
腾讯在CVPR 2025计算机视觉顶会上正式宣布混元3D 2.1大模型对外开源,这是目前首个实现全链路开源的工业级3D生成大模型,标志着中国在3D生成AI领域取得重大突破。
核心亮点
- 全链路开源:完整开放了数据处理、训练推理代码、模型权重及架构,支持社区开发者微调下游任务
- 技术领先性:采用两阶段生成流程,基于流扩散的几何生成模型和强大的纹理合成模型
- 物理级渲染:首个支持PBR(基于物理渲染)纹理材质生成的开源模型,实现皮革、青铜等材质的电影级光影效果
- 工业级应用:生成速度更快、细节更丰富、材质表达更逼真,可直接用于商业项目
技术突破
混元3D 2.1版本在之前基础上实现了多项优化:
- 几何与纹理分离生成技术
- 支持高分辨率3D模型生成(最高8K纹理)
- 多视图输入支持
- 模型智能减面技术
- 全格式兼容能力
开源生态表现
- 在HuggingFace平台累计下载量已突破180万次
- GitHub Star数达到2500+,成为HuggingFace下载增速最快的3D模型
- 社区开发者已创建超过900个衍生版本
- 包含5个不同规格的模型变体,满足从研究到生产的不同需求
应用场景
该模型特别适用于:
- 游戏开发:快速生成高质量3D角色和场景
- 影视制作:创建逼真的3D道具和特效素材
- 工业设计:加速产品原型设计流程
- 元宇宙建设:大规模生成虚拟世界内容
- 电商展示:为商品创建3D展示模型
腾讯此次开源延续了其"开源协同"的技术战略,通过开放核心技术推动整个3D生成生态的发展。混元3D系列模型的开源不仅降低了行业进入门槛,也为学术研究提供了可复现的基线标准。
© 版权声明
文章收集自互联网,如有侵权,请联系删除