字节跳动 Seed 团队宣布推出 3D 生成大模型 Seed 3D 1.0

AI 资讯
25 年 10 月 24 日
编辑

小强

字节跳动 Seed 团队近日宣布推出 3D 生成大模型 Seed3D1.0，该模型能够从单张图像端到端地生成高质量仿真级 3D 模型，包括精细几何、真实纹理和基于物理渲染（PBR）材质。这一创新成果有望为具身智能的发展提供强大的世界模拟器支持，解决当前技术在物理交互能力和内容多样性方面的瓶颈问题。

在研发过程中，Seed 团队收集并处理了大规模的高质量 3D 数据，构建了完整的三阶段数据处理管线，将海量异构的原始 3D 数据转化为高质量训练集。Seed3D1.0 采用基于 DiffusionTransformer 架构的模型，通过端到端的技术路线，实现从单张图像到仿真级 3D 模型的快速生成。该模型在几何生成方面表现出色，能够精确构建结构细节并保证物理完整性; 在纹理贴图生成上，通过多模态 DiffusionTransformer 架构，确保不同视角间的一致性; 在 PBR 材质生成上，采用估计方法框架，提升了材质估计的准确性。

Seed3D1.0 的生成能力在多项对比评估中展现出显著优势。在几何生成方面，1.5B 参数的 Seed3D1.0 超过了业界 3B 参数的模型，能够更准确地还原复杂物体的精细特征。在纹理材质生成方面，Seed3D1.0 在参考图像保持性方面表现优秀，特别是在精细文本生成和人物生成上优势明显。人工评测结果显示，Seed3D1.0 在几何质量、材质纹理、视觉清晰度及细节丰富度等多个维度均获得较好的评分。

Seed3D1.0 不仅能够生成单一物体的 3D 模型，还可通过分步生成策略构建完整的 3D 场景。生成的 3D 模型能够无缝导入 IsaacSim 等仿真引擎，仅需少量适配工作即可支持具身智能大模型训练。这一能力为机器人训练提供了多样化的操作场景，实现了交互式学习，并为视觉-语言-行动模型构建了全面的评估基准。

尽管 Seed3D1.0 在三维模型和场景生成中展现了良好性能，但 Seed 团队也意识到，要基于 3D 生成大模型搭建世界模型仍面临生成精度、泛化性需进一步提升等挑战。未来，团队将尝试引入多模态大语言模型（MLLM）来提升 3D 生成的质量和鲁棒性，并推动 3D 生成模型在世界模拟器中的大规模应用。

项目主页:

https://seed.bytedance.com/seed3d

体验入口:

https://console.volcengine.com/ark/region:ark+cn-beijing/experience/vision?modelId=doubao-seed3d-1-0-250928&tab=Gen3D

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

字节跳动 Seed 团队宣布推出 3D 生成大模型 Seed 3D 1.0

快手推出「工具+模型+平台」AI 编程生态，KAT-Coder-Air 免费开放

Google 重磅推出「Google Skills」平台，内部 AI 知识向公众免费开放

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

快手推出 「工具+模型+平台」AI 编程生态，KAT-Coder-Air 免费开放

Google 重磅推出 「Google Skills」 平台，内部 AI 知识向公众免费开放

光子级渲染重塑视觉极限：Reve Image 突破 AI 生成真实感瓶颈

Reddit 控诉 AI 公司 Anthropic：超十万次违规访问引发版权争议

智谱 AI 全新企业级超级助手 Agent CoCo 正式上线

DeepSeek 前高管秘密创业，新 AI Agent 项目已获顶级 VC 押注

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

快手推出「工具+模型+平台」AI 编程生态，KAT-Coder-Air 免费开放

Google 重磅推出「Google Skills」平台，内部 AI 知识向公众免费开放