腾讯混元 3D 世界模型正式发布并开源

年 7 月 27 日举办的 2025 世界大会论坛上,腾讯公司正式发布了混元 3D 世界模型 1.0 版本,并宣布该模型将全面。这一举措标志着业界首个支持沉浸漫游、交互与仿真的开源世界生成模型诞生,为游戏开发、虚拟现实 (VR) 及数字内容创作等领域开辟了全新的可能性。

混元 3D 世界模型 1.0 融合了全景视觉生成与分层 3D 重建技术,能够接受文字和图片作为输入,快速生成高质量、风格多样的可漫游 3D 场景。这一技术突破极大地简化了 3D 场景的构建流程,过去需要专业建模团队数周才能完成的工作,现在通过简单的文字指令或图片上传,几分钟内即可实现。对于游戏开发者而言,该模型能够迅速生成包含建筑、地形、植被等元素的完整 3D 场景,输出的 Mesh 文件可直接用于游戏原型搭建或关卡设计,同时支持前景物体调整和天空背景更换,满足个性化创作需求。即便是没有建模经验的普通用户,也能通过混元 3D 创作引擎,轻松生成 360°沉浸式视觉空间,并无缝导入 VisionPro 等虚拟头显设备,享受沉浸式体验。

混元 3D 世界模型 1.0 的核心优势在于其创新的 「语意层次化 3D 场景表征及生成算法」。该算法将复杂的 3D 世界解构为不同语意层级,实现前景与背景、地面与天空的智能分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的 3DMesh 资产,兼容 Unity、UnrealEngine、Blender 等主流工具,便于用户对场景内元素进行独立编辑或物理仿真,实现了 AIGC 技术与传统 CG 工作流的无缝衔接。与全球领先的开源模型相比,混元 3D 世界模型 1.0 在文生世界、图生世界的美学质量和指令遵循能力等关键指标上均实现了全面超越。

此外,还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。其中,混元旗舰模型 TurboS 自年初发布以来,保持着每月一个版本的快速迭代,在代码生成、理科能力和复杂指令遵循方面均有显著提升,稳居全球权威排行榜前列。基于 TurboS 基座开发的混元 T1 进一步提升了推理能力,展现出国内领先的综合能力。同时,端到端语音模型混元 Voice、多模态理解模型混元 Vision 等也基于混元基座打造,继承了出色的理解、认知和推理能力,在多模态理解领域屡获佳绩。

腾讯混元在多模态生成方面同样布局全面,3D 生成能力全球领先。最新发布的混元 3D2.5 模型质感大幅提升,在上海人工智能实验室的评测中排名全球第一。除混元 3D 世界模型 1.0 外,腾讯还将在月底开源一系列小尺寸模型,包括 0.5B、1.8B、4B、7B 混合推理模型,更加轻量且易于部署。同时,多模态理解模型混元-large-vision 和专为游戏场景优化的交互式游戏视频生成框架混元 GameCraft 等也将于近期对外开源。

腾讯混元还开放了完整的多模态生成能力及工具集插件,陆续开源了业界领先的文生图、视频生成和 3D 生成能力,提供了接近商业模型性能的开源基座,方便社区基于业务和使用场景进行定制。目前,混元 3D 系列模型的社区下载量已超过 230 万次,成为全球最受欢迎的 3D 开源模型之一。

腾讯混元 3D 世界模型 1.0:

●项目主页:https://3d-models.hunyuan.tencent.com/world/

●体验地址:https://3d.hunyuan.tencent.com/sceneTo3D

●HuggingFace 模型地址:https://huggingface.co/tencent/HunyuanWorld-1

●Github 项目地址:https://github.com/Tencent-Hunyuan/HunyuanWorld-1.0

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

京东正式宣布旗下大模型品牌升级为 JoyAI

2025-7-28 1:20:35

AI 资讯

腾讯全面展示 AI 时代产品应用图,发力 3D 世界模型与具身智能平台 Tairos

2025-7-28 1:20:41

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索