腾讯发布并开源新一代生图模型「HunyuanImage3.0」

小强

腾讯混元推出并开源其最新的多模态图像生成模型——「混元图像 3.0」（HunyuanImage3.0）。此次发布标志着该模型的参数规模已达到 80B，成为首个开源的工业级原生多模态生成模型。官方表示，该模型的生成效果可以与业内领先的闭源模型相媲美。

混元图像 3.0 的主要亮点在于其能够处理复杂的语义内容，解析千字级别的文本并生成相应的图像。通过对知识的推理，该模型能够生成长文本，这在以往的图像生成模型中是一个不小的突破。这项技术的进步不仅为用户带来了更为丰富的创作体验，也为 AI 图像生成领域带来了新的可能性。

此次更新是混元系列自今年 5 月推出 2.0 版本以来的重要升级。2.0 版本已实现毫秒级的响应速度和超写实的图像质量，并支持实时生成图像，用户可以在输入文字的同时看到图像生成的过程。这种即时反馈的功能大大提升了用户的交互体验。

腾讯混元在过去的时间里已陆续开源了多项 AI 生成技术，包括 3D 生成模型、定制化图像生成插件 InstantCharacter，以及多模态视频生成工具 HunyuanCustom。这些开源项目构建了一个完善的 AI 生成内容（AIGC）技术生态，使得开发者和用户能够在多个领域中进行探索与应用。

**划重点:**

🌟混元图像 3.0 是腾讯开源的首个工业级多模态生成模型，参数规模达到 80B。

🖼️模型能够解析复杂的语义，并生成千字级长文本，效果可与顶尖闭源模型相媲美。

🚀这是继 2.0 版本后的升级，支持毫秒级响应和实时生成图像的交互体验。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证