腾讯开源轻量级混元-A13B 模型 1 张中低端 GPU 卡即可部署

正式发布并混元家族的新成员——混元-A13B 模型。该模型采用基于专家混合 (MoE) 架构,总参数规模达 800 亿,激活参数为 130 亿,在保持顶尖开源模型效果的同时,大幅降低了推理延迟与计算开销,为个人开发者和中小企业提供了更具性价比的 解决方案。

据腾讯方面介绍,混元-A13B 模型在极端条件下仅需 1 张中低端 GPU 卡即可部署,用户可通过 Github、 等技术社区下载使用,模型 API 也已在官网上线。这一特性使得更多开发者能够以较低成本接入前沿 ,推动创新应用落地。

在性能表现上,混元-A13B 模型在数学、科学和逻辑推理任务中展现出领先效果。例如,在数学推理测试中,模型能够准确完成小数比较并展现分步解析能力。此外,该模型还支持调用工具生成复杂指令响应,如出行攻略、数据文件分析等,为智能体 (Agent) 应用开发提供了有力支持。

技术层面,混元-A13B 模型通过预训练中使用 20 万亿高质量网络词元语料库,提升了模型推理能力的上限,并完善了 MoE 架构的 ScalingLaw 理论体系,为模型设计提供了可量化的工程化指导。同时,模型支持用户按需选择思考模式,快思考模式提供简洁高效输出,慢思考模式则涉及更深推理步骤,兼顾了效率与准确性。

为进一步推动 AI 开源生态发展,腾讯还开源了两个新数据集。其中,ArtifactsBench 主要用于代码评估,构建了包含 1825 个任务的新基准;C3-Bench 则针对 Agent 场景模型评估,设计了 1024 条测试数据,以发现模型能力的不足。

此次混元-A13B 模型的开源,是腾讯在 AI 领域持续投入的又一成果。未来,腾讯混元大模型家族还将推出更多尺寸、更多特色的模型,与社区共享实践技术,共同促进开源生态的繁荣。

体验入口:https://hunyuan.tencent.com/

开源地址:https://github.com/Tencent-Hunyuan

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

全球独角兽榜单出炉!SpaceX、字节跳动和 OpenAI 荣登前三甲

2025-6-28 1:21:24

AI 资讯

可灵 AI 推出 「视频音效」 功能,实现 「所见即所听」 沉浸体验

2025-6-28 1:21:41

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索