腾讯开源 Hunyuan-A13B: 小尺寸,大智慧的 AI 模型

Hunyuan-A13B 是一个由最新,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。

这款模型采用了细粒度 MoE(Mixture-of-Experts) 架构,拥有 130 亿活跃参数,但总参数量高达 800 亿。这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。

Hunyuan-A13B 的核心功能亮点包括:

  • 支持快慢思维的混合推理模式: 这种独特的推理机制让模型能够根据任务需求灵活调整思考深度,提升处理复杂问题的效率。

  • 原生 256K 超长上下文理解能力: 这意味着模型可以处理极长的文本输入,使其在需要大量背景信息的任务中表现出色。

  • 任务上的卓越表现:Hunyuan-A13B 在执行各类智能体 (Agent) 相关任务时展现出强大的能力。

为了实现高效推理,Hunyuan-A13B 采用了 GroupedQueryAttention(GQA)技术,并支持多种量化格式。目前,该模型已开源预训练、指令微调、FP8 和 INT4 量化版本,方便开发者使用。

在多项基准测试中,Hunyuan-A13B 都展现出强大的竞争力,尤其是在数学、科学、编码、推理和智能体领域

腾讯为开发者提供了全面的支持,包括使用 HuggingFaceTransformers 进行交互和模型训练的详细指南。同时,对于模型部署,Hunyuan-A13B 也提供了通过 TensorRT-、vLLM 和 SGLang 的支持,并提供了预构建的 Docker 镜像和量化模型部署方案,大大简化了部署流程。

Hunyuan-A13B 的开源,无疑为在资源受限环境下的应用开辟了新的可能性,也为 社区带来了新的创新动力。

开源地址:https://huggingface.co/tencent/Hunyuan-A13B-Instruct

github:https://github.com/Tencent-Hunyuan/Hunyuan-A13B?tab=readme-ov-file

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

阿里 Ovis-U1 震撼发布:多模态 AI 三合一,开源赋能全球开发者

2025-7-1 1:22:47

AI 资讯

Runway AI 重磅推出 「游戏世界」 大型互动文本冒险来了

2025-7-1 1:23:05

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索