阿里巴巴推出革命性语音识别模型 FunAudio-ASR，降噪效果惊人

AI 资讯
25 年 9 月 17 日
编辑

小强

近日，阿里巴巴通义实验室正式发布了其最新的端到端语音识别大模型——FunAudio-ASR。这个模型的最大亮点在于它的创新「Context 模块」，让高噪声环境下的语音识别准确率得到了显著提升，幻觉率从 78.5% 大幅降低至 10.7%，降幅近乎 70%。这一技术突破为语音识别行业树立了新的标杆，尤其适用于嘈杂的场合，如会议、公共场所等。

FunAudio-ASR 模型在训练过程中使用了数千万小时的音频数据，并将大语言模型的语义理解能力融入其中，使其在远场、嘈杂和多说话人等复杂条件下的表现，已经超越了诸如 Seed-ASR、KimiAudio-8B 等众多主流语音识别系统。通过这一技术的应用，用户在进行语音识别时，能够享受到更清晰、更精准的识别效果。

除了完整版本外，阿里还推出了轻量化版本 FunAudio-ASR-nano。该版本在保持高识别准确率的同时，降低了推理成本，适合那些对资源要求较高的部署环境。无论是大企业还是小型团队，都能找到适合自己的解决方案。

目前，FunAudio-ASR 已经在钉钉的「AI 听记」功能、视频会议以及 DingTalkA1 硬件中得到了实际应用。此外，其 API 也已在阿里云百炼平台上正式上线，方便开发者进行集成和使用。对于企业用户而言，这意味着他们可以利用这一先进技术提升会议效率，增强沟通效果。

FunAudio-ASR 不仅为语音识别技术带来了新突破，更为用户的实际应用提供了强大支持，推动了 AI 技术的进一步普及和应用。

官方介绍：https://mp.weixin.qq.com/s/7l5EPTU7cpz7GSN4RP91rg

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

阿里巴巴推出革命性语音识别模型 FunAudio-ASR，降噪效果惊人

AI 数据标注新星 Micro1 融资 3500 万美元，估值飙升至 5 亿

Anthropic 的 Claude AI 正式上线 Xcode 26，助力开发者提升编码效率

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

AI 数据标注新星 Micro1 融资 3500 万美元，估值飙升至 5 亿

Anthropic 的 Claude AI 正式上线 Xcode 26，助力开发者提升编码效率

盘点免费且靠谱的 AI 大模型 API，统一封装，任性调用

亚马逊拟在北卡罗来纳州投资 100 亿美元 扩展人工智能基础设施

智源发布 RoboOS2.0 与 RoboBrain2.0：首个支持 MCP 机制的机器人

AI 威胁使 SecOps 团队精疲力竭并面临风险

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

亚马逊拟在北卡罗来纳州投资 100 亿美元扩展人工智能基础设施