通义千问发布 Qwen3-LiveTranslate-Flash3 秒同传延迟刷新行业纪录

9 月 30 日,发布基于的多语言实时音视频翻译系统 Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。

该系统支持 18 种语言的离线和实时翻译,覆盖中文、英语、法语、德语、俄语、西班牙语等主流语言,以及普通话、粤语、北京话、吴语等多种方言,为国际交流提供全方位语言支持。

Qwen3-LiveTranslate-Flash 的核心创新在于视觉上下文增强技术。系统不仅能"听懂"语言,还能通过识别口型、动作、文字和实体等多模态信息"看懂"上下文,有效提升嘈杂环境和复杂语境下的翻译准确性,破解一词多译等翻译难题。

在延迟控制方面,该系统采用轻量混合专家架构与动态采样策略,实现最低仅 3 秒的同传延迟,大幅提升实时翻译流畅性。通过语义单元预测技术,系统还减轻了跨语言翻译中的调序问题,确保接近离线翻译的高质量输出。

测试数据显示,Qwen3-LiveTranslate-Flash 在中英及多语言翻译准确率上显著超越 -2.5-Flash、-4o-Audio-Preview 和 VoxtralSmall-24B 等主流模型,在多领域和复杂声学环境下表现卓越。

语音合成方面,系统基于海量语音数据训练,能根据原始语音内容自适应调整语气和表现力,生成自然流畅的音色。通义千问表示,未来将持续提升翻译准确性和自然度,扩展语种覆盖范围,增强复杂语音环境下的鲁棒性。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​Opera 推出 AI 驱动的 Neon 浏览器,开启智能上网新体验

2025-10-1 1:21:15

AI 资讯

火山引擎发布豆包大模型 1.6-vision 视觉理解能力实现重大突破

2025-10-1 1:21:31

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索