讯飞表示,传统 AI 语音识别系统在嘈杂环境下往往存在准确率下降的问题。为此,科大讯飞在软硬件一体化设计上进行了系统性创新,让 AI 不仅能 「听清」,还能 「看懂」。
基于该方案,讯飞多款 AI 硬件的降噪与识别性能显著提升:
-
讯飞智能办公本 X5 搭载行业首创 「上 4 下 4 环」 八麦克风阵列,在远场高噪音环境下的识别效果远超 iPhone17Pro;
-
讯飞 AI 翻译耳机在地铁、展会等复杂场景中识别准确率达到 97.1%;
-
讯飞双屏翻译机 2.0 在 90dB 工厂轰鸣声环境下依然实现 98.69% 的语音识别准确率。
讯飞方面称,这些成果得益于其在语音增强、声源定位、回声消除和多模态感知算法上的持续积累。
在本次开发者节上,科大讯飞还发布了基于星火语音大模型的 「百变声音复刻」 技术。用户只需一句录音即可高保真复刻任意音色,并可通过一条指令生成不同风格的声音输出。
这项技术的出现,意味着个性化语音创作进入普及阶段。它可广泛应用于数字人、有声读物、影视配音、内容创作等领域,让每个人都能快速打造属于自己的 「AI 声音分身」。










