当 AI 不仅能 「读」 小说,还能自导自演一出情感饱满、角色分明的多人有声剧,有声内容产业正迎来颠覆性拐点。近日,豆包语音团队正式推出**「AI 多人有声剧」 全自动生产方案**,
98% 角色识别准确率,AI「演」 出人物灵魂
该方案的核心突破在于其高自然度多角色语音合成 (TTS) 引擎。通过海量小说文本与语音数据的多模态预训练,AI 不仅能精准区分对话中的不同角色,角色划分准确率高达 98% 以上,还能为每个角色赋予符合其性格、情绪与场景的语调、节奏与语气。无论是冷峻反派的低沉冷笑,还是少女主角的轻快雀跃,AI 均能细腻演绎,告别传统 TTS「一人千面」 的机械感。
更进一步,系统可智能添加背景音乐、环境音效与转场
番茄小说率先落地,用户反响超预期
该技术已在字节旗下番茄小说 APP 完成首批商业化部署。首批 AI 生成的多人有声剧上线后,迅速获得书友热烈好评:「像在听专业配音团队制作的广播剧」「角色切换毫无违和感」「更新速度比人工快十倍」。这不仅极大丰富了平台内容供给,也让海量中长尾小说
从 「可听」 到 「好听」,AI 重塑文化生产链
豆包语音团队表示,未来将持续优化情感表达、方言支持与多语言能力,并扩展至悬疑、科幻、言情等更多题材。随着小说日更,有声剧亦可同步上线,真正实现 「文字发布即音频可用」。
在音频内容需求爆发的今天,传统有声书制作受限于高昂成本与漫长周期,难以覆盖海量网文作品。而豆包的全自动方案,不仅破解了这一行业瓶颈,更预示着一个 AI 原生音频内容时代的到来——未来,每一部小说都可能拥有自己的 「AI 剧团」,而听众,将享受到前所未有的丰富、即时、高质的听觉盛宴。









