Fish Audio 推出 S1 语音克隆模型升级:10 秒即可复刻真人语音

报道】 语音生成公司正式发布升级版 S1 语音克隆模型,在情感表现力与拟真度方面实现重大突破。新版模型能够生成富有情绪、节奏感与语气变化的真人级声音,几乎可以完美再现人类说话时的细微差别。

据介绍,用户只需提供约 10 秒的语音样本,S1 即可克隆任意人声,并完整保留原声的口音、语调与节奏,还原个人的说话习惯与情感特征,生成效果几乎与真人无异。相比国际知名产品,FishAudio 的语音克隆服务价格低约六倍,在语音生成成本和性能平衡上具备明显优势。

与此同时,FishAudioS1API 也已同步上线,显著提升了实时语音生成体验。其首帧延迟 (TTFT) 低于 500 毫秒,一句话不到半秒即可开始播放; 同时支持输入与输出的流式传输,实现边接收文字边即时朗读的自然交互,并可无限克隆不同人声、自由切换使用。

业内认为,FishAudioS1 的升级意味着语音克隆技术正从 「可用」 迈向 「可感」,其高保真、低延迟的特性将加速 语音在虚拟人、智能助理、内容创作及配音等领域的广泛落地。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​微软宣布结束 Win10 时代,Windows 11 开启 AI 驱动的未来办公

2025-10-22 1:22:58

AI 资讯

突破瓶颈!上交大与上海 AI Lab 携手提升多模态大模型反思能力

2025-10-22 1:23:15

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索