ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色

年 8 月 20 日,全球领先的 语音技术公司 正式宣布推出其最新的 Elevenv3AlphaAPI,为开发者提供了一个突破性的(Text-to-Speech,TTS) 工具。

Elevenv3AlphaAPI 被誉为 「地球上最具表现力的文本转语音模型」,其核心优势在于支持超过 70 种语言,能够生成自然、流畅且富有情感的语音输出。

该 API 引入了全新的对话模式 (DialogueMode),允许开发者创建多角色对话场景,支持无限数量的虚拟角色,并能处理语气变化、情感波动和对话中的自然中断。这种功能使其特别适用于制作多角色互动的音频内容,例如有声书、互动游戏叙述和多媒体项目。

此外,Elevenv3AlphaAPI 还支持高级音频标签 (AudioTags) 功能,开发者可以通过在脚本中插入如 [happy]、[whispering] 或 [sighs] 等标签,精确控制语音的语气、情感和节奏。这种技术突破使得 AI 语音不仅能 「说话」,还能 「表演」,为用户带来更真实、更具沉浸感的听觉体验。例如,开发者可以轻松实现从戏剧性独白到轻松幽默对话的动态语音生成。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​字节跳动发布全新开源长文本处理模型 Seed-OSS-36B

2025-8-22 1:22:44

AI 资讯

贝索斯 4.05 亿美元押注机器人大脑:FieldAI 欲造万能 AI,从人形机器人到自动驾驶全面统治

2025-8-22 1:23:01

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索