MiniMax 推出 Voice Design 音色设计功能，任意组合语言、口音、音色

AI 资讯
25 年 6 月 24 日
编辑

小强

MiniMax 最近推出了一项创新功能——VoiceDesign 音色设计，这标志着语音合成技术的一次重大突破。自 5 月发布以来，MiniMaxSpeech-02 模型在 ArtificialAnalysis 榜单上稳居全球第一，并赢得了用户的广泛认可。迄今为止，Speech-01 和 Speech-02 两代模型已经帮助客户生成了超过 1.5 亿小时的语音，与全球 30 多个国家的用户建立了合作。

VoiceDesign 功能允许用户通过自然语言描述自己理想中的音色，从而实现对语音的多维度精准控制，甚至可以生成一些世界上从未存在过的音色。这项新功能与 Speech-02 语音模型紧密结合，用户在进行文字转语音时，能够真正实现「所需即所得」。用户可以自由选择「任意语言×任意口音×任意音色」，进行全自定义的无限组合。

通过简单的文本描述，用户可以得到不同风格的 AI 助手语音。例如，用户可以请求一个积极鼓励的 AI 助手，语调活泼，韵律变化丰富，来表达关心和支持; 或者选择一个严厉的 AI 助手，快速的女声带有命令和责备的语气; 还可以让助手以小心翼翼的语气表达歉意。

VoiceDesign 功能解决了语音合成领域的两个主要挑战。首先，现有的音色库虽然质量高，但通常难以满足用户在特定场景下的细分需求; 其次，尽管复刻音色可以实现「所听即所得」，用户为了获得满意的效果通常需要花费大量时间准备高质量的输入素材，还可能面临版权风险。

通过 VoiceDesign，用户只需描述他们对音色的需求，模型便会自动将其拆解为音色相关的描述信息，生成新的音色编码。用户还可以像抽卡一样多次尝试，轻松获得理想的专属音色，并将其存储用于后续音频创作。

MiniMax 始终致力于降低全球用户使用 AI 技术的门槛，让不同语言的用户都能体验到语音模型带来的价值。立即打开 MiniMaxAudio，体验这一创新功能吧!

国内版:minimaxi.com/audio

海外版:minimax.io/audio

划重点:

🎤MiniMax 推出 VoiceDesign 音色设计功能，用户可通过自然语言生成个性化语音。

🌍该功能与 Speech-02 模型结合，支持「任意语言×任意口音×任意音色」的自定义组合。

⚙️VoiceDesign 解决了语音合成中的音色匹配难题，用户只需简单描述即可获得满意的音色。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

MiniMax 推出 Voice Design 音色设计功能，任意组合语言、口音、音色

马斯克要让 Grok 摆脱「传统媒体」，改写整个人类知识体系

AI 也能「闹情绪」？Gemini 调试失败躺平引发马斯克围观！

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

马斯克要让 Grok 摆脱 「传统媒体」，改写整个人类知识体系

AI 也能 「闹情绪」？Gemini 调试失败躺平引发马斯克围观！

DeepSeek 是什么？

蚂蚁国际发布 AI 金融平台 Cockpit，开启智能代理驱动的新金融时代

​零售行业的未来：全球首个开源 VLA 大模型 GroceryVLA 正式发布

​硅基流动完成数亿元融资，用户数突破 600 万

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国广电 DNS 服务器地址大全

马斯克要让 Grok 摆脱「传统媒体」，改写整个人类知识体系

AI 也能「闹情绪」？Gemini 调试失败躺平引发马斯克围观！

零售行业的未来：全球首个开源 VLA 大模型 GroceryVLA 正式发布

硅基流动完成数亿元融资，用户数突破 600 万