腾讯 LeVo 来袭!媲美 Suno 4.5 的 AI 唱歌模型,支持零样本音色克隆

团队推出了一款令人振奋的 AI 唱歌模型 LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉,LeVo 在多项关键指标上可媲美行业领先的 Suno4.5,为中国 AI 音乐生成技术赢得一席之地。 整理最新信息,为您深度解析 LeVo 的突破性功能与潜力。

媲美 Suno4.5:LeVo 的硬核实力

LeVo 由腾讯 AI 实验室研发,采用语言模型 (LM) 架构,结合 LeLM 和音乐编解码器,能够并行生成混合音轨 (融合人声与伴奏) 或双轨音轨 (人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上,LeVo 全面超越现有模型。根据最新评测,LeVo 在歌词对齐能力 (LYC) 上比 Suno4.5 高出 0.21 分,展现出卓越的文本控制能力。

项目地址:https://levo-demo.github.io/

零样本音色克隆: 个性化音乐创作新高度

LeVo 支持零样本音色克隆 (Zero-ShotVoiceCloning),仅需 3 秒音频片段即可精准复制目标音色,包括音调、情感和韵律。这一功能无需大量训练数据,极大降低了音乐创作的技术门槛。无论是为个人定制专属音色,还是模仿知名歌手风格,LeVo 都能提供自然流畅的生成效果,赋予无限可能。

分轨生成: 专业音乐制作的利器

与传统 AI 音乐生成模型不同,LeVo 支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人,能够轻松实现高质量的分轨输出,优化创作流程。相比之下,Suno4.5 在音色克隆和分轨支持上略显不足,LeVo 的这一特性无疑为行业树立了新标杆。

高保真与多场景应用

LeVo 在音质表现上接近 Suno4.5 的行业标准,尤其在音乐性、人声与伴奏和谐度和音质 (MOS 评分) 等方面表现出色。尽管在歌曲结构清晰度上略逊于 Suno4.5 和 Mureka-O1,但 LeVo 通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是制作,LeVo 都能提供专业级输出。

开源承诺: 推动 AI 音乐生态发展

腾讯表示,LeVo 将以开源形式发布,计划提供完整代码和预训练模型,供全球开发者免费使用。这一举措不仅体现了腾讯在 AI 音乐领域的雄心,也为全球音乐创作社区注入了新的活力。AIbase 注意到,LeVo 的开源策略将有效降低创作门槛,助力和音乐爱好者实现创意表达。

腾讯 LeVo 的发布标志着中国 AI 音乐生成技术迈向全球前沿,其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与 Suno4.5 仍有差距,但 LeVo 凭借高性价比和开源优势,已成为 AI 音乐领域的强有力竞争者。AIbase 认为,LeVo 的推出不仅提升了中国 的国际影响力,也为音乐创作的民主化进程迈出了重要一步。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

给 TA 打赏
共 {{data.count}} 人
人已打赏
AI 资讯

​月之暗面发布全新开源模型 Kimi-Dev-72B,打破编程基准记录

2025-6-18 1:21:40

AI 资讯

夸克 App 推出 「夸克老师」 具备个性化 AI 辅导能力

2025-6-18 1:22:01

个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索