腾讯AI 团队推出了一款令人振奋的 AI 唱歌模型 LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉,LeVo 在多项关键指标上可媲美行业领先的 Suno4.5,为中国 AI 音乐生成技术赢得一席之地。AIbase 整理
媲美 Suno4.5:LeVo 的硬核实力
LeVo 由腾讯 AI 实验室研发,采用语言模型 (LM) 架构,结合 LeLM 和音乐编解码器,能够并行生成混合音轨 (融合人声与伴奏) 或双轨音轨 (人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上,LeVo 全面超越现有开源学术模型。根据
项目地址:https://levo-demo.github.io/
零样本音色克隆: 个性化音乐创作新高度
LeVo 支持零样本音色克隆 (Zero-ShotVoiceCloning),仅需 3 秒音频片段即可精准复制目标音色,包括音调、情感和韵律。这一功能无需大量训练数据,极大降低了音乐创作的技术门槛。无论是为个人定制专属音色,还是模仿知名歌手风格,LeVo 都能提供自然流畅的生成效果,赋予创作者无限可能。
分轨生成: 专业音乐制作的利器
与传统 AI 音乐生成模型不同,LeVo 支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人,能够轻松实现高质量的分轨输出,优化创作流程。相比之下,Suno4.5 在音色克隆和分轨支持上略显不足,LeVo 的这一特性无疑为行业树立了新标杆。
高保真与多场景应用
LeVo 在音质表现上接近 Suno4.5 的行业标准,尤其在音乐性、人声与伴奏和谐度和音质 (MOS 评分) 等方面表现出色。尽管在歌曲结构清晰度上略逊于 Suno4.5 和 Mureka-O1,但 LeVo 通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是广告制作,LeVo 都能提供专业级输出。
开源承诺: 推动 AI 音乐生态发展
腾讯表示,LeVo 将以开源形式发布,计划提供完整代码和预训练模型,供全球开发者免费使用。这一举措不仅体现了腾讯在 AI 音乐领域的雄心,也为全球音乐创作社区注入了新的活力。AIbase 注意到,LeVo 的开源策略将有效降低创作门槛,助力内容创作者和音乐爱好者实现创意表达。
腾讯 LeVo 的发布标志着中国 AI 音乐生成技术迈向全球前沿,其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与 Suno4.5 仍有差距,但 LeVo 凭借高性价比和开源优势,已成为 AI 音乐领域的强有力竞争者。AIbase 认为,LeVo 的推出不仅提升了中国 AI 技术的国际影响力,也为音乐创作的民主化进程迈出了重要一步。