超小的 TTS 模型 Kitten TTS：参数量仅为 1500 万

AI 资讯
25 年 8 月 12 日
编辑

小强

近日，KittenML 团队在 HuggingFace 平台上发布了其新款开源文本转语音模型——KittenTTS。这一模型的设计目标是实现高质量的语音合成，同时保持轻量级和高效能，适合在各种设备上进行部署。KittenTTS 的参数量仅为 1500 万，相比于其他同类模型，其体积小于 25MB，特别适合资源有限的环境。

KittenTTS 支持无 GPU 运行，这意味着用户可以在普通的 CPU 设备上进行语音合成，极大地降低了使用门槛。该模型还提供了多种高质量的语音选项，确保生成的语音更加自然流畅，适合用于各类应用场景。此外，KittenTTS 的推理速度也得到了优化，可以实现实时语音合成，满足用户对速度的需求。

为了让用户快速上手，KittenML 还提供了简单的安装和使用指南。用户只需通过 pip 命令安装相应的库，并通过简单的代码调用模型，即可生成高质量的语音。例如，用户只需输入文本「这个高质量的 TTS 模型无需 GPU 即可运行」，模型便会输出相应的音频文件，方便用户保存和使用。

KittenTTS 目前处于开发者预览阶段，未来还将发布全面训练的模型权重，移动 SDK 以及网页版，进一步拓展应用范围。KittenML 希望通过这一模型，推动文本转语音技术的普及，帮助更多开发者和企业在其项目中轻松实现语音合成功能。

KittenTTS 的发布标志着 AI 语音合成技术向更广泛应用的又一步，期待这一模型在未来能够为更多用户带来便利和创新的体验。

项目：https://huggingface.co/KittenML/kitten-tts-nano-0.1

划重点:

🐱KittenTTS 是一款开源的轻量级文本转语音模型，体积小于 25MB，适合各种设备。

⚡模型支持无 GPU 运行，确保用户在普通 CPU 上也能进行高质量语音合成。

🚀KittenTTS 已提供简单的安装和使用指南，用户可快速上手并生成音频。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}} 已认证

超小的 TTS 模型 Kitten TTS：参数量仅为 1500 万

小钢炮 4.0 视觉模型 MiniCPM-V 4.0，手机端应用更流畅

GPT-5 正式发布 OpenAI 在华申请「GPT-5」商标被驳回

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

{{userData.name}} 已认证

相关文章：

小钢炮 4.0 视觉模型 MiniCPM-V 4.0，手机端应用更流畅

GPT-5 正式发布 OpenAI 在华申请 「GPT-5」 商标被驳回

字节跳动开源 Seed-X:70 亿参数小模型支持 28 种语言翻译，性能媲美顶级大模型

秘塔搜索 API 正式上线，低至 3 分钱的高效搜索服务

商汤科技 「悟能」 具身智能平台亮相 WAIC 2025

豆蔻妇科大模型成行业首例，创业公司+钉钉打造专业级 AI

国内知名公共 DNS 服务器

海外知名公共 DNS 服务器

中国电信 DNS 服务器地址大全

公共 DNS 服务器地址大全

中国移动 DNS 服务器地址大全

中国天威视讯 DNS 服务器地址大全

GPT-5 正式发布 OpenAI 在华申请「GPT-5」商标被驳回

商汤科技「悟能」具身智能平台亮相 WAIC 2025