我以前介绍过Kitten TTS，只有25M的语音模型，可以用CPU推理，甚至手机也能跑。

罗丽

2026-03-22 11:05:47

我以前介绍过Kitten TTS，只有25M的语音模型，可以用CPU推理，甚至手机也能跑。

上个月，他们发布了Kitten TTS v0.8，也才80M，依然可以在普通电脑上跑，甚至手机上跑，超级轻量级。
只是，还是不支持中文，这是一个遗憾，希望他们能尽快补齐。

特点：
超轻量级——型号大小从25 MB（int8）到80 MB，适合边缘部署
CPU优化——基于ONNX的推理无需GPU也能高效运行
8个内置声音——贝拉、贾斯珀、露娜、布鲁诺、罗茜、雨果、琪琪和利奥
可调语音速度——通过参数控制播放速率speed
文本预处理——内置流水线处理数字、货币、单位等
24 kHz 输出——标准采样率下的高品质音频

模型地址：www.modelscope.cn/models/KittenML/kitten-tts-mini-0.8/summary

相关阅读