我以前介绍过Kitten TTS,只有25M的语音模型,可以用CPU推理,甚至手机也能跑。

我以前介绍过Kitten TTS,只有25M的语音模型,可以用CPU推理,甚至手机也能跑。


上个月,他们发布了Kitten TTS v0.8,也才80M,依然可以在普通电脑上跑,甚至手机上跑,超级轻量级。
只是,还是不支持中文,这是一个遗憾,希望他们能尽快补齐。

特点:
超轻量级——型号大小从25 MB(int8)到80 MB,适合边缘部署
CPU优化——基于ONNX的推理无需GPU也能高效运行
8个内置声音——贝拉、贾斯珀、露娜、布鲁诺、罗茜、雨果、琪琪和利奥
可调语音速度——通过参数控制播放速率speed
文本预处理——内置流水线处理数字、货币、单位等
24 kHz 输出——标准采样率下的高品质音频

模型地址:www.modelscope.cn/models/KittenML/kitten-tts-mini-0.8/summary
分类