查看: 3|回复: 0

哇塞!开源 TTS 来袭,仅需 3 秒就能克隆任意声音啦!

[复制链接]

7

主题

0

回帖

21

积分

新手上路

积分
21
发表于 昨天 09:46 | 显示全部楼层 |阅读模式
哇塞!开源 TTS 来袭,仅需 3 秒就能克隆任意声音啦!#科技潮人#

LuxTTS 刚刚开源,它可是一个基于 ZipVoice 架构的轻量语音克隆模型哦。只要有 3 秒的参考音频,就能轻松克隆出任意声音,而且它超厉害,支持 GPU、CPU 以及 Mac MPS 全平台运行呢。
🎤 克隆效果那叫一个绝:官方都说啦,这语音克隆效果能和体积大它 10 倍的模型相媲美,达到了当前的 SOTA 水准哟。
⚡ 速度快得逆天:用单卡能跑出 150x 的实时速度,就算在 CPU 上也能超实时运行。
🔊 音质更是高得没话说:它输出的是 48kHz,可大多数 TTS 模型才 24kHz 呢,同等时长下,信息量直接翻倍啦。
💻 门槛低到尘埃里:只需要 1GB 显存,随便一块本地 GPU 都能让它跑起来。而且它在 GitHub 上完全开源,遵循 Apache - 2.0 协议,在本地运行完全不用交订阅费。
要是你在做播客、配音或者当 AI 主播,那可得好好关注一下这个,在本地运行,使用次数不限制,还没有信息泄露的风险哟。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关注公众号

相关侵权、举报、投诉及建议等,请发 E-mail:admin@discuz.vip

Powered by Discuz! X5.0 © 2001-2026 Discuz! Team.|青ICP备2025004122号-1

在本版发帖
关注公众号
返回顶部