XTTS 是一种语音生成模型,让...
XTTS 是一种语音生成模型,让您只需使用 6 秒的快速音频剪辑即可将语音克隆为不同的语言。不需要跨越无数小时的大量训练数据。
P-Flow是通过语音提示实现快...
它是通过大型语音语言模型的...
VITS(端到端文本到语音的对...
该存储库包含用于训练 Pheme ...
基于 EnCodec 标记器的非官方...
EmotiVoice 是一款功能强大且...