TTS，一个奇妙的AI工具

所有文章1年前 (2024)更新 aiziy

0 0

0. 简介

TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天，很多人尝试制作视频发到自媒体平台上，通过获得流量的方式实现直接或间接变现。有部分人天生能说会道，全靠一张嘴，能完成整个视频。但大多数人，很难一次性的流畅表达一个主题，往往需要在制作视频时加入配音。
当我们制作视频的时候，就会发现，给视频配音真是一件非常专业的事，对于非专业人士，费工费力后，完成的配音效果往往并不理想。
TTS就解决了这个问题，可以直接将写好的文案或台本转为语音播报。网络上有很多文字转语音网站都采用了这个TTS开源工具。这个AI工具支持13种语言，包括汉语。English, Spanish, French, German, Italian,
Portuguese, Polish, Turkish, Russian, Dutch, Czech, Arabic, and Chinese
(Simplified).

1. 安装TTS的安装非常简单，还是pip安装法，在命令行终端中输入以下内容：

pip install TTS

不过，这次安装并不是非常顺利，遇到了问题，原因是我的Win10中没有VC++。可以按提示去安装VC++，注意要安装C++开发运行环境。

TTS，一个奇妙的AI工具

安装完成后，再次运行pip install TTS

TTS，一个奇妙的AI工具

这个AI工具的依赖库非常多，且都指定了版本。如果你电脑中有类似的AI项目在运行，强烈建议以虚拟环境的方式进行安装。可参考文章《virtualenv，一个神奇的python工具》

2. 模型和TTS运行TTS安装完成后需要下载模型才可以工作，下面链接给出的是中文模型的地址。中文转语音模型下载完成后安装在C:\\Users\\**\\AppData\\Local\\tts目录下。这时就可以运行这个TTS了。TTS给出了两种运行方式，命令行和Python接口。命令行运行如下：

1 tts --text \"你好\" --model_name \"tts_models/zh-CN/baker/tacotron2-DDC-GST\" --out_path 1.wav

python代码运行如下：

1 from TTS.api import TTS

2tts=TTS(\"tts_models/zh-CN/baker/tacotron2-DDC-GST\")

3 tts.tts_to_file(text=\"你好\", file_path=\"1.wav\")

3. 模型性能和训练TTS项目中给出了TTS三个模型和主流模型的评价对比图，从图中可以看到，TTS模型整体表现中等偏下。主要原因是TTS提供的是一个开源框架，公开的模型性能与商业化模型之间存在差距。如果想到得到更好的模型，可以自己进行进一步模型训练。 TTS，一个奇妙的AI工具

出自：https://mp.weixin.qq.com/s/QEYGHfeWCj3oCMTpyprMgg

# 所有文章

文章版权归作者所有，未经允许请勿转载。

让你每次都随机生成各种图片，开盲盒的感觉：SD插件之无限抽卡神器Dynamic Prompts

aiziy

开箱即用的图像增强、视频增强AI工具，Upscapl、Topaz Video AI

aiziy

Meta发布业界最强文生图模型CM3Leon，实力碾压Stable Diffusion、Midjourney

aiziy

Stable Diffusion｜背景替换只需要两分钟！

aiziy

使用ChatGPT润色出高品质文章的提示词

aiziy

检索增强生成 (RAG):What, Why and How?

aiziy

暂无评论

暂无评论...

TTS，一个奇妙的AI工具

「语音转换新速度」— 探秘Whisper JAX的70倍速提升

Stable Diffusion AnimateDiff | 最火文本生成视频插件

相关文章

暂无评论