共计 1388 个字符,预计需要花费 4 分钟才能阅读完成。
我们先来听下效果,这是最近很火的 ChatTTS 项目,它是一款非常真实、自然、流畅的语音合成工具,它支持英文和中文两种语言。最大的模型使用了 10 万小时以上的中英文数据进行训练,支持上万种音色,支持音色克隆等功能。
本期视频就教大家如何在 Unraid 上面快速部署 ChatTTS,自带 WEBUI,无需显卡也可以使用,无需各类付费和有限制的软件,在本地就能合成语音了。
首先,我们在应用市场搜索安装 docker compose manager,已经安装过的同学可以忽略。
安装完成后,点击设置,找到 compse 设置,把 Compose Project Directory 改到我们默认存放 docker 数据的路径:
/mnt/user/appdata
点击应用保存,这样可以方便我们对 compose 容器的安装和管理。
然后,打开 unraid 自带的 web SSH 终端工具,执行命令进入 /mnt/user/appdata 目录:
cd /mnt/user/appdata
执行拉取项目仓库命令:
git clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui
执行命令进入到项目目录:
cd chat-tts-ui
查看下目录内的文件:
ls
可以看到,这里面有 docker-compose.cpu.yaml 和 docker-compose.gpu.yaml 两个 yaml 配置文件,我这台机子没有显卡,我们就需要使用后缀为 cpu.yaml 配置文件。
执行下面命令将 docker-compose.cpu.yaml 文件名重命名为 docker-compose.yml,就可以让 unraid 的 compose 调用管理:
mv docker-compose.cpu.yaml docker-compose.yml
完成后回到 unraid,点击 docker,在最下面就可以看到我们刚创建的 chat-tts-ui 的 STACK 堆栈了点击 COMPOSE UP 启动,等待数据拉取和容器部署,这个窗口不要关闭,必须等待所有任务执行完成。
经过 2 分钟的等待,看到 Container chat-tts-ui Started 提示,就代表我们已经部署成功了。
在 docker 容器里可以看到容器的访问 IP 和端口,复制下来,就可以进行访问了。
软件具体用法呢,其实也很简单,web ui 下的控制参数并不是很多,主要是需要找到自己喜欢的音色,然后在对其进行微调。下方提供了 10000 个中文音色包的下载地址,大家可以去下载使用。
10000 个中文音色.zip 下载地址:
链接:https://pan.quark.cn/s/03fcec7d6bf4
0.96 版本后,因 ChatTTS 内核升级,已无法直接使用从该站点下载的 pt 文件:
https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker
需要在容器的终端执行 python cover-pt.py,此操作会把 speaker 目录下的,以 seed_ 开头,以 _emb.pt 结尾的文件,即下载后的默认文件名 pt,转换为可用的编码格式,转换后的 pt 将改名为以 _emb-covert.pt 结尾,转换完成后之前下载的_emb.pt 结尾的文件就可以删除了。
本教程配套操作视频: