Unraid安装开源AI语音合成神器ChatTTS-ui教程

67次阅读
没有评论

共计 1388 个字符,预计需要花费 4 分钟才能阅读完成。

        我们先来听下效果,这是最近很火的 ChatTTS 项目,它是一款非常真实、自然、流畅的语音合成工具,它支持英文和中文两种语言。最大的模型使用了 10 万小时以上的中英文数据进行训练,支持上万种音色,支持音色克隆等功能。

         本期视频就教大家如何在 Unraid 上面快速部署 ChatTTS,自带 WEBUI,无需显卡也可以使用,无需各类付费和有限制的软件,在本地就能合成语音了。

        首先,我们在应用市场搜索安装 docker compose manager,已经安装过的同学可以忽略。

        安装完成后,点击设置,找到 compse 设置,把 Compose Project Directory 改到我们默认存放 docker 数据的路径:

/mnt/user/appdata

点击应用保存,这样可以方便我们对 compose 容器的安装和管理。

然后,打开 unraid 自带的 web SSH 终端工具,执行命令进入 /mnt/user/appdata 目录:

cd /mnt/user/appdata

执行拉取项目仓库命令:

git clone https://github.com/jianchang512/ChatTTS-ui.git chat-tts-ui

执行命令进入到项目目录:

cd chat-tts-ui

查看下目录内的文件:

ls

        可以看到,这里面有 docker-compose.cpu.yaml 和 docker-compose.gpu.yaml 两个 yaml 配置文件,我这台机子没有显卡,我们就需要使用后缀为 cpu.yaml 配置文件。

        执行下面命令将 docker-compose.cpu.yaml 文件名重命名为 docker-compose.yml,就可以让 unraid 的 compose 调用管理:

mv docker-compose.cpu.yaml docker-compose.yml

        完成后回到 unraid,点击 docker,在最下面就可以看到我们刚创建的 chat-tts-ui 的 STACK 堆栈了点击 COMPOSE UP 启动,等待数据拉取和容器部署,这个窗口不要关闭,必须等待所有任务执行完成。

        经过 2 分钟的等待,看到 Container chat-tts-ui Started 提示,就代表我们已经部署成功了。

        在 docker 容器里可以看到容器的访问 IP 和端口,复制下来,就可以进行访问了。

        软件具体用法呢,其实也很简单,web ui 下的控制参数并不是很多,主要是需要找到自己喜欢的音色,然后在对其进行微调。下方提供了 10000 个中文音色包的下载地址,大家可以去下载使用。

10000 个中文音色.zip 下载地址:

链接:https://pan.quark.cn/s/03fcec7d6bf4

 


0.96 版本后,因 ChatTTS 内核升级,已无法直接使用从该站点下载的 pt 文件:

https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker

        需要在容器的终端执行 python cover-pt.py,此操作会把 speaker 目录下的,以 seed_ 开头,以 _emb.pt 结尾的文件,即下载后的默认文件名 pt,转换为可用的编码格式,转换后的 pt 将改名为以 _emb-covert.pt 结尾,转换完成后之前下载的_emb.pt 结尾的文件就可以删除了。


本教程配套操作视频:

正文完
 0
评论(没有评论)