问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

本地部署 fish-speech：一款支持多语言的语音合成工具

创作时间:

作者:

@小白创作中心

本地部署 fish-speech：一款支持多语言的语音合成工具

引用

CSDN

1.

https://blog.csdn.net/engchina/article/details/144634619

fish-speech是一款先进的语音合成工具，支持零样本和小样本TTS，能够处理多语言文本，并提供WebUI和GUI两种用户界面。本文将详细介绍如何在本地部署和使用fish-speech，包括具体的安装步骤和运行方法。

0. fish-speech 特性

零样本 & 小样本 TTS：输入 10 到 30 秒的声音样本即可生成高质量的 TTS 输出。详见语音克隆最佳实践指南。
多语言 & 跨语言支持：只需复制并粘贴多语言文本到输入框中，无需担心语言问题。目前支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
无音素依赖：模型具备强大的泛化能力，不依赖音素进行 TTS，能够处理任何文字表示的语言。
高准确率：在 5 分钟的英文文本上，达到了约 2% 的 CER（字符错误率）和 WER（词错误率）。
快速：通过 fish-tech 加速，在 Nvidia RTX 4060 笔记本上的实时因子约为 1:5，在 Nvidia RTX 4090 上约为 1:15。
WebUI 推理：提供易于使用的基于 Gradio 的网页用户界面，兼容 Chrome、Firefox、Edge 等浏览器。
GUI 推理：提供 PyQt6 图形界面，与 API 服务器无缝协作。支持 Linux、Windows 和 macOS。查看 GUI。
易于部署：轻松设置推理服务器，原生支持 Linux、Windows 和 macOS，最大程度减少速度损失。

1. 本地部署 fish-speech

克隆代码，

git clone https://github.com/fishaudio/fish-speech

修改 tools/download_models.py，将 "gitattributes" 改为 ".gitattributes"。（估计后期代码库会修复，如果代码库已修复，这步就不用做了。）

# "gitattributes"
".gitattributes"

下面是基于windows环境进行部署，进入到 fish-speech 目录，双击 install_env.bat 安装虚拟环境。

2. 运行 fish-speech

下面是想使用 WebUI 界面进行推理，编辑项目根目录下的 API_FLAGS.txt，前三行修改成如下格式：

--infer
# --api
# --listen ...
...

双击 start.bat 运行 fish-speech。第一次运行时，会从网上自动下载模型。

然后使用浏览器，打开 http://127.0.0.1:7860/ 进行访问。

然后单击 “推理配置”，按照截图进行配置，我本地环境，设置编译模型为 "Yes" 会报错，实际使用的时 "No" 这个选项。

然后使用浏览器，打开 http://127.0.0.1:7862/ 进行访问。

之后，输入要推理的文本，上传参考音频，单击 “生成” 就可以进行推理了。

参考资料：

热门推荐

大语言模型的深度裁剪法

大语言模型的深度裁剪法

劳动争议纠纷是否适用合同法

劳动争议纠纷是否适用合同法

新手上路要注意这十点！真后悔才知道

新手上路要注意这十点！真后悔才知道

如何解压压缩文件：常见格式与解压方法全解析

如何解压压缩文件：常见格式与解压方法全解析

皮肤长痘?可能内分泌出问题了

皮肤长痘?可能内分泌出问题了

中国十大顶级红茶最新排名与口感评测

中国十大顶级红茶最新排名与口感评测

手机连接打印机的6种实用方法，总有一款适合你

手机连接打印机的6种实用方法，总有一款适合你

留学选校全攻略：从动机到就业，七大维度助你精准定位理想院校

留学选校全攻略：从动机到就业，七大维度助你精准定位理想院校

AI生图五大乱象④|打不完的官司：创作或剽窃，版权谁来定

AI生图五大乱象④|打不完的官司：创作或剽窃，版权谁来定

提升手机使用体验，手机分身功能你需要知道的那些事儿！

提升手机使用体验，手机分身功能你需要知道的那些事儿！

一个动作就能补元气、调气血、强身健体！很适合夏天做！

一个动作就能补元气、调气血、强身健体！很适合夏天做！

快速止牙痛的6个小妙招来啦！

快速止牙痛的6个小妙招来啦！

如果你无法在iPhone或iPad上下载或更新App

如果你无法在iPhone或iPad上下载或更新App

如何帮助社交恐惧的高中生克服心理障碍

如何帮助社交恐惧的高中生克服心理障碍

王者荣耀分路匹配功能引发争议，玩家呼吁优化机制

王者荣耀分路匹配功能引发争议，玩家呼吁优化机制

怎样通过饮食改善便秘？

怎样通过饮食改善便秘？

白头发千万不要随便拔，损伤毛囊小心掉光光

白头发千万不要随便拔，损伤毛囊小心掉光光

数字平台对就业的促进作用及面临的挑战

数字平台对就业的促进作用及面临的挑战

PUBG枪械谁最强？《绝地求生》2024最新枪械强度排行榜！

PUBG枪械谁最强？《绝地求生》2024最新枪械强度排行榜！

备孕迟迟怀不上，可能问题出在这儿

备孕迟迟怀不上，可能问题出在这儿

减肥一斤要消耗多少千卡热量

减肥一斤要消耗多少千卡热量

银杏叶的花语：永恒的友谊与深沉的爱情

银杏叶的花语：永恒的友谊与深沉的爱情

马斯克旗下脑机接口公司下周进行第二例人类植入手术，数年内或增至千人

马斯克旗下脑机接口公司下周进行第二例人类植入手术，数年内或增至千人

20-20-20 法則是什麼？改善眼睛疲勞的最佳方法！

20-20-20 法則是什麼？改善眼睛疲勞的最佳方法！

小型榨油厂精炼设备自动化程度的探讨

小型榨油厂精炼设备自动化程度的探讨

风靡靡的意思是什么？风靡全球！“靡”到底是什么意思？!

风靡靡的意思是什么？风靡全球！“靡”到底是什么意思？!

想要退休后获得更高养老金，谨记重要原则：多缴多得、长缴多得

想要退休后获得更高养老金，谨记重要原则：多缴多得、长缴多得

绿色能源浪潮下的非洲：探索可持续发展之路

绿色能源浪潮下的非洲：探索可持续发展之路

雅典和斯巴达之间爆发反纳比斯战争的原因是什么？

雅典和斯巴达之间爆发反纳比斯战争的原因是什么？

【新能源二手车避坑指南】手把手教你查电池底细挑车不被割韭菜

【新能源二手车避坑指南】手把手教你查电池底细挑车不被割韭菜

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号