本地部署 fish-speech:一款支持多语言的语音合成工具
创作时间:
作者:
@小白创作中心
本地部署 fish-speech:一款支持多语言的语音合成工具
引用
CSDN
1.
https://blog.csdn.net/engchina/article/details/144634619
fish-speech是一款先进的语音合成工具,支持零样本和小样本TTS,能够处理多语言文本,并提供WebUI和GUI两种用户界面。本文将详细介绍如何在本地部署和使用fish-speech,包括具体的安装步骤和运行方法。
0. fish-speech 特性
- 零样本 & 小样本 TTS:输入 10 到 30 秒的声音样本即可生成高质量的 TTS 输出。详见语音克隆最佳实践指南。
- 多语言 & 跨语言支持:只需复制并粘贴多语言文本到输入框中,无需担心语言问题。目前支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
- 无音素依赖:模型具备强大的泛化能力,不依赖音素进行 TTS,能够处理任何文字表示的语言。
- 高准确率:在 5 分钟的英文文本上,达到了约 2% 的 CER(字符错误率)和 WER(词错误率)。
- 快速:通过 fish-tech 加速,在 Nvidia RTX 4060 笔记本上的实时因子约为 1:5,在 Nvidia RTX 4090 上约为 1:15。
- WebUI 推理:提供易于使用的基于 Gradio 的网页用户界面,兼容 Chrome、Firefox、Edge 等浏览器。
- GUI 推理:提供 PyQt6 图形界面,与 API 服务器无缝协作。支持 Linux、Windows 和 macOS。查看 GUI。
- 易于部署:轻松设置推理服务器,原生支持 Linux、Windows 和 macOS,最大程度减少速度损失。
1. 本地部署 fish-speech
克隆代码,
git clone https://github.com/fishaudio/fish-speech
修改 tools/download_models.py,将 "gitattributes" 改为 ".gitattributes"。(估计后期代码库会修复,如果代码库已修复,这步就不用做了。)
# "gitattributes"
".gitattributes"
下面是基于windows环境进行部署,进入到 fish-speech 目录,双击 install_env.bat 安装虚拟环境。
2. 运行 fish-speech
下面是想使用 WebUI 界面进行推理,编辑项目根目录下的 API_FLAGS.txt,前三行修改成如下格式:
--infer
# --api
# --listen ...
...
双击 start.bat 运行 fish-speech。第一次运行时,会从网上自动下载模型。
然后使用浏览器,打开 http://127.0.0.1:7860/ 进行访问。
然后单击 “推理配置”,按照截图进行配置,我本地环境,设置编译模型为 "Yes" 会报错,实际使用的时 "No" 这个选项。
然后使用浏览器,打开 http://127.0.0.1:7862/ 进行访问。
之后,输入要推理的文本,上传参考音频,单击 “生成” 就可以进行推理了。
参考资料:
热门推荐
庞涓:被误解的军事才能
四柱八字命理学入门:从基础概念到实战应用的全面指南
《刺客信条·影》评测与购买建议:7.3分
GIA钻石证书上最重要的8个信息一定要会看!
火影忍者卑留呼决斗场玩法攻略
智能监控系统:保护你的安全
在家轻松做出外面餐馆级别的烤鱼:从选鱼到调味的全流程指南
急性心梗早期识别和院前抢救
米兰花的种植与养护(从选种到施肥,让你轻松拥有美丽的米兰花)
家里有快倒掉!面粉厂员工都不敢吃的面粉,添加剂里掺了点面粉
金叉与死叉:股票技术分析中的关键信号
海带芽和裙带菜有什么区别?如何区分它们?
研发团队如何应对技术标准的变化
游戏手柄的退出键在哪里?
盘点半月痕少的补救措施
银行账户被锁定怎么办?这份实用指南请收好
阿Q人物形象解读:历史背景下的个体命运与社会矛盾
熬银耳汤不出胶?大厨教你几招,20分钟煮出胶质浓郁的银耳汤
眼睛最爱的七大营养
酒店消费者权益法赔偿规定
电脑散热器不转的原因及解决方法(为什么电脑散热器不转)
被造谣应该怎么办?一文详解应对措施与法律维权
【兴证固收.转债】把握变奏阶段的机会——可转债2025年3月展望
中国田径队在历届室内世锦赛奖牌大盘点,刘翔1金2银1铜
一个超靠谱的避孕办法,很多人却不敢用
赡养老人证明资料填写指南及法律依据解析
东汉末建安七子之一王粲简介:深得曹氏父子信赖,赐爵关内侯
网贷逾期还了没有结清怎么查询
Switch与PS5对比评测:哪款游戏机更适合你?
如何在甘特图中处理单个任务的多时间段?