问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

CosyVoice本地部署详细教程

创作时间:
作者:
@小白创作中心

CosyVoice本地部署详细教程

引用
CSDN
1.
https://blog.csdn.net/huazn612/article/details/141856359

本文将详细介绍如何在本地部署CosyVoice语音合成模型。从环境准备到模型运行,手把手教你完成整个部署过程。

CosyVoice 本地部署详细教程

注意事项

  • 所有相关的软件、文件名称不要使用中文名称,也不要有中文路径,也不要有空格。
  • 包括C盘用户名,不要有中文或空格。

模型部署前准备

  • nvidia显卡,建议显存6G以上
  • AI框架CUDA、cuDNN安装 (已安装可跳过此步骤)
  • Git安装(已安装可跳过此步骤)
  • Miniconda安装(已安装可跳过此步骤)
  • 配套视频教程:cosyvoice本地部署详细教程 手把手小白版

一、AI框架CUDA安装 (已安装可跳过此步骤)

  1. 检查本机是否安装CUDA,以及CUDA版本
  • win+R 打开运行,输入cmd打开命令行窗口

  • 输入nvcc -V 查看CUDA版本,注意’V’大写,若提示命令不存在,则未安装CUDA
nvcc -V
  • 输入NVIDIA-smi,查看当前显卡支持的CUDA版本,最好高于12.0.
NVIDIA-smi
  1. 下载安装CUDA

  • 点击安装,默认下一步即可,需要时可以更改安装位置,注意路径不要有中文或空格。
  • 配置环境变量, 搜索环境变量设置,编辑环境变量,将cuda的安装位置添加到系统变量。若安装程序已自动添加,无需更改。
  1. 下载安装cuDNN
  • 下载地址:https://developer.nvidia.com/rdp/cudnn-archive
  • 选择合适的版本,需对应之前安装的CUDA版本,如CUDA版本12.x,下载的对应的v8.9.7。(需要登录NVIDIA账号)
  • 免登录下载办法:找到需要的版本,右键–>复制链接–>导入下载器下载或浏览器新建页面粘贴链接下载
  • 解压压缩包,将文件夹内所有文件复制至之前安装的CUDA根目录,覆盖替换即可。
D:\MyToolsSoftWare\CUDADevelopment\
  • 配置环境变量
  • 新建cuDNN系统环境变量
  • 变量名:CUDNN。变量值为:CUDA根目录、bin目录、include目录、lib\u0064目录,中间由英文分号隔开。
D:\MyToolsSoftWare\CUDADevelopment;D:\MyToolsSoftWare\CUDADevelopment\bin;D:\MyToolsSoftWare\CUDADevelopment\include;D:\MyToolsSoftWare\CUDADevelopment\lib\u0064
  • 在系统path变量下,同样添加以上目录

  • 检查安装结果

  • win+R 打开运行,输入cmd打开命令行窗口

  • 输入nvcc -V 查看CUDA版本,注意’V’大写,若能正确返回CUDA版本号,证明安装成功。

nvcc -V

二、Git安装(已安装可跳过此步骤)

三、Miniconda安装(已安装可跳过此步骤)

  • 下载地址:https://docs.anaconda.com/miniconda/
  • 点击页面中“Miniconda3 Windows 64-bit”版本下载
  • 选择安装位置,建议新建conda文件夹,默认安装,勾选所有选项。
  • 检查安装结果,win+R 打开运行,输入cmd打开命令行窗口
  • 输入conda --version,若能正确返回conda版本号,证明安装成功。
conda --version

部署模型

注意:以下部署过程中命令均在命令行窗口中执行,如果命令行窗口执行过程中,一直提示SSLError或HTTPSConnectionError错误,则表示无法下载,需设置代理端口克隆和下载三方库:

设置方式:在命令行窗口运行以下指令

set http_proxy=http://127.0.0.1:你的代理端口地址 & set https_proxy=http://127.0.0.1:你的代理端口地址

代理端口需自行获取。

一、下载项目至本地

  1. Git克隆项目文件到本地:
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
cd CosyVoice
git submodule update --init --recursive

PS:国内用户如果克隆失败,可以多尝试几次。有魔法的话,建议开魔法克隆。
如果仍无法解决,可以下载压缩包文件(时间2024/9/2),历史版本。
百度网盘下载:https://pan.baidu.com/s/1lXL6JBZXWFuzHgxUHSzlsg?pwd=1wan 提取码: 1wan
夸克网盘下载:https://pan.quark.cn/s/f8da3aca0d92

  1. 创建conda环境
  • 在当前文件夹输入cmd,打开命令行窗口
  • 输入以下命令创建并启动虚拟环境
conda create -n cosyvoice python=3.8
conda activate cosyvoice

二、下载安装第三方依赖库

  1. 安装前需先修改文件夹中requirements.txt内容
修改前:onnxruntime-gpu==1.16.0; sys_platform == 'linux'
onnxruntime==1.16.0; sys_platform == 'darwin' or sys_platform == 'windows'
修改后:onnxruntime==1.16.0
  1. 执行安装命令
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

上边为官方推荐镜像,速度较慢,推荐使用下方镜像。

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 手动安装torch
    安装过程中torch若下载过慢,可以手动下载该文件后,重新激活虚拟环境,手动安装该库。
pip install D:\AI\torch-2.0.1+cu118-cp38-cp38-win_amd64.whl -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 重新执行安装三方库直至全部安装完成
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
  1. 可能出现的error
  • cython 安装失败
  • 解决办法:手动安装
pip install cython -i https://pypi.tuna.tsinghua.edu.cn/simple
  • 各种情况导致的“Failed to build pynini”,pynini安装失败
  • 解决办法:conda手动安装
conda install -c conda-forge pynini=2.1.5

三、下载模型

  1. 新建Python程序文件粘贴以下内容保存
from modelscope import snapshot_download
snapshot_download('iic/CosyVoice-300M', local_dir='pretrained_models/CosyVoice-300M')
snapshot_download('iic/CosyVoice-300M-SFT', local_dir='pretrained_models/CosyVoice-300M-SFT')
snapshot_download('iic/CosyVoice-300M-Instruct', local_dir='pretrained_models/CosyVoice-300M-Instruct')
snapshot_download('iic/CosyVoice-ttsfrd', local_dir='pretrained_models/CosyVoice-ttsfrd')
  1. 激活虚拟环境,直接执行Python程序download_models.py
python download_models.py
  1. 也可以从以下链接直接下载模型,解压至项目文件夹即可(2024/9/2)
pip install modelscope==1.17.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

四、运行模型

  1. 内置音色模型启动(命令行)
conda activate cosyvoice
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M-SFT
start http://127.0.0.1:50000
  1. 内置音色模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
@echo off
call conda activate cosyvoice
start http://127.0.0.1:50000
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M-SFT
pause
  1. 克隆音色+跨语种克隆模型启动(命令行)
conda activate cosyvoice
python webui.py --port 50001 --model_dir pretrained_models/CosyVoice-300M
start http://127.0.0.1:50001
  1. 克隆音色+跨语种克隆模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
@echo off
call conda activate cosyvoice
start http://127.0.0.1:50001
python webui.py --port 50001 --model_dir pretrained_models/CosyVoice-300M
pause
  1. 内置音色+语气微调模型启动(命令行)
conda activate cosyvoice
python webui.py --port 50002 --model_dir pretrained_models/CosyVoice-300M-Instruct
start http://127.0.0.1:50002
  1. 内置音色+语气微调模型启动(启动文件)
  • 新建bat文件,把以下命令粘贴进文件,运行即可。
@echo off
call conda activate cosyvoice
start http://127.0.0.1:50002
python webui.py --port 50002 --model_dir pretrained_models/CosyVoice-300M-Instruct
pause

五、总结

根据功能需求,点击对应的.bat文件启动程序。

  1. 内置音色生成;
  2. 克隆音色+跨语种克隆;
  3. 内置音色生成+语气微调;
  • 浏览器页面会同步打开,但是不显示内容。需等待命令行窗口加载完成后,刷新下网页即可显示程序界面。
  • 参考教程:https://note.youdao.com/s/Z83Sljd1
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号