C++实现语音识别(Whisper.cpp)入门教程
创作时间:
作者:
@小白创作中心
C++实现语音识别(Whisper.cpp)入门教程
引用
CSDN
1.
https://blog.csdn.net/hhy321/article/details/139890557
本文将介绍如何使用C++实现语音识别,具体使用的是OpenAI的Whisper模型的C/C++端口——whisper.cpp。文章将详细讲解从环境搭建、模型下载到实际测试的全过程。
1. 简介
Whisper 是一种通用语音识别模型。它是在各种音频的大型数据集上训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。
2. 环境准备
2.1 Visual Studio 2017
请访问 Visual Studio 下载页面 进行安装。
2.2 CMake
请访问 CMake 下载页面 进行安装。
3. whisper.cpp 下载与编译
3.1 下载whisper.cpp
whisper.cpp 是 OpenAI 的 Whisper 模型的 C/C++ 端口,可以通过 GitHub 下载源码:
git clone https://github.com/ggerganov/whisper.cpp.git
然后通过 models/download-ggml-model.cmd 进行权重文件下载:
models/download-ggml-model.cmd tiny
models/download-ggml-model.cmd base
整个 whisper 系列一共有5个级别的模型,按参数量进行排序,分别是微型 tiny,基本 base,小型 small,中型 medium,大型 large。参数 base 可以替换为 base.en, tiny, tiny.en, small, small.en, medium, medium.en, large。带 en 后缀的表示是英语模型,不带 en 后缀的是多国语言模型。
3.2 编译whisper.cpp
进入项目目录并生成 VS 工程文件:
mkdir build
cd build
cmake ..
编译生成 main 程序。
4. 测试
执行 main.exe 进行语音识别测试:
main.exe -m C:\Users\tomcat\Desktop\yxy\whisper.cpp\models\ggml-base.bin -f C:\Users\tomcat\Desktop\yxy\whisper.cpp\build\bin\Debug\output.wav -l zh
可以修改参数后再次执行:
main.exe -m C:\Users\tomcat\Desktop\yxy\whisper.cpp\models\ggml-base.bin -f C:\Users\tomcat\Desktop\yxy\whisper.cpp\build\bin\Debug\output.wav
5. 批量处理
可以编写批处理脚本进行批量语音识别:
chcp 65001
@echo off
REM 设置 PATH 环境变量,包含whisper可执行文件
SET PATH=%PATH%;C:\python312\Scripts
REM 指定所有视频所在路径,支持多级目录。
SET "video_dir=C:output"
REM 循环遍历所有视频
FOR /R "%video_dir%" %%f IN (*.mp4,*.wav,*.avi,*.ts) DO (
REM 提取视频文件名
SET "file_name=%%~nf"
REM 切换到视频所在目录
cd /d "%%~dpf"
REM 为这个视频生成wav音频文件
ffmpeg.exe -i "%%f" -ar 32000 -acodec pcm_s16le "%%f.wav"
REM 语音文件识别
main.exe -l zh -osrt -m C:\ggml-medium.bin "%%f.wav"
REM 返回原目录
cd /d "%video_dir%"
)
pause
热门推荐
士掌文教,大夫理政:古代中国两大阶层的职能分工
金命人:坚韧果断铸就职场优势,五大领域成就非凡
从资产负债表看企业健康:三大分析方法详解
湖南醴陵窑:釉下五彩瓷发源地,从宋至现代的窑火传承
“中国陶瓷之都”醴陵:自驾游交通、景点全攻略
1-18岁孩子的心理特点和应对方法
生肖鼠的职场逆袭:聪明才智与灵活应变的双重优势
70年代苏州记忆:《小巷人家》里的园林、美食与人情
冠脉乐片:丹参酮与人参皂苷协同防治心血管疾病
美国签证面试通关指南:五大环节逐一击破
“同事是NPD人格,我快受不了了”
2025肥城桃花节最美一日游攻略:十万亩桃花海等你来
春秋战国时期的各国政治制度
秋游大兴安岭还是登黄山?这份攻略帮你决定
DAB在免疫组化中的应用新突破:从胰腺癌类器官模型到安全性改进
周杰教你如何在舞台上完美演绎包青天
网络订餐服务的商业模式创新:从技术创新到跨界合作
“各回各家,各找各妈”:年轻人的新年新选择
春节心理保健指南:各年龄段全覆盖
石家庄市校园掀起中医药文化热潮
春节拜年礼仪全攻略:让孩子成为最受欢迎的小可爱
破壁机让早餐制作超简单,5款懒人食谱轻松搞定营养搭配
中医养生:天人合一与阴阳平衡的秘密
冬藏养生:中医教你科学过冬
黛安娜博士教你避开减寿坏习惯
饮食调整是促进健康最有力的手段
戒烟真的能延长寿命吗?科学数据告诉你答案
心态管理,让你活得更久更精彩
双色球2527万巨奖花落山东,巨额奖金背后的故事
何继善院士开讲重庆大学城三中“阳光讲坛”:志在长空更阳光