OpenAI开源免费AI语音转文字工具Whisper本地部署指南
创作时间:
作者:
@小白创作中心
OpenAI开源免费AI语音转文字工具Whisper本地部署指南
引用
CSDN
1.
https://blog.csdn.net/TechAI/article/details/136903249
Whisper是OpenAI开发的一款强大的语音识别工具,能够将语音转换为文本,并支持多语言识别、翻译和语言检测。与其他商业语音转文字产品不同,Whisper完全开源且免费,效果出色。本文将详细介绍如何在Windows11系统上部署和运行Whisper。
一、使用场景
语音转文字功能在多个场景中都有重要应用:
- 会议、讲座、法庭、医疗等场景的记录
- 口述笔记,方便需要频繁记录思路、灵感的人
- 智能助手,例如智能音箱、导航等
- 文案提取,将视频中的对话转换为文字
ChatGPT的手机APP中使用的语音对话功能,就是基于Whisper实现的。
二、安装步骤
1. 安装FFmpeg
FFmpeg是一个开源的多媒体框架,用于处理音视频数据。下载地址:ffmpeg.org/download.html
安装完成后,在命令行中输入以下命令检查是否安装成功:
ffmpeg -version
如果无法执行,需要手动配置环境变量PATH。
2. 安装Rust
Rust是一种系统编程语言,Whisper的某些组件需要使用Rust编译。下载地址:rust-lang.org/tools/install
安装完成后,检查命令行是否可以执行:
rustc --version
如果无法执行,需要手动配置环境变量PATH。默认安装位置是~/.cargo/bin
。
3. 安装Whisper
创建Python虚拟环境,因为Whisper需要特定版本的Python:
conda create --name whisper_env python=3.9.18
activate whisper_env
安装依赖库:
pip install setuptools-rust
pip install -U openai-whisper
三、运行
命令行运行
在命令行中输入以下命令:
whisper Haul.mp3 --model medium
其中,“Haul.mp3”是测试用的音频文件。“--model medium”指定使用medium版本的模型(Whisper有多种模型:tiny、base、small、medium、large,模型大小依次变大)。
第一次运行时,会先下载指定的模型,需要耐心等待一会儿。模型下载之后,就会开始执行语音识别,输出识别结果,并自动写入文件。
Python代码中运行
import whisper
# 加载模型
model = whisper.load_model("medium")
# 加载音频文件
audio = whisper.load_audio("Haul.mp3")
audio = whisper.pad_or_trim(audio)
# make log-Mel spectrogram and move to the same device as the model
mel = whisper.log_mel_spectrogram(audio).to(model.device)
# detect the spoken language
_, probs = model.detect_language(mel)
print(f"Detected language: {max(probs, key=probs.get)}")
# decode the audio
options = whisper.DecodingOptions()
result = whisper.decode(model, mel, options)
# print the recognized text
print(result.text)
通过以上步骤,你就可以在本地运行Whisper,体验其强大的语音转文字功能了。项目源码地址:github.com/openai/whisper
热门推荐
前端需求文档编写指南:从模板到实例
跨境电商时代,海外仓服务如何助力企业实现本土化运营
谁会是中国第五城?Deepseek给出了答案
房地产不香了?上海地产集团频频转让资产,背靠上海国资为何不行了?
世界上,至今依然还在战乱的10个国家,结合地图了解一下
优化投资组合:资产再平衡的策略与时机
晋江南天寺泉南佛国摩崖石刻
如何将多页PDF转换为长截图
玄学香的现代应用:芳香疗法
户型图风水解析:九宫图揭示8种经典户型奥秘
儿童语言发育迟缓?家长请注意!这五种训练方法要掌握
汉语国际教育专业求职者怎样写好技能特长
出入库表怎么求剩余数
老人五七到了有哪些讲究? 五七的日子应该怎么算?五七为什么不能哭?你真的了解吗
高圆圆的成名史,你想知道吗?
2万元适合投资什么理财?两万块钱做什么理财
雨水至,最美的雨水在诗词里
明朝“异端思想家”李贽:那个批判孔子“非圣”的人
厦门两日游路线推荐
传销币鼻祖PI将上线头部交易所 能成功提币的用户是少数
如果将各个国家比喻成十二星座,你认为分别是什么星座呢?
中性粒细胞偏高:是病毒、细菌?还是肿瘤?
手机镜头保护膜选购指南
新能源车也怕放:长期不开,电池尽量别充满你怎么看?
爱的滋养:在亲子关系中培养孩子的幽默感与乐观心态
大模型总弄错「事实」怎么办?这有一份汇聚了300多篇文献的综述
单侧、双侧耳鸣原因各不同!耳鸣的类型一次整理给你
如何识别"妈宝男"?
亚洲殿堂级歌后中岛美雪:70岁高龄仍在创作,用500多首原创歌曲影响了几代人
保险公司“炒股”赚钱了