问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

唤醒词解决方案

创作时间:
作者:
@小白创作中心

唤醒词解决方案

引用
CSDN
1.
https://blog.csdn.net/wtl1992/article/details/145320522

唤醒词解决方案

1. 唤醒词项目介绍

唤醒词:腾瑞腾瑞

功能描述

通过说出"腾瑞腾瑞"来唤醒 hello.mp3 中的音频内容,达到唤醒词的功能。通过人工智能(AI)的不同的技术手段来实现这个功能。

2. 三个解决方案

1. 模型训练推理解决

通过傅里叶变换,采集到wav音频文件的特征,通过Conv1D + LSTM + Linear 作模型来进行训练,并使用特殊的推理代码进行唤醒词识别。

2. 通过RAG技术进行余弦相似度计算解决

RAG(检索增强生成)

  1. RAG技术可以解决的两大AI问题

    1. 第一大AI问题:

      大模型幻觉问题

      可能我们的场景是训练出一个垂直领域的微调大模型,当然这里说的大模型指的是公开模型文件的大模型。

      那么这时候我们可以有两个解决方案可以选择,那就是微调大模型和挂载知识库。

      这里值得一提的是,微调大模型可以使得该微调后的大模型能

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号