实测4090显卡对AI模型推理效果:加速56.26%
创作时间:
作者:
@小白创作中心
实测4090显卡对AI模型推理效果:加速56.26%
引用
1
来源
1.
https://53ai.com/news/LargeLanguageModel/2024071392753.html
本文通过实测对比展示了4090显卡在AI模型推理中的作用。测试使用了whisper系列模型处理不同长度的音频数据,结果显示显卡加速显著提升了推理速度。
测试细节
- 显卡型号:4090D
- 测试模型:whisper音频转文字AI模型(包括tiny、base、small、medium、large、large-v1、large-v2、large-v3共八个模型)
- 测试数据:10秒和30秒长度的音频
测试背景
在之前的音频转文字任务中,没有使用显卡加速。为了验证显卡加速的效果,本次测试对比了有无显卡加速的推理时间。
无显卡加速测试结果
首先测试了10秒长度音频在纯CPU推理下的表现:
从测试结果可以看出:
- tiny和base模型虽然速度快,但准确率较低
- 从medium模型开始,准确率提升,但耗时显著增加,达到29秒,是原音频长度的3倍
有显卡加速测试结果
接下来测试了有显卡加速的情况,同样是10秒长度音频:
结果显示:
- large系列模型的推理时间稳定在18秒左右,不到原音频长度的2倍
- 相比无显卡加速时的30-50秒,有显卡加速时的推理时间大幅降低
进一步对比测试
为了验证音频长度对推理时间的影响,测试了30秒长度音频的推理情况,并将三次测试结果进行对比:
其中:
- 蓝色表示无显卡加速,10秒音频
- 红色表示有显卡加速,10秒音频
- 橙色表示有显卡加速,30秒音频
测试结论
在保证准确度的前提下,使用large系列模型时:
- 无显卡加速的平均时长为42.00秒
- 有显卡加速的平均时长为18.37秒
- 使用GPU后的平均时长相比于不使用GPU时提高了约56.26%
综合测试结果表明,显卡加速确实显著提升了推理速度。推荐使用whisper的large-v2模型,因为它在准确率和推理速度上都表现出色。
热门推荐
上海必打卡的6条超赞CityWalk路线
面对折磨人的“鼠标手”,该怎么办?
空中上演“草船借箭”:揭秘BriteStorm电子战干扰装置
中国古代十大乐器
《中国绘画源流》:一部追源溯流的极简中国绘画史

先进电气技术 —— 电力载波通信
《自然》子刊:改造脂肪为棕色脂肪抑制肿瘤生长
重磅!前瞻产业研究院发布《中国钠离子电池产业七项“十大”榜单》
浴室清洁全攻略:从工具准备到日常维护,打造洁净卫生的卫浴空间
创业贷款需要哪些手续和条件
免税店是什么意思
嘉峪关,不只是雄关,更是多彩旅行的起点
欠债纠纷律师委托流程图:全面解析及法律实务操作指南
肝硬化:从病因到治疗的全面解析
来了宝鸡怎么吃?这些本地特色别说我没告诉你!
官禄宫:个人官运与官职的命理关联
顺治帝与董鄂妃:一段刻骨铭心的爱恋
荨麻疹和过敏的区别
健康科普 | 宝宝睡着后,在他身边玩手机会影响他的睡眠吗?
郑州房价稳中有降,郑东新区仍坚挺
成都三天两晚旅游攻略及必吃美食
诉讼离婚所需文件和证据有哪些
剑网1归来枪天王加点推荐:技能选择与心法搭配详解
当代书画名家唐铎:墨虾图中的艺术传承与创新
侵权赔偿标准依据是什么
杨梅的施肥方法
吉他音箱调节完全指南:从音量到混响的全方位设置
A股收官:告别2024,期待2025
跑步机坡度调节功能完全指南:作用、选择与使用技巧
匈牙利签证申请指南:表格填写、所需材料及办理流程详解