问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

国产AI大战高考物理,第1题全对,第2题开始放飞

创作时间:
作者:
@小白创作中心

国产AI大战高考物理,第1题全对,第2题开始放飞

引用
CSDN
1.
https://blog.csdn.net/QbitAI/article/details/139585755

端午佳节期间,各地高考正在如火如荼地进行。在语文数学之后,让我们看看大模型们如何挑战高考物理试题。

这份物理卷共有10道选择题,其中1-7题为单选题,总计28分。在测试开始前,需要说明的是,本次测试方法较为简单粗暴,不能完全反映各AI的真实水平,仅图一乐。

在单选题中,准确率最高的是第一题,一道有关标量矢量的概念题,所有参赛大模型均正确作答。到了第二题,大模型们就开始出现分歧。题目是:

在多选题部分(共18分),各AI的表现如下:

根据多选题的判卷规则(全部选对得满分,部分选对得一半分,有选错不得分),表现最佳的是海螺AI(2道题全对,1道题部分对),其次是通义千问、文心一言和万知(1道题全对,2道题部分对)。

在本次测试中,尽管AI在某些题目上表现不佳,但整体来看,还是有不少选手能在46分的选择题中拿到及格分。这反映了当前AI在图像识别和逻辑推理方面的能力和局限性,也为我们提供了有趣的观察视角。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号