号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
十二生肖背后的阴阳哲学:从五行对应到文化传承
蛇年春节谁最火?生肖金销售火爆成最大亮点
《阿加莎:无所不在》:揭秘绯红女巫的复活之谜与她的神秘之旅
优甲乐常见误区,你中招了吗?
横店影视产业实验区20周年庆典:文荣奖颁奖典礼亮点回顾
专家解读:老年高血压治疗迎来新突破
冬季来临,老年人如何科学监测血压?
优甲乐:甲状腺健康守护神
第十届横店影视文荣奖揭晓:《志愿军》《扫黑》等作品获奖
横店影视文荣奖:新星闪耀,见证中国影视十年发展
除甲醛仪器的结构组成与工作原理详解
去韩国旅游需费用,几月份去旅游比较好?「什么季节去韩国旅游最好」
韩国旅游大概多少费用「韩国旅游一般要多少钱」
鲍鱼需要蒸多久才能熟
鲍鱼蒸几分钟最佳时间-如何根据大小与种类掌握蒸制技巧
鲍鱼蒸几分钟最佳时间 鲍鱼最正宗的做法是什么
横店文荣奖:青年影人的星光大道
张杰设计的文荣奖奖杯背后的故事
山药乌鸡汤:秋冬养生的暖心之选
有效的长高方法
蚯蚓的养殖技术:从环境控制到采收加工的全面指南
蚯蚓的养殖方法,根据不同的情况来选择合适的容器
横店影视城打卡攻略:三大景区必玩项目全解析
文荣奖红毯:新生代演员闪耀时刻
陈凯歌点赞横店速度,文荣奖见证影视辉煌
《时光代理人》陆光和程小时关系解析:他们是情侣吗?
康奈尔大学新型锂电池实现5分钟极速充电
妙佑医疗国际&北京清华长庚医院推荐:老年人血压管理七步法
冬季护心攻略:老年人高血压的科学预防
自助餐攻略:如何优雅地享受并最大化美食体验