号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
车牌号222:你的幸运符?
雷凌自动驻车功能使用指南:每次启动都需要操作吗?
健身达人挑战:变身迪迦奥特曼
家庭聚会vlog:用视频记录美好瞬间
江门中微子实验完成95%,中国领跑中微子通信技术
中国科学家突破:量子纠缠通信实现百公里传输
抖音热拍:8种短视频运镜技巧大揭秘!
李世民的帝王权谋:《帝范》里的管理智慧
揭秘古代皇帝如何智斗奸臣:从法律到权谋的智慧
诸葛亮的权谋智慧:从《三国演义》到现代启示
三国权谋大师:刘备、曹操、曾国藩教你职场生存法则
揭秘《哪吒2》里的文物彩蛋,3岁的百亿影帝是这样练成的……
春节档电影对比:《哪吒2》如何以情感共鸣逆袭成神?
石榴花的寓意是什么?石榴花有哪些象征意义?
全国8大优质石榴产地,皮薄籽软香甜多汁,买石榴时要优先选择
国家流感中心:联防联控应对流感大流行风险
王钰栋闪耀亚冠:从深圳球场到国家队的足球追梦人
国庆打卡神仙洞村:探秘伏羲山的自然奇观
如何通过海外代理商学习平台提升合作伙伴的培训效果与参与度?
比亚迪二期投产助力望城区打造千亿级智能终端产业集群
揭秘青岛市花,一起看看它是什么花吧(青岛市花的花语、特征及意义)
U20亚洲杯倒计时:久尔杰维奇率队全力冲刺
U20亚洲杯揭幕战:中国队2-0完胜卡塔尔,蒯纪闻刘诚宇建功
U20亚洲杯在深圳开赛,深圳青训基地见证中国足球新希望
满城烟花!2025南昌迎春烟花晚会浪漫上演
云南白药保险子:一颗救命丹的百年传奇
云南白药中的“救命丹”:保险子的正确使用指南
云南白药保险子:急救神器还是传说?
每天了解一个城市—山东菏泽,“中国牡丹之都”
团队代理如何管理制度