号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
从比例到笔画:书法上中下结构的全方位解析
育儿必读:五招预防宝宝尿布疹
新手爸妈必知:尿布疹护理全攻略
沐童舒&皮肤舒爽凝胶:新手爸妈必知的尿布疹护理神器
蒋勤勤首封影后:17岁儿子展现全能教育成果
首封影后的育儿经:传统文化与现代教育的完美融合
现代五项锦标赛首次采用“新五项”赛制,上海山东选手夺冠
药物联合心理治疗效果最佳,抑郁症治疗迎来新突破
牛里脊选购指南:5个关键点教你挑出最嫩的肉
现代五项迎奥运“绝唱”:巴黎赛后将取消马术
全球每7名青少年1人患精神疾病,15个征兆及早识别抑郁症
药物治疗配合心理干预,专家详解抑郁症防治要点
冬季进补正当时,牛里脊的N种花样吃法
蒋勤勤陈建斌育儿经:七大维度培养全面发展孩子
善式健康管理师教你快速入睡
军事睡眠法:两分钟入睡的科学助眠法
中医张军:四种助眠方法帮你告别失眠困扰
睡前吃大豆,助你一夜好眠
《秒睡:随时随地睡的幸福方法》:赵小明的心理学助眠指南
膝关节后侧疼痛的科学治疗法
缓解左脚膝腘疼痛,试试腘绳肌拉伸
MOTOOZ氨糖:科学护理,告别膝盖疼痛
央行双管齐下稳股市:降准与2000亿新工具齐发力
把握降息周期投资机会,专家建议关注金融地产消费板块
央行释放降息信号,金融地产等四大板块迎来布局良机
六牙白象灵牙仙:一个角色展现的道佛文化融合
天涯海角:从流放之地到浪漫圣地
三亚自驾游,悟空租车让你玩转天涯海角
老年机开机键在哪?教你快速找到!
北京五大公园开启冰雪游园会,20余项活动迎新春