号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
js如何动态添加图片
热塑性碳纤维复合材料性能与玻璃化转变温度的关联
邏輯是可以訓練的嗎?
世界上最有争议的河流:长宽都是290公里,但无法定义是河还是海
如何选择黑咖啡?从成分到功效全面解析
《哪吒2》刷新香港华语电影及动画电影开画纪录;本周有多部高分新片上映|一周票房
高层建筑结构设计扭转反应控制措施论文
绝经越早,意味着衰老越快?
屡屡中招!揭秘五花八门的诈骗套路
春季小孩子穿衣不犯愁!5度到15度精准搭配指南
我国合并最成功的大学!合并多所211后,逆袭成为985,排名全国十五强!
“A股逆转概率超95%”!巴菲特5.5万倍收益背后的三大秘诀!
手机连接新Wi-Fi全攻略:快速上手,稳定上网!
长沙汨罗两地联合举办抗战胜利日纪念活动
场内ETF“话语权”不断上升,股票型ETF成交额占比创历史新高
哲学家能领兵打仗?王阳明告诉你可以!平定宁王之乱的心理战出神入化
中华草龟:家中的绿色小精灵
管道水力计算公式选用指南
交警提醒:误闯红灯后,这样做可以避免被扣6分!
用DeepSeek买彩票?AI的灰色跨界
清华北大哪个更厉害?附2024年清华北大录取分数线
十几家,家常菜大比拼,家庭温馨味蕾记忆!
法官提醒:警惕招聘骗局,谨防求职诈骗
成都附二中医医院科普:辨识大便硬结——湿热与寒湿之分
摄影小白也能掌握的秘诀:艺术照主题与服装选择攻略
东莞5镇街分享市镇会商经验,推进产业科技发展
支付宝频繁收款风控规避指南
车厘子(大樱桃)施肥方案(精华版)
黑龙江:跨境电商,外贸“新引擎” 跑出“加速度”
学生党必看:预算有限下的游戏电脑配置推荐