号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
如何测试冰箱的正常运行状态(掌握关键步骤)
沈阳有什么特色小吃?沈阳小吃每一口都是满满的幸福感推荐收藏
心学问教育咨询:角色扮演与情感教育的融合,助力孩子同理心发展
宏明法师解读:从《大般涅槃经》看佛教生死观
大般涅槃经:佛教中的灵魂之作
中国古代纸币的发展历程
显示当前时间
从神秘到主流:二次元魅魔角色的崛起之路
《祈愿诗篇》评测:95分的魅魔RPG神作!
苏联名枪进入中国为何大变样?改良设计助力抗美援朝,效果不错
71年前,我们胜利了!今天重温这5场英勇战斗
《角斗士》:古罗马文化的银幕再现
《斯巴达克斯:血与沙》背后的角斗士故事
科利塞姆竞技场:古罗马角斗士的终极舞台
《角斗士》:一部再现古罗马文化的史诗巨作
蓝思科技迎多重利好,春节前投资机会显现
高考志愿填报实用指南:家长必看的六大步骤
江苏手机国补引爆消费热潮!
新年换新机:手机补贴政策大揭秘!
高考志愿填报必读的两本书:官方指南与实战策略的完美结合
狮子座冬季养生指南:运动与饮食的完美搭配
MBTI性格测试:揭秘狮子座的心理特质
狮子座VS双鱼座:谁才是爱情王者?
春运抢票新技能:12306在线选铺攻略
秋冬打卡济州岛:新昌风车&彩虹海岸绝美摄影指南
济州岛最美自然景观:汉拿山&城山日出峰
冬季去济州岛滑雪泡温泉攻略
城山日出峰:济州岛上的世界自然遗产
武汉外卖兼职:高收入背后的高风险与挑战
概率论视角:KL散度 vs 欧氏距离