号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
艾美特风扇如何正确加油?四步完成保养工作
血压低于90/60莫慌张,三种类型需警惕
2024年北京通州赛龙舟最佳观赛指南
太平天国运动:洪秀全的兴衰启示录
洪秀全的传奇人生:从金田起义到天京陷落
湖口大捷:太平天国的军事奇迹
林黛玉泡白茶的秘密武器竟是它?
从香港四大天王到内地摇滚巅峰,1993年华语乐坛全纪录
王源王一博领衔,湖南卫视跨年晚会打造青春盛宴
健脾消食用六神曲,4种传统妙方助消化
南越国:从秦到汉的岭南开发史
平潭壳丘头遗址群入选年度考古发现,证实南岛语族大陆起源
每周3-6个,苹果香蕉显著降低高血压患者死亡率
408X冬季启动噪音问题详解:从原因分析到解决方案
膀胱结石吃什么食物促进排石
乳清蛋白粉增肌瘦身全攻略:科学原理、使用方法与注意事项
国网上海电力:构建多元清洁能源体系,新能源装机将翻番
五个成语背后的故事:画蛇添足、对牛弹琴等
红药贴膏使用指南:孕妇禁用,这些情况要当心
西安长安区开展中医药防治培训,提升基层传染病防控能力
1280元玩转丽江6天5晚,跟团游性价比超自由行
现代足球数据采集:高速摄像机与人工判断的结合
探秘古代翡翠:揭示其名字背后的历史与文化
揉揉神阙穴,调理肠胃有奇效:中医养生的千年智慧
奈曼旗“村晚”:草根文化的盛宴
奈曼旗春晚:评剧《一个都不能少》展现传统文化新魅力
庙屯民俗文化村:奈曼旗春晚的文化明珠
普洱市干旱致春茶减产,市场价格上涨
家庭亲子猜谜游戏,欢乐无限!
2025春运特惠:成都飞海南机票价格全解析