号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
老年人嚼枸杞好处多多
北石窟寺:藏在黄土塬上的石窟艺术明珠
北石窟寺:千年石语诉说陇东故事
打破家庭内耗怪圈,掌握6大教育思维,助力孩子成长
科创板开户条件详解:您需要了解的关键要素
舒适睡裙选购指南:材质、款式、颜色全方位解析
为什么寄希望于IP的购物中心,基本都没能成功?
软件配置需求变更怎么办
如何确认社保是否缴纳?未缴纳该如何处理?
离合器如何通过技术改进提升换挡平顺性?这种技术改进如何影响车辆的驾驶体验和性能?
四川铜币跟四川银币,天府之国铸造的精美钱币,带你了解版本及市场价值走势
四川铜币跟四川银币,天府之国铸造的精美钱币,带你了解版本及市场价值走势
发电机组的有刷和无刷主要存在以下区别
如何找到适合自己的学习场所?这些场所有哪些特点?
股票冻结与减持策略:如何制定股票冻结与减持策略
总感觉手机在振动?你可能得了“幻觉电话综合征”
公司负债后即转让股权? 法院:原股东“金蝉脱壳”脱不了责任
司法冻结解除后银行卡多久可以用,以及需要注意什么?
如何探究煤价上涨的原因?煤价上涨对市场有哪些影响?
西班牙语年月日星期等日期表达方法
中航工业集团罗荣怀简历(中航工业集团罗荣怀的职业经历)
1955年罗帅被授予元帅军衔,离不开这7年的三大历史贡献
“子孓”是蚊子的幼虫:形态特征、生活习性及生态作用详解
柠檬红茶营销策略研究:从市场分析到品牌塑造
白衣服发黄怎么办?加一点这个,搓一搓,瞬间洁净如新
六月,喝排骨汤不如多喝它!高蛋白,低脂肪,鲜香美味,花不了几个钱!
充电桩如何选型
存折能做婚前财产公证吗?一文详解婚前财产相关法律问题
婚前的存折婚后还属于个人财产吗
更名岩山股份一年后:新业务烧钱,旧业务低迷,炒股巨亏|看财报