号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
掌握手机摄影参数优化技巧,轻松提升拍摄效果
三月邀您来武威
电热毯为什么影响怀孕
皮肤擦伤:为什么需要专业医疗处理?
基因王国之序章:遗传物质是什么?
脚本开发费用怎么算的
明朝官员林偕春简介:曾以“五经魁”,独得翰林学士
美国研究生专业介绍之ESG相关项目
儿童感冒类型辨别指南:风寒感冒 vs 风热感冒
西布曲明危害有多大?这样的“瘦身咖啡”千万别碰
维A酸乳膏适合哪个季节使用?
广州客天下·一日游,感受历史与现代交融的魅力
搬家公司如何提供高效服务?
女人为什么喜欢包包?六大原因深度解析
PCB线路板厂家:PCB金手指的防护措施以提高可靠性
燃油车“整合”效果受关注,丰田在中国收缩还是加码?
贵州十大经典美食:酸辣鲜香中的民族风味
如何合理规划家庭财务?这些规划如何应对突发经济变化?
护肤的七大步骤(水,乳,霜,精华液,顺序怎么用)
定期存款可以提前取吗?定存提前支取规则与注意事项
辞职后社保自缴指南:灵活就业人员参保全攻略
缅甸7.9级地震:中南半岛近百年来第二大地震,揭示板块碰撞下的地质密码
水蚤养殖及繁殖方法
“自由职业者”真的自由吗?
戒烟后身体会发生什么变化?专家揭秘戒烟10年后惊人健康效果!
1947:东北雪原上的生死棋局——解码林彪冬季攻势中的逆袭密码
2024年三季度证券行业分析:市场波动中显现结构性机遇
油痘肌护肤指南:如何选择适合的乳液
宝宝多大可以吃果丹皮?这些注意事项要记牢
影视剧加强文学性渐成焦点