号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
金小鸥讲健康|世界地贫日:地中海贫血不只贫血那么简单
ERP系统是什么?终于有人把中小企业适配的ERP系统说清楚了!
公版 VS 非公版显卡:游戏玩家必看!性能较量与个性化的激烈碰撞
2025年1月全国70城房价趋势深度解析
浅谈扬声器系统中分频点的选择
探访新加坡武吉知马山:全方位徒步体验与神器运动鞋大推荐
东莞理工学院学院设置及学校简介
跨部门协同协作机制是什么
如何办理离婚手续才能确保其合法有效
从零开始的ANSYS Workbench双向流固耦合仿真教程
怒江深度游攻略:全方位指南,探索自然风光与民族文化
和田玉质白玉雕琢貔貅:传统工艺与寓意的完美结合
特种作业持证上岗的必要性探讨
史蒂夫·乔布斯如何改变世界
康复科安全管理制度:保障患者与医护人员的安全与健康
收入效应和替代效应:价格变动如何影响消费者选择
如何为孩子制定个性化的学习方案
954开头电话号码的用途与来源解析
垂直绿化墙苗木选择指南:8种植物的特点与适用环境
土壤酸化怎么改良,使用有机肥可调节酸碱值
期货库存增减的影响因素是什么?这些因素如何反映市场供需关系?
雪天摄影技巧:掌握这四点,拍出绝美雪景大片
外国人可以在中国做公证吗?
湖北:双万兆网络构筑产业新底座,引领数智生活
国电投启动超80GW项目,90%为清洁能源!
主食别只知道吃米面,这些也可以当主食,而且还更健康!
有源RFID与无源RFID:技术差异与应用前景的深度探讨
信息化项目全过程咨询服务解码:专业支持,高效决策
“阙”字的读音、意义及其历史文化背景探讨
大模型|“上下文长度”和“上下文窗口”不再傻傻分不清楚!