号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
广州到深圳15分钟!“地上飞机”高速磁悬浮来了,哪些城市受益?
全线提速、增设站点!广州⇄深圳定制线路全面升级
汉朝明君占比揭秘:时长超半数,数量不敌唐明
古代帝王成就千乘之国的六大治国方略
从汉武到玄宗:帝王晚年为何频现暴虐之变
从汉武帝到唐玄宗:帝王晚年为何频现“善始难善终”
刘邦、刘彻、刘秀:奠定汉朝四百年基业的三位明君
地铁集团3.7亿竞得郑州金水区核心地块,周边配套优势明显
秋季喝茶有讲究:这四类茶最适合润燥养阴
第2次3连败!多特蒙德跌至德甲积分榜第10 菜鸟主帅只是背锅侠?
德甲:云达不莱梅VS海登海姆,不莱梅悬了?先要弄清楚这三点关键
车辆统筹险:低价背后的风险
交强险报销攻略:理财达人教你省钱秘籍
猫咪肠胃炎:症状识别、治疗方案与预防全攻略
金刚沙那:饭后也能练的瑜伽基础姿势,兼具多重健康功效
每日两次10分钟,四步腰椎保护操告别久坐腰痛
捷途旅行者被曝10余项质量问题,厂家回应将改进
半年减痛6分,70岁艺人用皮拉提斯告别护腰
伸展瑜伽入门指南:每天15分钟,提升柔韧性降低压力
空腹喝柠檬水真的伤胃吗?科学解读与饮用建议
空腹喝柠檬水真能瘦?揭秘真相!
健身达人的空腹蛋白质饮品指南
甲流疼痛原因及应对:从病毒侵袭到预防措施
贝加尔湖:淡水资源的守护神
气候变化下的淡水资源危机:全球挑战与应对之道
立冬开熏!重庆黔江土家腊肉飘香全国
孩子尿床不用治?小心这可能是一种病!
为什么半夜一直起来尿尿?医生揭秘夜尿症原因:「这激素」不足让尿量变多
增肌减脂饮食指南:运动前后怎么吃?
辣椒助燃,新陈代谢UP UP!