号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
鸦片战争前清朝的对外关系,以及日渐积深的中英贸易矛盾
刀郎演唱会门票,为何成了“尽孝硬通货”?
百年巨匠 | 季羡林
Excel身份证号计算年龄:从提取到验证的完整指南
化学试剂柜的通风与安全防护措施说明
有助于在工作中创造创新文化的5个因素
了解海星:门、特征及有趣的事实
会议论文 vs 期刊论文:区别大揭秘!对评职、毕业超关键!
人才保卫战!芯片公司重视从大学开始培养人才
居里夫人:科学巨匠背后的爱情风暴与坚韧人生
渐冻症患者建议了解!这5种居家锻炼方法你绝对不能错过!
交通事故后续处理:拨打122报警或寻求救援
黑巧克力减肥零食平价,黑巧克力的作用和功效可以减肥吗
高硼硅玻璃是食品级的吗
梦到同一个丧尸梦:解析与意义
肝功能化验报告怎么看? 轻松读懂肝功能化验指标!
人类无法想象没见过的事物,古人为什么能创造出鬼魂传说?
“电信诈骗事件”法律剖析:性质认定、责任追究与防范策略
什么是感染性关节炎?答案全在这里!
打造自媒体创作秘籍:内容矩阵思维导图助力提升创作效率
41%博士后逃离学术界,顶刊PNAS揭示残酷真相!名校光环背后的职业危机
探秘大模型架构:设计原则与实践应用
创新创意主题党日活动策划与实施指南
品控团队如何输出
最高9.8分!推荐10部神级英剧,最后一部绝对天花板级别!
抽血化验怀孕挂什么科
脊柱侧弯需要多少钱治疗
Excel中被保护单元格密码忘记了怎么解除?
Excel制作网上求职简历的实用指南
Qt/C++ 动态时钟(背景可切换)