号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
法定继承中的法律咨询与服务
八段锦“两手攀足固肾腰”,这样练才有效果
金姓的起源、发展与分布
2025怀孕亲子鉴定各项费用构成深度剖析
从古希腊哲学到现代科学思想,人类思维的发展脉络?
斗破:解析修炼天赋最强的9位角色,薰儿神品血脉,居然只排倒数
糖友必读:一文掌握自我血糖监测全攻略
Wi-Fi有辐射吗?睡觉不关掉Wi-Fi对健康会有危害吗?
玉皇管什么:玉皇职责、含义、别名及形象解析
爆火出圈的埃及展背后,有一支神秘的中埃联合考古队
探索辉煌与神秘:《古埃及史:时间之沙的见证》
银行账户资金转移的几种常见方式
川芎升血压还是降血压?使用需谨慎
陶渊明作品研究:自然与人生的诗意交融
平顶山秘境:自然奇观与美食天堂
团队回访如何跟踪领导
集装箱武器系统发展动态初探
核聚变取得突破,聚变推动航天器,是否还遥不可及?
如何计算黄金价值的合理估值?这种计算对投资决策有何帮助?
浙江全面加强文化遗产保护传承 在赓续历史文脉上实现新提升
杭州运河文化转化核心承载地:三大历史街区的保护与开发
如何防止云服务器被黑客攻击?详解实用防御策略
服务器系统安全性如何评估与审计
《小小的我》票房惊艳口碑分化
《小小的我》热映!关于剧中的脑瘫:我不傻,只是慢一点
面料指南:什么是莫代尔面料?它可持续吗?
怎样利用数据中台架构图进行跨部门协作?
林下生金!湛江“南药”产业焕发亿级生机
草原上的汉家烟火如何成就了契丹?
超级经典的【拿破仑】