号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
《未来中国》揭秘:AI如何读懂你的情感?
AI情感理解新突破:机器也能懂人心?
海德格尔视角下的AI情感探索
希克苏鲁伯陨石坑:白垩纪的"超级大反派"
中国三大航空公司,国航、东航、南航有哪些区别和联系?
中国科学院揭秘白垩纪早期蝉的秘密:从"哑巴"到噪音制造者
沧龙:白垩纪晚期的海洋霸主
白垩纪气候变化揭秘:恐龙如何应对?
内蒙古:白垩纪恐龙王国探秘
什么是土地合同?一文详解土地合同的定义、类型及注意事项
法国现在是第五共和国,前四个哪儿去了?
葡萄牙作为历史上最弱的殖民帝国,为何曾经全体投了殖民地?
葡萄牙-国家概况
用概率论玩转大乐透:提高中奖机会的科学方法
大乐透最新一期:罕见形态引关注,大数据揭秘号码走势!
大乐透多票投注法:如何分散风险提高中奖概率?
大乐透24145期:理性购彩新趋势
《老人与海》主要内容与主题思想解析
当你读懂了《老人与海》,你就不会再相信所谓的命运
广东梅州梅县松口镇:盘活古镇文化资源 客侨文化焕发新机
蒙脱石散:医学视角下的腹泻治疗首选
腹泻期间如何科学补充营养?
秋季腹泻救星:葛根芩连汤
澳洲史前巨鸟原来是最大的鹅?
春秋航空“2厘米”风波背后,乘客为何屡遭“行李刺客”?
如何在不同环境下拍出美丽的人像
乳山生蚝版蒜蓉烤生蚝,秒杀路边摊!
秋季必吃:山东乳山生蚝挑选小窍门
生蚝:心血管健康的秘密武器
冬季流感高发,吃生蚝增强免疫力!