号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
忽兰忽失温之战:朱棣与马哈木的草原对决,重塑瓦剌领袖形象
朱元璋朱棣:明朝两位最具影响力的皇帝
从靖难之役到永乐盛世:朱棣的双重历史评价
明朝“和议”止战,清朝武力统一:明清蒙古政策演变
陈亮药师教你正确服用二甲双胍
突破性发现:二甲双胍可延缓灵长类动物衰老,为健康老龄化带来新希望
2025年刘海发型指南:八字刘海、法式刘海等20个范本及整理技巧
情绪变化如何影响人际关系?心情波动,友情爱情受何影响
父母情绪稳定:对孩子成长的关键影响与深远意义
茶泡饭:从平安时代到现代,日本人的餐桌智慧
从粥品到御膳:古代皇帝的一日三餐
哈佛大学强推的书单,每本都是经典读物!
农机创新破解梯田耕种困局,每亩可增产600斤
突破考研瓶颈期:优化方法与调整心态双管齐下
继续教育:提升自我、适应社会的终身学习之道
职业化:提升竞争力与实现个人成长的必由之路
豌豆射手教你如何打败僵尸大军
《植物大战僵尸3》新作上线,新植物亮相!
植物大战僵尸杂交版2024:创新玩法引发玩家热议
补牙后有哪三大禁忌食物
补牙之后可以立即吃东西吗?补牙后的饮食注意事项解析
科普:拔智齿后吃什么食物能恢复的快
小红书养号攻略:从用户画像到数据运营的全方位指南
小学一年级数学怎么学?看看这里就知道了!
初中生数学焦虑研究:课堂气氛、考试压力是关键影响因素
“体重管理年”教你科学计算标准体重
跟李莎旻子学粤语:从“旻”字开始
启功大师教你写“旻”
茅山道士的神秘起源,林正英带你揭秘
CPI猪肉价波动,GDP预测新视角