号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
吉林市雾凇公园:冬日里的冰雪奇缘打卡圣地
广安新景观:邓小平故里与渠江两岸的美丽蝶变
红色经典一:毛泽东与“四星望月”
广安:借力双城经济圈建设实现跨越发展
广安新晋网红打卡点推荐:邓小平故里&华蓥山
新疆阿克苏市:赋能巾帼力量 点亮科普之光
方言白读音正在消失?真相揭秘!
武汉疾控发布“保姆级”居家消毒攻略,病毒退退退
泉州世遗景点打卡攻略:穿越千年的文化之旅
从童年到成年:圣诞老人是否真的存在?一探究竟!

绿色智慧城市:未来发展的新趋势
平遥古城墙打卡攻略:你去过几个?
平遥古城墙:七十二贤人的文化密码
碱式碳酸铜
适合春节游玩的12个目的地,年俗多样,年味超浓
坚决“零”容忍!这些超员车被查
什么是物业管理客户服务
结核联合用药为哪三种
遏制结核,从用对药开始
结核病防控科普:肺结核患者服药依从性的重要性
双十一买药防坑指南:如何辨别正品贝飞达?
新手爸妈必看:贝飞达正确使用全攻略
玩转开封两日游:从官府到园林,深度体验宋朝风情
开封府:千年古衙展新颜
清明上河园:开封必打卡的历史文化景点推荐
重新定义年味,年轻人的2025年货清单是怎样的?
家的味道:西红柿炒鸡蛋的温馨制作体验
夏日必备:西红柿炒鸡蛋的六大功效
《坦克连》团战模式:如何高效协同作战?
《坦克连》德系坦克完全攻略:从科技研发到实战技巧