号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
夜骑开封,灌汤包带火古城经济
开封必打卡:小笼包&桶子鸡!
几度秋意浓 最是桂花香,古诗词里的桂花,香满整个秋天!
南宋爱国词人陈亮,写下一首艳而不俗的桂花词,读来让人肃然起敬
四川十大名山你都去过吗
桂花什么时候开花?最佳观赏月份是几月?
十里桂花香!江苏这些“名桂”你都知道吗?
秋冬养生佳品:莲藕扣碗的制作与营养价值
春节家宴必学:莲藕扣碗做法大揭秘!
《中国国家地理》推荐:重庆巫山巫峡与江津瀑布
开封鼓楼夜市必打卡!
王师傅教你在家做正宗开封灌汤包
浏阳与北京的禁限放政策大比拼:一“放”一“收”背后的深思
孔子谈交友:以文会友,以友辅仁
云南的花花世界:当桂花开在云南,也变“滇”了?
我的世界绿色染料怎么做?绿色染料配方及合成方法介绍
职场人必看!新年贺词这样写最走心
用信任提升团队士气:从理论到实践
JNCI:具有乳腺癌遗传倾向的女性的一级亲属的癌症风险
维生素B1与甲钴胺能同时用吗
我的世界绿色染料怎么做,16种染料,老玩家冷知识
荆州必打卡:鱼糕&甲鱼,你更爱哪个?
荆州必打卡:古城、博物馆、方特东方神画全攻略
荆州城墙:2800年历史见证者
蒸莲藕圆子的养生之道:营养保留与食用建议
秋冬养生必备:蒸莲藕圆子的做法大揭秘!
珍珠藕丸:非遗美食的现代传承
秋冬必吃:莲藕蒸肉圆&桂花糯米藕
宝宝怎么防静电
有一种痛叫冬天的「静电」,3招拯救炸毛的你