号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
热干面的芝麻酱怎么调 热干面调芝麻酱用水还是油调
T1横扫TES晋级半决赛,滔博究竟输在哪?我的答案是:全方位差距
实际桩长和有效桩长的区别与联系
如何在Xcode中运行C语言程序
最新报告:一线城市专职外卖骑手收入6000-10000元
气管检查全攻略:五种常见检查方法详解
CSGO社区服务器丰富模式解析,畅享多样化游戏体验
乙肝疫苗接种建议和答疑,你想了解的都在这里
比格犬的优缺点及性格:了解这种狗的特点
顽固性呃逆的诊疗技巧—附罕见病例精析
免费动态域名有哪些:14款免费动态域名解析工具推荐
OpenWrt刷机后如何恢复出厂设置
猫咪搬家应激反应怎么缓解
9种常被误解的"减肥食物",原来它们才是减重的好帮手
如何测试鼠标性能软件
三明治定妆法:定妆喷雾+散粉的完美搭配
缺铁性贫血吃牛肉有效果吗
六月份适合种植的花卉:50种花草推荐及种植指南
吃牛肉真的能增肌吗
脾胃虚弱的食疗方法推荐:山药粥、红枣桂圆茶等
外周动脉疾病患者应避免食用的6种食物
动脉硬化的最佳锻炼方法是什么
教育部下达2025年退役大学生士兵专项硕士研究生招生计划
主动防御如何识别并应对未知威胁
新学期第一课:这份"校园防火秘籍"必须收藏!
失眠真的会伤身吗?医生解析失眠真相与改善方法
《蛟龙行动》:技术升级难掩故事空洞,行动目的成谜
杠杆清算潮席卷币圈,以太坊单日闪崩27%!反促ETF单日交易量创新高
Win11创建系统还原点及恢复,win11恢复系统的方法
国民党名将薛岳视角评长征初期中央红军各军团战力,简洁深刻