号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
刑事案与民事案可以一起办吗
申请强制执行程序:实现民事判决权益的途径
高楼层家里有蚂蚁什么原因,详解解决方案
印刷设备种类与选购指南
红枣和灰枣哪个补血效果好?
厦门胡里山炮台:探秘克虏伯大炮的历史与军事价值
壮族三月三知识
两大因素告诉你,如何避免在臀部训练中伤到腰或膝盖?
水污染的类型、原因和后果
联通卡如何转网移动号码套餐
2025全国赏桃花地图新鲜出炉,国内10个最美赏桃花胜地,快约起来吧
一进门玄关养什么植物 玄关摆放什么植物好
Excel中计算数据趋向稳定性的完整指南
律师服务合同争议如何解决
洗碗机到底值不值得买?看看这些使用体验就知道
如何合理设定违约金标准?设定时需考虑哪些因素?
8个实用拍照姿势,让你全身、半身照都自然好看
拍照时的表情管理指南:从微笑到眼神的全方位技巧
首次亮相的 “豹”2A8改进型主战坦克,性能怎么样?
荷兰已确认采购46辆豹2A8主战坦克:这是陆军未来的正确选择吗?
中国锂电安全国标再升级!远景动力领跑“动储”双赛道
硅碳负极助力锂离子电池能量密度提升
大腿粗壮如何变细腿
如果《大明王朝 1566》里严嵩集资补了亏空,有没有可能活下去?
美联储货币发行机制详解及其对全球经济的影响
如何判断弹簧的旋向(左旋或右旋)
改编权的内容有哪些
当代艺术与哲学、心理学、社会学、历史学、宗教思想、数字技术的交汇与互链关系
皇帝的龙袍:一条衣襟里的龙与皇权的象征
苏州十大景点排名,你去过几处?