号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
创作时间:
作者:
@小白创作中心
号称“地球上最聪明的AI”,Grok 3竟答不出9.11和9.9哪个大
引用
新浪网
1.
https://finance.sina.com.cn/roll/2025-02-19/doc-inekytki4993761.shtml
2月19日,马斯克及其xAI团队正式发布了备受期待的AI产品Grok 3。然而,这款被马斯克称为"地球上最聪明的AI"的产品,在实际测试中却暴露出一些令人意外的问题。
在发布会上,马斯克宣称Grok 3在数学、科学与编程的基准测试中超越了所有主流模型,并计划将其应用于SpaceX的火星任务计算,甚至预测未来三年内将实现诺贝尔奖级别的突破。
但Grok 3的实际测试表现却让人大跌眼镜。一些媒体测试了最新的Beta版Grok 3,并提出了那个经典的用来刁难大模型的问题:"9.11与9.9哪个大?"遗憾的是,号称目前最聪明的Grok 3,仍然无法正确回答这个问题,被网友戏称为"天才不愿意回答简单问题"。
此外,在xAI发布会直播中,在分析游戏《流放之路2》的职业与升华效果时,Grok 3也给出了大量错误答案,并且马斯克也没有看出这些明显的错误。
尽管在官方PPT中,Grok 3在大模型竞技场Chatbot Arena中看似"遥遥领先",但实际上其与DeepSeek R1和GPT4.0的差距仅为1%到2%。
马斯克在发布会上透露,Grok 3使用了超过20万张H100芯片,总训练小时数达到两亿小时。作为对比,DeepSeek V3仅使用2000张H800芯片训练两个月,其性能却与Grok 3相差无几。这表明,随着模型规模的不断扩大,性能提升的边际效应已经显现。
值得一提的是,马斯克在社交媒体上表示,当前的Grok 3仅是测试版,完整版将在未来几个月推出,并邀请用户反馈使用问题。
本文原文来自IT之家
热门推荐
解码孩子的人际交往:父母如何帮助孩子建立友谊
抗美援朝,美军地面部队只有9个师?其实他们动员了200多万陆军
小米汽车接入蔚来、小鹏、理想充电网络,补能便利性大幅提升
想拥有健康好生活?试试这些培养好心态的方法
如何合法代开发票
森林里抽烟是否违法?相关法律问题解析
C语言预处理命令详解:从#define到#pragma
蒙乃尔合金MonelK500国标的化学成分分析与应用价值
开创多个全国第一!大湾区首条地铁环线来啦
2024师范大学排名出炉!华中师大跃居第3,福建师大超过首都师大
家里被监听的5个迹象!守护隐私安全,这些你必须得注意!
如何管理公司团建项目
学习书法:如何快速提高楷书的书写水平
山茶花花语象征与寓意:永恒的爱、理想的美、坚贞不渝
山茶花花语象征与寓意:永恒的爱、理想的美、坚贞不渝
中药煎了可以保存几天
扑热息痛小孩子能吃么 扑热息痛剂量与使用方法
怎样引导青春期的孩子正确交友
活期宝理财的安全性与风险评估
科普课堂 | OSI模型,你真的了解吗?
剑中门派选择推荐:新手必看,详细解析与上手难度分析
如何进行有效的期货技术分析?这种分析方法有哪些实际应用?
期货是什么?期货的特点、功能及交易流程
不只是求职者要“过关”,AI面试官也要“闯关”
Excel中插入图片的完整指南:从单张到批量,轻松实现图片与表格完美融合
声音传感器-IC电子元器件
软件工程需求分析的步骤有哪些
代位继承可以是法定继承吗?全面解析继承法中的代位继承
狗牙根最好的播种方法
交互设计与用户体验的关系是什么