马斯克:AI训练数据已耗尽,合成数据将成未来方向
创作时间:
作者:
@小白创作中心
马斯克:AI训练数据已耗尽,合成数据将成未来方向
引用
腾讯
1.
https://new.qq.com/rain/a/20250109A08EOF00
PANews 1月9日消息,据TechCrunch报道,埃隆·马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。
马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。
合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。
本文原文来自PANews
热门推荐
账户找回:如何找回忘记的股票账户?
声学设计:打造理想的听音空间
胡辣汤制作技艺(逊母口胡辣汤制作技艺)
生石灰质量标准
鱼腥草可以直接吃吗
法律保护措施是什么?一文详解其定义、种类与运用方法
一张表了解家庙与祠堂的不同
如何查看打印机IP地址和端口(简单方法帮你轻松找到打印机的网络信息)
胆囊息肉怎么预防
胆囊息肉病变应该怎么治疗
GTA 在线模式:最佳夜总会升级选项
具身智能的进化机制:训练与成长
七水硫酸亚铁制备方法
春游宣城|绩溪油菜花最新赏花地图&花期预告(附赏花攻略)
男方未满22岁可以结婚吗
欠薪问题解决途径:劳动仲裁为您维权
怀孕初期出血什么情况需要看医生?
怀孕初期出血什么情况需要看医生?
发糕是冷水上锅蒸还是热水上锅蒸?哪种口感好吃?
CSGO暴躁老哥的游戏心态分析与应对方法-教你如何保持冷静赢得比赛
中国营养学会发布《乳糖不耐受与科学饮奶专家共识》
我从未见过这样的凯里-欧文
今年的生猪行情怎么看?
如何有效使用UnRAR工具解压RAR文件?
暖包贴在身体哪部位最暖?暖包原理及正确用法!什么人不适合用暖包
暖宝宝使用不当易致低温烫伤,这4点注意事项请收好
痛风患者的福音:七种低嘌呤海鲜推荐
术后水果吃哪种好?手术后十种最佳水果推荐
魏晋南北朝时期丝绸之路的变迁与发展
STM32定时器详解:从基础原理到PWM控制应用