马斯克:AI训练数据已耗尽,合成数据将成未来方向
创作时间:
作者:
@小白创作中心
马斯克:AI训练数据已耗尽,合成数据将成未来方向
引用
腾讯
1.
https://new.qq.com/rain/a/20250109A08EOF00
PANews 1月9日消息,据TechCrunch报道,埃隆·马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。
马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。
合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。
本文原文来自PANews
热门推荐
如何与父母沟通,才能不彼此伤害?
补脾益肠丸的副作用与禁忌
中国学者揭示职业与生活环境暴露对系统性红斑狼疮的影响
量化交易:最大回撤(Drawdown)算法
数据库如何存储树状结构
西甲焦点战:巴塞罗那迎战巴列卡诺,谁将问鼎胜利?
【科普】小元素,大健康—微量元素对人体有多重要?
消毒柜高温功能失效怎么办?故障分析与解决指南
抽奖成了“内定”?B站直播抽奖风波,你不知道的内幕!
如何理解战争对股市的影响?这些影响有哪些潜在风险?
高考前什么时候调整作息好?高考作息调整最佳方法
六爻基础之三刑
对多动症儿童的生活方式调整建议:家长必备指南,赶快收藏!
如何运用心理学的“课题分离”,改善家庭关系
动画电影新篇章,《落凡尘》带你领略中式奇幻之旅
滋味是什么?舌尖上的滋味:探索奇妙的味觉体验!
冬天的阳光怎样拍才美?这10个技巧告诉你
如何在上海黄金交易所进行有效投资以优化决策?这种投资策略在市场中如何应用?
鼻窦炎的CT表现
职工退休工资如何计算?看上海缴费40年,能领8000元是怎么回事?
18个冷门却惊艳的成语,若能认识五个,算你厉害!
毕业生自我鉴定300字应该怎么结构化?
同样是跟腱断裂,为何科比一落千丈 杜兰特还能大杀四方?
沉香原来还有这么多形成方式
福柯导读 | 谱系学、知识和权力
技术性调整即将开始
【皮肤课】恼人的“酒糟鼻”怎么治?
提升抖音视频质量:如何减少拍摄抖动的全面指南
北京线上医保购药规模扩大,美团买药已实现全城覆盖
如何有效清理浏览器缓存以提升上网体验和性能