马斯克:AI训练数据已耗尽,合成数据将成未来方向
创作时间:
作者:
@小白创作中心
马斯克:AI训练数据已耗尽,合成数据将成未来方向
引用
腾讯
1.
https://new.qq.com/rain/a/20250109A08EOF00
PANews 1月9日消息,据TechCrunch报道,埃隆·马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。
马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。
合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。
本文原文来自PANews
热门推荐
掌握最新资讯:如何轻松获取权威新闻平台
661分报丽水学院,职业认同与定向招生同等重要
提肛运动完全指南:正确做法与注意事项
中国电商如何在非洲做大做强?抓住中产阶级需求,建立本地合作关系,扩大市场份额
小儿抽动症如何识别与治疗
抽动症的诊断方法是什么
什么是 SSL VPN 以及它如何工作?
梦见狮子是什么预兆
广州楼市去化周期升至26个月,市场谋求加速去库存
干式变压器如何调压
从NSA和MoE探寻大模型发展的关键路径
数学应由四年级打好基础!专家建议四年级数学应试+温习技巧
轻微脑梗的治疗方案与注意事项
港媒:十几个新伙伴加入中国月球科研站计划,与美登月计划成对比
遗产继承人如何处理银行存款?这些细节要注意
小笼包起源于哪个地方?
车险到期时间查询指南:多种实用查询方法详解
上海中医药大学2025年招生简章!附招生计划、选科要求
锂电池充放电作业和用电方面的安全要求有哪些?
【微科普】宝宝呛奶很危险、科学喂养很重要
高血压用药指南:全面解析各类降压药特点,助你做出最佳选择!
日出日落时航拍的技巧
醉驾的行为后果有哪些
冬季必去!乌兰察布深度游:滑雪胜地、火山探险与文化之旅
鲍威尔最新讲话全文:不会急于降息,等待更清晰的信号
新疆伊犁七天六晚深度游:从城市到草原,从民俗到自然
行业透视|财报大PK,四大央企谁更胜一筹?
家境一般却想出国留学?这份攻略请收好
个人可以买地建房,自行设计施工,产权还独立!这个城市要放大招了
春季养生,与中药茶饮最配