马斯克:AI训练数据已耗尽,合成数据将成未来方向
创作时间:
作者:
@小白创作中心
马斯克:AI训练数据已耗尽,合成数据将成未来方向
引用
腾讯
1.
https://new.qq.com/rain/a/20250109A08EOF00
PANews 1月9日消息,据TechCrunch报道,埃隆·马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。
马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。
合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。
本文原文来自PANews
热门推荐
城市消极空间改造指南:从荒地到活力空间
香港大学特色专业详解
《玉清宝诰》:属于赞颂神仙的骈文,道门的特定文体之一
五行、八卦、天干、地支的关系
如何进行文献检索:实用技巧与工具推荐
“植”得一看,看交大师生如何唤醒校园“绿色精灵” !
如何选择适合你的项目管理方法和工具?
加拿大驾照攻略:从G1到G牌的完整指南
如何在中国驾照和加拿大驾照之间进行转换?这些转换流程有哪些注意事项?
碳水化合物:质量决定体重的奥秘——哈佛大学最新研究解读
掌握这些防护技巧,轻松抵御病毒侵袭!
南京到海南自驾游全攻略:路线规划、注意事项及沿途景点推荐
经常熬夜的危害
北京市养老保险缴费基数的变化历程与深层含义
怎样合理地拒绝别人的请求
Steam上加好友全攻略:轻松找到游戏伙伴,共享欢乐时光
中医专家推荐:雪梨无花果助肺部健康,远离结节困扰
西藏地图:三大地理区域全解析
30万预算,选哪款大众SUV最合适?
如何清理云盘空间
光化学烟雾形成原因 特点及对健康的影响
广州白云:从城市枢纽迈向枢纽城市
赛罗奥特曼战斗合集:从起源到未来的无畏征程
紫砂壶烧制技艺:探索倒焰窑的奥秘
用人工智能加速医疗模式变革
汽车取消15年强制报废!改成60万公里引导报废,一辆车可以开到老不再是梦
如何通过视觉设计让PPT汇报更吸引人?
黄瓜开花结果的时间与方法(在家里种黄瓜)
控费思路和管理手段都要转变 “医保版临床路径”落地方案解析
延长iPhone电池寿命的方法有哪些