马斯克:AI训练数据已耗尽,合成数据将成未来方向
创作时间:
作者:
@小白创作中心
马斯克:AI训练数据已耗尽,合成数据将成未来方向
引用
腾讯
1.
https://new.qq.com/rain/a/20250109A08EOF00
PANews 1月9日消息,据TechCrunch报道,埃隆·马斯克在与Stagwell董事长Mark Penn的直播对话中表示,目前AI模型的训练已基本耗尽真实世界的数据,“我们已经用尽了人类知识的累积总和,这在去年就发生了。”马斯克与前OpenAI首席科学家Ilya Sutskever的观点一致,后者在NeurIPS机器学习大会上提出AI行业已达到“数据峰值”,未来可能需要改变模型开发方式。
马斯克认为,合成数据将是补充真实数据的途径,AI将通过生成和自我评估数据实现自我学习。这一趋势已被包括微软、Meta、OpenAI和Anthropic等科技巨头采用,如微软Phi-4模型和谷歌Gemma模型都结合了真实数据和合成数据进行训练。Gartner预测,2024年AI和分析项目中约60%的数据将为合成生成。
合成数据的优势包括成本节约,例如AI初创公司Writer仅花费约70万美元开发其几乎完全基于合成数据的Palmyra X 004模型,相比之下,类似规模的OpenAI模型开发成本约为460万美元。然而,合成数据也存在风险,包括模型创造力下降、输出偏差加剧,以及潜在的模型崩溃,尤其当训练数据本身存在偏差时,生成结果也可能受到影响。
本文原文来自PANews
热门推荐
一颗灌汤包引发的“夜骑热潮”:开封如何用美食吸引年轻人?
大熊猫PK老虎:谁才是真正的森林之王?
苏门答腊虎:动物界的搏击王者?
虎熊之争:谁才是真正的森林之王?
粒子物理大揭秘:轻子、夸克和玻色子的奥秘
双十一抢票攻略:上海迪士尼乐园最划算购票方式!
冬季甜米酒发酵秘籍:两天出奇迹!
上海迪士尼暑期票价飙升背后的经济智慧
上海迪士尼票价更新,“疯狂动物城”成全球首个主题园区!
秋冬自制甜米酒,卡卡爸教你零失败秘籍
长乐甜酒:一碗承载千年文化的甜蜜佳酿
房颤消融术后应该注意什么
国产心脏脉冲电场消融产品填补技术空白,我国心律失常治疗再创新高
5部天花板谍战剧:柳云龙独占2部,《风筝》第四,第一16年难超越
宠物死后应该怎么妥当处理?
有人随意丢弃,有人就近掩埋!宠物的“身后事”该如何规范处理?
属牛和属狗的相处之道
新手爸妈必学:虾仁南瓜粥的制作与注意事项
北美大虾遇上虾仁米粥:一碗暖胃又暖心的美味
8个月宝宝必学:超火蔬菜虾仁粥做法
北邮专家张平:大学生如何平衡爱情与学业
大学情侣如何保持学习动力?这份攻略请收好
情绪管理:提升学习效率的关键
提升内容质量的实用技巧与策略
缙云烧饼:从千年古饼到“中国披萨”
和平精英新沙漠地图全攻略:资源点详解与实战技巧
平遥古城:2700年古城里的最佳拍照打卡地及购票攻略
数字赋能文旅创新:走进山西文旅数字体验馆
“想象的相遇”:《神曲》与《山海经》的跨时空对话
招摇山:《山海经》里的理想国