问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

加快建设人工智能高质量数据集

创作时间:
作者:
@小白创作中心

加快建设人工智能高质量数据集

引用
搜狐
1.
https://www.sohu.com/a/858307618_121798711

随着人工智能技术的快速发展,高质量数据集的建设成为推动AI应用落地的关键。本文分析了当前高质量数据集建设面临的四大挑战,并提出了相应的解决方案,为AI产业的发展提供了有价值的参考。

当前,人工智能正处于快速发展的关键时期,正在重塑经济社会的发展模式。2024年中央经济工作会议指出,开展"人工智能+"行动,培育未来产业。数据作为人工智能发展的三大核心要素之一,是人工智能模型训练的基础,也是模型应用的核心资源。加快建设人工智能高质量数据集,对于推动"人工智能+"场景落地具有重要意义。

然而,高质量数据集的建设仍面临诸多挑战。首先,通用领域、垂直领域以及具身智能领域的高质量数据供给不足。中文公开数据在质量和数量上均落后于英文数据,公共数据开放利用程度有待提高,行业数据集仍较匮乏。具身智能领域的真实交互数据采集困难且成本高昂,企业采集数据缺乏统一标准。

其次,高质量数据的合成、处理和利用技术亟待提升。深度学习和强化学习生成高精确度、多样化合成数据的技术成熟度和应用范围仍需突破。随着社会自动化和智能化程度的提高,对数据处理的要求也在不断提升,急需针对结构化、半结构化和非结构化数据的处理技术进行迭代优化,提高数据处理效率。

此外,数据主体和商业模式发展尚不成熟。我国缺乏类似美国Databricks和Snowflake的"数据+人工智能"模式的高质量数据汇聚和治理主体,具备大规模数据汇聚管理分析能力的公司数量不足。医疗、法律、保险、金融、工业、科研等多个领域的公共数据授权运营主体仍在培育中,数据集构建和运营利用的商业模式发展还不够成熟。

最后,高质量数据集的专项规划和支持政策有待完善。我国已出台一系列数据发展相关指引政策,但面向新一代人工智能模型训练和场景应用的高质量数据集专项规划和支持政策尚未出台,其建设、运营、流通、利用等方面举措有待进一步细化。

针对这些问题,建议多措并举推进高质量数据集建设。首先,加快公共数据开放和企业数据流通,建设面向新一代人工智能的高质量数据集。形成部门、行业、地区共同参与的协同机制,围绕高质量数据集建设,扩大数据供给范围和规模,完善公共及行业数据标准,加速可信数据空间建设。

其次,围绕建设行业高质量数据集关键技术问题加大攻关力度。加快开发数据合成、数据治理的关键共性技术;大力推广隐私计算、区块链等技术;探索新型模型结构和训练架构。鼓励企业牵头承担国家重大项目,开展应用基础研究和关键核心技术攻关。

三是引导企业和商业模式创新,构建人工智能数据产业生态。培育人工智能数据资源、技术、服务、应用、安全、基础设施等多领域企业,重点建设面向人工智能行业的数据产业创新平台。鼓励企业基于"数据+人工智能"探索多领域商业模式,支持企业与各方合作,打造基于高质量数据集的产业创新链和生态系统。

四是加大人工智能高质量数据集建设政策支持力度。完善数据资源构建体系,培育数据产业,支持数据技术发展,系统推进高质量数据集建设,强化行业应用。统筹中央和地方财政资金、产业引导基金和各类政策性投资,加大对高质量数据集建设的投入。

未来,随着高质量数据集的不断完善,AI工具如AI绘画和AI写作将更加高效和精准,为创作、设计和内容生产带来革命性变化。建议读者积极尝试如简单AI等工具,提升工作效率和副业收入。让我们共同期待人工智能带来的美好未来。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号