马栏山视频文创园:以音视频数据赋能国家标注基地建设
马栏山视频文创园:以音视频数据赋能国家标注基地建设
随着人工智能技术的快速发展,数据标注作为产业链中的关键环节,正迎来前所未有的发展机遇。2024年5月,长沙凭借其在音视频文创、高校科研人才和人工智能产业链等方面的综合优势,成功入选国家数据标注基地建设城市。其中,马栏山视频文创园作为长沙数据标注产业的重要支柱,正以丰富的音视频数据资源赋能国家数据标注基地建设。
2025年2月26日,长沙市国家数据标注基地建设成果发布暨2025年全省数据标注供需对接大会在湖南大数据交易所举行。
2024年5月,在数字中国建设峰会上,长沙凭借丰富的音视频文创等行业数据资源、优质的高校科研人才资源以及完备的人工智能产业链,成功入选承担国家数据标注基地建设任务的7大城市之一。根据计划,到2026年,长沙将建成全球高质量音视频文创数据特色开发基地,带动数据相关产业规模达100亿元以上。
2月26日,长沙市数据局在湖南大数据交易所发布了建设国家数据标注基地最新成果。在此次大会上,岳麓高新区等5家产业园区被确定为长沙市第二批行业数据标注基地。其中,岳麓高新区为智能网联汽车产业数据标注基地、湖南5G应用生态产业园为教育教学数据标注基地、雨花经济开发区为工业制造数据标注基地、望城经开区为医疗健康数据标注基地、长沙县为工程机械数据标注基地。
构建“1+n”产业布局,马栏山成重点支柱
近年来,长沙将整个城市作为一个“大基地”,发挥园区产业集聚效应,构建“1个综合标注基地+N个行业标注基地”的产业布局。在2024互联网岳麓峰会上,已授牌首批3个长沙数据标注基地。
其中,马栏山视频文创产业园(视频文创数据标注基地)以建成全球高质量音视频文创数据特色开发基地为己任,已集聚芒果TV、万兴科技、泛联新安等大模型头部企业,天择微链、中影年年等数据供给企业,迅雷百川等数据标注企业,中南出版、芒果融创等场景应用企业。中国V链已交易音视频算料百万小时、数千万元。
高质量数据集支撑产业发展
湖南大数据交易所大楼外景。(供图:郑娜)
目前,全市8大行业共有高质量数据集36个,数据规模达1.5万TB。
在文化旅游领域,以马栏山视频文创园为龙头,“5G高新视频多场景应用国家广播电视总局重点实验室”打造了数字资产制作平台,积累超10万套数字资产,500万个3D模型。万兴科技天幕大模型音视频数据集、芒果数智文博大模型数据集等6个高质量数据集,累计规模已达1万余TB。
数据标注产业迎来黄金发展期
在DeepSeek等人工智能大爆发的时代,数据标注作为产业链的中游,正迎来爆发式增长的黄金时期。乘着国家数据标注基地建设的“东风”,马栏山视频文创园凭借其丰富的音视频资源、先进的技术平台和完善的产业链,为长沙建设国家数据标注基地提供了强有力的支持。其贡献不仅体现在数据资源的供给上,更在于通过“文化+科技”的融合,推动了数据标注产业的创新与发展,为长沙乃至全国的数字经济注入了新的活力。
本文原文来自澎湃新闻