字节跳动捐赠2500万元助力北京大学《儒藏》数字化项目
字节跳动捐赠2500万元助力北京大学《儒藏》数字化项目
近日,北京大学《儒藏》编纂与研究中心、北京字节跳动公益基金会、北京大学教育基金会联合举办“北京大学《儒藏》数字化项目启动仪式”。北京字节跳动公益基金会向北京大学教育基金会捐赠2500万元,用于支持北京大学开展《儒藏》编纂与研究工作。与此同时,项目还将通过“识典古籍”智能整理平台推进《儒藏》数字化工程。未来,相关成果将在“识典古籍”平台上线,并向社会开放。
《儒藏》工程是新中国成立以来最大规模地系统整理海内外儒学典籍的一项基础性文化建设工程。2003年,“《儒藏》编纂与研究”工程由教育部批准立项,由北京大学资深教授汤一介担任项目首席专家,北京大学联合国内外几十家高校和科研机构共同承担。《儒藏》工程分两部实施,即《儒藏》“精华编”与《儒藏》全本。其中,先期成果《儒藏》“精华编”收录了中国历史上最具影响力和代表性的儒学文献——包括传世文献和出土文献510种,以及韩、日、越三国历史上用汉文著述的儒学文献160种,编为339册。
目前,《儒藏》“精华编”中国部分510种282册全部整理完成,已由北京大学出版社出版,总字数近2亿,中、韩、日、越四国近百所高校近500位学者参与。全本《儒藏》计划收书3000余种(含“精华编”),总字数约10亿,将基本囊括中、韩、日、越四国历史上有价值的儒学文献。2023年4月,全本《儒藏》编纂启动,重点推进《儒藏》文献的数字化整理、智能化利用和网络化传播。
据介绍,经过两年多的发展,“识典古籍”平台已经具有版式识别、自动标点、结构整理、校勘等涉及古籍整理的全流程整理功能。《儒藏》的整理者将相关文献的影像上传平台后,由人工智能进行初步整理,专业人员进行校对及做出更有深度的学术判断,这样可以大大减少专家在基础性工作上投入的精力。同时,“识典古籍”平台还开发了协作整理的功能,支持以团队的形式开展工作。
事实上,在此次捐赠之前,字节跳动公益在古籍保护及数字化方面已开展了数年探索。2021年,中国文物保护基金会、国家图书馆(国家古籍保护中心)、字节跳动公益联合开展“字节跳动古籍保护与利用公益项目”,在古籍保护、古籍科研、古籍数字化、人才培养、古籍活化与利用等方面展开深度合作。字节跳动首批捐赠1000万元,设立中国文物保护基金会字节跳动古籍保护专项基金,定向资助中华珍贵古籍修复和专业人才培养、古籍活化与数字化等项目,其中重点包括《永乐大典》“湖”字册等国家珍贵典籍和特藏文献。
2022年3月,字节跳动向北京大学教育基金会进行捐赠,全面支持“北京大学-字节跳动数字人文开放实验室”的工作。字节跳动依托在OCR(光学字符识别)、自然语言处理、知识图谱等领域的技术和经验积累,以及互联网产品设计与研发优势,研发古籍数字化平台,利用人工智能技术加速中华古籍资源的数字化建设,探索借助人工智能提高古籍修复、整理工作效率。
2022年10月,由该实验室研发的古籍数字化平台——“识典古籍”平台上线,进一步提高了古籍数字化进程。截至目前,“识典古籍”阅读端已经上线超过1万部古籍,并提供图文对照、分词检索、实体百科等功能。此外,为进一步解决用户“找不到”“不会用”等问题,“识典古籍”平台还上线了古籍智能助手。当遇到不懂的古文时,用户可以点击“问AI”,就能够看到这句话的翻译,还可以让智能助手总结古文的主要内容,提出可供参考的研究问题。
2023年7月,故宫博物院与中国文物保护基金会、字节跳动合作启动“古籍保护与活化公益项目”。此次合作为期三年,致力于开展抢救性保护及资源转化利用。合作首年,由中国文物保护基金会字节跳动古籍保护专项基金捐赠首批资金,用于筹建故宫古籍科技实验室,进行古籍修复、古籍数字化、雕版预防性保护、专题展览及出版等项目,用公益力量推动古籍保护和活化的可持续发展……
这一系列动作,让我们看到了以科技赋能公益的巨大潜力。除了古籍修复和数字化,字节跳动在古籍活化传播方面也做了很多积极探索。如,依托抖音、今日头条、番茄小说等平台,联合创作者、图书馆活化古籍,让古籍以更加轻松、鲜活的方式走向大众;通过游戏、VR等形式创新古籍体验场景;通过古籍公开课、古籍纪录片等方式,用现代的语言讲述古籍里的知识……目前,每天有3000多万人在抖音观看古籍内容。
数据显示,我国现存古籍约有20万个品种,从1949年到2019年共修复整理出版近3.8万种,而修复整理现存的全部古籍可能需要300多年时间。字节跳动古籍项目运营负责人陈景收说,“技术的发展可以解决很多问题,如果没有资源壁垒,通过人工智能等现代技术,可能在数年内就能够完成全部古籍的数字化工作。从这个层面来看,用技术手段造福社会就是最大的公益。”