问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

档案数字资源存储载体特性比较及备份策略分析

创作时间:
作者:
@小白创作中心

档案数字资源存储载体特性比较及备份策略分析

引用
网易
1.
https://www.163.com/dy/article/J7F54578055666RY.html

随着信息技术的快速发展,档案数字资源的存储和长期保存成为了一个重要课题。本文从存储载体的特性出发,详细分析了磁性载体、光盘、胶片以及新兴的玻璃存储技术在档案数字资源长期保存中的应用,并提出了针对档案数字资源的"4-3-2-1"备份策略。

信息技术的发展推动存储载体的不断变迁,从磁性载体、光盘,到固态硬盘,再到近几年提出的玻璃盘等,存储方式的变革见证了人类社会的进步和科技的发展。档案数字资源具有数据量大、保存时间长、安全要求高等特点,如何合理选择存储载体确保档案数字资源的长期保存,是目前业界需要研究的重点问题。

常见的档案数字资源存储载体类型

在传统数据存储领域,常见的存储载体包括磁性载体、光盘、固态硬盘等。在档案数字资源存储领域,胶片是一种重要的异质备份载体,因此胶片也被纳入其中。而由于固态硬盘在长期保存过程中,存在因为存储单元内的电子逃逸而导致数据永久性丢失的风险,同时,档案数字资源大部分为冷数据,读取频率低,对读取速度要求也不高,因此,在档案数字资源长期保存领域,固态硬盘基本没有应用。目前常见的档案数字资源存储载体主要是是磁性载体、光盘和胶片。

磁性载体

磁性载体主要包括磁带和硬盘。磁带是一种用于记录各种文字、图表、声像等不同形式信号的载有磁层的带状材料,具有成本低、能耗低、便携等优势,但也存在对环境要求严格、读写速度慢和兼容性差的问题。硬盘作为计算机的主要存储载体,具有读写速度快、容量大和价格低廉的特点,适合大量数据存储。然而,硬盘的寿命较短,对环境同样敏感,且在抗震和功耗方面表现不佳,安全性也相对较低。

光盘

光盘采用光存储技术,用激光照射载体,通过激光与载体的相互作用使载体发生物理、化学变化,从而将信息存储下来的技术。根据光存储技术采用的激光波长的不同,光盘分为CD、DVD和BD等几种类型。目前BD蓝光光盘(采用波长405纳米的蓝紫色激光光束来进行读写操作)在档案数字资源存储领域中应用越来越多。BD对温度、湿度、磁场等环境因素依赖较小,具有载体寿命长、能耗低、安全性高、数据长期稳定性好等优点。但是由于光盘的读取需要将光盘加载到光驱中,造成了数据读取速度慢的缺点。

胶片

根据档案数字资源异质备份的要求,胶片因其长寿命、低维护成本和高安全性而成为关键的备份载体。用于档案数字资源存储的主要是银盐感光胶片,其在档案数字资源异质备份中的应用主要包括两种方式:一是缩微胶片,二是数字胶片。缩微胶片通过“数→胶”的方式存储模拟图像,效率高但格式兼容性差,无法保存某些文件格式如数据库和音视频文件。数字胶片作为技术升级,采用“数→胶→数”的胶片应用模式,通过将数据编码成高密度二维码图像打印于胶片上,解决了兼容性问题,允许任意格式数据的直接存储,确保了档案数据的真实性和完整性,展现了胶片作为长期存储介质的独特优势。

尽管缩微胶片和数字胶片都具备直读性、异质备份适应性及长期保存能力,但它们的使用受限于较高的耗材和处理成本,以及卷装保存导致的较慢数据访问速度。

玻璃存储用于档案数据存储的可行性探索

早在20世纪90年代就有利用飞秒激光(1飞秒=10-15秒)在玻璃内部进行改性研究的报道,E. Glezer等人将飞秒激光聚焦在熔融石英内部诱导了微孔结构,实现了三维光存储(图1(a)。1999年,Kazansky等人首次在掺锗石英玻璃中观察到飞秒激光照射区域的各向异性散射。2003年,Shimotsuma等人将研磨后的熔融石英样品放在SEM下观察,证实该结构为由富氧区与缺氧区交替排列组成的纳米光栅结构(图1(b))。由于缺氧区具有更低的折射率,纳米光栅结构可表现出单轴双折射材料的光学性质,其光程延迟值与慢轴角度可以分别由飞秒激光的光强与偏振方向调制,可用于实现五维光存储(图1(c))。2014年,南安普顿大学的张静宇博士将一个无机械转动部件的激光调制系统应用到了五维光存储的写入中(图1(d)),在原有激光直写系统基础上将写入速度提升了两个数量级,理论存储容量可达360TB/盘,并获得了最长存储寿命的吉尼斯世界记录认证。2018年,张静宇博士回国后加入了华中科技大学并组建了一支专业队伍,继续从事玻璃存储技术的研发。同年,微软与南安普顿大学合作并成立了Project Silica项目致力于开发玻璃存储技术。2022年10月,微软研究院在其官网上发布了该项目的最新进展。Project Silica正在重新思考如何构建大型存储系统,以充分利用玻璃载体的特性,创建可持续且安全的存储系统,以支持未来几十年的档案数据存储。


图1:(a)利用微孔结构的三维数据存储(b)纳米光栅结构SEM图像(c)五维光存储存储的世界地图,上图中颜色表示结构的慢轴角度,下图中亮度表示结构的延迟值大小(d)无机械转动部件的五维光存储光路示意图

微软研究院发布的最新研究进展引起了业界的广泛关注和讨论,档案行业也在探索其在档案数字资源长期安全保存中的可行性。玻璃具有透光性好、化学性能稳定、机械性能好等优势,无论煮沸、烘焙、刮擦都无损其存储稳定性,具有抗高温、抗电磁干扰、耐磨损的特性,在自然环境下存储数据依然可以保存数千年以上;同时还具备光存储技术特有的安全可靠、绿色节能、能耗低等优势,非常适用于档案数字资源的长期保存。

2023年6月,江苏省档案馆、苏州石头记智能科技有限公司和华中科技大学联合承担了国家档案局“揭榜挂帅”科技项目《档案数字资源长期保存策略及技术方案研究》,重点研究档案数字资源长期保存策略并探索玻璃存储在档案数字资源长期保存中的应用可行性。其中,华中科技大学的张静宇团队首次将五维玻璃存储技术应用到数字档案文件的存储中,并通过实验预测了载体的存储寿命。

实验采用康宁HPFS 7980熔融石英作为存储载体,利用1030 nm,220 fs的飞秒激光诱导纳米光栅结构实现数据的写入。其中,延迟选取2种状态,对应1bit数据,慢轴角度选取16个状态,对应4bit数据,每个数据点共存储5bit数据。利用玻璃五维光存储技术将《中共江苏省委党史学习教育领导小组办公室文件》等数字档案文件存储到了2×2 mm2见方的区域中,实现了60层数据的读写,其中,点间距为2 μm,层间距为15 μm,如图2(a)所示。对60层数据解码测试结果表明,绝大部分数据原始误码率在5‰以下(图2(b)),利用纠错编码技术,可确保数据的准确读取。根据加速老化实验结果预测,在室温下(30 ℃),该方法存储在玻璃载体上的数据寿命高达10+38.86±1.45年(图2(d)),玻璃存储载体满足了档案数字资源长期保存的要求。


图2:数字档案文件在玻璃载体上的存储试验结果(a)玻璃存储实物图;(b)60层数据样品的解码原始误码率;(c)数字档案文件样例;(d)玻璃存储样品寿命预测图

通过上述实验研究,初步完成了玻璃存储技术在档案数字资源长期保存中的可行性验证工作。但由于玻璃存储密度和读写速度都有待提高,制作成本昂贵等局限性,现阶段该技术还需要不断完善。

档案数字资源存储载体特性比较

从上述研究和分析可知,档案数字资源长期保存领域适用的存储载体主要是磁带、硬盘、蓝光光盘、胶片、玻璃盘。下面分别从响应时间、数据读取方式、使用寿命、安全性、数据丢失、环境要求、环保指数、迁移周期及成本、兼容性、载体价格、技术成熟度等方面进行比较分析,分析结果如下表所示。

通过对各类存储载体特性的对比分析可知,每种存储载体都有各自的优劣势,都有其适用的使用场景,依靠单一的存储载体并不能很好地解决档案数字资源的长期保存问题。

档案数字资源备份策略分析

档案数字资源备份是确保档案信息长期安全保存的一项重要措施。相对于传统数据备份,档案数字资源备份有其特殊的要求。最新颁布实施的《中华人民共和国档案法实施条例》第四十一条指出:

“档案馆对重要电子档案进行异地备份保管,应当采用磁介质、光介质、缩微胶片等符合安全管理要求的存储介质”

《“十四五”全国档案事业发展规划》要求:

“扎实做好档案数字资源备份工作,完善备份机制,实现馆(室)藏全部档案数字资源完整备份,重要电子档案异地异质备份,积极探索备份新途径,加强备份工作全过程安全监控,切实保障档案数字资源安全”。

因此,档案数字资源备份工作开展过程中需要选择合适的备份载体,建立完善的备份策略,实现档案数字资源的完整备份、离线备份、异地备份和异质备份。

基于档案数字资源的特点及各类载体的特性,硬盘适用于大容量档案数字资源的在线存储,磁带适用于档案数字资源的离线备份,蓝光光盘适用于档案数字资源的近线存储和离线备份,胶片适用于异质备份,但由于制作成本高,一般只用于珍贵和重要档案数字资源的异质备份,而玻璃盘代表着长期安全存储的发展趋势。在实际备份工作开展过程中,应充分发挥各种存储载体的优势并进行组合应用。

在数据存储备份领域,“3-2-1”备份策略早已为大家所熟知,“3-2-1”备份策略可以简单归纳为:对于需要长期存储的数据,至少要有3份拷贝(副本),它们被存储在2种不同的物理载体上,其中1份必须是可移动的,离线的永久拷贝。“3-2-1”备份策略有效消除了数据存储出现单点故障的风险,不仅在一个副本损坏或技术失败的情况下为组织提供保障,而且在发生自然灾害或盗窃导致物理存储类型消失的情况下也得到保障。


图3:3-2-1备份策略示意

对于普通数据或者数字资源的安全存储和备份而言,“3-2-1”备份策略已经能够满足要求,但是对于档案数字资源这样的重要数据而言,“3-2-1”备份策略还显不够,比如这种策略就缺少了对于重要和珍贵档案数字资源而言非常关键的异质备份,还不足以达到档案数字资源备份体系建设的要求。为此,我们提出了更为完善的“4-3-2-1”备份策略,如图所示。


图4:4-3-2-1备份策略构成

“4-3-2-1”备份策略采用磁光胶融合存储,通过建立包含在线存储、离线备份、异地备份、异质备份在内的完整的存储备份策略,以满足档案数字资源长期安全保存的要求。

在存储载体的选择上,档案数字资源在线存储载体可以选用硬盘,发挥其存取速度快的优势;近线/离线备份载体选用蓝光光盘,发挥其存储寿命长、环境要求低的优点;异质备份选用胶片,发挥其可直读、保存时间长的优势。期待玻璃存储技术成熟之后,可以用玻璃盘替代蓝光光盘作为离线备份载体,解决档案数字资源长期安全保存的问题。

在备份数据的套数上,按照在线存储、离线备份、异地备份、异质备份的要求备份4套数据,其中1套保存在硬盘上,2套保存在蓝光光盘上,1套保存在胶片上,其中离线备份的1套蓝光光盘可放置异地进行异地备份。

结 语

存储载体是档案数字资源长期安全保存的基石,而现有每种存储载体都有各自的优劣势,都有其适用的使用场景,依靠单一的存储载体并不能很好的解决档案数字资源的长期保存问题,在实际备份工作开展过程中,应充分发挥各种存储载体的优势并进行组合应用,制定完善的备份策略。

当然,仅仅依靠存储载体并不能解决档案数字资源长期保存的所有问题。比如由于技术更新导致文件格式面临淘汰的问题,在存储载体中保存了几十年甚至上百年的文件,当这些文件格式被废弃或者取代后将面临无法读取的风险,即便其存储载体依然完好无损。因此,在档案数字资源长期保存过程中,我们在关注存储载体的同时,还需要落实配套的管理策略,比如格式策略、迁移策略、更新策略等等,通过管理策略和技术策略的综合运用,才能确保档案数字资源的长期安全保存。

数字罗塞塔计划是一个致力于档案信息化领域研究的第三方机构,其研究团队由来自数字罗塞塔计划、江苏省档案馆和华中科技大学的专家组成,本文的研究成果发表于《浙江档案》杂志2024年第5期。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号