1 范围
本文件规定了实物档案数字化的组织与管理,确定了实物档案数字化前处理、数字化采集、影像处理工作与实物档案验收、移交和入库要求。
本文件适用于各级各类档案室、档案馆采用拍摄、扫描等方式对实物档案数字化加工过程的管理。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 20530—2006 文献档案资料数字化工作导则
DA/T 1 档案工作基本术语
DA/T 18 档案著录规则
DA/T 31 纸质档案数字化规范
DA/T 68(所有部分) 档案服务外包工作规范
ISO/TR 13028 信息与文献 档案数字化实施指南(Information and documentation—Implementation guidelines for digitization of records)
3 术语和定义
GB/T 20530—2006、DA/T 1、DA/T 18界定的以及下列术语和定义适用于本文件。
3.1实物档案 physical records
国家机构、社会组织或个人在社会活动中制作或获取的,以特定有形物品存在的具有保存价值的实物。
注: 实物档案包括奖状、奖杯、锦旗、证书、印章、印模、产品、标本、工具设备等。
3.2数字化 digitization
利用信息技术将模拟信号转换为数字信号的处理过程。
[来源:DA/T 31—2017,3.1,有修改]
3.3实物档案数字化 digitization of physical records
采用拍摄、扫描等方式对实物档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上的数字文件,并按照实物档案的内在联系,建立目录数据与数字文件关联关系的处理过程。
3.4三维扫描 3D scan
利用数字化扫描方式,将物体的空间外形、结构及色彩等立体信息转化为三维数字模型的过程。
3.5实物档案特征点 feature point of physical records
反映实物档案空间外形、结构及色彩等特征信息发生显著变化的临界点。
4 总体要求
4.1 应根据档案的珍贵程度、开放程度、利用率、亟待抢救程度、数字化资金情况等因素,统筹规划、科学开展实物档案数字化工作。实物档案数字化工作的开展应遵循ISO/TR 13028和GB/T 20530—2006提出的要求和建议。
4.2 实物档案数字化的基本环节主要包括:数字化前处理、目录数据库建立、数字化采集、影像处理、数据挂接、数字化成果验收与移交等。
4.3 应采用有效的管理和技术手段,确保实物档案数字化成果质量。实物档案数字化应遵循档案管理的客观规律,真实反映实物档案的有关信息,最大程度地展现档案原貌。
4.4 实物档案数字化过程中,应保存数字化项目信息、技术环境、数字化各类技术参数等方面的元数据。元数据元素的确定应符合ISO/TR 13028提出的要求。
4.5 应加强实物档案数字化各环节的安全管理,确保档案实体和档案信息的安全。
4.6 加工涉密档案时,应按照涉密档案相关保密要求开展工作。
5 组织与管理
5.1 机构及人员
5.1.1 应建立实物档案数字化工作组织,对数字化工作进行统筹规划、组织实施、协调管理、安全保障、技术保障、监督检查、成果验收等,确保数字化工作的顺利开展。
5.1.2 应配备具有相应能力的工作人员,包括熟悉档案业务并具有较高调查研究水平和良好组织领导能力的管理人员,熟悉相关标准规范并能够为实物档案数字化工作各环节提供技术支持的技术人员,掌握一定数字化基础知识并熟悉本职工作的操作人员等。应通过科学规范的管理制度,对工作人员进行规范化管理。
5.1.3 为强化数字化工作的安全性,应加强对外聘工作人员的审核与管理。
5.2 基础设施
5.2.1 应配备专用加工场地并进行合理布局,形成档案存放、数字化前处理、档案著录、数字化采集、影像处理、质量检查等工作区域。
5.2.2 加工场地的选择及温湿度等环境的控制应有利于档案实体的保护。场地内应配备防火、防水、防有害生物、防盗报警、视频监控等设施设备。
5.2.3 应合理规划、配备和管理实物档案数字化设施设备,确保设施设备满足实物档案数字化工作的需要。
5.3 工作方案
5.3.1 应在充分调研的基础上,制定科学合理的工作方案,确保实物档案数字化工作达到预期目标。
5.3.2 实物档案数字化工作方案应包括数字化对象、工作目标、工作内容、成本核算、数字化技术方法和主要技术指标、验收依据、人员安排、责任分工、进度安排、安全管理措施等内容。
5.3.3 应对实物档案数字化工作方案进行专家论证,确保其科学、规范、合理。
5.3.4 实物档案数字化工作方案应经审批后严格执行。工作方案审批结果应与数字化工作过程中形成的其他文件一并保存。
5.4 管理制度
5.4.1 应制定科学化、规范化的管理制度,并在工作过程中严格执行,以有效保障档案实体安全和实物档案数字化成果质量。
5.4.2 实物档案数字化管理制度应包含岗位管理、人员管理、场地管理、设备管理、数据管理、档案实体管理等方面的制度。岗位管理制度主要规定数字化工作各岗位的工作目标和职责,形成明确的岗位业务流程规范、考核标准、奖惩办法等;人员管理制度主要对人员的安全责任、日常行为、外聘人员信息审核及管理、非工作人员来访登记等进行规范;场地管理制度主要对人员出入和工作场地内基础设施、环境、网络、监控设施、现场物品、证件等的管理进行规范;设备管理制度主要对数字化工作各环节涉及的全部设备的管理进行规范;数据管理制度主要对数字化各环节所产生的数据的管理进行规范;档案实体管理制度主要对档案实体在数字化过程中的交接、管理、存放等工作进行规范。
5.5 工作流程控制
5.5.1 应制定相关的工作流程和各环节操作规范等,对实物档案数字化全过程进行有效的控制,确保数字化成果质量。实物档案数字化流程示例参见附录A。
5.5.2 应加强对实物档案数字化工作的全流程安全管理,及时对数字化加工过程各环节产生的数据进行备份。
5.5.3 应建立完善的问题反馈机制,对实物档案数字化工作过程中发现的问题进行及时反馈和修正。
5.6 工作文件管理
5.6.1 应根据情况制定符合实际要求的实物档案数字化工作文件,以此加强对数字化工作的管理。主要包括实物档案数字化工作方案、实物档案数字化审批书、实物档案数字化流程单、数据验收单、项目验收报告、实物档案数字化成果移交清单等,采取外包方式实施时,还应包括项目招标文件、投标文件、中标通知书、项目合同、保密协议等。部分工作文件示例参见附录B。
5.6.2 应加强对实物档案数字化工作文件的管理,明确数字化工作过程中形成的工作文件的整理、归档、移交等管理要求。
5.7 档案数字化外包
5.7.1 实物档案数字化工作如需外包,相关工作应符合DA/T 68的相关要求。档案部门应从企业性质、股东组成、资金来源(构成)、安全保密、企业规模、注册资金情况等方面严格审查数字化加工企业的相关资质;按照GB/T 20530—2006第5章的要求评估数字化加工企业的技术能力;从规章制度的建立健全情况等方面考查加工企业的管理能力。《国家秘密载体印制资质管理办法》给出了审查数字化加工企业保密资质的信息。
5.7.2 在项目实施过程中,应从档案部门、数字化服务机构、数字化场所、数字化加工设备、档案实体、数字化成果移交与接收、设备处理等层面执行严格的安全管理要求,进一步信息见《档案数字化外包安全管理规范》。
5.7.3 档案部门应指派专门人员参与实物档案数字化外包业务的监督、指导,完成质量监控、进度监控、投资监控、安全监控和协调沟通等方面的工作。
6 档案出库
6.1 档案保管部门应按照实物档案数字化工作方案确定的数字化对象开展档案调取、清点、登记等前期准备工作,并提交档案出库申请,经相关责任人批准后,严格按照档案库房管理规定为数字化对象办理出库相关手续,并与数字化部门共同清点无误后,对档案进行交接出库。
6.2 实物档案数字化过程中,应根据工作需求设置距离数字化加工场所较近的保管库用以临时存放实物档案,并对实物档案的领取与归还进行严格管理,认真做好检查、清点、登记等工作,确保实物档案的安全。
7 数字化前处理
7.1 确定实物档案数字化对象的特征点
应对确定为数字化对象的实物档案完整数字化,不应遗漏特征点,确有不需要采集的特征点应加以标注。
7.2 档案检查
7.2.1 对实物档案进行外观检查,对损坏严重或有其他情况不利于数字化加工的,应进行适度的加固、清洗等技术处理。技术处理应根据实物档案具体情况合理选择,并符合有关档案保护的规定。
7.2.2 检查实物档案的质量,对存在的问题进行记录。
7.2.3 记录实物档案编号、材质、外形等信息。
7.3 目录数据准备
7.3.1 按照目录数据库建立时制定的数据规则,对照实物档案有关信息,规范档案中的目录内容。
7.3.2 对需在目录数据库中进行标记的情况,在有关登记表中进行登记。
8 目录数据库建立
8.1 应制定目录数据库数据规则,包括数据字段长度、字段类型、字段内容要求等。目录数据库数据规则的制定应符合DA/T18对档案著录的要求,实物档案目录准备与目录数据库建立工作也应严格遵守DA/T18的相关规定。
8.2 目录数据库选择时,应考虑通用数据格式转换问题,以便数据交换。
8.3 数据库结构的设计应特别注意保持档案的内在联系,以便实物档案数字化成果的管理和利用。
8.4 将实物档案数字化前处理工作中对实物档案目录进行修改、补充的结果录入数据库,形成准确、完整的目录数据。实物档案数字化目录数据中应至少包括档号、保管期限、年度、责任者、题名、材质、形制、参见号,以及数字化项目信息、技术环境、数字化各类技术参数等信息。
8.5 可采用计算机自动校对与人工校对相结合的方式,对目录数据的质量进行检查,检查内容包括著录项目的完整性、著录内容的规范性和准确性等。发现不合格的数据应及时进行修改。
9 数字化采集
9.1 基本要求
9.1.1 应根据档案原件实际情况、数字化目的、数字化规模、计算机网络和存储条件等选择相应的信息采集设备,进行相关参数的设置和调整。参数的设置和调整应保证采集后数字影像清晰、完整、不失真,影像效果最接近档案原貌。
9.1.2 应特别注意对档案实体的保护,采集过程中不应对档案实体造成损毁。
9.1.3 在采集前,应对相应的采集设备和场所进行清洁、检查和调整,以确保实物档案数字化成果质量。
9.1.4 应遵循相关设备的使用说明进行定期维护、保养。
9.2 平面扫描
9.2.1 适用于能以二维静态图像形式展示的实物档案,如奖状、证书、印模等。
9.2.2 超出所使用扫描仪扫描尺寸的档案可采用更大幅面扫描仪进行扫描,也可以采用小幅面扫描仪分幅扫描后进行图像拼接的方式处理。分幅扫描时,相邻图像之间应留有足够的重叠,并且采用标板等方式明确说明分幅方法;若后期采用软件自动拼接的方式,重叠尺寸建议不小于单幅图像对应原件尺寸的1/3。
9.2.3 对于极其珍贵且尺寸不规则的档案,为方便直观显示原件大小,可采用标板、标尺等方式标识原件大小等信息。
9.2.4 为最大限度保留实物档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描。扫描色彩模式、扫描分辨率的选择应符合DA/T 31提出的要求和建议。
9.3 三维扫描
9.3.1 适用于能以三维立体影像形式展示的实物档案,如奖杯、产品、标本、工具设备等。
9.3.2 实物档案数字化三维扫描主要技术参数应符合表1的规定。
9.3.3 扫描实物档案的纹理精细度总体应符合以下要求:
a) 应真实反映实物档案表面的颜色、质地、形状和图案等,同一表面纹理应协调一致;
b) 长宽像素数应为 2 的n 次方(n 为自然数),纹理长宽比差异不应过大;
c) 应进行纠正处理,减少视角或镜头畸变引起的变形,并消除眩光和阴影;
d) 图像分辨率不低于100 dpi,色调协调、自然真实;
e) 应拼接无缝,过渡自然;
f) 纹理扫描后,数字化成果需用色卡进行对比矫正,应保持其与实物档案色彩一致。
9.4 数码拍照
9.4.1 适用于能以二维静态图像形式展示的实物档案,如奖牌、奖杯、锦旗等。数码相机应采用彩色拍摄方式,拍摄精度不低于1600万像素。在拍摄前,针对拍摄实物档案的环境,对数码相机白平衡进行色温校正。
9.4.2 拍摄时应注意:
a) 选择中焦距以上镜头拍照并尽量保持水平,避免图像变形;
b) 将照相机设置成无时间显示格式的画面;
c) 布光均匀;
d) 将拍摄主题充满影像画面;
e) 对具有规则形状的实物档案,分别从正视、侧视、俯视等多角度进行拍摄。
9.4.3 数码拍照主要技术参数应符合表2的规定。
9.4.4 实物档案数字图像长期保存格式为 TIFF、JPEG 或 JPEG2000 等通用格式,图像压缩率的选择可根据实际应用的需求而定。
9.4.5 实物档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为 OFD、PDF 等其他格式。
9.4.6 同一种拍摄方式应采用相同的存储格式。
9.5 环物摄影
9.5.1 适用于能以三维全景影像形式展示的实物档案,如生产工具、设施设备等大型实物档案。
9.5.2 对实物档案进行环物摄影时:
a) 应注意镜头与被摄实物档案表面保持正射,摄影人员根据需要使用数码单反相机、摄影机、鱼眼镜头、全景云台、三脚架、航拍无人机等专业设备对实物档案进行360度全景拍摄,实物档案的特征点不应遗漏;
b) 拍摄时应选择合适的曝光模式,保证每张照片的曝光参数相同、色调统一;
c) 拍摄过程中,焦距、光圈、感光度一经设定,直至照片全部拍完方可修改,且应保持每30度一个拍摄角度进行拍摄。
9.6 文件命名
9.6.1 应以档号为基础对数字文件命名,并确保唯一性。
9.6.2 一条目录对应采集后的多个数字文件时,可按档号与顺序号的组合对数字文件命名。
9.6.3 应科学建立数字文件的存储路径,确保数据挂接的准确性。
10 影像处理
10.1 旋转及纠偏
对不符合阅读方向的影像应进行旋转还原。对出现偏斜的影像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。
10.2 去污
应对数字影像进行去污处理,以去除在数字化过程中产生的污点、污线、黑边等影响影像质量的杂质,应遵循展现档案原貌的原则,档案数字化处理时不应去除实物档案保管过程中所形成的痕迹。
10.3 影像拼接
对分幅扫描形成的多幅影像,应进行拼接处理,合并为一个完整的影像,以保证档案数字化影像的整体性。拼接时应确保拼接处平滑地融合,拼接后整幅影像无明显拼接痕迹。
10.4 裁剪处理
应对数字影像进行合理的裁剪处理,去除影像多余的部分,以有效缩小影像文件的容量,节省存储空间。
10.5 降噪
去除三维扫描点云中由于外界因素(如光线、震动等)以及三维扫描仪本身的因素造成的无效点。
10.6 数据平滑
为了得到平滑模型及提高轮廓识别度,应对三维扫描结果进行平滑处理,提高数据的平滑度,以更加接近于实物档案的几何特征。
10.7 影像质量检查
由数字化处理人员对数字文件的质量情况,如影像偏斜度、清晰度、失真度等进行检查。对不符合质量要求、数字化成果不完整或不清晰的应重新数字化;数字文件整理秩序与实物档案不一致的,应及时进行调整。
11 数据挂接
11.1 应借助相关软件对数据库中的目录数据与其对应的实物档案数字影像进行挂接,以实现目录数据与数字影像的关联。
11.2 对挂接结果进行逐条检查,包括目录数据与实物档案数字影像对应的准确性、已挂接数字影像与实际扫描数量的一致性、数字影像是否能正常打开等,发现错误及时进行纠正。
12 数字化成果验收与移交
12.1 验收方式
12.1.1 建议档案部门成立专门的验收组对实物档案数字化成果进行验收。
12.1.2 应采用计算机自动检验与人工检验相结合的方式对实物档案数字化成果进行验收。
12.2 验收内容
12.2.1 实物档案数字化成果包括数字影像、档案目录数据、元数据、数据挂接、工作文件、存储载体等。
12.2.2 应对数字影像进行验收,主要包括数字化参数、存储路径、命名的准确性、影像的完整性、排列顺序的准确性、影像质量等。
12.2.3 应对档案目录数据进行验收,主要包括数据库中各条目的内容、格式等的准确程度,必填项是否填写等。
12.2.4 应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。
12.2.5 应对数据挂接进行验收,主要包括目录数据与其对应的数字影像的挂接的准确性等。
12.2.6 应对工作文件进行验收,主要包括工作文件的完整性、规范性等。
12.2.7 应对存储载体进行验收,主要包括载体的可用性、有无病毒等。
12.3 验收指标
应进行100%检验,检验合格率应为100%。
12.4 验收结论
12.4.1 每个实物档案数字化成果质量检验达到12.2和12.3的要求,予以验收“通过”。验收未通过应视情况进行返工或修改后,重新进行验收。
12.4.2 验收完成后须经验收组成员签字。验收“通过”的结论,应经相关负责人审核、签字后方有效。
12.5 移交
验收合格的数字化成果应按照实物档案数字化工作方案及时移交,并履行交接手续。移交单示例参见附录B.8。
13 档案归还入库
按照实物档案入库相关要求对完成数字化处理的档案原件进行处理和清点,并履行档案入库手续。实物档案数字化专用出(回)库单示例参见附录B.9、数据质检退回处理单示例参见附录B.10。
附 录 A
(资料性)
实物档案数字化流程示例
附 录 B
(资料性)
数字化登记表示例