佘醒 周雨婕 程车智 摘要:工业遗产文献档案的数字化是保护国家工业文化脉络、促进信息共享、提升研究效率的重要方法。现以马钢(集团)控股有限公司(以下简称“马钢”)高炉的历史档案为例,探讨通过数字化留存、交互设计及版权管理等技术协同应用的档案数字化技术框架与实施路径,促进工业遗产的研究、保护与开发,为工业遗产的可持续利用提供技术支撑,促进工业遗产文献档案信息的安全保存和有效传播。 文献档案是工业遗产的重要组成部分,是“可移动”的工业遗产。它包括利用文字、图片以及音视频记录的历史档案、工业技艺、规章制度、企业文化等。工业遗产文献档案承载着丰富的历史信息,是文化传承与教育的重要载体。随着数字化技术的发展,工业遗产文献档案的数字化保护与活化,成为当前的研究热点。然而,目前工业遗产文献档案的数字化进程仍存在诸多问题,如版权和权益归属问题制约了数字资产价值的有效释放,数据孤岛化情况显著,文化阐释力不足等。因此,探讨工业遗产文献档案的数字化保护与活化路径,具有重要的现实意义。 工业遗产文献档案数字化研究现状 理论研究 工业遗产文献档案数字化有多种形式,数字叙事是目前展现工业档案、传承工业记忆、工业精神的主要手段。数字叙事为档案服务提供了人文和媒介新视角,对数字记忆构建以及知识创新有促进作用[1]。现有研究不仅证实了数字叙事对“可移动工业文化遗产”开发利用的作用及意义,还明确了数字叙事的可行性和必要性。刘伯英(2021)提出了工业遗产的相关价值,包括历史价值、科学技术价值、社会文化价值、艺术审美价值、经济利用价值。赵怡(2024)基于数字叙事及档案价值理论,提出了工业遗产文献档案开发利用框架和路径,强调通过数字叙事手段,深入挖掘工业遗产文献档案的潜在价值,促进档案信息资源的开发与利用。这些理论研究,为工业遗产文献档案的数字化保护与活化,提供了多维度的思考框架,有助于更好地理解和推进相关实践。 实践研究 基于实践操作角度,国内外相关机构已大规模开展工业遗产文献档案的数字化整理与展示工作。国内的档案部门、工业企业以及地方志编纂机构,围绕造船、桥梁工程、粮食加工和铁路建设等领域实施多项数字化工程。例如,“档案史料揭示金陵机器制造局”项目运用电子化处理将历史文献变成可检索的数据库。 然而,目前实践仍面临诸多挑战,包括场景构建水平欠佳,多数项目以基础性档案转化为聚焦点,缺乏像虚拟漫游这类复合型交互场景,数字叙事与实体空间脱节,造成用户体验呈现碎片化;数字孪生与元宇宙等前沿技术还需针对工业场景优化算法和交互逻辑,建立真实性维护机制,避免出现缺失。人工智能生成内容(AIGC)若被滥用,或许会消解档案的历史客观属性。李明(2023)提到,虚构影像对工业遗产的史料价值形成了威胁,应借助区块链存证、数字水印等技术搭建内容溯源体系。 综合而言,工业遗产文献档案数字化需搭建跨学科协同架构,把历史学、计算机科学和传播学等学科的方法论进行融合,综合解决技术阻碍与文化阐释课题。在实践中,应平衡历史文脉保护和创新表达,助力档案活化从物理空间改造过渡到文化价值再生产;应完善数字版权认证举措,鼓励企业、公众等主体介入,形成可持续的遗产数字化生态格局。 工业遗产文献档案数字化的技术框架 数字化留存技术 数字化留存技术是工业遗产文献档案保护的核心要点,涉及图片、文字、音视频等载体的高精度信息保存与抽取。光学字符识别(Optical Character Recognition,OCR)作为具有关键支撑意义的技术,在档案信息结构化处理中发挥了重大作用。其流程由图像预处理、字符识别和后处理三个阶段构成。当前,OCR技术主要应用的场景为文档、票据等格式固定之处,而工业遗产文献档案鉴于年代久远、版式十分复杂,需进一步强化算法的适配性能。 高分辨率扫描技术为图像档案的完整保存起到了保障作用,面对褪色、折痕等物理损伤的历史照片,可精准抓取其纹理特征,还原照片中设备结构和作业场景的原始样貌。音视频档案需要利用高分辨率(HR)、超分辨率(SR)技术结合处理,前者凭借专业设备记录声波频谱与动态范围,后者依靠深度学习对低质量音频的频段信息进行重建,同时借助色彩校正算法修复历史视频的颜色偏差,给沉浸式展览提供高保真的素材[2-3]。 在修复和增强领域,凭借深度学习算法,可识别图像噪点、划痕及物理破损,并进行修复。例如,凭借局部像素特征分析填补胶片老化带来的斑点,重塑视觉的连贯性效果。就大面积缺失的档案图像而言,算法依靠档案图像剩余部分的纹理特征,生成合理的内容,并以自适应方式调整色彩平衡与对比度,让工业设备技术细节和历史环境得以精准呈现。此类技术不仅改进了档案的视觉质量,也为后续的学术研究和虚拟展示搭建了高可信度的数据基础平台。 数字版权管理技术 建设适合工业遗产文献档案版权保护的区块链基础设施,是数字版权管理的关键。择取性能稳定、安全性良好的区块链平台,铺建私有链或联盟链网络,确保网络节点既可信又可靠;开发智能合约,精准界定档案版权信息结构,把档案关键特征所生成的哈希值写入智能合约,达成自动化、标准化的版权存证流程[4]。运用区块链不可篡改、可追溯的属性,对档案的使用进行全程跟踪监控,一旦检测到侵权行为,便可迅速找准侵权源头,为版权维权工作提供有力的证据。依靠区块链平台,实现版权的授权及交易,使授权流程更显透明、高效,降低交易开支,提升版权的流通性及价值。 数字水印技术作为辅助性的补充保护手段,应依据工业遗产文献档案特性,设计差异化算法,在频域嵌入策略的实施中,利用离散小波变换(DWT)将加密水印信息嵌入图像低频分量或音频关键频段,采用量化调制平衡图像的隐蔽性和抗攻击能力。算法应具备抵制几何变换、格式转换及压缩攻击的鲁棒性,并兼顾载体文件的视觉和听觉质量。在实施阶段,开发配套检测工具链,协助版权方借助密钥提取水印信息,鉴定数字资产的完整性及传播合规状态。区块链与数字水印技术的协同实施,为工业遗产文献档案的数字化带来双重保障。 数字化叙事与交互技术 数字化叙事与交互技术依靠时空关联及虚拟化手段,能够重构工业遗产的历史脉络,采用整合工业遗产建设到关停这一期间的关键事件和地理空间信息的方式,让用户可自行查看对应时间的图文资料,实现历史发展的多维度呈现。动态可视化工具把生产效率、能耗趋势等复杂数据转化为图表和热力图,为科研与面向公众的科普教育提供后盾。就交互设计而言,依托3D建模及全景拍摄技术,构建马钢高炉的数字孪生模型,用户可以自由查看高炉内部结构与文物细节,突破物理空间的禁锢。工业技术模拟器借助Unity平台开展开发工作,准许用户利用调控温度参数或观察化学变化进程,沉浸式体验炼铁流程,从而提升对工业遗产技术特性的理解与感悟。 工业遗产文献档案数字化的技术框架涉及数字化留存、数字版权管理以及数字化叙事与交互技术,这些技术让档案信息的完整提取、安全保存与有效传播得以实现。数字版权管理手段,尤其是区块链与数字水印技术的运用,为档案的版权保护起到了强有力的保障作用。而数字化叙事与交互技术借助创新的展示举措,增进了用户对工业遗产历史价值的理解与感悟。这些技术的综合运用,不仅对工业遗产的保护、研究与开发起到促进作用,还为挖掘其在文化传播及教育领域的潜在能力提供了技术后盾,助力工业遗产实现可持续利用。 工业遗产文献档案数字化保护示例 工业遗产文献档案数字化是守护历史价值、促进信息共享与增强研究效率的关键做法。采用数字化技术不仅能长久保存档案,修复受损材料,还能凭借互联网实现广泛传播,有效提升工业遗产的社会影响力。数字化技术可对档案信息进行深度挖掘,对学术研究与决策给予支撑,在保护原件的基础上,推动工业遗产的灵活利用,令其成为文化传承与教育的主要载体。1953年9月16日18时5分,马鞍山铁厂高炉顺利放出了第一炉铁水,改写了华东地区有矿却没铁的历史局面(如图1所示);1958年9月8日,马钢九号高炉建成投产。本文以马钢高炉历史档案为案例,协同应用数字化留存、交互设计,以及版权管理等技术,对工业遗产文献档案进行数字化保护,以期能切实推动工业遗产的保护、研究与开发,为工业遗产的可持续利用给予技术支持。 
档案数字化与特征提取 就文本档案的数字化处理而言,针对历史文件、技术图纸和管理层通信记录等,采用高分辨率扫描仪进行扫描,将分辨率设为300dpi以上的数值,并将文件保存为PDF及TIFF格式,从而保障文字清晰,让后续OCR文字识别处理更加便捷。OCR技术在这一过程中扮演了关键角色,采用Adobe Acrobat Professional专业OCR软件,对扫描后的图像开展文字识别处理,也对图像实施去噪、增强对比度、修正倾斜等前期处理。为提升文字识别的精准度,采用文字定位及分割手段,判别图像中的文字区域,并把文字剖分为单个字符或词组,运用深度学习模型进行字符识别,生成初步文字。再按照上下文语义和词库开展后处理及校正,纠正识别差错并转换为文本样式,进而高效地把图像上的文字内容转化成可编辑的文本文件。 图像档案处理方面,用专业相机高清拍摄,并采用JPEG格式保存。顾及历史照片的特点,除了利用图像修复软件进行去噪和色彩校正,还可以使用深度学习算法辅助AI自动识别并整治照片中的划痕、破损等缺陷,恢复照片原始模样。就音频档案处理而言,采用专业音频设备对工人采访、生产指令等音频资料加以转录,保存为MP3格式,保证采样率,进而保障音频的清晰度。就视频档案而言,采用专业摄像设备对其进行数字化转换,保存为MP4视频格式,并且分辨率和帧率要分别达到1080p以及25fps以上。 在特征提取阶段,利用MATLAB对图像档案做边缘检测、纹理分析和颜色特征提取,采用Canny算子、灰度共生矩阵(GLCM)和颜色直方图等技术,精准抓取图像关键特征,进而形成特征向量。就文本档案而言,利用NLTK文本分析工具开展关键词提取、词频统计以及语义分析;采用TF-IDF算法、词频统计以及预训练语言模型等,深度挖掘文本核心特征并转换为特征向量,这些特征向量不仅为后续的版权明确归属提供了坚实基础,也为档案在分类、检索、分析等的应用上提供了有力保障。 区块链存证与版权治理 在区块链存证与版权确权的实证研究中,依靠构建区块链平台、开发智能合约以及推进版权存证行动,使历史档案版权信息得以安全、透明又不可篡改的记录;采用高性能硬件服务器,搭建以太坊区块链网络,保证网络性能与安全稳定。借助Solidity语言在以太坊上开展智能合约开发,规划版权信息结构格局,设计版权交易功能模块,许可版权进行转让及授权,留存交易活动信息,将档案的数字形式副本及其特征信息提交至区块链网络,形成版权存证编号,凭借智能合约把档案特征向量产生的哈希值写入区块链,保障版权信息不被篡改且可追溯。 在数字水印生成与嵌入的实证研究中,设计了频域的数字水印算法,保障工业遗产文献档案的版权信息在共享及传播过程中的安全和可追溯;采用离散小波变换(DWT)将水印信息嵌入图像低频部分或文本特定地点,保证水印的隐蔽性以及鲁棒性特征。水印信息含有档案的版权标识、时间、使用权限等核心数据,故而采用加密算法对水印信息进行加密处理,对图像、文本、音频和视频档案分别实施水印嵌入,并运用水印检测工具对已嵌入水印的档案开展检测,查证水印的完整性与可提取性。 开放共享与传播创新 在开放共享平台搭建及授权机制的研究中,实施开放共享平台开发,前端凭借HTML5构建用户界面,实现档案分类翻阅及检索查找等功能;后端采用Python Django框架,承担处理业务逻辑的职责,接收前端请求并作出响应,实现档案的存储管理、用户权限把控及版权授权管理的功能。实现与区块链系统的对接,实时展现档案版权状态及使用记录,构建API接口,达成平台跟区块链的数据交互。在制定授权机制上,基于档案类型、重要性及使用范围等,明确各使用场景中授权的条件、费用标准和期限。平台给出授权申请功能,并借助智能合约进行自动审核,只要条件符合就自动授权,随后记录信息,审视档案共享情况。平台实时采集档案共享数据,并依据用户需求和市场动态,对共享策略作出调整,从而在版权保护与开放共享间找到平衡,确保平台持续运营,实现档案资源的有效利用。 在制作依靠档案实施沉浸式叙事设计的交互式纪录片时,以马钢高炉的历史发展为主线,结合档案中的关键事件及人物故事,搭建丰富的故事网络,按照故事线布置多个交互场景,如让用户化身钢厂工人,参与生产决策,亦或成为历史事件的见证者,亲身体验事件历程。此外,在场景中设置点击物件获取信息、与虚拟角色交流等互动,以增强参与感和沉浸感。将数字化档案素材融入纪录片,以Unity整合故事线、交互场景与多媒体素材,开发交互式纪录片原型,并在开发时优化程序性能,确保交互流畅、画面优质呈现。 研究可知,数字化留存技术可完整保存档案信息;区块链、数字水印等相关版权管理技术可守护版权安全;数字化叙事及交互技术可提升档案展示效果和用户体验,这些技术的联合运用,为工业遗产的可持续利用奠定了坚实基础。数字化技术不仅能长期保存档案,修复受损的相关资料,还能依托互联网实现广泛传播,提升工业遗产的社会影响力,更能对档案信息进行深度挖掘,为学术研究及决策提供支撑。 本文为同类文献档案内工业遗产的数字化保护工作提供了参考和借鉴。但在工业遗产数字化保护领域,跨学科协作、新技术融合应用以及更广泛的社会参与机制等内容,还需进一步研究,以适配不断变化的技术环境和工业遗产保护诉求。 本文为2023年安徽省社科规划项目“皖江流域工业遗产数字化保护与应用”(AHSKYY2023D040)成果之一。 (作者单位:安徽工业大学艺术与设计学院) 参考文献: [1]李子林,虞香群.基于数字叙事理论的档案服务创新研究[J].档案与建设,2023(01):33-36. [2]孙奥运,温培旭,邵淮先,等.高精度音频Sigma-Delta调制器综述[J].电子与信息学报,2024,46(05):1874-1887. [3]江俊君,程豪,李震宇,等.深度学习视频超分辨率技术综述[J].中国图象图形学报,2023,28(07):1927-1964. [4]刘越男,吴云鹏.区块链技术在档案管理中应用路径研究[J].中国档案,2020(09):28-31.
|