文化产业杂志

为壮族古籍建数字新家

时间:2026-06-04 18:09:29来源: 文字:

张嘉璇 廖美萱 奚晓媛 冯代乾

摘要:壮族古籍作为记录壮族语言、历史、民俗的重要载体,蕴含着丰富的文化精髓与历史记忆,是中华民族多元一体文化格局中不可或缺的组成部分。然而,由于年代久远及保管条件不一,这些珍贵典籍正面临虫蛀、霉变、字迹退化等多重风险,保护工作迫在眉睫。尽管部分壮族古籍已出版,但分布零散,系统性检索与利用困难,导致学者及爱好者难以全面获取研究资料。在此背景下,国家高度重视文化保护与传承,出台了一系列政策推动古籍数字化进程,包括《“十四五”非物质文化遗产保护规划》强调的利用数字技术保护文化遗产以及《关于推进新时代古籍工作的意见》中推进古籍数字化和古籍专业数据库开发与利用的要求。

国内外关于壮族古籍的研究已取得一定成果,主要集中在古籍整理的历史发展与现状、文学价值、数字化保护与技术创新以及铸牢中华民族共同体意识等方面。然而,目前尚无专门的壮族古籍检索平台,本研究将填补这一空白,为壮族文化的传承与发扬提供有力支持。本研究旨在建设国内首个壮族古籍总目数据库,并开发配套多维度检索网站,以系统整理和保存壮族古籍文献,解决当前壮族古籍研究面临的资源分散与检索低效问题。为实现上述目标,本研究将采用文献研究法、田野调查法、数字技术法及跨学科研究法。

壮族古籍概述

壮族古籍作为壮族历史文化的重要载体,是指壮族在历史上形成的,以古壮字、汉字及壮语为记录媒介的古代书册、文献典籍、口头传承及铭刻文书等。这些古籍不仅记录了壮族的语言文字、历史变迁、民俗风情,还深刻反映了壮族人民的宗教信仰、社会生活及精神世界,是研究壮族乃至中华文化不可或缺的宝贵资料。壮族古籍的范畴广泛,包括但不限于经文、神话、抒情长诗、故事性古歌、碑刻、文书等多种形式,时间跨度从古代至近现代,涵盖了壮族社会发展的各个阶段。

壮族古籍类型多样,各具特色。从载体形式上看,可分为书册类、碑刻类、铭刻类及口头传承类等。书册类古籍多以古壮字或汉字书写,内容丰富,涉及历史、宗教、文学等多个领域;碑刻类则多记录土司制度、民间风俗等,是研究壮族地方历史的重要实物资料;铭刻类如铜鼓铭文,虽数量有限,但蕴含着深厚的文化内涵;口头传承类则通过歌谣、传说等形式流传,是壮族文化活态传承的体现。壮族古籍的特点主要体现在以下方面:一是语言独特,古壮字作为壮族特有的文字系统,记录了壮族语言的演变与发展过程;二是内容丰富,涵盖了壮族社会的方方面面,是研究壮族历史文化的百科全书;三是形式多样,既有书面文献,也有口头传承,体现了壮族文化的多元性;四是地域性强,不同地区的壮族古籍在内容、形式上均有所差异,反映了壮族文化的地域特色。

壮族古籍具有极高的学术、经济和文化传承价值。从学术角度看,壮族古籍是研究壮族语言、历史、民俗、宗教等领域的宝贵资料,对于深入了解壮族文化、构建中华民族多元一体文化格局具有重要意义。通过整理和研究壮族古籍,可以揭示壮族社会的发展规律、文化特征及民族精神,为学术研究提供丰富的素材和理论依据。从经济角度看,壮族古籍的开发利用可以促进文化旅游产业发展,带动地方经济增长。例如,通过展示壮族古籍中的历史故事、民俗风情等,可以吸引游客前来参观体验,推动文化旅游的融合发展。从文化传承角度看,壮族古籍是壮族文化传承的重要载体。通过数字化保护和传承,这些珍贵文化遗产得以有效保存和广泛传播,从而增强壮族人民的文化认同感和自豪感,促进壮族文化的代代相传。同时,壮族古籍的传承有助于弘扬中华优秀传统文化,彰显中华文化的包容性与多样性。

建设壮族古籍总目数据库的必要性

解决壮族古籍保护及运用的现实难题

壮族古籍是记录壮族语言文字、历史与民俗的核心媒介,但当前面临双重保护难题。一方面,实体留存风险上升,因历史久远且保管条件有限,不少古籍出现虫蛀、霉变、字迹退化情况,部分民间抄本、口述资料甚至几近消失;另一方面,资源利用效率不高,已刊印的典籍分散在各类高校图书馆与地方文化单位,未公开的田野调研材料存于广西偏远的壮族居住区域,研究人员需花费不少时间和精力跨地区、多途径查找。更关键的是,国内尚未搭建专门的壮族古籍查询平台,“知晓有此书却不知何处找寻”的情况较为常见,极大限制了壮族古籍资源的高效利用及学术研究的深入开展,迫切需要借助构建数据库以实现资源的系统整合与便捷查询。

契合国家文化战略及地方政策方向

从国家层面来看,《“十四五”非物质文化遗产保护规划》清晰地指出运用数字技术保护文化遗产;《关于推进新时代古籍工作的意见》提出推进古籍数字化和古籍专业数据库开发与利用;国务院《“大数据+”行动计划》也支持通过数据整合促进文化创新,为古籍数字化保护提供了政策支撑。在地方层面,广西是壮族的主要聚居区域,《广西“十四五”文化和旅游发展规划》要求,建立自治区级古籍综合信息数据库,加强少数民族古籍修复工作,推进珍贵古籍缩微复制和数字化工作。

补足学术研究不足及助推文化活态传承

目前,学术界对壮族古籍的研究有明显不足,主要体现在以下三个方面。首先,尽管已经有《中国少数民族古籍总目提要(壮族卷)》等整理文献成果,却未能实现壮族古籍的数字化与多维度查询功能。其次,当前数字化研究多集中于单部古籍或特定人物,缺少对整体书目的系统梳理,且不易展现文献间的隐藏联系,容易造成研究资源的浪费。最后,在现代社会多元文化的影响下,壮族濒危语言文字及古籍传承面临后劲不足的问题,年轻群体缺少便捷的了解和学习途径。构建数据库能整合学术资源,为语言学、民俗学、历史学等跨学科研究提供工具助力,同时借助数字化平台吸引年轻群体的关注,促使壮族文化从“静态保护”转变为“活态传承”,增强民族文化认同,铸牢中华民族共同体意识。

建设壮族古籍总目数据库的可行性

政策支持与保障

国家高度重视少数民族文化保护与发展,出台了一系列政策法规,为壮族古籍总目数据库建设提供了坚实的政策支持。《中华人民共和国民族区域自治法》等法律法规明确支持有关单位和部门收集、整理、翻译和出版民族历史文化书籍。1984年成立的全国少数民族古籍整理出版规划小组,其职责便是系统性推进少数民族古籍的保护工作。

2022年,中共中央办公厅、国务院办公厅印发的《关于推进新时代古籍工作的意见》强调,深入开展古籍普查,完善书目数据,推动少数民族文字古籍文献的抢救保护,统筹古籍数字化版本资源建设与服务。该文件为壮族古籍总目数据库的建设指明了方向与标准。《新疆的文化保护与发展》白皮书(2018年)进一步指出,国家已在少数民族文字数字化方面取得成果,证明了少数民族语言文字数字化的可行性,也为方块壮字古籍的数据库建设提供了参照与动力。

技术支撑与保障

《2021―2035年国家古籍工作规划》将古籍数字化列为重点任务,部署了古籍数字化工程、国家古籍数字化资源总平台等关键项目,为壮族古籍数字化提供了清晰的技术路径、标准规范与实践示范。

数字采集领域已形成成熟技术体系,三维扫描、数字摄影、OCR(光学字符识别)文字识别技术协同发力,高效实现古籍影像采集与文字转写。其中,三维激光扫描聚焦高精度需求,可完成铜鼓铭文、破损古籍的数字化存档,为后续虚拟修复提供基础数据;数字摄影测量则兼具成本低、效率高的优势,适配多数书册、碑刻类古籍的细节捕捉,能精准还原字迹与版式;OCR技术经算法优化后,识别率达98%以上,能有效破解方块壮字字形复杂、多字体混杂、版式不规则等难题,大幅提升文字提取效率。

虚拟修复与智能应用助力古籍价值深挖,AI(人工智能)技术可精准识别虫蛀、撕裂、霉变等破损类型,结合修复案例智能生成方案,通过虚拟填充、碎片拼接还原古籍原貌,减少对原件的直接干预。同时,融合大数据与自然语言处理技术,能提取古籍中的历史事件、民俗礼仪等关键知识点,构建多维度知识图谱,既增强文献考证的准确性,也显著提升资源利用率。

资源基础与保障

我国古籍数字化工作已积累丰富的实践经验。2014年“中华经典古籍库”上线后,“中华古籍资源库”“中国基本古籍库”等一批权威数据库相继建成,覆盖海量历代典籍,标志着古籍数据库全面迈入“全文检索时代”。国家级整合平台“籍合网”进一步突破资源壁垒,实现多库互联互通,优化了数字资源的整合共享与公共服务效能。

广西本土同步发力古籍数字化建设,2022年上线的“广西古籍文库”,整合区内高校、文化单位资源,集数字化古籍、音视频、拓片等多元资源于一体,支持在线阅读、精准检索等功能,还联合打造“民族古籍音乐数据库”等专题库,为壮族古籍数据库建设提供了可供借鉴的技术路径、运营模式与发展范式。

人才队伍与保障

国家通过“中华古籍保护计划”“古文字与中华文明传承发展工程”等项目,系统培养古籍修复、编目、数字化等专业人才。教育部也推动高校加强古籍保护与研究,全国高校古籍整理研究工作委员会在21所高校设立古籍研究所,5所高校开设古文献专业。

古籍保护是一门综合性极强的学科,不仅涵盖多学科知识,还包括古籍数字化、智能化等现代科学技术,内容包罗万象、融汇古今。广西高校资源丰富,可借鉴复旦大学、贵州民族大学等院校的跨学科培养模式,联合本土壮族古籍传承人与青年学者,推进古籍整理与研究。通过校企合作、多方协同,培养既懂古籍文化又掌握数字技术的复合型人才,为数据库建设提供坚实人才保障。

建设壮族古籍总目数据库的预期成果

数据库框架及功能规划

壮族古籍总目数据库将采用先进的分层架构设计,以确保系统的高效运行和可扩展性。首先是底层,数据层以Access数据库为核心支撑,搭建古籍信息表、关键词表、馆藏信息表等关联数据表,将“文献ID”作为主键以保障数据唯一性;其次是服务层,借助Node.js结合Express框架构建后端服务器,确保数据调用和传输安全;最后为应用层,依据Vue.js框架及Element Plus UI库开发前端界面,适配多种终端访问。

在功能方面,支持关键词、多条件组合(如“史诗+稻作民俗+广西馆藏”)、壮汉双语对照查询,创建索引以提高查找效率。同时,搭建关键词标签体系以实现文献智能关联,以列表和知识图谱展示结果,完整呈现古籍信息(包括书名、抄写年代、书影链接等)。

数据收集及整理方案

壮族古籍收集范围包括公开资源与独家资源。公开资源通过整合《中国少数民族古籍总目提要(壮族卷)》等已刊印典籍,从广西民族大学古籍库、广西图书馆获取元数据信息;独家资源则借助田野调查,深入百色、河池等壮族聚居地收集民间传抄本和口述资料,抢救濒危壮族古籍。

整理工作可分为三个阶段。首先,在预处理阶段剔除错误数据,优化传抄本图像且人工核对OCR文本;其次,依据文献类型、关键词标签等多维度进行分类,标记14项核心字段;最后,提炼关键元素并搭建关键词表,构建知识图谱,按时更新数据及关联逻辑。

建设意义

壮族古籍大多为纸质古籍,历史久远,会随着时间推移产生磨损。这就要求我们对壮族古籍的保护不能只停留在纸质层面。因此,建设壮族古籍总目数据库意义重大。

1.文化意义

建设壮族古籍总目数据库,推动壮族文化发展。壮族古籍是壮族文化传承纽带及文化创新基础,不仅包含着壮族先民对世界的原始想象,还囊括了壮族不同种类的文学艺术,如富有节奏和韵律的刘三姐歌谣,讲述古代帝王将相著名人物故事的壮剧……建设壮族古籍总目数据库,为这些艺术形式提供网络传播平台,为艺术创作家提供可借鉴的素材资源,同时有助于人们了解壮族故事,促进壮族文化的新生。

2.社会意义

建设壮族古籍总目数据库,有助于传播壮族传统道德观,弘扬社会美德。壮族古籍是少数民族社会记忆的现实标本,蕴含着壮族人民的朴素道德观。例如,壮族古籍《行孝歌》中的《为人子者》通过宣扬二十四孝故事,讲述壮族人民立身处世的道德准则和人生哲理。建设壮族古籍总目数据库,将此类故事进行传播,有助于引导人们树立正确的价值观。

3.学术意义

建设壮族古籍总目数据库,为学术研究提供丰富的研究材料。壮族古籍内涵丰富,极具挖掘价值,是学术研究的一大热点。建设壮族古籍总目数据库,整合相关文献总目,能够解决文献材料零散问题,降低学者收集辨识文献的时间成本,从而提高学术研究效率。

壮族古籍总目数据库建设面临的挑战与应对策略

面临的挑战

壮族古籍总目数据库建设工作复杂,资金稳定投入至关重要。前期的数据采集技术需要高精尖设备支持,中期建设要投入大量人力、物力和财力,后期的长久维护和升级也要资金支撑。

建设过程中,数据质量控制面临挑战。首先是壮族古籍分布广且多有破损;其次是录入难度高,方块壮字结构复杂、古籍文献排版精妙;最后是元数据的标准不一,目前国内外规范各异,给数据库建设带来一定阻碍。

在壮族古籍数字化建设过程中,知识产权保护是一个亟待解决的重要问题。口头传承类古籍多为口头传唱,还有许多文献是抄写编录的,可能会存在人为误差和版权纠纷,为授权使用、推广带来困难。

复合型人才匮乏是壮族古籍总目数据库建设面临的一大难题。目前,广西高校尚未建立相应的人才培养机制,本土也缺乏相关企业提供技术支持,专业人才队伍保障严重不足。

应对策略

1.多元化资金筹备

为解决资金投入不足问题,应扩大建设资金来源。建设壮族古籍总目数据库是对政府保护和传承文化政策的积极响应,可向政府申请资金。此外,还可通过加强宣传争取社会捐赠,并积极寻求企业合作。

2.建立数据库质量保障体系

统一数据录入格式与标准,建立交叉互审机制,以确保严格按照文献情况录入,提高数据库质量。

3.加强知识产权保护

完善知识产权保护,借助在壮族古籍总目数据库中嵌入数字水印等技术手段;同时,用户需在使用数据库时签订授权协议,明确双方权利与义务。

4.加强人才培养与引进

以壮族古籍总目数据库为热点,吸引相关领域学者加入团队并邀请其为团队成员开展相关专业知识培训,提高成员在完善数据库信息方面的专业能力。

本文充分论证了建设壮族古籍总目数据库的必要性和可行性。壮族古籍卷帙浩繁,作为壮族文化的精华所在,它的价值是多方面的。它不单是壮族的文学典籍,更记载着壮族人民的生产生活史、经济史、社会发展史。建设壮族古籍总目数据库,不仅能“定格古籍”,使其不会随着岁月流逝而褪色,还能够有效解决纸质典籍“数量零散收集难,查找时间成本高”的难题,对壮族文化传播、社会风尚弘扬与学术领域研究都有着重要价值。

未来,在信息化、数字化建设进程中,古籍的数字化转型路径和发展道路会越来越广阔,从而为中华文化搭建更大、更丰富的传播平台。壮族古籍总目数据库的建设不是终点,而是起点。

2025年国家级大学生创新创业训练计划项目“壮典云擎:壮族古籍总目数据库的多维度建设与应用”(项目编号:X2025106020006)。

(作者单位:广西师范大学)

联系我们|网站介绍|欢迎投稿|杂志订阅|网站声明|

主管:山西出版传媒集团   主办:山西三晋报刊传媒集团     编辑出版:《文化产业》杂志社   投稿邮箱:whcytg@163.com
地址:山西省太原市迎泽区柳巷南路云路街2号 邮编:030000 联系电话:0351-4120686、0351-4120998、0351-4120995
期刊出版许可证丨 国内刊号:CN14-1347/G2 丨国际刊号:ISSN1674-3520丨邮发代号:22-415
晋ICP备2021019266号-1 晋公网安备140105029904671
主管:    山西出版传媒集团   主办:    山西三晋报刊传媒集团     编辑出版 《文化产业》杂志社   投稿邮箱:whcytg@163.com