推动古籍目录数据库建设
9月24日,由北京大学数字人文研究中心、北京大学人工智能研究院主办的“古籍智能信息处理”系列专题研讨会第七讲在线上举行。
本次讲座的主题为“古籍目录数据库建设”。北京大学中国语言文学系教授杨海峥在致辞时提出,古典目录学有着“辨章学术,考镜源流”的学术传统,在新的智能时代下,古籍目录数据库的建设作为古籍数字化的重要一环,在整理和利用古籍资料过程中发挥着重要作用。在报告阶段,中国科学院自然科学史研究所研究员孙显斌、国家图书馆副研究馆员包菊香、上海图书馆研究员夏翠娟、古联(北京)数字传媒科技有限公司大数据服务中心主任苏瑞欣先后作专题报告。
古籍目录数据库的建设与应用
孙显斌从古典目录学的理论问题切入,指出几个关键的考察维度:目录的构成,特别提到单书目录在唐宋以后的多书目录中的缺失;典籍分类及排序的依据;目录分类的演变;即类求书以及查询一书之著录等问题。他认为,这些问题需要在古籍目录数据库建设中得到回应。在回顾古籍目录数据库建设的发展历程的基础上,他重点介绍了由北京大学数字人文研究中心、国家图书馆等单位建设的“中国历代典籍总目系统”和“经籍指掌:中国历代典籍目录分析系统”,如其浏览、检索和各种分析功能等。据介绍,这两个系统将持续建设,近期目标是完成品种层的全覆盖及数据的关系化构建。孙显斌表示,数字人文的发展要重点回应傅斯年所说“运用新材料、发现新问题、采取新方法”中开创“新方法”的使命。
国家古籍保护中心古籍目录数据库建设
包菊香详细介绍了国家古籍保护中心立足于工作实际而建设的各古籍书目数据库。全国古籍普查登记平台及全国古籍普查登记基本数据库分别是全国古籍普查登记工作的工作平台和发布平台,有效保障了全国古籍普查登记工作的开展及其成果的展示,最终将形成中国境内现藏古籍的统一联合目录,将完整揭示中国境内古籍的存藏情况,海外中华古籍书目数据库的建设旨在尽快摸清海外中华古籍的存藏情况,这三个数据库均是从空间维度出发开展古籍的调查工作。中华历代古籍书目数据库则是从时间维度出发开展古籍的调查工作,从而摸清我国历代典籍的流散历史和相关学术的演变脉络。国家珍贵古籍名录数据库是以数据库的形式公开发布第一批至第六批《国家珍贵古籍名录》收录的古籍信息,展示的是从中国境内一、二级古籍中遴选的具有重要文物、文献、艺术价值的珍贵古籍。包菊香表示,未来古籍书目数据库的重点发展方向是对数据进行规范统一、细粒度化的标引,切实加强各古籍目录数据库之间的互联互通,以便为公众提供更佳的使用效果。
面向循证研究的中文古籍联合目录构建及服务
夏翠娟介绍了“古籍循证”这一概念——即以古籍目录的记载和古籍文献中的内容作为依据,将科学的研究方法与研究人员的经验相结合,解决特定研究问题。秉持这一理念,上海图书馆开发的中文古籍联合目录及循证平台,从技术层面探索了跨机构古籍资源和数据的共建共享,并以本体和关联数据的语义框架融合不同来源不同格式的古籍目录数据,支持研究者发现古籍中的物理证据、历史证据、内容证据、关联证据,以循证实践的方式解决研究中的问题。夏翠娟介绍了作为特殊的民间文献的专题古籍联合目录——中国家谱知识服务平台,以及包括古籍和家谱在内的整个数据基础设施建设情况。建设系统性的基础设施,将支持包括数智证据的多重证据参照的循证研究。在服务层面,向社会提供开放的有数据服务、向研究人员提供知识服务、向到馆读者提供多媒体展陈服务。
古籍书目产品的设计与技术实现
苏瑞欣表示,古联公司开发了三款古籍书目产品:中华古籍书目数据库、历代石刻总目数据库、中国古籍总目(网络版),此外还开发了支撑工具古籍书目智能处理系统。中华古籍书目数据库是对历代书目文献的综合利用,“籍合”自古至今各类已整理的书目资源,将准确、权威的书目作碎片化数据处理,实现一站式检索;唐五代墓志专目综合整理石刻资源在各类文献中的著录情况,对墓志的题名、主题词、时间、地点细致标注,通过考证、标注墓志志主之间的人物关系实现库内资源关联,还支持跨库调阅墓志原始文献;中国古籍总目(网络版)则是《中国古籍总目》在新的网络时代所进行的新布局,古籍书目智能处理系统是进行各类书目相关数据库和项目建设的支撑工具。书目库建设有助于引入更多关联资源,逐步搭建更加全面、系统的中国古籍知识网络工程体系。
本次讲座由北京大学数字人文研究中心、中国古籍保护协会古籍智能开发与利用专委会主办,北京大学中国古文献研究中心、南京师范大学文学院联合主办,北京大学-字节跳动数字人文开放实验室、北京大学人工智能研究院承办。