会议回顾 | “古籍智能信息处理”系列研讨会第七讲

2022年9月24日下午两点,由北京大学数字人文研究中心、北京大学人工智能研究院主办的“古籍智能信息处理”系列专题研讨会第七讲在腾讯会议如期举行。本次研讨会由北京大学数字人文研究中心、中国古籍保护协会古籍智能开发与利用专委会主办,北京大学中国古文献研究中心、南京师范大学文学院联合主办,北京大学-字节跳动数字人文开放实验室、北京大学人工智能研究院承办,会议由北京大学中国语言文学系杨海峥教授和中国科学院自然科学史研究所、北京大学数字人文中心孙显斌老师主持。

本期会议的主题为“古籍目录数据库建设”,中国科学院自然科学史研究所研究员孙显斌老师、国家图书馆副研究馆员包菊香老师、上海图书馆研究员夏翠娟老师、古联(北京)数字传媒科技有限公司大数据中心主任苏瑞欣老师先后发表了精彩的报告,随后杨海峥教授主持了讨论和互动环节。本次研讨会通过腾讯会议、哔哩哔哩平台同步直播,来自国内外高校及相关研究领域的一千多位观众在线观看,共襄盛会。

开场致辞

会议起始,杨海峥教授提到古典目录学有着“辨章学术,考镜源流”的学术传统,在新的智能时代下,古籍目录数据库的建设作为古籍数字化的重要一环,在整理和利用古籍资料过程中发挥重要作用。杨海峥教授介绍了参与本次研讨会报告的各位专家,随后四位专家各自分享了他们主要的工作研究成果。

专题报告

一、古籍目录数据库的建设与应用

孙显斌老师从古典目录学的理论问题切入,指出几个关键的考察维度:目录的构成,特别提到单书目录在唐宋以后的多书目录中的缺失;典籍分类及排序的依据;目录分类的演变;即类求书以及查询一书之著录等问题,并指出这些问题需要在古籍目录数据库建设中得到回应。第二部分孙显斌老师简单回顾了古籍目录数据库建设的发展历程。随后重点介绍了他参与的由北京大学数字人文中心、国家图书馆等单位建设的“中国历代典籍总目系统”和“经籍指掌:中国历代典籍目录分析系统”,包括其浏览、检索和各种分析功能,并表示将持续建设,近期目标是完成品种层的全覆盖及数据的关系化构建。最后,孙显斌老师援引傅斯年先生的话,认为数字人文的发展要重点回应“运用新材料、发现新问题、采取新方法”中的开创“新方法”的使命。

二、国家古籍保护中心古籍书目数据库建设

包菊香老师详细介绍了国家古籍保护中心立足于工作实际而建设的各古籍书目数据库。全国古籍普查登记平台及全国古籍普查登记基本数据库分别是全国古籍普查登记工作的工作平台和发布平台,有效保障了全国古籍普查登记工作的开展及其成果的展示,最终将形成中国境内现藏古籍的统一联合目录,将完整揭示中国境内古籍的存藏情况,而海外中华古籍书目数据库的建设旨在尽快摸清海外中华古籍的存藏情况,这三个数据库均是从空间维度出发开展古籍的调查工作;中华历代古籍书目数据库则是从时间维度出发开展古籍的调查工作,从而摸清我国历代典籍的流散历史和相关学术的演变脉络。国家珍贵古籍名录数据库是以数据库的形式公开发布第一批至第六批《国家珍贵古籍名录》收录的古籍信息,展示的是从中国境内一、二级古籍中遴选的具有重要文物、文献、艺术价值的珍贵古籍。对于未来古籍书目数据库的发展,包菊香老师提出了几点展望,如对数据进行规范统一、细粒度化的标引,切实加强各古籍书目数据库之间的互联互通,以期为公众提供更佳的使用效果。

三、面向循证研究的中文古籍联合目录构建及服务

夏翠娟老师介绍了“古籍循证”这一概念,即以古籍目录的记载和古籍文献中的内容作为依据,将科学的研究方法与研究人员的经验相结合,解决特定研究问题。秉持这一理念,上海图书馆开发的中文古籍联合目录及循证平台,从技术层面探索了跨机构古籍资源和数据的共建共享,并以本体和关联数据的语义框架融合不同来源、不同格式的古籍目录数据,支持研究者发现古籍中的物理证据、历史证据、内容证据、关联证据,以循证实践的方式解决研究中的问题。夏翠娟老师也介绍了作为特殊的民间文献的专题古籍联合目录——中国家谱知识服务平台,以及包括古籍和家谱在内的整个数据基础设施建设情况,通过建设系统性的基础设施来支持包括数智证据的多重证据参照的循证研究。最后从服务层面介绍了向社会提供开放数据服务、向研究人员提供知识服务、向到馆读者提供多媒体展陈服务。

四、古籍书目产品的设计与技术实现

苏瑞欣老师介绍了古联(北京)数字传媒科技有限公司开发的三款古籍书目产品:中华古籍书目数据库、历代石刻总目数据库、中国古籍总目(网络版),及支撑工具古籍书目智能处理系统。中华古籍书目数据库是对历代书目文献的综合利用,“籍合”自古至今各类已整理的书目资源,将准确、权威的书目作碎片化数据处理,实现一站式检索;唐五代墓志专目综合整理石刻资源在各类文献中的著录情况,对墓志的题名、主题词、时间、地点细致标注,通过考证、标注墓志志主之间的人物关系实现库内资源关联,还支持跨库调阅墓志原始文献;中国古籍总目(网络版)则是《中国古籍总目》在新的网络时代所进行的新布局,古籍书目智能处理系统是进行各类书目相关数据库和项目建设的支撑工具。苏瑞欣老师详细描述这些系统的策划、当前进展和后续规划,期待通过书目库建设引入更多关联资源,逐步搭建更加全面、系统的中国古籍知识网络工程体系。

互动问答

报告结束后,与会人员就资源开放与未来数据共享互通的可能进行讨论。夏翠娟老师就上海图书馆现已开放可供大众使用的资源做了补充说明,孙显斌老师、包菊香老师、苏瑞欣老师表示希望未来在顶层设计指导下,从技术和标准层面推进协作与共同建设。会议最后,王军老师和杨海峥老师做了总结性发言并与各位参会老师合照留念。至此,本次会议在热烈讨论氛围中圆满结束。

图片

本次研讨会由全国高等院校古籍整理研究工作委员会和中国古籍保护协会古籍智能开发与利用专业委员会指导,字节跳动公益特别支持。

本期研讨会视频回放已在B站更新(https://www.bilibili.com/video/BV1Gt4y1w7Fp)。“古籍智能”系列研讨会第八讲将于2022年10月中旬举行。系列研讨会的相关信息将会在古籍智能网站(http://gujiai.cn)上进行更新。此外,研讨会还将开展暑期课程等一系列后续活动。敬请关注。

zh_CNChinese