计算机软件及计算机应用自动化技术中国文学

基于大语言模型的文史知识库构建研究

标题: 基于大语言模型的文史知识库构建研究

作者: 丘子靓,胡韧奋,莫凯洁,王予沛,刘智颖

第一作者: 丘子靓

机构: 北京师范大学

期刊: 数字人文

发表日期: 2024-12-31

论文摘要: 高质量的文史知识库是开展数字人文研究的基石。近年来,大语言模型凭借其强大的语言理解与生成能力,为人文学科知识的深度加工带来了新的机遇。本文以典故知识分析为案例,通过典故知识结构化整理、用典判断和典故识别三项任务,评估了大语言模型在文史知识提取和加工方面的能力。实验结果显示,经合理的提示设计,大语言模型能够有效地完成文史知识整理,并表现出一定的文史知识判断能力;此外,小样本学习、检索增强及微调策略均能显著提升模型处理文史知识问题的能力。据此,文章讨论了大语言模型在文史知识加工领域的应用策略,包括模型选择、调用方式、提示与微调等引导机制,并提出了基于大语言模型构建文史知识库的基本路径。进一步地,文章展望了大语言模型在数字人文领域的未来应用方向。

关键词:

典故; 大语言模型; 数字人文; 文史知识; 知识库

知网阅读链接: 点击跳转

提示：本站使用最低限度cookies来确保基础功能实现。 View more

同意

拒绝