计算机软件及计算机应用 基于关键词提取的文化遗产信息资源知识抽取方法 标题: 基于关键词提取的文化遗产信息资源知识抽取方法作者: 彭博第一作者: 彭博机构: 华中科技大学建筑与城市规划学院期刊: 数字人文研究发表日期: 2023-06-28论文摘要: 在文化遗产信息资源数量爆炸式增长的态势下,能否高效抽取非结构化数据构成的文化遗产信息资源中的知识,影响着是否能更有效传播和弘扬优秀传统文化。文章以文化遗产信息资源文本为研究对象,提出将其按来源分类,根据不同的知识分布特点选取针对性的关键词提取方法,获得关键词后在知识图谱中检索文化遗产实体与关系,完成知识抽取的路径。实验结果表明,研究所确立的分类关键词提取方法在多个阈值条件下较其他方法有较大提升,能够较好地抽取非结构化数据中的文化遗产知识。关键词: LDA; TF-IDF; 关键词提取; 文化遗产; 知识抽取知网阅读链接: 点击跳转