数字人文视域下多粒度特征融合的古文命名实体识别
数字人文视域下多粒度特征融合的古文命名实体识别

数字人文视域下多粒度特征融合的古文命名实体识别


标题: 数字人文视域下多粒度特征融合的古文命名实体识别


作者: 孟佳娜,许英傲,赵丹丹,李丰毅,赵迪


第一作者: 孟佳娜


机构: 大连民族大学计算机科学与工程学院


期刊: 知识管理论坛


发表日期: 2024-12-31


论文摘要: [目的/意义]利用命名实体识别技术深入挖掘古籍文献,推动中文古籍数字化进程,对于推动历史学习、增强文化自信以及弘扬中国传统文化具有重要意义。[方法/过程]提出多粒度特征融合的古文命名实体识别方法,以《左传》为研究语料,构建人名、地名、时间等命名实体识别任务。首先,将古文字信息、词性信息及字形特征融合,提高输入特征表示能力;然后,在加入预测实体头尾辅助任务学习古句边界信息的同时利用Transfer交互器启发式学习古文实体构词规律,并用BiLSTM和IDCNN联合抽取上下文信息;最后,将学习到的多种古文特征加权融合,输入CRF中进行实体预测。[结果/结论]实验结果表明,多粒度特征融合的古文命名实体识别方法,相比主流的BERT-BiLSTM-CRF模型,精确率、召回率和F1值分别提升5.09%、13.45%和9.87%。多粒度特征融合的古文命名实体识别方法能够精准地实现对古籍文本的命名实体识别。


DOI阅读链接: 10.13266/j.issn.2095-5472.2024.039






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝