中国文学 基于多任务联合学习的长白山民间文学实体抽取方法研究 标题: 基于多任务联合学习的长白山民间文学实体抽取方法研究作者: 张卫东,陈希鹏,李心怡,李奉芮第一作者: 张卫东机构: 吉林大学商学与管理学院期刊: 现代情报发表日期: 2024-09-11论文摘要: [目的/意义]通过对民间文学文本数据进行命名实体识别,有助于民间文学资料的深度描述和展示,为构建完整的长白山非遗知识体系夯实根基。[方法/过程]本研究提出了基于多任务联合学习(BERT-BiGRU-MHA-CRF)的长白山非遗民间文学实体抽取模型,引入双向门控循环单元BiGRU更好地处理实体在句子中的长序列依赖性,解决梯度消失问题;再联合多头自注意力机制MHA加强对关键实体的注意力权重分配,从而获得更好的实体识别结果。[结果/结论]通过对比BERT-CRF、BERT-BiLSTM-CRF主流多任务联合学习基准模型,本模型对民间文学命名实体识别的准确率均为最优,其精确率达86.76%。本研究初步实现了对民间文学文本的精准实体识别,有利于对民间文学资料进行深入分析和知识挖掘,有助于保护和传承长白山文化记忆。关键词: 多任务联合学习; 实体识别; 数字人文; 民间文学; 长白山文化; 预训练模型知网阅读链接: 点击跳转