中文与韩文数据集的创建、关联与分析——用MARKUS与COMPARATIVUS进行数字文本标注
中文与韩文数据集的创建、关联与分析——用MARKUS与COMPARATIVUS进行数字文本标注

中文与韩文数据集的创建、关联与分析——用MARKUS与COMPARATIVUS进行数字文本标注


标题: 中文与韩文数据集的创建、关联与分析——用MARKUS与COMPARATIVUS进行数字文本标注


作者: 魏希德,陈大龙


第一作者: 魏希德


机构: 荷兰莱顿大学区域研究所,浙江大学国际联合学院


期刊: 数字人文


发表日期: 2021-09-30


论文摘要: MARKUS("码库思")是一个多语言数字文本标注和分析平台。这个平台使历史学家和其他研究人员能够利用其获取的全文数字格式的原始资料来构建数据集。MARKUS最初是为处理20世纪以前的中文文本而设计的,现在已经发展成为一个多功能的标注平台,特别适合对现代中文、文言文和前现代韩文(韩国语)文本中的命名实体进行自动标注、参阅和可视化。此外,它的许多附加标注功能还可以用来分析和阅读任何语言的文本,只要电子文档是以统一的语言编码标准Unicode编码的。下面将讨论MARKUS和与其相关的文本比较工具COMPARATIVUS(2)的主要目标和方法特征,并通过一些运用MARKUS研究中国和朝鲜(韩国)历史的实例来进行说明。


知网阅读链接: 点击跳转






提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝