计算机软件及计算机应用 哲学 主题建模辅助哲学研究的方法论探究——以《论语》《孟子》《荀子》的计算分析为例 标题: 主题建模辅助哲学研究的方法论探究——以《论语》《孟子》《荀子》的计算分析为例作者: 高元昊,王小红,科林·艾伦,杨钊第一作者: 高元昊机构: 西安交通大学人文社会科学学院,匹兹堡大学科学哲学科学史系,西安交通大学计算机科学与技术学院期刊: 数字人文研究发表日期: 2021-05-08论文摘要: 近年来被广泛运用于史学、文学研究的LDA主题建模不仅仅可以用于发现庞大语料库的整体意义结构,将LDA运用于哲学语料库,再聚焦于具体文本,还可以揭示小文本意义特征和文本间意义关系,从而进行哲学发现,并为一些哲学命题提供实证论据。作为一种新方法,LDA的有效性与客观性需要被检验。首先,基于新汉典语料库,以《论语》《孟子》《荀子》的LDA建模研究为例,展示该研究从建模到得出推论的全过程。其次,将模型数据和哲学推论与SN关于上述三部典籍的数字人文研究进行对比,分析不同推论的原因,论述运用LDA发现小文本的意义特征和文本间关系的有效性。最后,使用控制变量法对Ctext语料库进行建模,对比不同参数下模型所呈现的《论语》主题分布,论述该方法的客观性条件仅与k值设置有关,当k取值于收敛向“理想状态”的一段区间时,LDA能最大程度避免主观性因素的干扰,保证该研究方法的客观性。关键词: 《孟子》; 《荀子》; 《论语》; LDA主题建模; 数字人文; 计算哲学研究知网阅读链接: 点击跳转