文本挖掘
文本挖掘

文化地理学视角下《道德经》英译本的数字人文探索

摘 要:文章从文化地理学的视角出发,采用数字人文的研究方法,探索《道德经》英译本的历史演变进程。此研究对《道德经》1859—2024年可检索的全部464位/组译者的710个英译版本的出版地进行了统计与可视化分析,并基于地理分布将《道德经》的英译历程归纳为五个时期,并利用文本挖掘技术,对各时期译本的关键词进行深度分析。研究发现,《道德经》的英译呈现出“文化扩散-文化区形成-文化整合”的循环模式。这一模式不仅深刻影响了《

基于LDA主题模型的中国高校期刊文本挖掘研究(1912—1978) ——以数学文章为考察中心

摘 要:文章旨在运用数字人文领域的文本挖掘技术与可视分析方法,深入探索中国近现代高校期刊中数学文章的丰富内涵,通过以中国高校期刊为载体的近现代中国数学知识流通特征研究,为科技期刊文本与数据挖掘智能化的期刊研究开辟新视角。文章以1912—1978年高校期刊中发表的数学文章为语料来源,建立期刊数据库。通过Jieba分词、LDA主题模型等文本挖掘技术,对期刊文本进行主题分析。然后用正则表达式对主题词进行语义追溯,从而深度挖

利用“知识图谱”网站诗词库API及文本挖掘技术分析诗词意象的方法 ——以挖掘“鹧鸪”意象隐藏模式为例

摘要:利用“知识图谱”网站诗词库API提供的诗词数据、基于Bert的模型(包括SikuBERT、SBERT、BERT-Base-Chinese-WS)、DBSCAN及Apriori算法可以有效挖掘诗词意象中的隐藏模式。以“鹧鸪”为例,据算法提供的线索可发现鹧鸪意象的兴起与唐朝乐府之曲《山鹧鸪词》广泛流传密切相关。曲中叙说了湘妃在舜南巡而死之后,投水化成鹧鸪的故事,因此鹧鸪意象经常用于表达游子、思妇的愁情。此外,宋代出

提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝