《数字人文》2024年第3期
《数字人文》2024年第3期

唐宸:古典文学天文研究与古籍数字化的多维探索

问:您最初是如何踏入数字人文这一前沿领域的?有哪些关键事件或人物激发了您的兴趣? 答:我在高中阶段(2002—2005年)便爱好计算机网页编程,曾在计算机老师指导下和几位同学合作制作了我们中学(屯溪一中)的第一个官方网站。当时国内的网页编程较国外稍显滞后,主流的网页编程软件是Frontpage,写的都是最基本的HTML代码,连CSS(层叠样式表)都很少使用,更不要说现在流行的JavaScript和各种结构化语言了。后

检测脚注 ——以“十八世纪在线文集”(ECCO)的3,200万页书籍为材料

在《回答此问题:什么是启蒙?》一文中,18世纪德国哲学家康德对一个大问题作出了回答,而这个大问题的提出是在一个小小的脚注里。但你无从得知,因为康德这篇著名文章的现今版本不再包含那项脚注中的内容:1784年12月期《柏林月刊》刊登的康德的原文章标题下印着“参见1783年12月期,516页”。事实上,1783年12月期《柏林月刊》的第516页有一条脚注:“什么是启蒙?这个问题几乎与‘什么是真理?’一样重要,在开始启蒙之前

情感分析与情感小说

这篇文章探讨了情感分析这一新兴领域对18世纪英国情感小说研究的启示,以及情感小说又能为情感分析提供何种启示。情感分析是涵盖多种文本挖掘技术的统称,在商业和营销环境中已成为监测和管理消费者意见的几乎无处不在的一种方法。它的目标对象并非传统市场分析中的人物形象——经济人或理性行为者——用约翰·密尔(John Mill)的话来说,即“渴望拥有财富,并有能力判断达成此目的方法的相对效率的人”。[1]相反,这一新的计算方法将人

数字史学项目模式探讨 ——以“现代中国城市中的精英、网络与权力”(ENP-China)为例

摘 要:法国艾克斯-马赛大学的跨学科团队启动了一项名为“现代中国城市中的精英、网络与权力”(ENP-China)的大型项目,旨在运用数字技术研究1830—1949年间中国近代精英的转型过程。项目聚焦精英个体的行为模式,分析他们如何通过建构社会网络来影响社会与政治格局。通过规划缜密的基础建设路径及开发历史文本分析工具等方式,项目团队收集了海量地理和人物数据,建设了开放的数据库平台,并基于这些数据进行了多元研究。该项目在

大语言模型的历史知识生成 ——基于美国史教学试验的观察与思考

摘 要:大模型的历史知识生成能否取代传统教师的角色?如何理解人与人工智能在历史知识供给过程中的区别?基于美国历史课程的教学试验证明,将大模型引入历史教学,无论是作为课堂讨论的参与者,还是学生自主学习的帮手,抑或是培养思辨意识的互动工具,都能为传统课堂带来明显助益。教学试验同样证明,当前大模型的技术能力仍存在较大局限,无法在脱离教师引导的情况下完全取代传统课堂的知识获取方式,学生的自主思考与课后阅读在与大模型互动的过程

基于预训练模型的古典诗歌风格判定方法

摘要:诗人诗歌风格分析是中国古典诗歌研究的重要课题之一。以往的研究者评判某位诗人的诗风,多凭其自身阅读和创作的主观经验,并参考已成为某种定论的前人评价。这种判断方式往往有效,但也可能存在一些误差。文章使用搜韵公司开源的中国古典诗歌数据,并以此为基础提出了一种基于预训练模型的通用诗歌风格判定方法,创新性地将深度学习引入计量风格学领域;并尝试使用此方法解决唐宋诗风格识别问题,且以明代后七子、同光诗派等被认为具有较明确且一

唐宋之间:李梦阳律诗中的同题异调

摘 要:运用数字人文方法构建唐宋诗风格的自动分类模型,准确率可达86%。运用该模型分析明代诗歌,可以清晰地发现,李梦阳等人的律诗写作在明前中期以宗宋为主流的诗坛背景下,确立了“独标唐风”的文学史定位。与何景明等人不同,李梦阳在同题组诗创作中,出现了不少同时呈现唐风与宋调的诗作,一面侧重丰神情韵,另一面又侧重筋骨思理。基于对台阁、茶陵文人以及性气诗的反思,李梦阳的诗学理想注重情感抒发,但又警惕个人化的情感表达流于浅表,

大语言模型开放性生成文本中的职业性别偏见研究

摘 要:大语言模型问世以来,在自然语言处理诸多任务上都取得了惊人的表现。但其中可能存在的安全性和公平性问题也引起了人们的重视,特别是模型生成文本可能含有对特定职业、性别等群体的偏见和歧视。文章通过两种性别征形式,构造了显性和隐性的性别职业提示语,提示大语言模型生成开放性文本,并从情感极性、词汇丰富度和冒犯性程度三个维度对生成文本的偏见进行分析,评估并比较传统模型与以ChatGPT为代表的大语言模型中的职业显性性别和隐

唐代元和文学基本创作生态的量化研究 ——基于唐宋文学编年地图及知识图谱的数据分析

摘要:根据“唐宋文学编年地图”平台及“知识图谱”平台所提供的编年系地数据,可以发现元和文学是继开元、天宝文学后又一个创作高峰,是唐代文学的中兴。从文类的情况看,元和文学掀起了新的诗歌高潮与文章高潮。就诗歌而言,814年是诗歌创作峰值年份,元稹、刘禹锡、柳宗元因贬官外任,反而促进创作的繁荣。就文章而言,元和时期也是唐代文章创作的高峰,在政治剧变的前后两年间,长安产生了大量制诰类文章。从文学版图来看,长安仍是全国文坛的中

提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝