基于预训练模型的古典诗歌风格判定方法
摘要:诗人诗歌风格分析是中国古典诗歌研究的重要课题之一。以往的研究者评判某位诗人的诗风,多凭其自身阅读和创作的主观经验,并参考已成为某种定论的前人评价。这种判断方式往往有效,但也可能存在一些误差。文章使用搜韵公司开源的中国古典诗歌数据,并以此为基础提出了一种基于预训练模型的通用诗歌风格判定方法,创新性地将深度学习引入计量风格学领域;并尝试使用此方法解决唐宋诗风格识别问题,且以明代后七子、同光诗派等被认为具有较明确且一
摘要:诗人诗歌风格分析是中国古典诗歌研究的重要课题之一。以往的研究者评判某位诗人的诗风,多凭其自身阅读和创作的主观经验,并参考已成为某种定论的前人评价。这种判断方式往往有效,但也可能存在一些误差。文章使用搜韵公司开源的中国古典诗歌数据,并以此为基础提出了一种基于预训练模型的通用诗歌风格判定方法,创新性地将深度学习引入计量风格学领域;并尝试使用此方法解决唐宋诗风格识别问题,且以明代后七子、同光诗派等被认为具有较明确且一
摘 要:运用数字人文方法构建唐宋诗风格的自动分类模型,准确率可达86%。运用该模型分析明代诗歌,可以清晰地发现,李梦阳等人的律诗写作在明前中期以宗宋为主流的诗坛背景下,确立了“独标唐风”的文学史定位。与何景明等人不同,李梦阳在同题组诗创作中,出现了不少同时呈现唐风与宋调的诗作,一面侧重丰神情韵,另一面又侧重筋骨思理。基于对台阁、茶陵文人以及性气诗的反思,李梦阳的诗学理想注重情感抒发,但又警惕个人化的情感表达流于浅表,
摘 要:大语言模型问世以来,在自然语言处理诸多任务上都取得了惊人的表现。但其中可能存在的安全性和公平性问题也引起了人们的重视,特别是模型生成文本可能含有对特定职业、性别等群体的偏见和歧视。文章通过两种性别征形式,构造了显性和隐性的性别职业提示语,提示大语言模型生成开放性文本,并从情感极性、词汇丰富度和冒犯性程度三个维度对生成文本的偏见进行分析,评估并比较传统模型与以ChatGPT为代表的大语言模型中的职业显性性别和隐
摘要:根据“唐宋文学编年地图”平台及“知识图谱”平台所提供的编年系地数据,可以发现元和文学是继开元、天宝文学后又一个创作高峰,是唐代文学的中兴。从文类的情况看,元和文学掀起了新的诗歌高潮与文章高潮。就诗歌而言,814年是诗歌创作峰值年份,元稹、刘禹锡、柳宗元因贬官外任,反而促进创作的繁荣。就文章而言,元和时期也是唐代文章创作的高峰,在政治剧变的前后两年间,长安产生了大量制诰类文章。从文学版图来看,长安仍是全国文坛的中
摘 要:此研究选取“中国学术期刊数据库”中2000—2023年博物馆陈列文本英译研究相关文献,借助可视化分析工具CiteSpace,通过考察年发文量、高发文量机构、作者、高频关键词、高中心性关键词等指标,梳理研究现状,呈现研究热点。研究发现:一、相关研究起步较晚,发文量总体呈波动上升趋势,成果集中于近十年;二、研究机构地区分布不均;相对缺乏固定学者群体持续关注;独立研究领域尚未形成。三、研究热点主要包括:英译策略、展
随着人工智能迅速发展,知识积累、逻辑推理型的工作可能会被机器取代,但人文学者的“生”的智慧则很难被取代,如感知言外之意、弦外之音和透过外部现象领会事物本质的思维能力。在未来,通过利用机器对大量材料进行梳理,人文学者将能够更便捷地分析现象、阐释材料和表达意义,这是数字人文工具协助人文研究的途径。在本期笔谈中,我们有幸邀请到几位在相关领域活跃的学者,以文化史为例,共同探讨如何利用数据助力人文研究。
《文学遗产》已走过70年光辉而曲折的历程。从1954年3月1日创刊到1966年停刊期间,《文学遗产》在《光明日报》以专栏的形式面向读者;1980年复刊,由报纸专栏改为杂志专刊。此后《光明日报》也恢复了“文学遗产”专栏。因2022年以来有关数据搜罗不全,故本文主要量化分析1954—1966年间《光明日报·文学遗产》和1980—2021年间《文学遗产》杂志所刊发的有关宋代文学的研究论文,实际统计的时长为55年。《文学遗产
摘要:利用“知识图谱”网站诗词库API提供的诗词数据、基于Bert的模型(包括SikuBERT、SBERT、BERT-Base-Chinese-WS)、DBSCAN及Apriori算法可以有效挖掘诗词意象中的隐藏模式。以“鹧鸪”为例,据算法提供的线索可发现鹧鸪意象的兴起与唐朝乐府之曲《山鹧鸪词》广泛流传密切相关。曲中叙说了湘妃在舜南巡而死之后,投水化成鹧鸪的故事,因此鹧鸪意象经常用于表达游子、思妇的愁情。此外,宋代出
摘要:《周易》有云:“观物取象”“立象以尽意”。意象承载着诗词作者内心充沛的各种情感。在流传至今的中华文化典籍中,唐诗的意象系统是较为丰满的。文章以“中国历代人物传记资料库”和《全唐诗》为样本,结合社交网络研究方法,拟从量化角度分析唐朝诗人社交关系及其与常见意象的蕴情关联。研究发现,诗人群体的社会关系以正向弱关系为主,主要社会活动为赠送诗文;诗人社群可分为五个模块,初唐诗人的社群结构并不明显,且与盛唐诗人社群联系紧密