汉语音义文献自动分词研究 ——以唐五代佛典音义为例
摘要:汉语音义文献属于我国古籍中特殊且重要的一类,是汉语音义研究的核心文献。汉语音义研究首先需要从其中离析提取出音和义,进行匹配和判定。而作为古籍数字化的基础任务之一的自动分词,也是音义信息精准高效提取的关键。随着古籍数字化及数字人文相关技术的不断迭代,古汉语自动分词技术有了新进展。本文以唐五代佛典音义文献自动分词研究为切入点,提出面向佛典音义的词汇切分规范,通过微调训练得到唐五代佛典音义文献自动分词模型YinYiB
摘要:汉语音义文献属于我国古籍中特殊且重要的一类,是汉语音义研究的核心文献。汉语音义研究首先需要从其中离析提取出音和义,进行匹配和判定。而作为古籍数字化的基础任务之一的自动分词,也是音义信息精准高效提取的关键。随着古籍数字化及数字人文相关技术的不断迭代,古汉语自动分词技术有了新进展。本文以唐五代佛典音义文献自动分词研究为切入点,提出面向佛典音义的词汇切分规范,通过微调训练得到唐五代佛典音义文献自动分词模型YinYiB
摘要:西夏文字是研究西夏历史文化的重要载体,因其字形结构独特、研究人员稀缺,其解读和研究面临诸多挑战。人工智能技术的发展为走出这一困境提供了新途径,但仍受限于标注数据稀缺的现状。本研究聚焦于低资源条件下的西夏文OCR与机器翻译两项任务。在OCR任务中,使用字体生成技术构造了训练数据,在仅使用500张真实标注图片的前提下实现了83.1%的准确率。在机器翻译任务中,结合大语言模型和西夏文辞书知识,实现了西夏文到汉语的对译
摘要:随着古籍数字化及数字人文的飞速发展,近些年诸多数字古籍整理平台于网络上涌现,并产生了广泛影响。其基本功能通常有图像文字转换、协助转换校对、协助文本格式处理、自动标点、文本对勘、其他相关功能,并设计有流程系统、合作系统;根据对各功能的支持情况,可对诸平台进行分类。数字古籍整理平台在古籍整理方面具有非常重要的意义,但是在校勘功能上却支持羸弱,应进一步建设加强。经全面梳理分析校勘的具体步骤,可见数字手段能全面应用于校
摘要:2025年3月30日,清华大学人文学院、清华大学—同方知网数字人文联合研究中心、中国艺术研究院艺术哲学与艺术史研究中心、《文艺研究》杂志社共同举办的“人工智能时代人文知识生产的模式变革与体系重构”工作坊,在清华大学蒙民伟人文楼成功召开。来自学术界、期刊界及数字技术领域的多位专家与学者,围绕“人工智能对知识生产的系统性冲击”“各环节的功能变化和定位更新”“各主体的适应性变革和应对策略”“共建知识生产新模式的可能性
摘要:随着全球移民的加速和信息技术的进步,国家之间、民族之间的语言接触与融合现象愈发频繁,引起了越来越多学者的关注。但对国际上该领域研究的总体状况、前沿热点和发展趋势的相关分析还未曾进行。文章采用Python软件,从合作、关键词、引用关系等维度,对Web of Science三大引文数据库中收录的1,031篇该领域相关文献进行计量分析,以探讨该领域在国际上的研究热点及演变趋势。结果表明,当前该领域的研究主要集中于国外
摘要:此研究聚焦于1785年至1900年间《泰晤士报》对老子思想的报道及其在特定历史背景下的传播活动。研究揭示,《泰晤士报》在西方中心主义的影响下,以基督教神学为框架,将老子思想简化为基督教教义的附属品或背离一神论的异教“教义”。报道通过他者化的叙事方式,将老子思想贬低为失去活力和价值的古老文明。研究认为,此种基于西方中心主义的报道实践,实质上是一种涉及权力关系的文化政治行为,映射出彼时英国主流媒体在中英关系中的文化
摘要:以内蒙古师范大学蒙古学学院数字人文本科专业为例,文章探讨了数字人文本科专业课程建设的思路与实践,介绍了数字人文的概念及其在人文学科中的重要作用,阐述了内蒙古师范大学蒙古学学院数字人文本科专业的概况、培养目标、毕业要求以及课程体系建设思路。课程体系建设需考虑紧密结合社会需求培养人才,基于原有支撑专业融合传统与新兴,考虑学生背景多样性促进文理交叉融合,权衡课程比例、强化实践与实验教学等四个方面。 关键词:数字人文
摘要:随着数字人文转向,学界开始借助计算机辅助软件研究电影,揭示肉眼无法辨识的现象背后的模式和结构。有学者研究发现,多色感知特征模型和MCEG-Net模型能有效预测电影色彩与情感关联。基于上述理论基础,结合色彩分析软件VIAN,借由气氛美学,本研究为理解电影色彩表达和情感传递提供新视角和方法,探索藏语电影的色彩叙事空间在导演—电影—受众间的感知传播效应。文章为数字人文领域的电影分析与情感研究提供了参考,同时为电影创作
摘要:岩画是世界公认的重要文化遗产,在我国乃至全球范围内,许多岩画遗址尚未被发现,大部分岩画未被记录、研究或公开,仍需判断岩石痕迹是自然形成还是人工刻凿,开展基础的鉴别和分类工作。作为不可移动文物,人工现场鉴别和分类岩画比较困难,在面对大量岩画图像时也难以保持客观一致的标准。文章以贺兰山岩画为实验对象,运用深度学习方法,对岩画进行自动化的鉴别和分类,尝试提供相对客观且高效的分类方法。经过测试,岩画鉴别与分类模型综合F