《数字人文》专栏
《数字人文》专栏

面向文化遗产整理与人文研究的数字人文时间基础设施:学理基础、应用构想与实施路径

朱本军 / 北京大学图书馆 摘要:中华文化遗产中的汉语时间表达极为复杂。对于中华文化遗产及文化遗产内容知识单元的数字化整理和智慧化关联而言,实现中国古代不同政权之间纪时的古—古转换、中国历法与西方儒略历或格里高利历的中西历转换,是一项带有关键性、全局性和基础性的工作。该项工作甚至可以为全世界的文化遗产数字化整合带来变化。文章对数字人文时间基础设施“汉语统一时间标尺平台”的学理基础、应用构想与实施路径进行了系统性论述。

湍流中的稳态:东晋门阀贵族的社会网络

数字史学 尚闻一 / 美国伊利诺伊大学厄巴纳-香槟分校 桑梓洲 / 美国伊利诺伊大学厄巴纳-香槟分校 摘 要:东晋(317—420)常被历史学家认为由门阀贵族所宰制。网络分析通过将研究范围从门阀政治扩展到贵族制社会,为理解这些门阀贵族提供了一个独特的视角。文章基于《世说新语》的文本,重构了东晋门阀贵族的社会网络。作为志人小说集,《世说新语》为东晋贵族的社交互动提供了丰富的材料,并能用于社会网络的综合分析。文章使用网络

大数据时代避讳学的新机遇:以清初为例

 数字史学 黄一农/新竹清华大学历史研究所 摘 要:先前学界有关清初避讳的认知,几乎均有待商榷。如误以顺治朝对帝名“福临”有“二名不偏讳”之规定;误以康熙继位后,旋因避御名而改玄武门为神武门(此应发生在康熙三年至十一年间),还因此改称范晔为范蔚宗等。其实,清朝在雍正元年十一月初九日之前并无面对一般大众的具体讳例,而讳例的颁布时间也不能作为断代的绝对界线。康熙朝对皇帝玄烨及皇太子胤礽名字的改笔或改字(出现颇多

“其命维新”:聚焦文献数字化的现状与未来——中国历史文献研究会数字文献分会第一届年会暨东北数字人文研究中心揭牌仪式综述

郑思佳 / 辽宁大学文学院 2022年8月1日—2日,由中国历史文献研究会数字文献分会主办,辽宁大学文学院承办,学灯论坛组委会协办的“中国历史文献研究会数字文献分会第一届年会暨辽宁大学东北数字人文研究中心揭牌仪式”在辽宁沈阳隆重召开。来自北京大学、中国人民大学、上海交通大学、南开大学、北京师范大学、山东大学、吉林大学、华东师范大学、东北师范大学、南京师范大学、延边大学、古联(北京)数字传媒科技有限公司等全国40余所高

现代汉译文学期刊史料的编年考录与其数据库的建立

李 今/中国人民大学文学院 学界将最近十年由新史料观,特别是计算机和数字化技术所引发的,对史料存储、呈现及获取方式所发生的巨大变革,称为“史料革命”。我所认知的这个“史料革命”,基本上就是把图书馆、博物馆馆藏文献数字化,这一步无论怎样估价都不过分,它是一次伟大的科技之创举。其进一步的发展,现在已经显示出从聚积型数据库向聚类型专题数据库转变的趋势。在此“史料革命”的过程中,形成了诸多数字人文成果。例如,目前“现代汉译文

徐永明教授访谈录

徐永明 韩玉凤 受访人简介: 徐永明,浙江大学人文学院教授、博士生导师。浙江文献集成编纂中心办公室主任,浙江大学经济与文化研究中心主任。浙江大学“大数据+学术地图创新团队”“学术地图发布平台”(amap.zju.edu.cn)“智慧古籍平台”(https://csab.zju.edu.cn)负责人,明代文学学会(筹)副会长、浙江省政协应用智库成员、哈佛大学“中国历代人物传记资料库”(CBDB)专委会委员。先后任哈佛大

细读之初的统计分析

五十岚洋平 / 美国康涅狄格大学英语系 汪 蘅(译)/ 自由译者 五十岚洋平 / 美国康涅狄格大学英语系 汪 蘅(译)/ 自由译者 摘 要:作为两种文本阐释方法,细读与远读之间的关系成为有关数字人文能否适用于文学研究方面讨论的关键点。一般而言,细读被认为是充满个体性的、情感偏见的,而远读往往被归结为客观性的数据分析、并由此而被认为失去了人性的角度。事实上,从文学批评史的角度来看,统计分析在细读诞生之初即发挥了重要的作

现在是去除知识区域划分的时候了吗?

编者按: 数字人文与其所涉及的各个学科(如数据科学、信息科学等)之间的关系问题,一直是本刊关注的一个重点。这个当下的问题与历史密不可分,即大学学科体系在近现代时期的发展演变过程。本文作者克里夫·希斯金教授和威廉·华纳教授长期主持以纽约市为中心、横跨大西洋两岸的Re:Enlightenment学术研究项目。这是一个自2006年开启的、多个学科知名学者参与的、以启蒙运动与当下学科知识发展关系为中心议题的长期学术合作项目。

系列笔谈之四:智能时代古籍OCR技术

北京大学数字人文研究中心 “古籍智能”系列专题 北京大学数字人文研究中心 王军(北京大学信息管理系):OCR技术是古籍数字化技术的核心和基础 OCR技术是古籍数字化技术的核心和基础,现代汉语常用汉字约七八千字,而古籍中所包含的文字最高达8万。由于文字量庞大,异体字众多,字形多变,版式多样,而且年代久远,页面模糊,再加上缺乏充足的训练数据,这使得古籍OCR比一般的OCR任务更具有挑战性。近年来,深度学习技术在这个领域的

提示:本站使用最低限度cookies来确保基础功能实现。 View more
同意
拒绝