《唐语林》中对话网络的可视化和统计分析初探[1]

秦 颖 / 加州州立大学萨克拉门托分校人文与宗教研究系及历史系

摘 要:文章以《唐语林》中的“语”为研究对象,构建对话网络,并对其进行可视化和统计分析。网络图呈现一系列以唐帝王为中心的“文本性时间聚集”,表明《唐语林》中“语”的主要关注对象是君主和少数重臣。节点度分析进一步聚焦了几位身处唐室兴衰转折点的帝王,特别是玄宗及其后的中晚唐君主。这与唐代轶事于安史之乱后开始崛兴的历史现象相契合。点击度分析则彰显了一个有着网络全局影响力的“玄宗因素”,反映出唐中后期的历史轶事对玄宗朝的高度关注。“玄宗因素”在文本传世的前半部分与佚失又重辑的后半部分的网络中都十分显著,其在对话网中的角色则发生了反转,玄宗从发话为主转为听取为主,对应了轶事集后半部分对玄宗形象更偏负面的刻画。

关键词:轶事 网络分析 对话网络 文本性时间聚集 唐玄宗

古代轶事材料正迅速成为中国历史和文学研究的一个热点领域。各项研究从不同面向对轶事材料加以分析和论述,都取得了丰硕的成果。这些研究有的将轶事视为在社会关系网络中传播的文人闲谈与流言蜚语,有的将轶事材料视为从不同视角出发对文化思想史的另类表达,还有的则将其作为承载有关过去的零散记忆的特殊文本空间予以诠释。[2]为了更好地认识轶事小说中对话的特性——亦即这类文本中引以为名的“语”“谈”“话”等用词所彰显的语言交流在轶事书写中的功能和特性——本文使用网络分析方法,以《唐语林》[3]中的直接语言交流为分析对象,进行文本远读(distant reading)。[4]《唐语林》是北宋(960—1127)时期编撰的唐代轶事小说集。其编纂者王谠(约1046—约1106年)[5]从五十本早期的轶事集[6]中摘选了一千一百余条有关唐代历史人物、事件、朝廷机构以及民间风俗的轶闻杂事,并将它们分别归入52个门类之中。王谠将《唐语林》的分类系统建立在《世说新语》分类系统的基础上,采用了《世说新语》36门类中的35个,[7]又在其后添加了17个新的门类。[8]

本文针对《唐语林》中的对话网络进行可视化和量化分析,通过分析对话网络,希望了解这类文本的数字表达特性,也就是文本在被转化为结构化数据的过程中所表现出的特点,同时探索数字人文方法及相关的工具在研究轶事小说类文本方面的优势与劣势。本文提出几个研究问题:轶事小说中对话的数字表达和对话网络有何特征,这些特征与这类文本的特性有何关系?作为一本北宋时期的轶事集,《唐语林》在建构唐代记忆时,选择收录的是什么类型的对话以及哪些人物的话语?对话网络可视化能否向我们揭示仅凭文本细读无法发现的关系和规律?对基于文本的人物互动网络或者对话网络的研究,往往针对整体性较强的文本,因而本文也希望考察这种分析方法对于轶事集这种离散性的文本有何作用。如果把对话网络看作一个虚拟的社会网络,那么社会网络分析的统计性指标对研究这个轶事小说集又有什么启发?

本文关心的另外一个问题则与《唐语林》的版本流传有关。《唐语林》的文本历史相当复杂,曾有多个不同的版本流传。早在12世纪——亦即王谠身后五十年左右——便至少有两个完整的版本(即八卷本和十卷本)和一个不完整的版本(十一卷本)在流传了。[9]13世纪的书目中又记录了新的不同版本。[10]宋代之后,直到明朝《唐语林》完整本佚失之前,目录所记载的多为十卷本或者八卷本。[11]今天所见的《唐语林》主要是依据清代四库馆臣所编刻的武英殿聚珍版。全书的前半部分(即从“德行”到“贤媛”十八个门类)是依据明代嘉靖年间桐城齐之鸾所刻的两卷残本(1523年)编刻,后半部分则是四库馆臣从《永乐大典》(1408年成书)中将其引用的《唐语林》条目一一辑出,再按大约的时间顺序整理而成。[12]清代以来直至今天我们通常所见的《唐语林》便是以这个武英殿本为基础的。[13]因此,本文希望探讨能否通过对《唐语林》中的人物对话关系进行网络分析,进而揭示《唐语林》的前半部分(即传世的部分)和后半部分(即后世重构的部分)在文本特征上是否有显著的不同?如果确实存在显著的不同,那么我们又该如何去理解这个现象呢?

一、对话数据的定义、获取及有向网络图构建

要提取对话数据,首先面临的一个问题是如何定义对话。《唐语林》中包含多种来自唐代的话语,但这些话语并非都是呈现于对话语境之中的。第一类是来自唐代的集体性话语。这包括当时广为流传的一些看法、说法、谚语,以及流行的事物名称、对人物的昵称、别号等。这种集体性话语在《唐语林》中出现时,往往没有特定的对话语境,更没有明确的发话者和听受者,而是用“故言”“语曰”“时人语”“时为语曰”“元和中语”“人曰”“时人以为”“时谓”“时称”“谓之”“时人谓之”“时谓之”“人谓”“时人称”,甚至简单的“称”“呼”“号”“呼为”“号为”“当时号为”“时号”“号曰”等一系列的泛指来提示引用的话语、谚语或者名号。这些集体性的话语,在笔者使用的电子文本中也是用引号标示出来的,但是构建对话网络时,笔者并未将这一类话语算作对话数据。《唐语林》中的第二类话语是来自人物个体的、孤立的语句。在这种情况下,文本虽然表明发话者的身份,但是仅仅孤立地引用此人的一句话、一段对事态人物的评价或吟诵的诗句,却并没有提供说话的背景,没有点明与之对话的个体。这些孤立的话语,也未被计入本项研究的对话数据中。本文的对话网络数据属于《唐语林》中的第三类话语,这些话语有明确的对话对象、对话行为和对话语境。有时候文本中仅仅引述了对话中某一方的话语,有时候文本中明确指出的受话方是“左右”“老父”等无名人士,但是只要对话的行为或语境明确存在、可被读者感知,笔者便将这些话语算作对话数据。

提取对话数据在实际操作上有一定难度。在这方面,计算机自动标注有相当的局限性。轶事小说文本中出现的人物称谓多种多样、缺乏一致性,文中提及的对话人物也存在指代模糊的现象,而且《唐语林》的对话语境中还存在大量仅具备泛指性身份的无名对话者,所以本文最终使用的数据基本是人工提取出来的。

在对话数据提取出来之后,笔者使用Gephi软件(0.9.2版)绘制了对话关系网络图,并对其结构特征加以分析。网络图中的节点代表对话的双方,连接节点的边代表了对话关系。每条边都从说话人指向受话人,比如“玄宗→高力士”这条有向边代表在对话语境中唐玄宗对高力士说了话,而边的权重是两个人物节点间有向话语的次数。

如下文所示,这个对话网络密度低,其巨型分量(Giant Component)的联通性也比较弱,各项统计指标数值均较低。如果将对话数据做成无向网络图,关于节点的各项统计指标会有一定提高,但是网络分析中就无法考虑发话者和听受者的区别。在某些有关对话网络和人物互动网络的研究中,研究者将相关数据作为无向数据处理,进而构建无向网络加以分析,也得到了极富建设性的发现。但在轶事小说中,文本所呈现的对话或者互动,在很多情况下带有很强的偏向性。对话或者互动的双方在轶事小说中被重视的程度和被呈现的程度都有很大的不同。一则轶事中往往有一位或少数几位特别突出的中心人物,而其他人物即使参与对话,也常会被淡化为抽象的个体。比如,《唐语林》常常将中心人物置于与他人互动和对话的场景中,通过记述中心人物的话语和行为来刻画他们的形象,而受话方则常常被抽象为“左右”“侍臣”“所亲”等,有时甚至仅将受话方简单地记录为“谓人曰”中的“人”。更有甚者,文本有时候不会使用任何词语来明确指代抽象的听受者,仅在文意上隐性地示意有这样一个听者存在,从而把发话者的话语安置在一个对话语境中,与没有对话语境的简单引用区别开来。这种抽象泛指的听受者往往是沉默的,文本中极少给出他们的回应。他们在对话网络中的角色和作用,显然不能与发话者相提并论。所以,有向图更适合表述和分析《唐语林》中的对话网络,有助于厘清对话网络中发话者和受话者群体之间的差异,以及这种差异所揭示出来的《唐语林》中“语”的深层含义。

故而,本文通过提取《唐语林》中的对话数据,建构了一个有向对话网络。鉴于这个网络中的巨型分量联通性较弱、节点的统计指标数值普遍较低,笔者认为基于统计结果进行比较分析时,与其就统计数值间的微小差异进行分斤掰两的计较,从大处着眼进行阐释更有意义。下文将首先从整体上对《唐语林》对话网络加以分析解读,然后再对文本前、后两部分中的对话网络进行比较。

二、文本性时间聚集、玄宗因素及《唐语林》中的“语”

与一般的社会网络相比,历史人物生活的时间段往往相距甚远,唐初人物间的对话和唐末人物的对话可能相差近三百年。所以,以《唐语林》中的对话数据为基础构建出来的对话网络,提供的是一个静态的、长跨度的时间累加图。虽然在唐代近三百年的时间中,一个个人物在不同时间点不断出现和消失,但是代表他们的网络节点却是同时共存于这个网络图中的。[14]本文用Gephi对《唐语林》中的对话网络所进行的简单探索,是将它作为一个“文本性的静态网络”来处理,使用Gephi所提供的静态网络分析指标,来解读这个基于文本构建出来的有向加权网络。但是,由于《唐语林》中的对话数据本身具有时代性关联特征,因此这个对话网络的时间跨度不可避免地在可视化过程中被表达出来,呈现为网络图中一系列的节点聚集群之间的空间跨度。

通过对《唐语林》全文本中对话网络的整体性分析,笔者得出两点发现。首先,这本北宋编纂的轶事集中所呈现的唐代话语交流网络,是以帝王和朝臣的对话为中心的。网络中的节点大致按照对话双方的生活时代形成一个个以帝王为中心的结构子群,本文将其称为“文本性时间聚集”(Text-based Temporal Clusters)。其次,某些帝王及其近臣在《唐语林》的话语网络中地位突出。比如太宗、玄宗、宪宗等就比高祖、高宗、中宗等要突出,而玄宗的地位尤其突出。玄宗之后的唐代中后期君主,特别是多少享有中兴之势的几位君主,也在话语网络中占有较突出的地位。通过分析发话者和听受者的出度、入度和各个节点在整个话语网络中的影响力,笔者将进一步揭示这个对话网络中,存在一个全局性的“玄宗因素”,从网络分析统计层面上看,它可称为《唐语林》中“语”的一个显著特色。

《唐语林》全文本的对话数据呈现了一个高度离散的网络图。这个有向网络含有1,089个节点和1,141条有向边。图1给出了这个网络的概观。在这个网络中联通节点数最高的分量——即所谓巨型分量(Giant Component)——只涵盖了不到一半的节点。这个巨型分量之外还存在着大量离散的小型对话结构,因而整体网络的密度很低。

这种网络结构从根本上反映了《唐语林》的文本特性。网络图中的巨型分量是若干个对话团体的组合,但这些对话团体并不代表历史上真实的社会网络,而是一个基于文本的人物互动网络,是《唐语林》这本宋代编写的小说集通过选择性地收录唐代轶事建构起来的。而孤立的小型对话结构——有的是仅有两个节点和一条边的小子群——是由《唐语林》中的一些小故事产生的。这些小子群的节点人物在《唐语林》中往往只有一条轶事,此外就没有在文本的其他地方出现过了。这些离散的、小型子群不足以对分析《唐语林》对话网络中不同人物的重要性产生影响,故而本文后续的网络分析的对象主要是概观图中的巨型分量子图。

将《唐语林》对话网络中孤立的对话小分量过滤掉后,得到的巨型分量含有503个节点(占比46.19%)和700条有向边(占比61.35%)。这个巨型分量的密度虽然比全网密度高,但也只有0.003。巨型分量中的节点平均度(Average Degree)为1.392,平均加权度(Average Weighted Degree)为2.205。由于有向图的话语流中有很多被动的听受者,他们作为孤悬节点,和发话人以外的其他节点没有任何直接联系,所以巨型分量中很多节点不容易形成闭合三元组(closed triplets),因而其平均聚类系数(clustering coefficient)仅为0.018。但是,如果采用边的密度(而非闭合三元组的密度)进行衡量且忽略边的方向,那么巨型分量就会表现出较高的集聚程度,其模块化指数达到0.557,[15]分量中的节点能很好地被划分为一系列模块化社群。这个集聚方式凸显出《唐语林》对话网络中一些地位显著的互动关系和对话群体(见图2)。

图1 《唐语林》静态对话网络概观

使用Gephi内置的胡一凡(Yifan Hu)算法布局。节点大小代表节点的度,颜色标示节点所属的模块化社群。模块化计算采用的分辨率(resolution)为5,模块化(modularity)数值为0.929。计算结果呈现240个模块社群(Modularity Classes),每个社群大小约在2至84个节点的范围内。[16]

图2 巨型分量(Giant Component)子图

组合用Gephi内置的力导向(Force Atlas)、胡一凡(Yifan Hu)和力导向2(Force Atlas2)算法布局。节点大小代表节点中介中心度,颜色标示节点所属的模块社群。模块化计算采用的分辨率为5,模块化数值为0.557。计算结果呈现10个模块社群(Modularity Classes),每个社群大小约在10至95个节点的范围内。[17]

a.

b.

c.

图3 巨型分量(Giant Component)子图模块化社群细节示例a.b.c.

这些模块化的社群较好地模拟了文本中的对话团体。从根本上来讲,书写活动和文本记录使本来转瞬即逝的话语得以旷日持久地存在。那么由记载下来的话语形成的网络,就像经过一个文本性的时间积累,仿佛时间的流逝未能带走往昔的话语,反而促成了文本中对话网络的延伸,从而形成一个长跨距累时网络图。在这个“文本性的静态网络”中,模块化子群集结的模式,正对应了这样的累时效果,展现出一个大体类似时间轴的顺序。也就是不考虑时间维度,将动态时间产生的网络图压平,以空间上的铺展取代时间上的纵深,将本来是动态网络的时间切片平摊开成为整体网络中的一个个虚拟社群。每个小社群中的节点大致活跃于同一个历史时期,因此每个社群也就直观地和唐代历史的各个时间段对应起来,在此称它们为“文本性时间聚集”,以区别于真实存在于唐朝各个历史时期的社群。图3通过三个例子,展示了巨型分量子图中几个模块化社群的细节。

观察图2中显著的节点和图3中的局部细节,可以发现这些根据网络可视化和统计分析得出的模块化子群,展示了较为合理的计算结果和视觉效果,十分直观地展现出《唐语林》中以唐朝帝王和重要大臣为中心的“文本性时间聚集”。图中每个显著的聚集群大致呈现了一个帝王的统治时代,将唐代人物对话网络的时间跨度可视化,呈现为一系列按时代聚集的节点群组成的空间序列。显著的时间聚集群依次以太宗、高宗、武则天、玄宗、代宗、德宗、宪宗、文宗、宣宗为中心节点,其中又以玄宗朝以及围绕其后几个帝王的“文本性时间聚集群”最为显著。

最主要的“文本性时间聚集群”围绕唐代后期君臣的特点,契合了唐代笔记小说于安史之乱之后开始崛兴的历史现象。这一现象与唐朝中后期的两个变化有很大关系,其一是关于皇室和朝廷的轶事传闻广为流行,其二则是士人受“史官文化”影响访集并私撰轶事集,以弥补官方修史机制的衰退与丧乱中史料典籍受损的缺憾。[18]这也说明北宋时期编撰的《唐语林》在以轶事建构对唐代的历史记忆时,其材料来源与选择直观体现了唐代笔记小说发展的历史因素。

从对话网络分析的角度看,《唐语林》中“语”的主要关注对象,即为每个时间聚集群的中心节点,此外,还有在这个离散的网络中将代表不同时期的“文本性时间聚集群”连接成空间序列的那些节点(如图2所示)。从图2可以直观地看到,除了帝王彼此之间的对话将以他们自己为中心的时间聚集群连接在一起之外,一些效力于两朝、甚至数朝帝王的重臣,也在以帝王为中心的时间聚集群之间起到了连接作用,其中个别人物甚至成为小的子群的中心。比如宋璟节点连接了武则天、中宗和玄宗的时间聚集群;李泌节点连接了以代宗、德宗为中心的时间聚集;元载、颜真卿、卢杞在代宗、德宗聚集群之间形成连接链;而裴度、李吉甫、李德裕、白敏中在宪宗、文宗、宣宗三个主要的时间聚集群之间起到连接作用。

表1 巨型分量中中介中心度排名前二十位的节点

表1呈现了巨型分量中中介中心度(betweenness centrality)[19]排名前二十位的节点人物。他们代表了对话网中对连通各个聚集群体起到最显著作用的一些节点。

中介中心度衡量的是一个节点在网络中控制话语流动的能力,亦即它在连通时间聚集群方面的全局性重要程度。虽然《唐语林》文本是由总体上时间跨度很大的一个个相对独立的轶事故事组成,中介中心度这个全局性统计指标的计算,与其在一个整体性强的长篇小说对话网络中的计算是一样的,都要假设信息交流可以超越文本中单个对话所处的直接互动关系的界限,并沿着网络链接的渠道延伸。

表1包含了巨型分量中最为显著的时间聚集群的中心人物,即玄宗及其后的几位帝王。其中,德宗、宪宗的排名更是居于玄宗之上,成为网络中全局重要性最高、最具聚集连通能力的节点。除帝王外,特别重要的还有两朝甚至三朝重臣,如宋璟、裴度、李泌、李德裕。他们活跃在至少两位帝王的朝堂之上,也成为这个对话网中能够全局性掌控和联通虚拟话语流的重要节点。这些节点之所以具有极高的中介中心度,是因为他们彼此之间有链式对话边相连,使那些围绕着他们的时间聚集群得以连接起来。而聚集群中与他们对话的其他人物之间互联性低,很少拥有跨聚集的对话边,仅呈现为聚集中簇拥中心节点的环绕节点,从而更在直观上凸显了高中介中心度的节点人物。这也是对话网络的平均聚类系数数值很低的原因所在。

上述对话网络可视化的初步分析结果,从网络整体结构、集群层面(cluster-or group-level)和集群连通性的角度,揭示了《唐语林》对话网的基本特征。对话网络的主体是一个由以帝王和重臣为中心的一系列“文本性时间聚集群”连成的跨时代的巨型分量。从对话网络分析的角度看,《唐语林》中“语”的主要关注对象是帝王和重臣,尤其是跨越不同帝王统治时代的重臣和玄宗及其后的唐代君主。下一节将从节点层面进行分析(node-level analysis),以探讨对话网中的重要人物及其特征,并进一步分析《唐语林》中“语”的更具体的含义。

三、具有局部重要性的节点:节点度分析

在以轶事小说为背景的对话网络中,可以用出度、入度、HITS等几个统计指标,从不同角度来分析节点人物的重要性。本节从局部重要性的视角出发,关注网络中每个人的对话性质及其对话活动的多寡,采用出度和入度两个指标加以衡量。出度高的节点即文本中话语发声次数多的人物,他们自然是故事刻画的重点人物;而入度高的节点则是受话较多的人物,他们有可能是说话者需要影响的重要人物(比如君王),也有可能是前面所提及的抽象化的被动受话者(比如“左右”和对话语境中没有明确指出的“听者”)。本文在数据建设过程中,使用编号对反复出现的抽象化受话者加以区分(如“听者_TYL264”“听者_TYL566”),这样就避免了在数据分析中出现笼统的、高入度、普适性受话节点,所以网络中入度高的受话节点基本上是非抽象化的人物,在对话语境中具有一定的重要性。结合下一节中使用点击度(HITS)指标对节点的全局重要性进行的分析,笔者从另一个角度发现了数位帝王与朝臣在对话网中的显著地位,发现《唐语林》中“语”的主要作用在于影响帝王,而其中“玄宗因素”可谓其核心。

Gephi计算出的加权节点度——包括加权入度和加权出度——在统计分布上符合帕累托法则,即网络中大部分节点的度数相当低。这反映了文本中很多人物仅出现于一两个轶事中的情况。因此关于节点重要性的分析,下文将聚焦度数排名前列的一小部分节点。表2给出了加权度排名最高的前二十位人物。

表2 巨型分量节点加权度数排名前二十位人物

绿色标示李姓帝王;红色标示女帝;黄色标示来自《刘公嘉话录》的大权重对话流中的人物节点;褐色标示李德裕,说明以他为中心的对话在《唐语林》对话网络中具有显著地位;紫色标示《虬须客传》中的对话人物。

这个排名很好地体现了影响对话网络中节点度的几个重要因素:

首先,帝王是话语网络中的绝对主要人物。表2中用绿色标出唐朝李姓帝王,用红色标示女帝武则天。加权度排名前二十中有八位帝王,其中五位排名前十。如果分开看,则受话度(入度)排名前二十中有九位帝王,发话度(出度)排名中有八位帝王。除了女帝武则天外,排名表上的李姓帝王包括太平盛世的太宗和玄宗、安禄山叛乱之后达成元和中兴的宪宗,以及有复兴之志却颇受时局困扰和后人争议的德宗、宣宗和文宗。帝王集中出现于节点度排名表前十位,并且出度、入度都很高,这说明他们是这个对话网络的中心,也说明帝王与他人的对话是《唐语林》中“语”的重点。而表中排名高的几位李姓帝王均为身处唐室兴衰起伏转折点的人物,这一结果从统计层面上反映了《唐语林》中的“语”集中在唐帝国兴败转变之际。[20]其中,玄宗以相当优势占据三个排名的榜首,是对话网络中最显著的人物,也是与他人对话最多的人物。此外,以李德裕为代表的名臣的话语行为也是《唐语林》对话网络中一个重要构成,仅次于帝王的话语活动。表2显示大臣的对话行为在节点度排名表的十名之后变得显著。三种加权度排名中,前十位多为帝王,而十一到二十名之间开始出现裴度、杜悰、韦澳、令狐绹、宋璟、张说、李绅等大臣。

其次,从统计角度看,网络中话语的注意力也集中在应对与影响帝王。受话度排名前二十位中有九位帝王,是三种节点度排名中帝王占比最高的,而且其中七位(包括武则天)排名前十。帝王不仅出度高,而且入度也高,表明他们既是网络中的主要发话人,也是其他人物应对和影响的主要对象。观察这个对话网络的细节,就可以发现向帝王说话的包括朝臣、宦官、侍者、后妃、俳优、卫兵、僧侣、道士,甚至平民老父等。通过文本细读可以进一步发现,《唐语林》中很多轶事在对话后强调帝王的肯定态度,用“善之”“嘉之”“纳其言”“纳之”“从之”“从其言”等措辞作结语,例如“言语”一门中记有一例:

高宗朝,晋州地震,雄雄有声,经旬不止。高宗以问张行成,行成对曰:“陛下本封于晋,今晋州地震,不有征应,岂使然哉!夫地,阴也,宜安静而乃屡动。自古祸生宫掖,衅起宗亲者,非一朝一夕,或恐诸王、公主谒见频烦,乘间伺隙;复恐女谒用事,臣下阴谋。陛下宜深思虑,兼修德,以杜未萌。”高宗深纳之。[21]

除此之外,《唐语林》有许多轶事虽然未用明确措辞表示,但在文意中体现了帝王的正面反应和所受的影响。这一特征也反映出编纂轶事的文人士大夫对帝王聆听和纳言的期望。[22]

女帝武则天是表2中最突兀、最有趣的节点。排名前十的其他节点人物往往在总度数、入度和出度各项排名中同时高居前列,或者作为同一对话关系的双方在出度和入度排名上互相呼应(比如“刘禹锡”和“韦绚等人”这两个节点就是《刘公嘉话录》中一再出现的对话双方,它们分别排在加权出度榜的第三和加权入度榜的第二)。然而,武则天只有加权入度进入前十(排名第7)。她在加权出度榜只排19,总度数排名位列12。与几位男性帝王相比,这位女帝的发话度和受话度之间的差别十分显著。这一现象显示了《唐语林》故事将女帝刻画为一个相对而言更适合听受的人物——她在对话网中的发话量远不如那些向她说话的男性帝王及大臣们显著。结合文本内容中对武则天的刻画可以更好地说明这一点。兹举一例:

则天以武承嗣为左丞相。李昭德奏曰:“不知陛下委承嗣重权,何也?”则天曰:“我子侄,委以心腹耳。”昭德曰:“若以姑侄之亲,何如父子?何如母子?”则天曰:“不如也。”昭德曰:“父子、母子尚有逼夺,何诸姑所能容?使其有便可乘,宝位其能安乎?且陛下之子,受何福庆,而委重权于侄手?事之去矣!”则天惧曰:“我未思也。”即日罢承嗣政事。[23]

这个小故事中武则天和李昭德的说话次数相等,但对答间作为臣子的李昭德言辞尤为咄咄逼人,三个对话回合由一句一问,到一句两问,到一句三问继而以重语作结。其言语之强势,在大臣与李姓帝王对话中难有其匹。而女帝显然处于被动的地位,从逻辑到推理均被她的大臣引导,最后在情绪和决策两个层面均被说服,彻底采取了“臣服”的态度。这个故事的对话中李昭德和武则天的出度、入度都是3,从数据上看没有差异。而故事对武则天弱势的强烈表达,只能通过文本细读发现。如果这个例子可以用来彰显《唐语林》对女帝的态度,下面两个例子则可以彰显这个态度在数据上的体现:

张易之、昌宗贵宠用事,有潜相者言其当王,险薄者多附会之。长安中,右卫西街有榜云:“易之兄弟、长孙汲、裴安立等谋反。”宋璟时为御史中丞,奏请穷理其状。则天曰:“易之已有奏闻,不可加罪。”璟曰:“易之为飞书所逼,穷而自陈。且谋反大逆,法无容免,请勒就台勘当,以明国法。易之等久蒙驱使,分外承恩,臣言发祸从,即入鼎镬,然义激于心,虽死不恨。”则天不悦。内史杨再思遽宣王命,左拾遗李邕历阶而进,曰:“宋璟所争,事为国家社稷,望陛下可其所奏。”则天意始解,乃传命,令易之就狱推问。斯须,特敕原之,仍遣易之、昌宗就璟辞谢。……[24]

此处武则天被两位朝臣劝谏,文中只引用了一句她的话,女帝的其他反应均为约略的情绪描述,且女帝最后亦被说服。而下面的一例中,武则天完全是无声的存在,全文的重点在大臣宋璟的奏言:

宋璟。则天朝,以频论得失,不能容,而惮其公正,乃止敕璟往扬州推按。奏曰:“臣以不才,叨居宪府,按州县乃监察御史事耳,今非意差臣,不识其所谓,请不奉制。”无何,复令按幽州都督屈突仲翔。璟复奏曰:“御史中丞,非军国大事不当出。且仲翔所犯赃污耳,今高品有侍御史,卑品有监察御史,今敕臣,恐陛下有危臣之意,请不奉制。”月余,优诏令副李峤使蜀。峤喜,召璟曰:“叨奉渥恩,与公同谢。”璟曰:“恩制示礼数,不以礼遣璟,璟不当行,谨不谢。”乃上言曰:“以臣副峤,何也?恐乖朝廷故事,请不奉制。”易之等冀璟出使,当别以事诛之。既不果,伺璟家有婚礼,将刺杀之。有密以告者,璟乘车舍于他所,乃免。易之寻伏诛。[25]

故事的重点在于刻画宋璟。然而,在陪衬角色李峤都有一句话被引用的情况下,武则天在全篇叙述中却是没有一点声音的。除了与李峤的一轮对话外,宋璟被引用的言语主要是与武则天的奏对,他的三句话以三个“请不奉制”终结,十分强硬地反对女帝的决策与任命。这个故事甚至省略了对女帝反应的约略描述。对女帝的这种刻画也在数据上反映出来,在这组对话中女帝听受度远大于她的发话度。

虽然大臣劝谏李姓帝王的故事中,也强调说服效果,并存在对话双方话语引用上的差别对待,但与这类故事相比,武则天的故事中,大臣们说服和拒绝的言辞明显更加强势。而上述节点度分析已显示,作为女帝,其发话度和受话度之间的差距远比几个主要男性帝王的情况更加戏剧化,她的加权出度排名低于加权入度排名12位之多。这充分显示了《唐语林》所选的轶事中,女帝在文本刻画和引用话语统计这两个层面上都被呈现为——或者被期望是——一个被动的听受型人物。这一特点是唐代轶事小说中同一特点的延续,抑或这本宋代的集子在选录唐代轶事时有所偏重,将是笔者下一步研究中的一个关注点。无论如何,这一刻画符合唐朝后期一直延续到宋代的那种男性士大夫对女帝武则天的谴责性态度。这些关于武则天的轶事故事从更戏剧化的角度,印证了本文的论点,即《唐语林》对话网络以帝王为绝对中心,体现了其书名中“语”的一个重要关注点在于应对与影响帝王。

再者,表2也表明,影响节点局部重要性(节点度)的因素还包括《唐语林》文本材料的来源、含某一人物对话的轶事的数量、轶事故事的篇幅长短,以及故事中对话的数量。高加权出度的刘禹锡和高加权入度的韦绚等人这两个节点构成了一个权重相当大的、稳定的有向对话流(刘禹锡→韦绚等人),这是因为在《唐语林》对话网络中,引自《刘公嘉话录》的轶事含有大量以刘禹锡为发话者的对话语境,给刘禹锡这个节点贡献了显著的发话权重。另外,《唐语林》也采用了数量颇多的以李德裕为中心的轶事,特别是来自李德裕幕府记事的《戎幕闲谈》中的故事。这显然在很大程度上,导致了李德裕在节点度排名上普遍位居前列,跻身唐代踞于兴衰转折点的重要帝王之列。从轶事材料选取对对话网络的影响上看,表2还显示了与度数有关的节点重要性指标也受到轶事故事的篇幅长短及其所含的对话数量的显著影响。比如李靖和虬须客在度数排名中进入前十,主要是由于《虬须客传》这一篇明显比《唐语林》中大多数轶事的篇幅长很多,而且其中虬须客和李靖都有大量的对话行为。

四、具有全局重要性的节点:点击度分析

以上有关节点度的分析是基于节点自身在网络中的局部特征,因而很容易通过分析这些节点人物在《唐语林》文本中呈现出来的特性加以解读。但如果我们把对话看作一种信息流动,把对话网看作虚拟的信息流动渠道网,即假设话语可沿网络中的有向连接,进行跨越文本故事边界的流通,那么我们也可以尝试基于每个节点在网络中的全局特征对其重要性加以综合分析。

在这种假设下,一个节点的重要性和与之对话的其他人物的重要性有关,且这种相关带有指向性。那么,这就和互联网中网页之间的超链接情况相似,故而可以用点击度(HITS:Hyperlink-Induced Topic Search)来分析网络节点的全局性地位,考察节点在虚拟信息流动中基于网络全局话语流指向和邻接节点重要性而获得的综合性价值和影响。表3以巨型分量为分析范围,列出了点击度排名前十的节点。

点击度本来是一个用来衡量互联网中的网页重要性的指标。[26]虽然它也是以入度与出度为根据来计算的,但是它与衡量局部重要性的加权节点度不同,它是综合全局性网络特征计算节点重要性的。因此,点击度排名的计算结果也与加权节点度及不加权节点度的排名结果明显不同。它提供了一个与加权节点度互补的分析角度,基于对话网络虚拟流通性的假设,从全局层面对节点的重要性加以观察。

点击度分析采用迭代法为每个节点计算两个数值,即权威度(Authority)和枢纽度(Hub)。一个节点(网页)的权威度是通过对指向该节点的所有其他节点的枢纽度进行加总而得出的,而一个节点的枢纽度则是通过对该节点所指向的所有其他节点的权威度进行加总而得到的。在互联网的语境下,权威度反映了一个节点(网页)的价值。指向这个网页的其他网页数量越多、指向这个网页的其他网页的导流能力(以枢纽度衡量)越高,该网页的价值就越大,其权威度数值也就越高。将这个概念应用到对话网络中,就意味着权威度高的人物是话语信息流的主要流向对象,一般来说也是这个网络中导流能力强的发话者们最常寻求的听众。同样,在互联网的语境下,枢纽度反映了一个节点(网页)的导流能力。一个网页指向的高权威度网页越多,那么它的枢纽度也就越高。用在对话网络中,如果一个人物可以将话语信息流引向众多被高度寻求的听众(权威度较高的节点),那么它就会具有较高的枢纽度。也就是说,对话网络中,一个人物节点的权威度既与自己的入度有关,也与向它说话的人物节点的枢纽度有关;而一个人物节点的枢纽度既与自己的出度有关,也与听受自己说话的人物节点的权威度有关。两个统计指标的数值会互相影响,如果一个节点人物具有较高的枢纽度,那么他所指向的听受者将因此获得更高的权威度;反过来,如果一个节点人物具有较高的权威度,这也将提升对他说话的节点人物的枢纽度。

表3 巨型分量中点击度排名前十的节点人物

表4 局部重要性与全局重要性差异显著的节点排位比较

观察表3列出的点击度排名,和表2中节点加权度排名前十位人物相对照,可以发现一些显著的变化。首先是高力士权威度排名第1,在所有人之上,而在各种节点度排名中一向居于首位的玄宗并不在权威度排名前十以内,而是全网枢纽度最高的节点。要注意的是,这里的权威度、枢纽度和人物在历史上的社会身份(帝王或宦官)无关。高权威度单纯是因为许多节点的话语最终都可以虚拟性地流向这个节点,导致他被凸显为对话网中的一个高值流向点,似乎是一个被高度寻求的有价值的听受对象。

另外,如前所述,在加权节点度排名中,前十位大部分被帝王占据,特别是身处唐室兴衰起伏转折点的帝王。这体现了这些节点在对话网络中的局部重要性,并能直观地与文本故事对这些人物的呈现相印证。但在点击度排名前十位(表3)中,除了肃宗在权威度和枢纽度排名中高居第二、玄宗居枢纽度排名第一位、代宗居权威度排名第三位之外,并不见其他帝王。而高力士、肃宗、代宗在加权度排名(表2)中都不能称为高位节点。针对这四个体现显著差别的节点,表4给出了它们点击度排位与加权节点度排位的比较。

再者,点击度排名前十(表3)中其余人物则更是局部重要性很低的节点(各种节点度排名均在30之外),甚至有的明显只出现在一个轶事故事中,加权和无加权节点度排名都特别低的抽象人物。这些显著的差异表明点击度分析,与节点局部重要性的分析不同,其结果反映了相当强的全局性影响因素。

那么是什么因素使局部重要性排名较低的高力士、肃宗、代宗在全局性的节点重要性分析中高居权威度之首呢?是什么因素使一些自身局部重要性极低的节点在这个全局性观察中变得十分显著了呢?

首先,高力士节点的高权威度说明对话网中向他说话的有枢纽度很高的人物。而他的枢纽度相对较低,则说明由他引导话语流能达到的高权威节点并不多。高力士的入度、出度、加权入度和加权出度都不高。观察对话网发现,仅有三个人物向他发话,即玄宗、肃宗、僧无畏。直观上,从局部看,玄宗在所有节点中具有压倒性的高出度,对高力士的权威度产生直接影响,而肃宗出度较低,僧无畏更低。所以,正是玄宗的高枢纽度对高力士的高权威度起到了主要贡献作用,并与之相互呼应。而高力士节点的高权威度也同时提升了肃宗、僧无畏的枢纽度,使其枢纽度仅次于玄宗。但是,高力士在网络中仅有玄宗一个受话节点。因而,玄宗的权威度排名相当低(38位),说明高力士以及其他向玄宗说话的人物节点的枢纽度都不高。故而,虽然高力士在对话网络中接受到的话语信息最丰富(权威度最高),堪称信息之渊薮,但是玄宗的全局性影响力绝对比他大,话语信息导流能力最强(枢纽度最高)。

其次,权威度排名前十位的人物,都是对话网中听受玄宗话语的节点。事实上,即便就表3没有列出的其他节点看,由出度、入度都特别高的玄宗直接发话输入话语流的听受节点,也都有高的权威度。这说明玄宗的枢纽度之高,在网络中影响力之大,足以使权威度排名高位完全被他的受话者占有。肃宗节点在权威度和枢纽度排名均高居第二的现象,是由他在对话网中直接受话于玄宗并向高力士发话的活动特点造成的。肃宗的权威度受益于玄宗的高枢纽度,他的枢纽度则受益于高力士的高权威度,故而呈现出一个点击度指标双高的综合结果。不过,肃宗也是向玄宗发话的节点之一,他的高枢纽度排名却未能对玄宗的权威度有显著贡献。

故而,以点击度为基础进行的节点重要性分析,最终指向节点综合影响力中一个十分显著的主导因素,就是“玄宗因素”。玄宗的加权度、加权入度与加权出度均属最高,说明从节点的局部重要性看,他是对话网络中最主要的发话者和听受者。点击度指标将目光转向每个节点的全局重要性,综合性地表达了节点在整个对话网络中的全局影响力。本节的点击度分析表明,“玄宗因素”不仅具有局部重要性,更是一个全局性因素。

事实上,晚唐历史笔记小说的编撰者们的确对玄宗朝的轶事情有独钟。柯睿(Paul W. Kroll)指出,对于9世纪的文人来说,玄宗朝与他们所处的时代截然不同。它处于安史之乱这个历史分水岭的另一面,虽说在时间上并不遥远,但在心理距离上已经恍如隔世。[27]对这些轶事性的“杂史”或“潜史”(unofficial or submerged histories)的记录,整体上反映了9世纪文人对玄宗朝的回望视角。自豪与怀念,惋惜与批评,这个带着复杂感情的视角对后来的时代影响甚大,以至于在很大程度上支配了后世对玄宗及其时代的解读。[28]唐朝后期有很多笔记小说通过轶事故事来着重刻画玄宗时期的历史与文化记忆。更有甚者,一些笔记小说集,如《松窗杂录》,明面上以追忆往昔、闲话朝堂为目的,实则含蓄地对唐朝一系列君主进行隐晦的政治批评,并把这些批评的重点以及晚唐诸多问题的历史根源追溯到玄宗朝。[29]

观察唐代轶事小说的来源,特别是关于玄宗时期的轶事来源,就可以发现高力士作为玄宗的近侍和玄宗话语的直接听受者,的确拥有第一手信息,是价值甚高的权威人物。李德裕编制的《次柳氏旧闻》记载了史臣柳芳从高力士处得闻玄宗时宫禁中事,并有所问答,编成《问高力士》一书。书虽亡失,由于李德裕之父李吉甫与柳芳之子柳冕在贞元初同为尚书郎,之后谪官同道东出,李吉甫从柳冕处听得高力士所说,后又常向李德裕言及这些旧事,故而李德裕将所闻所记编成《次柳氏旧闻》进献给文宗。[30]这一广为引用的记载见证了高力士在与玄宗朝有关的轶事小说来源方面的权威地位。唐朝后期对玄宗时期的广泛兴趣,也导致了高力士作为信息来源,受到笔记编撰者的高度关注。

在本文的《唐语林》对话网络中,玄宗节点具有压倒性的高出度和高入度,而高力士则拥有全网络最高的权威度,这些都从统计角度反映了轶事故事来源与流传情况的重要特点。

而令人惊讶的是,唐朝中后期对玄宗朝的高度关注,在北宋笔记《唐语林》中仍旧卓然可见。仅仅通过对文本中一千一百多个轶事的细读,是很难发现这个“玄宗因素”的。

文本细读往往沉溺于单个故事的细节和关注点,而对整个轶事集对话网络进行统计分析,却可以从“语”的角度揭示《唐语林》中这个处于支配地位的因素。虽然全局性指标很难与文本细读直观地对应起来,但它从统计计算的角度,展示了玄宗节点的影响力大到可以覆盖整个对话网络。至于《唐语林》中的“玄宗因素”在多大程度上继承了中晚唐轶事材料中对玄宗时期的关注,又在多大程度上体现北宋笔记编撰者选材时的主观选择,尚待笔者在未来的研究中进一步探讨。[31]

五、《唐语林》前后两部分文本的对话网络比较与“玄宗因素”的反转

如前所述,《唐语林》文本可以分为传世的前半部分与佚失后又重辑的后半部分。从总体上看,根据这两部分分别建构的对话网络图,没有显著的差别。与依据《唐语林》全文建构出的网络图相比,它们各自的节点数量、对话数量、边的权重都降低了,其结构也明显变得更加离散。这两个网络中不存在显而易见的单一巨型分量,而是由数个规模类似的较大分量组成。

对前、后两部分文本的对话网络图按照同样的参数进行过滤(取分量节点数大于等于8),得到的弱联通性分量(下文权且称为“大分量”)数目基本一致,使用Gephi内置的模块化算法得到模块化社群数目也大体一致。图4、图5分别给出前、后两部分文本的对话网络图,从直观上看,它们与前文给出的全文本网络大致类似。

图4 《唐语林》前半部分对话网络概观

使用Gephi内置的力导向算法布局。图4中节点大小代表节点的加权度,颜色标示节点所属的模块社群。计算采用的分辨率为5,模块化数值为0.938,共含159个模块化社群。

图5 《唐语林》后半部分对话网络概观

使用Gephi内置的力导向算法布局。图5中节点大小代表节点的加权度,颜色标示节点所属的模块化社群。计算采用的分辨率为5,模块化数值为0.942,共含143个模块化社群。

表5 《唐语林》前、后部分文本的对话网络统计指标(使用Gephi计算得出)

从各项统计指标(表5)来看,文本后半部分的对话网络总体上显得更离散,节点数大于等于8的大分量所占全图的节点百分比和边数百分比都比文本前半部分节点数大于等于8的大分量更低,平均无加权度和平均加权度也比前半部分略低。但是就节点数大于等于8的大分量数目而言,两部分都含有6个这样的大分量。如果只考虑这些大分量子图,可以发现后半部分大分量子图的平均无加权度和平均加权度却比前半部分大分量子图要高了,这表明后半部分文本的大分量子图中的对话更加集中在一个相对较小的节点集合中。

表6 文本前半部分对话网络中三种加权节点度排名前十位比较

对前、后两部分对话网络的加权节点度的分析,显示了与全文本网络加权节点度排名相似的规律,即前、后两部分文本中的对话活动仍旧以帝王为绝对中心,其次是朝廷重臣,并同时体现出文本取材来源的影响。

但是如果对网络全图和它所含的大分量子图进行比较,则可以看出前、后两部分对话的一些不同特点。表6和表7分别给出两部分文本的大分量子图中三种节点度排名的前十位。

表7 文本后半部分对话网络中三种加权节点度排名前十位比较

前半部分前十位排名中,与表2全文本网络相比,多了韦澳、高祖、令狐绹等节点,反映出他们的对话活动在整个网络中的显著性提高了,而李德裕节点的排名降到十名以外。由于《虬须客传》属于文本的后半部分,李靖、虬须客因而在后半部分网络的节点加权度排名中占据了相当高的位置,同时李德裕的对话活动在文本后半部分的网络中也有显著的地位。

网络全图和大分量子图的结构差异在前、后两部分的对话网络中有所不同,这体现在加权度排名的变化规律上。比较文本前半部分的对话网络全图和它所含的大分量子图,可以发现加权度排名前13位的节点完全相同,加权入度排名前8位也完全相同(见表6中绿色横线以上),全图和大分量子图的排名差异在这之后才出现(体现在表6中标为红色的“高祖”节点)。[32]与此不同的是,加权出度排名前15位完全相同,全图和大分量子图的差异从第16位才显现出来。也就是说大分量子图和全图的差异更多地体现在加权入度大的节点上,而在加权出度大的节点排名上两者间的差异相对较小。而文本后半部分的网络中,全图和大分量子图的差异在加权出度和加权入度排名上呈现了相反的趋势。比较文本后半部分的网络全图和它所含的大分量子图,可以发现加权度排名前8位的节点完全相同,加权入度排名前6位相同,加权出度排名前4位相同,全图和大分量子图的排名差异在表7中绿色横线以下才出现(体现在标为红色的“盗僧”“韦生”节点)。[33]这三个数字都明显小于文本前半部分的三个对应指标。换言之,网络全图和大分量子图的差异,在文本后半部分中更加明显,影响到了加权出、入度排名表上位置更加靠前的节点。

这个明显的差别表明,后半部分文本的对话网络全图中,节点数小于8的孤立对话小型分量中的节点更早地出现在三种节点度排名表的高位。即网络大分量和小分量中节点的度数更趋向均衡,而在前半部分文本中,小分量中的节点度数往往更低一些。这是因为《唐语林》后半部分收录了一些对话量大的相对独立的轶事故事,它们的人物与其他轶事中的人物没有重合或对话互动,比如侠盗故事中的盗僧与韦生,[34]从而形成节点度数较高的孤立小分量。此外,网络全图和大分量子图的差异在文本后半的网络中更多地体现在加权出度排名上,而在前半部分网络中则更多体现在加权入度排名上。这一截然相反的现象仍有待进一步考察,但它也许从一个小的侧面体现了后半部分小分量中节点人物说话量(出度)比前半部分小分量中的人物多。也就是说,文本后半的网络中话语在大小分量间的分布比较平衡,而在前半部分文本中,话语主要集中在大分量中的节点人物上。或者说,前半部分文本中主要发声者相互之间有更多的关联,而后半部分文本中,发声者节点之间关联程度比较低。

那么,在不同的集群之间起连接作用的节点,以及在整个网络话语流中具有全局重要性的节点,在前后部分文本中有什么不同呢?表8列出了文本前、后两部分网络大分量子图中的节点的中介中心度排名前十位,以便比较。

在不同对话集群间起中介作用的节点仍旧是以帝王和重臣为主。结合文本细读可以发现,前半部分网络中,中介中心度较高的裴度、宋璟等往往具有正面的贤臣形象,而文本后半的网络中,中介中心度较高的白敏中和元载在他们的对话语境中往往呈现负面形象。对于轶事内容和人物形象的分析将是对话网络之外的另一个课题,本文仅做初步探讨。粗略看来,尽管文本后半部分因为经过佚失重辑,轶事条文已经无法被归入原定的门类,仍旧可以从中看出一些故事原属负面涵义的门类,如“谀佞”“僭乱”“残忍”。这与具有负面形象的大臣在后半部分文本中对话活动增加、节点中介中心度提高,显然有关。

表8 全文本及文本前、后两部分对话网络大分量子图中的中介中心度排名前十位的节点

另一个显著的变化是宪宗节点。前半部分对话网络大分量子图以及全文本对话网络中,宪宗的中介中心度排名都居于第1、2位,而在后半部分大分量子图的中介中心度排名上骤降至300名左右,是各节点中变化最大的。究其原因,文本前半部分中,与宪宗对话的节点人物包括德宗、李吉甫、赵宗儒、杜黄裳、裴度、崔群、权德舆、郑余庆、陆质、柳公绰等帝王重臣,以及抽象的对话对象“内臣”“左右”“宰相”。对话的语境主要为裁决政事、品评人物、节俭用度、读书等,话语流往往带有大于1的加权值。[35]而在文本后半部分,宪宗仅仅出现在三个对话中,出度仅为1、入度仅为4,对话对象中除了李吉甫为朝臣,其余两位一是推倒石碑的“老卒”,一是品评宝物价值的“市人”。[36]这个比较极端的例子,也从侧面反映了后半部分文本中说话者的群体更广,包含了更多节点度低、只出现了一两次的人物,整体上看话语在节点人物中的分布相对不那么集中。

使用点击度可以从结合整个网络的话语流指向性评估每个节点的全局重要性。点击度分析揭示了前、后两部分文本间另一个比较极端的变化。图6给出前、后两部分对话网的大分量子图各节点权威度和枢纽度的分布情况。

图6a 《唐语林》文本前半部分大分量子图中各节点权威度和枢纽度的分布情况

图6b 《唐语林》文本后半部分大分量子图中各节点权威度和枢纽度的分布情况

表9 玄宗节点在文本前、后两部分的数据比较

两部分文本的对话网络中,点击度分布有一些共同特征,即相当数量的节点权威度和枢纽度为零,只有少量节点的权威度和枢纽度略大于零。两部分对话网络间最显著的不同体现在权威度和枢纽度数值接近1的节点的分布特征上。前半部文本的网络中有一个节点的枢纽度接近1,而后半文本对话网络中正好相反,有一个节点的权威度接近1。查看数据,发现这个节点在文本前、后部分都是玄宗节点,表明对话网络中的“玄宗因素”在《唐语林》前、后两部分间发生了反转性的变化。表9比较了玄宗节点在文本前、后两部分的统计指标和对话的对象。

引起反转变化的直接原因是玄宗在对话中的角色发生了转变。从表9看,前半部分文本中,玄宗节点不但出度大于入度,而且听受玄宗说话的人数明显大于向玄宗说话的人数。而后半部分正好相反,文本中他的入度大于出度,向玄宗说话的人数略大于听玄宗说话的人数。听受或者说话的节点人物的多寡,以及这些人物节点自身的出入度,及与之相连的其他人物节点的出入度都会对玄宗的权威度和枢纽度产生影响。但是这个差别能造成如此戏剧性的反转,以至于使玄宗节点的枢纽度和权威度接近于1,这说明从全局重要性来看,玄宗的对话活动不论是在前半部还是后半部文本中,都占有优势地位,也就是说“玄宗因素”在文本两部分中都十分显著。请见表10排名情况。

表10 全文本及文本前、后两部分大分量子图中权威度、枢纽度排名前十位的节点

表10最显著的特点有两个,其一是上述玄宗节点的权威度和枢纽度排名在两部分文本中的反转现象。表中只列了排名前十位,实际上有趣的是,前半部文本网络中玄宗枢纽度排名第1,而权威度排名27,而在他之上权威度排名最高的二十六个节点,都是可以直接从玄宗节点引入话语流的节点,结合表9可以看出,这二十六个节点正是玄宗话语的直接听受者。这个规律也表现在全文本网络中,玄宗节点在全文本枢纽度排名也是第1,而权威度排38,在他之上的37位对话网络权威度最高的节点,全部是直接听受玄宗话语的人物。也就是说,全文本网络中玄宗的枢纽度和权威度主要受制于文本前半部分的内容。虽然在文本后半部分“玄宗因素”发生反转,这也未能改变全文本网络的这一特点。

就文本后半部分而言,玄宗是权威度最高的节点,但是他的枢纽度跌出前十,排在第21位。排名在玄宗之上的前二十个枢纽度最高的节点,全部都是能将对话流直接引入玄宗人物,也就是在后半部分直接对玄宗说话的人物。表10将这种话语流向用箭头表示出来(只包括了表中列出的前十位节点)。权威度和枢纽度的计算采用的是迭代算法,每个节点的权威度、枢纽度和与之相连的其他节点的话语流指向及数量密切相关。在本文的网络中,枢纽度和权威度的排名结果和玄宗这个节点的话语流向及数量密切相关,可见玄宗本身的对话行为在前后部分的网络中都是节点权威度和枢纽度的绝对决定因素。

表10中的另一个显著特点是高力士在全文本及文本前、后两部分的网络中稳定的高权威度。这是因为三个高枢纽度的节点——玄宗、肃宗和僧无畏——都可以直接将话语流引入高力士,使他在前后两部分的网络中保持高权威度排名。但高力士的枢纽度则前后变化较大。从枢纽度看,他在全文本的网络中排名第26,在前半部分网络中排名第13,在后半部分网络中排名第4,这说明将文本分作两部分看的时候,网络变小,结构变得更分散,高力士的枢纽度反而更高,也就是说,与高力士有关的对话活动的重要性更加突出了。

如上所述,尽管“玄宗因素”在文本前后两部分中都很显著,其表现形式则发生了反转。从对话网络数据上看,这一反转体现了玄宗在对话中的角色发生了转变,从发话为主转为听取为主。这一点也恰恰反映了《唐语林》前后部分在内容方面的差异。文本前半部分大多是一些较具正面涵义的门类,比如“德行”“方正”“雅量”“箴规”等,而后半部分则有一些具负面涵义的门类,如“谀佞”“僭乱”“残忍”等。将网络分析和文本细读相结合,可以发现在前半部分中具有高中介中心度的大臣往往具有正面的形象,而文本后半部分具有高中介中心度的大臣往往在他们的对话语境中以负面形象出现。这与具有负面形象的大臣在后半部分文本中的对话活动增加、节点中介中心度提高密切相关。而玄宗节点在前半部分中加权出度大于入度,在后半部分中则加权入度大于出度,这也意味着在后半部分文本中,玄宗在对话活动中的角色转而更偏重听取了。观察表9中向玄宗说话的人物可以发现,在后半部分明显多出一些非关朝政的人物,如娱乐帝王的倡优黄幡绰、歌者李龟年、乐家、“善视鬼”的异士夜光、僧人一行、无畏等。这些人物向玄宗说的话语在后半部分文本中显著起来。兹举一例:

又开元中,上与内臣作历日令。高力士挟大胾,置黄幡绰口中,曰:“塞穴吉!”幡绰遽取上前叵罗内靴中,走下,曰:“内财吉。”上欢甚,即赐之。[37]

这则轶事展现了开元盛世中玄宗享受日常调笑取乐的一幕,故事中宦官和倡优的话语呈现得甚是生动,读之似能闻其声。此刻的帝王是“欢甚”并加赏赐的听受者,与《唐语林》前半部分故事中玄宗多与朝臣对话、时常纳谏的形象大有不同。文本后半部分中,与这则故事相邻的是一系列关于玄宗与黄幡绰互动的轶事,其中的对话背景均为击球、宴饮、论马、调笑,甚至以丞相骑乘、朝官服佩等事取乐。比如黄幡绰滑稽为戏,玄宗一高兴便赐他绯衣,以至于黄幡绰进一步邀宠,故意佩戴一兔尾来见玄宗,并巧言提示玄宗赐绯衣时忘了一并赐给他鱼袋。[38]其实,《唐语林》后半部分关于玄宗的轶事中,即使是不涉及对话刻画的纯记录性轶事,也有很多与游乐宴饮、赏玩鹰鸟、蹴鞠拔河、绳技鼓乐等有关。而从对话网络分析的角度看,《唐语林》后半部分的对话活动,把玄宗这位最受中晚唐轶事关注的帝王,塑造为一个比前半部分中更偏向听取的人物,而他听取的话语多涉及神仙、秘术、预言、求雨、调笑等内容。可见网络分析发现的“玄宗因素”在前、后部分对话网中的反转,与文本后半部分内容中对玄宗作出的非关朝政的、偏负面的形象刻画大有关联。

结 语

本文尝试利用数字人文技术,借助Gephi软件对《唐语林》文本中的虚拟对话网络进行可视化与统计分析,得出以下几方面的发现:

首先,《唐语林》对话网络以帝王和朝臣的对话活动为中心,参与对话的人物围绕这些高中介中心度的节点形成的一系列的“文本性时间聚集群”,其中最为显著的时间聚集群的中心人物,即玄宗及其后的几位唐代帝王。将这些按时代聚集的对话群体连接起来的正是位于时间聚集群中心的帝王节点和一些特别重要的两朝重臣、三朝重臣。

其次,节点度的分析聚焦于几位身处唐室兴衰转折点的帝王,从统计层面上反映了《唐语林》的关注点是唐帝国兴败转变的契机,而对话网络中“语”的重点则在于影响帝王。点击度分析则进一步彰显了一个对整个对话网络具有全局性影响力的“玄宗因素”。这个因素反映了唐朝中后期轶事编撰者对玄宗朝的高度关注。

另外,《唐语林》文本传世的前半部分与佚失后又重辑的后半部分,在对话网络结构方面大致相似。在前后两部分的网络中,对话活动都以帝王和朝臣为绝对中心,并同时体现出《唐语林》取材来源因素的影响。尽管如此,这两部分的对话网络仍有一些比较明显的差别:文本后半部分的对话网络总体上更离散,大分量子图中的对话更加集中在一个相对较小的节点集合中,话语在大小分量间的分布比较平衡,主要发声者之间关联程度相对低;而在前半部分文本中,话语主要集中在大分量中的节点人物,主要发声者彼此之间有更多关联。“玄宗因素”在文本前后两部分中都很显著,但玄宗在对话中的角色在文本前后部分发生了反转,从发话为主转为听取为主。这个有趣的反转反映了在轶事集后半部分中,与玄宗对话的群体从直言规谏的朝臣转为僧侣、奇士、倡优之流,体现了对玄宗形象更偏负面的刻画。

以上发现都在不同程度上反映了《唐语林》的取材、编撰和文本流传的情况。在下一步的研究中,可以用文本远读所揭示的特征来指导进一步文本细读的关注方向。比如“玄宗因素”这一《唐语林》中“语”的特征,在主要关注局部内容细节的文本细读中不容易被发现。但被数字方法和文本远读提炼出来之后,便可以用来引导对晚唐轶事小说集的细读分析,引导研究者进一步考察《唐语林》的“玄宗因素”在多大程度上反映了中晚唐轶事材料中对玄宗时期的关注,又在多大程度上体现北宋笔记编撰者在选材时出于对唐帝国兴衰的反思而作出的选择。

再者,裴度、李泌、宋璟、李德裕等中介中心度排名高的大臣对网络话语流通的联通和控制能力,从总体上看仅次于帝王。他们在网络图中也拥有以自己为中心的小型聚集群。可见跨历数朝的重臣与帝王和其他人物之间的交流也是《唐语林》对话网络中“语”的一个重点。在将注意力从帝王转向话语网络中重要性仅次于他们的大臣群体时,也可以分析网络中后世公认的贤臣与奸臣的话语行为在《唐语林》中有何不同,探讨唐朝后期涉入党争的人物的话语权及其在对话网络中的角色有何规律。这些都将在下一步的计划中,结合对具体轶事的细读,通过与其他笔记小说集数字分析结果的比较,来做更详细的研究。

Visualization and Analysis of Dialogue Networks in the Tang yulin (Forest of Conversations on the Tang)

Amelia Ying Qin

Abstract: This study examines the yu, “conversations,” in the Tang yulin (Forest of Conversations on the Tang) through the construction, visualization, and statistical analysis of its dialogue networks. The network graph presents a series of substructures, here called “Text-based Temporal Clusters,” that demonstrate the focus of the collection’s yu on Tang emperors and a few important ministers. Node degree analysis reveals the importance of several rulers who presided over turning points in the Tang fortunes, especially Emperor Xuánzong and later rulers of the mid- and late-Tang. This feature corresponds to the proliferation of Tang anecdotal accounts after the An Lushan rebellion. Additionally, HITS (Hyperlink-Induced Topic Search) analysis highlights a “Xuánzong factor” of global influence across the dialogue network, which refects the heightened attention on Xuánzong in mid- and late-Tang historical anecdotes. The “Xuánzong factor” remains significant in the dialogue networks built both for the first, continuously transmitted part of the collection and for the latter, lost and then reconstructed part of the collection. Interestingly, the role of the Xuánzong node in these two networks is inverted: statistically speaking, in the first part Xuánzong is more of a speaker in the network, but he is presented in the network of the latter part of the text as more of a listener—a feature corresponding to the relatively more negative image of Xuánzong portrayed in the later part of the Tang yulin.

Keywords: Anecdotes; Network Analysis; Dialogue Network; Text-based Temporal Clusters; Tang Xuanzong

(编辑:赵薇)

注释:

[1]本文的撰写受益于审稿老师们的宝贵建议、本刊编辑陈松老师和赵薇老师细致入微的指导和帮助,以及中华书局编辑校订老师们的耐心修订。特别是在研究本课题的过程中,笔者就网络分析方法向陈松教授请教良多,使本文的立论、结构、表述等各方面均有了长足进步,实受益匪浅。在此向各位老师致以深深的谢意。

[2]与本文直接相关的综合性唐笔记小说研究,见张剑光:《宋人笔记视域下的唐五代社会》,郑州:大象出版社,2020年。有关《唐语林》的近期成果,包括何姿慧:《〈唐语林〉所见唐代社会生活史料考述》,硕士学位论文,台湾中兴大学,1998年;邝明月:《〈唐语林〉研究》,硕士学位论文,华中师范大学,2003年;余志新:《〈唐语林〉词语札记》,《滁州学院学报》2007年第5期;钟小勇:《略论〈唐语林〉在近代汉语词汇研究中的价值——以〈唐五代语言词典〉为参照》,《绥化学院学报》2005年第1期;赵艳丽:《〈唐语林〉词汇研究》,硕士学位论文,四川大学,2007年;郑丽萍:《〈唐语林〉复音词研究》,硕士学位论文,安徽大学,2007年;曾腊梅:《〈唐语林〉词语与〈汉语大辞典〉订补》,硕士学位论文,江西师范大学,2009年。运用网络分析和数字方法进行人文研究的近期成果,包括廖俊凡:《中国古典白话小说中的社会网路关系:以〈儒林外史〉为例》,硕士学位论文,台湾大学资讯网路与多媒体研究所,2010年;许超、陈小荷:《〈左传〉中的春秋社会网络分析》,《南京师范大学文学院学报》2014年第1期;许超:《〈左传〉的言语网络和社会网络研究》,博士学位论文,南京师范大学,2014年;赵薇:《社会网络分析与“〈大波〉三部曲”的人物功能》,《山东社会科学》2018年第9期;陈松:《为学作记:从网络分析和文本分析视角看宋代地方官学碑记的作者与主题》,《数字人文》2020年第4期;Jack W. Chen, Anecdote, Network, Gossip, Performance: Essays on the Shishuo xinyu, Cambridge, MA: Harvard University Asia Center, 2021; Hilde De Weerdt et al., “Is There a Faction in This List?,”Journal of Chinese History, vol. 4, 2020, pp. 347-389; Jack W. Chen et al., “The Shishuo xinyu as Data Visualization,”Early Medieval China, vol. 20, 2014, pp. 22-58.

[3]王谠撰,周勋初校证:《唐语林校证》,北京:中华书局,1987年。

[4]关于文本远读,见Franco Moretti, “Conjectures on World Literature,”New Left Review, no. 1, 2000, pp. 54-68; Franco Moretti, Graphs, Maps, Trees: Abstract Models for Literary History, London: Verso, 2005。关于对网络分析方法的介绍,见Mark Newman, Networks: An Introduction, Oxford: Oxford University Press, 2010 等多种书籍。

[5]关于王谠的生平及生卒年,见王谠撰,周勋初校证:《唐语林校证》,“前言”,第1—38页;颜中其:《关于唐语林作者王谠》,《中国历史文献研究集刊》1980年第1期。

[6]周勋初:《唐语林援据原书提要》以及《唐语林援据原书索引》,《唐语林校证》,第763页、第839页。

[7]唯一未被《唐语林》采纳的门类是今本《世说新语》中的“捷悟”一门。

[8]周勋初:《唐语林原序目》,《唐语林校证》,第1—2页。

[9]晁公武(1105—1180)在《郡斋读书志》(1151)中记录了一个十卷的版本,郑樵(1104—1162)在《通志》(1161)中记载了另一个八卷的完整版本。《中兴书目》中另外记录了一个十一卷本,而这个版本中有十五个类别的内容是缺失的。详见王谠撰,周勋初校证:《唐语林校证》,第810页;陈骙等编:《中兴馆阁书目》,台北:世界书局,1963年,第525页。

[10]陈振孙(约1183—约1262)的《直斋书录解题》记录了一个八卷的完整版本。王应麟(1223—1296)的《玉海》记载了一个缺失五个门类的十一卷本。见王谠撰,周勋初校证:《唐语林校证》,第810页。

[11]王谠撰,周勋初校证:《唐语林校证》,第810—814页。

[12]详细分析请见周勋初:《唐语林的版本问题》,《唐语林校证》,第25—34页。

[13]关于几个清代的版本,如李锡龄(1794—1844)的《惜阴轩丛书》版,张若云(约1805前后在世)的《墨海金壶》版,以及《守山阁丛书》版等,请见王谠撰,周勋初校证:《唐语林校证》,第813—822页。

[14]关于类似的长时间跨度网络的一例研究,见Marcus Bingenheimer, “Who was ‘Central’ in the History of Chinese Buddhism,”International Journal of Buddhist Thought & Culture, vol. 28, no. 2, December 2018, pp. 45-67。

[15]Gephi(0.9.2) 中,模块化指数的算法依据Vincent D. Blondel et al., “Fast Unfolding of Communities in Large Networks,”Journal of Statistical Mechanics: Theory and Experiment, 2008, p. 1000,以及R. Lambiotte, J.-C. Delvenne, M. Barahona, Laplacian Dynamics and Multiscale Modular Structure in Networks, 2009, https://arxiv.org/abs/0812.1770v2。按照Gephi目前的算法,在计算平均聚类系数时,考虑了边的方向性而不考虑其权重;在计算模块化指数时,则仅考虑边的权重而不考虑其方向性。

[16]进行模块化计算时,如将分辨率设置为1,则模块化数值为0.941。计算结果呈现247个模块社群,每个社群大小约在2至76个节点的范围内。

[17]进行模块化计算时,如将分辨率设置为1,则模块化数值为0.581。计算结果呈现23个模块社群,每个

社群大小约在3至70个节点的范围内。

[18]周勋初:《唐代笔记小说的崛兴与传播》,《唐人笔记小说考索》,南京:江苏古籍出版社,1996年,第22—38页。

[19]Gephi(0.9.2) 中介中心度算法为Ulrik Brandes, “A Faster Algorithm for Betweenness Centrality,”Journal of Mathematical Sociology, vol. 25, no. 2, 2001, pp. 163-177。本文几种中心度的计算,都将网络图按照有向图处理,并采用归一化(normalized)数据。

[20]这一现象既体现了北宋士人在编撰选材上对唐帝国兴衰的反思,也是对唐代笔记小说本身历史关注点的一个客观反应。这一点将在下一步研究中与唐代笔记小说整体研究结果进行比对之后,加以讨论。

[21]王谠撰,周勋初校证:《唐语林校证》,第32—33页。

[22]很多研究讨论过文人理想中的君臣关系,比如:Howard J. Wechsler, Mirror to the Son of Heaven: Wei Cheng at the Court of T’ang T’ai-tsung, New Haven: Yale University Press, 1974; Denis Twitchett, “How to Be An Emperor: T’ang T’ai-Tsung’s Vision of His Role,”Asia Major, 3rd series, vol. 9, 1996, pp. 1-102; Xiao-bin Ji, Politics and Conservatism in Northern Song China, Hong Kong: The Chinese University Press, 2005; Patricia Buckley Ebrey, Emperor Huizong, Cambridge, MA: Harvard University Press, 2014, pp. 317-318。

[23]王谠撰,周勋初校证:《唐语林校证》,第33页。

[24]王谠撰,周勋初校证:《唐语林校证》,第228—229页。

[25]王谠撰,周勋初校证:《唐语林校证》,第230页。

[26]Gephi(0.9.2) 中点击度算法的依据为Jon M. Kleinberg, “Authoritative Sources in a Hyperlinked Environment,” Journal of the ACM, vol. 46, no. 5, 1999, pp. 604-632。本研究的点击度计算中,将网络作为有向图处理,收敛迭代的停止条件(Epsilon)设定为1.0E-4。

[27]Paul W. Kroll, “Nostalgia and History in Mid-Ninth-Century Verse: Cheng Yü’s Poem on ‘The Chin-yang

Gate’,”T’oung Pao, vol. 89, no. 4, 2003, pp. 286-287, p. 307.

[28]Kroll, “Nostalgia and History in Mid-Ninth-Century Verse,” pp. 289-290.

[29]Amelia Ying Qin, “Particularly Unusual, Definitely True: Anecdotes as Political Criticism in the Late Tang Miscellany Songchuang zalu,”Oriens Extremus, vol. 56, 2017, pp. 117-170.

[30]李德裕:《次柳氏旧闻序》,《教坊记(外三种)》,北京:中华书局,2012年,第45页。

[31]有关作为《唐语林》材料来源的笔记小说,目前已有很多研究。英文论著包括:Carrie E. Reed, “Motivation and Meaning of a Hodge-podge: Duan Chengshi’s Youyang zazu,”Journal of the American Oriental Society, vol. 123, no. 1, 2003, pp. 121-145; Yue Hong, “A Structural Study of Ninth Century Anecdotes on Original Events,”Tang Studies, vol. 26, 2008, pp. 65-83; Linda Rui Feng, “Unmasking Fengliu in Urban Chang’an: Rereading Beili zhi (Anecdotes from the Northern Ward),”Chinese Literature: Essays, Articles, Reviews, vol. 32, 2010, pp. 1-21; Manling Luo, “Remembering Kaiyuan and Tianbao: The Construction of Mosaic Memory in Medieval Historical Miscellanies,”T’oung Pao, vol. 97, 2011, pp. 263-300; Manling Luo, “What One Has Heard and Seen: Intellectual Discourse in a Late Eighth-Century Miscellany,”Tang Studies, vol. 30, 2012, pp. 23-44; Glen Dudbridge, A Portrait of Five Dynasties China: From the Memoirs of Wang Renyu (880-956), Oxford: Oxford University, 2013; Anna M. Shields, “The ‘Supplementary’ Historian? Li Zhao’s Guo shi bu as Mid-Tang Political and Social Critique,”T’oung Pao, vol. 103, 2017, pp. 407-447。此外还有为数众多的中文和其他语言的期刊论文和学位论文。

[32]比如,在网络全图中,高祖的加权入度排名第9。如果只考虑大分量子图,高祖节点从加权入度排名中消失,因为以他为中心的对话群体不在大分量子图中,因而被过滤掉了。

[33]造成这一变化的原因是,韦生和盗僧的节点不在大分量子图中,因而被过滤掉了。这两个节点来自同一个故事(即《唐语林》第1080条)。这是一个无名士人韦生搬家途中遇到盗僧的故事,颇具武侠小说风格,篇幅长,对话多,从网络的角度上看则是一个十分孤立的故事。也就是说,故事中的人物并非帝王或朝臣,故事内容主要是剑法、弧矢、侠客之事,与《唐语林》中大多数轶事故事所关注的内容并不相通。

[34]轶事第1080条,见王谠撰,周勋初校证:《唐语林校证》,第747—748页。

[35]轶事第74、76、106、107、108、109、196、197、303、307、487条,见王谠撰,周勋初校证:《唐语林校证》,第45—46页、第63—67页、第126页、第200页、第203页、第333页。

[36]轶事第827、837、1098条,见王谠撰,周勋初校证:《唐语林校证》,第575—576页、第581页、第757—758页。

[37]王谠撰,周勋初校证:《唐语林校证》,第472页。

[38]王谠撰,周勋初校证:《唐语林校证》,第473页。

zh_CNChinese