零壹Lab | 数位人文视野下的知识分类观察: 两部官修类书的比较分析(上)

发布时间: 2019-03-06 项洁、陈丽华等

   公众号:lingyilab

零壹Lab:记录数字媒介之日常,反思科技与人文精神
01Lab: Archiving digital lives, reconceptualizing sci-tech and the humanities

作者简介

(原文发表时)

项洁,现任台湾大学资讯工程学系特聘教授兼数位人文中心主任。

陈丽华,作者现任中央研究院人文社会科学研究中心博士后研究。

杜协昌,作者现任台湾大学资讯工程学系博士后研究。

钟嘉轩,作者系台湾大学资讯工程硕士。

感谢项洁教授授权转发。

汉语世界的数字人文尽管起步略晚,但在过去的十多年间也取得了长足的进展,其中执牛耳者就有以台湾大学项洁(Jieh Hsiang)团队开展的以数据库带动文本间脉络的大图景研究。团队以唐宋两部官修大型类书《艺文类聚》和《太平预览》为例建立起的全文资料库及其查询、分析和观察功能为研究者提供了从一个宏观视野观察唐宋士人知识结构中渐进而深刻的变化轨迹。这种研究提供的对历史文献的分类结构、比重和条目内容上的差异的观察和分析,非人力能及,恰恰是通过数据库系统和相关的后台计算功能才得以实现的。


一、引言:观察类书的新视野

面对纷繁复杂的大千世界,人们如何在头脑中巧妙地搭建起一个完整的架构,将万事万物井井有条地安置其中,这是令无数思想史和知识史研究者为之著迷的问题。在近代西方,将人类古往今来的知识,按照一定的知识结构分类编辑后形成的工具书,便是 “百科全书”(encyclopedia)。西方学者曾仔细地比对了启蒙运动时期法国第一部《百科全书》中确立的知识架构与之前的区别,发现当时的哲学家,透过巧妙地修剪前人留下的 “知识树”,拆解了正统宗教在旧知识秩序中的地位,从而确立了文明和哲人在其新秩序中的重要位置。【1】

在中国,一种特殊的文本类型——类书,常被近世学者拿来与西方的 “百科全书”类比,甚至被西方学者譬喻为 “中国的百科全书”。【2】它在中国历史上可谓源远流长,学界一般认为它起源于公元220 年左右,4-5 世纪后类书日益盛行,不但隋唐以降成为国家参与的事业,元、明、清时期更在文人中广泛流通;近代以来,新型类书的编修亦未停止脚步。【3】然而在性质上, “类书”与 “百科全书”存在很大差异,前者是按照 “以类相从”的特殊方法编纂出来的书籍,它将社会上常见书籍中的内容摘抄浓缩之后,分门别类地加以重新排列,以便于阅读和查找。换句话说,它其实是按照设定知识的基本架构,把相关联的内容编排罗列出来,编辑者隐身幕后,并不直接阐述对于特定主题的看法。而西方的百科全书则不同,乃是由编辑者直接发声,针对特定的类别和主题,进行具体而主观的诠释。

“类书”与 “百科全书”的相似之处,则在于二者同样需要建构一个庞大而体例完整的知识架构,以便对天地万物进行分类。而这一分类在中国类书中的形成、演变和比较,亦成为历代学者极 为感兴趣的问题。追溯起来,民国时期便有不少学者,如张涤华(1909-1992)、 邓嗣禹(1905-1988)、 胡道静(1913-2003) 等人, 对类书进行过综述性研究。其中除了论述类书的定义、文体、分类、版本、校勘、辑佚等,已经关注或罗列了历代类书的分类体系。【4】近年来,学者则逐渐注意到类书分类体系的比较,对于中国古代思想史及历史书写研究的意义,如荷兰学者许里和(Erich Zurcher)便比较过中古时期的佛教类书与官方类书,傅大为(Fu Daiwie)则比较了宋代两部大型类书《太平广记》和《文苑英华》,均试图发现不同分类方式所反映的世界观差异。【5】葛兆光以唐初的官修类书《艺文类聚》为例,分析当时人的一般知识、思想与信仰世界。【6】宋家复关于北宋类书《册府元龟》的最新研究,与本文的关心最为接近,他运用史学的方法分析比较了其分类结构与前代类书《修文殿御览》、《北堂书钞》以及宋初《太平御览》之间的关系,同时试图勾勒建构这一高度精密的分类框架,对于当世人的思维过程所具有的意义。【7】

由于类书的工具书性质及规模过于庞大,除了部类结构之外,学界目前还鲜少尝试将某部类书的全部内容视为一个整体,并针对不同时代的类书进行整体性的比较。得益于近年来数位科技的发展,类书全文资料库的建置和运用已变成可能,历代学者以往透过经年积累、反覆查找获得的信息,如今可以透过更为便利的方式取得。在此基础上,从整体上重新审视不同类书之间分类结构、资料来源及编排上的差异,由此推敲不同时代编修者知识分类观念的演变,亦不再是天方夜谭。

本文想要做的,便是这样的尝试。我们运用资讯科技,建构两个可以用来整体分析《艺文类聚》与《太平御览》这两部中国唐宋时期官修的大型类书的全文系统,分别为 “艺文类聚/太平御览”全文资料库,以及 “类书对应查询系统”,并透过它们来观察两部类书中所反映的唐宋之间高层文人知识分类架构的变化。选择这两部类书的理由,在于首先二书均为新王朝建立之初、集国家之力延揽人力物力编修完成的。《艺文类聚》为唐王朝统治之后第7 年(公元624 年),弘文馆学士欧阳询(557-641)等主修;《太平御览》则在宋王朝建立之后第25 年(公元984年),翰林学士李昉(925-996)等主修完成。其次,二者均规模庞大,体制完整,《艺文类聚》更号称是《太平御览》编修时主要参考的三部类书之一(另外两部是南北朝时期北朝编修的《修文殿御览》,以及唐初编修的《文思博要》)。前者分为100 卷,总计约100 万字,按天、地、人、事、物的次序分46 个部,部下再细分734 个类别;后者则全书1000 卷,部类结构和前者相似, 全书分为55 部,5597 类,总计达400 万字。第三,两者既是当时代 横向知识的总整理,亦是纵向历时知识的总汇编。【8】这类庞大的知识总汇,亦是我们观察唐宋之际知识架构演变的最佳文本。

本文的结构如下:在第二节中我们叙述对《艺文类聚》与《太平御览》这两部书的文本处理及用处理过的文本所建置的 “类书对应查询系统”与 “艺文类聚/太平御览”全文资料库。透过这两个分析和观察平台,我们在第三节内提出一些对两部类书的 “部”的观察和比较,第四节也做了对两书的 “目”和条目的比较。第五节则比较两书引用的书籍。在第六节中我们对以上的工作做了一个总结。


二、建置类书分析系统

(一)文本处理和分析

在建构分析系统之前,我们须先对这两本书的文本做进一步的处理。【9】一部类书会有一个树状结构的知识分类,通常这个知识分类至少会有两层:第一层的大分类叫做 “部”,部的下面一层会有一些 “目”。《太平御览》的目下可能会有子目,如 “四夷”部下面的 “东夷二”里就有 “百济”、 “夫余”和 “新罗”三个子目。这些最下层的目或子目,就是一部类书的 “类”,我们也称之为 “主题”(subjects)。换言之,我们将一本类书知识分类树的每一个树叶(leave)定义成一个 “类”。根据我们的统计,《艺文类聚》有 734 个主题,而《太平御览》则有 5597 个,是前者的 7.5 倍。

一个类(主题)下面会有一些 “条目”,这些即是针对这个主题从较早书籍中萃取的引文。一个条目通常有 “出处”和 “内文”两 部分。 “出处”顾名思义,就是引文的由来,但出处的书写方式即使在同一部类书中都不见得一致,有的有作者,有的除了书名外亦有篇章,但有的仅有篇章而省略书名。许多人认为类书的出处都是书,但事实并不是如此。以《艺文类聚》来说,所引用的书大约只有一千种上下,而单篇的诗文等则超过 4000 种。【10】 为了能够对引文的时间做分析,我们对出处的形成时间做了一些探讨,如果成 “书”的时间确 定,则加入年代;如不确定,但至少知道在什么时代已经存在,则用 “朝代前”来代表。如《竹书纪年》的成书时代不知,但西晋时已经存在,所以我们用 “西晋前”代表它的年代。

经过这样的整理后,我们算出《艺文类聚》共有 14572 个条目, 《太平御览》则有 65633 个条目,每个条目包含下列资讯:

  1. “属性”:条目所属的部、目、子目和其前一条目与后一条目。

  2. “出处”:条目所属年代、作者、书名及篇章名。

  3. “内文”:条目所引的内容。在之前的研究中(钟嘉轩,2013),我们有详细说明为了断出一个条目的出处所设计的自动方法。我们强调在出处的部分,被引的也不见得是一本书籍,可能是一篇文章(或其它文体),朝代与作者可能亦均不详。


(二)条目间的共引性

为了分析两本书之间引用关系的异同,我们需要决定条目间的共引性。所谓共引是指同一段文字在两部类书中均出现,或在同一部书中不同的类目中出现。但这里我们要小心,因为不同传抄的关系,一段文字、即使是在同一本类书中出现数次,文字也不尽相同。因为我们的目的是要了解两个条目是否引自同一出处,所以若两句的结构、 语意以及提到的主词、动作等皆大致相同,且出于同一本书的同一位置,或文字相同但出处不同,则这两个条目被视为共引。反之,即使两条目文字类似且出于同一本书,如果原书位置不一样,或所提及的事件不同或无法判断,则被认定为不相关。因为二书中的引文完全相同的并不多,我们采用一个 “最长相同子序比较法”(longest common subsequence)的演算法来决定相似度,【11】 用的公式是:

共引度=( LCS 长度 ×2)/ (A 句字数+ B 句字数)

其中 LCS 的定义是 A 句和 B 句中共同的最长的子序列。举例说,在二书内有以下条目:

其中共同的最长子序为 “帝见王母有一卷书以紫锦之囊”,长度为 13,而两个内文字数各为 19 和 22,所以相似度为 60.5% 。这两个条目虽然分属不同的部目,但其出处和内文均很类似,且在《汉武帝内传》中出于同一位置,所以被认为是共引的条目。反之,以下之 例:

虽然内文的相似度高达 78.57%,且出处、文字和结构均相似,然而条目中的关键词不同(麟,凤),所以不被认为是共引的条目。【12】 又如:

虽然两者相似度 71.43%,但出于《礼记‧月令》中两段不同的文字,所以也被认定是不是共引。

经过实验,我们发现 60% 是一个最佳的界值(threshold):两个内文共引度在 60% 以上的条目,经人工检验的结果,发现超过93%可认证是共引的。

表一:正常长度条目配对已 LCS 共引度分群的数量分布【13】


(三)长短条目共引度的处理

我们先看以下的例子:

这两个条目应该是有共引关系的,因为它们出处和引文都类似,但用 LCS 的算法它们的共引度仅为 46.1%。这是因为二书所引内文的长短有时有什大的差距。为了解决这个问题,我们用另外一个方法来计算长短句的共引度。

一对条目为 “长短条目”如果其中一条内文的长度至少为另一条的两倍,直观来说一对长短条目被认为是相关如果短的条目被 “包含”在长的条目里面,亦即如果两段文字的LCS 与短的条目很类似。换句话说如果短条目被包含在长句里的越完整,这两个条目越可能有关联。这个观念换成计算就是先找出两个条目的 LCS,再用 LCS 的长度除以短条目的长度。如果比例达 80% 以上(80%是我们经过反覆试验得出来的最佳值),则认为这两个长短条目是有共引关系的。以上述例子而言,其长短条目共引度是 100%,所以这两个条目被认为是共引的。

在我们的实验中先对《艺文类聚》与《太平御览》的条目做了两两条目间的比对,得到共引度最佳为60% 和长短条目共引度最佳为80%的结论,然后再做一个条目对多个条目的比对。由于一对多的计算复杂度太高,我们仅仅对六个目做了完整的求准率(precision) 和求全率(recall)的分析,然后用自动方法从事两部类书完整的条目相关性比较。而以自动条目比对方法将两部类书完整比对后,所得到的统计数据如下所列:

(四)类书分析系统

为了有效的比较这两部类书,我们建置了两个不同的系统,分别是 “类书对应查询系统”及 “艺文类聚/太平御览”全文资料库,各有不一样的目的。

1. 类书对应查询系统

钟嘉轩建立的 “类书对应查询系统”【14】利用上述的共引关系,从知识结构的对应角度比较两部书在知识结构和引文上的差异。研究者可以选择一部书的某一部或目(子目),利用系统提供的图示呈现与统计资料,一目了然的观察其中条目在另一部类书中不同知识框架下出现的分布情形。这个资料库的基本动机,即《艺文类聚》与《太平御览》成书于不同的时代背景之下,展示的是唐初和宋初知识菁英不尽相同的知识结构,因此透过观察其中一部类书不同层级部类结构下的条目,在另一部类书中的取舍和所属部类的分布,可以窥见两个时代知识结构演变及对特定主题的观念的变化。

这个系统的输入界面非常简单:使用者选择要观察的书(《艺文类聚》或《太平御览》)及部(或部和目/类)(见图一),选择送出后,系统就提供该部/目所有条目在另一部书中出现的情形。以下我们用 “符命”做例子说明:

图一:系统─ 选择要分析的目标

系统第一个呈现的是:目标部目的条目中,有多少在另一部书中有共引的条目出现。以 “符命”为例,《艺文类聚》中有 51 条,其中 27 条在《太平御览》中可以找到共引的条目,其他的 24 条则找不到(图二)。

图二: “符命”在两部书中的对应统计

 系统然后列出 “符命”在《艺文类聚》中所有的条目(图三)。在胪列条目的时候,使用者可以选全部、只显示有对应到的、只显示没有对应到的等。

 

图三: “符命”在《艺文类聚》中的条目

若条目能于另一部类书中找到对应,则其项目后方会有 “显示相似条目”的点击字样,点下后其对应的条目即会显示于下方,图四是一例,这个条目在《太平御览》有四条对应。

图四:以《艺文类聚》 “符命”部条目为例的单条条目及对应

 下一个功能提供一个图表,显示想要分析的部/目中的条目,在另一部类书里的分布。图五还是用《艺文类聚》中的 “符命”做例子。 (《艺文类聚》的 “符命”部下只有一个目,也是 “符命”。所以我们不强调看的是部还是目(或子目)。最左边的长柱代表《艺文类聚》中 “符命”的条目中,有27条可在《太平御览》里找到对应。 旁边长柱中的 “51条”,表示这27条在《太平御览》中可以找到51个条目与之对应。右边和右中则分别显示《太平御览》中这51个条目,在所属的部和目中的分布。这个例子十分有趣,因为从这个图表立刻可以看出 “符命”部在《太平御览》消失了。这个现象我们会在下一节做进一步的说明。

图五:《艺文类聚》 “符命”中的条目在《太平御览》中的分布

  最后一个功能(图六)是将上面的图表用文字的方式做排列。也就是仅列右边《太平御览》中在各部的分布,亦可展开。

图六:表列式呈现《艺文类聚》 “符命”中的条目在《太平御览》各部的分布

 2. “艺文类聚/太平御览”全文资料库

以上的 “类书对应查询系统”在两部类书的知识结构上提供鸟瞰式的比较,但并没有搜寻的功能。我们的第二个系统是杜协昌博士用 “台湾历史数位图书馆”(THDL)的系统架构所建的 “艺文类聚/太平御览”全文资料库。【15】这个资料库除了可以进行全文检索外,也充分利用到了上述的资料结构,将检索结果用出处、年代、作者、部别、类目等学者会有兴趣的资讯进行后分类,同时将分类后的情况呈现在系统中。系统更有 “辑佚”的功能,可以将一本书在类书中出现的所有条目列出,并分析它们出现的部别和类目。这个功能也让研究 者可以观察同一本书在不同类书中出现的分布,为不同时代的知识分子在如何看待和运用一本书的同异上提供讯息。同样的分析和观察也可以运用在同一个条目上。总体来说,研究者针对感兴趣的内容进行检索之后,不必再像以往一样耗费诸多时间,分析出处来源、作者及 其时代、属于哪个部目等,系统会自动帮助研究者分析相关资讯,省却了许多一一搜寻排比的功夫。

  以下我们用两个例子来说明。首先我们对《太平御览》这个文本下检索词 “孔子”(B.C. 551-479)。图七显示在《太平御览》中, “孔子”一词出现 977 次,介面中间区块呈现 “孔子”出现条目的部/目、书名(包含年代和作者)、及条目内容。如果此条目在这两部类书其他的地方也出现过,则在条目标题后会用一个数目字代表,如果按下这个数字,相对的条目就会展开。在图七的例子里,第一条出现在天部元气目的条目,还在别处出现过两次:一次在《太平御览》的礼仪部/叙礼上目,一次在《艺文类聚》的礼部/礼目。比较特别的是第一次出现时,《太平御览》引用的出处是《孔子家语》,另外两次的出处则为《礼记·礼运》。

图七: “孔子”在《太平御览》检索的结果

 图七的左上方的区块为检索历史,左下则为本系统中重要的后分类功能。简单的来说,后分类就是把整体的检索结果用不同的诠释栏位来排列,这个功能提供使用者一个鸟瞰检索结果的机制,以便快速的作分析。图八是 “孔子”的检索结果的分析,可以看出 “孔子”的1009 个条目来自131个出处,由99个作者所写(但有40个出处、486个条目作者不详),且在《太平御览》的55部中均有出现,如果算目,则有568目,如连小目一起算,则有574 目中提到 “孔子”。

图八: “孔子”在《太平御览》检索结果的后分类

  “孔子”在《太平御览》出现最多的是人事部了,共 278 条。将游标放在人事部的数字(278)上可以呈现出更细的后分类(图九)。

图九: “孔子”在《太平御览》检索结果在人事部的细部后分类

 本系统还提供一个 “辑佚”的功能,让使用者可以输入一本书名后,回传所有引自该书的条目。图十以 “春秋元命苞”为例,该书在 《艺文类聚》中出现 39 笔,分布在 14 部,其中州部 11 条,帝王部 6条,木部5 条,人部2 条。

到了《太平御览》,条目数增为 133 次,其中人事部大幅增加到34 条,此外天部 27 条,皇王部 12 条。地部没有增加,维持在 11 条 (虽然内容不尽相同)。

图十:以 “春秋元命苞”为例的辑佚查询

 我们指出虽然这个系统提供两部类书分别的全文检索,我们并不让使用者同时查询两部类书。这是一个刻意的设计,而不是技术上的限制。全文检索在技术上不是困难的事,但我们强调的是检索之后的分析,这种统计资料和检索后分类给予人文学者一个更宽广的观察、分析和诠释的视野,便利人文学者发掘问题,并针对不同问题,迅速进行直观观察和分析,亦是推进学界以新方法和新角度,对大型类书进行细致观察和比较研究的起点。这种数位人文研究平台当然有它的局限性,自动化工具虽然能够萃取出有用的统计资料,然而不能期待 这个平台变成一个 “决策系统”,分析及诠释的脚色还是在研究者身上。

  以下我们提出一些透过上述的两个系统对《艺文类聚》和《太平御览》比较分析的初步观察与分析。


三、两部类书 “部”的比较

 “部”是两部类书最显而易见、亦最便于分析和比较的知识架构。其实各部之上,还存在着一个天、地、人、事、物的知识序列,每个大类之下包含一定数量的部。在葛兆光看来,这一安排显示了当时人知识世界的结构,显示当时人对广袤世界的理解和叙述,是从象征着时间和空间的天地开始的,是当时人知识世界的终极依据;其后为人的社会生活方式的论述,被排挤的佛道相关知识,以及被视为细枝末节的自然界各种具体知识。【16】 不过比较起来,两部类书在这一维度上结构颇为相似, “天”部分包含的部数最少,其下渐次增加,而 “物”的部分包含部数最为庞大,均超过半数。虽然《太平御览》中 “地”的部分因为合并,由《艺文类聚》中的 5 部减少至 2 部,而 “物”的部分则因细分和由类升格为部,而大增了 8 部之多,但这一变化并未挑战原本知识序列的格局,因此并非本文分析的重点。

对于两部类书 “部”的比较分析,学界则积累了一定的研究成果。如当代学者周生杰便细致比较了两者,发现《太平御览》中除了 “逸民”、 “宗亲”、 “四夷”等少数新设的部之外,55 个部中的绝大部分都与46 部的《艺文类聚》重叠,或由其一部(或部下面的目)析分而来。 【17】这似乎也印证了宋代刊印的《太平御览》序言中的说法, 即该书的编修参考了南北朝时期的《修文殿御览》、唐初的《艺文类聚》、《文思博要》及其它书而成,因此二书在整体结构上亦非常接近。【18】本部分内容并不是试图挑战上述说法,但是透过上述系统的帮助,我们不仅可以观察相隔350 年间,两朝高层文人对于知识分类设置上整体的变化,亦可以观察不同部类的比重、内容上变化的趋向,从而在整体具有延续性的画面之下,窥见更为细微和深层的变化。

(一) “部”的结构变化

比较起来,《艺文类聚》各部亦并非被《太平御览》全盘继承, “符命”部及相关类别的消失,便是其中一个明显的变化。所谓 “符命”,是君权神授的象征,表现为自然界出现特别的现象或物品。它的起源驳杂,在秦汉时期成为极具影响力的思想。在政权更迭的过程中,它亦往往被有心人士利用,从而为新帝国及皇权确立正统性护航。【19】在唐初编修的《艺文类聚》中, “符命”部是颇为重要的一部,因为它被置于是 “人”这个大的类别之首,位置更在帝王部之前。 “符命”部下总共有 51 条引文,讲述上至上古帝王,下至三国君王出生、人生经历中的奇异现象。符命在帝王部分之前,意味着后者权力的获得,必须获得上苍的暗示或象征。【20】

至《太平御览》编修时,曾经在《艺文类聚》中占据重要位置 的 “符命”部,已经消失不见了。其部下一半左右的内文为后者所收录,却散落到 “皇王”(12条)、 “天”(8 条)、 “休征”(7 条)、 “皇亲”(5 条)、 “地”(4 条)、 “人事”(3条)等16 个不同的部类中。例如《艺文类聚》中引自东汉谶纬书《河图》中的商汤(约BC 1675-1646)诞生传说: “汤母扶都,见白气贯月,意感而生汤。”这一内容到了《太平御览》中,被分别收录在 “皇王部/殷帝成汤”及 “皇亲部/殷汤母”两类之下,它试图说明的是两个人物,而非强调汤王出生时的奇异。不过,少量条文与《太平御览》 “休征”部的内容相似,意味着 “符命”部虽然隐退,其观念却并未消失无踪。

而《太平御览》新增的部分,除了少数部一分为二或合二为一的情况外,总共新增了11 个部,其中 “偏霸”、 “宗亲”、 “四夷”为完全新增设的部; “学”、 “释”、 “道”或多或少可以在之前找到一些影子,但已经内容大变; “逸民”、 “奉使”、 “疾病”、 “竹”、 “菜茹”五部则是以前《艺文类聚》部下面的类,现在被升格为独立的一部。即使《太平御览》中完全新设的部,在之前的史书或类书中亦非完全无迹可寻。如 “偏霸”往往指割据一方的政权,如三国时期蜀国的刘备 (161-223)、 刘禅(207-271), 吴国的孙权(182-252), 以及南北朝时期南朝的帝王等。《艺文类聚》并无此类别,部分帝王乃是被收入 “帝王”部中。周生杰便指出,这反映出二书在统治正统观念上的差异,《太平御览》的编修者,将南北朝史书本来并未彰显的正统偏霸观念加诸其中,将位于中原者列为正统,而雄踞江南者则归入偏霸,

这实际上是为了北宋巩固政权的政治目的服务的。【21】而《太平御览》新增的 “宗亲”部,同样为《艺文类聚》所无。

不过在唐代编修的另外几部著名类书,如《三教珠英》、《白氏六帖》 等当中,都可以找到相似的类别。【22】该部下按照祖父母、父母、继母、叔伯等亲属称谓区分,共分成27 目,总计660 条,其中77 条可以在《艺文类聚》中找到相似条目,除了来自 “人”部的38 条为大宗外,其它都零星散布在 “职官”、 “礼”、 “封爵”等22 个部之下, 亦显示其来源的纷杂。

至于新设的 “四夷”部,其称由来已久,泛指中国王朝统治之外的各类人群或政体,历朝史书多有记载相关内容。【23】该部下则分为东夷、南蛮、西戎、北狄四大类,总共叙述了388 个不同的政权、部落或群体,总计920 个条目,如日本、朝鲜、大秦(今罗马或叙利亚)、吐蕃、林邑(今越南中部古国)等。隋朝及唐初编修的类书《北堂书钞》及《初学记》中,亦出现四夷的类别,但均与音乐联系在一起,亦非强调不同的政权和群体。【24】

更相近的来源,可见于中唐时期杜佑(735-812)编修的著名政书《通典》,该书记载了历代典章制度沿革,其中最后一部分 “边防”,便分为东夷、南蛮、西戎、北狄四大类别,每个类别下按照政权及群体名一一编写,与《太平御览》如出一辙。【25】 其中《太平御览》 “四夷”部西戎部分总计有 344 条,更有约有近十分之一的条目来自于《通典》,显示西戎部分的编者曾直接参考了该书。就记载的政权或群体数量而言,《太平御览》总共记载的数量已经扩充至《通典》的两倍。具体而言, “东夷”部分叙述了 22 个群体,与《通典》(20个)相较变化不大; “北狄”部分(8个)则较《通典》的42个大大减少;而 “南蛮”和 “西戎”部分则增幅显著,分别为181 个及160个,分别是《通典》同类别的3.2 倍与2.1倍。显示出《太平御览》在编修时,至少在南蛮和西戎部分参考文献范围已大为增加,较 之《通典》走得更远了。

(二)各部内容的变化

除了上述部类设置明显的变化之外,《太平御览》的部名大部分与《艺文类聚》相同或相近。周生杰便按照部类名称和引文内容,制作了《艺文类聚》与《太平御览》部类继承关系的对照表。【26】

这样一种对照表,对于我们理解二书关系、分析各部比重和内容变化无疑是相当重要的,但是少部分相似部类下包含的内容,却可能存在相当大的差异,以至于无法断定二者必然存在继承关系。本文作者之一便借助 “类书对应查询系统”,根据相似条目分布的情况,重新判读了二书相似部类的情况,如下表所示。【27】

表二:两部类书相似条目对应情况


其中最明显的差异,在于《艺文类聚》中的 “符命”、 “仪饰”、 “内典”、 “祥瑞”四部后来的演变上。 “符命”部上文已经提及, “仪饰”部(表中第25笔)则是讲述节、黄钺等与礼仪制度有关的器 物文献,总计收录52条内文。其内容在《太平御览》中并非进入器物、杂用部,而是仪式、兵、天、人事等诸部。而 “祥瑞”部(表中第45笔)总计收录了210条引文,讲述的是各种代表吉祥的自然界现象,如树木结为连理、麒麟或凤凰出现等,它们的出现往往象征着皇治昌明及天下太平。而到了《太平御览》中, “祥瑞”部超过六成(130 条)的内容,都可以在收录各种鸟类的 “羽族”部中找到。如战国时期思想家荀况(BC 313-238)的一段话: “古之王者,其政好生恶杀,凤在列树。”这句话最后一句 “凤在列树”,亦被改动为 “麟在郊野”及 “鸟鹊之巢可俯而窥”,收入同书 “祥瑞部/麟”及 “鸟部/鹊”之下。而在《太平御览》中,有关麟的一段不见了, 有关鸟的两段则均收入 “羽族”部之下,一条放在凤类,一条放在鹊 类。而在《太平御览》中含义与之接近的 “休征”部(休征为古语,其含义亦是吉祥的征兆)中,与《艺文类聚》 “祥瑞”部共引的则只有约四分之一的内文(49条)。

至于《太平御览》中的 “释”、 “道”二部,名称上似乎和《艺文类聚》中的 “内典”部及 “灵异”部存在关联,但检视内容之后,便会发现其关联颇为微弱。所谓 “内典”,乃是一种佛教中心的词汇,意指佛教之内的经文典籍等,而佛教之外的书籍,则归之为 “外典”。早在南北朝时期,梁国的虞孝敬(南朝人,生卒年不详)便着有《内典博要》,按照类书的体制编排佛教典籍。初建的唐王朝继承了南北朝以来崇佛的气氛,因此在名称上亦沿用之。道的部分则尚无专门类别,而需要到 “灵异”部下面的仙道目中去搜寻。在两部类书之间,已经出现了这一类别的划分,据说在《艺文类聚》编修后不久,武则天时期又有编辑一部类书《三教珠英》, “于旧书外,更加佛、道二教及亲属、姓名、方域等部。”【28】 不过这部类书现在已佚,无法一窥其详。在中唐时期编修的官修类书《初学记》中,亦设有 “道释”部,按照先道后佛的顺序,引用其经籍叙述其来历。【29】 从表格中亦可看出,与《艺文类聚》描述佛教的 “内典”部存在最多相似部类的,并不是《太平御览》的 “释”部,而是 “四夷” 部。事实上, “四夷”部中仅有 37 条(占 4%)可以在前者中找到共引条目,且分散于 20 个不同的部当中,不过最大宗的来源便是 “内 典”部(12 条)。因为佛教的交流,亦同时带来了关于域外政权或群 体的信息,由此便成为此增设部类的知识来源。而该书 “灵异”部与《太平御览》 “道”部共引的条目,更仅仅有 8 条(不到 0.6%),显示其内涵有极大变化。

至于其它各部,研究者未注意《艺文类聚》中内容的一个最大宗的流向,便是《太平御览》中的 “人事”部。它是《太平御览》中内文最庞大的一部,达 9339 条,占了整部类书内容的 14.2% 。尽管《艺文类聚》中的 “人”部亦是最大的一部,涵盖了 2600 条内文, 但《太平御览》整整扩充了 6739 条,这是其它任何部类都难望其项背的。它在部之下目的划分上,也比《艺文类聚》同部多出了 218 个目,仅次于 “皇亲”与 “职官”二部。至于其内容,涵盖了人的生理、心理、情感、行动、特征等诸方面,亦成为唯一一个可以在《艺文类聚》的37个部中均找到相似条目的部类,可见其地位之重,以及收录范围之广。

(三)各部比重的变化

整部类书而言,《艺文类聚》总计有 14572 条引文,《太平御览》 条目数则扩充至 65633 条,后者的条目数较前者扩充了 4.5 倍。若按照天、地、人、事、物的总体框架进行比较,会发现条目数增加最多的,乃是 “地”、 “事”两大类别,分别增加了6.1 倍与5.7 倍,高于整体的平均数。

 表三:两部类书各部条目数比重情况(前 10 部)

对于同一部类书中不同部之间比重不均的问题,之前研究者也早有注意到。如郭伯恭便根据《太平御览》各部包含的卷数,指出 “人事”、 “兵”、 “职官”、 “皇王”、 “礼仪”及 “地”六部,规模均在40 卷以上,加起来几乎占了全书总共千卷的近二分之一。而不满 10 卷者总计有 20 部,反而未及全书的十分之一。【30】这是一种各部比重的蠡测方法,不过在今日,我们亦可以有诸多其它重新估算的方法。姑且以各部所含的条目数量而计,排在前六位的便与按卷数者略有不同,即 “人事”、 “兵”、 “职官”、 “地”、 “礼仪”及 “居处”六部,换句话说,卷数虽多的 “皇王”部,条目数却不及 “居处”部。总体而言,这六个部的条目数占了全书的近四成,而每个部包含的条目数都超过了 2000 条,最多的 “人事”部更达 9339 条。若在加上排在其后的 “天”、 “州郡”、 “兽”、 “羽族”四部,即相当于全书总条目数的二 分之一。

若将《艺文类聚》、《太平御览》两部类书进行比较的话,会发现就各部条目数而言,二者排在前十名的部,有 “人事”( “人”)、 “职官”、 “礼仪”( “礼”)、 “天”、 “兽”五部雷同。不同的是,《艺文类聚》中还有 “鸟”、 “乐”、 “药香草”、 “果”、 “木”几个部,这些部在《太平御览》中的比重均大大下降。《太平御览》中的 “兵”、 “州郡”、 “地”三部,则因分别合并了《艺文类聚》中的两个至三个部类数量扩充,而跃升至前十名之列, “居处”和 “羽族”两部亦后来居上。而两部类书条目数排在后十名的,则没有一部雷同。《艺文类聚》分别为 “布帛”、 “储宫”、 “衣冠”、 “后妃”、 “刑法”、 “州”、  “仪饰”、 “ 方术”、 “ 符命”及 “郡”部, 每个部的条目数均没有超过百条,最少的 “郡”部更只有25 条。而到了《太平御览》中,除了 “符命”部取消外,其它各部则均因合并、扩充、改造等因素而上升。在该书中屈居后十名者,包括了由《艺文类聚》中一部拆分而来的 “舟”部,和由部下面的一目演化而来的 “逸民”、 “香”、 “妖异”、 “神鬼”、 “竹”、 “奉使”6 个部,新设的 “释”、 “偏霸”部,以及 “杂物”部。由类升部,或多或少反映了这些类别在当时士人心目中重要性的上升,而与其条目数多寡无关,如讲述奉命出使事宜的 “奉使”部,便仅有 69 条,却独立为一部。至于《太平御览》条目数扩充最多的部,除了上文提到的 “人事”部外,依次是 “兵”部,包含4649 个条目(比《艺文类聚》中的相似部类增加4322 条), “职官”部(增加3242 条)、 “地”部(增加2540条)、 “居处”部(增加1820 条)、 “州郡”部(增加1752 条)、 “天”部(增加1366 条)等。 【31】 其中, “兵”部的条目数在《太 平御览》各部中排名第二,而在《艺文类聚》中,与之相似的 “军器”与 “武”部分别排在第 22 和 31 位。其引用的文献来源有 360种,而《艺文类聚》的 “军器”与 “武”部分别是 29 种和 81 种。 “职官”部的条目数在《太平御览》中排名第三,在《艺文类聚》中 更排名第二,显示该部的文献累积一直颇为丰富,亦受到当时官僚文人的推重。至于其文献来源的书籍,可以发现《史记》、《汉书》、《三国志》、《后汉书》、《晋书》等史书,均是二书最为倚重的文献,而《旧唐书》及五代时期的史书,则是《太平御览》新增的重要材料来源。另外值得注意的是这两个部类中均引用了不少来自于唐代杜佑编修的《通典》, “兵”部有 118 条, “职官”部有 30 条,占了整部书对于《通典》引用量的近四分之三。

就条目来源所属的时代而言,《太平御览》中两部虽然都增加了唐、五代的史料,但增加更多的是前代的资料,在 “兵”部中最多的是来自周朝文献的条目(1007 条),其中来自《左传》者便超过三分之一;其次为汉、晋、南北朝时期。  “职官”部条目数最多的集中在晋朝(1112 条),其后为汉、南北朝时期。若仅就来自唐代以降新增书籍的条目而言, “职官”部增幅近四分之一,高于 “兵”部。尤其 来自《旧唐书》的条目数达 415 条,是该部总计 289 个文献来源中收录数最多的一个。

而从 “释”、 “道”两部在二书中分类和比重的变化上,我们更可以窥见在当时高层文人心目中该类别地位的变化。在《太平御览》的55 个部中, “道”部的条目数排在第14 位,而 “释”部则排在第50 位(倒数第6),显示出二者地位至少在该类书中极大的不平衡,这与《艺文类聚》中的情况形成了鲜明的对比。就条目数和内容而言,《艺文类聚》 “内典”部在该书 46 部中排名第 26,位居中游。此部其实对于佛教事迹的叙述非常简略,绝大部分条目是著录和佛教有关的诗文、寺碑等,大半均来自笃信佛教的南北朝时期,一方面反映的是南北朝时期鼎盛的文学传统的延续,另一方面亦有史料汇编的性质。到了《太平御览》中, “释”部则是专门针对佛教情况专设的部,下分为叙佛、奉佛、僧、异僧、经、象、戒律、禅、塔、寺等 10 目, 总计197 条引文。其中只有一条来自《艺文类聚》,还是从 “礼” 部,而非 “内典”部借来的。另外一个突出的特点,是引自唐代以后 编修书籍的内容极为丰富,超过三成,在总计 55 部中排名第二。

而与佛教相比,道教的宗教化成果更是达到令人惊异的程度。 《艺文类聚》中,它并没有独立的一部,而内容颇为庞杂的 “灵异”部,下设仙道、神、梦、魂魄四目,其中前两部分提到的或传说、或真实人物事迹,在2-6 世纪道教逐渐宗教化的过程中,亦被收入道教的众神谱系当中。【32】不过,道教似乎还未被当作一个系统化的宗教对待。到了《太平御览》中,不但新设独立的 “道”部,其下更分设道、真人、道士、斋戒、养生、仙经等总计53 个目,为佛教的5 倍多;引文数量更达1402 条,为佛教的7 倍之多。引文内容则涉及到道教的教义、组织、人员及经典,更谈起其日常服装、礼仪用品、建筑样式及师承等,展示的是一个组织严密、无远弗届、与日常生活紧密相关的道教形象。按照汤一介的研究,在东晋南北朝时期,道教形成为完整意义上的宗教团体,包括它具备了一整套理论体系,形成有影响力的教会组织,具有较固定的教规教仪,还有阐发其教义的经典,及固定崇奉的神灵和教派的传授史等。【33】 但是在唐初编修的《艺文类聚》中,这一发展趋势显然并未得到足够的重视;直到宋初的《太平御览》,我们才看到了这一发展的恢弘成果。

虽然《太平御览》的条目安排上出现了有关道教的条目远胜佛教的现象,但若将比较的视野扩大,会发现佛教在知识架构中的势力仍 然占据极为重要的分量。在编修《太平御览》同一时期,同样由李昉 主导编成的另外两部大型类书《太平广记》和《文苑英华》,便俯拾 皆是大量与佛道教有关的资料。二书的编修目的是为了弥补《太平御览》对于文学作品收录的不足,因此其中文学作品占了很大比重。傅大为(Fu Daiwie)的研究亦指出,《太平御览》与《太平广记》来源于唐五代以来不同的笔记传统,前者以帝国为中心,在知识界占据优势,与文人及官员生活更契合;而《太平广记》则缺乏政治中心,与民间宗教及普通人信仰世界相结合。【34】


【1】罗伯‧丹屯(Robert Darnton):〈哲学家修剪知识树:『百科全书』的认识论策略〉,收于罗伯‧丹屯(Robert Darnton)着,吕健忠译:《猫大屠杀:法国文化史钩沉》(台北:国立编译馆,2005 年),页 265-298。

【2】张涤华:《类书流别》(北京:北京商务印书馆,1943年),页4; Qu' était-ce qu'écrire une encyclopédie en Chine? (What Did It Mean to Write An Encyclopedia In China?), edited by Florence Bretelle-Establet and Karine Chemla (Saint-Denis: Presses Universitaires de Vincennes, 2007).

【3】张涤华:《类书流别》,页1-33; 胡道静:《中国古代的类书》(北京:中华书局,1982 年),页1-22。〔美〕周绍明(Joseph P. McDermott)着,何朝晖译:《书籍的社会史:中华帝国晚期的书籍与士人文化》(北京:北京大学出版社,2009 年),页 58、91、150。

【4】张涤华:《类书流别》;胡道静:《中国古代的类书》;邓嗣禹:《中国类书 目录初稿》(台北:古亭书屋,1970 年)。

【5】Fu Daiwie: “The flourishing of Biji or Pen-notes texts and its relations to history of knowledge in Song China (960-1269),” in What Did It Mean To Write An Encyclopedia In China?, 105-107;〔荷〕许里和(Erich Zurcher)着,李四龙等译:《佛教征服中国》(南京:江苏人民出版社,1998 年),第二版序言页5。

【6】葛兆光:《七世纪前中国的知识‧思想与信仰世界》(上海:复旦大学出版社,1998 年),页 21。

【7】宋家复:〈从《册府元龟》论北宋初期类书式历史书写操作的典范意义〉, 《新史学》第 25 卷第 4 期(2014 年 12 月),页 68-94。

【8】按照南宋一位官员称道后者的说法,其 “备天地万物之理,政教法度之原, 理乱兴废之由,道德性命之奥。”李昉等敕撰:《太平御览》,原序,景印文渊阁四库全书本(台北:台湾商务印书馆,1975 年)第893 册,页3。

【9】在我们所用的文本中,《艺文类聚》是根据上海古籍出版社1982 年纸本建置,《太平御览》根据的是1986 年台湾商务印书馆景印《文渊阁四库全书》本建置。全文电子资源来源于国学网(网址:http://www.guoxue. com/),本资料库去除了其中的注释。

【10】关于出处的统计会在下节中较详细的说明。

【11】Thomas H. Cormen,Charles E. Leiserson,Ronald L. Rivest和Clifford Stein,Algorithms of Introduction(2nd ed.)(Cambridge:MIT Press and McGraw-Hill,2001),350-355。

【12】条目的处理和共引度的计算,主要见钟嘉轩:《类书知识分类变化之自动分析与讨论:以<艺文类聚>与<太平御览>为例》(台北:台湾大学电机资讯学院资讯工程研究所硕士论文,2013 年)。

【13】钟嘉轩:《类书知识分类变化之自动分析与讨论:以<艺文类聚>与<太平御览>为例》,页28-29.

【14】网址见 http://leishucis.digital.ntu.edu.tw/,2013 年 7 月上线。

【15】http://thdl.csie.org/L303_YiWen_YuLang/RetrieveDocs.php本系统需要登录。 Jieh Hsiang, Szu-Pei Chen, Hsieh-Chang Tu, “On Building a Full-Text Digital Library of Land Deeds of Taiwan”, Digital Humanities 2009 (College Park, Maryland, 22-25 June, 2009).

【16】葛兆光:《七世纪前中国的知识‧思想与信仰世界》,页 601-603。

【17】周生杰:《太平御览研究》,页 401-403。

【18】李昉等敕撰:《太平御览》,原序,页 893-3。

【19】陈盘:《古谶纬研讨及其书录解题》(台北:国立编译馆,1991 年),页 1-98。

【20】葛兆光:《七世纪前中国的知识‧思想与信仰世界》,页 601-603。

【21】周生杰:《太平御览研究》,页 363-364。

【22】胡道静:《中国古代的类书》,页 87-108。

【23】周生杰:《太平御览研究》,页 191。

【24】唐光荣:《唐代类书与文学》(成都:巴蜀书社,2008 年),页 114。

【25】杜佑撰;王文锦等点校:《通典》(北京:中华书局,2007 年重印本),页 4978-5512。

【26】周生杰:《太平御览研究》,页 401-402。

【27】钟嘉轩:《类书知识分类变化之自动分析与讨论:以<艺文类聚>与<太平御览>为例》,页 65-69。

【28】王溥:《唐会要》(上海:上海商务印书馆,1936 年)(七),卷36,页 657。

【29】不过由于体制的关系,其正文偏重于个别词汇,下面采用小注引用其它书籍内文。徐坚:《初学记》(台北:台湾商务印书馆,1983 年,景印文渊 阁四库全书本,第 890 册),页 363-372。

【30】郭伯恭:《宋四大书考》(台北:台湾商务印书馆,1971 年),页 22。

【31】本统计数字中《太平御览》的 “兵”部,为《艺文类聚》中的 “武”、 “军器”二部合并之后进行比较; “地”部,乃是与《艺文类聚》中的地、山、水三部合并之后进行比较; “州郡”部则是与《艺文类聚》中的州、郡二部合并比较。

【32】葛兆光:《七世纪前中国的知识‧思想与信仰世界》,页 484-505。

【33】汤一介:《魏晋南北朝时期的道教》(台北:东大图书出版公司,1988年),页 11-13。

Fu Daiwie: “The flourishing of Biji or Pen-notes texts and its relations to history of knowledge in Song China(960-1269).” in What Did It Mean to Write An Encyclopedia in China?, 105-107.

主编:陈静     责编:顾佳蕙     美编:张家伟

关注零壹Lab,获取更多数字人文信息!