本研究以唐诗中的金陵意象为对象,以《全唐诗》为文本,试图采用文本挖掘、文本分析与文本可视化的方法,对唐诗金陵意象的时代特点和意象组合形式进行分析。
意象是诗词中最小的意义单位,通常由数个字符构成,而诗是一个独立自足的意义符号系统。“金陵”本指代魏晋南北朝时期的帝都空间,进入诗词文本中就成为了一种意象符号,用以表达作者的创作意图。金陵能够成为一种意象,与这一地点所经历的历史变迁、城市兴衰息息相关。自秦始皇时起,秣陵就因其优越的地形条件和突出的地理位置引起统治者的注意;三国时期,更形成了“王气”传说,东吴、东晋以及南朝的宋、齐、梁、陈均定都于此。但是,历史现实背离了金陵作为“帝王州”的命运,在唐代以前,定都于金陵的政权皆偏安短命,国家兴衰、政权更迭无数次在该地上演。金陵特殊的历史遭际引起了史家与文人的注意,诗人、词人咏叹金陵,也往往着眼于此地历经的沧海桑田,金陵由是逐渐成为了咏史诗与怀古诗中的常见意象。
值得注意的是,由于中国文字语词的多义性及丰富的隐喻性,诗词意象意义历经长久发展会发生意义的增生,在文学史上呈现出演变特征。
首先,许多承载金陵历史的地点均成为了金陵意象,具有代指金陵、表达特定意义的功能,例如石头城、乌衣巷、景阳宫井等,这些意象属于本研究所关注的金陵意象的范畴。
第二,金陵意象经常与其他常见的诗歌意象发生组合,共同营造某种文学意境,表达作者的创作意图。因此,意象的组合方式是本研究关注的重点。从符号学的角度来看,诗词中的意象符号具有组合与聚合关系,后者被索绪尔称为联想关系,即把不在现场的要素统一在潜在的记忆序列中。对与金陵相关的意象的组合方式进行考察,可以窥得诗词背后隐藏着的诗人的深层创作意图与情感空间。
第三,唐朝的文学史一定程度上是对社会史、政治史的影射,因此,不论是咏史诗、怀古诗的创作,还是金陵意象在诗歌中的使用方式,都呈现出一定的时代特征,这同样是本研究期望发现的问题。
古代诗人的咏史怀古诗创作,为当地和后世留下了充满历史典据和故事性的地点和意象,汉学家宇文所安曾以“金陵”为例,将关注点置于“诗人是从何时开始在诗歌中把它作为‘怀古’的地点;从古至今它的诗歌意象在回忆文本中有没有发生变化;是文本让读者记住了地点还是地点让读者记住了文本?”我们也将通过本次对《全唐诗》的文本研究,对唐代怀古咏史诗中的金陵意象进行时代性分析,以回应宇文所安的追问。
本研究主要采用文本挖掘、文本标记、文本分析和文本可视化的方法。研究经历以下步骤:
1. 基于唐诗金陵意象相关研究成果与《全唐诗》的编修特点,对《全唐诗》的TXT 文档进行初步梳理。
(1)《全唐诗》的编修特点
《全唐诗》成书于清朝康熙年间,由彭定求、沈三曾等翰林院学者编纂,据可信统计,存诗49403 首,收罗作者2873 人。全书卷帙浩繁,旨在集成唐代诗作,其结构有意模仿官方修史,参照了二十四史通用的“纪传体”编排法。此种目录编排方式体现出《全唐诗》作为官方钦定文化工程的特质。除采用纪传体这种以人物为中心的述史方法,《全唐诗》主体卷的编排还遵循了时间顺序,展现将“纪传体”与类似“编年体”记述方法相结合的特点。
(2)《全唐诗》TXT 文档预处理
对全唐诗文本的预处理,包含去除乱码、将文本划分为多个部分以及筛除完全没有出现金陵意象的部分,以前两步为主。
①去除乱码。纵观选用的全唐诗文本,发现其中存在大量乱码。具体表现为完整诗文结束后,凭空多出一个字。这些乱码的存在极大的影响我们的阅读体验,并且对后续的文本处理工作带来困难。举例如下:

由于乱码出现频率非常高,且完整文本将近390000 行,需要通过编写代码来快速解决问题。乱码清除后,文本可以正常使用。代码如下图:

②划分文本。本次选择依照全唐诗的目录结构将全篇划分为多个部分。第一部分为四卷帝王诗。第1 卷为唐太宗李世民诗作;第2 卷为唐高宗李治、唐中宗李显、唐睿宗李旦诗作;第3 卷是唐玄宗李隆基诗作;第4 卷为肃宗、德宗、文宗、宣宗、昭宗的作品合集。第二部分为第5 卷“后妃传”,其中包括武则天等作者。第三部分是第6 卷“宗室传”,作品较少,收有章怀太子名篇《黄瓜台辞》。第四部分为第7 卷,作者均为女性,身份比皇后、妃嫔要低。第五部分第8 卷和第9 卷,是五代十国统治者及其宗室、王妃的作品,包括著名词人南唐后主李煜的诗作。第六部分为第10 到第29 卷,是不同类型的乐府诗,包括郊庙歌辞、乐府杂曲、横吹曲辞、相和歌辞、舞曲歌辞、琴曲歌辞、杂曲歌辞、杂歌谣辞。第七部分开始为全唐诗的主体部分,从第30 卷开始。文本大致遵循时间次序,将唐初至唐末五代300 多年留下诗作的诗人一一罗列,其中作品较少者,多人合成一卷,相当于“合传”,而作品成规模的诗人享有“专传”。著名诗人由于作品数量众多,往往跨越数卷,例如自第161 卷至185 卷,均为“诗仙”李白的作品,共25 卷;第216 卷至234 卷,是“诗圣”杜甫的作品,共计19 卷。其中作品最多的是白居易,累计高达37 卷。第八部分从第732 卷高力士等宦官作品开始,至《全唐诗》结束。
2. 利用MARKUS 识别《全唐诗》中的金陵核心意象词,定位相关篇目。
(1) 依据金陵的古称、代称以及重要的人文地理标志、自然地理标志,初步制定了“金陵核心意象词表”,如下表所示:

(2) 采用MARKUS 的关键词标记法进行识别,定位与金陵意象相关的篇目,将其提取出来。接着,依据唐代文学史分期(初唐、盛唐、中唐、晚唐)将提取出的篇目划入四个TXT 文档,其中含初唐26 篇,盛唐126 篇,中唐161 篇,晚唐136 篇。
(3) 对提取出的篇目进行复查,保留金陵咏史诗、怀古诗、含金陵意象的其他诗共194 篇,其中含初唐7 篇,盛唐52 篇,中唐77 篇,晚唐58篇。
3. 利用MARKUS 进行金陵意象标记。
(1)将复查过的四个TXT 文档上传至MARKUS,建立文件。
(2)以避免意义判断的原则,按照自然属性对金陵意象群进行分类(A-植物类,B-动物类,C-自然现象类,D-颜色类,E-自然类地标,F-人文类地标,G-历史人物,H-情感词,I-金陵代称,J-其他金陵意象)。
(3)在四个MARKUS 文件内分类标记金陵意象。

4. 将保存的MARKUS 文件导入Docusky 进行转码,建立全唐诗金陵意象数据库,借助词云进行时代特征分析,利用palladio 呈现意象的组合形式。

结合唐代的社会背景与筛选出的各时期文本数量进行分析,可以发现怀古诗和咏史诗创作的丰欠通常与时局的安定性成反相关。初唐时期属于社会的上升阶段,金陵怀古与咏史这一类主题运用较少。盛唐社会兴盛,诗歌这一文学形式繁荣发展,风格丰富多样,题材广泛,涌现出许多著名的诗人。怀古与咏史作为一种题材受到诗人的关注,但此时的金陵怀古诗与咏史诗对于历史兴亡主题的表现并不充分,其感怀悲伤的情绪并不深重,怀古、咏史诗中的金陵意象还常被用作表达人生失意、怀才不遇的个人情怀或对六朝文化风流繁荣的留恋与追寻。中唐时期,社会经历安史之乱的打击后开始逐渐衰退,严峻冷酷的局势和社会现实使诗歌从浪漫主义转型为现实主义为主。虽然社会政治经济下行,但诗歌等文学形式经过长期积累发展完备,达到巅峰。此时的诗歌数量庞大、流派众多,题材更加广泛。其中金陵怀古诗、咏史诗的伤怀情绪强烈,诗人们通过创作以史鉴今,表达希望统治者吸取历史经验教训,力挽狂澜的情怀。黄巢起义后,唐代社会千疮百孔,政权风雨飘摇,诗人对前朝亡国的通感愈发强烈,此时的金陵怀古、咏史诗传递出强烈的悲伤与惋惜之前,表达感史伤世和借古讽今的无奈。

通过研究可知,金陵意象种类繁多,不同类别意象具有不同的作用,大致分为以下三种。
第一类代指金陵或表达特定含义的意象,与金陵强相关,包括金陵代称、自然类与人文类地标和其他金陵意象。第二类为创造意境、渲染烘托氛围的意象,是一种情感的间接表达,包括自然现象类、时间类、植物类、动物类、历史人物类和颜色类等。最后一种是直接表达感情的意象,通常为情感类词汇。
值得注意的是,同一类金陵意象具体含义不同,例如同属地名、地标类,石头城象征昔日孙权依山筑城、虎踞龙蟠的雄伟气势;乌衣巷、朱雀桥意象则代表对往昔风流繁华生活的留恋感慨;台城代指南朝君王荒淫亡国,其具体应用与怀古、咏史诗主题相关。同一意象还会伴随时代发展,受到社会环境等多种因素的影响发生改变,例如石头城这一意象的含义随着唐代社会环境变化,逐渐失去早期正面、积极的象征意,成为六朝故都的代表。
1. 全时期(整个唐代)金陵意象分析
(1)自然地标类存在两种具体内涵,一是与金陵密切相关,可以直接代指金陵的自然地标,例如钟山、秦淮和玄武湖等。另一种是江河、山石、沧海桑田等自然地标类意象,以伟大之物衬托人类生命的渺小或用永恒不变的事物反衬时代的瞬息万变,以此表达感慨。
(2)植物类、动物类、自然现象类也分为两个层面,一种是事实性描述,即客观存在的事物,但当诗人看见这些事物产生某种思绪时,这些客观意象就被赋予了特殊含义,成为一种意象。另一层是约定俗成长期存在特殊象征含义的事物,例如动物类意象中的龙、虎、大雁和丹凤等,植物类意象中的柳、芙蓉等。
(3)历史人物类意象的运用是诗人在创作中化用典故,可以更好的引起共鸣、传递情感。
(4)在颜色类意象中,颜色本身是对客观事物颜色的描述,但当它们与特定词语组合在一起时,在特定场合下就能作为一种间接表达情绪的符号,例如红颜、白头等词语中的颜色类意象。
(5)情感类意象包含为两层含义,一是像“恨”、“空”、“惆怅”、“悲”、“愁”、“怜”等直接表达感情的词语,另一层是“残伤”、“兴亡”、“亡国”等词语,因其有强烈的情感色彩和情感指向性,从而成为表达情感的意象。



2. 分时期金陵意象分析
纵观《全唐诗》中整个唐代诗歌使用金陵意象的情况,还需对不同时期的金陵意象进行研究分析。首先是一个横向的比较,每一时期金陵意象的使用频率存在一定差异,部分意象使用的频率会明显高于其他意象。通过数据可以得知自然和人文类地标在每个时期都是使用较频繁的意象。此外,初唐时期植物类、自然现象类和动物类意象使用较多,盛唐和中唐自然现象类、金陵代称、情感词意象使用频繁;中唐与晚唐时期,其他金陵意象较常使用,且金陵代称意象和情感词在晚唐的使用频率也较高。
将不同时期的金陵意象进行纵向比较,可以发现意象具体的时代特征。由于初唐时期的相关文本过少,因而在分析时更加关注盛唐、中唐和晚唐时期的文本。
(1)金陵代称

由数据可见,由盛唐到中唐,诗中使用的金陵代称数量明显减少,中唐与晚唐使用的金陵代称数量基本一致,呈现出代称符号逐渐同一化的特点。盛唐时期,金陵代称的突出特征是常见“帝王宅”、“帝王州”,如李白的《永王东巡歌十一首》中“龙盘虎踞帝王州,帝子金陵访古丘”。中唐偶见“天子气”、“王气”,晚唐则未见这种形容。
(2)人文类地标

由数据来看,中唐时期人文类地标的使用数量有明显上升,至晚唐则有下降,但人文类地标数量与总词数的比值却是逐期降低,呈现出诗中人文类地标的范围缩小、意义集中化。在盛唐时期,尚有劳劳亭、谢安墩、孙楚楼这类地标出现。“劳劳亭”位于今南京市西南,古新亭南,是古时送別之所,又名“临沧观”、“望远楼”。在古汉语中“劳劳”表示极度忧伤,我国成语中就有“劳燕分飞”之说。李白曾在《劳劳亭》中以亭为意象来表达人间的离别之苦。“谢安墩”亦出于李白笔下《登金陵冶城西北谢安墩》中的“冶城访古迹,犹有谢安墩。”这一古迹是晋时谢安与王羲之的登临之处,此诗当写于天宝末年安史之乱发生前后,李白从当时唐王朝的危机联想到西晋的永嘉之乱,感慨于谢安在乱世中救国的英雄壮举,也希望如谢安一样为国效力,在国难当头之际一展宿愿,又联想到自己怀才不遇、空有满腔抱负却无处施展的境遇,于是写下此诗来表达自己内心建功立业的壮志理想。“孙楚楼”为古酒楼名,在今南京城西,后亦泛指酒楼。李白在《玩月金陵城西孙楚酒楼》诗中“昨晚西城月,青天垂玉鉤。朝沽金陵酒,歌吹孙楚楼。”描绘了与金陵友人饮宴游乐的情景,生动形象地表现了李白的豪迈之情。
在中唐和晚唐更加常见的是石头城、台城、前朝宫殿这类历史遗迹。石头城位于今南京市西清凉山上,三国时孙吴就石壁筑城戍守,称石头城,后人也每以石头城指建业。曾为吴、东晋、宋、齐、梁、陈六朝都城,至唐废弃。这一时期咏怀石头城的怀古诗中以刘禹锡《金陵五题》第一首最为著名,此时大唐帝国国运衰微,朝臣相互排挤,地方藩镇势力割据,这首诗并不只是抒发思古之幽情,更有引古惜兴亡之意,希望君主能以前车之覆为鉴。台城是六朝皇宫,即建康宫,六朝时的禁城。刘禹锡也曾创作怀古诗《台城》,诗中还出现了结绮阁和临春阁
这类前朝宫殿的意象,陈后主曾在豪华的台城中建造了结绮、临春、望仙三座高达数十丈的楼阁,整天倚翠偎红,不理朝政。诗人通过对陈后主的奢侈荒淫生活以及六朝繁华景象转瞬即逝的描写,总结了一代兴亡的教训,抒发了回顾历史的感伤情怀和以古谏今之意,体现了诗人忧国忧民的情怀。
(3)其他金陵意象

盛唐可见晋代衣冠、南渡衣冠,体现出当时仍对魏晋风流的社会氛围、六朝文化的繁盛有怀恋的情绪,如李白的《登金陵凤凰台》一诗中的“吴宫花草埋幽径,晋代衣冠成古丘。”东晋南渡后也建都于金陵,而衣冠是士大夫的穿戴,借指士大夫、官绅等豪门世族,一说指东晋文学家郭璞的衣冠冢,现今仍在南京玄武湖公园内。晋明帝当年为郭璞修建的衣冠冢豪华一时,而如今已经成为一座古丘,被称为郭璞墩。而“南渡衣冠”原指西晋末天下乱,中原士族相随南逃、中原文明或中原政权南迁,后逐渐演化为熟典,代指缙绅﹑士大夫等避乱南方并落地生根的之事件。到中晚唐,意象指向更加单一固定,主要是与亡国相关的玉树后庭花曲,如吴融《金陵怀古》中的“玉树声沉战舰收,万家冠盖入中州。”和《水调》中的“可道新声是亡国,且贪惆怅后庭花。”
(4)历史人物类

从数据来看,自盛唐至晚唐历史人物的数量逐渐减少,任务数量与总词数的比值逐渐升高,呈现出历史人物类意象使用逐渐同一化的特点。盛唐时与谢安相关的意象使用频率还很高,谢安在当时作为一种江左风流的代表受到诗人追捧,如李白的《登金陵冶城西北谢安墩》中“冶城访古迹,犹有谢安墩。”和杜甫的《戏作寄上汉中王二首》中的“谢安舟楫风还起,梁苑池台雪欲飞。”中唐开始,与谢安相关的使用频率降低,出现江令、张丽华等意象,江令为南朝陈的亡国宰相,而张丽华是陈后主的宠妃,均为王朝政权衰败的象征,如刘禹锡《金陵五题·江令宅》中的“池台竹树三亩馀,至今人道江家宅。”和张祜《玉树后庭花》中的“玉座谁为主,徒悲张丽华。”中唐时期还出现借用张丽华和陈后主等历史人物意象暗喻唐玄宗与杨贵妃的故事,晚唐时出现的侯景,主要是以侯景之乱映射安史之乱或唐末的其他农民起义。
宇文所安指出,“在照片与电影的时代之前,一个地方主要是通过文本以它们程式化的意象而被知、被记住并成为值得追忆的。”金陵这一旧朝故都,作为饱含历史沧桑感的文化符号始终出现在各个时代的咏史怀古诗中,甚至成为了特定的诗歌主题。“诗歌中的金陵在几个世纪的过程中反复浮现,它的意象(不断得以)增加和润饰,直到最终被一些强有力的诗歌所支配。一旦诗歌中的金陵获得了意象上的补充,一旦它变得充实它就成为了一种静态平衡,一种对后代来说确定的实际上无法逃避的遗产。”可以说,历代文人被典籍、遗物、胜地勾起过去的回忆,对往昔发出遥远的呼应,也为未来留下连结的纽带,正是基于过去、现实与未来的层层交叠,金陵意象如今才能够呈现出丰富而饱满的叠加态,为世人留下了永恒的话题。
本研究得到的数据在一定程度上印证了宇文所安提出的观点。例如,金陵意象在不同时期均呈现出十分丰富的内涵,对金陵意象的解读不该只局限于悲情、伤感和哀愁,尤其在盛唐时期,许多诗篇不只描述死气沉沉的帝都陵墓和纸醉金迷的奢靡生活,而是怀着对六朝文化的孺慕与仰望、带着难以割舍的历史眷恋,塑造着这座城市独特的文化气韵与诗学形象。但受到学识、能力、时间等诸多因素的限制,本研究还有很大的开展空间,仍有许多数据提供的信息值得我们深挖。
本研究还存在许多不足之处。在研究开始,我们便发现对金陵意象的判断存在困难,提及金陵、谈论金陵的唐诗很多,但究竟何为“金陵意象”,则是需要人工界定的问题,并且需要仔细阅读文本、理解诗篇涵义才能做出选择,在这过程中可能会存在判定的偏差,导致文本的误读或遗漏。此外,本研究涉及对金陵意象的分类标注,但由于金陵意象数量繁多,往往以组合的方式出现,所以难以对金陵意象进行严格分类,本文采取的分类方式希望避免先入为主的意义判断,但仍难排除由主观性造成的疏漏和不严谨性。最后比较遗憾的一点是,本研究最初计划借助Palladio 平台将各类意象词的共现情况进行可视化,分析各类意象的组合方式,但由于该平台最近出现的技术故障以及本组研究时间的紧迫性,我们尚未实现这一目标。幸运的是,数字人文创新思维与方法课程的各位老师为我们提出了替代性方案以及许多其他的可行性建议,使我们看到了进步的方向。课程虽已结束,但本组成员依然希望将该课题进展下去,以期得出更多有益的成果。
[1]魏冉:《金陵怀古诗词的符号学阐释》,硕士学位论文, 南京师范大学中国语言文学;文艺学,2012 年。
[2]潘东晓:《唐代怀古诗研究》,硕士学位论文, 漳州师范学院中国古代文学,2011 年。
[3]黄珍妹:《唐代金陵怀古咏史诗歌研究》,硕士学位论文, 闽南师范大学中国古代文学,2016 年。
[4]沈学玕:《唐宋诗词中的金陵怀古情结》,《南京邮电大学学报:社会科学版》2011 年第2 期,第91-95 页。
[5]弓亚斌:《唐宋咏史怀古创作中的“金陵”情结》,《天水师范学院学报》2013年第01 期,第79-83 页。
[6]王宏林:《论“四唐分期”的演进及其双重内涵》,《文学遗产》2013 年第02 期,第37-49 页。
[7]李倩:《论宇文所安中国古典文学研究中的“断片观”》,硕士学位论文,上海外国语大学比较文学与世界文学,2012 年。
[8](美)宇文所安著:《追忆》,郑学勤译,北京:三联书店,2004 年,第21页。
[9]乐黛云,陈珏编:《北美中国古典文学研究名家十年文选》,南京:江苏人民出版社,1996 年,第140 页。