公众号:lingyilab
零壹Lab:记录数字媒介之日常,反思科技与人文精神
01Lab: Archiving digital lives, reconceptualizing sci-tech and the humanities
向帆,清华大学美术学院副教授。
何依朗, 清华大学美术学院研究生。
导言:近来 《远读》 一书在中国被大量论文所引用。从大部分论文来看,“远读”概念是一个以计算 机技术介入文本分析的重要方法和理论。相当多的引用存在不严谨问题,令人怀疑 《远读》 中“远读” 的原意是否与中文学者的理解相一致。文章比对涉及 《远读》 的中文论文与 《远读》 英文原文,在辨 明正误的过程中追寻真意。研究发现:《远读》 可以被理解为量化分析在文学研究中的早期实践形成过 程;但《远读》 中的“远读”不包括对计算机数字技术处理的内容,也不是一个成熟的理论和方法。
笔者在知网检索发现,2016- 2017 年,出版于 2013 年的 《远读》 (Distant Reading)[1]被 13篇中文论文引用。同时,该书作者莫莱蒂(Franco Moretti)的论文被中国学者引用205次,2014年后尤为明显。由此可见莫莱蒂的影响力在中文学界比《远读》来得更大。矛盾的是,《远读》至今并没有中文译本,原作者在中文文献中的译名多样——从弗朗科·莫瑞狄到佛朗哥·莫雷蒂、佛兰科·莫雷蒂、弗朗哥·莫莱蒂、福兰克·墨罗蒂、弗朗哥·莫瑞提、弗兰克·莫莱蒂、莫瑞提等,书名则被翻译为 《远离阅读》《远读》《远距离阅读》等。这些不同的翻译不仅造成了检索困难,也不利于相关论文之间的互证互引。笔者还发现了同一文章被引自不同出版媒体;没有指明引用文本的准确位置,如章节、页码,甚至标注了全部达20 页的整个章节,让读者无法定位原文等问题。为此,笔者尝试在《远读》的原文与引文之中近读“远读”概念,以窥“远读”的真意。
笔者发现,虽然《远读》被中文论文热引,而《远读》中的文章本身被更早地引用过。例如,书中的文章《世界文学的猜想》(Conjectures on World Literature,2000)被引共65次,其中53次引自《新左翼报告》(New Left Review)[2],1次引自《讨论世界文学》(Debating World Literature,2004),而不是《远读》。为什么会产生一个文献出现源自不同媒体的问题呢?《远读》的扉页上表明本书是一个论文合集,并标明每篇文章发表的时间与媒体,其中7篇发表于《新左翼评论》的文章可以在线获取,也就是说所有本书中的文章都可能有至少两个以上引用源。
就引用《世界文学的猜想》英文原文的中文论文来看,论文之间的关系更加复杂,扑朔迷离,其中隐藏着本文前述的译名混乱问题。例如,2007年简·布朗的论文在引用文献中出现“弗朗科·莫瑞狄(Franco Moretti)”“Conjectures on on World Literature”[3]。之后王宁等引用该文,赋予 Franco Moretti 的中文译名是“弗朗哥·莫瑞提”[4]。有趣的是,虽然诗怡于2010年全文翻译《世界文学的猜想》[5],却赋予Franco Moretti 的中文译名为“弗兰科·莫莱蒂”。不同译名的论文被其他文献继续引用,莫莱蒂的学术成就就变得更加难以查证、统一,从引用文献上来考察《远读》,多引用源、中文译名的问题让笔者很难精准地统括其影响力。
笔者发现《远读》中的例图有误引现象。例如,《数字人文背景下“远距离可视化阅读”探 析》[6]引用的图例《哈姆雷特》人物网络分析是彩色的,并标注为引用自《远读》,而该书实际是黑白印刷的,却与《纽约时报》的书评文章例图一致[7],此图被标注来自斯坦佛大学文学实验室,插图制作者是Joo Mo Kang而不是莫莱蒂本人。此外,该文指出此图是计算机成果——“2010年斯坦佛文学实验室成立,致力于计算机分析文本,验证假设、建模与量化分析文本内容......在后续研究中,实验室对文本的情节进行了进一步的探究,如参照网络分析理论,把《哈姆雷特》的情节用网络关系表达出来...”此图结构与《远读》书中《网络理论,情节分析》(Network Theory,Plot Analysis,2011)一文中展示图例结构相同,莫莱蒂指出:“本研究中的所有网络图是由手工制作完成的,希望能够以弱化交叠的方式来实现最大化可视度的目标。”[8]215
笔者发现不少论文定义《远读》是一本与大数据、计算分析、计算机相关的著作。比如,注 释《远读》是“借助大数据分析进行文学研究的创新性著作”[9];“远距离阅读”这个词被作为“数字人文广为人知的方法,其研究核心在于以各种模型处理‘大量未读’问题”[10];《王安忆“90年代”的上海小说机器市民意识形态》 [11]一文正式使用“远读的工作”这一说法,当作者提起什么是“远读”这一概念时,却以“远读要求我们...”来回答,再以“远读”概念作为“为什么在第一章将会出现许多表格”的解释。看起来“远读”概念已经是一个以数据、表格和视觉化为范式的工作方法。那么,被认为是广为人知的方法是不是就是《远读》中的“远读”呢? 2017年国内数字人文学者指出:“具有反讽意味的是,莫雷蒂教授首次提出‘远读’的概念并非是在一个计算分析的语境中,而是在他思考非常宏大规模的“世界文学”研究主题的时候。”[12]为什么是反讽呢?笔者认为反讽一词恰好反映出我们对《远读》原文原意的陌生。笔者发现《远读》一书中只提及过“远读”概念5次,其中4次出现在《世界文学猜测》的一个小节之中,这个部分并不涉及计算机处理和大数据等概念。而且其中不少早期论文的内容与定量分析无关,例如,《现代欧洲文学:一个地理草图》[13]就没有任何定量信息的概念,而是不断以形态进化学的知识来推论欧洲文学的发展和变化。
《远读》中《世界文学的猜想》的“远读”概念与计算技术无关,虽然《远读》中的文章 Style.Inc: Reflections on 7,000 Titles (British Novels,1740-1850)直接采用计算机技术(类似Excel柱状表格),但尚不理想。莫莱蒂在《网络理论,情节分析》一文中写道:“本能是一个好事,但是概念更好,在我写作此文的同时,文学实验室正在进行更大的戏剧和网络理论研究:包含来自不同文化和历史阶段的上百个剧本。但是这是另一个故事,应该写入另一本书里。”[8]212。2010年,也就是《远读》中绝大部分论文完成后,莫莱蒂与马修·乔克思(Matthew L. Jockers) 才一起共同建立文学实验室,开始运用计算机算法来分析文学文本。莫莱蒂与实验室成员共同发表了不少文章,力图证明定量分析方法对文学研究的价值。“任何新的文学研究方法必须可以自证,不仅必须证明它能够完成正常的分析,而且还要比现有的分析方法做得更好,或至少同样好。”[14]204 2017年莫莱蒂在接受采访时说,“远读”尚处于一个“漫长的研究过程中的一个阶段,第四或是第五阶段吧”[15]。因此,笔者认为此“远读”并非那些“广为人知”的“远读”。
在 《世界文学猜测》 中,莫莱蒂为“远读”概念写了一个小段,认为“远读”的意思是:“距离是一个知识的条件:它允许你关注的单位比文本更小或更大:方法、主题、修辞或类型和体系。如果在非常小的和非常大的之间,文本本身消失了,那么,这就是其中一个例子,人们可以合理地说少即是多。如果你想更多地理解这个系统的整体性,我们必须接受失去些什么。我们已经对理论知识付出了代价:现实是无限丰富的; 概念是抽象的,少有的。但正是因为概念少有,所以它是可能被掌握,并被理解的。这就是为什么少即是多。”[16]莫莱蒂的解释的确与我们今日所见的使用的大型文本数据分析实践是一致的,计算机科学家、人文学者确实可能在牺牲细节信息的情况下看到超级大量文本中的趋势、结构等普通阅读无法发现的现象,这也许正是“远读”这一概念被称为“数字人文的初始点”[12]的原因。
莫莱蒂对“远读”概念的说明举例,是从弗雷德里克.詹姆逊(Fredric Jameson)在介绍柄谷行 人(Kojin Karatani)的《现代日本文学的起源》时发现“日本社会生活素材和西方小说的抽象形式不能总是完美地结合在一起”[5]的观点开始,介绍自己如何从假象开始,通过二手资料(文学批评专著)来获得一个对世界文学观察的距离,呼应了自己对文学分析所提出的观点:“文学史将很快变得与现在截然不同:它将成为‘二手’:一种由他人的研究拼凑而成的拼凑物,没有单一的直接文本阅读。”[5]即他在并没有近距离大量阅读各国文学作品的情况下,实现了对世界文学的一次宏观考察,这种远距离的考察方式具有了意义。
《纽约时报》 在对莫莱蒂的采访中指出,莫莱蒂对“远读”的定义是:“通过聚合和分析大量数据来理解文学,而不是研读特定的文本。”[7]笔者则认为《远读》中的“远读”概念是指一种牺牲细节信息、获取宏观观察视野的考察方法,至于牺牲细节的方式则是各异的。
笔者猜测莫莱蒂对文本视觉化一直怀有矛盾的心情,既喜欢视觉化所具有的表现力,又充满无力驾驭的迷惑。从《欧洲小说地图》的地图[17]、《图表、地图和树》[18]中的表格到《网络理论,情节分析》中的网络图,他一直以手绘方式视觉化文本信息。虽然方法笨拙,但他认识到视觉化其实具有一种认知隐喻的功能,能够让他以新的方式观察到文学历史的趋势和现象,并声称这是一个“短暂的幸福”(Brief Happiness)[8]。莫莱蒂的手工文本视觉化确实产生了一些有价值的研究成果。比如,在 《文学的屠宰场》 中,他描述了如何以柯南·道尔的侦探小说绘制出“线索进化树”;11年后的《网络理论,情节分析》 再次聚焦于文本视觉化方法,将 《哈姆莱特》《红楼梦》的对白关系视觉化,再现书中人物关系结构,观察到宝玉与宝钗、李奶奶和仆人茜雪等互动时所呈现的多面人格,以此方法分析东西方小说中的 人物网络关系的差异。若按照《远读》最末一文《网络理论,情节分析》的最后一段来看,莫莱蒂对视觉化是充满期待的:“有一天,更丰富的图像可能会帮助我们看到不同的文学类型所对应的形状;在理想的情况下,甚至可以让人在大的网络中辨认出其中的微观模式。图像,观察,可见,图案,形状......这些视觉化的词汇将铺满通往未来的道路。”[8]240
然而,文学实验室公布的《网络理论,情节分析》 [19]比《远读》多了一个章节《后记·理论、可视化的概念》,这个章节可以说是一个大逆转。莫莱蒂发现,通过计算机技术所生成的《哈姆雷特》人物关系视觉化成果虽然拥有更多信息纬度,却让人看不懂,观察不到什么新的现象“:人很 难认识到自己已经走入一个死胡同,我们确实是 走到了死胡同。网络形式对于情节结构的直观知 识有重要的作用,但是在有用性方面有其局限。”读者可以感受到表述中的情绪,他认为自己对数字技术的参与并没有准备好,流露出对缺乏数学智慧的遗憾。
莫莱蒂在此提出了一个新方向:“让我们离开图像一段时间,将直觉让位给概念(网络大小、密度、聚类、中间性...)和统计分析。”这让笔者想起法国制图家和理论家雅克·伯丁(Jacques Bertin,1918- 2010),他在莫莱蒂说不清楚的“概念”(网络大小、密度、聚类、中间性...)方面早就积累了大量成果,提出了视觉变量的概念,总结出视觉元素与信息认知之间的关系。可惜,被莫莱蒂誉为新起点的文学实验室研究者瑞安侬·路易斯(Rhiannon Lewis)在后续研究中并没有显示出对视觉语言逻辑的重视,其研究采用比莫莱蒂更先进的计算机技术,“以弗兰科·莫莱蒂对三部莎士比亚戏剧《哈姆雷特》《麦克白》《李尔王》的网络分析为基础,从麻省理工学院获得的莎士比亚语料库的xml文件中提取对话的数据,使用R语言视觉化其中的人物关系......”[20]这后续发生的一切好像与莫莱蒂所指的新方向无关。
基于《远读》的引文及原文的考察,笔者辨明了曾经在阅读“远读”概念相关的论文中所发 现的问题。这些问题可能是由于缺乏一手文献调查、望文生义造成的,也可能是由我们对“远读”的期待所产生的误解,但导致了一个被热议的学术概念被扭曲、一本书的真意被误解。《远读》中的“远读”概念并不是遍及全书,也不是一个完整的原理和方法,而是莫莱蒂个人的“远读”概念的发展的过程,是他从生物进化知识起步,历经地理学、地图学、数组和图表等,逐渐抵达以定量分析介入文学分析的过程。正如他所写道的:“一步引领一步,一步要求一步。有一天,我意识到我的形态进化学研究已经变形成了定量数据研究。”[14]179 这段话最早出版于 2009 年,是在“远读”概念第一次出现在《对世界文学的猜想》的第九年之后。
感谢清华大学赵健教授在数字阅读研究领域给予本文的支持;感谢朱舜山先生和武汉大学王晓光先生在本文写作中所参与的讨论,这些讨论将笔者对《远读》的考察视点带入了学术历史的思考,提起了探讨学术概念如何在传播中被改变、被发展、被重释的兴趣。
感謝向帆老師授权零壹Lab转发!
[1]Franco Moretti. Distant Reading [M]. London: Verso Books,2013.
[2]Franco Moretti. Conjectures on World Literature [J].New Left Review,2000,1(4):54-68.
[3]简·布朗. 歌德与“世界文学”[J]. 学术月刊,2007(6): 32-38.
[4]王宁. 世界文学与中国[J]. 中国比较文学,2010 (4): 10-22.
[5]弗兰科·莫莱蒂. 对世界文学的猜想[J]. 诗怡,译. 中国比较文学,2010(2):9-20.
[6]胡悦融,马青,刘佳派,等. 数字人文背景下“远距离可视化阅读”探析[J].图书馆论坛,2017(2): 1-9.
[7]Katheryn Schulz. What is distant reading? [N]. New York Times,2011-06-24(14).
[8]Franco Moretti. Network Theory,Plot Analysis [M]//Franco Moretti. Distant Reading. London: Verso Books, 2013.
[9]傅守祥. 文学经典的大数据分析与文化增殖[J]. 浙江社会科学,2017 (10):127-133,159.
[10]苏文成,卢章平. 数字人文研究方法争议浅析——以宋词流派特征远距离阅读项目为例[J]. 图书馆论坛,2018(2):22-28,43.
[11]丁雄飞. 王安忆“90 年代”的上海小说及其市民意识形态[D]. 上海:华东师范大学, 2016.
[12]戴安德,姜文涛. “数字人文:观其大较”[J]. 山东社会科学,2016 (11):26.
[13]Franco Moretti. Modern European Literature: A Geographical Sketch [M]//Franco Moretti. Distant Reading. London: Verso Books,2013:1-42.
[14]Franco Moretti. Style,Inc.: Reflection on 7,000 Titles [M]// Franco Moretti. Distant Reading. London: Verso Books,2013.
[15]梅丽莎·丁斯曼,弗兰科·莫雷蒂,向俊. 人文研究中的数字:弗兰科·莫雷蒂访谈[J]. 山东社会科学,2017 (9):32-37.
[16]Franco Moretti. Conjectures on World Literature [M]//Franco Moretti. Distant Reading. London: Verso Books,2013: 48.
[17]Franco Moretti. Atlas of the European Novel,1800-1900 [M]. London: Verso,1998.
[18]Franco Moretti. Graphs,Maps,Trees: Abstract Models for a Literary Theory [M]. London: Verso,2005.
[19]Franco Moretti. Literary Lab: Network Theory,Plot Analysis [EB/OL]. [2018-05-12]. https: / / litlab.stanford.edu/LiteraryLabPamphlet2.pdf
[20]Plot as Network: Quantifying the Evolution of Dramatic Style [EB/OL]. [2018-05-12]. http://dh2011abstracts.stanford.edu/xtf/view?docId=tei/ab-265.xml;query=; brand= default.
主编:陈静、徐力恆 责编:陈静、徐力恆 美编:张家伟
关注零壹Lab,获取更多数字人文信息!