零壹Lab:记录数字媒介之日常,反思科技与人文精神
01Lab: Archiving digital lives, reconceptualizing sci-tech and the humanities
作者简介
但汉松,南京大学英文系副教授、硕士生导师,主要研究美国文学。
“今日的未来遗产”专辑论文之二
贰
此时,我们可能已对所谓“数字人文”框架下的文学批评产生了疑问:“数字人文”作为新术语进入欧美人文学科不过是近十年的事情,但文学研究是否已经在文学文体学中被“数字人文化”几十年了?韩礼德、辛克莱尔和图兰这些学者对文学的研究,不就是一种定性的、计算的研究吗?这种命名的滞后,很像图书馆学、地理信息学、计量史学圈子很多学者的抱怨:早在DH被作为一个学术概念炒热之前很久,他们其实早已开始走数字人文之路了。果真如此的话,那么当前数字人文的文学研究进路,是否仅仅需要在现有的文体学研究框架下,用“文学文体学+语料库+更多的计算、统计方法”这样的配方就足够了?
然而,问题绝没有那么简单。笔者认为,“数字人文”旗帜下的文学研究并非简单地在研究文学的过程中运用计算机软件、统计工具或数据库/语料库,也不是应用语言学框架内文学文体学某种“顺水推舟”的发展。作为学科融合的概念,“数字人文”产生于这个以互联网、大数据、人工智能/机器学习为特点的信息时代,它作为一个“伞状概念”(umbrella concept)被不同学科、不同机构用来指代不同的方法与理念。[1]但本文更认同安斯沃斯(John Unsworth)在那篇颇具争议的《什么是人文计算?(什么不是?)》中谈及的观点:“人文计算是一种再现的实践,是一种建模或模仿形式。它是一种论证方式,是一套本体论的许诺(ontological commitments),它的再现实践一方面由其所需要的有效计算决定,一方面则取决于人的交流。”[2]换句话说,安斯沃斯认为“人文计算”最本质的要素不是使用了什么工具,而是人作为研究问题的提出者,在处理问题过程中和这个工具处于一种怎样的关系中。为了正本清源,他指出了那些被称之为“江湖骗术”的人文计算,它们的共有特征就是将原本复杂、庞大的再现实践变成“拙劣而浅显的模仿”,仅仅是为了追求计算的浅层效果。[3]那么,检验人文计算含金量的指标到底是什么呢?安斯沃斯认为,判断依据就是制定研究问题的用户与人文计算之间的“相互作用性”。[4]如果完全没有相互作用发生,只是借人文计算的皮相,那就是“江湖骗术”;如果运用到了关键词搜索、组合检索等,这属于较为初级的;如果在计算过程中有可以改变的变量和参数,并引入了新的算法,那么这就是相当好的人文计算。
这里,笔者想借用海尔斯(N. Katherine Hayles)的观点对“相互作用性”做进一步引申。在数字化文学批评中,应该存在着两种意识载体在活动:一个是批评家的人脑,它是具有认知能力的意识主体;另一个则是来自机器与算法,它被海尔斯称为“认知的非意识”(cognitive nonconscious)。[5]海尔斯创造这个概念的本意,其实是想说明数字人文中电脑虽然不具备意识能力,但却可以进行认知活动;同时人类不必为拥有机器无法效仿的意识能力沾沾自喜,因为这种意识在认知活动中会带来无法克服的偏见与负面代价。[6]我认为,理想的数字化文学批评,应该是这两种批评认知力量的“战争”(agon),两者保持一种紧张对峙状态,并不仅仅用于相互印证或否定,而是相互启发和批判。同时,人类读者作为这场“战争”的主角(protagonist)存在,而机器读者是敌人(antagonist),两者关系既不可等同,也不可互换。这并非简单的折衷主义,而更像是一种元批评,即不对结论做先入为主的预设,而是对批评方法、模型本身保持暂定性,一旦数据计算中揭示出的“意外”状况,人类读者就可以开启反思式、生产性的解读。
霍伊特·朗(Hoyt Long)和苏真(Richard Jean So)的研究为机器与人的这种竞争式阅读做出了绝好的示范。他们试图以日本俳句在美国现代主义中的接受和改编为个案,用朴素贝叶斯算法构建的分类器让机器学习识别英文俳句。有趣的是,这个研究并不是为了证明机器可以“鉴诗”,而是要让文本细读、机器学习和历史主义批评这三种阅读阐释“模型”产生一种安斯沃斯所说的“相互作用性”。进一步的说,两位作者认为三种读法都内化了某种关于文本的本体论认识(或用安斯沃斯的术语,“本体论的许诺”),他们的做法“并非要偏重某一种模型而贬低另一模型,而是要主张通过这类人力阅读和机器阅读的交互作用,凸现出一种关于俳句这种文学事物的新的批评视角。通过讲这些文学分析模型理解为按其自身视域具有理据、而在更广阔的模式识别阐释学中可相互对照,一种关于俳句——以及广义地关于现代主义文本——的新的本体观出现在人们视野中。”[7]
另一个范例是莫莱蒂(Franco Moretti)用“网络理论”(Network Theory)重读《哈姆雷特》的尝试。和霍伊特·朗与苏真不同的是,莫莱蒂的研究并未凸显大数据和人工智能的技术维度,他甚至坦言这是基于关系网络的粗浅研究,剧中人物关系拓扑图是人工绘制的,全然没有当下社交网络分析工具Ucinet和Gephi的“复杂气质”。但即使在这样看似“低端”的数字人文实践中,我们依然感到莫莱蒂强烈的问题意识。他始终强调,自己是在操练一种“再现的实践”,并对其模型运用了一种批判性解读。具体地说,《哈姆雷特》的人物关系链有三个关键人物,即哈姆雷特、好友霍拉旭(Horatio)和继任国王克劳狄斯(Claudius),经由他们三个人全剧所有人物获得了联结。莫莱蒂惊奇地发现,如果将克劳狄斯拿掉,剧中人物的网络结构不受太大影响;但如果将原本在剧中分量轻微的边缘人物霍拉旭拿掉,剧本的关系网络就会坍塌。[8]
莫莱蒂以一种思辨性的解读,首先追问了这种将剧中人物关系做可视化建模到底有何意义。他的答案是:这种阅读模型可以将时间性的情节变为一种“过去”与“现在”并置的抽象关系,这是传统的阅读所不能给予我们的观察角度。[9]由此,莫莱蒂发现了霍拉旭对关系网络的奇特意义——他虽然看似无足轻重,但帮助哈姆雷特联结了宫廷之外那些游走于戏剧中心的“小人物”。[10]该研究最大的方法论意义,实际上是莫莱蒂试图打通风格与情节的野心。他认为,自己的研究可以指向更具普遍性的数字人文文学研究方法:“风格嵌入情节,变成情节的功能。这可能会是一个突破,不仅仅针对文学分析——(文学分析)目前还无法创造出一种将情节与风格统一的理论——而且适用于更广泛意义上的文化分析…情节-风格这个连续体所能提供的,是基于我们的行动和我们如何思考这种行动之间的一种关系模型。”[11]虽然莫莱蒂的这个研究尚在初级阶段,但他对于不同阅读模型的元批评意识,无疑是和霍伊特·朗、苏真等人的研究殊途同归的,也彰显了安斯沃斯所心仪的那种“人文计算”。
那么,目前文学文体学是否已经完成了朝向数字人文的范式转换呢?我觉得答案是否定的。一方面,虽然文学文体学比语言文体学更关注文学,但文体学总体上依然是以语言、语言学为导向,其价值归宿是如何借助文学来更好地完善语言(包括话语与风格)分析模型。如果仅仅将经典文学作品作为风格化的语言质料加以统计处理,那么这样的数字化文学批评很容易沦为验证某种语言学理论(如系统功能语法)或特定语言分析方法(如认知心理学)的“酸碱试纸”。然而,文学批评作为一种主观的、直觉的阐释活动,它针对的是文本意义及其背后的深层含义。艾布拉姆斯(M. H. Abrams的)在《镜与灯》中认为,批评理论考察的是四个要素,即作品,作者,世界和读者。[12]无论是将文本作为客体,还是强调作者主观意图,亦或是关注读者反应,文学批评都是在文学的复杂系统中探究不同要素之间的关联和意义的生成,其价值取向是基于艺术审美的,关注的是信仰、伦理、天赋等“非功利主义的、非经济的、非物质的、内在的领域,而且在本质上,它是不变的、超验的”。[13]显然,这与语言学的功能主义、工具主义、物质主义的取向有着深刻差异。
另一方面,文学文体学的一些最新领域(如女性主义文体学、认知文体学、叙事文体学)虽然在做“去语言学化”的尝试,但与人文计算的大数据、自动化、智能化方向却渐行渐远。如前所述,NLP涉足文学的最大阻碍,在于后者是高语境的。韩礼德对于文体学的改造,正是向语境的一次进军,人际意义和语篇意义都是在上下文中生成的。辛克莱尔反对主流的语料库文体学中对于人工标注(tagging)的过度使用,并认为“计算机能够被训练用来识别标签,而且标记式语言可以帮助文本在机器之间输出…文本中的语言和内容等会有越来越多的方面可以被(计算机)标注出来。”[14]然而,依然有众多语料库文体学家坚持认为,“一些复杂的话语现象,比如话语陈述,它们并非基于词汇,是无法被计算机程序系统地、定量地检索,也无法在上下文中被阐释。”[15]图兰对于人文计算的自动化过程也持保留态度,譬如他就反对将文学文本做数字化处理后的特征结果与参考语料库(reference corpora)直接进行比较的做法,因为对文本叙事元素的究查应摆脱语言的束缚,更多地转向心理学、社会史和文化。[16]或者说,图兰认为意义的生成不是在一个标准语料库中观察比较得到的,而是应该考虑读者个体化的认知过程,这其中涉及到一时一地的读者主体带入阅读过程中的推理、图式(schema)、文类期待和自身的文化背景。[17]这样的研究是基于叙事认知的细微过程,同样也是高度语境化的,很难被目前的计算机建模或模拟出来。
Michael Toolan
简言之,文学文体学在其自身发展中就存在“重语言”还是“重语境”、“重文化”的分歧,它的发展转化面临着来自学科内部自身的危机,既与文学批评传统中的“细读”模式存在抵牾,同时也依然对是否应该进入数字人文的算法批评心存疑虑。诚如拉姆齐(Stephen Ramsay)所言,尽管“数字化的文学研究”在自然语言处理、统计语言学、语料库文体学等领域已经早已展开了几十年,但真正的“算法批评”(algorithmic criticism)其实还未出现(或者说,仅有一些雏形),它远未渗入文学批评的核心区域。[18]
注:
[1]Matthew Kirschenbaum认为“数字人文”这个词已经成为了一个“自由漂浮的能指”。关于“数字人文”概念的定义、演变、争鸣等,参见Matthew Kirschenbaum, “What is Digital Humanities and What’s It Doing in English Departments?”, in Matthew K. Gold, ed., Debates in the Digital Humanities, Minneapolis and London: University of Minnesota Press, 2012. pp. 3-10.
[2]John Unsworth, “What Is Humanities Computing and What Is Not?”, Illinois Informatics Institute, University of Illinois, November 8, 2002, https://www.ideals.illinois.edu/bitstream/handle/2142/157/whatis.html.
[3]Ibid.
[4]Ibid.
[5]N. Katherine Hayles, “Cognition Everywhere: The Rise of the Cognitive Nonconscious and the Costs of Consciousness” , New Literary History, Vol.45, No.2, Spring 2014, p.199.
[6]N. Katherine Hayles, “Cognition Everywhere: The Rise of the Cognitive Nonconscious and the Costs of Consciousness” , New Literary History, Vol.45, No.2, Spring 2014,p. 204.
[7]霍伊特·朗、苏真:《文学模式识别:文本细读与机器学习之间的现代主义》,林懿译,《山东社会科学》2016年第11期;另参见Hoyt Long and Richard Jean So, “Literary Pattern Recognition: Modernism between Close Reading and Machine Learning”, Critical Inquiry, 42.2 (Winter 2016), pp. 235-267.
[8]Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), pp. 87-88.
[9]Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.84.
[10]莫莱蒂将这种建模方式推及小说阅读,在《红楼梦》中发现了一个与霍拉旭具有同样关系功能的配角—“周瑞家的(媳妇)”。——See Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.99.
[11]Franco Moretti, “Network Theory, Plot Analysis”, New Left Review, 68 (Mar. Apr. 2010), p.94.
[12]See M. H. Abrams, The Mirror and the Lamp: Romantic Theory and the Critical Tradition, New York: Oxford UP, 1973, p.6.
[13]Barbara Herrnstein Smith, “Value”, in Michael Kelly ed., The Encyclopedia of Aesthetics, 2nd ed., Oxford: Oxford University Press, 2014.
[14]John Sinclair, Trust the Text: Language, Corpus and Discourse, London and New York: Routledge, 2004, pp. 190-191.
[15]Nina Nørgaard, Rocío Montoro and Beatrix Busse, Key Terms in Stylistics, p.204.
[16]这个意义上,女性主义文体学等批判文体学更加看重的是话语背后的意识形态操纵,这是更加远离数字人文中机器阅读所擅长的“浅层阅读”(surface reading)和“远读”(distant reading)。
[17]Michael Toolan, Narrative Progression in the Short Story: A Corpus Stylistic Approach, pp.25-28.
[18]Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.2.
主编: 陈静 责编: 顾佳蕙 美编: 张家伟
关注零壹Lab,获取更多数字人文信息!