零壹Lab | 朝向“数字人文”的文学批评实践:进路与反思(下)

发布时间: 2018-06-12 但汉松

   公众号:lingyilab

零壹Lab:记录数字媒介之日常,反思科技与人文精神
01Lab: Archiving digital lives, reconceptualizing sci-tech and the humanities

作者简介

但汉松,南京大学英文系副教授、硕士生导师,主要研究美国文学。

“今日的未来遗产”专辑论文之二

到底什么是“算法批评”呢?按照拉姆齐的定义,它是“一种源自对文本进行算法处理的批评”[1]。这种数字化的文学研究绝不只是单纯在文学分析中使用统计模型、计算机软件等,而是让算法以人工智能的方式嵌入文本阐释的过程中,使之成为海尔斯所指的“认知的非意识”,并与传统批评范式或意识产生互动。拉姆齐格外强调,算法批评在其发展之肇始,就应该考虑到“科学的方法如何在人文计算自身中被使用和滥用”[2]。这种对于人工智能技术在文学批评活动中的批判性接受,也恰恰是安斯沃斯对人文计算的那种理想性规划。借助机器学习来识别英文俳句的个案,或许只是贝叶斯算法在文学批评中的一次初级应用,但却或许称得上拉姆齐意义上的“算法批评”的雏形。

 

那么,我们该如何进一步走向这种“算法批评”呢?或者更具体地说,我们如何能利用人工智能领域的飞速发展,将机器学习(甚至深度学习)[3]引入到文学批评的实践中,让这种批评帮助我们进一步解析文学作品,同时还借助计算机的超强运算能力和学习算法的自我完善能力,去观察更庞大的文学数据中人类无法觉察的模式与规律?

 

要迈出的第一步,或许是文学批评家对于机器学习的破冰之旅。时下,机器学习的发展令人应接不暇,已经深入到日常生活的方方面面,依靠深度学习称霸棋坛的AlphaGo不过是其中一例。机器学习已细分为五种流派:符号学派、联结学派、进化学派、贝叶斯学派和类推学派。不同专业背景的文学研究者应该深入到机器学习的操作层面,学习用具体的模型、规律、算法等去解读文学文本。科技公司巨头有强大的盈利驱动力和技术资源,它们固然会积极推动人工智能的进步,但文学研究者恐怕不能指望它们慨然为人文计算提供现成的算法工具或软件。[4]毕竟,以商业为导向的NLP技术并不关注精微的文本意义,它们更愿意去实现的,是如何从电商网站的客户评价中自动提取情感反馈,如何实验自动翻译并让准确率达到日常交际的基本需求,如何从社交媒体的信息流发现选民立场和舆情变化等等。而另一方面,在现实的人文计算中,我们的研究问题往往是个性化的,对文本语料库的特征标注和分类需求千奇百怪,无法以某几种通用工具来对接全部的计算需求。未来的数字人文研究者必须学会跨出自己的专业,亲力亲为地学习基础的编程方法和统计学。

Norbert Wiener

另一方面,我们也必须承认,除了极少数像控制论之父维纳(Norbert Wiener)那样的全才,大部分文科学者都很难深入到机器学习的技术内核和细节层面。在“浅水区”,我们可能了解一下NLP、知识库、数据挖掘、深度学习、分词、贝叶斯定律等概念就够了;可如果想进入“深水区”,我们需要面对的将是正则表达式、感知器、马尔可夫链、BP网络、K最近邻算法等令文科生眼花缭乱的术语以及背后复杂的数学原理。如果未接受过起码的统计学、离散数学训练,就贸然宣称要在文学研究中植入人文计算的方法,那么即使不是故意“装神弄鬼”,恐怕也只能是一次堂吉诃德式的冲锋。当然,采取跨学科合作的方式也是当前数字人文研究的重要策略,但在与统计学家、人工智能专家的分工中,如何让文学批评保持自身独立性,却仍是非常棘手的问题。毕竟,文学研究的知识生产在本质上有别于科学,甚至与物理这类硬科学南辕北辙,因为前者的特点是“任务的高度不确定性”,同时习惯于单兵作战、以单一作者署名的文学研究者又“具有极低的相互依赖性”。[5] 所以,未来的人文学者选择拥抱人工智能、却又无法真正深入并成为技术层面的主导者,这恐怕是知识爆炸时代加剧的学科壁垒和专业分工带给人文学者的一种宿命,也是我们作为人的必然局限。

 

要迈出的第二步,是对学习算法、文本挖掘、概率统计、可视化结果等科学方法的“祛魅”。当然,它不是对科学内部细节的敬而远之,而恰恰是要求人文学者在认识人文计算的原理方法之后,获得一种祛魅化的智识立场,即对科学本身的局限性、暂定性保持学理上的警惕和反思,不以“科学主义”取代文学研究传统中那种基于含混、悖论、反讽等要素的诗学价值观。事实上,科学中存在着各种各样的陷阱,譬如著名的“辛普森悖论”(Simpson’s Paradox)就提醒我们:在分组比较中出现的变量趋势,在合并组的统计计算中可能会获得相反的结果。[6]如果不了解统计数据在分组与合并中可能带来的截然相反的结果,我们可能就会掉入陷阱而不自知。同样,机器学习中会出现“过拟合”(over-fitting)的问题,这往往意味着算法在数据中找到了现实世界里并不存在的虚假模型,它不过是数据带给我们的幻觉。[7]甚至有人说,数据挖掘意味着“折磨数据,直到数据妥协”;在学习算法中又特别容易出现“过拟合”问题,“因为它们拥有从数据中发现模型、近乎无限制的能力”。[8]如果在数字人文范式下的文学研究中进一步引入读者心理认知的维度,我们还需要提防在心理学研究中早已为人诟病的“重复性危机”(reproducibility crisis),[9]不要过分相信在中小规模的受试读者中以调查问卷方式获得的统计分布规律。

 

如果上述“祛魅”是在科学方法范畴中进行的,那么还有另一种需要警惕的认识论迷信,它某种程度上源于我们在图像时代对于可视化图形的“返魅”(Re-enchantment)。中世纪的宗教绘画中隐藏着人类对于神圣力量的圣像崇拜,而在文艺复兴之后,当“圣像破坏运动”(iconoclasm)已经成为强大的世俗共识之后很多年,信息时代的我们却被重新带入另一种对于图像的崇拜。此刻,我们顶礼膜拜却不自知的,不再是教堂壁画中的圣母或耶稣,而是计算机通过程序生成并呈现的各种图表——曲线图、柱状图、圆饼图、点状分布图、网络关系图等等。它们不仅是图像化的数据,而且在人类潜意识中构成了机器的一种“绘画”,它似乎表征着某种真理的显形。然而,格金姆(Anna Marazuela Kim)尖锐指出,这些图像尽管看似无所不能,但其实不过是“对那个由人、物体和人际关系所构成的无比复杂的物质世界的一种苍白反映”[10]。因此,习惯以文字进行学术生产的人文学者应该警惕人们对于“图表”的敬畏感。对于莫莱蒂所倡议的文学史制图方法,我们既要保持开放的学习态度,但同时也要小心这些图表背后数据的可检验性(retrievability)、制图方式的任意性,以及对于文学复杂系统进行制图所造成的简化主义弊端。


这样的“祛魅”不仅不是反科学的卢德主义(Ludditism),反而是真正科学的理性态度。培根(Francis Bacon)曾在《新工具》(Novum Organum, 1620)中对科学的方法论提出了一个变革性描述:科学应该从演绎走向归纳。这并不是说用归纳法取代演绎法,而是实现两者的有机结合,即“从感官和特殊的东西引出一些原理,经由逐步而无间断地上升,直至最后才达到最普遍的原理。”[11]不难看出,培根心仪的归纳法反对由特殊材料一劳永逸地飞抵“最普遍的原理”,而是以“三步走”的方式循环渐进:首先要求观察者获得尽量多的经验数据,然后对数据“观其大较”并做客观地整列、类编与分析,在此基础上“捕获原理,然后再由业经确立的原理进至新的实验”[12],并如此往复。有当代学者认为,培根的描述不仅构成了西方现代科学实验的方法基石,而且已经颇具远见地将“科学发现从本质上视为一个算法的过程”[13]。在这种图景下,新的观察结果不断充实数据库,而称为“科学”的一般性假设随时等待被证伪,并被新的一般性假设来取代。

 

在科学哲学中,波普尔对科学“可证伪性”的讨论,以及库恩提出的“范式转换”概念,已让人们明白科学并不意味着亘古不变的真理,科学方法、科学知识都具有暂时性与相对性。既然如此,我们恐怕更没有理由将人文计算不加甄别地视为文学研究中的“进步”。至少在库恩那里,“范式转换”的后果往往喜忧参半,甚至还有倒退的可能。[14]我们不必认为人文计算是所有文学研究中必须引入的批评工具[15],或将人工智能、机器学习视为玄奥之物。事实上,人文计算随时可能犯错,它有着自身的边界。但强于人脑之处在于,它具备持久的高速计算能力,可以在不断重复中自我学习和优化。批评家期待它们会“撞大运”般在文本挖掘中找到有趣的“原理”,从而帮助我们抵达文学阐释的某个奇点;但同时我们也更应该做好心理准备,那就是它会在不断运算中一无所获。

 

我之所以不特别强调人文计算和算法对文学研究的必然意义,是因为正如伽达默尔所言,“阐释在本质上并不是一个方法的问题”[16]。阐释,不是一种可以像其它经验客体那样拿来进行科学调查并达到理解目的的方法。尽管它有别于科学的方法论,但阐释仍然关乎知识和真理,只是这种知识和真理有别于科学家追求的对象。阐释关乎的是直觉和信仰,这两种东西是我们和人工智能最大的区别所在。同时,基于大数据的机器学习目前主要是寻找相关性,并在此基础上作出预测。然而,除非只是单纯对文学文本进行风格测量,否则对真正的文学研究而言,我们需要实现的是阐释,而非预测。事实上,文学批评家之所以需要自动算法,并不是指望它用多高的准确率区分一首诗到底是不是俳句,或一部戏是悲剧还是喜剧;算法批评的意义恰恰是利用人工智能,促使批评家发现之前使用别的方法未曾觉察的问题,帮助批评家阐释文本并解析出新的意义。或许,唯有这样的数字化文学研究,才会真正吸引我们扬帆驶向数字人文的“比特海”。

注:

[1]Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.2.

 

[2]Stephen Ramsay, Reading Machines: Toward an Algorithmic Criticism, Urbana, Chicago and Springfield: University of Illinois Press, p.x.

 

[3]机器学习(machine learning)是当下人工智能领域的一个热门分支,而深度学习(deep learning)是借助神经网络(neural network)的一种机器学习方式。

 

[4]一个例外,可能是“谷歌图书”中的Ngram Viewer,它能向用户免费提供1500年到2008年图书语料库中的任意关键词的词频变化曲线的检索服务。

 

[5]Wolfgang Kaltenbrunner, “Scholarly Labour and Digital Colloboration in Literary Studies”, Social Epistemology, 29.2 (2015), p. 209. Kaltenbrunner的研究个案是欧洲科学基金会资助的数字人文项目“Women Writers in History”,该研究旨在建立文学研究者、统计学家和计算机科学家的合作平台,通过大规模数据库来调查1700年至1900年间欧洲所有边缘女作家的接受史。然而,作者以亲身经历指出,这类合作研究有文理科之间难以协调的学术生产范式的差异,譬如文学研究者和信息技术人员无法就“文类”和如何定义“接受”这样的关键问题达成一致。

 

[6]关于“辛普森悖论”的一个经典例子是:某法学院的女生录取比例高于男生,某商学院的女生录取比例也高于男生,看似不存在性别歧视的问题,但实际上将两个学院录取人数合并起来,会发现女生录取率实际上是低于男生录取率。出现这种有悖“常理”的统计结果的原因,是因为每个分组的基数可能存在较大差异,两个向量分别的斜率差异和合并后的情形不一定相同。

 

[7]譬如,最近上海交通大学做的“基于面部图像的自动犯罪概率分析”就极具争议,被认为是缺乏科学伦理的一种变相的“颅相学”。Richard Tynan认为,该研究之所以会有这么荒谬的“准确”预测,是因为在“小数据集上,算法、人工智能和机器学习可能会建立起专断荒唐的相关性。这不是机器的错,把复杂系统运用在不合适的地方是很危险的”。http://news.sjtu.edu.cn/info/1005/1230344.htm

 

[8]佩德罗·多明戈斯:《终极算法:机器学习和人工智能如何重塑世界》,黄芳萍译,中信出版集团2017年版,第91-92页。

 

[9]2015年《科学》杂志刊登的一个调查显示,对2008年顶级心理学期刊发表的100项研究进行重复,仅有36%的实验结果得到了重现,而且83%的重复试验的效应量都小于原研究。——See Open Science Collaboration, “Estimating the Reproducibility of Psychological Science”, Science, 349.625 (Aug 2015), p.943. 另一个极端的例子,是荷兰心理学家Diederik Stapelz在五十多篇论文中编造数据的特大丑闻,详细讨论见英国《卫报》的长篇报道《针对科学造假的高科技战争》(The High-Tech War on Science Fraud),February 1, 2017,https://www.theguardian.com/science/2017/feb/01/high-tech-war-on-science。

 

[10]Anna Marazuela Kim, “Re-enchantment and Iconoclasm in an Age of Images”, The Hedgehog Review, Fall 2015, p.53. 

 

[11]培根:《新工具》,许宝骙译,商务印书馆1986年版,第12页。

 

[12]培根:《新工具》,许宝骙译,商务印书馆1986年版,第60页。

 

[13]Ahmed Alkhateeb, “Science has outgrown the human mind and its limited capacities”, Aeon, 24 April, 2017. https://aeon.co/ideas/science-has-outgrown-the-human-mind-and-its-limited-capacities。

 

[14]Barbara Herrnstein Smith, “Scientizing the Humanities: Shifts, Collisions, Negotions”, Common Knowledge, 22.3 (September 2016), p. 355.

 

[15]数字人文圈子里有一种“不追随我就得死”(follow-us-or-die)的偏激论调,参见Jon Saklofske, Estelle Clements, and Richard Cunningham, “They Have Come, Why Won’t We Build It?: On the Digital Future of the Humanities," in Brett D. Hirsch et al ed. Digital Humanities Pedagogy: Practices, Principles and Politics, Cambridge, UK: Open Book Publishers, 2012.

 

[16]Hans-Georg Gadamer, Truth and Method, trans. Joel Weinsheimer and Donald G. Marshall, London: Bloomsbury, 1975. p.xx

主编: 陈静      责编: 顾佳蕙       美编: 张家伟


关注零壹Lab,获取更多数字人文信息!