零壹Lab | 数字人文的幻灭

发布时间: 2017-12-13 蒂莫西·布伦南

   公众号:lingyilab

零壹Lab:记录数字媒介之日常,反思科技与人文精神
01Lab: Archiving digital lives, reconceptualizing sci-tech and the humanities

首先我们看到的是价格不菲的“Ada”算法的崩溃,而它恰好在希拉里·克林的惨败竞选中处于核心操控位置。接着是美国有线电视联播网爆出,内特·希尔在搞砸了2016年大选播放之后,为自己的数据结论辩护称,他并不比1968年以来的任何其他统计预测者错得更多。最后,想想英国剑桥分析公司所引发的混乱:这家英国公司使用的数据建模中的“心理统计”方法和“情绪分析”被认为是特朗普阵营的秘密武器——直到有怀疑者回忆起泰徳·克鲁兹和本·卡森也使用了他们的服务。

梦想电脑算法能揭开复杂的社会和文化进程中的秘密,这一念想正遭受非常公开和尴尬的结果危机。这些挫折也使得大学中产生了一些自我反省,促使人们更加细致深入地观察数字人文。大致说来,已有差不多十年的学术资源投入数字人文方向,其中包括在国家人文基金会设立数字人文办公室,从安德鲁梅隆基金会获得前所未有的高额资助,由跨学科文章组成并由高规格学术刊物刊登的庆祝性论文集,以及在终身制职位短缺的时代的学术职位空缺;于是,(我们不禁要问),在所有这些支持和帮助下,数字人文领域究竟取得了什么成就?

这是很难回答的问题。数字技术很好地适应了一些类型的人文工作——比如汇编协调。它们在破译古代语言方面也被证明很有作用。杰出的语言破译家尤里·诺洛佐夫曾使用了“统计定位”方法来破译玛雅碑文。也许,即便没有计算机的帮助他也能破解这样的古代语言,但他因此而编写出的计算机程序却显示出极好的拓展性,并在他随后对哈拉帕文本的翻译中发挥了积极的作用。

数字人文也吸引了一些从事着非常重要的研究工作的学者。比如特立独行的的杰西卡·玛丽·约翰逊,约翰霍普金斯大学的非洲研究助理教授,在《洛杉矶书评》系列采访文章中指出,#BlkTwitterstorians和社交媒体的其他用途“帮助人们在学术界中创造出了——自由的、黑色人种的、解放的、激进的独立空间。”也许只有理论家才会怀疑这种通常会被学界中经济或文化阻碍所拒之门外的低成本社群互动所拥有的潜力吧。

最后,就展示方式而言——专门性图书馆网站,具有挑战性的经典小说的文本/超文本版本,多媒体历史教科书——数字人文的辛苦付出似乎仅仅体现在为大数据建立顺畅或吸引人的表达系统。

然而,对于这个领域的公正评估却被基本的术语混淆所妨碍:人文学科的数字化并不是数字人文。今天几乎没有人文学者会对Moodle,播客,自动格式化或深入的网络研究一无所知。即使是勒德份子也并不反对使用小说的Kindle版本来搜索关键词,而不必逐页翻检实体书本。因此,“数字人文”这个短语并不重在引入此前不存在的数字技术,而更多地指向了一种制度的重构。人们口中的数字人文更多地指向了一个个项目,并最终成为一种认识论。

数字人文研究者们大多同意这样的看法。伊利诺伊大学厄巴纳-香槟分校的英语教授特德·安德伍德坚持认为“机器学习确实是一种学习的理论。”而阿默斯特学院的英语教授玛丽莎·帕罕姆认为,数字人文并不仅仅部署数字化工具——它同时“在方法论和工具性的层面“产生了意义。对于这个领域提问实际上就是在问:数字人文究竟如何知道,知道什么,以及它究竟让我们知道什么。而最后看来,答案是:并不多。

让我们从期许和实际成果间的张力开始。任何数字人文的初学者都会注意到(数字人文)修辞上的奢华夸张。根据斯坦福文学实验室的一封很可能被人文领域的绝大多数人无视的邮件,数字人文也许能“改变一些历史悠久的学科,譬如历史学或文学批评”。劳拉·曼德尔,得克萨斯州农工大学数字人文、媒体与文化系主任,宣布将打破“书本(这一)形式”,却并不在意为什么人们会想要这么做——与预测相反,即使是实体书本,也坚挺着填满了亚马逊网站飞机库大小的仓库。

数字人文有一种标志性的风格或可被描述为技术狂热与新词崇拜的结合。数据被“展示”而不是被处理;信息被“杠杆化”;事实被“聚合”而不是被质问。重要的是,这些术语从未被定义,但它们却无疑期待着读者的臣服。

恐怕没有什么断言会比2011年《科学》期刊的文章《基于百万数字图书的文化定量分析》更夸大其辞的了,而这篇文章的作者恰恰包括(大名鼎鼎的)让-巴蒂斯特·米歇尔和史蒂文·平克。这篇被广为阅读并激发了更多学术期刊论文的文章夸耀到:它所使用的“文化测序”方法,发掘出了对语法演进和对名誉、公共记忆和词源研究具有复杂且重大影响的数据。它声称发现了数以万计的从未在词典中出现过的新单词。然而只需仔细考量就会发现:这不过只是作者将已知单词的变形误认为是新词;似是而非地推断一个事件的后续正是是由它之前的事件引起的;(又或是)在名誉索引中发现了所有媒介文化领域学者早已熟知的事情(即名人会很快被遗忘);研究几乎完全依赖西方图书馆,却没有能对作为研究中心数据集的“书本”给出定义。

当数字人文学者转向纯粹的文学批评时,也会产生类似的问题。“远读”,一种在不进行阅读的情况下研究小说的方法,利用计算机扫描搜索“比文本小得多或大的多的单位(用弗兰克·莫雷蒂的话来说)”——一端是修辞,另一端是流派或体系。其中最智能的例子之一是理查德·让·苏和安德鲁·派珀于2016年发表在《大西洋》上的文章《MFA格式如何改变美国小说?》(基于他们对发表在学术期刊上的文章所做的研究)。作者们量化了“小说作者们在用词、风格、主题、背景等文学特征方面如何地相似”,但他们却从未具体地引用任何一段那些被计算机量化的内容。毕竟,在现实的小说世界中,风格、主题和人物往往是相互关联中形成的——换句话说,这并不需要在单词或短语中留下可以被程序识别为模式的痕迹或线索。

也许出于同样的目标,芝加哥大学的一位英文系助理教授,与霍伊特·朗(同样来自芝加哥大学)在《批判调查》上合作发表了一篇详尽讨论机器学习与“文学模式识别”在现代派俳句研究中的使用的文章。他们在论文里确实说明了他们对程序员提出了怎样的要求,以及计算机事实上计算出了什么。但得出的解释其实引发了一些新的问题,这些问题某种程度上泄露出某些不受作者掌控的东西。正如他们自己承认的那样,他们的一些解释来自于“事先”知道的东西,也即这部分发现并不需要数据支撑,因此,上述发现在某种程度上是无意义的。在长达30页高度技术性讨论之后,得到的结论仅仅是俳句与其他短诗具有不同的形式特征。而我们已经知道这点了。

数字人文忽视了一个难于摆脱的理论困境:计算机尝试给出的阐释性问题并不是那些长期困扰批评家们的问题。正相反,技术要求人们只能问它能够回答的问题,也就使得问题本身被改变了,而改变的依据却是计算机自身的局限。这样一来事情就不那么有趣了。正如在计算这一环节中经常发生的那样,数字人文研究者往往会通过收缩探询来确保具体的计算变得可操作。例如,为了建立评估质量的标准线,苏和派珀将“文学的卓越度”等同于被《纽约时报》评论。这样一种草率武断的标准在非数字人文的研究文章中是完全站不住脚。令人不安的不仅仅是这种“作弊”可能被通过(数字长期以来跟“精准”这一标签的绑定直接挡下了不少外行的责备),更是在于数字人文方法本身——运作于质量和数量不兼容的记录中——需要这样空白的能指来使整个算法运转起来。

远距离阅读者们说没有人能阅读3346部小说,这完全没错,正如林肯内布拉斯加大学英语副教授马修·L·乔克斯,利用计算机在《宏观分析:数字方法和文学史》(伊利诺伊大学出版社,2013)一文中所证实的那样。但他们从未真正提及他们为什么认为计算机能做到。与远距离阅读中粗暴的光学扫描相比,人类的阅读如同交响乐——是潜意识中的对话、笔记、品味和联想的混合。

计算机回路可能如闪电般迅速,但它们却排除了可能随机发生的研究方向的切换。由于其自身机制,数字“阅读”从根本上将大脑自然产生的智慧灵感,建立价值形式的建立,以及本能冲动都彻底排除在外。细查所有你想要的数字人文文献,但你不会找到任何一篇有在处理上述数字特质导致的方法论问题。数字人文向我们提供了强大却枯燥无味的工具,就像那些反复做着举重的举重运动员。

大数据挖掘的巨大前景(作为大数据授权提案的固定项目)似乎仍旧诡异地停留在自信的断言这一阶段。在2011年刊载于《新左翼评论》的文章《网络理论,点状图分析》中,莫雷蒂给了我们一张常见于许多数字人文研究的空头支票:“有一天,在我们给这框架增添了不同维度的导向、重量和语义之后,那些(计算出的)更加丰富的图像也许会让我们看到不同文学流派——悲剧和喜剧;流浪派,哥特派,成长小说……——以不同形状呈现;理想状态下,他们甚至可以让这些构成大型网络图形的微观结构也变得可见。”

但是,当我们试图去衡量悲剧的时候,这种图形的语义究竟是什么?如果“图形”只是允许对文学意义作更复杂计算(去除令人烦恼的包袱)的场所,那么我们该采用怎样的协同原则,将它纳入在原类型基础上重构的流派形式?这不是说数字人文没能为这个问题提供答案;而是数字人文从来没有问过这样的问题。但如果不回答这些问题,莫雷蒂的“有一天”将如何到来?

伊利诺伊大学的泰徳·安德伍德教授在追踪故事中的词频时有了“有趣的发现”,但他却并没有说明它们是什么——这是数字人文文献的典型姿态。类似的是,纽约大学媒介、文化和传播学系教授亚历山大·加洛韦也认为,梅尔维尔的词频很重要:“如果计算《白鲸记》中的单词,你会更了解白鲸吗?我认为你可能会——而且我们必须承认这一点。”但我们为什么该去数?“鲸鱼”一词出现(假设出现了1700次)的意义无非仅仅是:“鲸鱼”一词出现了1700次。

对于其所拥有的资源而言,数字人文犯了一个新手错误:它将更多信息混淆为更多知识。数字人文并不知道,为什么它认为自己知道它所不知道的东西。而这对于学科而言是十分奇怪的一点。

鉴于这一切,为什么会产生数字人文热潮?比起这些显而易见的诱因——对科学的迷恋,新自由主义的撤资——还有更多因素在起作用。一定程度上,数字人文是那些在学术上被剥夺权利着的一种反抗。由于对终身教职的获取渐渐无望,年轻学者开始将(获取教职的)必要性打造为某种道德行为;于是,他们不再攻击大学里的新自由主义逻辑,反而是与(新自由主义)一起来攻击大学里的教席制,而这一制度里面恰恰有着他们渴望拥有的东西。学术层面的贫富分野在数字人文的倡议者那里被彻底抹去,而这显然极大地激发了那些规模较小、资金不充裕的人文艺术学院,或是二线研究院的积极性。

有时,怨恨表达得很直接。密歇根州霍普学院的威廉·潘纳帕克,一位坚定的数字人文倡导者,指出数字人文的热情拥趸认定自己身处学界的“地位经济”之外,也即他们认为自己在很大程度上是“选择自绝于终身教职制”的。取而代之的是,他们选择了“由互联网带来的合作可能性”。潘纳帕克将数字人文视作“将学生从听课和考试中解放出来,让他们自主学习”的叛乱工具。试问,谁还需要大学?

由于数字人文本就在一种社交媒体饱和的背景中兴起,数字化的推拉已开始缓慢地影响当下的批判意识,年轻学者们会觉得向数字人文的研究转向几乎是理所应当的。一些年轻学者甚至开始与政府和媒体圈的意见精英缔结起亲密关系,而这些精英恰恰是想要降低“知识分子”地位的人。在中央情报局被公开的一份1985年的章节中,你会读到这样的小标题:“再没有萨特,再没有纪德”,而这份报告自身的标题亦为《法国:左翼知识分子的背离》。在对这篇报告的犀利解读中,加布里埃尔·罗克希尔观察到,该机构颇为自得地描述了“学术劳动的临时工化如何有助于消除左翼激进分子”,当中就包含了一些学术明星,他们的权威恰是来自于其粉碎社会准则时闪现的聪慧度和理论契合度。

数字人文常常呼吁通过“众包”和“建立用户社区”来规避职业权威,这在起初看似非常民主。但它也有一个黑暗面——在整体文化中使得原本已经非常强力的技术话语变得有攻击性,进而使得对创新不满和不守规矩的人无计可施。在所谓的“群体协作”中,原子化的个人贡献依旧显得分散,并且不可避免地臣服于社会习俗中的安全性。人群仍然是人群。

数字人文一度只是一个口号,现在却已有许多文集来详细介绍各种数字人文的项目,而且几乎总是在提议,有时近乎示威地说:数字人文是人文学科的未来,而不仅仅是其中的一个学派。最顶尖的成果之一大概要数《数字人文》(麻省理工学院出版社,2012)。在众多的夸大其词中,这本期刊是更调和与让步的。所以,对于数字人文的质疑者而言,通过书中参与者的原话来检验数字人文是非常公平的。尽管如此,这本期刊仍然无比乐观。除了对主张削减成本的大学行政和右翼智库的文化战士进行痛斥之外,期刊作者们都将数字人文视为救援力量。文集“将当今的时代视作人文学术更新的接触承诺。”但要实现这一目标,人文学者必须从传播与媒介设计中学习如何“创造阅读层级结构,形成理解路径,部署节点和模板以求发挥最佳效用,并发展出导航模式。”

又一次,(我们看到)这种操作是认识论的。作者们设想出了“有生产力的企业”,在里面学生和老师“实行”超越文本分析、评论和批评的研究,着重于“跨媒体语料库、软件和平台”。作者总结了他们所提倡的智力活动:“数字化、分类、描述和元数据、组织和导航。”这是一个惊人的列表,却恰恰忽略了“思考”过程中应由矛盾和否定所维系的(思考)质量。将矛盾和否定从思考这一概念中驱逐,或视之为技术约束下的负面阐述必然是错误的。可以说,思考的真正目标本就是指向矛盾与否定。

与其说数字人文是一场革命,倒不如说它是将人文学科从其存在理由中分离的楔子——即,从对主流规范的反思。相反地,数字人文将人文学科带到了行政人员和立法者的角度:一方面对其方法给出看似科学的注解,另一方面为教室中大规模自动化教学的承诺所带来的盈利性技术交易奠定了体系。正是在这个意义上,数字人文“结出的果实”并不虚幻。数字人文将许多人文学者变成了机构策展人,也使得批判思维成为固定(资产)折旧中的一种形变。

译者:顾佳蕙 付梅溪     主编:付梅溪     责编:顾佳蕙     美编:张家伟

关注零壹Lab,获取更多数字人文信息!