《数字人文导读》

第六章

地狱之门:数字/人文/计算的历史和定义¹

爱德华 • 凡浩特

比利时皇家荷兰语言文学研究院

1. 一个隐喻

1879年,法国负责艺术事务的国务大豆埃德蒙·特凯(Edmund Terquet,1836-1914)委托雕塑家奥古斯特·罗丹(Auguste Rodin, 1840-1917)制作一扇纪念性大门。罗丹的这扇门将被作为规划中的巴黎装饰艺术博物馆(Decorative Arts Museur)的入口。罗丹本有三年的时间去完成它。但是,由于博物馆项目出现了问题,法国在 1889年取消了该项目。这扇门就已经失去了最初设置的功能,而罗丹则从设计功能性艺术品的束缚中解放了出来,他发掘了大门表面所具有的创作潜力,进而创作了一件雕塑作品。直到离世,他都经常瑞摩这件作品。目前,这件作品陈列在巴黎的罗丹博物馆(Rodin Museum)2。毫无疑问,它就是一扇门,有两个门板、边框和门楣。但是,这扇门没有开合装置,无法打开。即使有开合装置,门上200多个人物和群体如此紧密地交织,门板也不可能移动。当时,但丁的《神曲》(La Divina Commedia)非常流行,并给了罗丹创作灵感,于是罗丹把这件作品称为《地狱之门》(La Porte de l'Enfer/The Gates of Hell)。

在观看纪录片《地狱之门:罗丹的门(A Season in Hell: Rodin's Gate)3时,我突然想到,罗丹创作雕塑的故事可以用作“人文计算”领域的隐喻。4我用“人文计算”指代在20世纪50年代早期至2004年期间,用于人文学科和在人文学科中使用计算的实践5。自2004年开始,“数字人文”就成了该领城的代名词。

如同罗丹的“门”,“人文计算”也由两个完全分离的门扇组成,它们有各自的历史和意义。但是,当把它们放在一起,它们就紧密连接,将它们分开必然导致意义的丢失。“人文计算”既不是传统的人文学科也不是计算学科。这就是为什么随着时间的推移,关于什么组成和定义了“人文计算”的反思性问题成了一个研究主题。

罗丹的《地狱之门》之所以能够恰当地隐喻“人文计算”,主要原因在于它是失败的创造性成果。法国政府未能建成巴黎的装饰艺术博物馆,这使罗丹的设计不再受制于功能性限制,从而成全了一项充满活力的创作。与此类似,由于早期计算机制造商末能及时地生产出适用于二战的实用的机器(或者,也可以说,由于盟军未能使战争持续得更久),才有了“人文计算”这个创造性产物。


 2.失败

1943年,奥古斯塔·阿达,洛芙菜斯伯爵夫人(Augusta Ada, Countess of Lovelace, 1815-1852)6将路易吉·费德里科·梅纳布雷亚(Luigi Federico Menabrea, 1809-1896)的“Notions sur la machine analytique de Charles Babbage”(1842)7翻译为《查尔斯·巴贝奇发明的分析引擎简图》8(Menabrea, 1961[1843]; Lovelace, 1961[1843]),其翻译标注很可能是首次提及计算在艺术中应用的地方。奥古斯塔·阿达更常被称作阿达·洛芙莱斯,她是诗人拜伦勋爵(Lord Byron, 1788-1824)和数学家安娜贝拉·米尔班克(Anabella Milbanke, 1792-1860)之女。她完全有理由被视为人文计算教育理念的化身。在思考将“巴贝奇的分析引擎””(Babbage Analytical Engine)9用于非数字目的所具有的可能性时,她对其运行机制这样写道:

也许它对数字以外的东西也能进行操作;作为物体,彼此间的基本关系可以通过抽象的操作表达出来;它们也应该能够适应这个引擎的操作符号和机制。举例来说,如果在和声创作中,高音之间的关系和乐曲间的关系能够被表达的话,那么引擎就能够创作出各种复杂的、精致且科学的音乐片段。(Lovelace, 1961[1843], pp. 248-9)

但是,在 CSIRAC10之前,计算机音乐还没有同世。CSIRAC是澳大利亚的第一台数字计算机,在1950年或是1951年曾被用来播放《波基上校进行曲》(Colonel Bogey March)。第一个声音生成程序被恰如其分地命名为“MUSIC”,随着它的发布,电子计算机音乐自 1957年以来莲勒发展11。此外,在20世纪六七十年代,音乐学者向《计算机与人文》杂志投稿了大量文章。但是,洛芙莱斯的观察是没错的,计算技术和设备也可以在非数字的应用中发挥作用。这一点在第二次世界大战结束后得到了验证。

1943年,美国军方12委托建造电子数字积分器和计算机(Electronic Numerical Integrator And Cormputer, ENIAC),以计算二战中大炮的弹道,这涉及复杂的重复操作。这个巨型电子数字计算器(electronic digital calculator)的首席设计师是宾夕法尼亚大学摩尔电子工程学院的J·普雷斯珀·埃克特教授(J. Presper Eckert, 1919-1995)13和约翰·莫克利教授(Jobn Mauchly, 1907-1980)14。在ENIAC问世之前,这些操作要通过使用微分分析仪、桌面计算器和包含几个序列化穿孔卡片机的穿孔卡片装置来完成(Polachek, 1997)。当时,国际商业机器公司(IBM)控制着穿孔卡片机的市场。1946年,当ENIAC组装完成并交付美国军方时,它的研发和生产时间己经超出了二战的战争时间,它的作战用途也因此变得多余。离散变量自动电子计算机(Electronic Diserete Variable Automatic Computer, EDVAC)也是如此。它是第一台二进制存储程序计算机,在1944年由同一个团队委托建造,结果直到1951年才全面投人使用。

随着二战的结束,出于战争目的对计算能力的迫切需要消失了。尽管由于冷战的原因,涉密计算机的研究项目直到20世纪90年代初期都是情报的头等大事。沃伦·韦弗(Warren Weaver, 1894-1978)15是早期思考计算技术的社会功能的先驱之一。他在战时关注弹道学,后来成为洛克菲勒基金会(Rockefeller Foundation)自然科学部的主任。战前开创性的计算项目以及战时亲历的发展启发了他,他开始琢磨,“这个令人难以置信的强大工具——电子计算机”(Weaver, 1970, p. 105)应该如何进行应用。弹道和密码分析的战时计算实践让他确信,计算机尤其可以用于两个和平的学术应用,第一是在科学,第二是在人文学领域,也就是数学和机器翻译(Weaver, 1970, pp. 104-08)。

正如巴黎博物馆项目的失败将罗丹从功能性大门的束缚中解放出来,二战的结束也消除了韦弗视野上的局限,他不再将计算机仅仅视为弹道和密码分析工具。


3.机器翻译

20世纪50年代初期,理查德·H. 瑞奇思(Richard H. Richens, 1918—1984)16和安德鲁·D. 布斯(Andrew D. Booth, 1918-2009)17使用穿孔卡片(Richens and Booth, 1952)对科学摘要进行了逐词翻译(word-for word translations)的实验18。直到那时,翻译自动化的问题仅仅是从机械术语的角度来考虑的:开发一套词典查询系统(a dictionary lookup system),以帮助人工译员。伦敦大学伯克贝克学院(Birkbeck College)的晶体学家安德鲁·布斯很可能是第一个提出电子计算机也许可以用于“机器翻译”的人。在1948年2月12 日递交给洛克菲勒基金会的报告中,他写道:

机器翻译是(Machine Translation,MT)“使用计算机将一种自然语言的文本翻译为另一种自然语言”(Hutchins, 1986, p.15)。支特开展“机器翻译”研究的理由有实用和交际的(人们不得不用他们不了解的语言阅读文件并进行交流)、学术和政治的(通过消除语言障碍开展国际合作和实现全球化,以促进和平,增进对发展中国家的了解),军事的(弄清敌人掌握的信息)、学术的(研究语言和思想的基本机制,挖掘计算的可能性和制约性)和经济的(出售成功的产品)。

在电子计算机的可能性应用上,一个结论性例子就是将其应用于两种语言之问的翻译。我们细致地思考过这个问题,现在已经清楚:机器可以通过不对其进行任何修改就实现翻译的功能(引自Weaver, 1965 [1949], p. 19)。

在普林斯顿高级研究院做洛克菲勒研究员时,布斯听命于洪伦·韦弗。早在1946年,后者已经与布斯就使用自动数字计算机实施两种语言间的机械翻译进行过数次谈话(Booth & Locke, 1965[1955], p. 2; Booth, 1980, p. 553; Hutchins, 1986, p. 24)。在做研究员期间,布斯和后来成为他妻子的助手凯瑟琳·布里顿(Kathleen Britten, b. 1922)开发了一套详细的编码体系,用于在计算机的存備器中存備词典,而后通过标准电传输入可在词典中进行检索。这个构思最早可以追溯至1946年在自动计算机上实现了词典翻译(Booth, 1958, pp. 92-9)。韦弗的报告《翻译》(“Translation”)于1949年7月15日出版。布斯的研究以及他在战时作为密码分析员的经历为这份报告奠定了基础(Weaver, 1965[1949])。《韦弗备忘录》(Weaver Memorandum)在20或30名“语言学学生、逻辑学者和数学家”(Weaver, 1970, p.107),以及多达200名不同领域的学者(Locke, Booth, 1965[1955], p. 15)中间传播。正是由于这份备忘录,多所高校启动了科研项目,产生了关于“机器翻译”所涉问题的一些早期著作19。这些问题包括词语的模糊性、句法的语义功能,以及如何解决不同语言中的词序问题。

1952年,18名学者聚首于MIT举办的第一届机器翻译“国际”会议,布斯是唯一的非美国籍代表。随后,大约40名语言学者参加了同年在伦敦召开的国际语言学大会(International Linguistics Congress)。一年后,“机器翻译”首次出现在由布斯伉俪编写的学术教材——《自动数字计算器》(Automatic Digital Calcdlators)(Booth and Booth, 1953)中。该书的目标读者是计算机科学家,其中的一章《计算机器的一些应用》(“Some applications of computing machines”)详细地讨论了“机器翻译”20。1954年,一场大力宣传的展示会在IBM总部举办。展示会精选49句俄语样句、由250个选自不同领域的俄语单词及其对应的英语所组成的词汇表,以及6条句法规则。IBM的新闻稿上写道:“—个完全不懂苏联人语言的小女孩在IBM的卡片上打出了俄语信息。机器的‘大脑’飞速运作,以每秒两行半的速度在一台自动打印机上给出了对应的英文翻译”21。同年,哈佛大学的安东尼·奥廷格(Anthony Oettinger, b. 1929)发表了世界上第一篇有关“机器翻译”的博士论文 (Oetinger, 1954),杂志《机器翻译》(Mechanical Tanslation)也首次登台亮相。

1955-1966年,领域内部以小组为单位进行划分,例如划分为主攻字典、词典和语义问题的小组和主攻句法问题的小组;采用实践研究法的小组(主要在英国)和采用理论研究法的小组(主要在美国);以及研究短期操作系统的小组和研究高质量长期操作系统的小组。这几年中,针对“机器翻译”开展了十几次重要的大会、聚会和研讨会,“机器翻译与计算语言学协会”(Association of Machine Translation and Computational Linguistics, AMICL)也于1962年6月13日成立。除美国和英国外,保加利亚、加拿大、前捷克斯洛伐克、法国、以色列、日本、前苏联及后来成立的独立国家等都开展了相关研究。22

虽然在1960年6月美国众议院科学和航天委员会编制的报告中,美国的资助机构已经对“机器翻译”之于“我国信息和科学领域的总体发展”的重要性表示了认可(Hutchins, 1986, p. 159),但6年后一家在资助机构的要求下成立的独立咨询委员会所给出的结论,给美国对“机器翻译”的研究经费资助画上了句号。1966年出版的声名狼藉的ALPAC23报告《语言和机器:翻译和语言学中的计算机》(Language and Machines: Computers in Translation and Linguistics)对自动翻译的需求、成本和表现进行了批判,甚至提议说:既然英语是科学领域中的优势语言,那么与提供翻译服务相比,让俄语文章的重度使用者学会俄语会更划算。报告在最终建议中列出,应该将资金用于开发人工译员的辅助机器和“计算语言学”來提高翻译质量,而这已经超出了“机器翻译”的范畴。ALPAC的报告终结了对完美翻译的研究,并将自己的理想归于乌托邦的范围24

对宏观意义上的语言学,尤其是“计算语言学和人文计算”来说,这份报告改变了人们对未来的语言研究项目的思考角度,或者用维克多·英格维(Victor Yngve)的话来说就是:

哲学是语言学的发源地,但不是它的未来;语言学的未来在标准科学中,现在它可以自信地朝这个方向发展。这要求语言学要最终意识到,一位科学语言学家真正的研究对象是以其他方式说话、理解和交流的人群以及真实世界中的其他相关方面。(Yngve, 2000, p. 69)。

罗伯托·布萨(1913-2011)似乎认同英格维的观点,他认为“机器翻译”研究中的主要问题不是没有足够的计算机来处理人类的语言,而是人对人类语言的理解不够全面(1980, p. 86)。


 4. 词汇文本分析

“机器翻译”在人文数据的电子处理中参与度极高。早期有关“机器翻译”的文章中提到,对索引、频率列表和词形还原的使用必不可少。按照安东尼奥·扎姆波利(Antonio Zampolli, 1937-2003)的话说,这些都是“词汇文本分析”(Lexical Text Analysis, LTA)的典型产品 (Zampolli, 1989)。针对这一点,在“机器翻译”的相关书籍中找到有关“文学研究中的计算机”的文章也就没什么奇怪的了(Booth, 1967)。

迈克尔·列文森(Michael Levison)已经对20世纪50年代和60年代初,“机器翻译”和“词汇文本分析”学者间的合作进行了报告。1958年,他以博士生的身份加人了布斯的实验室。虽然布斯在当时的以人文学为基础的工作基本上都属于“机器翻译”领域,但20世纪50年代中期以后,人们对计算机在其他语言学中的应用产生了浓厚的兴趣(Booth et al. , 1958)。20世纪60年代早期出现了文本、文体学和索引制作的统计分析项目(Levison, 1962)。1967 年,列文森在《文学研究中的计算机》(“The Computer in Literary Studies”)一文中,对可以成功应用计算机的文学问题进行了分类描述:索引、术语表、作者判断、文体研究、相关年表、莎草纸的碎片问题,甚至还有数字图书馆的维形——磁带柜。“络绎不绝的拜访者”都来“寻求文学和语言学问题上的帮助“(Lessard and Levison, 1998, p. 262),他们频繁造访布斯的实验室,对上述文学问题进行研究,甚至有几位地质学家提议用模拟的方式研究是否可能对“波利尼西亚人漂流航行后的定居”作出解释(ibid)。

尽管布斯在这些项目取得成果前就离开了实验室,但毫无疑问是他的灵感和声誉促成了这些合作。甚至可能布斯的两位学生,菜昂纳多·布兰伍德(Leonard Brandwood)和乔治·克利夫(Jobn Cleave)是首次将计算机应用于人文学科中非语言问题的博士生。布兰伍德主要研究柏拉图著作的年表和索引(Booth et al. , 1958,pp. 50-65),而克利夫则负责布莱叶点字法(Braille)的机械转录(ibid, 1958, pp. 97-109)。

不过,早期“词汇文本分析”最重要的项目之一是罗伯托·布萨的《托马斯著作索引》(Index Thomisticus),一部制作了托马斯·阿奎那(Thoras Aquinas)全集中所有单词的素引。虽然首次提到这个项目的是刊登在1950年1月份《反射镜》(Speculum)上的一篇短小的项目描述(Busa, 1950)25,但布萨自己说最初想到用现代机械技术进行书面文本的语言学分析是在1941或1942年(2004b, p. xvi; 2002,p.49),当时他刚刚开始博士阶段的研究,以及1946年他完成了博士论文,寻找下一个研究项目的时候(1980, p. 83)。事实上布萨(1949)写博士论文的时候没有借助,也没有提到任何计算机技术26。然而在1951年,布萨(1951)与纽约IBM的员工进行合作,为托马斯·阿奎那的诗自动编制索引,这是第一份由穿孔卡片机打印成的单词索引。不过这一次对概念的论证也没有涉及任何的计算和编程。其主要创新点在于布萨洞察到商用计算机器可以为人文学科带来好处。1951年的项目研究为人们带来了6种学术工具:单词的字母频率表、单词的倒序频率表、词目中单词的字母频率表、词目、单词索引;以及“前后文关键词索引”(KWIC Concordance)(Winter, 1999)。

布萨对完整的《托马斯著作索引》所需要的穿孔卡片进行了计算,其重量将达到500吨,需要长90米、深1米、高1.2米、体积108立方米的空间。1975年《托马斯著作索引》完成,逐渐在56册书中占用65 000页篇幅(Busa, 1974-1980),共对约10 631 973个符号进行了加工处理27。整个加工过程包括输入、校对,以及利用词法水平下的索引和编码对价值进行说明——用布萨(2002,2004a)的术语说就是“内部超文本”。这些工作由在布萨自己的培训学校(在1954-1967年办学)接受培训的一组穿孔机操作人员完成(1980, p. 85)。

虽然布萨在与IBM的密切合作中运用到了穿孔技术,但约翰·W. 埃里森(John W. Elison)也利用雷明顿·兰德公司(Remington Rand)所提供的计算设施,即磁带技术和通用自动计算机第一代大型计算机(UNIVersal Automatic Computer)28,完成了他的《修订标准版本圣经计算机索引》(Computerized Concordance to the Revised Standard Version of the Bible)。故事大概是这样的:大约在1954年,布萨遇见了埃里森,向他在计算研究中取得的成果道贺,然后回到IBM将穿孔卡片都转移到了磁带上,并在1957年《死海古卷》(Dead Sea Scrolls)项目的出版中使用了计算机技术和编程2930。对整本《托马斯著作索引》,布萨(2004b, p. xvii)用了1800卷磁带,每一卷长2400尺,总长达到1500千米。

埃里森追溯他最初想到使用“现代机械设备”是在1945年的时候,当时他意识到“拥有两三个博士学位”的杰出学者“在研究手稿的时候,基本上都要依靠他们的手指”(Elison, 1965,p. 64)。1950年,他申请使用哈佛计算实验室进行计算,1951年得到批准。他验证概念的方法是对圣路加福音(St. Luke gospel)的309份手稿进行稿内校勘,打印出来后与1952年或1953年用马克四号(MARK IV)计算机制作、分为8类异文的标准文本进行对比。这是第一份由计算机执行并打印的手稿校勘。

在1966年声名狼藉的ALPAC报告出版前,“计算语言学”和“词汇文本分析”仍属于同一领域,利用统计分析创建索引、语汇索引、语料库和词典。不过自那时起,“计算语言学”就开始使用象征法,摒弃了一直是“人文计算”核心的统计分析法。

 

5.文学和语言学计算以及面向人文的计算

“机器翻译”和“词汇文本分析”的发展历史与计算机、程序语言、软件的技术发展以及制造商所看准的经济机会息息相关。二战结束后的那几年中,模拟制表设备的传统制造商和供应商纷纷将核心业务向数字计算设备和服务转移,并不断探索新市场。这也是为什么雷明顿·兰德和IBM这样的关键企业会与人文学者开展合作,并且对探索新计算应用方式的会议和项目提供资助。其中一场会议是1965年1月在耶鲁大学举办的,会议名称“面向人文学科的计算机(Computers for the Humanities)?”还略带有迟疑的色彩。会议纪要以同样的标题出版(Pierson, 1965),其封面就像一张穿孔卡片,以穿孔的方式品现出罗丹《思想者》(Le Penseur)的轮廓,以此显示计算与思想史之间的联系。会议记录中的文章内容包括计算的历史以及计算机在科学界中的应用;计算机和词语;语言和文学;计算机和历史学;计算机和艺术;以及对计算机项目在未来的可能性及推测的讨论。这本也许是除《机器翻译》外,最早对计算在人文学科的应用进行概述的书籍。两年后,以《人文研究中的计算机:理解与看法》(Computers in Humanistic Research. Readings and Perspectives)(Bowles, 1967)这一不那么迟疑的标题出版发行了另一本会议纪要,纪要中的文章选自1964-1965年IBM赞助的六场同类型的会议31,全美共有大约1200位专家学者参加。这本书中的文章主要涉及计算在人类学、考吉学、历史学、政治科学、语言、文学以及音乐学中的应用。

1964 年,英国剑桥大学设立文学与语言学计算中心(Literary and Linguistic Computing Centre, LLCC),由罗伊·威斯比(b. 1929)担任第一任主管。1970年,威斯比组织举办了第一届有关计算机在文学及语言学研究中的应用的国际会议,英国学者和来自澳大利亚、加拿大、欧洲大陆以及美国的参会者齐聚一堂32。1972年,第二届大会在爱丁堡举办33。1973 年,威斯比作为联合创办人之一,创办了“文学与语言学计算协会”(ALLC)34,并于 1973-1978年担任协会主席。从协会的命名也能看出对文学和语言学计算的强调。ALLC在 1973-1985年出版了期刊《ALLC公告》(ALLC Bulletin),后又于1980-1985年出版了《ALLC 杂志》(ALLC Journal)。1986年,《文学和语言学计算》(LLC)取代了上述两本出版物,并于2005年更名为《LLC:人文领域的数字学术杂志》(LLC: The Journal of Digital Scholarship in the Humanities),ALLC开始以自己的名义,围绕文学和语言学计算开展了一系列一年两度的会议,并且将之前的两届会议也列人会议名单35

自1973年起,这些会议与在奇数年举办的美国半年期系列会议“国际计算机人文会议”(International Gonference on Computers in Humanities, ICCH)交替举办36。因此,1978年在美国创办的专业协会取名为计算机与人文协会(Association for Computers and the Humanities, ACH)37。12年前,协会创始人约瑟夫·罗本(Joseph Raben, b. 1924)就已经开始对在1966-2004年一直发行的杂志《计算机与人文》(CHum)进行编辑和校订38。欧洲地区主要针对文学形式的语言开展文学和语言学研究,而美国的会议、杂志和协会的兴趣范围却更加广泛,还包括以计算机为基础的文学及非文学形式的语言研究。这从20世纪 70年代组织举办的会议纪要标题就能看出:“文学与语言学研究中的计算机”(The Computer in Literary and Linguistic Research)(Wisbey, 1971);“计算机与文学研究” (The Computer and Literary Studies)(Aitken et al., 1973);“文学与语言学研究中的计算机”(The Computer in Literary and Linguistic Studies)(Jones and Churchhouse, 1976);欧洲的“计算机辅助的文学与语言学研究进展”(Advances in Computer-aided Literary and Linguistic Research)(Ager et al., 1979);以及北美“人文领域的计算机”(Computers in the Humanities)(Mitchell, 1974)和“人文领域的计算”(Computing in the Hamanities)(Lusignan and North, 1977)。从一开始,ICCH的会议内容就包含历史学、音乐学、计算机辅助教学以及创造性艺术(舞蹈、音乐、诗歌)相关的论文39

然而,第一本有关人文中的计算机的专著却是来自计算机领域。1971年,IBM针对人文计算出版了一系列应用手册:《计算机人文导论》(Introduction to Computers in the Humanities)(IBM,1971a);《文学数据处理》(Literary Data Processing)(IBM, 1971b);以及《人类学与考古学中的计算机》(Computers in Anthropology and Archaeology)(IBM, 1971c)。将近十年后,也就是人文学计算发展30年后,大西洋两岸的拥护者终于等到了两本人文计算的教科书,而且这两本书是在1980年1月的同一周相继出版。苏珊·霍基的《计算机在人文学科中的应用指南》(A Guide to Computer Applications in the Humanities)(Hockey, 1980a)和罗伯特·奥克曼(Robert Oakman)的《文学研究的计算机方法》(Computer Methods for Literary Research,1980)40首次从学术角度给出了一致的概述41。尽管两本书都满足了人们对文学和语言学计算领域的概论性教科书的迫切需求,但两本书都没有明确地从教学的角度去构思。两位作者“从一个观察者的统一角度”(Oakman, 1980, p. ×),对期刊文章、几本收录成册的会议纪要、可用的项目报告、稀有的特定编程语言和应用手册中提出的问题进行了收集整理42。这两本书对30年来的研究成果进行了总结,成为续写领域历史的参考点。在这点上,还有一条信息值得关注,即霍基认为布萨是人文计算的先驱,但奥克曼却认为是埃里森。

最初以“人文计算”指代人文学科中的计算活动和针对人文学科进行的计算活动的情况之一出现在第二期CHum的一篇文章中,这篇文章主要讲述1966年PL/I作为一门程序设计语言在人文研究中的使用情况“Heller and Logemann, 1966”43。1968年,奥尔多·杜罗(Aldo Duro)出版了一本概论《意大利的人文计算活动》(Huanities Computing Activities in Italy, 1968)。概论中表示,“人文计算”这个术语虽然在社群内还不足以占据统治地位,但已经家喻户晓44。尽管20世纪60年代末就已经进人以“人文计算”指代计算活动的初始阶段,但这一术语直到70年代初才开始作为领域的标识,这一点我们从史黛丝·坦纳(Stacey Tanner)有关1974年ALLC会议的报告中就能看出。该报告最初发表于《数据周》(Dataweek),后在《ALLC公告》(Tanner, 1975)上重印。坦纳对布萨在会议上的演讲进行了意译(paraphrase)。报告中提到,布萨谈到了“人文计算的末来”以及对“人文计算程序的展望”(Tanner, 1975, p. 54)。到20世纪80年代,用“人文计算”指代这一领域的情况己经非常普遍,正如布萨的回顾性论文《人文计算年鉴:托马斯著作索引》(The Annals of Hunanities Computing : The Inder Thomisticus, 1980)所显示的那样尽管霍基(1980a)和奥克曼(1980)都没有用这个词作为领域的名称。自20世纪80年代中期起,“人文计算”开始出现在北美的教学项目名称中(Ide, 1987)、计算中心名称中(华盛顿大学与麦克马斯特大学),以及场所建筑名称中(亚利桑那州立大学、杜克大学和加州大学洛杉矶分校)。虽然使用某个名称来界定一个独树一帆且条理清晰的学科经常会引起争论(Miall, 1990, p. 3),但经过20年的犹豫不决,两册《人文计算年鉴》(Humanities Computing Yearbook)(Lancashire and McCarty, 1988 and Lancashire, 1991)和五册《人文计算研究》(Research in Humanities Computing)(1991-1996)的出版终于确立了这一名称的地位。

 

6.文本编码

从一开始在人文学科中使用计算机和计算技术就出现的主要问题之一,就是输入、处理和输出时的数据表示。正如迈克尔·斯伯格-麦克奎恩(Michael Sperberg-McQueen)所说,计算机是二进制机器(birary machine),它“可以容纳和控制电荷的形式,但不能容纳数字,它是抽象的数字对象,但不是电荷,也不是文本;它是复杂、抽象的文化和语言学对象”(1991, p. 34)。这一点从早期输入设备的工作原理就可以看出。比如对穿孔卡片来说,根据计算机所使用的特定字符集,某一坐标上的孔实际上代表着这个坐标上的字符或数字是1还是0对还是错)。因为不同计算机系统所使用的字符集不同,不同宇符集所包含的宇符数量也不同,所以首先必须将文本转录为专用的字符集。所有的字符、标点符号、变音符号,以及文字样式的明显变化都必须利用有限的字符进行编码。由此就产生了一组复杂的“标记”,用以区分大小写、编码重音宇符,以及开始一个新的章节、段落、句子或词语。这些“标记”同样也用来在文本中添加分析性信息,例如词类信息、形态信息、句法信息和词法信息。理想状态下,每一个项目都使用自己的一套编码规范,贯穿始终。由于这—套规范往往是在对要转录为机读文本(machine readable text)的文本材料分析后设计而成,因此另外一份文本材料的语料库可能就需要另外一套规范。同时,规范的设计在很大程度上也取决于项目的性质和基础设施,例如硬件和软件。

尽管一些项目凭借这种内部统一的方法就能够取得有意义的学术成果,但每一套规范的特性或是编码方案都存在许多不足。在一个项目的专用方案下生成的文本难以被其他项目利用;因为编码方案的不兼容性和硬件的非标准化,为分析这类文本所开发出的软件也无法在项目之外得到应用。不过随着转录为机读格式的文本数量的增长,对资源进行经济利用的需求也变得广泛。早在1967年,迈克尔·凯(Michael Kay)就表示支持制定“一套标准代码,使得任何外来的文本都可以被看作标准代码”(Kay, 1967, p. 171)。理想状况下,这套代码将会作为一种交换格式,让用户可以在输人和输出时使用自己的编码规范(ibid, p. 172)。

有一些文学文本中编码和分析标记的标准化是通过COCOA的编码方案实现的。这一方案原先是为20世纪六七十年代的COCOA计划制定的(Russell, 1967),但在20世纪80年代的“牛津索引项目”(Oxford Concordance Program, OCP)(Hockey, 1980b)和20世纪90年代的“文本分析计算工具”(Textual Analysis Computing Tools, TACT)(Lancashire et al., 1996)中却是作为一套输人标准使用的。对于经典希腊文本的转录和编码,β转录/编码系统(Beta-transciption/encoding system)在一定程度上做到了标准化使用(Berkowitz and Squiter, 1987)。

1987年,32位人文学者45齐聚纽约波基普西市的瓦萨学院,参加一场为期两天的会议(1987年11月11-12日)。这场会议由ACH提议,南希艾德和近克尔·斯伯格·麦克奎恩组织举办。会议主要围绕应该如何为学术研究设立机读文本的编码标准以及是否应该设立这种标准的问题展开。会议的结论被表达为一套方法论原则——被称作“波基普西原则”(Poughkeepsie Principles)46——作为文学、语言学和历史学研究的文本编码标准的基础(Burnard, 1988, pp. 132-3; Ide, Sperberg-McQueen, 1988, pp. E. 6-4, and 1995, p. 6)。

到了原则实施阶段,ALLC和计算语言学协会(Association for Computational Linguistics, ACL)也参与到了ACH的工作中47。为了制定切实可行的文本编码标准,他们一起成立了“文本编码倡议”(TED)。TEI很快就采用标准通用标记语言(Standard Generalized Markup Language, SGML),1986年ISO出版发布的一个标准(Goldfarb, 1990)作为电子文本的推荐编码格式48。任命迈克尔·斯伯格·麦克奎恩为标准的总编辑,卢·伯纳德为欧洲地区标准的编辑。

1990年7月,“TEI 标准”的第一本公开倡议书《机读文本的编码和交换指南》(Guidelines for the Encoding and Interchange of Machine Readable Tezts)出版发行,书上印有TEI的文件编号 TEI P1——代表第一本倡议书(Sperberg-McQueen and Burnard, 1990)。“TEI标准”的进一步发展是由四个工作委员会(文本建档[Text Documentation]、文本表示[Text Representation]、文本分析和解释[Text Analysis and Interpretation]、元语言和句法[Metalanguage and Syntax])以及众多专业工作组共同推进的49。“TEI 标准”进一步发展后,大量新材料涌现出来。1992年3月至1993年末期间,这些新材料作为TEI P2,一章接着一章地出版发行(ibid, 1992——1993)。

1999年,初始阶段的制定工作以1292页的最终标准——《TEI P3电子文本的编码和交换指南》(TEI P3 Guidelines for Electronic Text Encoding and Interchange)——的出版告终(ibid, 1999),最终标准对大约439种元素进行了界定。这一标准提供的文本编码框架适用于任何自然语言、任何时间、任何文学体裁或文本类型,对文本形式和内容没有要求,对连续性材料(“行文”)和字典、语料库这样非连续性材料的处理也同等对待,达到了“波基普西原则”的要求。

1990年后,可扩展标记语言(XML)50作为一种行业标准取代了SGML,它的出现和成功对可兼容XML的标准51提出了要求(ibid, 2002)。2002年,这一版本的标准由新组建的TEI联盟出版发行52。在“P4标准”的XML可兼容版本下,使用TEI方案的XML和SGML应用享受同等支持,同时还确保在旧版TEI规范下生成的文件在新的版本下依然可用。

2003年,TEI联盟要求他们的成员召集特殊利益团体(SIGs),他们的任务可以是对“标准”中的特定章节提出修订意见,并为制定新版P5标准提出改动和改进建议。新成立的TEI 委员会负责对TEI 联盟的技术性工作进行监督。它的成立使得对从更基础层面上修正和提高“标准”的议程达成一致意见成为可能(TEI Consortium, 2007)。TEI P5中包含了用XML 对“TEI标准”的完整表达,引入了新的元素,对内容模型进行了修正,同时还对一个模块化分类系统中的元素进行了整理,提高该系统对用户需求的灵活变通性。TEI P5不同于之前的版本,不向之前的版本提供兼容性53

 

7.再说隐喻

令人好奇的是,罗丹的《地狱之门》在英语中被翻译为The Gates of Hell(复数),而不是法语原意的The Gate of Hell(单数)。但实际上前者的翻译更加贴切。人们对罗丹眼中的地狱存在着多种可能的诠释方法,而且以这个名宇命名的雕塑也不止一座。当罗丹的雕塑没能成功参加1900年的巴黎世界博览会时,他和他的雕塑家伙伴克劳德·莫奈(Claude Monet, 1840-1926)共同举办了一场独立展览。罗丹为这场展览制作了一个《地狱之门》的石膏模型54。他专门剥离了大部分的人物和群体雕塑,只留下表面的起伏,没有清晰的聚焦点。如此一来,他的雕塑从故事讲述上升到了情感表达的层次。因为青铜门是国有财产,不可出售,所以他将一些剥离下的人物和群体雕塑进行重组、放大和浇铸,使之成为可出售的商品,例如《思想者》《吻》(The Kiss)、《转瞬即逝的爱》(Fleeting Love)和《三个影子》(The Three Shades)55。其他雕塑也都是根据不同的材料和尺才进行加工改造的,例如《蹲着的女人》(Crouching Woman)。石膏模型的抽象特征重新引起了人们对其雕塑的兴趣。

同时在这点上,英语中的《地狱之门》也可以作为“人文计算”和“数字人文”的一个恰当的隐喻。随着时间推移,“人文计算”一直在作为一门学科或一个领域的自我表现和自我营销的问题上苦苦挣扎。在使用计算技术的人文学科中寻找一个共同实践、理论原则、方法论,或是哲学哲理似乎并不那么容易。“尽管大多被称作‘人文计算’的方法已经在特定的人文科目中得以实行”(Miall, 1990,p. 3),但对这个独树一帜且条理清晰的学科的有效性的质疑(始于20世纪80年代中期)仍末消失。“人文计算”作为一种应用方法,将自己定位为人文学科的一个群岛(McCarty, 2006;本书第五章)进行营销。这一点从规范的教学计划、文献集中的各个章节,以及会议的安排上都可以看出。“人文计算”的故事(历史)一直都是特定科目的故事(历史),例如著作权研究、电子文本编辑、叙事学以及多媒体研究;或者说是计算在历史学、音乐学、词典学和表演艺术等更多领域中应用的故事(历史)。

将这些科目单独分离出来为重塑“人文计算”为更不像术语且更加抽象的“数字人文”铺平了道路。这也使人们,尤其是广大群众,对该领域产生了新的兴趣。人文学科的潮流特质取代了人文计算那些封闭的活动,但自我表现和定义中的实质问题依然没变。

 

8.自我表现

有人争论说,如果我们知道我们在“人文计算”或“数字人文”中在做什么,那么出于监定我们的工作成果、获得认可和学术荣誉,以及通过使用先进的策略和工具来推动(跨学科的)发展与合作的考量,我们应该都可以进行交流。正如梅丽莎·特拉斯在界面(Interface)2011的开场主题演讲中提醒我们的那样,“我们应该遳镇自己正在将什么样的视角投射到更广阔的学术世界中”。特拉斯在数字人文2010大会的闭幕大会“现在,无权投票:圆形监狱中的‘数字人文’”上(2011b;本书第十八章),让我们清楚地意识到:作为一个领域、一个社群,我们的自我表现多么糟糕。在演讲快结束的时候,她为这个领域的数字身份(digital identity)、影响力和可持续性提出了一个议程。议程的核心是发展领域的定义,清晰表述领域的相关性、成就、影响,以及该领域作为一门学科的历史由来,并且保存学科传统。

维拉德·麦卡蒂认同特拉斯的看法,也认为领域的历史由来和定义是领域意识和自我表现的关键所在。近日,麦卡蒂(2012)表示,“数字人文在最初半个世纪的真正历史”“能够在很大程度上帮助我们将可怜的哀叹和无趣的事实转化为那些我们现在应该提出的令人兴致盎然的问题”。比根据现有年表编写人文计算的史学著作更具挑战性的是从历史角度对人文计算进行解释。为此,历史学家“必须在时间的广阔文化背景下寻找从业者中少数派担心的事情,然后对众多相关发展的汇合与分流的复杂模式进行描述”(McCarty, 2012)。

然而,领域的自我表现一直局限于年代综述和概论的呈现。例如,麦卡蒂在解释他的开创性著作《人文计算》(Humanities Computing)的命名时写道,它“是一个研究与实践领域的代名词。在世界上的很多地方,这个领域都不仅存在于学术内部,也存在于学术围墙之外”(McCarty, 2005, p. 2)。麦卡蒂引用了他和马修·柯辰保在《人文计算的机构模式》(Institutional Models for Humanities Computing)中一段更为翔实的描述作为说明——一个“以不同方式对人文计算进行例示的部门中心、研究机构和其他机构形式”的结构化列表 (McCarty and Kirschenbaum, 2003, p. 465)56

 

9. 人文计算

这种引用一个都是名称的例示列表,进而提供列举描述而非列举定义的下意识行为,正是尝试对(学术)活动领城进行定义的典型做法。从词源学上讲,定义这个词源自拉丁文中的“definitio”,字面意思就是界限或围墙。所以说,一个词的定义从形式上锁定了它所蕴含的意义,但因为“人文计算”作为一个活动领域,一直处于不断变化的状态,所以不可能有一个形式化描述。这种不可能性也因为领域年表或综述中对这些活动的列举而一直为人们所忽略。例如,在20世纪80年代末和90年代初,历史学和计算中的综述就是如此(Adman, 1987);对音乐计算来说,这种综述出现在1966-1991年(Hewlett and Selfridge Field, 1991);对CHum中有关文学统计分析的出版物来说,则是在1966-1990年(Potter, 1991)。近日,《数字人文指南》(A Corpanion to Digital Famanities)(Schreibman et al., 2004)上发表了对考古学、艺术史、古典文学、历史学、词典学、语言学、文学研究、音乐、多媒体、表演艺术以及哲学和宗教学的类似概述,尽管主要是从英裔美国人的视角进行的。

出于特定目的,有关“人文计算”发展的更普遍的概述已经对社群中所开展的活动产生了影响;这些概述要么针对社群本体,要么意在广大群众。1987 年,苏珊·霍基(1987)针对某次“人文计算”发展对教学的重大影响评估中,对硬件、软件、文本数据和人文学者所开设课程的可获得性,以及人们对人文学中计算技术的接受程度进行了简要说明57。3年后,霍基(1990)呼呼对领域中的活动进行批判性评估,并且在按照年代顺序从20世纪60年代初至今的对可用和新兴工具的概述结论中,她提议将元批评的重心从方法论转向建模。兰开夏根据自己对1968-1988年文学和语言学计算活动的见解来制定末来的发展策略。兰开夏(1990)将对过去的思考作为反思当下目的的一种方式,不仅促进了研究向教学的转变,而且将对“意义”的研究提升为末来“人文计算”的一项重要议程。我在这里要举的最后一个例子是1992年欧洲科学基金会(European Science Foundation, ESF)出版的一份有关计算机和人文学的报告(Genet and Zarpolli, 1992)。对人文学、社会科学以及自然科学的研究社群和政策制定者来说,这份报告是对基于计算机的人文学科研究的横向和跨学科特性所带来的挑战和潜力的介绍。这本书是作为一本备忘录提交给ESF的人文学常务委员会,书中除了对领域的发展和末来议程进行批判性反思外,还对人文研究计算方法的最新进展进行了说明,对人文计算的杂志、机构和项目进行了概述58

除了这样的做法似乎是将“人文计算”视为语义原语外,这些或多或少的时序概述都遵循着一个隐含的前提,即一个领域的历史知识对这个领域进行了界定,或者至少让我们可以对理论、方法和哲学上的公共地带进行探索,而这些公共地带对当下研究的领域具有重大影响和指示作用。除了最终的研究议程外,它们主要关注表现本身,避免涉及任何预测。换向话说,它们不会对“人文计算”进行定义,只会对领域的活动和工具进行概述59

当然人们可以说,通过研究领域中发生的事情,我们可以加深对领域的理解(Warwick et al., 2012 p. xiii),年表也可以为“人文计算”提供一个使用中的定义,或者通过对领域中的活动进行年代性报告来为其提供一个情景定义。这里的问题在于定义的年表。从它遵循的定义可以看出,一个情景定义可能并不是一个确定的表达,而是必须使用一个不包含这个表达的等价说法(OED online, definition, 4. c)60。在对“人文计算”的年表的叙述中,这个等价说法是一个由活动的所有情景定义或描述所组成的虚拟缩写式。这些定义或描述,在下定义的那一刻,被认为是属于这个领域的。因此,麦卡蒂(2005)在著作的一开始引用《机构模型》(Instirutional Models)中的列表,更多的是依据“人文计算”对列表中的所有元素进行了界定,而不是根据其(所谓的)活动来定义“人文计算”。

然而,正如麦卡蒂(2005)在《人文计算》中说的那样,即便这个领域的历史是真实存在的,它仍然需要方法论意识的补充。方法论是人文学中任何计算知识转移的基础,特拉斯和麦卡蒂也正是在这里确定了一场有关领域跨学科性的、有成效的辩论中需要讨论的问题。然而,这个问题并不是最近才提出的。罗本在1973年就已经指出,赞助主体对人文学中计算方法的普遍忽视是其发展和成功的最大障碍:“在他们眼中,一份文本的准备好像是秘书的工作,但图书出版却属于学术研究的范畴”(1973, p.5)。

麦卡蒂在书中试着通过“将人文计算的方法分解为四个角度:分析、综合、语境和专业”,从而弥合这一知识鸿沟(McCarty, 2005, p. 6)。分析与综合是所有人文学科的常规方法,前者属于非专业学者的领域,而后者则对于学者在学术界扮演社会学角色至关重要,最好是在学术界外也是如此。正如麦卡蒂(2005)充分表明的那样,既然“人文计算”是在人文学科,那么它的一般方法就和传统人文学科的方法没有什么区别。在计算性下,人文学者有机会将备选的分析方法发展成为一个论题。对人文学科的计算(工具上的)和人文学科中的计算(方法论上的)之间的差别正是建模作为计算的众多形式中最核心的分析方法的缺失(对前者而言)或是重要性(对后者而言)之间的差别。尽管后者属于“人文计算”的范畴,但在“数字人文”中二者地位相当。

对于建模,麦卡蒂指的是“搭建和操作模型的启发式加工”;在麦卡蒂看来,一个模型,要么是“为了研究,对某种东西进行的描绘”(外延模型),要么是“为了实现某个新想法的设计”(示范模型)(McCarty, 2003b; 2004, p. 255; 2005, p. 24)。建模从来不是为了直接证实真相,而是“通过失败引出并指出问题,例如:我们如何知道我们知道什么”(MCCarty, 1999b),“我们不知道什么”,以及“向我们提供我们还没有的东西”(McCarty, 2004, p. 255)。“人文计算”和(例如)计算机科学具有相同的方法论特征,但在模型上却截然相反。“人文计算”从对“有缺陷的显性知识”进行建模开始(McCarty, 2005, p. 194),然后一路前进,深化计算建模,直到对世界产生更深刻理解的阶段。而计算机科学,尤其是编程,是从真实存在的问题开始,一直到最终在硬件中的实施61

曼弗雷德·泰勒和提托·奥兰迪各自在他们的辩护——《人文计算机科学》(“Humanistic Computer Science”)(Thaller, 2001 and 2006)62和《人文信息学》(“informatica umanistica”)(Orlandi, 2003)——中都对人文学科和计算机科学共用的方法表示支持,他们共同将其定义为“增加特定领域中被认可的、正确的知识所需要的规范(或成套工具)”(Thaller, 1999, p. 25),这也让他们产生了比当下对计算机科学的认可程度更强的认同感。泰勒和奥兰迪认为通过算法和数据结构进行数据再现(data represertation)的方法对问题进行形式化,是人文学科中的计算的核心方法(Thaller, 1999, p. 27; Thaller, 2001, 2004; Orlandi, 2002)。

特别地,这种形式化的问题遭到了来自文本编码和建模理论领域的批评。因为人文学科不是问题导向型的学科,所以伯纳德认为他们的方法论不能被形式化。他反而认为诠释学 (hermeneutics)和文本编码是“人文计算”的核心,这两个方法在计算或其他任何科学领域中都未被分享。诠释学是针对解释说明的研究,它赋子文化对象以价值(Burnard, 2001, p. 32)。伯纳德认为诠释学的连续体的起点是转录和编辑,它们是对解释说明具有决定性作用的主观行为。对文本中不同符号系统的表达和记录进行标记63为人文学科提供了一种单一的形式体系,这种体系降低了“表现我们诠释学分析中各方面间互通性的复杂性,因此有利于多价分析的形成”(ibid, p. 37)。正如斯伯格·麦克奎恩曾经说的,这个层面上的文本编码不同于行业内进行学术研究时准备一份文本,它形成了一种新的学术研究形式(1991, p. 34),麦卡蒂(2003a)曾称之为“—种认识论上的建模”。文本编码倡议为人文学科提供了表达和记录专用的标记模型——也就是文本的不同解释的代表,明确了计算机可加工的形式化过程的一个文本理论。因此伯纳德并没有对问题定义的形式化表示赞同,而是支持文本及其解释向可加工的数据结构的形式化64

对奥兰迪和泰勒所提议的“人文计算”核心方法的第二种批评形式可以从建模理论中提炼出来。建模理论采用一种代表全部知识种类的方法,甚至超出了可以被明确且准确表达的知识的范畴(McCarty, 2004, p. 256),因此也超出了可以用算法表达式进行形式化的知识的范畴。不仅是失败,成功也使实现建模的问题化目的有了进展,即便这次成功在当时的模型搭建阶段中是偶然且难以说明的。将建模的变化形态作为实验,避开形式化,对于人们将学术研究视为一个过程而不是一个成品有很重要的意义。65这里面最突出的就是像“结构玩具”(thinkertoy)66那样的模型,可以体现出玩乐性、实验性的特点。确实,“名词‘模型’(model)的优点就在于,在以计算为基础的研究中,各项工作从根本上讲都具有实验性,这时‘模型’的默认形式就是它的现在分词‘建模’(modeling),以此表示这个过程”(McCarty, 2003b)。

在迈里格·贝农(Meurig Beynon)、史蒂夫·罗斯(Steve Russ)和麦卡蒂对人文学科的建模理论所做的贡献中,他们请求“从另一个角度对计算重新进行评估,让经验而不是逻辑享受特殊地位”(Beynon et al., 2006, p. 145)。为了进行重新评估,他们提供了一个命名为“人工计算”(human corputing)的新视角,并将其定义为“一种联合协作活动,活动中的设备,尤其是电子设备,能够凸显什么是意义构建中的核心人类活动”(ibid)。他们没有采用伯纳德建议的文本编码方式进行意义探索(启发式)——一种基本上将学术研究视为成品67的方法他们将人文学计算的关注焦点转向利用他们称为“经验建模”(Empirical Modelling)的方法进行意义构建68。从“人工计算”的角度来看,计算超越了执行算法的传统功能 源自人们对图灵机作为初级模型的认可。在这个模型中,人和计算机处于一种交替互换的关系。之所以如此,是因为它使人参与到了计算活动中。他们将此描述为“利用计算机模型的搭建和行为经验,让人不断与计算机进行互动和协商”(ibid)。在这个方法中,经验建模取代问题的算法形式化成为“人文计算”的核心方法。这种“经验建模”由能够与人的认知过程进行交互的工具所支持,并且这些工具会考虑“对与一些现象相关的可观察量,以及这些可观察量中可靠的依赖和代理模式进行试验性识别”(Beynon et al., 2006, p. 146)。因此,它类似于人文学者在个人与主观的(人文学者与研究对象间的)关系中处理研究对象时开发出的研究方法。

迄今为止,似乎宏观意义上的建模,特别是数据再现或文本编码——至少从它们的启发性和认识论层面的含义来看——都是“人文计算”的关键方法。它们作为粗略的实践方法并不排外,这就是对“人文计算”方法的监别。因此,有必要将文本编码作为一种学术(建模)实践,与通过标记(例如正在出版行业中使用的标记)进行的行业数据表示区分开来。同样地,自带计算属性的建模也应该与模型搭建这项古代艺术区分开来。

就像之前所说,也许建模和数据显现只在“人文计算”中才有,但它们却连接到人文研究中的两种通用方法,即分析与综合。在综合的问题上,麦卡蒂(2005)表示,数字版本的学术评论是综合在人文学科中最具前景的实例;正如一定的数据再现、启示法和建模合并成了杰出的学术参考书《卓越》(par excellence)(McCarty, 2005, pp. 73-113)69。矛盾的是,那些或许能够表明这些人文研究常规方法的应用是属于“人文计算”范畴的特征,正是我们想要超越的计算性。如果麦卡蒂写《人文计算》本书是希望通过提供一种“人文计算”的理论来吸收这种超越行为,那么它没能对自我表现问题的“人文计算”方法进行清晰、可引用,或是形式化的描述70。令人好奇的是,麦卡蒂在书中对“人文计算”制定初步议程时,正是针对这个交流问题提出了两点看法,议程中还给出了对领域方法的最终思考角度。然而,由于“人文计算”的形式化方法缺少清晰的描述,这个领域将难以成功地为“人文计算”承揽的每一项活动和每一个项目提供通俗化的解释,也无法为具体的活动和项目内容提供合理化的解释和辩护。

 

10.数字人文

因此,阿尔瓦拉多认为“数字人文”是一个社会类别(social category),而不属于本体论类别。马特·柯辰保支特阿尔瓦拉多的观点,他在2011年“数字人文日”(Day of Digital Fumanities)的概述中将“数字人文”定义为“—个战术便利的术语”(Taporwiki, 2011)。柯辰保(2010,见本书第九章)在他的文章《什么是数字人文和它对英语系有什么作用?》(“What Is Digital Humanities and What's It Doing in English Department?”)中提醒我们,“2004 年《数字人文指南》的出版(Schreibman et al., 2004)、2005年数字人文组织联盟71的成立、2006年NEH 创办数字人文倡议(Digital Humanities Initiative),以及2007年之后《数字人文季刊》的发行都促进了‘数字人文’作为领域通用名字的确立”。直到最近,文学与语言学计算协会也在2013年更名为欧洲数字人文协会(European Association for Digital Humanities, EADH),加人了这一运动。柯辰保(2012)在最近的一篇文章中,强调了使用这一术语完成工作的环境现实:

迄今为止,类似上述对“人文计算”的定义性陈述普遍借鉴“人文计算”的方法论和范围作为起点,但很少能总结出一个定义。根据拉斐尔·阿尔瓦拉多的说法,这是因为数字人文本来就没有定义。阿尔瓦拉多(2011)说,“虽然没有定义,但我们有系谱,它是暂时的思想流派、方法论和意向工具中语族相似的网络;是已经选择称呼自己为数字人文学者的人的历史;对于正处于尝试定义这个术语的阶段,正在创造这个定义的人,这也是他们的历史”。

从塔娜·麦克弗森(Tara McPherson)对“数字人文”的类型分析中也能看出,“人文计算”的定位基本上就是计算在基于文本的人文学科中的工具性应用。麦克弗森在2008年 HUMlab的演讲《动态方言:当代学术中的新兴数字形式》(“Dynamic Vernaculars: Emergent Digital Forms in Contemporary Scholarship”)中,对“计算人文”(Computing Humanities)、“博客人文”(Blogging Humanities)以及“多模态人文”(Multimodal Humanities)进行了区分,并且大致阐述了三者之间的特定联系。“计算人文”指的是“人文计算”的长期传统,焦点是工具、标准和互用性(McPherson, 2008, 0: 10: 00),“博客人文”是指网络上的点对点写作,主要是在非专业的计算人文学者间进行;而“多模态人文”综合前两者,同时将计算机作为一个平台、一种媒介和一个显示设备进行研究。正是在这种多模态的学术研究中,麦克弗森发现了“数字人文”的一个发展议程。我们发现斯文森的分析同样也对这种关联性进行了表述。他说,“[有]很多参与那些或许可以被称作数字人文活动的人文学者,他们对人文计算一无所知或所知甚少;反之亦然,有很多人文计算的代表人物,也不过多参与现在的‘新媒体’研究,例如平合研究、跨媒体视角或数据库美学等”(2009, p.7)。

斯文森在第一篇文章中总结说,一个构思全面的“数字人文”必然包含人文计算及其对“工具、方法论、文本和数字化”的关注(2009, p. 56),他还承认“认知承诺和传统惯例”,例如人文计算“很难被归为数字人文的另外一种类型”(2010, p. 4)。换向话说,“数字人文”的领域要更大一些(2009, p. 42)72。因此,斯文森表示,这两个术语不是同义词,而且从“人文计算”向“数字人文”的话语性转变也不仅是一次再包装,更是一次范围的拓宽。他补充说,这个术语在“数字人文”社群中是一个集合名称,用以指代人文学和信息技木之同的活动和结构(ibid)。

各种圆桌讨论、会议小组、论文和海报,数字人文中心和研究机构的任务陈述,还有脸书和推特73,都不断为杂志和博客文章提供这种定义性陈述,极大丰富了现在的文献,并且证明了定义性文章已经自成一类(Kirschenbaum, 2010, p. 55;见本书第九章)74。近期,这类文章中最详尽的新陈述之一是帕特里克·斯文森(Patrik Svensson)所写的刊登在《数字人文季刊》上的四部曲系列文章。在这个系列文章中,斯文森尝试通过绘制图表的方式来理解“数字人文”这个新兴领域。在第一篇文章中,他仔细审查了从“人文计算”到“数字人文”的话语性转变(Svensson, 2009;见本书第7章);在第二篇文章中,探索了“数字人文”更大的覆盖范围(Svensson, 2010);在第三篇文章中,他对宏观意义上的人文学科,特别是对“数字人文”的网络信息基础设施进行了讨论(Svenssom, 2011);在第四篇文章中,斯文森“为‘数字人文’的未来”呈现出“一个暂时的前瞻性发展空间”(Svensson, 2012)。

最近,罗伊·罗森茨威格历史与新媒体中心数字学术研究的主管弗雷德·吉布斯介绍了自己对数字人文定义的分类,他提醒说“[如果]有两件东西是学术界不需要的,那就是另一本有关达尔文的书,和另一篇对数字人文进行定义的博文”(Gibbs, 2011;见本书第二十一章)。确实,自布莱克维尔的《指南》一书出版后,已经涌现出大量有关“数字人文”日标和本质(有时是与“人文计算”的区别)的定义性陈述。

“数字人文”亦是如此。这个术语肯定已经但并不完全取代了“人文计算”成为领域名称。似乎人们对这一术语的普遍理解就是“数字时代下人文研究”的代名词,与传统的人文研究相对。然而,这个新名字的大众化和社会化必将带来平凡化的风险。“数字”这个大众化的条件只和计算的技术(工具的?)元素相关,而与“计算机”“计算”或“计算的”这样的专业术语无关。不过这并没有解決领域定义的问题,甚至使问题模糊不清。尽管与“数字人文”相比,“人文计算”是一个更加封闭的术语,但它界定的范围却更加清哳。“人文计算”关乎信息学、信息科学与人文学的交汇地带,而且它是在早期“词汇文本分析”和“机器翻译”的领城上发展起来的,这一点我们之前己经谈到了。“数字人文”这个术语并非特指这样的专业活动,而是提供一个大帐篷,将人文学科中的所有数字学术研究都囊括在内。2004 年,《数字人文指南》的编辑突然引入这个术语作为通常所指的“人文计算”活动的扩充,他说领域“对自己进行重新定义后,接纳所有的多媒体种类”(Schreibman et al., 2004, p. xxii)。然而这里还存在一个问题,那就是成熟发展的学科,例如计算语言学或者多媒体和游戏研究,是否希望住在“数字人文”的大帐篷下。

 当整个学界,特别是人文学,成为巨大且猛烈的变革对象时,数字人文作为一个稀有的柔术矢量出现,将人文学院置于特定价值的载体——开拓精神、开放性和公众参与、未来导向型思考、协作、跨学科性、大数据、行业联动,以及远程或分散式教育——的最前沿,同时也顾及到了多形式的学院内部流动——提出新的课程、雇佣新的同事、分配新的资源,以及重新分配旧的资源。(Kirschenbaum, 2012)

对这一术语的当下使用以及它的起源也是为了一时的战术便利, 这一点我们从柯辰保的《什么是数字人文》一文中已经了解到了。很明显,布莱克维尔的社论和营销人员不喜欢《人文计算指南》(A Companion to Humanities Computing)这个标题,而是希望以《数字化人文指南》(A Companion to Digitized Humanities)来命名。即使曾经提出用“人文信息学”来指代这个领域,但作为一种妥协,同时也为了将重点从简单数字化和复杂计算上转移开,约翰·昂斯沃斯提议了《数字人文指南》这个名字(Kirschenbaum, 2010, pp. 56-7)。

 

11.总结

之前已经说过,“数字人文”中自我呈示和自我呈现问题仍然存在。维拉德·麦卡蒂在《人文计算》的终章中,为领域制定了一个与麦克弗森的“多模态人文”关系密切的议程。麦卡蒂议程中的大多事项都和麦克弗森的三类人文相关或部分相关,他甚至在支持学者和从业者重归于好的论述中隐晦地表达了对大帐篷的支特。事实上,麦卡蒂的著作很好地证明了,斯文森有关“人文计算”的限定条件是关注“工具、方法论、文本和数字化”的观点是一种还原论的视角。如果有哪一本书反对过分强调计算机在人文学科中的工具性使用,并提议将计算作为以世界模型为基础,同时生成世界模型的意义生产活动,那一定是麦卡蒂的《人文计算》。

“我们在‘数字人文’中做什么以区它和世界有什么关联”是一个我们不应该回避的问题。即使它会带来糟糕的后果,或者出于这本书的考虑,会打开“地狱之门”。现在,我们知道“数字人文”试图通过成功和失败对我们生存的世界进行建模,从而加深我们对人类、人类活动和人工制品的理解,并将其记录下来,无论这些东西是我们己知的还是未知的。也许这可以作为这个领域的一个定义。

 

 

 注释

1.此文献给罗恩·范·丹·布兰登:没有你…

2.http://www.musee-rodin.fr/fr/collections/sculptures/la-porte-de-lenfer2013112日访问)。

3.http://www.canal-educatif.fr/en/videos/art/2/rodin/gates-of-hell. html (2013112日访问)。

4.本文中,加引号的“人文计算”指代整个领域,而没有引号的则指代人文学中的计算活动和对人文学进行的计算活动。

5.“为了人文学科的计算”是指为了人文学科而对计算的工具性使用;“人文学科中的计算”是指“人文计算”的意义生产活动。

6.参见图勒(Toole, 1996, 1998),了解她的生平和作品评价。

7.原先出版在Bibliotheque Universelle de Geneve, 82(1842年10月)。

8.翻译标注单独出版在《科学回忆录:外国学院及学术田体议事录和外文期刊选集》(Scientific Memoirs, Selections from The Transactions of Foreign Academies and Learned Societies and from Foreign Journals),1843年由理查德·泰勒(Richard Taylor)编辑。

9.“巴贝奇的分析引擎”是一项有关计算机可操作的机械计算器的提议,计划可以存储1000个50位数字。它使用穿孔卡片进行指令输入、数据的输入和输出,以及数据和指令的存储。

10.CSIRAC:科学和工业研究议会自动计算机(Council for Scientific and Industrial Research Automatic Computer)。

11.该程序由弗农·马修(Vernon Matthews, b. 1926)在贝尔实验室编写(多恩布施[Doornbusch], 2004, 2005)。

12.更确切地说是军械部。

13.参见埃克斯坦(Eckstein, 1996),了解埃克特早期生活的描述;参见威尔克斯(Wilkes, 1995),了解他的作品。

14.参见斯特恩(Stern, 1980),了解莫克利的生平;参见莫克利(1984),了解他至关重要的早期实验和研究。

15.参见韦弗1970了解他的生平参见哈钦斯2000b)了解其简要生平。

16.参见斯派克·琼斯(Sparck Jones, 2000),了解瑞奇恩在MT领域的研究综述。

17.参见布斯(1997)和布斯夫妇(2000),了解布斯在MT领域的研究综述。参见布斯(1980),了解他对晶体学的研究,以及对早期计算机和磁存储设备发展的贡献。布斯同时也是英国软盘专利的持有人。

18.论文《机械化翻译的一些方法》(“Some methods of mechanized translation”)写于1948 年,但直到1955年才发表(Sparck Jones, 2000, p. 263)。这篇论文出现在了1952年6月份在麻省理工学院举办的首届机器翻译大会(Conference on Mechanical Translation)上。

19.参见洛克和布斯的文献注释(1965 [1955], pp. 227-36)。

20.这本书重印了两次,分别是在1956年和1965年,后于1957年翻译为俄文。

21.1954年1月8日,TBM新闻稿,http://www-03.ibm.com/ibm/history/exhibits/701/701_ translator.html[2013年1月12日访问]。

22.了解这些国家中相关研究的记录和综述,参见哈钦斯的其他论文(2000a)。

23.自动语言处理咨询委员会。

24.ALPAC的报告让科学界对“机器翻译”的研究空缺长达十年,而资助机构则更长,而且它使得公众相信“机器翻译”比科学更加虛幻。20世纪80年代后,在1989年更名为《机器翻译》的新杂志《计算机与翻译》(Combuters and Tiranslation, 1986),以及一系列的国际会议和研讨会中,才看出人们重新对“机器翻译”产生了兴趣。1989年,《文学和语言学计算》(4[3])专门为“机器翻译”划分了一个特殊区域,里面有6篇安东尼奥·扎姆波利引入和编辑的文章。

25.尽管布萨在他的“参考文献”中提到了这篇文章,但由于这篇文章是以第三人称写的,所以不清楚布萨是否真的是这篇文章的作者。

26.好几位作者都认为1949年是人文学开展计算工作的象征性起点,参看最近的伯迪克(Burdick)等(2012, p. 123)。

27.数据来源于项目报告“Opera quae in indicem thomisticum sunt redacta”(1975, 1980年修订),是由私人提供给我的。

28.UNIVAC计算机由制造ENIAC和EDVAC计算机的团队制造。

29.因为 FORTRAN语言在1975年才出现,所以编程还属于卡片管理的范围。

30.同样是在1957年,康奈尔大学启动了一个计算机制作的索引系列的项目(当时布萨或埃里森的相关研究还未开始,与他们无关),由斯蒂芬·M.帕里什(Stephen M. Parrisb)担任总编辑(Parrish, 1963, p. 3)。

31.这些会议在1964-1965年分别在罗格斯大学、耶鲁大学、加州大学洛杉矶分校、华盛顿特区大学联合会、普杜大学和波士顿大学举办。

32.会议纪要由威斯比(1971)出版。

33.会议纪要由艾特肯(1973)等人出版。

34.http://www.alle.org [2013年1月12日访问]。ALLC近日更名为EADH:欧洲数字人文协会。

35.这解释了为什么EADH网站上列出的前两届ALLC会议时间早于协会的成立时间。

36.除1985、1986、1987和1988年的ALLC会议外,从1989年起每年都会举办一次联合会议,偶数年在欧洲,奇数年在美国或加拿大。1990-2005年,根据举办地点不同,会议名称为ALLC/ACH或ACH/ALLC。2005年ADHO成立后,大会更名为“数字人文”

37.http://www.ach.org [2013年1月12日访问]。

38.1968年发行了另一本杂志:《人文学和言语行为中的计算机研究》(Computer Studies in the Humanities and Verbal Behaviour)。

39.不过,英国还独立组织了“人文学的计算机辅助教学”(CATH)系列会议。

40.注意,现在是霍基在她的书的标题中使用“人文学科中的计算机”这个词,而奥克曼已经将适用范围缩小到“文学研究”了。

41.虽然霍华德-希尔(Howard-Hill)的《文学一致性》(Literary Concordances, 1979)被称为“人工和计算机一致性的预备大全”,但它对计算涉及甚少。不过,它比霍基和奥克曼的出版时间早一年。霍基在1978年就已经完成了她的著作,不过出版商把她的稿子压了一段时间。当她听说奥克曼在写书的时候,她的手稿已经交到出版商那里了(苏珊·霍基,私人对话,2005年6月5日)。奥克曼在1978年初完稿(1984, p. xv),而且他在1984年修订的再版中明确地提到了霍基的著作。

42.“我认为之所以会产生这种相似性,是因为可参考的材料并不多,只有一些会议纪要、CHum,还有ALLC的出版物”(苏珊·霍基,私人对话,2005年6月5日)。

43.感谢维拉德·麦卡蒂为我提供这篇文章的副本。

44.差不多那个时候,美国科罗拉多大学已经有一台可操作的“人文计算装置”了。

45.其中有来自欧洲主流文本档案馆、北美重要学术和商业研究中心的代表参加。

46.我引用的是《案例下的TEI》(TEI by Example)中“模块0:介绍”里的“波基普西原则”,http://www.teibvexample.org是这部分中有关文本编码内容的依据[2013年1月12日访问]。

47.http://www.aclweb.org [2013年1月12日访问]。

48.启动基金由美国国家人文基金会(US National Endowment for the Humanities)、欧共体委员会第十三总司(Directorate General XIII of the Commission of the European Communities)、加拿大社会科学和人文研究理事会(Canadian Social Science and Humanities Research Council)以及安德鲁-W.梅隆基金会(Andrew W. Mellon Foundation)共同提供。

49.其中包括符集、考证、超文本和超媒体、公式、表格、图形、图表、语料库、手稿和手稿学、诗篇、戏剧和表演文本、文学散文、语言描述、口语文本、文学研究、历史学研究、纸质字典、机器字典,以及术语数据等工作组。

50.http://www.w3.org/TR/REC-xml[2013年1月12日访问了。

51.“TEI 标准”的XML表达和对一个符合“TEI 标准”的XML DTD的遵守实现了对XML的支持。TEI联盟生成了一套DTD的碎片,既可以组合成为SGML DTD, 也可以组合成为XML DTD,因此实现了TEI P3下编码文本的后向兼容性。换句话说,任何符合TEI P3 SGML DTD的文件都一定符合TEIP4 XML版本的标准。TEI P4的这种“双重意识”是将其称为“XML可兼容版本”而非“XMIL版本”的原因。

52.TEI联盟成立于2000年,作为一个非营利性会员机构,主要是为了维持和发展TEI,http://www.teirc. org [2013年1月12日访问]。

53.不过TEI联盟连续五年一直对“P4标准”进行维护和错误更正,一直到2012年末。此后,TEI联盟为了TEI P5,不仅停止了官方支持,并且弃用了TEI PA。

54.在默东(Meudon)的罗丹博物馆展出。

55.当时罗丹需要依靠出售单独的雕塑谋生。

56.除本书的URL因ALLC网站的重新设计而失效外,这个列表也已经被CenterNet在数字人文中心出版的信息所替代,http://digitalhumanities.org/centernet [2013年1月12日访问]。也可以参考丹·科恩(Dan Cohen)在Twitter上的数字人文学者和中心的列表,https://twitter.com/#!/dancohen/digitalhumanities/members [2013年1月12日访问]。

57.尤其是可独立操作的“微机”的快速发展与“大型计算机”的对照,以及储存容量的快速增加对“人文计算”与高等教育教学的互动方式,如在大型文本集合中的检索方面的革新。

58.当时领域的情况还一目了然,而且网络基础设施和资源地没有出现,这里提到的概述是圈定领域活动范围的一次尝试。

59.在这些年表中,决定时间范围和焦点的是年代学家的直觉,而不是领域的定义。他们错误地认为将焦点放在领域上就能给出定义。

60.OED online : 《牛津英语词典在线版》(Oxford English Dictionary online.)

61.参见麦卡蒂的《建模阶段》(“Stages of Modelling”)(MoCarty, 2005, p. 197)。

62.泰勒是“Historisch-Kulturwissenschaftliche Informationsverarbeitung”专业的教授。他在自己的网站(http://www.hki.uni-koeln.de/manfred-thaller-dr-phil-prof)[2013年1月12日访问]上將其翻译为“人文学的计算机科学”[2013年1月12 日访问]。

63.伯纳德谈到了文本的三种连锁符号系统:文本作为图像,文本作为语言架构和文本作为信息结构(2001, p. 33)。

64.例如,对内容对象的有序层次结构中的文本(OHCO),还有对标记意义的解释进行所提议的形式化。

65.例如,麦卡蒂(1999a)认为从学术角度看,文本编码,即“通过添加明确陈述的元数据来渲染可计算的现象”,和成品一样基础。他在这里似乎忽略了真正的文本编码是一种可变化的建模活动,它也可以生成“结构玩具”。

66.原本“Tinkertoy”是一种建筑玩具,儿童可以用来搭建任何想象中的东西,并且“通过锻炼我们现在所说的‘空间智能’进行学习”,http://www.toyhalloffame.org/toys/tinkertoy [2013年1月12日访问]。正如麦卡蒂(2003b)指出的,随后这个词被用以“描述粗略的(或者说纯物理的)建模技术”(n. 1)。

67.参看麦卡蒂(1999a)。

68.更多有关“经验建模”的信息请参见“经验建模”网站http://www2.warwick.ac.uk/fac/ sci/des/research/em,和http://www2.warwick.ac.uk/fac/sci/dcs/research/emn/projects中的“经验建模”档案[2013年1月12日访问]。

69.麦卡蒂所说的评论形式的理想结构由以下几个部分组成:“(1)所评论作品的学术介绍;(2)用文本设备对作品进行的文本编辑;(3)评论本身,以与文本配合的段落长度的标注为表现形式;以及(4)内容和索引的常见表格”(McCarty, 2005, p. 77)。

70.麦卡蒂博学的、富有哲理的个人习语和文体指纹形成了一种浓厚且有时神秘的平淡文风,需要读者付出很多努力才能理解。

71.收集在本书的伴生网站http://blogs.ucl.ac.uk/defningdh中。

72.集合这类文章和讨论的书也已经自成一类。参看贝里(Berry, 2012),戈尔德(Gold, 2012),卢内菲尔德(Lunenfeld et al., 2012)。

73.《数字人文指南》的编辑表示,领域“已经对自己进行了再定义,接纳所有的多媒体种类”(Schreibman et al., 2004, p. xxii),重新起名为“数字人文”。

74.http://www.digitalhumanities.org [2013年1月12日访问]。

75.所有网址于 2013年1月12日访问。

 

 

参考文献

Adman, P. (1987). "Computers and Fistory”, in S Rahtz Ced. ), Informa- tion Technology in the Femanities: Tools, Techriques and Applications, Chiches- ter: Ellis Horwood Limited, pp. 92 - 103.

Ager, D.E., Knowles, F. E. and Smith, J. Ceds) (1979). “ Advances in Computer- aided Literary and Linguistic Research". Proceedings of the Fifth International Symposium on Computers in Literary and Linguistic Research held at the University of Aston in Birmingham, UK, 3 - 7 April 1978, As- ton: AMLC.

Aitken, A. J., Bailey, R. W. and Hamilton- Smaith, N. ceds) (1973). The Computer and Literary Studies, Edinburgh: Edinburgh University Press.

ALPAC (1966). “Languages and Machines: Computers in Translation and Linguistics', A report by the Automatic Language Processing Advisory Committee, Division of Behavioral Sciences, National Academy of Sciences, National Research Council, Washington, DC: National Academy of Sciences, National Research Council ( Publication 1416), http: / www. nap. edu/ books/ ARC000005/htonl.(链接失效译者注)

Alvarado, R. (2011). “The Digital Huranities Situation”, The Trans- ducer, 11 May, http: / transducer. ontoligent. com/? p=717.

Berkowitz, L. and Squiter, K. A. (1987). Thesaurus Linguae Graecae, Canon of Greek Authors and Works, New York/Oxford: Oxford University Press.

Berry, D. M. Ced.) (2012) . Understanding Digital Humanities, Lon- don: Palgrave Macmillan.

Beynon, M. , Russ, S. and MeCarty, W. (2006)• “ FTuman Compu- ting? Modelling with Meaning”, Literary and Linguistic Computing, 21 (2,pp. 141-57.

Booth, A. D. (1958) . “The History and Recent Progress of Machine Translation’, in A. H. Smith Ced. ) Asbects of Translation. Studies in Com- munication 2, London: Secker and Warburg, pp. 88 -104.

Booth, A. D. (ed. ) (1967). Machine Transtation, Amsterdarn: North Holand Publishing Company.

Booth, A. D. (1980). “Computers in the University of London, 1945- 1962”,in N. Metropolis, J. Holett and G-C. Rota ceds), A History of Computing in the Treentieth Century . A Collection of Essays, New York, London, etc. : Academic Press, pp. 551-61.

Booth, A.D., Brandwood, L. and Cleave, J. P. (1958). Mechanical Resolution of Linguistic Problems, London: Butterworths Scientific Publications.

Booth, A. D. and Booth, K. H. V. (1953) . Automatic Digital Calcula- tors, London : Butterworth.

Booth, A. D. and Booth, K.H. V. (2000). “The beginnings of MT”, in W.J. Hutchins (ed. ), Early Years in Machine Transtation . Memoirs and Biog- raphies of Pioneers, Amsterdar/ Philadelphia: John Benjarins Publishing Com- pany, pp. 253-61.

Booth, A. D. and Locke, W. N. (1965). “Ffistorical Introduction”, in W. N. Locke and A. D. Booth Ceds), Machine Translation of Languages: Fourteen Essays, Cambridge, MA: The MIT Press, pp. 1 - 14. Original publication 1955.

Booth, A. D. (1997). “ Andrew D. Booth, an Autobiographical Sketch”, IEEE Annals of the History of Computing, 19 (4), pp.57-63.

Bowles, E. A. (ed. ) (1967). Computers in Humanistic Research: Readings and Perspectives, London: Prentice Hall.

Burdick, A., Drucker, J., Lunenfeld, P., Pressner, T. and Schnapp, J. (2012). Digital Humanities, Cambridge, MA: MIT Press, http: // mit- press. mit. edu/sites/ default/ files/ titles/ content/ 9780262018470_ Open_ Ac- cess_ Edition. pdf.

Burnard, L. (1988). “Report of Workshop on Text Encoding Guide- lines'', Literary and Linguistic Computing, 3, pp. 131 -3.

Burnard, L. (2001). “On the Hermeneutic Implications of Text Enco- ding'”, in D. Fiormonte and J. Usher (eds), Nere Media and the Humani- ties: Research and Applications, Oxford Humanities Computing Unit, pp. 31-8.

Busa, R. (1949). La terminologia Tomistica dell'Interioritd : Saggidi metodo ter wn' interpretaxione della metafisica della presenxa, Milano: Fratelli Bocca.

Busa, R. (1950). “Complete Index Verborum of Works of St. Thomas”Speculun: A Journal of Medieral Studies, XXV/1 (January), pp. 424-5.

Busa, R. (1951). S. Thomae Aquinatis Hymorum Ritualium Varia Specimina Concordantiarum. Primo sasgio di indici di parole automatica- mente composti e stampati da macchine IBM a schede perforate, Milano : Bocca.

Busa, R. (1980). “ The Annals of Humanities Computing: The Index Thomisticus', Com puters and the Humanities, 14, pp. 83- 90.

Busa, R. (2002). Hermeneutika e kompiuterizar. Pas gjashtedhjete ujetesh-L'ermeneutica computerizzata. Sessant'anni dopo-Computerixed her- meneutics. Sizty years on, Tirane: albin.

Busa, R (2004a). “Analysis of scientific and philosophical texts. What differentiates them and what they have in common', in D. Buzzetti, G. Pan- caldi and H. Short Ceds), Augmenting Comprehension. Digital Tools and the History of ldeas. Proceedings of a con ference at Bologna, 22 -23 Sep- tember 2002, London: Office for Humanities Publication, pp. 15- 17.

Busa, R. (2004b) . “Foreword: Perspectives on the Digital Humanities”, in S. Schreibman, R. Siemens, and J. Unsworth (eds), A Companion to Digital Hunanities, Malden, MA/Oxford/ Carlton, Victoria: Blackwell Publishing, pp. xvi-xxi.

Doornbusch, P. (2004). “Computer Sound Synthesis in 1951: The Mu- sic of CSIRAC”, Compater Muusic Journal, 28 (1),pp.10-25.

Doornbusch, P. (2005). The Muusic of CSIRAC, Australia's first com- puter music, Altona, Vic. : Common Ground Publishing.

Duro, A. (1968) . “ Humanities Computing Activities in Italy”, Com- puters and the Humanities,3 (1) (September), pp. 49-52.

Eckstein, P. (1996). “J. Presper Eckert”, IEEE Annals of the Fisto- ry of Computing, 18 (1) (March), pp. 25-44.

Ellison, J. W. (1965). “ Computers and the Testaments”, in G. W. Pierson Ced. ), "Computers for the Humanities?” A Record of the Conference Sponsored by Yale University on a Grant from IBM January 22 - 23, New Haven, Connecticut: Yale University Press, pp. 64 - 74.

Genet, J. -P. and Zampolli, A. Ceds) (1992). Computers and the Hu manities, Aldershot: Dartmouth/ European Science Foundation.

Gibbs, F. (2011) . “Digital Humanities Definitions by Type'”, http://fredgibbs. net/blog/teaching/digital-humanities- definitions-by-type ( Chapter 21 in this volume) .(链接失效译者注)

Gold, M.K. (ed. ) (2012). Debates in the Digital Humanities, Minne- abolis: University of Minnesota Press.

Goldfarb, C. E. (1990). The SGML Handbook, Oxford: Clarendon Press.

Heller, J. and Logemann, G. w. (1966). “PL/I: A Programming Lan- guage for Humanities Research”, Computers and the Humanities, 1(2) (No- vember), pp. 19-27.

Hewlett, W. B. and Selfridge- Field, E. (1991). “Computing in Musi- cology”, Computers and the Humanities, 25 (6),pp.381- 92.

Hockey, S. (1980a). AGuide to Computer Applications in the Human- ities, London: Duckworth.

Hockey, S. (1980b). Dxford Concordance Prosram Users' Manual, Oxford: Oxford University Computing Service.

Hockey, S. (1987). “ An Historical Perspective”, in S. Rahtz (ed.), Information Technology in the Humanities: Tools, Technigres and Appi- cations, Chichester: Ellis Horwood Limited, pp. 20-30.

Hockey, S. (1990). “ Tools for Literary and Linguistic Computing: What is there? what is emerging? and what is needed?”, in Y. Choueka (ed. ), Computers in Literary and Lingwistic Research. Literary and Lin- guistic Computing 1988, Proceedings of the Fifteenth International Conference, Jerusalem, 5 - 9 June 1988, Paris/ Geneve: Champion Slatkine, pp. 29 -35.

Howard-Hill, T. H. <1979 ). Literary Concordances: A Comblete Handbook to the Preparation of Manual and Computer Concordances, Oxford: Pergamon Press.

Hutchins, W.J. (1986). Machine Transtation: Past, Present, Future, Chichester: Ellis Horwood Limited, http: / ourworld. compuserve. com/ homepages / WJHutchins/PPF-TOC. htm.(链接失效—译者注)

Hutchins, W.J. Ced. ) (2000a). Early Years in Machine Translation.Memoirs and Biographies of Pioneers, Amsterdam/ Philadelphia: John Ben- jamins Publishing Company.

Hutchins, W. J. (2000b). “ Warren Weaver and the launching of MT. Brief biographical note”, in W. J. Hutchins Ced. ), Early Years in Machine Translation. Memoirs and Biogra phies of Pioneers, Amsterdam/ Philadel- phia: John Benjamins Publishing Company, pp.17 -20.

IBM (1971a). Introduction to Computers in the Humanities, White Plains, New York: IBM.

IBM ( 1971b ). Literary Data Processing, White Plains, New York: IBM

IBM (1971c). Computers in Anthropology and Archeology, White Plains, New York: IBM.

Ide, N. M (1987). “Computers and the Humanities Courses: Philosophical Base and Approach”, in N. M Ide (ed. ), Special Issue on Teaching Computing to Huonanists. Computers and the Humanities, 21 (4), pp. 209-15.

Ide, N. M. and Sperberg-McQueen, C. M. (1988). “Development of a Standard for Encoding Literary and Linguistic Materials'”, Cologne Computer Conference 1988. Uses of the Computer in the Humanities and Social Sci- ences. Cologne University, 7 - 10 September 1988, Volume of Abstracts, pp. E.6-3-4.

Ide, N. and Sperberg- McQueen, C. M. (1995) . “ The TEI: History, Goals, and Future. ” Computers and the Humanities, 29/1:5-15.

Jones, A. and Churchhouse, R. F. Ceds) (1976). The Computer in Lit- erary and Linguistic Studies. (Proceedings of the Third International Symposium), Cardiff: The University of Wales Press.

Kay, M. (1967). “ Standards for Encoding Data in a Natural Ian- guage', Comnputers and the Humanities, 1 <5),pp.170-7.

Kirschenbaum, M. G. (2010). “What Is Digital Humanities and What's It Doing in English Departments?” ADE Bulletin, 150, pp. 55- 61 (Chapter g in this volume) .

Kirschenbaum, M. G. (2011). Comment to Alvarado (2011) on http: / transducer. ontoligent. com/?p=717.

Kirschenbaum, M. G. (2012). “ Digital Humanities as/is a Tactical Term', in M. K. Gold (ed. ), Debates in the Digital Humanities, Minneap- olis MN: University of Minnesota Press, http: // dhdebates. gc. cuny. edu/ de- bates/ text/48.

Lancashire I. (1990). “Back to the Future: Literary and Linguistic Corputing 1968-1988.” In Choueka, Yaacov (ed. ), Compatersin Literary and Linguistic Research : Literary and Linguistic Com puting, 1988: Pro- ceedings of the Fifteenth Interrational Con ference, Jerusalem, 5 -9 June 1988, Paris: Champion- Slatkine, pp. 36-47.

Lancashire, I. Ced.) (1991). The Humanities Computing Yearbook 1989-1990, Oxford : Clarendon Press.

Lancashire, I. and MeCarty W. Ceds) (1988) . The Humanities Compu ting Yearbook 1988, Oxford: Clarendon Press.

Lancashire, I. , Bradley, J. , McCarty, W., Staits, M. and Woolridge, T. R (1996). Using TACT rerth Electronic Tezts, New York: Modern Language Association of America.

Lessard, G. and Levison, M. (1998). “Tntroduction: Quo Vadimus?”Computers and the Humanities,31 (4), pp. 261-9.

Levison, M. (1962). aThe Mechanical Analysis of Language”, NPL, pp. 562 -74.

Levison, M. (1967). “The Computer in Literary Studies’, in A. D. Booth(ed.), Machine Transtation, Amsterdam: North-FIolland Publishing Company, pp. 173 - 94.

Locke, W. N. and Booth, A. D. ceds) (1965). Machine Transtation of Languages. Fourteen Essays, Cambridge, MA: The MIT Press. Original publication 1955.

Lovelace, A. A., Countess of (1961). Notes by the Translator”, in P. Morrison and E. Morrison Ceds), Charles Babbage and his Calcalating En- gines. Selected Writings by Charles Babbage and Others, New York: Dover Publications, pp. 245 - 95. Original publication in R. Taylor(ed.), Scien- tific Memoirs, Selections from The Transactions of Foreign Academies and Leared Societies and from Foreign Journals, 1843.

Lunenfeld, P., Burdick A. , Drucker, J., Presner, T. and Schnapp, J. (2012). Digital Humanities, Cambridge (MA): The MIT Press.

Lusignan, S. and North, J. (eds) (1977). Computing in the Hamani- ties, Waterloo: University of Waterloo Press.

Mauchly, K. R. (1984). “John Mauchly's Early Years”, Annals of the History of Computing, 6 (2),pp.116-38.

McCarty, W. (1999a). “We would know how we know what we know: Responding to the computational transformation of the humanities”, Paper, The Transformation of Science-Research bet ween Printed Information and the Challenges of Electronic Networks, Schloss Elmau, Max Planck Gesell- schaft, 31 May to 2 June.

McCarty, W. (1999b) . “Fumanities Computing as Interdiscipline'”, a seminar in the series “Is Humanities Computing an Academic Discipline?”IATH, University of Virginia, 5 November, http: 1/ www. iath. virginia.edu/hcs/ mccarty. html.

McCarty, W. (2003a). a Knowing true things by what their mockeries be’: Modelling in the Humanities”, Computing in the Humanities Working Papers, A.24, jointly published with TEXT Technology, 12 (1), http: // www.chass. utoronto. ca/ epc/ chwp/CHC2003/McCarty2. htm.

McCarty, W. (2003b) . “Epistemic Tinkertoys”, Unpublished manuscript.

McCarty, W. (2004). mModeling: A Study in Words and Meanings”, in S. Schreibman, R. Siemens and J. Unsworth Ceds) , A Companion to Digit- al Humanities, Malden, MA/Oxford/ Carlton, Victoria: Blackwell Publish- ing, pp. 254- 70, http:1/ www. digitalhumanities. org/ companion.

McCarty, W. (2005). Humanities Computing, London: Palgrave.

McCarty, W. (2006) . “Tree, Turf, Centre, Archipelago-or Wild Acre? Metaphors and Stories for Humanities Computing”, Literary and Linguistic Computing, 21 (1), pp. 1 -13 (Chapter 5 in this volume) .

McCarty, W. (2012). “A Telescope for the mind?” in M. K. Gold (ed.), Debates in the Digital Funanities, Minneapolis MN: University of Minnesota Press, http: // dbdebates. gc. cuny. edu/debates/ text/ 37.

McCarty, W. and Kirschenbaum, M. (2003). “Institutional Models for Humanities Computing'”, Literary and Linguistic Computing, 18 (4), pp. 465-89, http: // www. alle. org/publications/ institutional-modelshumanities-com- puting.(链接失效——译者注)

McPherson, T. (2008) . “Dynamic Vernaculars: Emergent Digital Forms in Contemporary Scholarship', Lecture presented to HUML ab Seminar, Umea Uni- versity, 4 March, http: // stream humlab. umu se/ index. php? streamName =dy- narnicVernaculars (链接失效——译者注) Menabrea, L. F. (1961). “Sketch of the Analytical Engine Invented by Charles Babbage. Translated by Ada Augusta, Countess of Lovelace”, in P. Morrison and E. Morrison (eds), Charles Babbage and his Calcuating En- gines. Selected Writings by Charles Babbase and Others, New York: Dover Publications, pp. 225 -45. Original publication, Bibliotheque Universelle de Geneve, 82 (October 1842);original translation by Ada Augusta, Countess of Lovelace, in R. Taylor (ed. ), Scienti fic Memoirs, Selections from The Transactions of Foreign Academies and Leared Societies and from Foreign Journals, 1843.

Miall, D.S. Ced.) (1990). Humanities and the Computer. Nere Direc- tions, Oxtord: Clarendon Press.

Mitchell, J. L. (ed. ) (1974). Computers in the Humanities, Edin- burgh: Edinburgh University Press.

Oakman, R. L. (1980). Computer Methods for Literary Research, Co- lumbia: University of South Carolina Press.

Oakman, R. L. (1984). Computer Methods for Literary Research, 2nd edition, Columbia: University of South Carolina Press.

Dettinger, A. G. (1954). A Study for the Design of an Automatic Dic- tionary, PhD Thesis, Harvard University.

Orlandi, T. (2002). “Is Humanities Computing a Discipline?” in G. Braungart, P. Gendolla and F. Jannidis Ceds) , Jahrbach fiir Computer phi- iologie, 4, pp. 51-8. Also published in Jahrbuch fiir Computer philologie anline : http: // computerphilologie. uni- muenchen. de/jg02/ orlandi. html.(链接失效——译者注)

Orlandi, T. (2003) . “Per un curriculum europeo di informatica umanis- tica”, in D. Fiormonte (ed. ), Informatica wmanistica dalla ricercar all'insegnamento, Roma: Bulzoni Editore, pp. 19-25.

Parrish, S. M. (1962). “Problems in the Making of Computer Concord- ances”, Studies in Bibliography,15,pp.1-14.

Pierson, G. W. Ced.> (1965). “Computers for the Humanitiesz” A Rer cord of the Conference Sponsored by Yale University on a Grant from IBM January 22 -23, New Haven, Connecticut: Yale JUniversity Press.

Polachek, H. (1997). “Before the ENIAC”, IEEE Anals of the His- tory af Combuting, April, pp. 25-30.

Potter, R. G. (1991) . “Statistical Analysis of Literature: A Retrospective on Computers and the FIumanities, 1966 - 1990”, Computers and the Humanities,25 (6), pp. 401-29.

Raben J. (1973). “ The humanist in the Computer Lab: Thoughts on Technology in the Study of Literature”, Bulletin of the Association for Lit- erary and Linguistic Computing, 1 (1),pp.3-9.

Richens, R. H. and Booth, A. D. (1952) . Some Methods of Mecha- nized Translation”, Presented at the Conference on Mechanical Translation, June, Massachusetts Institute of Technology. [Corrected reprint in: W. N.

Locke and A. D. Booth Ceds) Machine Translation of Langrages : Fourteen Essays, Cambridge, Mass.: Technology Press of the Massachusetts Institute of Technology, 1955, pp. 24 -46], http: // www. mt-archive. info/MIT- 1952-Richens. pdf.(链接失效——译者注)

Russell, D. B. (1967). COCOA: A Word Count and Concordance Gen- erator for Atlas, Chilton: Atlas Computer Laboratory.

Schreibman, S., Siemens, R. and Unsworth, J. Ceds) (2004) . A Com- panion to Digital Humanities, Malden, MA/Oxford/ Carlton, Victoria: Blackwell Publishing, http: // www. digitalhumanities. org/ companion.

Sparck Jones, K. (2000). “R. H. Richens. Translation in the nude”, in W. J. Hutchins (ed. ), Early Years in Machine Transtation. Memoirs and Biogra thies of Pioneers, Amsterdam/Philadelphia: John Benjamins Publish- ing Company, pp. 264 -78.

Sperberg McQueen, C. M. (1991). “Text in the Electronic Age: Tex tual Study and Text Encoding with examples from Medieval Texts”, Literary and Linguistic Computing, 6 (1),pp.34-46.

Sperberg-McQueen, C. M. and Burnard, L. (eds) (1990). TEI P1: Guidelines for the Encoding and Interchange of Machine Readable Tezts, Chicago/Oxford: ACH-ALL CACL Text Encoding Initiative, http: // www.

tei-c. org/ Vault/Vault-GL. html.

Sperberg-McQueen, C. M. and Burnard, L. (eds) (1992-1993). TEI P2 Guidelines for the Encoding and Interchange of Machine Readable Teats Draft P2 (published serially 1992 - 1993). Draft Version 2 of April 1993: 19 chapters, http: // www. tei-c.org/Vault/ Vault-GL. html.

Sperberg-McQueen, C. M. and Burnard, L. Ceds) (1994). Guidelines for Electronic Tert Encoding and Interchange. TEI P3, Oxford, Provi- ddence, Charlottesville, Bergen: Text Encoding Initiative.

Sperberg-McQueen, C. M. and Burnard L. Ceds) (1999). Guidelines for Electronic Text Encoding and Interchange. TEI P3. Revised reprint, Oxford, Providence, Charlottesville, Bergen: Text Encoding Initiative.

Sperberg-McQueen, C. M. and Burnard, L. Ceds) (2002). TEI P4: Guidelines for Electronic Tezt Encoding and Interchange, XMI-compatible edition XML conversion by S. Bauran, L. Burnard, S. DeRose and S. Rahtz, Oxford, Providence, Charlottesville, Bergen: Text Encoding Initia- tive Consortium, http: // www. tei-c.org/P4X.(链接失效—译者注)

Stern, N. (1980). “John von Neumann's Influence on Electronic Digital Computing, 1944- 1946”, Annals of the History of Compating , 2 (4), pp. 349-62.

Srensson, P. (2009). “FTurnanities Computing as Digital Fumanities”. Digital Humanities Quarterly,3(3) (Summer), http: // digitalhumanities.org/dha/ vol/3/3/000065/000065. html, (Chapter 7 in this volume)

Svensson, P. (2010). “ The Landscape of Digital Humanities”, Digital Humanities Quarterly, 4 (1) (Summer) , http: // digitalbumanities. org/ dha/ vol/4/1/000080/000080. html.

Svensson, P. (2011). “ From Optical Fiber To Conceptual Cyberin- frastructure”, Digital Humanities Quarterly, 5 (1) (Winter), http: // digi- talhumanities. org/dha/ vol/5/1/000090/000090. html.

Svensson, P. (2012). “ Envisioning the Digital Humanities”, Digital Huanities Quarterly, 6 (1),http: // www. digitalhumanities.org/ dha/ vol/ 6/1/000112/000112. html.

Tanner, S. (1975). “How to bring the dead language to life (Report on the ALL C International Meeting. 1974)”, Datareeek, 22 January. Reprinted in ALLC Balletin, 3 (1) (Lent), pp. 52-4.

Taporwiki (2011). “How do you define Humanities Computing /Digi- talHumanities?” http: // tapor. ualberta. ca/ taporwiki/ index. php/ How_do_ you define _ Humanities _ Computing _/_ Digital_ Humanities% 3F.(链接失效_译者注)

TEI Consortium Ceds) (2007). TEI P5: Guidelines for Electronic Tezt Encoding and Interchange. Oxford, Providence, Charlottesville, Nancy: TEI Consortium, http: // www. tei-c. org/ Guidelines/P5.

Terras, M. (2011a) . "Peering Inside the Big Tent: Digital Humanities and the Crisis of Inclusion”', http: // melissaterras. blogspot. corn/ 2011/07/ peering-inside big-tent-digital. html.

Terras, M. (2011b) . “Present, not voting: Digital Hlumanities in the Panopticon', Closing plenary speech, Digital Humanities 2010. LLC, The Jourral of Digital Scholarship in the Humanities,26(3),pp. 257-69, doi: 10.1093/1lc/ far016.

Thaller, M (1999). “Defining Humanities Computing Methodology”, in K. de Smedt, H. Gardiner, E. Ore, T. Orlandi, H. Short, J. Souillot and W.

Vaughan Ceds), Computing in Hunanities Education. A European Perspective, Bergen: University of Bergen, pp. 13 -62.

Thaller, M. (2001). “Bridging the Gap; Splitting the Bridge? Studying Humanities Computer Science in Cologne.” Abstract. CLiP. Computers-Lit- erature-Philosophy, Duisburg.

Thaller, M. (2004). “Texts, Databases, Kleio. A note on the architec- ture of computer systems for the humanities”, in D. Buzetti, G. Pancaldi and H. Short (eds), Augmenting Comprehension. Digital Toois and the History of Ideas. Proceedings of a con ference at Bologna, 22 -23 Septerber 2002, London: Office for Humanities Communication, pp. 49- 76.

Thaller, M (2006). Waiting for the Next Wave: Humanities Compu- ting in 2006”, CliP, London: King’ s College London, 30 June.

Toole, B. A. (1996). “Ada Byron, Lady Lovelace, an analyst and meta- physician”, IEEE Arnals of the History of Computing, 18(3), pp. 4-12.

Toole, B. A. (1998). Ada, The Enchantress of Nuenbers. A Selection from the Letters of Lord Byron's Daughter and Her Description of the First Computer, Mill Valley, CA: Strawberry Press.

Warwick, C. , Terras, M. and Nyhan, J. Ceds) (2012). Digital Hu- manities in Practice, London: Facet Publishing/UCL.

Weaver, W. (1965). Translation”, in W. N. Locke and A. D. Booth (eds) Machine Transtation of Languages. Fourteen Essays, Cambridge, MA: The MIT Press, pp.15- 23. Original publication 1949.

Weaver, W. (1970). Scene o.f Change. A Lifetime in American Sei- ence, New York: Scribner.

Wilkes, M. V. (1995). “A Tribute to Presper Eckert”, Communica- tions of the ACM, 38 (9) (September), pp. 20-2.

Winter, T.N. (1999). “Roberto Busa, S. J. , and the Invention of the Machine- Generated Concordance ”, The Classical Balletin, 75(1), pp.3 -20.

Wisbey, R. A. Ced.) (1971). The Computer in Literary and Linguistic Research. Papers from a Cambridge symposium, Cambridge: Cambridge U- niversity Press.

Yngve, V. H. (2000). “Eatly research at M.I. T. In search of adequate theory”, in W. J. Hutchins (ed. ) Early Years in Machine Translation.

Memoirs and Biographies of Pioneers, Amsterdam / Philadelphia: John Ben- jamins Publishing Company, pp. 37 - 72.

Zampolli, A. (1989). “Introduction to the Special Section on Machine Translation'”, Literary and Linguistic Computing, 4 (3), pp. 182-4.