“语言的基因与文化的图谱” 数字人文工作坊

Date: 2018-11-15

2018年11月7日至11月8日,由南京大学“2018年度国际合作伙伴计划”资助的、南京大学人文社会科学高级研究院数字人文创研中心主办的“语言的基因与文化的图谱”数字人文工作坊在仙林校区逸夫馆C308顺利举办。

本次工作坊主讲人包括台湾政治大学文学院资深教授郑文惠老师、统计系教授余清祥老师及历史与思想数字人文实验室邱伟云博士,他们在一天半的时间里向四十多位学员介绍了台湾政治大学历史与思想数字人文实验室、台湾政治大学文学院数字人文中心以及台湾政治大学高教深耕“东亚文化传统及其现代转型”国际拔尖计划的数字人文研究实践经验与心得。工作坊有趣的实践活动和活跃的课堂讨论使学员们在实践与理论两方面收获颇丰。


图为“语言的基因与文化的图谱” 数字人文工作坊招生海报

此次工作坊包含三部分内容,即“语言基因与文化图谱:唐诗与近代思想观念的数字人文研究”、“共现、词缀、网络:文本探勘技术的操作与实践”以及“人文基因图谱:隐喻或方法?”。其中11月7日下午,郑文惠老师进行了以“语言基因与文化图谱:唐诗与近代思想观念的数字人文研究”为题的第一课。授课开始前,所有学员对自己学术背景进行了介绍。
 


参与者介绍学术背景

正式授课的内容以数字时代和知识微缩革命给人文研究带来的新挑战展开,概述了数字人文学科的基础建设、基本流程和所需要的资料化研究材料。此外,她还提出数字技术能从宏观视野掌握文本中的资料结构,避免主观迷障,同时需要数字人文学者探索新视域、新方法和新范式。

此后,郑文惠教授用数字人文的方式解决了百回小说《西游记》中的各种有趣问题,活跃了课堂氛围。在对中文切词原理、全自动分析和数字人文研究思路独特性等问题进行了课堂讨论后,她将自己在数字人文领域的最新研究成果——《情感现象与色彩政治学:中唐诗歌白色抒情系谱的数字人文研究》进行了分享。在这一阶段的讨论环节中,郑文惠教授着重探讨了海量大文本数据分析和精读文本追踪的交叉应用以及数据处理结果的呈现方式。郑文惠教授还就《新青年》的研究价值与意义提出了自己即将研究的课题并介绍了目前最新的几种数字人文领域的数字技术和统计方法,最后向学员们介绍了数位人文在技术层面的发展方向并回答了学员在学术敏感度养成方面的问题。
 


课后提问环节

11月8日上午邱伟云老师以“共现、词缀、网络:文本探勘技术的操作与实践”为题,对人文假设理论驱动的检索与数据驱动的探勘之间的差异进行了辨析,通过啤酒与尿布在超市摆放在一起的现实场景,阐述了数字人文时代下的远读视野重要意义。邱老师幽默诙谐的讲课风格使学员们很快地走入了情景,深刻了解到大数据在现实生活中的应用场合。

同时,他还例举了国际语言学界和历史学界用谷歌图书进行跨学科的探索性研究。在课程实践环节,邱伟云老师指导学员们使用台湾数字人文团队研发的小小赞系统对《论语》等先秦著作中的关键词汇“圣人”进行时序分析和情境分析,最后将《孔子》《孟子》《荀子》《韩非子》中的先秦文学关键字的共性与独特性进行了图像展示。

 


邱伟云老师指导参与者进行实操

下午则由余清祥老师从统计学的角度讲授了题为“人文基因图谱:隐喻或方法?”的第三部分内容。他首先讲解了大数据的定义以及大数据“大、快、杂、疑”的四个特性,随后提出了常见的文字分析议题特点,并例举了文字分析的相关研究。他从统计学的视角,通过《新青年》的文本分析验证五四运动时期的文体变化,介绍了透过数理模型描述观察结果的重要性与关键思路。最后,余教授通过实例讲解了处理大数据的注意事项并指出文字分析的其他可能方向。
 


余清祥老师授课过程

此次工作坊是高研院数字人文创研中心的“数字人文研究与实践”系列工作坊之一,其系列活动重视在教学过程中跨学科整合的思考与实验过程,着重培养了学员跨领域合作与沟通的基础能力。系列工作坊将以数字人文研究为框架,结合理论课程与实践课程,锻炼学员们的数字人文认知与实践操作等基础能力,为有兴趣迈入数字人文领域进行学术研究的学者提供学习机会。