Experimental Report on Digital Humanities Analysis of Monster and Spirit Imagery in Strange Tales from a Chinese Studio

Date: 2026-03-16

作者:李欣雅,马雪健

一、 实验目的与假设

(一)实验目的:

1.核心目的: 运用数字人文研究方法(文本标注、统计分析、关联规则挖掘),对《聊斋志异》中的精怪意象进行系统性量化与质性分析,构建其分类、行为及隐喻体系。     

2.深层目的: 验证精怪意象并非零散的文学想象,而是承载特定文化逻辑与社会心理的符号系统,并探索其从“自然物”到“文化符号”再到“叙事功能体”的转化模型。

(二)研究假设:

1.假设H1:《聊斋志异》中的精怪意象可按“本体-行为-叙事”三层框架进行有效分类与关联分析。

2.假设H2: 精怪的行为属性(能力类型)与其道德倾向存在显著关联模式。

3.假设H3: 精怪意象承载着一个多层次(自然、社会、心理、哲学)的文化隐喻谱系,是对清代社会现实与集体心理的隐喻性表达。

二、 实验材料与方法

(一)实验材料:

1.主要文本: 选用《聊斋志异》通行全本作为分析底本,共计491篇。将其全文进行数字化处理,构建可检索、可标注的文本数据库。

2.分析工具: 采用文本标注工具(如BRAT, CATMA)、统计分析软件(如Python的Pandas, Matplotlib库)及关联规则挖掘算法(如Apriori算法)。

(二)实验方法:

步骤一:数据构建与标注(基础层):

1. 实体识别与标注: 人工精读全文,识别并标注所有“精怪实体”,记录其本体类别(狐、鬼、妖、仙、精等)、出处篇目。

2. 属性标注: 对每个精怪实体标注其行为属性(能力类型:幻化、法术、预知、医术等;道德倾向:善、恶、中性)及叙事要素(故事类型:爱情、公案、报恩等;结局类型:和谐、得道、被收服)。

步骤二:量化统计与可视化(描述层):

1.对标注数据进行频次统计,生成精怪类别分布直方图、核心特征频率统计表及精怪意象词云图(基于高频特征词生成)。

步骤三:关联规则挖掘与模型构建(分析层):

1. 运用关联规则算法,分析“能力类型-道德倾向”、“精怪类别-故事类型”等组合之间的频繁项集与强关联规则。

2. 基于统计与关联结果,归纳构建“自然物→文化赋予→精怪意象→叙事功能”的意象转化模型。

步骤四:深度解读与体系建构(阐释层):

1.选取典型精怪(如狐女、冤鬼、植物精),结合其量化特征与叙事语境,进行深度文本细读,构建其象征体系与四层隐喻体系。

三、 实验过程与数据分析

(一)数据构建结果(验证研究基础):

精怪实体统计: 共标注精怪实体431个,覆盖387个篇章,占全书78.8%。具体分布为:妖类205例、鬼类141例、狐类91例、精类38例。

1:精怪类别分布直方图:清晰显示妖、鬼、狐为三大主要精怪类型。


2:精怪核心特征词云图:高频词如“幻化”、“报恩”、“爱情”、“狡黠”、“冤屈”等直观呈现了精怪意象的核心关注点。


3:主要妖怪种类的主要特征:清晰显示花妖,鬼魂,狐妖三大主要种族的最主要三大特征。

(二)关联规则与模型分析(验证H1与H2):

1.三层分析框架验证: 通过标注体系,成功将每个精怪实体置于“本体层-行为属性层-叙事要素层”中进行定位与关联分析,证明该框架具有可操作性和有效性。(H1得到支持)

2.能力与道德关联分析: 发现强关联规则:如“幻化能力 + 用于欺骗害人”与“道德倾向:恶”强关联;“预知能力 + 用于提醒避祸”与“道德倾向:善”强关联。 但同时也发现:“幻化能力”也与“嬉戏”、“考验”等中性或积极情境关联。这表明能力本身是工具,其道德色彩由叙事语境和行动目的决定。(H2得到部分支持与深化,关联并非绝对,而是概率性的叙事偏好)

3.意象转化模型: 成功构建模型:自然原型(狐/死亡/植物) → 文化赋予(狡猾/幽冥/高洁) → 精怪意象(狐精/冤鬼/花仙) → 叙事功能(推动情节、表达情感、社会批判)。该模型有效解释了精怪意象的生成机制。

三、文化隐喻谱系分析(验证H3):

1.自然隐喻: 数据证实,狐、鬼、植物精怪的特征高度依赖其自然原型(如狐的夜行、鬼的虚无、牡丹的娇艳)。

2.社会隐喻: 定量分析显示,“冤鬼”叙事高度集中于司法题材篇目;“狐女”叙事与爱情题材强相关。深度解读揭示: 鬼类: 成为司法腐败(《席方平》)、科举执念(《叶生》)、性别压迫(《林四娘》)的批判载体。 狐女: 成为探讨自然人性(《婴宁》)、理性情感(《青凤》)、智慧报恩(《小翠》)的符号。

3.植物精怪: 成为文人价值观的投射(菊之隐逸、莲之纯洁、牡丹之富贵)。 心理与哲学隐喻: “幻化”对应身份焦虑,“附身”对应控制欲;“人鬼恋”探讨生死界限,“精怪报恩”体现因果观念。(H3得到全面支持,四层隐喻体系得以建立)

四、 实验结论

(一)综合结论:

本实验通过数字人文方法,成功地将《聊斋志异》中看似纷繁复杂的精怪世界进行了系统性解码。 首先,构建了一个可量化、可分析的精怪数据体系,确证了精怪叙事的核心地位。 其次,揭示了精怪意象“工具-语境”式的行为逻辑,以及从自然到文化的生成模型。 最终,阐释了一个立体、交织的文化隐喻谱系,证明《聊斋志异》的精怪故事是蒲松龄用以折射现实、探讨人性和寄托哲思的一套精密符号系统。研究实现了从“感性赏析”到“理性论证”的跨越。

(二)实验的局限与反思:

1.主观性局限: 初始标注环节(如道德倾向判断)存在一定主观性,可能影响后续量化分析的客观性。

2.版本差异影响: 分析基于单一版本,不同版本的文字差异可能对词频、实体识别结果产生微小扰动。

3.量化与质性的张力: 词云、频次统计能揭示宏观模式,但难以完全捕捉文学文本的微妙修辞、反讽与意境。例如,“狡黠”在词云中是高频词,但其在具体篇章中可能是贬义、褒义或中性的,需结合语境细读。

4.词典完备性: 自建的精怪类型与特征词典仍有完善空间,可能未能涵盖所有边缘案例。

五、 未来工作展望

(一)方法改进:

1.采用多版本对比分析以增强稳定性。

2.实施专家协作标注与校验,提升标注信度。

3.深度融合量化与质性分析,在数据模式引导下进行更聚焦的深度文本阐释。

(二)技术扩展:

1.应用深度学习模型(如BERT)进行自动化的意象识别、情感分析及关系抽取,扩大分析规模与深度。

2.开展跨文本对比研究,将分析框架应用于《搜神记》、《子不语》等志怪集,进行历时性比较。

3.进行多模态分析,结合清代以来《聊斋志异》的插图、戏曲、影视改编,分析精怪意象在不同媒介中的流变。

(三)理论深化:

1.将分析数据与清代社会史、思想史资料更紧密结合,进行更实证化的社会隐喻研究。

2.纳入读者接受视角,分析不同时期读者评论数据,探讨精怪隐喻意义的动态演化。