摘要:张爱玲作品中的空间书写是解读其创作思想与生命体验的关键切口,现有研究多依赖定性解读,存在方法局限、粒度粗疏、情感维度缺失及离散语境关联不足等缺口。本研究立足数字人文视角,以张爱玲上海时期(《金锁记》《倾城之恋》《红玫瑰与白玫瑰》)与美国时期(《小团圆》《雷峰塔》)经典作品为语料,通过构建包含 175 个核心空间词的专属词典(分为室内、室外、过渡三类),结合 Jieba 分词与 SnowNLP 情感计算模型,开展空间词汇量化统计与情感分析。研究发现,两时期空间词密度相近,但类型分布差异显著。过渡空间词占比上升 7%,室内、室外空间词分别下降约一成与三成;室内空间功能从 “归属感稳定空间” 转向 “临时性容身空间”,美国时期新增空间词多侧重位置标记而非生活描摹。情感层面,两时期整体情感均值接近(沪 0.5377 / 美 0.5373),但美国时期中性情感比例显著提升,情感表达更趋内敛,空间情感重心从宏大国族空间转向微观私人空间。本研究构建了 “文本预处理 - 词频统计 - 情感分析 - 可视化验证” 的量化研究链条,创新了张爱玲研究方法论,填补了空间书写动态演变研究空白,拓展了离散文学研究的空间 - 情感维度,同时为经典文学精细化解读提供了数字人文实践参考。
关键词:张爱玲、空间书写、数字人文
张爱玲作为中国现代文学史上的标志性作家,其作品以细腻的市井洞察、精准的人性描摹与独特的叙事风格占据重要地位,长期以来是学界研究的核心议题。空间书写作为张爱玲文本的核心叙事策略,贯穿其整个创作生涯,无论是上海时期的里弄、公馆、阳台,还是美国时期的房间、吸烟室、异国地域,空间不仅是人物活动的物理载体,更承载着情感张力、身份认同与时代印记,成为解读其创作思想与生命体验的关键切口。
现有学界对张爱玲空间书写的研究已积累一定成果,主要聚焦三大方向:其一,空间的象征意义解读,如将“弄堂”“公馆”视为旧时代伦理的桎梏、女性生存困境的隐喻;其二,空间与叙事结构的关联研究,探讨空间转换如何推动情节发展、塑造人物关系;其三,地域文化视角下的空间书写差异分析,对比上海、香港等地域空间在文本中的文化内涵。这些研究多采用定性解读范式,深化了对张爱玲空间叙事价值的认知,但仍存在显著的研究缺口,难以全面精准地呈现其创作生涯中空间书写的动态演变特征。
具体而言,现有研究存在三方面不足:一是研究方法的局限性,多数研究依赖文本细读的定性分析,缺乏量化数据支撑,难以客观精准地捕捉空间词汇的使用频次变化、类型分布差异等细节特征;二是研究粒度的粗疏性,对空间类型的划分较为笼统,未深入区分室内、室外、过渡等空间亚型的功能差异,尤其忽视了过渡空间在叙事中的功能性价值;三是情感维度的缺失性,现有研究多聚焦空间的社会文化内涵,未能建立空间词汇与情感表达的关联机制,且对上海与美国两个关键创作时期的空间-情感演变特征缺乏系统性对比;四是离散语境的关联性不足,对美国时期空间书写的变化多归因于地域环境变迁,未结合量化数据揭示空间功能从“稳定归属”到“临时容身”的本质转变,以及这种转变与离散体验的内在关联。
与此同时,随着数字人文理念的普及,量化文本分析方法在文学研究中的应用日益成熟,为突破传统定性研究的局限提供了可能。基于此,本研究以张爱玲上海与美国时期的经典作品为语料,借助分词工具与情感计算模型,构建空间词典并开展量化分析,精准捕捉不同创作时期空间词汇的使用规律与情感演变特征,弥补现有研究的不足,深化对张爱玲创作风格转型与离散体验表达的认知。
本研究旨在以张爱玲上海与美国时期经典作品为语料,借助数字人文方法构建空间词典,量化分析不同时期空间词汇的使用规律与情感演变特征,揭示其空间书写转型逻辑,深化对其创作风格与离散体验内在关联的认知。
本研究的理论意义首先体现在张爱玲研究方法论范式的创新上,将数字人文方法与传统文学研究相结合,通过构建专属空间词典、量化统计空间词汇频次、借助预训练模型开展情感计算,建立“文本预处理-词频统计-情感分析-可视化验证”的完整研究链条,打破了以往依赖定性解读的单一研究模式,为张爱玲研究提供可复制、可验证的量化分析范式,丰富文学文本精细化研究的方法论体系。其次,本研究填补了张爱玲空间书写动态演变研究的空白,通过精准划分室内、室外、过渡三大空间类型并进一步细分过渡空间子类,对比上海与美国时期空间词汇的频次变化、类型分布与情感特征,系统揭示张爱玲空间书写从“生活化稳定空间”到“功能性过渡空间”的核心转变,厘清空间功能从“归属感承载”到“位置标记”的本质差异,弥补了现有研究对空间演变细节与内在逻辑关注不足的缺陷。再者,本研究深化了空间与情感关联的理论认知,首次将空间词汇与情感表达建立关联,通过量化数据揭示不同空间类型、具体空间词汇的情感演变规律,厘清整体情感均值稳定下的内部波动差异,阐明离散语境下空间感知与情感表达的互动机制,突破了现有研究“重空间内涵、轻情感关联”的局限,为文学空间研究注入情感维度的理论视角。此外,本研究还拓展了离散文学研究的空间维度,以张爱玲海外创作时期的空间书写为核心,通过量化数据印证离散体验对空间书写的影响,揭示离散作家从“地域空间依赖”到“微观空间聚焦”的感知转变,为离散文学研究提供“空间词汇-情感表达-身份认同”的三维分析框架,丰富离散文学的研究维度与理论内涵。
本研究的现实意义同样多元具体,一方面,可为经典文学的精细化解读提供示范,通过数字人文方法挖掘张爱玲文本中隐藏的空间-情感关联细节,展现经典文学作品的多元解读可能,为其他经典文学文本的精细化、深度化研究提供方法借鉴与实践参考;另一方面,本研究揭示的离散体验与空间-情感书写的关联规律,能为跨文化语境下的文学创作研究提供启示,助力理解地域变迁、文化差异对文学表达的影响,对当代跨文化创作与文学研究具有现实指导价值;同时,本研究的实践过程——包括文本数字化处理、专属词典构建、情感计算模型应用、多维度可视化呈现等——还能助力数字人文与文学研究的深度融合,为人文社科领域的数字化转型提供可操作的实践案例,推动数字技术与文学研究的深度融合,提升文学研究的科学性与精准性。
(一)空间词典构建
首先,在预处理环节进行研究选材与文本数字化。本研究选取张爱玲上海时期的三部经典作品 ——《金锁记》《倾城之恋》《红玫瑰与白玫瑰》,以及美国时期的《小团圆》《雷峰塔》作为研究语料。第一步完成文本的数字化清洗,将这些作品的 PDF 格式逐一转换为纯文本 TXT 格式,去除格式冗余,保留核心文本内容。最终分别形成两个语料库:上海时期语料 596,678 词,美国时期语料 443,822 词,两部分语料体量充足,能够支撑后续的对比分析。
其次,进行语料处理和词典构建。研究选用中文文本处理常用的 Jieba 分词库作为基础分词工具。考虑到张爱玲作品中存在大量具有个人风格的专有名词、特定时代词汇,为了提高分词准确性,我们专门构建了张爱玲专用词典,确保分词结果更贴合文本原貌,避免因通用词典的局限性导致关键信息丢失。
在具体操作层面,空间词典生成工作分为两步:第一步是 Python 生成粗筛名词词表。通过 Python 编程对两部分语料进行词性筛选,提取出前 1000 个高频名词,这为后续空间词筛选提供了基础候选集;第二步是人工清洗与分类。首先对 1000 个高频名词进行手动甄别,删除非空间类词汇,如明显的人名、物件名,最终筛选出 175 个核心空间词。
随后,依据空间的功能属性与使用场景,将这 175 个空间词划分为三大类:第一类是室内空间,指被明确包围、可长期停留且具有私密性的场所,比如 “家里”“房间”“浴室” 等;第二类是室外空间,特指开放、非私人所有且不以居住为目的的区域,像 “弄堂”“戏院”“草地” 等;第三类是过渡空间,即不会长期停留、主要用于空间转移的场所,例如 “门口”“楼梯”“路上” 等。
(二)词频分类统计
本部分研究以空间词典为核心依据,通过多维度词频相关统计及可视化分析,构建形变分析的数据支撑体系,同时针对过渡空间词开展专项分类统计,具体研究方法如下:
首先开展基础词频与标准化频率统计工作,基于预先构建的空间词典对文本中的空间词进行全面检索与筛选,完成两大核心统计:一是原始词频统计,精准记录每个空间词的出现次数;二是标准化频率统计,采用“每万词频次”作为核心指标,通过计算空间词在每万词文本中的出现频次,消除不同文本长度差异的干扰,保障统计数据的可比性与客观性。
在基础词频统计的基础上,进一步计算每个空间词的TF-IDF(词频-逆文档频率)值,以此量化空间词在特定文本中的重要程度。其中TF值反映空间词在当前文本中的出现频率,IDF值反映该空间词在整个文本语料库中的普遍程度,二者结合可实现关键空间词的精准定位,为后续空间分布变化分析提供核心数据维度。
为直观呈现各类统计数据的差异与关联,后续采用堆叠柱状图等可视化工具对上述统计结果进行处理,通过图表清晰展示不同空间词的原始词频、每万词频次及TF-IDF值的对比情况,助力精准分析空间分布相关问题,提升数据解读的效率与准确性。
除基础空间词分析外,本研究还针对过渡空间词开展专项分类统计工作。具体流程为:先采用人工分类方式将过渡空间词划分为七大类,明确各类别核心界定标准并完成分类标注,其中已界定类别及示例包括定位类(标识人物所处具体地域,如“上海”“法国”)、公共场景类(标识公共活动场所,如“大学”“饭店”)等;分类完成后,对每一类过渡空间词重复上述基础词频及标准化频率统计流程,形成分类统计数据集,为过渡空间相关分析提供分类维度的数据支撑。
(三)情感数据分析
采用基于预训练模型(SnowNLP)的情感计算与人工校验相结合的方法开展情感分析工作,构建了“数据准备-核心句提取-情感计算-可视化-人工抽样-统计解释”的完整分析链条,确保分析过程的系统性、准确性与可追溯性。
数据准备阶段的核心任务是导入空间词典与语料库并完成基础预处理。研究首先加载空间词典和分时期语料库,其中空间词典将空间词汇划分为室内、室外和过渡三大类,为后续空间属性关联分析奠定基础;语料库则通过智能分句函数处理为标准化的句子单元,精准控制分析粒度以适配后续研究需求。
在完成数据基础准备后,进入核心句提取阶段,本阶段采用双重匹配策略(集合运算与逐词扫描)从两个时期的文本中筛选包含空间词汇的句子,并同步记录多元元数据形成结构化数据集。为提升匹配效率与准确性,先对空间词典进行数据结构转换与词汇排序:一方面建立空间词到其类别的映射字典以实现快速查询,同时将所有空间词汇整合为集合以借助集合运算的高效性;另一方面按词长降序对空间词排序(相同长度按字母排序),优先匹配较长词汇(如“卧室”先于“室”),有效规避短词前缀误匹配问题。双重匹配策略中,集合运算匹配作为主要路径,将分词后的句子转换为集合与空间词集合求交集,适配已分词文本的快速处理;当集合匹配失败时(多因分词不一致导致),则启动回退字符串匹配,按排序后的空间词列表逐词扫描,确保匹配无遗漏。在匹配过程中,对每个命中的句子均记录原始文本、匹配的空间词、主要空间词类型、所属时期、句子长度等完整元数据,同时设置每5000句输出进度的监控机制并展示示例,增强程序可观察性,便于及时调试与验证匹配效果。
核心句提取完成后,采用SnowNLP模型开展情感计算与分类工作。首先进行情感分值计算,遍历每个核心句并实例化SnowNLP对象,通过调用其sentiments属性获取0-1区间的连续情感分值(分值越接近1表示情感越积极);为保障分析流程的鲁棒性,特别设置try-except异常处理机制,当遇到空句子、特殊字符等导致分析失败的情况时,自动返回中性值0.5。随后开展情感离散化分类,基于情感分析研究惯例,采用pandas的cut函数将连续情感分值划分为三个语义明确的区间:负面(<0.35,代表显著消极情绪)、中性(0.35-0.65,代表情感中立或模糊)、正面(>0.65,代表显著积极情绪),该分类标准与人工评价的“正面/负面/中性”标签体系精准对齐,为后续准确率计算提供便利。最后完成数据增强与整合,将情感分值和离散标签作为新列添加至原始DataFrame,形成“句子-空间-情感”的三联结构化数据,同时保留所有原始信息(句子文本、空间词、时期等),确保数据完整性以支撑后续多维度分析。
本研究核心分析程序具备显著优势:基于预训练模型(SnowNLP)的自动化分析保障了过程的可重复性与一致性;连续分值与离散分类的双重输出模式,既适配精细的数值分析(如均值、标准差计算),也满足粗粒度的类别统计(如情感比例分布)需求;同时与后续人工抽样校验形成“机器初判+人工复核”的质量控制闭环,为研究结论提供双重验证。整体流程实现了非结构化文本数据向结构化、可计算分析单元的转化,为后续统计比较和可视化提供标准化输入,其模块化设计遵循“关注点分离”的软件工程原则,使数据提取、情感计算、统计分析、可视化呈现等环节既相互独立又有机衔接,有效增强了整个分析系统的可维护性与可扩展性。
为全面呈现分析结果,研究设计了六种聚焦不同维度的独立可视化图表,分别为:展示整体情感密度的情感分布对比图、呈现正面/中性/负面比例变化的情感极性比例对比图、揭示不同空间类型情感分布差异的空间类型情感箱线图、对比具体空间词情感分值演变的高频空间词情感热力图、探索文本形式与情感关联的句子长度与情感关系散点图,以及捕捉情感随文本序列波动模式的情感变化趋势图,通过多维度可视化实现分析结果的直观呈现。
人工抽样校验作为保障分析效度的关键环节,遵循规范的工作流程:首先从两个时期的语料库中随机抽取包含核心空间词的句子样本;随后由研究组成员独立依据上下文语境对每个样本的情感倾向进行人工标注;再将人工标注结果与SnowNLP自动情感打分结果进行比对,计算模型判断准确率;最后针对标注不一致的案例开展集体讨论,深入分析模型误判原因,如对中性表达的敏感度不足、对文化特定语境的理解偏差等。该环节的实施不仅通过量化评估验证了自动情感分析模型的可信度,为大规模数据分析提供了效度支撑,还精准揭示了模型在特定语境中的局限性,促使研究在得出整体结论时纳入对方法局限性的反思,进一步提升了研究的严谨性与解释力。
(一)文本预处理
经文本数据预处理后,我们生成了张爱玲空间词典,包括175个空间词,并将其分成室内(被明确包裹、可停留、私密性较高的场所)、室外(开放、非私人、不以居住为目的)和过渡(非长期停留、转移空间)三类。其中,室外26个,室内60个,过渡89个。
具体数据如下表所示:
词汇 | 总次数 | 上海词频 | 美国词频 | 分类 |
家里 | 321 | 219 | 102 | 室内 |
上海 | 249 | 132 | 117 | 过渡 |
中国 | 219 | 107 | 112 | 过渡 |
地方 | 187 | 145 | 42 | 室内 |
房间 | 179 | 62 | 117 | 室内 |
香港 | 157 | 116 | 41 | 过渡 |
床上 | 121 | 71 | 50 | 室内 |
学校 | 119 | 69 | 50 | 过渡 |
世界 | 118 | 72 | 46 | 过渡 |
房里 | 117 | 90 | 27 | 室内 |
回家 | 117 | 63 | 54 | 过渡 |
房子 | 117 | 84 | 33 | 室内 |
楼上 | 116 | 57 | 59 | 室内 |
英国 | 108 | 48 | 60 | 过渡 |
汽车 | 95 | 74 | 21 | 过渡 |
桌上 | 91 | 46 | 45 | 过渡 |
浴室 | 90 | 41 | 49 | 室内 |
乡下 | 85 | 31 | 54 | 过渡 |
门口 | 84 | 63 | 21 | 过渡 |
外国 | 84 | 42 | 42 | 过渡 |
厨房 | 82 | 48 | 34 | 室内 |
阳台 | 79 | 79 | 0 | 室内 |
屋里 | 78 | 77 | 1 | 室内 |
楼下 | 76 | 32 | 44 | 室内 |
隔壁 | 73 | 47 | 26 | 室内 |
客室 | 73 | 39 | 34 | 室内 |
地上 | 68 | 52 | 16 | 过渡 |
楼梯 | 67 | 32 | 35 | 过渡 |
地下 | 66 | 32 | 34 | 过渡 |
街上 | 65 | 41 | 24 | 室外 |
台上 | 64 | 25 | 39 | 过渡 |
日本 | 60 | 8 | 52 | 过渡 |
阑干 | 59 | 45 | 14 | 室外 |
外头 | 58 | 43 | 15 | 室外 |
沙发 | 55 | 41 | 14 | 室内 |
窗户 | 49 | 33 | 16 | 过渡 |
公寓 | 49 | 20 | 29 | 室内 |
路上 | 46 | 23 | 23 | 室外 |
大学 | 46 | 32 | 14 | 过渡 |
玻璃窗 | 44 | 42 | 2 | 过渡 |
宿舍 | 43 | 11 | 32 | 过渡 |
旅馆 | 43 | 18 | 25 | 室内 |
穿堂 | 41 | 18 | 23 | 过渡 |
印度 | 41 | 25 | 16 | 过渡 |
家庭 | 41 | 35 | 6 | 过渡 |
窗外 | 39 | 29 | 10 | 过渡 |
雷峰塔 | 39 | 0 | 39 | 过渡 |
沈家 | 36 | 0 | 36 | 过渡 |
客厅 | 36 | 18 | 18 | 室内 |
电车 | 35 | 29 | 6 | 过渡 |
帐子 | 34 | 29 | 5 | 过渡 |
修道院 | 34 | 23 | 11 | 室外 |
店里 | 33 | 32 | 1 | 室内 |
杨家 | 33 | 7 | 26 | 过渡 |
房门 | 33 | 20 | 13 | 室内 |
公馆 | 33 | 13 | 20 | 室内 |
北京 | 32 | 17 | 15 | 过渡 |
电梯 | 32 | 24 | 8 | 过渡 |
美国 | 32 | 10 | 22 | 过渡 |
窗子 | 32 | 31 | 1 | 过渡 |
车子 | 31 | 26 | 5 | 过渡 |
回国 | 31 | 15 | 16 | 过渡 |
屋子里 | 31 | 31 | 0 | 室内 |
屋子 | 31 | 31 | 0 | 室内 |
门外 | 31 | 18 | 13 | 过渡 |
书房 | 31 | 15 | 16 | 室内 |
黄包车 | 31 | 23 | 8 | 室外 |
天津 | 31 | 10 | 21 | 过渡 |
卧室 | 30 | 19 | 11 | 室内 |
公司 | 30 | 16 | 14 | 过渡 |
新房 | 30 | 1 | 29 | 室内 |
上楼来 | 28 | 14 | 14 | 室内 |
姜家 | 28 | 28 | 0 | 过渡 |
学堂 | 28 | 14 | 14 | 过渡 |
饭店 | 28 | 20 | 8 | 过渡 |
上楼 | 28 | 15 | 13 | 室内 |
娘家 | 28 | 18 | 10 | 过渡 |
婚礼 | 27 | 11 | 16 | 室内 |
浅水湾 | 26 | 17 | 9 | 室外 |
南京 | 26 | 2 | 24 | 过渡 |
花园 | 26 | 10 | 16 | 室外 |
楼梯口 | 25 | 15 | 10 | 过渡 |
上门 | 25 | 19 | 6 | 过渡 |
内地 | 25 | 14 | 11 | 过渡 |
床沿 | 24 | 17 | 7 | 室内 |
马路 | 24 | 11 | 13 | 室外 |
吸烟室 | 24 | 0 | 24 | 室内 |
书桌 | 24 | 8 | 16 | 室内 |
屋顶 | 23 | 9 | 14 | 室外 |
玻璃门 | 23 | 20 | 3 | 过渡 |
院子 | 22 | 14 | 8 | 过渡 |
窗帘 | 22 | 16 | 6 | 过渡 |
橱窗 | 21 | 12 | 9 | 过渡 |
弄堂 | 21 | 21 | 0 | 室外 |
德国 | 20 | 7 | 13 | 过渡 |
办公室 | 20 | 14 | 6 | 室内 |
餐室 | 20 | 6 | 14 | 室内 |
柜台 | 20 | 14 | 6 | 室内 |
公共汽车 | 20 | 13 | 7 | 过渡 |
饭桌 | 20 | 0 | 20 | 室内 |
家乡 | 19 | 11 | 8 | 过渡 |
公园 | 19 | 11 | 8 | 室外 |
出洋 | 19 | 4 | 15 | 过渡 |
浴缸 | 19 | 6 | 13 | 室内 |
窗前 | 19 | 12 | 7 | 过渡 |
山东 | 18 | 14 | 4 | 过渡 |
法国 | 18 | 4 | 14 | 过渡 |
下山 | 18 | 15 | 3 | 过渡 |
小道 | 18 | 17 | 1 | 室外 |
天下 | 18 | 14 | 4 | 过渡 |
食堂 | 18 | 3 | 15 | 室内 |
沙发椅 | 18 | 6 | 12 | 室内 |
座位 | 18 | 12 | 6 | 室内 |
当地 | 18 | 4 | 14 | 过渡 |
窗口 | 17 | 12 | 5 | 过渡 |
梳妆台 | 17 | 8 | 9 | 室内 |
一带 | 17 | 12 | 5 | 室外 |
厂里 | 17 | 17 | 0 | 室内 |
华南 | 17 | 16 | 1 | 过渡 |
中学 | 17 | 9 | 8 | 室内 |
大陆 | 17 | 13 | 4 | 过渡 |
码头 | 17 | 3 | 14 | 室外 |
后门 | 17 | 9 | 8 | 过渡 |
药房 | 17 | 17 | 0 | 室内 |
海滩 | 16 | 8 | 8 | 室外 |
堂屋 | 16 | 14 | 2 | 室内 |
火炉 | 16 | 13 | 3 | 室内 |
银行 | 16 | 7 | 9 | 室内 |
俄国 | 16 | 10 | 6 | 过渡 |
上街 | 16 | 10 | 6 | 室外 |
被窝 | 16 | 7 | 9 | 室内 |
自行车 | 16 | 12 | 4 | 室外 |
栏杆 | 16 | 13 | 3 | 室外 |
洋房 | 16 | 11 | 5 | 室内 |
房屋 | 16 | 13 | 3 | 室内 |
球道 | 15 | 15 | 0 | 室外 |
窗台上 | 15 | 8 | 7 | 过渡 |
租界 | 15 | 1 | 14 | 过渡 |
卞家 | 14 | 0 | 14 | 过渡 |
烟铺 | 14 | 3 | 11 | 过渡 |
门警 | 14 | 0 | 14 | 过渡 |
园子 | 14 | 10 | 4 | 室外 |
空间 | 14 | 3 | 11 | 室内 |
坐间 | 14 | 11 | 3 | 室内 |
床头 | 14 | 11 | 3 | 室内 |
铁门 | 14 | 9 | 5 | 过渡 |
住宅 | 14 | 8 | 6 | 室内 |
窦家 | 14 | 14 | 0 | 过渡 |
舅舅家 | 14 | 2 | 12 | 室内 |
把门 | 14 | 11 | 3 | 过渡 |
书桌上 | 14 | 5 | 9 | 室内 |
盛家 | 13 | 0 | 13 | 过渡 |
门帘 | 13 | 7 | 6 | 过渡 |
新房子 | 13 | 1 | 12 | 室内 |
戏院 | 13 | 9 | 4 | 室外 |
政府 | 13 | 3 | 10 | 过渡 |
西方 | 13 | 1 | 12 | 过渡 |
舞台 | 13 | 6 | 7 | 过渡 |
脚踏车 | 13 | 13 | 0 | 室外 |
门边 | 12 | 3 | 9 | 过渡 |
飞机 | 12 | 4 | 8 | 室外 |
楼底下 | 12 | 11 | 1 | 室内 |
上学 | 12 | 7 | 5 | 过渡 |
草地 | 12 | 8 | 4 | 室外 |
巴黎 | 12 | 10 | 2 | 过渡 |
教会 | 12 | 8 | 4 | 室内 |
大门 | 12 | 8 | 4 | 过渡 |
马来亚 | 12 | 3 | 9 | 过渡 |
城里 | 12 | 4 | 8 | 过渡 |
乔家 | 12 | 12 | 0 | 过渡 |
满洲国 | 12 | 0 | 12 | 过渡 |
水门汀 | 12 | 7 | 5 | 过渡 |
房门口 | 12 | 3 | 9 | 室内 |
大门口 | 11 | 8 | 3 | 过渡 |
摊子 | 11 | 8 | 3 | 室外 |
(二)词频统计
首先,分析空间相关词汇的统计结果,整体而言,张爱玲上海时期小说的空间词密度为每万字69个,美国时期为每万字66.3个,两者数量相近,可见其在不同创作阶段均注重空间书写。但细分不同类型的空间词后,变化特征十分明显:室内空间词(如“屋子”“阳台”)的每万词出现次数从28.5 降至25.6,下降约一成;室外空间词(如“弄堂”)从7.3降至5.0,降幅超三成;而过渡空间词(如“门口”“楼梯”)则从33.2 升至35.7,增长约7%。这一变化表明,小说中承载人物稳定生活、日常活动的空间有所减少,人物更多处于“途中”状态,即从一个空间向另一个空间过渡的过程中。
针对过渡空间词,我们进一步将其划分为定位类、公共场景类、交通类等七个子类,发现其变化呈现出清晰的规律性:定位类(如“上海”“法国”,仅明确人物地理位置)、公共场景类(如“大学”“饭店”)、家族类(如“姜家”“杨家”)等词汇的出现频次均有所上升,说明叙事中对人物地理位置、社会环境及家族关系的标记更为频繁;而交通类(如“汽车”“黄包车”)、视觉类(如“窗户”“窗外”)等词汇的频次则有所下降,意味着人物移动的具体方式、通过窗户观察的细节描写不再是叙事重点。这一现象印证了,随着过渡空间词的增加,叙事重心已从人物在空间中的停留状态,转向人物的位置属性、社会关系等功能性内容。
尽管两个时期的空间书写强度基本一致,且室内空间词整体呈下降趋势,但进一步考察可发现一个关键现象:上海时期高频出现的“家里”“屋里”等词汇,在美时期大幅减少,部分几近消失;而“房间”一词却显著增加,增幅超过一倍。通过分析这些词汇的语境我们发现,“家里”“屋里”带有强烈的归属感,是人物长期生活、展开日常活动的核心空间;而“房间”更多指向临时性空间,不再承载家庭温暖与长期生活的内涵。由此可见,室内空间并未消失,而是其功能发生了本质转变——从提供归属感的稳定空间,转变为仅满足基本居住需求的容身空间。
我们还观察到,两个时期的特有空间词呈现出明确的差异化特征。上海时期的特有空间词(如“阳台”“弄堂”)具有鲜明的生活化属性,属于人物高频活动的日常空间;而美国时期新增的空间词(如“雷峰塔”“沈家”“吸烟室”),更多用于标记人物的地理位置与社会关系,并未对其中的生活细节展开细致描摹。例如,提及“沈家”“卞家”仅明确人物与家族的关联,提及“吸烟室”“饭桌”也仅作为短暂场景交代,并未涉及人物在这些空间中的长期生活状态。这一特征进一步印证了美国时期小说中承载稳定生活的空间显著减少,人物更多处于“途中过渡”或“位置明确标记”的状态。

图 1
(三)情感分析
本研究聚焦张爱玲上海与美国时期文本的空间词情感特征(其中上海时期有效句子样本量为3448句,美国时期为2511句),通过量化统计与图表分析,梳理出两时期情感表达的核心差异与演进规律,具体研究发现如下:
从整体情感倾向来看,两个时期的平均情感分差异极微,上海时期平均情感分为0.5377,美国时期为0.5373,仅相差约0.0004,但情感波动性存在细微差别,上海时期情感分标准差为0.373,略高于美国时期的0.356,这一数据表明上海时期的情感表达可能更为起伏。
在情感极性分布上,两个时期同样呈现出微妙变化:上海时期的正面情感比例为46.00%,略高于美国时期的44.01%;负面情感比例方面,上海时期(38.14%)也稍高于美国时期(36.64%);而中性情感比例则呈现明显差异,美国时期以19.35%显著高于上海时期的15.86%,增幅约3.5个百分点。综合这一分布特征可知,张爱玲在美国时期的文本中中性描写明显增多,这一变化可能暗示其情感表达趋向内敛与克制。
基于上述整体情感特征的分析,进一步聚焦空间词的情感变化模式,可发现不同空间词呈现出差异化的情感演进特征。部分空间词的情感在美时期显著增强,且集中于特定类型的空间表述,诸如“楼上”(0.29→0.88)、“桌上”(0.46→0.84)、“台上”(0.44→0.75)等代表“垂直空间”和“家具表面”的词汇,情感色彩转变为极为积极。这一变化背后折射出张爱玲空间审视视角的调整,在美国时期,她对室内空间的关注从“整体房间”转向更具体、更可掌控的“局部”,情感状态也随之从压抑转向某种程度的安定或抽离;另一空间词“房里”(0.35→0.59)则从消极情感转为中性偏积极,与“房间”整体的负面情感形成鲜明对比,暗示其对室内空间的感知存在内部差异。
另有部分空间词的情感在美时期显著减弱,其中作为最核心室内空间词的“房间”(0.45→0.35),情感分值进一步下滑,成为美国时期负面情感最稳定的锚点;而“世界”(0.89→0.42)、“英国”(0.88→0.56)、“长安”(0.74→0.50)等宏观地理与象征空间词汇,情感色彩大幅“褪色”——在上海时期,这些词汇或许承载着想象、传奇或对比的功能,到了美国时期,情感表达则趋于平淡或疏离。此外,还有一批空间词的情感状态保持稳定,包括“家里”“上海”“中国”“地方”“房子”“香港”等,其情感分值变化均在±0.05以内,作为基础的地理或空间概念,这些词汇的情感色彩相对恒定。
各类图表数据进一步佐证了上述情感变化特征,其中图表2与图表3聚焦于情感分布与极性比例,从分布形态来看,两个时期均呈现双峰分布特征,正面与负面情感相对集中,不同之处在于美国时期在0.4–0.6的中性情感区间密度略高;从极性比例的可视化呈现来看,美国时期的中性柱形明显更高。结合这两项图表信息可得出结论:张爱玲文本的情感整体趋向内敛与疏离,情感的“激烈程度”有所下降,从上海时期的“浓郁”逐步走向美国时期的“平淡”。

图 2

图表3
图表4的空间类型情感箱线图则揭示了不同空间类型的情感差异及时期变化,其中室内空间的情感中位数较低,且美国时期的室内情感分布更为集中且略偏负面;过渡空间(如走廊、楼梯)的情感分布相对分散,美国时期的情感跨度更大;室外空间的情感整体较高且保持稳定。这一数据特征印证了室内空间“情感困境”的深化——“室内”不仅承载着最负面的情感,其情感体验也最为复杂、波动最大,这与前文提及的“房间”一词情感分值进一步降低的结论相互印证。

图表5的高频空间词情感热力图不仅再次印证了部分空间词的情感变化趋势,诸如“房间”从上海时期的0.45降至美国时期的0.35,呈现明显负面化特征,“房里”从0.35升至0.59实现明显正面化转变,“楼上”从0.29飙升至0.88出现极大情感转变,“世界”则从0.89降至0.42,从极高正面转为偏中性;同时还呈现出句子长度与情感分值的关联规律,两个时期均表现为中等长度句子的情感分值较高,极长或极短句子的情感则偏向两极。此外,热力图还直观展现了两个时期的情感波动差异,上海时期的情感线波动更为剧烈,而美国时期的情感线则更为平缓,进一步印证了其情感表达趋于稳定甚至淡化的核心趋势。

图 5
综合上述分析可知,张爱玲个人情感在空间载体上呈现显著转移特征。上海时期,“中国”“长安”“世界”等承载宏大国族意识与历史厚重感的空间词汇寄托了极高的情感浓度,而移居美国后,情感表达的重心逐渐转移至“楼上”“桌上”等私人化、日常化的微观空间。与此同时,美国时期文本中“房间”一词的消极情感倾向进一步强化,这或许与她漂泊异乡的陌生居住体验及归属感缺失密切相关;而“楼上”“台上”等过渡性空间的情感分值显著提升,则可能暗示她对“流动空间”的情感投射更为复杂多元。从整体情感结构来看,张爱玲移居美国后,其小说空间书写的情感结构实现了从外显波动到内敛平稳的转变,尽管两个时期的整体情感均值未出现大幅变动,但中性描写比例的显著上升,暗示其叙事姿态逐渐趋向冷静克制并与文本形成一定距离感。尤其在室内空间的情感表达上,消极化倾向进一步加剧,这一特征可与她离散生活中“家”的缺失感形成呼应;而部分过渡空间情感分值的明显上扬,则可能揭示出作者在动荡流动的生活状态中试图寻找情感锚点的内在尝试。值得注意的是,这种情感层面的质变并非简单的“由悲转喜”或“由喜转悲”,而是情感光谱的拓宽与情绪密度的稀释,美国时期文本中空间承载的情感更趋复杂暧昧,这种变化既可能是她适应海外新创作环境的叙事策略调整,也是其自身情感结构在离散语境中重新塑造的直接体现。空间类型的扩展与情感表达的淡化呈现同步态势,共同构成了张爱玲文学空间在离散语境中的独特“蜕变”,空间不再是封闭的情感容器,而是转变为承载情感流动的通道。
本研究在方法应用、分析维度与研究覆盖范围等方面仍存在若干有待完善之处。
首先,在情感分析所采用的技术工具层面,本研究选用的SnowNLP模型存在一定局限性。该模型基于现代网络语料训练而成,对张爱玲文学文本中含蓄隐晦的情感表达、隐喻修辞及特定历史语境的适配性不足,不仅对中性情感的识别准确率有待提升,也难以精准区分情感强度的细微差异,可能对部分文本情感判断的精准度产生影响。其次,在分析维度的设计上,本研究存在一定的简化倾向,虽完成了不同时期空间词平均情感值的统计与对比,但未能深入考察同一空间词汇在不同叙事上下文语境中的情感多义性,也未系统探究修饰词、句式结构等语言要素与空间词的情感协同塑造机制,这在一定程度上影响了研究结论与文本细读深度的契合度。此外,在研究对象的覆盖范围上,本研究的分析重心集中于高频空间词的情感特征与演变规律,对低频空间词的文学价值与情感内涵未能展开深度发掘,而低频空间词或许承载着特定的叙事功能与情感指向,其价值的忽视可能导致对张爱玲空间书写情感图景的认知不够全面。最后,在结论验证的充分性上,本研究虽通过人工抽样校验保障了基本效度,但受限于抽样规模与范围,未能对具体文本中的空间活动场景展开系统性还原与全面分析,仅依托部分抽样案例完成模型校验与结论支撑,使得部分研究结论的说服力有待进一步强化。
本研究借助数字人文方法,以张爱玲沪美时期经典作品为语料开展空间-情感关联分析,揭示出其空间书写随创作时期更迭呈现显著转型特征,即过渡空间词占比上升、室内空间功能从归属感的承载转向临时性容身,情感表达则趋于内敛克制且寄托重心从宏大国族空间转向微观私人空间,这一转变深刻呼应了其离散体验中的身份焦虑与情感锚点重构。作为数字人文与传统文学研究融合的实践探索,本研究不仅创新了张爱玲研究的量化范式,填补了空间书写动态演变与情感关联研究的空白,为离散文学研究提供了全新分析维度,更为经典文学的精细化解读与人文社科领域的数字化转型提供了可借鉴的思路与路径;同时,研究虽存在模型适配性不足等局限,但也为未来结合更精准的情感计算模型、融入深度语境分析的后续探索指明了方向,助力进一步深化对现代离散作家创作心理与文本内涵的认知。