Historical Evolution of Chinese Women’s Discourse (1949–1980) —A Semantic Network Analysis Based on the People’s Daily

Date: 2026-03-16

作者: 李畅 张洁王慧

一、研究背景与研究问题

妇女解放是新中国成立以来政治实践与意识形态建构中的重要议题。妇女不仅作为政策对象被反复讨论,也被持续纳入国家公共舆论体系之中。然而,妇女在公共话语中“被如何讲述”,并不必然等同于其真实社会处境的呈现,其背后往往蕴含着国家权力、意识形态目标与社会角色分配的逻辑。

作为中央党报,《人民日报》在长期实践中不仅记录社会现实,更通过稳定、持续的话语输出,对社会角色进行规范与引导。分析《人民日报》中妇女话语的整体结构及其随时间变化的特征,有助于理解社会主义时期国家如何在公共层面塑造妇女形象。

本文关注的“历史演化”,并非仅指词汇频率的简单变化,而是指妇女话语在不同时期的语义结构、话语功能与角色定位的系统性转变。基于此,本文试图回答以下问题:1949-1980年间,《人民日报》中的妇女话语主要围绕哪些主题展开?妇女是否作为具有独立性别经验的主体被讨论?不同历史阶段中,妇女话语的结构性位置如何发生变化?

二、数据来源与研究方法

本文以《人民日报》图文数据库为数据来源,检索1949-1980年间标题中包含“妇女”一词的新闻报道,共获得2849条有效标题文本。

选择标题而非正文作为分析对象,是有意识的取舍。我们认为标题是新闻文本中最为凝练、最具定调功能的部分,集中体现官方话语意图;同时,标题在不同时期具有较强的体裁一致性,更有利于进行跨时间比较分析。相比之下,正文中包含大量事件性与程序性信息,容易在长期语料中引入噪音,干扰宏观话语结构的识别。

在文本处理阶段,本文对标题文本进行中文分词,并构建停用词表,剔除功能词、新闻体例词及研究对象本身(如“妇女”),以减少结构性噪音。随后,根据年份信息对文本进行时间重编码,并结合历史事件,将样本划分为四个阶段:1949-1957年、1958-1965年、1966-1976年和1977-1980年。

在多种文本分析方法中,本文以语义网络分析作为核心工具,用以考察“妇女”概念在整体话语体系中的结构位置;同时辅以高频词分析、TF-IDF分析、词频热力图、LDA主题模型与Word2Vec词向量分析,对语义网络所揭示的结构特征进行解释与补充,从而形成多方法互证的分析框架。

三、分析结果:妇女话语的历史演化

通过对1949-1980年《人民日报》标题文本的系统分析,可以发现妇女话语在整体结构与历史演变中呈现出高度一致的特征:妇女被持续纳入国家公共叙事,但其性别经验与个体诉求并未成为话语中心。

从整体高频词分布来看,与妇女相关的高频词主要集中于“代表”“参加”“民主”“生产”“劳动”“革命”“号召”“全国妇联”“国际”等。这些词汇指向明确的公共领域议题,表明妇女在官方话语中被优先塑造成政治参与者、社会主义建设者以及国际交往中的象征性主体。与之形成鲜明对比的是,“家庭“母亲”“权益”“就业”“地位”等与妇女性别经验密切相关的词语,在整体语料中出现频率极低,甚至长期缺席。这一结构性差异显示,妇女并非作为具有独特性别经验的社会主体被讨论,而更多以公共角色和功能性身份存在于国家叙事之中。

在此基础上,我们进行分析得到了妇女关键词阶段对比,进一步揭示了妇女话语重心的阶段性变化。

1949-1957年,妇女话语主要围绕妇联组织、民主参与与政治动员展开,强调妇女在新政权建构过程中的参与作用。

1958-1965年,随着政治运动与生产动员的加强,“生产”“劳动”“斗争”等词显著上升,妇女形象进一步与劳动者和建设者身份绑定。

1966-1976年,话语高度集中于“革命”“斗争”等政治词汇,语义结构明显收缩,妇女作为独立议题的讨论空间被进一步压缩。

1977-1980年,政治高压词汇逐步退潮,“会见”“世界”“联合国”等国际交往相关词汇开始出现,显示妇女话语随国家叙事转向而发生变化。这种变化在高频词热力图中表现为明显的语义断裂,印证了历史分期的合理性。


         除此之外,我们还构建了以妇女为核心的语义网络图,从结构层面揭示了妇女话语在整体话语体系中的位置。“妇女”一词主要嵌入在政治组织、生产劳动与国际事务三类语义网络之中,而与家庭生活、私人经验相关的语义连接几乎完全缺失。这表明,妇女话语在结构上高度依附于国家叙事体系,而未形成相对独立的性别话语空间。

LDA主题模型进一步显示,妇女话语的潜在主题集中于政治动员、生产建设、节日仪式和外交接待等内容,未出现以妇女自身问题或性别困境为中心的主题结构。妇女话语并非围绕“妇女自身”展开,而是作为国家政治、生产与外交叙事的延伸而存在。

词向量分析为理解这一演化路径提供了深层语义证据。结果显示,“母亲”一词在语义空间中更接近“集会”“主席”“斗争”等政治词,而非“儿童”“亲情”等私人生活词汇;“家庭”则与“建设”“团结”“革命”等集体主义词汇高度相关,被重构为生产与动员的单位。与此同时,“权益”“就业”“地位”等词语的语义邻近关系稀疏,关联度显著偏低,呈现出明显的边缘化状态。这表明,与妇女个体发展和性别不平等密切相关的概念,未能在公共话语中形成稳定、清晰的语义位置,而是以孤立、空洞的形式存在。


四、结论与讨论

         综合以上分析可以发现,1949-1980年中国妇女话语的历史演化,并非从私人领域向公共领域的线性转移,而是呈现出一种由政治动员主导、逐步结构化并高度嵌入国家叙事的演化路径。妇女在国家话语中获得了前所未有的公共可见性,被持续塑造成政治参与者、劳动者和国际交往中的象征性主体;但与此同时,其性别经验、家庭角色与个体权益却在话语结构中被系统性弱化。

这一结果表明,社会主义时期妇女解放在话语层面呈现出明显的结构性张力:妇女被高度纳入国家叙事,却并未作为具有独立性别经验的主体被充分讨论。通过语义网络分析所揭示的这一历史演化特征,为理解国家叙事与性别话语之间的复杂关系提供了新的经验材料。

五、创新与反思

(一)研究创新

本文的创新主要体现在研究视角与方法路径两个方面。

首先,在研究视角上,本文并未从政策文本或个案叙述入手讨论妇女地位变迁,而是将妇女置于国家公共话语结构之中加以考察。通过分析《人民日报》中妇女话语的整体语义结构及其历史演化,本文关注的不是“妇女是否被讨论”,而是“妇女被如何纳入国家叙事”。这一视角有助于揭示社会主义时期妇女形象建构背后的话语机制,补充了以往以制度史或运动史为主的研究路径。

其次,在方法路径上,本文引入数字人文方法,对长时段、大规模文本进行系统分析,并以语义网络分析作为核心工具,考察“妇女”概念在整体话语体系中的结构位置。在此基础上,结合词频分析、主题模型与词向量分析进行多方法互证,使得研究结论不仅建立在直观文本印象之上,而是具有可重复、可检验的数据基础。这种从宏观结构入手的分析方式,有助于揭示传统定性研究中难以捕捉的长期话语特征。

(二)不足与缺陷

尽管本文力图通过多种方法提升分析的稳健性,但仍存在一定的研究边界,需要加以反思。

首先,在文本层面,本文选择标题作为分析对象,虽然有助于提高跨时期比较的可比性,并突出官方话语意图,但也不可避免地忽略了正文中可能存在的细节叙述与个体经验。因此,本文的结论主要适用于国家层面的妇女话语结构分析,而不宜直接外推为对普通妇女现实生活状况的描述。

其次,在方法层面,语义网络与词向量分析更适合揭示宏观语义结构与概念关系,而难以反映具体历史情境中话语使用的复杂性。例如,某些词语在特定历史时期可能具有特殊语境含义,这需要结合定性文本细读才能得到更为细致的解释。本文已尽量通过历史分期与多方法互证降低这一风险,但仍无法完全替代传统史料分析。

最后,从研究对象来看,本文以《人民日报》作为唯一语料来源,能够有效呈现国家层面的官方话语,但也意味着研究结论主要反映国家叙事中的妇女形象。未来研究可引入地方报刊、妇女期刊或个人书写等多样化文本,与中央媒体话语进行对比,从而更全面地理解不同层级话语中妇女形象的差异。

(三)进一步研究方向

基于以上反思,未来研究可从以下几个方面进一步拓展:一是将标题分析与正文分析相结合,比较不同文本层级中的妇女话语差异;二是引入跨媒体或跨区域语料,检验国家话语在不同传播场域中的变形与延伸;三是结合定性文本细读,对关键历史阶段或高频语义节点进行深入分析,以弥补纯量化方法的解释局限。