共青团微信推文的感情-身份词汇运用初探

发布时间: 2025-12-19

作者:武泽威


研究背景

共青团在中国具有官方色彩的组织中处于一个“中层”位置——一方面它毋庸置疑具有一定的政治色彩,但另一方面它又要和其名义上所管辖的对象“青年”直接发生关系。因此在这个新媒体时代,共青团中央一方面要“贯彻官方的意志”,另一方面又要“接地气”,把官方叙事讲述的“活灵活现”。在这个基础上,对于共青团怎么使得这两种本来不相干的东西勾连起来就成为了一个值得研究的议题。


研究问题

共青团微信推文中出现了哪些形容词与人称、组织?这关系到一个重要的事实,即共青团在向青年受众发布信息时最多提到的是谁?又是怎样形容,同时又在传达怎样的形象?为了了解这一点,需要知道它在推文里是如何定位青年的,所以研究集中在身份名词、形容词(感情词)以及词频,分析当“青年”主题出现的时候,官方编辑会用什么词来表述,并从中把握在共青团的叙事中,“青年”处于一个什么位置。

本次初探将所有情感色彩的词汇,形容类的词汇都归纳为“感情词”,将所有人称代词、身份、组织、国家都归纳为“身份词”。集中在对于这些词的词频统计和关系分析上。


研究材料和工具

研究材料:

共青团近期约十篇推文。(约2-3万字)

研究工具:

文本标记工具:MARKUS https://dh.chinese-empires.eu/markus/beta/

数位人文研究平台:DocuSky http://docusky.org.tw

数据可视化工具: Palladio http://hdlab.stanford.edu/palladio/


 研究思路

1.准备文本

鉴于微信公众号的文本难以用自动化的方式抓取而容易被手工抓取,且手工抓取的工作量并不大,因此选择用手工抓取的方式选择数十篇推文,并另存为UTF-8格式TXT文本,并调整排版格式。


2.文本标记

(1)将文本上传到MARKUS,进行手工关键词标记。将感情词,身份词都标记出。

(2)生成XML文档,上传DocuSky建库。


3.词频统计与分析

(1)使用DocuSky生成标记的形容词、身份词词频云图,并用excel表格整理。

(2)将多个不同的推文输入Palladio,并分析多个文本之间形容词与身份词的出现关系。



结果分析

1.感情词的个人色彩较强,政治性色彩较弱


很容易可以看出在把定义放宽到几乎所有形容词和名词的范畴之后,感情词中的“一般政治性”色彩也较弱,这里定义的“一般政治性色彩”指的是那种官方叙事的,团结一致、自强不息的青年人形象。在对于感情词-形容词的抓取之后可以明显的看出,无论是在进行新闻报道时,还是在进行自我总结式的散文类推文时,大多都是围绕着个人展开的。只有“团结”一词相对突出,造成原因可能是因为近期适逢贸易战,导致了推文选取的一个极端例子的的发生。(如推文《感谢美国让中国青年更团结!》)而其他感情-形容词都不显著,如果去掉另一个过度个人化的例子“帅”之后,我们可以发现其他的词汇大多也都是围绕着个人的。而那种一般意义上具有集体政治色彩、政治动员的词汇极少。

2.身份词的生活化,个人化同样显著

在设计了所有人称、组织的词汇中。除前文提到的因贸易战时局而频繁出现的“中国”“美国”之外,大多数都是围绕着个人-家庭展开。个人是在个人的环境中被定位,而并非是有一个政治性较强的称呼。大多数时候,读者都被称之为“年轻人”“青年”。“中国”这个词的频繁出现也因为“中国青年”这个词的频繁出现,在“中国”出现时,有四分之一为“中国青年”。

另外值得注意的是,作为十篇较长的,按照自然时间线抓取的共青团的原创推文。在这十篇风格迥异的推文中,共青团中央却极少提到自己“共青团”。以往我们认为作为共青团的一种叙述策略的自称“团团”更是在选取文本中为出现次数为零。这种消除自我,并从感觉上的亲近读者风格转移成一种似乎和读者有一定距离的“客观化”叙事模式,似乎成为了共青团推文的主要方法之一。

 3.  不同风格文章用词策略和跨度较大,但总体保持稳定

在Palladio中可以看出,不同文章中的感情词和身份词存在一定的割裂现象。因为文章存在一定的偶然性问题,代表性不充分的情况下会出现有些词不能连接起来。但仍然可以看出大多数文章都连接在了那些个人性较强的感情词和身词上。而与“团结”“荣誉”“人才”这些词相连接的文章较少。

 

 

 

总结与反思

在这次分析中,初步结论可以如此归纳:在选取的这个样本中,共青团的推文无论是从感情色彩层面,还是身份指称层面都显得更加个人化。传统官方媒体的那种动辄“家国”“国运”在共青团推文中都较少体现。转而更加趋向于和青年受众一起谋求某种情感层面的共识。比如“帅”“萌”“青春”等。在和青年受众进行交流时,对于“人”的指涉更多往家庭、学校层面转移。

这一初步结论和在开始研究前的预测基本相同。但这一研究当然存在诸多问题。最为根本的问题是碍于技术手段过于原始,难以对于词汇做出更细致的划分与考察:感情词和感情色彩的分析不是简单的抓取词汇就能够分析的,只能得出比较浅显的结论。身份词则应该更加进一步划分为个人层面,国家组织层面等等。因为这种划词方面的技术手段存在问题,导致对于样本的选择也存在诸多问题。因为划词只能通过手工划分,因此只好将样本数量降低,否则划词的过程会更加漫长。

如果能够在概念层面进一步细分“个人”“国家”。建立一个令人信服的去政治化的-政治化的划分体系。并在技术手段上进步,抓取更多文本。则能够在研究共青团如何将自身官方组织的、带有一定政治宣传的色彩这一身份给隐蔽,并通过“去政治化的”“个人”的方式去迎合其读者从而真正起到政治动员效果的这一研究课题中用数字人文的方式做出更成果。