中国数字时代
中国数字时代

中国数字时代是一个中英双语新闻网站,由美国加州大学伯克利分校信息学院教授萧强创办和出任总编辑。我们致力于收集、记录被中国政府审查的信息,也生产对抗审查的原创内容。我们以求真为宗旨,紧跟中国政治与社会百态、网络舆论热点,关注极权之下的个体生存与公民社会抗争。欢迎访问中国数字时代:https://chinadigitaltimes.net/chinese/ 在这里,了解祖国。

【404档案馆】第46期:“实习狗加班好累”有什么问题?关于习近平的数万个敏感词

当你结束一天的辛苦工作,晚上9点从公司回家,准备在微博上吐槽一句:“实习狗加班好累”,却发现这句吐槽因为“违反相关法律法规”无法发出。这魔幻的一幕,是一位微博网民2018年12月11日的真实经历,而背后的原因是“实习狗”中的“习狗”二字,触发了关于中国国家主席习近平的敏感词审查。

《404档案馆》讲述中国审查与反审查的故事,同时以文字、音频和视频的形式发布。播客节目可在 Apple Podcasts, Google Podcasts, Spotify或泛用型播客客户端搜索“404档案馆”进行收听,视频节目可在Youtube“中国数字时代·404档案馆”频道收看。


作者:西西弗斯推大石

欢迎来到404档案馆。在这里,我们一起穿越中国数字高墙。今天我们来聊聊,中国互联网上关于“习近平”的敏感词到底有多少,它们都是怎么来的。

当你结束一天的辛苦工作,晚上9点从公司回家,准备在微博上吐槽一句:“实习狗加班好累”,却发现这句吐槽因为“违反相关法律法规”无法发出。这魔幻的一幕,是一位微博网民2018年12月11日的真实经历,而背后的原因是“实习狗”中的“习狗”二字,触发了关于中国国家主席习近平的敏感词审查。

浑身敏感的习近平

敏感词审查,是中国网民习以为常的上网经历。而涉及领导人的敏感词审查又是严上加严,作为“定于一尊”的中国最高领导人,习近平的相关敏感词数量更是达到了惊人的程度。据中国数字时代统计 ,在2016年8月国新办下发给乐视视频的清查词库中,和习近平相关的敏感词组就多达35467个之多,加上最近几年修宪废除任期限制、中美贸易战、香港反送中、新冠疫情等,每次重大事件的发生,都让这个敏感词词库更加“丰满”。

除了数量众多,这些敏感词的类型也极为广泛,从名字谐音到任职职务,从习近平说过的错别字到官方媒体的宣扬的习式“金句”,都榜上有名。有些敏感词的荒谬程度甚至会让人觉得这是在“高级黑”。2018 年 1 月,有网友在一款做饭应用中上传了一份菜谱,却因为“洗净平底锅”的表述中,“洗净平”与习近平谐音而遭到审查,无法上传该菜谱。

谐音梗、拆造字、报菜名、读错字:敏感词的千种类型

我们把这些关于习近平千奇百怪的敏感词大体分为三类。

第一类是和习近平名字相关的各种词组,这也是数量最多的种类。习近平三字的各种谐音被重点审查,习近平三个字的各种近似字,如与“习”字相近的“刁蛮”的“刁”,与“习大大”的“大”相近的“犬”、“太”等字也同样高度敏感,甚至“翠绿”的“翠”字因为上下结构是“习习卒”,被认为可以用来诅咒习近平死亡而常被屏蔽。除了名字本身以外,习近平及其职位、昵称加上各种前缀后缀的称呼也是被审查的重点,从描述他正式职位的“主席”、“总书记”到戏谑性的“习总”、“boss”等,都是高等级的敏感词。

第二类敏感词与其成为中共最高领导人前的成长经历有关。比如,习近平因为文革没有完成初中学业,后来凭借工农兵学员身份获得进入清华的资格,在仕途步步高升之时,又完成“兼职博士”经历。在网友对此的调侃和嘲讽中,诞生了“初中生”、“小学生”、“小学博士”等敏感词。另外一个有代表性的事件,来自于习近平早年接受采访时,对自己在文革农村插队期间的回忆。“扛两百斤麦子,十里山路不换肩”,被众多网民认为违反常识,自吹自擂,从而诞生了像“扛麦郎”、“两百斤”等屏蔽词。

习近平青年时期曾在梁家河村插队七年。1985年,时任厦门市副市长的习近平曾与厦门大学的大学生交流,说“我在梁家河的七年,正好是你们上高中、上大学加在一起的时间。我上的是梁家河的高中、梁家河的大学”。这两句话后来被官方作为习近平激励年轻人的经典语句,多次引用、宣传。但在网民使用“梁家河大学”、“梁家河图书馆”等相关表达对习近平进行讽刺时,这些表达就成了敏感词。

第三类敏感词与习近平执政期间的事件和争议有关。习近平在各个公开场合讲的错别字,比如将格萨尔王讲成“萨格尔王”、 将通商宽农讲成“通商宽衣”、把人均国内生产总值误读为“人均收入八千万美元”,把精湛读成“精甚”,赡养读成“瞻仰”,都会引发网友的嘲笑,而该词也会立即变成敏感词。2013年,习近平前往北京庆丰包子店吃午饭,从而得到了“习包子”、“庆丰帝”等绰号,这些绰号自然也成为了敏感词。2017年开始,动画人物小熊维尼突然遭到封杀,外界猜测是因为有网民用小熊维尼的形象调侃了身材相似的习近平。而这一荒谬的封杀行为,引发了网民的大量二次创作,加速了这个梗的传播,全世界都将习近平的个人形象与小熊维尼联系了起来。一些相关词语,如“噗噗熊”、“蜂蜜罐”、“习噗噗”等,也迅速加入了不断壮大的敏感词列表。

从姐夫到称帝登基

每次遇到引发强烈争议的事件或是丑闻,和习近平相关的敏感词会产生一波爆炸性的增长。其中两个最标志性的事件当属2016年巴拿马文件丑闻和 2018 年修改宪法废除任期限制引发的舆论争议。2016年,国际调查记者联盟曝光“巴拿马文件”,涉及全球多位政要家庭财产情况,引发世界舆论哗然。其中多位中共高层权贵也榜上有名,最重磅的当属习近平的姐夫邓家贵,他的离岸资产在“巴拿马文件”中被曝光。“姐夫”一词也因此一度冲上微博热搜,这次事件引发大规模审查,和“姐夫”有关的搜索在微博、知乎不但遭到屏蔽,甚至还“连累”了与“巴拿马文件”相近的“巴拿马运河”等词语,都一度被加入了敏感词列表。

2018年2月,新华社播发了中共关于修改宪法的建议,首次向外界披露了删除国家主席任期限制的内容,引发大量网络讨论。网民纷纷用各种方式表达对于取消任期限制的愤怒,“吾皇”、“万岁”、“登基”、“称帝”、“劝进”等词语全部被屏蔽,借用袁世凯称帝讽刺的相关词语“袁世凯”、“复辟”、“戊戌变法”等词语也惨遭审查,甚至“移民”也成为敏感词。当天,民间的讽刺创意与官方的审查斗智斗勇,在中文谐音词被高度封禁时,有网友开始使用英文,但英文敏感词也从修宪事件相关的对应词语快速扩展开来。在当天几个小时的“冲塔”高峰期内,所有包含英文字母“N”的微博,都无法发出。此次事件,也导致与习近平相关的敏感词数量激增。

习近平敏感词的增加过程只是中国这几年网络审查的一个缩影。随着敏感词数量一起不断增加的,是网络防火长城的高度;而网民在与敏感词审查的拉锯战中,不断创造新的表达,不断地试图推倒这座高墙。


中国数字时代 CDT 致力于记录和传播中文互联网上被审查的信息,以及人们与审查对抗的努力。我们邀请您参加敏感词开源研究项目和404文章存档项目,为记录和对抗中国网络审查作出你的贡献!详情请访问我们的网站 CDT.MEDIA.




CC BY-NC-ND 2.0 版权声明

喜欢我的文章吗?
别忘了给点支持与赞赏,让我知道创作的路上有你陪伴。

加载中…

发布评论