舆论讨论模型视角下的舆论演化——以twitter上占领华尔街运动为例
摘要:从舆论演化的讨论模型出发,利用文本挖掘和时间序列相结合的方法分析了“占领华尔街”运动的Twitter文本,为社会运动演化建立了一个多变量的时间序列模型。研究发现:通过文本分析和结构化时间序列方法,本文将舆论的讨论模型转化为一个可以计算的理论框架,主要研究重新形式化地表达并证明了以帕克和布鲁默为代表的芝加哥学派关于社会运动相关舆论演化的理论洞见。
关键词:Twitter;占领华尔街;社会运动;讨论模型;舆论形成
一、前言
21世纪以Facebook、Twitter为代表的社交媒体的兴起,凭借无以伦比的传播速度、全方位覆盖的跨空间能力、前所未有的低门槛使用标准迅速蚕食着传统媒体的信息垄断地位,传统媒体的新闻舆论预警、引导功能也遭到严重挑战。这一背景下,在当下频频爆发的社会运动中社交媒体往往承担了革命性的角色(如阿拉伯之春、茉莉花革命、占领中环)。
2011年9月17日美国“宪法日”,纽约祖科蒂公园爆发“占领华尔街”运动,在短短一个月时间里,运动从纽约华尔街上数十人的集会,迅速扩散到全美,又蔓延至亚洲、欧洲、大洋洲等950多个城市。运动的目标是要持续占领纽约市金融中心区的华尔街,以反抗由于国际权威集团的贪婪,使社会不公平的现象普遍存在,反对资本垂帘,寡头听政,以及全球权威集团在全球经济危机中对法律和政治的负面影响。[ ]
当下,在社会运动中社交媒体所引导的公共舆论扮演了重要的角色。社交媒体是现代科技和现代政治文明的产物,它的出现实现了在整个国家的范围内对社会成员诉求的有效传播,为社会成员广泛讨论公共事务供了便利和可能。NailaHamdy等人研究了半官方媒体、独立媒体以及社会化媒体在埃及暴乱中的公共舆论框架,研究发现社会化媒体在公共舆论的形成与演化中扮演重要的角色[ ];Papachariss等研究了新媒体舆论内容与传统媒体的差别,发现社会化媒体具有实时性和众包的权威等特点[ ]。社交媒体在社会运动过程当中客观上起到了记录、反思、动员、部署社会运动的作用。例如,占领华尔街运动的支持者、反对者都积极使用Twitter,频繁表达其政治意见。因此,有必要通过观察社交媒体上记录到的占领华尔街运动的文本时间序列,回顾事件的整个发展过程,避免结论的局部化和片面化。
二、舆论演化的讨论模型
舆论的形成和演化满足具有很明显的生命周期的特征。其中,最主要的理论是从公共议题(publicissues)的形成与解决为主线,例如普赖斯(Price)将舆论事件的过程总结为问题阶段(problemphase)、建议阶段(proposal phase)、对策阶段(policyphase)、执行阶段(programphase)、评估阶段(appraisalphase)[ ]。舆论形成和演化的机理类似于一般事件的发生发展过程,包括潜伏期、活跃期和衰减期,这一划分为研究者理解舆论事件提供了理论基础。与之类似,易臣何等将舆论过程划分为“触发—集聚—热议—升华”四个阶段,并呈现相应的规律,在个体行为的基础上构成了群体行为的特征[ ]。
对于舆论演化的过程我们已经有了很多理论思考和经验观察,但是并未发展出可计算化的模型,以描述舆论驱动因素与其演化之间的定量关系。通过社交媒体的内容记录,我们是否可以捕捉到那些推动社交媒体上内容推送的内在因素?这些内在因素起源于社会结构和社会性需求的矛盾关系,以文本的形式凝固于社交媒体互动数据当中。发掘这些社交媒体数据的要素,一方面可以帮助我们理解提高受众参与性的力量,另一方面也有助于我们构建舆论演化的模型。
本文选择以从舆论演化的“讨论模型”(discursivemodel)作为理论框架,分析社交媒体上占领华尔街内容如何随着时间动态变化。舆论演化的讨论模型的提出与研究者对于公众的理论化过程相关。根据普赖斯的介绍,虽然基于民意调查的研究范式使得研究者倾向于将舆论理解为个体层面的概念,20世纪发生在欧美的众多社会运动、罢工、暴动等群体行为促使研究者将舆论看成一个社会或群体层面的概念[4]。作为一个社会整体概念的公共舆论是一个社会过程(sociological process),即舆论的生命周期经历了不同的阶段。虽然讨论模型并未明确地将分析影响舆论演化社会过程的因素作为讨论模型的重要目的,讨论模型的核心却涵盖了这些理论元素。从更广义的角度讲,社交媒体上的发言是舆论演化的直接载体,是公众议程的最为具体的表现,舆论演化的讨论模型非常适用于分析社交媒体内容。综上,本文将结合占领华尔街的Twitter内容具体阐述如下:
首先,舆论演化的讨论模型认为舆论演化以公共议题(public issues)为主线展开的[ ][ ]。只有当舆论涉及到的问题涉及到社会公众的利益,才具有激发舆论扩散的意义和可能,因而议题的公共性是构成舆论的必要条件。针对占领华尔街运动,所涉及到的最主要的议题即为“反对经济不平等”,并且提出口号“我们都属于那99%”,该议题与美国民众的政治和民生关系密切,具备引发舆论的必然条件。社交媒体在建构舆论议题中发挥了重要作用,具体来说就是,社交媒体上的内容反映了抗议者们的政治主张。追踪Twitter标签趋势的Trendistic公司的调查表明,“#OccupyWallstreet”标签在9月16日晚间(即占领者驻扎祖科蒂公园前夜)11点左右开始大量出现;脸谱上“#OccupyWallstreet”页面出现于9月19日,有用户在上面写道:“欢迎各位新来者!请自由发表言论。发泄你们的不满情绪。”
研究假设1:舆论议题可以驱动舆论在社交媒体上动态演化。
其次,舆论演化的讨论模型认为作为舆论演化过程的参与者是动态的、松散结构的群体[6][7]。普赖斯(1992)将公共舆论过程中的“公众”界定为这样几类,即政治参与者、新闻记者、积极公众、热心公众与旁观者[4]。舆论不同阶段,各类公众的规模、互动各不相同,也可能实现不同角色的转换。强韶华等研究得出意见领袖的存在可以缩短突发事件舆情演变所需的时间,政府介入有助于突发事件网络舆情更快平息[ ]。社交媒体是各方参与者表达各自阵营意见的重要场所,参与者本身参与程度的变化必然影响舆论动态的演化。张毓强认为“颜色革命”能够轻易得手,媒体“功不可没”[ ]。反对派通过大量、精准地报道、妖魔化当局、制造谣言、组织民调、组织指挥等手段利用媒介达成了引领舆论推翻政府的目的。
研究假设2:舆论参与者可以驱动舆论在社交媒体上动态演化。
另外,舆论演化的讨论模型认为舆论演化以讨论和争论等行动的形式展开,其根本特质是传播,可以推动社会演化以适应变化的环境[6][7]。这是舆论演化的讨论模型不同于草根模型和现在的各种舆论理论之处。与讨论模型相比,草根模型强调“一人一票”,将舆论形成的过程简化为一个投票选举过程,而忽略了参与者互动构建舆论所产生的“一加一大于二”的效果[4]。参与者的行动无疑会影响甚至扭转初始的意见之和。例如,10月7日,“占领者”们又通过社交媒体向全球发起共同参与10月15日的“为世界的改变而联合”(Unitedforglobalchange)活动,号召美洲、亚洲、欧洲和非洲的人们共同进行和平示威,一起“占领”。纽约时报15日报道称,全球多地出现抗议现行金融体系的活动,“尽管语言、场景和程度不同,这些抗议活动都有的共同特点,就是对不断扩大的贫富差距抱有的沮丧情绪”。通过分析新闻报道中的行动及其类型,有助于理解新闻动态的变化。
研究假设3:参与者的行动可以驱动舆论在社交媒体上动态演化。
三、研究方法
本文从舆论形成与演化阶段相关理论出发,采用计算社会科学的方法推进对于社会运动相关的新闻内容的研究[ ][ ],尤其是对社会运动相关的社交媒体动态、议题、参与者及其行动多个角度进行衡量。传播学研究对于传播内容的分析具有巨大的需求,因而借助于大量人工编码的内容分析成为传播学研究中的一大特色,也是最为常用的研究方法的之一。但内容分析需要编码员付出很多的时间和精力,并且需要对编码员进行反复训练。以舆论的讨论模型为例,虽然从理论和逻辑上讲,“讨论模型”更切合实际,但因为涉及到很多问题无法测量,导致其在理论发展脉络无法与以民意调查为主的“草根模型”竞争,采用计算社会科学的解决办法有利于改变这一状况,具体解决思路是采用文本挖掘和时间序列分析相结合的方法:一、追踪一段时间里的某一类或一个新闻事件,获取其传播文本;二、采用信息检索的方法提取重要的词语及其时间序列;三、采用结构化贝叶斯时间序列分析方法对新闻报道的时间序列进行建模、对众多的内容要素进行降维,并采用聚类的方法来辅助理解。基于此,我们可以更为细致地理解社会运动过程中新闻报道的动态。
本研究通过编写爬虫程序收集了从2011年10月6日至2012年2月18日Twitter上所有关于占领华尔街运动的tweets(N=6602141)。研究数据基本上贯穿运动始终(由于技术原因未收集到2011年9月17日“占领”运动开始至10月6日之间的数据),为我们提供了一个观察和反思社会运动的文本资料。
就数据分析而言,本文采用文本挖掘与时间序列分析相结合的方法[11],采用计算社会科学的思路分析人类的传播行为[ ]。通过文本挖掘,进行tweets中的词频统计,通过数据分析完成对“占领”运动动态的描述。首先,进行中文分词,然后采用词云(word-cloud)分析文本。词云分析便于采用可视化的方法分析文本当中的词语的重要性。这种词语的重要性一方面包括词频(Term-Frequency),另外一方面也考虑逆向文件频率
(Inverse-Document-Frequency)。
时间序列分析将用于分析“占领”运动相关tweet随时间的演化以及不同时间序列之间的相互影响。本研究统计每天“占领”运动相关的tweet数量,可以得到Twitter上对于“占领”运动的时间序列。同时,我们可以得到每天包含某个关键词的tweet数量,就可以得到该关键词相关的“占领”运动的时间序列。基于以上构造时间序列的方法,我们可以进行多变量的时间序列分析。具体而言,本文采用贝叶斯结构化时间序列方法(BSTS)将时间序列分解为趋势、周期、回归三个部分[ ]。BSTS方法采用卡尔曼滤波的方法估计趋势和季节性影响,同时采用钉板回归(Spike and slab regression)来做变量选择,采用贝叶斯模型对效果最好的变量组合构成的模型进行平滑来做预测。因此BSTS方法可以从多个变量中遴选出对于预测因变量最重要的一组因素,起到降维的作用。当我们明确用于分析的有限的自变量之后,可以采用聚类分析对其进一步分类或者采用贝叶斯方法进行拟合。
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注