舆论讨论模型视角下的舆论演化——以twitter上占领华尔街运动为例【2】
四、研究发现
1.社交媒体上的舆论演化
本文发现,就笔者收集到的数据来说,Twitter上“占领华尔街”的热度可以分为三个阶段,如图1所示:一、从2011年10月初至211年11月初,在2011年10月中掀起了两次小高潮。二、从2011年11月初至2011年12月初,Twitter上“占领华尔街”运动掀起了一次大高潮。三、2011年12月初到2012年2月,Twitter上“占领华尔街”运动的热度大幅下降,并且逐渐归于平静,再没有集中爆发。
结合“占领华尔街”运动实际事件来看其Twitter时间序列变化可知,第一个阶段2011年10月14日和10月26日的两次峰值可以归因于:10月14日上千名示威者在美国首都华盛顿举行游行,抗议大企业对美国政治的影响和美国政府发动的阿富汗与伊拉克战争,并且与警方和安保人员发生了严重的冲突;10月25、26日的小爆发则是因为加利福尼亚的奥克兰警方强制拆除了当地示威者的营地,并且使用了催泪瓦斯,还逮捕了大量示威者;第二个阶段在11月爆发的峰值则是因为11月15日纽约市当局与示威者在祖科蒂公园发生了激烈冲突,纽约当局对示威者进行了强制清场,并且逮捕了200多示威者;第三阶段,随着11月15日当局对“占领华尔街”示威者的清场,之后“占领华尔街”运动渐渐落幕,Twitter上的热度也逐渐降低。可见,社交媒体很好的反应了社会运动的过程。
如图2所示,通过拟合运动期间“占领华尔街”话题在Twitter上每日的用户活跃数量和tweets各元素,可以看出,每日的tweets数量和每日活跃的用户(User)数量(不重复计算)在双对数坐标下呈现直线特征(Beta=1.06,R?=0.99),具有典型的幂律或长尾特征;每日用户数量和每日转推(Retweets)数量在双对数坐标下也呈现直线特征(Beat=1.2,R?=0.98),也具有典型的幂律或长尾特征;同理,每日活跃用户和tweet中@的用户数(Mentions)(Beta=1.15,R?=0.99)也呈现典型幂律或长尾特征。综上,可以看出,在整个运动期间,少数特殊的几天是社交媒体上tweets发布、互动、转推等的集中爆发时期,从上文活动期间tweets变化曲线图中也可以得到验证,确实在特殊日期tweets存在爆发现象。
按照用户运动期间发送twitter数量,Twitter 用户的活跃度分布具有幂律特征或“长尾”的特点,用户发twitter的数量与其排名的分布在双对数坐标下呈现直线特征(β=-0.58;R?=0.98)。具体而言,排名前二十的用户有:
OccupyPics(41813),RonPaulsVoice(29890),owsar(29316),clandestine73(29235),darealmaozedong(17987),occupyFlickr(14233),OccupyWeather(13460),Xfilespoker(13158),BPGulfLeak(9745),Occupy_USA(9521),blogdiva(9141),CAFalk(8306),Kaymee(8283),OpWallStreet(8272),J4LYN(7607),LibertySqGA(7161),occupysfbot(6783),DownWithTheBull(6473),UnifiedLeftNews(6413),KCPhilYglesias(6352)。按照用户属性可以划分为六类:大众、自媒体人、活动发起方、新闻机构、其他组织、未知。其中top20所发tweets数量按属性可以划分为大众(30%)、评论家(10%)、运动组织方(18%)、未知(42%)。从上述分布状况,我们可以看出现如今的公共舆论参与者中,传统新闻媒介在发声的量的方面已经不再占主导地位,而热心公众代替政治参与者发挥着主要作用。
2.讨论模型的三要素及其影响
本文主要从tweets文本内容的角度着手,本文采用词云的方法,统计了“占领华尔街”tweets中的常用词。按照词语的重要程度排名,前50个依次ows、rt、quot、occupy、you、occupywallstreet、that、p2、police、they、amp、wall、street、people、protesters、what、via、tcot、occupyoakland、will、up、your、nypd、oo、who、park、their、live、video、movement、99、don、there、protest、why、arrested、n17、obama、oakland、news、support、when、them、nyc、teaparty、solidarity、today、world、anonymous、time。从词云分析的结果可见:一、”ows”、”occupywallstreet”、”99”(“Wearethe99%.”)、amp(“Association of Muslim Professionals”)等政治议题占主导地位。二、”protesters”、”people”、“nypd”构成了“占领华尔街”运动的主要的参与者。三、”occupyoakland”、”park”、”arrested”、”protest”等词代表了“占领华尔街”运动的主要过程,展示了舆论演化中的具体事件。
我们采用贝叶斯结构化时间序列的方法(BSTS)分析了影响“占领”运动舆论演化的因素。首先,对前200个关键词通过钉板回归(spike and slab regression)进行变量提取,我们提取出了62个可以跟模型最佳拟合的变量,如图4所示。
随后,除趋势模型外和全模型外,我们采用递增变量的方法建立了五个模型,依次加入的时间序列分别是:protests、money、says、p2(progressive hashtag on Twitter),tcot(Top Conservatives on Twitter)六个词变量,其结果如下图所示,从model 1到model 2 至model 6,模型的拟合效果R?由0.942至0.982在逐渐增长,拟合效果显著;另外,如图5所示,模型的累积绝对误差随着核心时间序列的加入而逐渐降低,客观上就证明了上述几个变量可以很好的预测舆论的演化过程。
通过上面研究我们可以看到50个关键词对舆论的演化是可以很好的预测出来的,经过人工删除一些无意义词汇,我们对剩下来的32个词进行了聚类分析,以便让我们更清楚认识这些词汇到底代表了什么含义。结果可以分成以下四类:行动(occupydc,occupyla,action);议题(jobs,democracy,power,party,americans);议题(gas,crowd,violence,99,tomorrow);行动(occupywallst,march,arrested,cops)。综上,我们证明了三个假设。
五、结论与讨论
本文的意义在于证明了舆论演化的讨论模型在描述新闻报道演化中的适用性。通过文本分析和结构化时间序列方法,本文将舆论的讨论模型转化为一个可以计算的理论框架,主要研究重新形式化地表达并证明了以帕克和布鲁默为代表的芝加哥学派关于社会运动相关舆论演化的理论洞见,因此,具有理论价值。
当然,本文依然具有研究缺陷,可以通过未来研究继续改进。例如:在对变量进行时间序列构建后,全模型的拟合系数低于trend模型,并且season模型也低于trend模型,这一点笔者并未找到合理的解释。另外,对于舆论的测量,至少包括舆论强度、效价、情感等多个维度进行理论化和操作化。在本文当中,主要采用了舆论强度的维度,并以数量作为测量方式,可以在后续的研究中进一步丰富。
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注