海外社交媒体上中国国家形象传播者的特征研究——基于Twitter的数据挖掘与分析
摘要:研究利用NVivo软件,在Twitter中以“China”为关键词,根据组合周时间抓取推文,同时采用文献分析、内容分析和词频分析的方法,运用数据文本分析软件IBM SPSS Text Analytics for Surveys4对近2万条样本数据进行了数据初步挖掘,基于数据挖掘结果,分析了海外社交媒体Twitter上中国国家形象传播中的传者特征。
论文通过数据挖掘的研究方法,对传播者特征进行了研究,结果表明传播者以普通用户为主,传播内容大部分由用户自主生产创造,大多数专业媒体通过转发评论的形式来参与传播,扮演的是“信息传播节点”的角色。在地理位置分布上,传播者主要来自于英美等发达国家和日本印度等周边国家,参与传播的亚洲国家最多,而来自北美洲得传播者总量最多。
期待通过本文研究成果,可以促进社交媒体上对中国国家形象传播者的认知,为当下采取针对性的传播策略提供事实与依据。
关键词:中国,社交媒体,传播者特征,Twitter,数据挖掘
一、研究背景
一直以来,中国过去的国家形象及对外传播主要依赖传统媒体,因而在国际传播中,中国话语权掌控格局严重失衡, 这直接导致在国际舆论环境中陷入被动和僵局,甚至在网络空间形象经常被“妖魔化”。
随着新媒体时代的到来,以Twitter等为代表的社交媒体在国际传播领域迅速崛起,对我国海外形象的传播和建构起着越发显著的作用。网络时代也为国家形象建构带来了新的契机和挑战。
首先,新媒体具有便捷性、快速性和全球化等传播特性,为新媒体环境中中国国家形象的构建提供了强大实用的工具和手段,微博客便是其中一种重要工具。用户作为微博传播最庞大的主体,其在国家形象传播与塑造等国际传播领域中的作用逐渐显现。
其次,作为一种关系型内容生产媒介,微博等社交媒体是基于密切的社会网络信息表达场域,用户在微博上发表任何信息时,可以是沟通、倾述、发言甚至发泄等状态,不同维度的表达塑造了用户的个人形象和个性特征。与此同时,成千上万的用户对同一话题讨论、传播的相关信息内容,初始状态是零碎的,但将每一条零碎的表达信息整合后,所能体现的,便是该话题在社交媒体上呈现的现状和特征。
最后,以Twitter为典型代表的社交媒体上,数据或由用户独立生产、或因用户间的互动而产生,因此非常适于观察人类行为,较为真实地反映了用户的态度、情感及特征。根据We Are Social发布的2015年全球数字社交和移动报告显示,在不包括即时通讯和聊天工具的社交网络平台中,Twitter排第5;在2015年Alexa全球网站排名数据中,Twitter居第8位。截止2012年7月,Twitter共有注册用户5.7亿,活跃用户1.7亿,日发送信息量已达约4亿条。因此,作为最活跃的社交媒体之一,Twitter上的中国国家形象的传播者研究,将对今后我国海外网络形象的传播与建构,产生广泛深远的影响。
本文通过对Twitter数据内容和信息特点进行挖掘研究,厘清社交媒体中国家形象传播者的构成情况,为新改革时代下的国家治理提供基础。
二、文献综述
国家形象是一个交叉学科,政治、外交、传媒、公关等各个领域的学者从不同角度对中国的国家形象进行了探讨,本文主要阐述及梳理的是,国内外学者从新闻传播学角度研究的相关成果。
1国内研究综述
在我国,传统的国家形象研究涉及了理论和方法论两个层级,主要从对外传播的理论与策略、国家形象的传播与塑造、传统媒体与国家形象、网络媒体和国家形象等四大方面进行研究,集中采用定性研究中的文献分析、深度访谈,以及定量研究中的内容分析和问卷调查法,融合新闻框架、议程设置、刻板印象等理论基础。目前我国学者最广泛的研究成果集中在“媒体与国家形象的关系”这一角度,研究方法广泛采用的是内容分析法,小部分采用问卷调查法和跨国民调的方式进行,总的来说,国内学者对国家形象的研究成果数量比较多,但侧重于挖掘西方传统媒体或主流媒体报道中的中国国家形象,缺乏“社交媒体与中国国家形象传播”的研究视角。
目前国内学者中只有相德宝等人采用实证研究方法,分析过社交媒体上中国国家形象传播者的问题。
相德宝通过内容分析法研究了Twitter等10种自媒体,发现“自媒体上的对华舆论主要由发达国家的受众塑造,因此自媒体上对中国的报道框架与传统媒体相比并无明显变化。”此外他也通过数据挖掘的方法,对国际自媒体Twitter 涉华舆论领袖传者特征及其影响力进行研究,发现“兴趣小组、媒体、企业及非政府组织是涉华舆论组织的主要类型,媒体组织中商业媒体尤为活跃,涉华舆论传播者主要来自美国、加拿大、中国和日本等国家,职业以媒体从业人员为主。” 但通过事件间接获取的涉华用户会出现主题性和临时参与性的特点,对管窥国际自媒体涉华舆论传播主体的长期稳定和普遍特征具有一定的局限性。
张军芳总结说,“以往主要采用两种方法:一是对国际传统主流媒体的涉华报道进行研究,但主流媒体上的涉华舆情并不等同于各国民众对中国实际持有的态度。二是采用民意调查方法研究涉华舆情。这一方法实施难度太大。”“与这两种方法相比,依据社交媒体文本来研究国际涉华舆情既易于操作,又降低了成本,也可保证研究者对研究过程的可控性。” 这说明,国内学者已经认识到利用传统媒体的文本内容研究国家形象存在极大不足,逐步开始重视利用社交媒体文本完成相应研究。但笔者检索发现,整体而言,利用社交媒体文本对中国国家形象传播者进行研究的文献非常少。
2国外研究综述
国外有关对外传播、国家形象的著作研究主要是从国际关系、公共外交、国际传播、品牌战略、形象修复等方面展开,目前国外研究中国国家形象的力量主要集中在美国和英国。其中有影响力的包括英国外交政策研究中心《中国国家形象:外国学者眼里的中国》,该书是一部关于外国人如何看中国国家形象的专题文集,内容包括中国的内政、外交、国防和政治、经济、文化,以及乔舒亚库珀莫雷的《淡色中国》,系统地阐述了他眼中的“中国国家形象”。 纽曼(W. Russell Neman)等学者依据经典的“议程设置”理论,选取美国政治讨论中的重要议题,利用社交媒体上的大数据,试图回答Twitter上究竟由“谁来设置议程”,研究发现,将传统媒体和社交媒体在Twitter上发起的政治讨论间的关系概括为互动最为合适。因此,研究者提出传统媒体议程与社交媒体议程之间并非一种因果关系机制。
在国外学术论文方面,利用“世界高质量学术期刊数据库(Elsevier S ci Verse Science Direct)”,以“Twitter”和“China”为关键词对库中已收录的2006年至今的所有领域的期刊文章的摘要、题目和关键词(Abstract, Title, Keywords)进行搜索,共显示了11个搜索结果。进一步分析发现,没有相关话题的研究成果。
上述分析表明,目前有关社交媒体中国家形象传播者的研究尚处于起步阶段。作为一种尝试,本文利用大数据技术,通过软件辅助分析,来探索国际社交媒体Twitter中的中国国家形象传播者的问题。
三、研究方法
1数据挖掘与方法
利用数据挖掘进行数据分析的常用方法主要有:分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘这7种。其中Web页挖掘指的是,通过对Web上丰富的信息量的挖掘,利用这些海量数据进行分析,收集政治、经济、政策、科技、金融、等信息,分析和处理有重大或潜在重大影响的外部和内部信息,并根据分析结果找出各种问题和可能引起危机的先兆。本文所使用的NVivo10软件属于Web页挖掘的方法。
2 IBM SPSS Text Analytics for Surveys 4
本文的研究方法是基于软件而实现的,采用的IBM SPSS Text Analytics for Surveys 4软件,该软件是一款成熟的商业文本挖掘软件,主要用来挖掘消费者评论意向及社会调查的文本内容。利用文本分析技术,可以将文本自动聚类,进行词频分析,本文语义还能够表现出提供者的立场、观点、态度等,此外还可以对文本内容中的形容词、表情符号等情感因素进行情感分析,极大减轻研究者的统计与研究工作量。相对于人工操作而言,该软件对于分析开放式的问题,具有更强的分析能力和决策能力。
3研究设计
Twitter是微博客的代表性网站,能让人们发表有关个人现状的短消息的网站。基于以下两点考虑,本研究选择Twitter作为研究平台:首先,作为国际自媒体中最具影响力的网站之一,Twitter在全球的影响力远高于博客、论坛等其他国际自媒体类型,是最为活跃的社交媒体之一。其次,Twitter是一个公共讨论平台,所有信息可以及时检索。尽管Facebook在国际影响力方面更胜一筹,但出于对用户隐私的保护,Facebook上讨论内容仅局限于好友圈中才能看到,无法进行类似Twitter上公共检索的操作,来获取相关数据。
本文使用定量和定性研究相结合的方法,主要包括内容分析法和词频分析法 。词频分析以人工干预分词,辅以“Excel词频统计工具”确保词频样本的真实性和准确性。
在数据挖掘的具体操作上,在Twitter首页以“China”为关键词搜索推文,并加以“ N Capture”软件辅助进行自动采集,不包括其中的视频、图像和音频等多媒体内容,只限于文字文本部分。按最相关顺序排序,根据2015年5月31日至1月18日(避开重大事件)的7个时间点形成的组合周进行操作,挖掘到推文内容共计113038条。软件挖掘到的推文绝大部分是英文,有极少部分推文为中文、阿拉伯文、西班牙文、日文、韩文等。除了推文,Ncapture软件也自动抓取了用户ID、个人标签、粉丝数、转推数、推文量、位置、话题标签等信息。由于本研究使用的IBM文本分析软件,最大分析的条数为20000,因此在10多万条数据的基础上,采用等距抽样,计算出抽样距离K= N(总体单位总数)/n(样本容量)≈ 6,抽取随机数为1,作为样本的第一个单位K1,接着取K1+K,K1+2K……共抽取18840条推特数据。
四、研究发现
(一)影响力、活跃度分析
正如美国学者保罗?莱文森(Paul Lvinson)所说,人在互联网上发布信息的同时,自己也变成了互联网的内容,也成为关注与被关注和信息节点互动的环节。在Twitter上的中国国家形象传播者,也成为中国国家形象传播研究中关注的焦点之一。与国内的新浪微博类似,粉丝数(Number of Followers)是衡量用户在Twitter中影响力的关键性因素,关注数(Number of Followering)和推文数(Number of Tweets)是反映用户在Twitter中活跃程度的重要因素。根据挖掘结果,推文中含有“China”内容的Twitter用户的推文数、粉丝数和关注数的情况如下:
1传播者的推文类型分析
在挖掘的数据中,高达66%的相关推文内容是原创型,34%是转载型,这说明在Twitter上中国国家形象的传播中,大部分内容由用户自主生产、创造,与Web2.0 时代的信息传播特性——用户创造内容(简称“UGC”)的特质相符。转载类型的推文既有来自个人用户、商业机构、兴趣小组的,也有来自New York Times、India Today和BBC Chinese等媒体组织的。绝大部分转载型推文的来源呈现多元化特征,没有出现大量转载同一推文、或来源于传统媒体的推文刷屏的情况。传统视野下中国国家形象的研究主要关注西方主流媒体上的形象塑造与传播效果,但在社交媒体平台,转载媒体信息已不再是传播者主要的信息来源与选择,社交媒体上自创的内容更加丰富,这在一定程度上打破了传统媒体的信息垄断特权。
采集数据时虽然刻意避开了重大热点事件,但研究中发现,2015年6月21日广西“玉林荔枝狗肉节”在Twitter上引发极大争议,甚至引发国际主流媒体对此的跟进报道。台湾“中央社”快速发文报道称“外国网友和动物保护组织纷纷反对广西玉林的荔枝狗肉节,推特上已经累计出现25万条带有‘阻止玉林2015’的话题符号推文。” 纽约时报也第一时间跟进推特上的抵制情况,发表了《中国玉林狗肉节,一场举世关注的冲突》的报道。 这印证了美国学者沙尼伯曼( Shayne Bowman) 和克莱斯威利斯( Chris Willis)的观点,二人在《自媒体: 受众正如何影响新闻信息的未来报告》中提出,“到2021年受众将生产50%的新闻内容,届时主流新闻媒体也将不得不逐步采纳和实践这种全新的新闻传播形式”。Twitter上的中国国家形象推文内容以原创为主,转载内容所占比例较少。从这个角度来说,Twitter上的传播者,在中国国家形象的传播方面担负着信息制造的角色,而不仅仅是涉华舆论的再讨论和再传播。
分享让更多人看到
- 评论
- 关注