基于语料库的人民网对外传播英文报道特点研究
摘要:当前英语频道(网站)及世界范围内各大社交媒体已经成为重点新闻网站对外传播工作中的标准配置,对外传播阵地已经大大向前推进。结合人民网对外传播的问题,本文采用语料库的研究方法,以人民网twitter账号@PDChina传播的人民网英文版文章为主体构建了研究语料库。结合人民网对外传播英文报道语料库利用WordSmith Tools 5.0软件进行了词频统计分析和共词分析,总结了人民网对外传播英文报道的5个特点,病探讨了应用语料库研究方法研究新闻文本的问题。
关键词:人民网;对外传播;英文报道;语料库
1 引言
随着中国综合国力的大幅提升,国际地位也日益提高,已经越来越深入地参与到国际事务的处理当中,中国与世界的关系早已与往昔不同。然而在国际舆论场上,中国却依旧面临着西强我弱的旧秩序,主流媒体的对外传播压力重重。近年来,中国主流媒体的国际传播能力建设逐步加强,作为参与国际舆论场竞争的一项重要方式,英语频道或网站已经成为重点新闻网站的标准配置,这些平台刊载的英文报道成为向国际社会“讲述好中国故事,传播好中国声音”的重要渠道。与此同时,因应社交媒体快速发展而造成的人们获取新闻资讯方式的改变,中国主流媒体也都开始加入其中,在国际热门社交网站,如facebook、twitter、youtube等上开设账号,将对外传播阵地继续向前推进。
其中,人民网(www.people.com.cn )作为国家重点新闻网站的排头兵,也肩负起对外传播的重大责任,极具代表性。人民网英文版(en.people.cn)早在1998年1月14日便已创办,经过多次改版,目前包含了Opinions、Business、Military、World、Society、Culture、Travel、Science、Sports、Special Coverage、Photo、Video等12个频道,日刊载文章数百篇,已经成为一家成熟的英文新闻网站。同时,以网站为主体,人民网英文版也形成了自身的社交媒体矩阵,涵盖国内外最热门的6大社交网站(facebook、twitter、instagram、youtube、微博、微信),其twitter账号@PDChina于2011年5月创建,拥有200多万关注者,是twitter平台上的“大V”,该账号虽然以“People’s Daily,China”(人民日报)为名,不过账号内容还是来自于人民网英文版网站,是人民网对外传播中的重要角色。
本文即是以人民网英文版中刊载的英文报道为研究对象,通过其twitter账号@PDChina发布的推文构建英文报道语料库(corpus or copra),借助语料库分析的研究方法,利用相关语料分析软件对相关文本进行系统分析,主要进行词频统计分析、共词分析等分析步骤,以全面探析人民网对外传播英文报道的报道特点。
2 文献综述:语料库和新闻文本研究
语料库分析就是指利用相关分析软件程序来分析文本中词汇运用的一种方法,在语言学领域已经发展多年。其最初的研究来自于美国布朗大学的Henry Ku?era和W. Nelson Francis于1964年创建的第一个电子语料库——布朗语料库(Brown Corpus),目前“基于语料库”的研究范式逐渐成为语料库语言学研究的主流范式和默认范式,主张一切源自语料库,利用语料库对已有的理论或假设进行探索,目的在于验证或修正已有理论,采用普通实证研究的步骤,即“提出假设—分析数据—验证假设”的步骤。 本文也将采取这一“基于语料库”的研究范式进行研究。
语料库分析最基本的单位是“词汇”,之所以能将语料库研究引入到对新闻文本的分析,是因为透过词汇在文本中的组成可以探讨其背后所隐含的文化与社会实践意义。Roger Fowler在对新闻文本进行研究的基础性著作《新闻中的语言:报纸中的话语与意识形态》(Language in the News: Discourse and Ideology in the Press)一书中,深化了上述观点,他强调词汇是一个文化中对外在世界的再现,该世界也是根据一个文化中意识形态的需求而被认知的。 这一观点将词汇运用进一步连接到文化、意识形态及人们对外在世界的感知,也暗示了新闻实践和词汇选用有关。本文认为新闻工作者在报道的过程中对报道事实的选择、遗漏或改编,都会体现出对报道对象的态度,媒体文本中词汇的选用反映了特定的价值观点与意识形态。故而,我们可以透过分析人民网对外传播英文报道,得出人民网对外传播中的态度偏向和论述方式。
目前基于语料库的新闻文本研究主要有两种研究取径。
第一,新闻文本的语言特征研究(包括语言风格和语法结构等方面)。这类研究取径将新闻文本视作日常生活中的自然语言之一,与语言学结合较多,可以说是从新闻文本预料可中分析语言运用的问题。第二,新闻文本对社会现实“再生产”的研究。这类研究拓展了语用层面的研究,更加关注新闻文本的结构及社会文化层面的探讨,也与新闻传播专业的研究更加切合。具有典型性的有Paul Baker等人的研究,他们搜集了1996至2005年英国关于难民、政治庇护寻求者、及移民的大量报告,构成了总数达1亿4千字的大型语料库,这项研究发现多数应该媒体对难民或政治庇护者报道都强调负面数字,对移民的报道则使用了“逃脱”、“逃离”这样具有较多负面情感的词汇;同时,难民或移民也被用“水的隐喻”来描述(诸如,洪水、洪流、及倾泻等),这显示媒体将这些西欧的难民或移民建构成为一种失控、无人管理、不乐见的自然灾害。
而近年来大数据炙手可热,语料库分析方法也属于对大量资料进行处理的技术,也被认为是适合用于研究电子化资料库和分析大量文本资料的方法,因此语料库分析方法也大有乘风而起之势。同时,由于大量新闻文本已经实现数字化,完全具备了应用语料库分析方法进行研究的基础,也催促着语料库分析方法的科学运用以探索新知。
在新闻传播领域采用语料库分析方法对新闻文本进行分析尚属新兴阶段,本文则是聚焦于人民网对外传播英文报道,通过语料库分析方法的应用,探析人民网对外传播英文报道的词汇运用情况及报道倾向。
3 研究方法
3.1 语料库的建构
当前社交媒体已经是人们接收新闻资讯的主要方式之一,传统新闻网站也需要通过社交媒体来“引流”,所以经过社交网站传播的新闻报道更具代表性,传播效果也更好。鉴于此,本文借助twitter提供的高级搜索服务,通过人民网英文版twitter账号@PDChina来索引英文文字报道。
具体方法则是,首先遍览@PDChina发布的推文,通过推文中附带的链接,索引至人民网英文版网站,选取英文文字报道保存下来。由于研究者精力所限,故而将抽样的时间范围定在2016年1月1日至2016年6月30日,将此时间范围内人民网英文版通过其twitter账号@PDChina向外界传播的所有英文文字报道搜集起来,构成了本文中所要研究的语料库。语料库中包含英文报道1,946篇,总字数超过77万。
3.2 分析工具及分析方法
本文使用的分析工具是WordSmith Tools 5.0,WordSmith Tools(简称WS)这款软件由词汇分析软件有限公司(Lexical Analysis Software Ltd)和牛津大学出版社(Oxford University Press)于1996年首次发布,至今已经走过20年,是当前在语料库分析领域应用最广的软件之一,被广泛用于语言学、文学、法学、医学、历史学、政治学、社会学等领域。 WS中提供了多种语料库分析技术,包括了量化统计和质化分析方法,在本研究中将应用其中主要的2项功能:(1)词汇列表功能(Wordlist):该功能支持创建语料库中词汇使用的频率列表,确定其中常见抑或是少见的词汇或词串;(2)索引功能(Concord):该功能的主要作用是搜索和统计特定词汇或短语在指定文本中出现的频数,是WS中最主要、最常用的功能。
借助WS的相关功能,本研究对于语料库中人民网对外传播英文报道的文本将主要做出如下分析:
(1)词频统计分析:词频统计分析是大多数语料库分析的基础和分析起点,通过对语料库中词汇出现频率的统计,可以分析文本中词汇分布的情况,并基于此来决定需要对哪些词汇进行重点分析。
(2)共词分析:共词分析则是把词汇放置在语句所处的前后文当中,以分析词汇在文本中的实际意义。因此,共词分析是词汇形式出现情况的集合,并且将每个词汇放在各自文本环境中原样呈现。通过WS软件的协助,在进行共词分析的过程中,可以将特定词汇在句子中出现的词汇一起列出,并将具体考察的主要词汇放在中心位置,这也被称为上下文关键词索引(key word in context,KWIC)分析。共词分析的核心是在探讨关键词处于文本中的位置及意义,在方法上近似于质化文本分析,根据研究目标的不同,共词分析的范围可以是一整个句子,也可以是一整段文字,甚至于是一整篇文章的意义。
4 研究发现
4.1 人民网对外传播英文报道的词频统计分析
借助WS软件,在词频统计中能够呈现语料库整体的词汇使用情况,通过这些词汇出现的频率高低,可以看出文本整体的词汇使用倾向,从而能够全面地对语料文本进行研究。
经WS软件分析,本文所研究的语料库共有词汇22,351个。这些词汇包含两类,第一类是“语法词汇”(grammar words),用于连接句子的结构,包括了the、of、to、and、in、for、as、at、in等;第二类是“内容词汇”(content words),构成了报道文本表达的主要内容,而内容词汇中的be动词也不具有反映报道特征的作用,因此,根据研究需要及篇幅限制,仅在表4.1中仅列出除be动词之外的出现频次超过1500的内容词汇。
表4.1中唯一出现的国家名就是“CHINA”,而且高居词频统计列表首位,而表示所有性质的词汇“CHINESE”和“CHINA’S”也都排在前十,从中可以看出人民网对外传播英文报道绝大多数都是在向外界报道中国,而在中国参与国际事务报道方面可能并不多。而“BEIJING”则是唯一出现在表中的城市名,可见北京作为中国的首都,得到了人民网对外传播英文报道最多的关注,诸多新闻事件可能都来自于北京。
“SAID”是出现频率最高的动词,表明报道常引述受访对象的说法。此外,动词“WILL”出现的频率也很高,排在表中第4位,说明报道中出现了大量未来的信息,同时,可以看到形容词“NEW”也出现在表中的第17位,这些反映出人民网对外传播英文报道常常以积极的态度报道未来的景象。
“PERCENT”一词在语料库中出现1823次,平均0.94篇报道即出现一次,而经过WS软件的统计,语料库中数字出现多达23,555次,可见人民网对外传播英文报道中多使用数字化和统计化的方式来呈现事实。
“DEVELOPMENT”的出现则反映出人民网对外传播英文报道的另一个主题,即中国的发展成就。
然而必须指出的是,词频统计分析只是对语料库中词汇出现次数的纯数学统计,虽然具有较高的量化意义,但是对于揭示词汇在文本结构中的实际使用意义这一层面则显得力所不能及。以出现最多的词汇“CHINA”为例,词频统计分析并未能揭示出人民网对外传播英文报道中关于中国的报道聚焦在哪些新闻事件。由此可见,词频统计分析将文本的脉络切割开来,使得词汇的实际使用意义缺失了,需要后续的共词分析将词汇放置回文本中。
分享让更多人看到
推荐阅读
相关新闻
- 评论
- 关注