人民网
人民网>>传媒>>传媒期刊秀:《新闻爱好者》>>2018年第5期

电影大数据国际文献综述

海阔 海翔宇
2018年08月13日13:58 |
小字号

来源:《新闻爱好者》

【摘要】大数据是当前的一种热点技术,在越来越多的科学研究领域得到应用。通过对国际前沿的电影大数据研究进行梳理,以近5年电影大数据相关的英文论文为样本进行分析发现,大数据在电影产业得到广泛应用。根据文献的主题域,从票房预测、市场营销、情感分析、推荐系统、产业经济、文化批评和文本分析方面,总结主要研究成果,为电影研究带来新的视野。

【关键词】电影;大数据;社交媒体;人工智能

大数据是当前的一种热点技术,对社会影响巨大。越来越多的科学研究领域应用大数据,甚至一些人文学科也在开拓数据研究新理路。大数据的核心是运用计算机技术,通过人们在互联网上形成的分散的、非结构化的数据,发现传统研究无法实现的规律。本文试图对国际前沿的电影大数据研究进行梳理,总结研究成果,尤其是跨学科的理论,为电影研究带来新的视野。

波德维尔(2000)以“中间层面理论”强调在“实证主义”思想指导下的电影形式关怀,提倡电影内容生产的数据思维和计算过程。以互联网、云计算等技术和平台为核心的大数据,为这种研究路径提供了新的形式和方法。2013年,Netflix公司根据网络用户使用习惯,分析出导演、主演和剧情的交集,推出《纸牌屋》,获得巨大成功。同年,谷歌的媒体与娱乐业首席分析师Andrea Chen与Reggie Panaligan联合发布了《用谷歌搜索量化电影魔力》白皮书。以2012年间美国上映的近百部电影为研究对象,分析了影片上映前各时间段里用户对各类电影信息的搜索行为数据,揭示了电影相关搜索量与电影票房成绩间存在的强相关性。国内也快速应用了大数据,但主要在票房监测和预测、营销等方面。

本研究以2013年1月到2018年1月与电影大数据相关的英文文献为样本,通过对600多篇文献进行筛选,最终选取76篇作为研究对象。根据文献的主题域,我们划分为票房预测、市场营销、情感分析、推荐系统、产业经济、文化批评和文本分析六个方面。

一、票房预测

电影产业的高风险性使企业一直在寻找能够准确预测收益的方法。然而,由于电影受到非常复杂的社会因素影响,即使是最有经验的电影人,也往往会无法准确把握。近年来,成本的不断攀升,前两周即完成主要票房收入的饱和式发行,家庭影像产品销售的下降,以及媒介竞争的加剧,都使得电影的风险日益增强。不过,随着人们互联网应用的深入,通过信息技术准确预测票房的可能性不断提高。计算机专业较早地以不同的算法和变量组合,探索票房预测的规律。

传统票房预测研究将预算、演员、导演、制片人、故事地点、编剧、上映时间、音乐、上映地点、目标观众和续集等因素作为变量。而基于大数据的研究则集中在社交媒体、搜索引擎和营销活动等方面。

人们通过社交媒体,对电影进行评论,即消费者参与行为(Consumer engagement behavior,简称CEB),产生大量数据。许多研究探讨了CEB与票房之间的关联性。Oh Chong等对美国电影及社交媒体活动进行分析,发现Facebook和YouTube上的CEB与票房总收入是正相关的;然而,在Twitter上却没有同样的效果。他们认为,电影在多个渠道进行社交媒体传播具有重要意义。[1]Huang Jianxiong等提出,专家评论和基于拉动式的用户评论在电影上映的早期阶段有影响,并且随着时间的推移,影响会逐渐减小。相比之下,基于推送式的微博平台的评论数量对以后的票房收入有影响。他们认为,网络意见并不总是具有说服力和有用性。[2]不过,Baek Hyunmi等似乎获得了与上述两个研究不同的结果。他们以罗杰斯的创新扩散理论为框架,对多个社交媒体平台进行比较,提出在电影上映的初期阶段,Twitter对票房收入的影响更大,因为它具有高度的即时性和传播性。雅虎在电影上映的后期,对电影的影响力更大,因为它具有很强的说服力。由于博客和YouTube包含了大众媒体和人际传播媒体的特点,在最初和后期阶段对票房收入的影响没有什么不同。[3]Ding Chao等聚焦Facebook的点赞行为,发现在上映前一周,点“赞”数量增加1%,则上映周票房增长约0.2%。越接近上映日期,提前点“赞”的效果就会变得越强。[4]Oh Sehwan等通过对YouTube上电影预告片的分析发现,电影预告片的分享对电影的票房收入有积极的影响,在电影上映的早期阶段,这一效果比在后期阶段更大。[5]有些研究通过对比Android和iOS两个系统平台上发布的Twitter文章,探讨了不同平台对导演、剧情和音乐等的侧重点。

有些研究将视野从单一的国内市场,扩大到国际市场。Kim Sang Ho等通过对美国电影国内和国际票房的分析,探讨专家评论和网络口碑(eWOM)与票房之间的关系。研究发现,二者对国内票房均有重要作用,而eWOM则对国际票房有影响。[6]

有些研究通过建立电影在社交媒体的情感关系模型,探讨评论者情绪对票房的影响。Rui Huaxia团队提出,Twitter上的正面评论可以促进票房增长,负面评论则阻碍票房增长。对电影销售最强烈的影响来自于那些直接表达他们想看某部电影的推文。因为这类意图明确的推文在电影销售上具有双重效果:作者自己购买行为的直接影响,以及通过替代认知效应(awareness effect)或网络口碑对接受者的说服性间接影响。[7]而有的研究则认为,用户的购买意向可以带来更准确的电影票房收入预测。

电影的发行渠道及破坏市场秩序的方式对票房的影响一直受到人们的关注。Kim Eun等对韩国电影市场的研究表明,较高的票房成绩与较短的播放延迟对视频点播(VOD)市场效果具有显著作用。票房在网络上的重要性可以用高质量的评价、营销或“点赞”行为等方面来解释。[8]Kestutis Cerniauskas通过对BitTorrent网络上电影分享的研究,探讨该盗版方式对票房的影响。研究发现,在电影发布后的最初几周,文件共享与美国票房销售有些许正面的关系,之后没有任何效果。也就是说,电影分享不会减少票房收入,因为分享并非电影的替代品。[9]

此外,有的研究将历史性的结构性数据与社交媒体的非结构性数据结合,进行交叉熵的传播分析;还有的研究分析维基百科与票房之间的关系。就准确率而言,通过首映周末的数据分析之后的票房收入的预测方式最稳定。

二、市场营销

从文献的学科分布来看,市场营销也是电影大数据研究的一个热点,其中跨媒体整合营销是重要的一种路径。Sattelberger Felix等以德国电影市场为例,分析了多平台营销策略,提出应该尽可能多地增加吸引用户的页面和电影预告片。在不同用户的不同平台之间,存在着强大的路径依赖关系,并且在不同的平台之间的可互换性很高,这表明可以开发一种更简化的监控社交媒体的程序,以减少工作量和成本。另外,增加预告片的覆盖范围、点赞的次数和评论可相应减少电影的负面评价。艺术电影应该采用更为广泛传播的市场策略。对于大片来说,网络搜索过程总是先于在线用户交流。因此,在电影上映之前很久就提供有关电影的信息,这对于增加电影被网络搜索引擎索引的可能性是至关重要的。[10]同样,Nanda Madhumita等通过YouTube、Facebook和Twitter的数据,探讨了整合社会媒体推广策略(integrative social media strategy)在宝莱坞电影产业中的成功作用。社交媒体宣传策略的核心是开发合适的内容,以匹配社交媒体平台的独特特征。Facebook的主要用途是通过组织有趣的活动来连接观众,Twitter则主要用来转发来自观众的正面口碑。利用社交媒体平台与观众建立情感联系,通过宣传观众与电影主角的身份认同是有效的宣传策略。[11]

Weisfeld-Spolter Suri等则通过网络口碑(eWOM)营销与同步营销传播(MC)两种关系营销的作用比较发现,并不是所有积极的口碑都比MC有更积极的影响。因为,并非所有的eWOM类型都具有相同的说服力和社区支持。来自C2C支持的社交网络的影响力比B2C更有影响力,尤其是对多对多的eWOM通信来说。因此,SNS的赞助可能会导致信息源偏差,并影响嵌入在SNS中eWOM的说服性。[12]

有些研究重点考察电影营销的不同阶段。Chen Kun等以中国电影市场为研究对象,探讨社会信息在不同产品发布阶段的竞争效果。他们提出,竞争对手的社会观点对产品的销售很重要。搜索量缓和了社会观点和产品销售之间的影响。当搜索量足够大的时候,对手负面观点对票房的作用会相应减少。[13]Yeujun Yoon运用马尔可夫决策过程理论(decision process theory),以美国的电影行业数据和Twitter发布的数据,分析在电影质量评价阶段,如何影响人们观看一部电影的决定。研究发现,在电影上映前为了吸引观众而进行大量的广告宣传,可能会适得其反,因为那样提高了观众的期望值。[14]Gopinath Shyam等通过对美国不同区域市场的调查发现,电影首映的表现受到预先发布的博客数量和广告的影响,而放映后的表现受到放映后博客的评级和广告的影响。在整个市场中,广告和博客评级(放映后)的弹性比博客数量(提前发布)的弹性更大。实际应用中,大部分电影公司的有限发行策略中,广告和博客数量只达到了理想数据的一半。[15]Escoffier Nadine等认为,尽管群体智慧在没有社会影响的情况下更准确,但在社会影响的条件下,其准确性会随着时间的推移而增加。在电影上映前的评估中,由一小群人独立评估产生的群体效应的智慧比少数专家的评估更准确。因此,应当以群体智慧来获得对电影质量的真实度量。在市场营销阶段,通过在线群体智慧,以形成积极的社会媒体影响。[16]

有些研究从观众满意度的视角着眼。Chen Hongyu等认为社交媒体上的评论,即用户生成内容(UGC),具有天生的不完整性,因为没有抓住不写评论的用户的意见。这些沉默的用户可能与那些说话的人有系统性的差异。他们通过Blockbuster.com用户的电影评论调查发现,当用户对电影不满意时,他们发布评论的平均概率是0.06;而当用户满意时,则是0.23。因此,我们在分析UGC时如果忽视沉默的用户,将导致效果的偏差。[17]

三、情感分析

大数据研究中,消费者的情感往往成为决定事物发展方向的重要因素。通过人工智能的算法,对电影评论的情感分析是研究的一个热点。其中,电影评分与票房和社会影响力有着紧密联系。

Lee Young-Jin等比较了陌生人和朋友对用户生成影评的作用。研究发现,陌生人群评分具有“羊群效应”和差异化行为的双重影响。用户在评分时会受到之前电影主流评分的影响,跟随主流,或者故意发表不同言论。相比之下,朋友的评分总是会引发“羊群效应”。[18]Flanagin Andrew等提出,评分的等级与信任、依赖、对用户生成内容的可信性以及自己与他人的观点一致等因素具有较强的关系。人们倾向于在信息量低的时候倾向于专家,但在信息量大的情况下倾向于用户生成的信息。人们的观点和行为意图与他们所暴露的在线评级信息相一致。[19]当消费者遇到太多的正面评论时,他们可能会怀疑eWOM本身的可信度。因此,Jong HyupLee等通过对文本挖掘技术的分析,分析了评论文本情绪的熵。评论文本中的熵值对eWOM与电影票房销售的关系有积极的缓和影响。删除负面评论以提高产品销量可能不会对在线零售商或相关方有所帮助。[20]

除了评分的情感分析,计算机专业研究的主流是影评语言的算法,而人文社会科学则通过情绪倾向探讨其背后的社会现象。Oh Sanghee等通过多个社交媒体平台,试图分析用户与匿名者分享他们的个人经历、信息和社会支持的动机。他们提出影响分享动机的10个因素有快乐、自我效能、学习、个人收获、利他主义、移情、社会参与、社区利益、互惠和声誉。这些因素都是基于对主要动机理论和模型的评价来确定社交媒体用户的动机的。不同的信息内容和不同的目的,不同的社交媒体有不同的动机。[21]有的研究从女性主义视角,认为强势女性担任主角并不会降低科幻电影的盈利能力。

四、推荐系统

大数据为商业社会带来了一种重要行为方式,即智能推荐系统。人们在互联网上产生的信息记录,使企业可以把广告精准地送达,甚至达到引导消费的效果。热门电影及其相关信息的推荐成为该领域的研究热点,主流的研究方法是计算机智能算法。在线协作电影推荐试图通过在用户或电影中捕捉与他们历史相似的“邻居”,来帮助用户访问他们喜欢的电影。然而,由于数据稀疏,随着电影和用户的快速增长,“邻居”的选择变得越来越困难。

还有一些研究运用混合模型电影推荐系统。Dixon Prem Daniel等提出一种利用智能手机用户浏览历史的模式,进行个性化电影推荐。浏览历史和电影情节摘要被用来生成一个相似的分数。电影获得的分数被合并到一个潜在的因素模型中,该模型可以计算潜在的用户和项目特性。这个模型在使用用户浏览历史的情况下预测用户的评分,并最终获取与用户喜欢的相似的电影。[22]此外,有些研究将年龄和性别等用户信息作为电影推荐系统的评估要素。

五、产业经济

粉丝圈和众筹都被认为是一个空间,被边缘化的声音可以对流行文化进行变革干预,并对产生它的媒体行业做出反馈。Scott Suzanne等认为,尽管粉丝资助行为有可能催生行业和文化变革的作品,且在一定程度上影响媒体产业和粉丝文化,但我们需要审视这种变革干预的局限性,检查粉丝金融、情感和创新投资各自的活动框架。尽管粉丝性质的项目具备了在媒介文化上再造生产商和粉丝之间的道德经济。然而,其变革能力关系到他们接受或拒绝“粉丝参与”(fan participation)这个工业概念。[23]

互联网协议电视(IPTV)和在线视频点播(VOD)等视频播放渠道的发展,正在使电影发行转变为一种同步的结构。Kaeun Song等在这些变化的市场条件下,分析了电影票房、IPTV和VOD服务的驱动因素,以确立新的发行模式。他们使用弹性理论,考虑不同的消费者风险,来解释当面对不同程度和风险类型时,电影消费者如何在不同的电影播放渠道表现出不同的行为。他们将电影选择的前提分为合理的(风险对冲)因素,如观众评价、场景熟悉度、明星效应、出品国家,以及不合理的(诱人的)因素,包括专家评级和类型。[24]

六、文化批评和文本分析

在《美国魔力2.0》一文中,Friedman Alice T.指出,魅力分层概念(the layered notion of glamour),这个20世纪中期电影、建筑和流行文化耳熟能详的术语,与当今社交媒体的超级公共世界(hyperpublic world)、网络形象建构和市场细分之间的关联性与日俱增。长期以来,好莱坞形象的创造和消费,光鲜的广告复制,对于叙事结构、投射、表现和自我评估具有长期侵入的过程。这与我们的定制化Instagram信息流、“Facebook嫉妒”(Facebook envy)和其他形式的数字传播、接收和监视等文化方式有着重要的相似之处。越来越多的当代公共空间被塑造成一个用于生产和消费这些数据的平台;随之而来的是监视技术的发展和建立可防御的私人空间都给物理和网络环境的设计者带来了新的挑战。[25]此外,有研究者采用机器学习技术分析电影脚本的叙事流和叙事结构,从而探讨叙事模式。

七、结论

从近年来的研究成果来看,大数据在电影产业得到广泛应用。我们应当借鉴这些观点,为电影研究提供新的视野和路径。

(1)社交媒体是电影大数据研究的核心。Twitter、Facebook、YouTube、博客和微博等平台是主要数据来源。用户在社交媒体的CEB和UGC等行为,为票房预测、市场营销、情感分析和智能推荐等研究提供了巨大的数据支持,使电影产业的预测和营销获得了更为有效的工具。不过,基于Google或百度等搜索引擎平台的研究较少。虽然中国研究者贡献了近20%的文献。但是,对中国社交媒体的针对性研究,除微博外,其他主流平台较少涉及。

(2)雅虎电影社区、Blockbuster.com等专业电影平台也成为数据的重要来源。由于电影经济的特殊性和复杂性,跨平台数据的混合研究,能够在数据和效果上,提供更好的解决方案。

(3)从研究地域来看,出现了跨国市场研究。全球性的互联网平台为此提供了便利。近年来,中国电影市场是全球最活跃的市场,而且拥有发达的互联网媒体和数据平台。对于中国电影市场及其与其他国家的跨国研究,是一个非常有潜力的领域。

(4)从学科分布来看,计算机专业是电影大数据研究的主要领域。人文社会科学与计算机等跨学科结合,成为研究的一个新动向。越来越多的基于大数据的跨学科研究机构产生。一些利用大数据的文化和文本研究呈现出新的活力。

(5)从方法论来看,多变量融合是解决复杂电影问题的一种有效途径。而将大数据研究纳入经典理论框架之中,也是一种常见模式。

(6)与电视和互联网结合的跨媒体研究,目前主要集中在IPTV和VOD等与电影发行相关的研究上。对于电影在视频网站的长期性研究,以及消费产品授权的研究较少。随着人工智能技术的发展,大数据研究将在这些方面提供更多的突破。

(7)虽然是大数据研究,但是,当前的研究样本很多没有与主流商业数据有效对接,数据量比较小。只有实现即时数据的分析,电影大数据研究才会有更好的结果。

[本文为国家社科基金重大项目“当代中国文化国际影响力的生成研究”(项目编号:16ZDA219);上海市新闻传播高原学科课题成果]

参考文献:

[1]Oh Chong,etc.Beyond likes and tweets:Consumer engagement behavior and movie box office in social media.Information & Management. 2017,54(1):25-37.

[2]Huang Jianxiong,etc.A Temporal Study of the Effects of Online Opinions:Information Sources Matter.Journal of Management Information Systems.2017,34(4):1169-1202.

[3]Baek Hyunmi,etc.Electronic word-of-mouth,box office revenue and social media.Electronic Commerce Research & Applications.2017(22)13-23.

[4]Ding Chao,etc.The Power of The“like”Button:The Impact of Social Media on Box Office.Decision Support Systems.2017,94:77-84.

[5]Oh Sehwan,etc.Predictive value of video-sharing behavior:sharing of movie trailers and box-office revenue.Internet Research.2017,27(3):691-708.

[6]Kim Sang Ho,etc.Exploring the Effects of Online Word of Mouth and Expert Reviews on Theatrical Movies' Box Office Success.Journal of Media Economics.2013,26(2):98-114.

[7]Rui Huaxia,etc.Whose and what chatter matters?The effect of tweets on movie sales.Decision Support Systems.2013,55(4):863-870.

[8]Kim Eun,etc.Online movie success in sequential markets.Telematics and Informatics.2017,34(7):987-995.

[9]Kestutis Cerniauskas,etc.The effect of film sharing on P2P networks on box office sales.Blekinge Institute of Technology,2017.

[10]Sattelberger Felix.Optimising Media Marketing Strategies in a Multi-platform World:an Inter-relational Approach to Pre-release Social Media Communication and Online Searching.Journal of Media Business Studies.2015,12(1):66-88.

[11]Nanda Madhumita,etc.Innovation in social media strategy for movie success.Management Decision.2018,56(1):233-251.

[12]Weisfeld-Spolter Suri,etc.An Integrative Approach to eWOM and Marketing Communications.Corporate Communications:An International Journal.2014,19(3):260-274.

[13]Chen Kun,etc.Information Competition in Product Launch: Evidence from the Movie industry.Electronic Commerce Research & Applications.2017(26)81-88.

[14]Yeujun Yoon,etc.The Impact of Word of Mouth via Twitter On Moviegoers' Decisions and Film Revenues:Revisiting Prospect Theory.Journal of Advertising Research.2017,57(2):144-158.

[15]Gopinath Shyam,etc.Blogs,Advertising,and Local-Market Movie Box Office Performance.Management Science.2013,59(12):2635-2654.

[16]Escoffier Nadine,etc.The Wisdom of Crowds in the Movie Industry:Towards New Solutions to Reduce Uncertainties.International Journal of Arts Management.2015,17(2):52-63.

[17]Chen Hongyu,etc.De-Biasing the Reporting Bias in Social Media Analytics.Production & Operations Management.2016,25(5):849-865.

[18]Lee Young-Jin,etc.Do I Follow My Friends or The Crowd?Information Cascades in Online Movie Ratings.Management Science.2015,61(9):2241-2258.

[19]Flanagin Andrew,etc.Trusting Expert- versus User-generated Ratings Online.Computers in Human Behavior.2013,29(4):1626-1634.

[20]Jong HyupLee,etc.The role of entropy of review text sentiments on online WOM and movie box office sales.Electronic Commerce Research and Applications.2017(22)42-52.

[21]Oh Sanghee,etc.Motivations for sharing information and social support in social media.Journal of the Association for Information Science & Technology.2015,66(10):2045-2060.

[22]Dixon Prem Daniel R,etc.A latent factor model based movie recommender using smartphone browsing history.International Conference on Research and Innovation in Information Systems.July,2017:1-6.

[23]Scott Suzanne,etc.The moral economy of crowdfunding and the transformative capacity of fan-ancing.New Media & Society.2015,17(2):167-182.

[24]Kaeun Song,etc.Dissecting movie performance across multiple distribution channels:An elastic justification theory perspective.Telematics and Informatics. 2018,35(1):159-167.

[25]Friedman Alice T.American Glamour 2.0:architecture,spectacle,and social media.Consumption,Markets & Culture.Dec2017,Vol. 20 Issue 6,p575-584.

(海阔为上海大学新闻传播学院副教授;海翔宇为上海大学新闻传播学院硕士生)

(责编:赵光霞、宋心蕊)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部