電影大數據國際文獻綜述

海闊 海翔宇

2018年08月13日13:58  
 

來源:《新聞愛好者》

【摘要】大數據是當前的一種熱點技術,在越來越多的科學研究領域得到應用。通過對國際前沿的電影大數據研究進行梳理,以近5年電影大數據相關的英文論文為樣本進行分析發現,大數據在電影產業得到廣泛應用。根據文獻的主題域,從票房預測、市場營銷、情感分析、推薦系統、產業經濟、文化批評和文本分析方面,總結主要研究成果,為電影研究帶來新的視野。

【關鍵詞】電影﹔大數據﹔社交媒體﹔人工智能

大數據是當前的一種熱點技術,對社會影響巨大。越來越多的科學研究領域應用大數據,甚至一些人文學科也在開拓數據研究新理路。大數據的核心是運用計算機技術,通過人們在互聯網上形成的分散的、非結構化的數據,發現傳統研究無法實現的規律。本文試圖對國際前沿的電影大數據研究進行梳理,總結研究成果,尤其是跨學科的理論,為電影研究帶來新的視野。

波德維爾(2000)以“中間層面理論”強調在“實証主義”思想指導下的電影形式關懷,提倡電影內容生產的數據思維和計算過程。以互聯網、雲計算等技術和平台為核心的大數據,為這種研究路徑提供了新的形式和方法。2013年,Netflix公司根據網絡用戶使用習慣,分析出導演、主演和劇情的交集,推出《紙牌屋》,獲得巨大成功。同年,谷歌的媒體與娛樂業首席分析師Andrea Chen與Reggie Panaligan聯合發布了《用谷歌搜索量化電影魔力》白皮書。以2012年間美國上映的近百部電影為研究對象,分析了影片上映前各時間段裡用戶對各類電影信息的搜索行為數據,揭示了電影相關搜索量與電影票房成績間存在的強相關性。國內也快速應用了大數據,但主要在票房監測和預測、營銷等方面。

本研究以2013年1月到2018年1月與電影大數據相關的英文文獻為樣本,通過對600多篇文獻進行篩選,最終選取76篇作為研究對象。根據文獻的主題域,我們劃分為票房預測、市場營銷、情感分析、推薦系統、產業經濟、文化批評和文本分析六個方面。

一、票房預測

電影產業的高風險性使企業一直在尋找能夠准確預測收益的方法。然而,由於電影受到非常復雜的社會因素影響,即使是最有經驗的電影人,也往往會無法准確把握。近年來,成本的不斷攀升,前兩周即完成主要票房收入的飽和式發行,家庭影像產品銷售的下降,以及媒介競爭的加劇,都使得電影的風險日益增強。不過,隨著人們互聯網應用的深入,通過信息技術准確預測票房的可能性不斷提高。計算機專業較早地以不同的算法和變量組合,探索票房預測的規律。

傳統票房預測研究將預算、演員、導演、制片人、故事地點、編劇、上映時間、音樂、上映地點、目標觀眾和續集等因素作為變量。而基於大數據的研究則集中在社交媒體、搜索引擎和營銷活動等方面。

人們通過社交媒體,對電影進行評論,即消費者參與行為(Consumer engagement behavior,簡稱CEB),產生大量數據。許多研究探討了CEB與票房之間的關聯性。Oh Chong等對美國電影及社交媒體活動進行分析,發現Facebook和YouTube上的CEB與票房總收入是正相關的﹔然而,在Twitter上卻沒有同樣的效果。他們認為,電影在多個渠道進行社交媒體傳播具有重要意義。﹝1﹞Huang Jianxiong等提出,專家評論和基於拉動式的用戶評論在電影上映的早期階段有影響,並且隨著時間的推移,影響會逐漸減小。相比之下,基於推送式的微博平台的評論數量對以后的票房收入有影響。他們認為,網絡意見並不總是具有說服力和有用性。﹝2﹞不過,Baek Hyunmi等似乎獲得了與上述兩個研究不同的結果。他們以羅杰斯的創新擴散理論為框架,對多個社交媒體平台進行比較,提出在電影上映的初期階段,Twitter對票房收入的影響更大,因為它具有高度的即時性和傳播性。雅虎在電影上映的后期,對電影的影響力更大,因為它具有很強的說服力。由於博客和YouTube包含了大眾媒體和人際傳播媒體的特點,在最初和后期階段對票房收入的影響沒有什麼不同。﹝3﹞Ding Chao等聚焦Facebook的點贊行為,發現在上映前一周,點“贊”數量增加1%,則上映周票房增長約0.2%。越接近上映日期,提前點“贊”的效果就會變得越強。﹝4﹞Oh Sehwan等通過對YouTube上電影預告片的分析發現,電影預告片的分享對電影的票房收入有積極的影響,在電影上映的早期階段,這一效果比在后期階段更大。﹝5﹞有些研究通過對比Android和iOS兩個系統平台上發布的Twitter文章,探討了不同平台對導演、劇情和音樂等的側重點。

有些研究將視野從單一的國內市場,擴大到國際市場。Kim Sang Ho等通過對美國電影國內和國際票房的分析,探討專家評論和網絡口碑(eWOM)與票房之間的關系。研究發現,二者對國內票房均有重要作用,而eWOM則對國際票房有影響。﹝6﹞

有些研究通過建立電影在社交媒體的情感關系模型,探討評論者情緒對票房的影響。Rui Huaxia團隊提出,Twitter上的正面評論可以促進票房增長,負面評論則阻礙票房增長。對電影銷售最強烈的影響來自於那些直接表達他們想看某部電影的推文。因為這類意圖明確的推文在電影銷售上具有雙重效果:作者自己購買行為的直接影響,以及通過替代認知效應(awareness effect)或網絡口碑對接受者的說服性間接影響。﹝7﹞而有的研究則認為,用戶的購買意向可以帶來更准確的電影票房收入預測。

電影的發行渠道及破壞市場秩序的方式對票房的影響一直受到人們的關注。Kim Eun等對韓國電影市場的研究表明,較高的票房成績與較短的播放延遲對視頻點播(VOD)市場效果具有顯著作用。票房在網絡上的重要性可以用高質量的評價、營銷或“點贊”行為等方面來解釋。﹝8﹞Kestutis Cerniauskas通過對BitTorrent網絡上電影分享的研究,探討該盜版方式對票房的影響。研究發現,在電影發布后的最初幾周,文件共享與美國票房銷售有些許正面的關系,之后沒有任何效果。也就是說,電影分享不會減少票房收入,因為分享並非電影的替代品。﹝9﹞

此外,有的研究將歷史性的結構性數據與社交媒體的非結構性數據結合,進行交叉熵的傳播分析﹔還有的研究分析維基百科與票房之間的關系。就准確率而言,通過首映周末的數據分析之后的票房收入的預測方式最穩定。

二、市場營銷

從文獻的學科分布來看,市場營銷也是電影大數據研究的一個熱點,其中跨媒體整合營銷是重要的一種路徑。Sattelberger Felix等以德國電影市場為例,分析了多平台營銷策略,提出應該盡可能多地增加吸引用戶的頁面和電影預告片。在不同用戶的不同平台之間,存在著強大的路徑依賴關系,並且在不同的平台之間的可互換性很高,這表明可以開發一種更簡化的監控社交媒體的程序,以減少工作量和成本。另外,增加預告片的覆蓋范圍、點贊的次數和評論可相應減少電影的負面評價。藝術電影應該採用更為廣泛傳播的市場策略。對於大片來說,網絡搜索過程總是先於在線用戶交流。因此,在電影上映之前很久就提供有關電影的信息,這對於增加電影被網絡搜索引擎索引的可能性是至關重要的。﹝10﹞同樣,Nanda Madhumita等通過YouTube、Facebook和Twitter的數據,探討了整合社會媒體推廣策略(integrative social media strategy)在寶萊塢電影產業中的成功作用。社交媒體宣傳策略的核心是開發合適的內容,以匹配社交媒體平台的獨特特征。Facebook的主要用途是通過組織有趣的活動來連接觀眾,Twitter則主要用來轉發來自觀眾的正面口碑。利用社交媒體平台與觀眾建立情感聯系,通過宣傳觀眾與電影主角的身份認同是有效的宣傳策略。﹝11﹞

Weisfeld-Spolter Suri等則通過網絡口碑(eWOM)營銷與同步營銷傳播(MC)兩種關系營銷的作用比較發現,並不是所有積極的口碑都比MC有更積極的影響。因為,並非所有的eWOM類型都具有相同的說服力和社區支持。來自C2C支持的社交網絡的影響力比B2C更有影響力,尤其是對多對多的eWOM通信來說。因此,SNS的贊助可能會導致信息源偏差,並影響嵌入在SNS中eWOM的說服性。﹝12﹞

有些研究重點考察電影營銷的不同階段。Chen Kun等以中國電影市場為研究對象,探討社會信息在不同產品發布階段的競爭效果。他們提出,競爭對手的社會觀點對產品的銷售很重要。搜索量緩和了社會觀點和產品銷售之間的影響。當搜索量足夠大的時候,對手負面觀點對票房的作用會相應減少。﹝13﹞Yeujun Yoon運用馬爾可夫決策過程理論(decision process theory),以美國的電影行業數據和Twitter發布的數據,分析在電影質量評價階段,如何影響人們觀看一部電影的決定。研究發現,在電影上映前為了吸引觀眾而進行大量的廣告宣傳,可能會適得其反,因為那樣提高了觀眾的期望值。﹝14﹞Gopinath Shyam等通過對美國不同區域市場的調查發現,電影首映的表現受到預先發布的博客數量和廣告的影響,而放映后的表現受到放映后博客的評級和廣告的影響。在整個市場中,廣告和博客評級(放映后)的彈性比博客數量(提前發布)的彈性更大。實際應用中,大部分電影公司的有限發行策略中,廣告和博客數量隻達到了理想數據的一半。﹝15﹞Escoffier Nadine等認為,盡管群體智慧在沒有社會影響的情況下更准確,但在社會影響的條件下,其准確性會隨著時間的推移而增加。在電影上映前的評估中,由一小群人獨立評估產生的群體效應的智慧比少數專家的評估更准確。因此,應當以群體智慧來獲得對電影質量的真實度量。在市場營銷階段,通過在線群體智慧,以形成積極的社會媒體影響。﹝16﹞

有些研究從觀眾滿意度的視角著眼。Chen Hongyu等認為社交媒體上的評論,即用戶生成內容(UGC),具有天生的不完整性,因為沒有抓住不寫評論的用戶的意見。這些沉默的用戶可能與那些說話的人有系統性的差異。他們通過Blockbuster.com用戶的電影評論調查發現,當用戶對電影不滿意時,他們發布評論的平均概率是0.06﹔而當用戶滿意時,則是0.23。因此,我們在分析UGC時如果忽視沉默的用戶,將導致效果的偏差。﹝17﹞

三、情感分析

大數據研究中,消費者的情感往往成為決定事物發展方向的重要因素。通過人工智能的算法,對電影評論的情感分析是研究的一個熱點。其中,電影評分與票房和社會影響力有著緊密聯系。

Lee Young-Jin等比較了陌生人和朋友對用戶生成影評的作用。研究發現,陌生人群評分具有“羊群效應”和差異化行為的雙重影響。用戶在評分時會受到之前電影主流評分的影響,跟隨主流,或者故意發表不同言論。相比之下,朋友的評分總是會引發“羊群效應”。﹝18﹞Flanagin Andrew等提出,評分的等級與信任、依賴、對用戶生成內容的可信性以及自己與他人的觀點一致等因素具有較強的關系。人們傾向於在信息量低的時候傾向於專家,但在信息量大的情況下傾向於用戶生成的信息。人們的觀點和行為意圖與他們所暴露的在線評級信息相一致。﹝19﹞當消費者遇到太多的正面評論時,他們可能會懷疑eWOM本身的可信度。因此,Jong HyupLee等通過對文本挖掘技術的分析,分析了評論文本情緒的熵。評論文本中的熵值對eWOM與電影票房銷售的關系有積極的緩和影響。刪除負面評論以提高產品銷量可能不會對在線零售商或相關方有所幫助。﹝20﹞

除了評分的情感分析,計算機專業研究的主流是影評語言的算法,而人文社會科學則通過情緒傾向探討其背后的社會現象。Oh Sanghee等通過多個社交媒體平台,試圖分析用戶與匿名者分享他們的個人經歷、信息和社會支持的動機。他們提出影響分享動機的10個因素有快樂、自我效能、學習、個人收獲、利他主義、移情、社會參與、社區利益、互惠和聲譽。這些因素都是基於對主要動機理論和模型的評價來確定社交媒體用戶的動機的。不同的信息內容和不同的目的,不同的社交媒體有不同的動機。﹝21﹞有的研究從女性主義視角,認為強勢女性擔任主角並不會降低科幻電影的盈利能力。

四、推薦系統

大數據為商業社會帶來了一種重要行為方式,即智能推薦系統。人們在互聯網上產生的信息記錄,使企業可以把廣告精准地送達,甚至達到引導消費的效果。熱門電影及其相關信息的推薦成為該領域的研究熱點,主流的研究方法是計算機智能算法。在線協作電影推薦試圖通過在用戶或電影中捕捉與他們歷史相似的“鄰居”,來幫助用戶訪問他們喜歡的電影。然而,由於數據稀疏,隨著電影和用戶的快速增長,“鄰居”的選擇變得越來越困難。

還有一些研究運用混合模型電影推薦系統。Dixon Prem Daniel等提出一種利用智能手機用戶瀏覽歷史的模式,進行個性化電影推薦。瀏覽歷史和電影情節摘要被用來生成一個相似的分數。電影獲得的分數被合並到一個潛在的因素模型中,該模型可以計算潛在的用戶和項目特性。這個模型在使用用戶瀏覽歷史的情況下預測用戶的評分,並最終獲取與用戶喜歡的相似的電影。﹝22﹞此外,有些研究將年齡和性別等用戶信息作為電影推薦系統的評估要素。

五、產業經濟

粉絲圈和眾籌都被認為是一個空間,被邊緣化的聲音可以對流行文化進行變革干預,並對產生它的媒體行業做出反饋。Scott Suzanne等認為,盡管粉絲資助行為有可能催生行業和文化變革的作品,且在一定程度上影響媒體產業和粉絲文化,但我們需要審視這種變革干預的局限性,檢查粉絲金融、情感和創新投資各自的活動框架。盡管粉絲性質的項目具備了在媒介文化上再造生產商和粉絲之間的道德經濟。然而,其變革能力關系到他們接受或拒絕“粉絲參與”(fan participation)這個工業概念。﹝23﹞

互聯網協議電視(IPTV)和在線視頻點播(VOD)等視頻播放渠道的發展,正在使電影發行轉變為一種同步的結構。Kaeun Song等在這些變化的市場條件下,分析了電影票房、IPTV和VOD服務的驅動因素,以確立新的發行模式。他們使用彈性理論,考慮不同的消費者風險,來解釋當面對不同程度和風險類型時,電影消費者如何在不同的電影播放渠道表現出不同的行為。他們將電影選擇的前提分為合理的(風險對沖)因素,如觀眾評價、場景熟悉度、明星效應、出品國家,以及不合理的(誘人的)因素,包括專家評級和類型。﹝24﹞

六、文化批評和文本分析

在《美國魔力2.0》一文中,Friedman Alice T.指出,魅力分層概念(the layered notion of glamour),這個20世紀中期電影、建筑和流行文化耳熟能詳的術語,與當今社交媒體的超級公共世界(hyperpublic world)、網絡形象建構和市場細分之間的關聯性與日俱增。長期以來,好萊塢形象的創造和消費,光鮮的廣告復制,對於敘事結構、投射、表現和自我評估具有長期侵入的過程。這與我們的定制化Instagram信息流、“Facebook嫉妒”(Facebook envy)和其他形式的數字傳播、接收和監視等文化方式有著重要的相似之處。越來越多的當代公共空間被塑造成一個用於生產和消費這些數據的平台﹔隨之而來的是監視技術的發展和建立可防御的私人空間都給物理和網絡環境的設計者帶來了新的挑戰。﹝25﹞此外,有研究者採用機器學習技術分析電影腳本的敘事流和敘事結構,從而探討敘事模式。

七、結論

從近年來的研究成果來看,大數據在電影產業得到廣泛應用。我們應當借鑒這些觀點,為電影研究提供新的視野和路徑。

(1)社交媒體是電影大數據研究的核心。Twitter、Facebook、YouTube、博客和微博等平台是主要數據來源。用戶在社交媒體的CEB和UGC等行為,為票房預測、市場營銷、情感分析和智能推薦等研究提供了巨大的數據支持,使電影產業的預測和營銷獲得了更為有效的工具。不過,基於Google或百度等搜索引擎平台的研究較少。雖然中國研究者貢獻了近20%的文獻。但是,對中國社交媒體的針對性研究,除微博外,其他主流平台較少涉及。

(2)雅虎電影社區、Blockbuster.com等專業電影平台也成為數據的重要來源。由於電影經濟的特殊性和復雜性,跨平台數據的混合研究,能夠在數據和效果上,提供更好的解決方案。

(3)從研究地域來看,出現了跨國市場研究。全球性的互聯網平台為此提供了便利。近年來,中國電影市場是全球最活躍的市場,而且擁有發達的互聯網媒體和數據平台。對於中國電影市場及其與其他國家的跨國研究,是一個非常有潛力的領域。

(4)從學科分布來看,計算機專業是電影大數據研究的主要領域。人文社會科學與計算機等跨學科結合,成為研究的一個新動向。越來越多的基於大數據的跨學科研究機構產生。一些利用大數據的文化和文本研究呈現出新的活力。

(5)從方法論來看,多變量融合是解決復雜電影問題的一種有效途徑。而將大數據研究納入經典理論框架之中,也是一種常見模式。

(6)與電視和互聯網結合的跨媒體研究,目前主要集中在IPTV和VOD等與電影發行相關的研究上。對於電影在視頻網站的長期性研究,以及消費產品授權的研究較少。隨著人工智能技術的發展,大數據研究將在這些方面提供更多的突破。

(7)雖然是大數據研究,但是,當前的研究樣本很多沒有與主流商業數據有效對接,數據量比較小。隻有實現即時數據的分析,電影大數據研究才會有更好的結果。

﹝本文為國家社科基金重大項目“當代中國文化國際影響力的生成研究”(項目編號:16ZDA219)﹔上海市新聞傳播高原學科課題成果﹞

參考文獻:

﹝1﹞Oh Chong,etc.Beyond likes and tweets:Consumer engagement behavior and movie box office in social media.Information & Management. 2017,54(1):25-37.

﹝2﹞Huang Jianxiong,etc.A Temporal Study of the Effects of Online Opinions:Information Sources Matter.Journal of Management Information Systems.2017,34(4):1169-1202.

﹝3﹞Baek Hyunmi,etc.Electronic word-of-mouth,box office revenue and social media.Electronic Commerce Research & Applications.2017(22)13-23.

﹝4﹞Ding Chao,etc.The Power of The“like”Button:The Impact of Social Media on Box Office.Decision Support Systems.2017,94:77-84.

﹝5﹞Oh Sehwan,etc.Predictive value of video-sharing behavior:sharing of movie trailers and box-office revenue.Internet Research.2017,27(3):691-708.

﹝6﹞Kim Sang Ho,etc.Exploring the Effects of Online Word of Mouth and Expert Reviews on Theatrical Movies' Box Office Success.Journal of Media Economics.2013,26(2):98-114.

﹝7﹞Rui Huaxia,etc.Whose and what chatter matters?The effect of tweets on movie sales.Decision Support Systems.2013,55(4):863-870.

﹝8﹞Kim Eun,etc.Online movie success in sequential markets.Telematics and Informatics.2017,34(7):987-995.

﹝9﹞Kestutis Cerniauskas,etc.The effect of film sharing on P2P networks on box office sales.Blekinge Institute of Technology,2017.

﹝10﹞Sattelberger Felix.Optimising Media Marketing Strategies in a Multi-platform World:an Inter-relational Approach to Pre-release Social Media Communication and Online Searching.Journal of Media Business Studies.2015,12(1):66-88.

﹝11﹞Nanda Madhumita,etc.Innovation in social media strategy for movie success.Management Decision.2018,56(1):233-251.

﹝12﹞Weisfeld-Spolter Suri,etc.An Integrative Approach to eWOM and Marketing Communications.Corporate Communications:An International Journal.2014,19(3):260-274.

﹝13﹞Chen Kun,etc.Information Competition in Product Launch: Evidence from the Movie industry.Electronic Commerce Research & Applications.2017(26)81-88.

﹝14﹞Yeujun Yoon,etc.The Impact of Word of Mouth via Twitter On Moviegoers' Decisions and Film Revenues:Revisiting Prospect Theory.Journal of Advertising Research.2017,57(2):144-158.

﹝15﹞Gopinath Shyam,etc.Blogs,Advertising,and Local-Market Movie Box Office Performance.Management Science.2013,59(12):2635-2654.

﹝16﹞Escoffier Nadine,etc.The Wisdom of Crowds in the Movie Industry:Towards New Solutions to Reduce Uncertainties.International Journal of Arts Management.2015,17(2):52-63.

﹝17﹞Chen Hongyu,etc.De-Biasing the Reporting Bias in Social Media Analytics.Production & Operations Management.2016,25(5):849-865.

﹝18﹞Lee Young-Jin,etc.Do I Follow My Friends or The Crowd?Information Cascades in Online Movie Ratings.Management Science.2015,61(9):2241-2258.

﹝19﹞Flanagin Andrew,etc.Trusting Expert- versus User-generated Ratings Online.Computers in Human Behavior.2013,29(4):1626-1634.

﹝20﹞Jong HyupLee,etc.The role of entropy of review text sentiments on online WOM and movie box office sales.Electronic Commerce Research and Applications.2017(22)42-52.

﹝21﹞Oh Sanghee,etc.Motivations for sharing information and social support in social media.Journal of the Association for Information Science & Technology.2015,66(10):2045-2060.

﹝22﹞Dixon Prem Daniel R,etc.A latent factor model based movie recommender using smartphone browsing history.International Conference on Research and Innovation in Information Systems.July,2017:1-6.

﹝23﹞Scott Suzanne,etc.The moral economy of crowdfunding and the transformative capacity of fan-ancing.New Media & Society.2015,17(2):167-182.

﹝24﹞Kaeun Song,etc.Dissecting movie performance across multiple distribution channels:An elastic justification theory perspective.Telematics and Informatics. 2018,35(1):159-167.

﹝25﹞Friedman Alice T.American Glamour 2.0:architecture,spectacle,and social media.Consumption,Markets & Culture.Dec2017,Vol. 20 Issue 6,p575-584.

(海闊為上海大學新聞傳播學院副教授﹔海翔宇為上海大學新聞傳播學院碩士生)

(責編:趙光霞、宋心蕊)

推薦閱讀

人民日報創刊70周年
  70年,25541期,25541個日夜,人民日報與黨和人民風雨兼程、一路相伴,一同走過革命、建設和改革的崢嶸歲月,一起走進更加昂揚的新時代。
【詳細】人民日報創刊70周年   70年,25541期,25541個日夜,人民日報與黨和人民風雨兼程、一路相伴,一同走過革命、建設和改革的崢嶸歲月,一起走進更加昂揚的新時代。 【詳細】

2018(第三屆)全國黨報網站高峰論壇
  2018(第三屆)全國黨報網站高峰論壇暨全國黨報網站總編輯看天津活動6月20日在天津市舉行,主題為“媒體融合:宣傳新時代 擁抱新時代”。
【詳細】2018(第三屆)全國黨報網站高峰論壇   2018(第三屆)全國黨報網站高峰論壇暨全國黨報網站總編輯看天津活動6月20日在天津市舉行,主題為“媒體融合:宣傳新時代 擁抱新時代”。 【詳細】