【摘要】因為收視習慣的轉變,傳統收視率統計的方法對於在線點播用戶的觀察和監測陷入了無能為力的盲區,通過公開數據分析互聯網視頻用戶和觀眾的收視情況,可以實現對內容平台的評估、熱點趨勢的追蹤、收視人群特征的分析,借此對人群傾向和愛好做出判斷。本文通過對案例的分析,解讀視頻站點公開數據的價值。
【關鍵詞】收視人群﹔好評率﹔人群畫像﹔人群分布
隨著視頻網站和交互式網絡機頂盒的運用普及,越來越多的觀眾開始選擇“回看”而不是坐在電視機前等“直播”,“欲知后情請聽下回分解”變得難以接受,使用點播的方式獲取內容順應了人們快節奏的生活方式,大大節約了看片的時間成本。由於收視習慣的轉變,傳統收視率統計方法對於在線點播用戶的觀察和監測陷入了無能為力的盲區,通過公開數據分析互聯網視頻,更好地解讀用戶、把握用戶、提高用戶黏度、提升廣告效果,對於傳統媒體互聯網轉型過程具有一定的指導意義。本文從內容平台的價值評估、熱點內容的追蹤能力、收視人群的傾向分析、收視的特征描繪等方面,全面解讀公開數據的價值。
一、通過公開數據評估視頻內容與平台價值
傳統收視評估常常以樣本區域的收視率作為內容播出成績依據。這種方式存在兩個明顯弊端:其一,樣本數量偏小,分布范圍、人群是否科學、均衡,是否具有代表性值得商榷,或有以偏概全的嫌疑﹔其二,單個樣本對於抽樣統計結果的影響較大。以一個城市存在500個樣本戶計算,單個樣本戶對於收視率的影響就達到了0.2%,所以即使極小范圍的樣本污染也會造成播出效果統計的較大失准。而目前多數視頻網站以視頻播放次數為評判的播出情況統計方法非常具有借鑒意義,這樣的方式更加直觀且客觀地反映到單個視頻的收視情況。
(一)通過播量反映內容價值變化
以《愛情公寓》系列為例,截至今年3月26日19:00,該劇在愛奇藝頁面的播量第一季到第四季分別為4.11億次、4.89億次、6.74億次、15.36億次,數字直觀顯示出了觀眾規模從億級到十億級的增長,每季劇集熱度呈現明顯的攀升態勢,對於播出電視劇的傳統電視台亦具有參考意義。一輪劇在售賣給央視及省級衛視的同時,常常將網絡播映權同期售賣給網絡視頻平台,形成台網同步播出的局面。而購買二輪劇的城市台,可以借由播量曲線數據,分析預判電視劇的質量及收視情況。網絡播量的曲線表現可以體現觀眾的基數水平,且與電視劇在電視台播出的收視率呈現某種正向相關的關系,片源的議價能力也應該與播量曲線呈正比關系。作為季播開發的電視劇,播量曲線變化的解讀同樣可以用於評估題材后續開發前景。
從電視台角度看,播量數據的意義還在於可以進一步改進收視評估方式。如通過機頂盒記錄用戶開啟直播頻道的時間點、跨度和頻次,推算內容播量,進而推算觀眾規模﹔或通過交互電視機頂盒訪問雲媒資庫中的點播內容時間點、跨度、頻次,實現對全區域全部開機用戶的收視情況採樣。這種評估方式有別於收視率的抽樣統計,播量的統計樣本是全體,具有普遍性,橫向比較可以為內容和平台的價值評估提供依據。通過記錄開啟時間點、跨度和頻次,可以實現內容在歷史訂閱人群中的推送。
(二)通過播量反映平台價值差距
通過播量數據可以非常直觀地反映平台間播出情況的差別,這樣的比較類似於以往電視台間對於相同內容基於收視率的統計比較,只是基於播量的統計方式採樣范圍更廣,對比更加實時,評估更加客觀,能更好地反映觀眾對於不同平台的黏度。以熱播劇《大丈夫》為例,搜狐與土豆都有整劇播出專頁,截至今年3月26日,該劇第一集在搜狐播量約為2500萬次,同集在土豆網約為151萬次,觀眾規模比例大約呈現16.6:1的情形,前20集播量搜狐和土豆分別是13508萬次和1086萬次,前20集觀眾規模大約呈現12.4:1,可以比較准確地反映平台的差距和觀眾黏度。據統計,1-20集搜狐視頻單集播量500萬次左右,遠遠高於土豆網100萬次以下的單集播量。雖然這些數字未必十分精准,但不影響趨勢的判斷,無論是從平台觀眾規模,還是從觀眾黏度評價,《大丈夫》在搜狐視頻的播出效果都要好於土豆網。從網站基因看,精於正版內容價值釋放的搜狐視頻在2012年就開始投入5000萬美元購買正版電視劇,[1]經過幾年運作,其在電視劇的運營能力上遠遠超越中國互聯網視頻領域UGC先驅者土豆網。對於內容供應商而言,在貼片廣告分成模式或點播計費模式下,搜狐平台顯然更具吸引力和競爭力。
(三)通過播量反映收視群體來源
除了統計播量情況並反映平台差距,一些視頻網站如優酷網,還會統計播量來源,對於分析播量的“量”和“質”具有一定參考意義。以《大丈夫》第一集為例,根據優酷網統計,約有94.3%的播量來源於優酷平台(含優酷網頁、優酷移動平台客戶端、電視盒優酷客戶端等),僅有5.7%的播量來自於其他平台。而在優酷自身負載的播量中,約有40%來自PC端,60%來自移動設備。手機、PAD等移動互聯網設備為播量貢獻了巨大份額,移動收視、小屏播出、多屏互動、App化訂閱、碎片化收視的大趨勢越發顯現。[2]這將帶來四個方面的轉變:其一,視頻內容將越發短小精煉以更好地滿足用戶碎片化的收視習慣,小屏化傳播趨勢將加速﹔其二,各級頻道的電視網覆蓋優勢將漸漸消弱,取而代之的將是視頻App平台訂閱用戶群規模的競爭。其三,由於手機與PAD長久以來承載了相當重要的社交功能,所以未來的視頻App極有可能融合社交功能,但亦有社交App逐步融合視頻播出功能的可能性。其四,基於“雲模式”的綜合性媒資服務平台接入成本和門檻將降低,社會公眾用戶將成為主要用戶。
二、通過公開數據分析全網熱點趨勢
目前,很多視頻網站都對搜索熱點進行專門統計,包括尼爾森在內的電視收視監測機構也開始了網絡傳播效果的評估。[3]城市台顯然不具備尼爾森監測網的覆蓋優勢和技術優勢,如何通過網絡公開大數據間接獲得內容的比較,尋找熱點推動傳統電視網內容編排,是一個值得思考的命題。
以電視劇內容為例,土豆網、優酷網、搜狐視頻、愛奇藝等都對內容做了有針對性的歸類和熱度排行統計。筆者在今年3月26日14:00抓取了幾大主流視頻網站基於搜索頻次統計得到的電視劇排名情況,試圖在統計結果中根據一定規則,將8個主流視頻網站的電視劇排名做一個綜合排序。為此,筆者設計了兩個簡單的模型:
第一個模型:將單個視頻網站排名1-10的電視劇視頻給予熱度打分,按照第一名10分,第二名9分,第三名8分以此類推遞減,排名第十的視頻可以獲得1分。最終,《一仆二主》、《妻子的秘密》分獲71分和55分,位列8個視頻網站電視劇綜合得分排名前兩席,《老兵》與《我的兒子是奇葩》同獲36分並列第三。(見圖1)
第二個模型:按照各電視劇進入8個網站單站熱度前十的比例進行統計,《一仆二主》進入前十的比例為9次,折算比例為11.25%,位列第一。《妻子的秘密》與《大丈夫》進入前十的比例為8次,各佔比10%,並列第二。(見圖2)
從兩個模型看,8個視頻站點《一仆二主》與《妻子的秘密》進入各站前十的比例相對其他電視劇高出不少,且在各站點的排名趨勢相對入圍的其他電視劇更加靠前。《老兵》進入單站前十的比例要小於《大丈夫》,但其在前十排名榜單中,名次要比相同入圍前十的《大丈夫》靠前許多,所以《老兵》即使在入圍比例劣勢的情況下最終在綜合得分上可以反超《大丈夫》位列前三。此次統計,雖然各站的資源擁有量和行業地位存在相對差距,模型的建立方式是一個基於排行榜樣本的統計,並不具有絕對代表性,但樣本的數據可以被認為是基於各站大數據的排序,是在一定時間內獲得的對客觀整體趨勢的排序描述,從一定程度可以認為是對今年3月26日全網電視劇視頻熱度綜合形態的描述。
熱度榜單的統計採樣了視頻網站用戶或觀眾收視行為大數據,是一種超越了傳統樣本戶收視率統計的新數據評析方法。其數據的獲得是全網較長時期內的採樣結果,而非某一時間點的抓取統計﹔較長的時間跨度能夠防止短期、小范圍樣本感染造成的收視率污染。綜合各站點數據又可以得到比較綜合、宏觀的推論:
1.一般綜合得分排名靠前的單片,在全局入圍佔比上存在相對優勢,且單片排名在單站中存在相對優勢。一種視頻資源想要走紅全網,資源分享的廣度和單站傳播的深度是互為充分必要條件的。
2.一般來說,全局佔比不佔優勢但個別站點排名靠前的單片,或全局佔比佔有優勢但單站排名不靠前的單片,其形成全網影響力的可能性都是微乎其微的。但全局佔比和單站排名的成績互為促進關系,且對綜合結果都產生貢獻。
基於以上判斷,優質電視劇資源單一平台壟斷或是獨播,從互聯網視頻長遠發展看難以為繼,高成本和高風險毋庸贅言,壟斷造成的傳播壁壘也會影響資源在全網傳播的廣度。從市場良性發展的角度看,未來視頻資源會更加均衡地分布於整個市場:站點間互有優質產品並以此相互競爭、優勝劣汰﹔強勢產品加速平台間兼並和退出﹔寡頭時代終結迎來多足鼎立百家爭鳴。互聯網視頻平台也將形成類似各級電視台的格局和梯隊,但並不會排斥逐利合作,以分攤成本、風險。聯合投資、收益的競爭伙伴關系,將成為合力打造熱點、做大“蛋糕”的一種行之有效的方式。
三、通過公開數據統計反映收視人群好惡
以往對於收視效果,往往看重“量”的評估,對於“質”的調查存在一定盲區,收視率數字的“量化”並沒有“亮化”觀眾對於內容的評價,也就有了“雷劇”收視率奇高卻口碑極差的怪象。[4]收視率好,始於好奇心理驅使和盲從審丑,與群體審美失去必然聯系。通過收視率判斷劇目內容好壞的方式,在一些極端題材和劇情下容易出現失准。堅持影視藝術作品思想性、藝術性、觀賞性有機統一,很重要的一個考量尺度是內容深受群眾的喜愛,筆者認為收視率是其一,好評率是其二。從目前的實際操作看,視頻網站通過引入好評機制、點贊評價就能很好評估內容的優劣,反映受眾好惡。以愛奇藝為例,全部視頻都可以通過播放窗口選擇“喜歡”和“不喜歡”標簽來為電視劇打分,當參與投票人數達到一定規模后,經過統計可以比較客觀地反映觀眾對於內容的好惡程度,接近於大數據統計的整體趨勢概念。
(一)公開數據可以檢測收視人群對內容的評價
以《愛情公寓4》第1集為例,截至今年3月26日,約有493263人選擇喜歡這一集,約有69683人選擇不喜歡該集,若將選擇喜歡的人數除以投票總數,換算成好評率,那麼《愛情公寓4》第1集好評率約為87.6%。(見圖3)
從數據可以看出,《愛情公寓4》1—20集好評率經歷了高開后平穩延續、逐步低走后反彈的形態,但好評率總體保持在87%左右,說明用戶及觀眾對於劇情內容的滿意度經歷了一定的起伏但總體表示認可。
進一步解讀《愛情公寓4》1—20集好評率曲線圖,可以得到一個結論,超過87%的觀眾對《愛情公寓4》的內容表示喜歡,進一步結合愛奇藝平台15.36億次(截至今年3月26日19:00)的累計播量測算,僅此平台就有超過13億人次觀看《愛情公寓4》劇情內容獲得了比較滿意的體驗。這樣的數據分析,對於影視題材規劃具有啟示意義,巨大播量和好評率証明了內容生產的成功,也為這一品牌和題材的后續開發提供了一種趨勢指導。對播量和好評率的統計僅僅是第一步,更加細致的大數據統計工作反映出了更多實質性的內容。以愛奇藝為例,在播出窗口下方可以創建互動投票話題,觀眾可以通過參與投票來表達對於劇情走向的期望,通過相關的數據統計,制作團隊也可以總結分析哪些情節設計更加吸引觀眾。如果這樣的投票分析有足夠的提前量,就可以通過投票方式,在劇集拍攝前獲得觀眾傾向性反饋,用以指導編劇方向,推動劇情內容沿著觀眾喜愛的線路發展。
(二)公開數據可以指導影視作品創作方向
除了從投票數據分析收視人群對於劇情內容的好惡和傾向性,部分視頻網站也提供了更加精細的對於分時內容熱度的統計工具,供行業內參考。優酷視頻后台系統對於內容進行分時統計,以柱狀圖的形式展現精確到分鐘的關注情況。以《大丈夫》第一集為例,圖4 ABC三個時間點,可以看出B點的劇情內容吸引了最多用戶拖拽。可以這樣認為,這一時刻的關注集中度是客觀上最高的。根據優酷網的統計查看《大丈夫》后續劇集,其A、B、C三點收視高潮也比較平均地將整個劇情分為三個段落,基本實現每10—15分鐘出現一次關注高峰,而三次拖拽點內容分別為“訓斥下屬”、“憤怒掀桌”、“攔車大鬧”,劇情均處於劍拔弩張的沖突段落,內容與採樣點的對應,為編劇總結劇情架構和觀眾心理訴求分析提供參考。
四、通過公開數據分析描繪收視人群畫像
目前,視頻網站可以通過記錄用戶注冊ID信息或檢測COOKIE等手段,對用戶進行白描,解析用戶人群畫像。用戶注冊ID信息比較容易描述出用戶的年齡、性別、地域等信息,因為這些信息常常是用戶根據實際情況填寫注冊的,而檢測IP地址記錄和檢測瀏覽器COOKIE的方式,基於對用戶瀏覽信息和檢索信息的記錄與分析,可以分析人群畫像的其他特征。
(一)公開數據可以反映收視人群結構
以《大丈夫》為例,截至今年3月26日在土豆網的人群畫像統計中,女性觀眾佔到了總體用戶的61.1%,以將近2成比例領先廣大男性觀眾。在總體觀眾中,年齡在30-39歲的觀眾佔到了37%,居於首位,緊隨其后的是22-29歲的觀眾群,約佔總數的33%,可見,《大丈夫》的觀眾群體中70后和80后女性佔了絕大多數。在所有觀眾群體中,約有4成是公務員,約有26.7%和20%的觀眾分別為白領人群和非全職人群。在地域統計上,北上廣深的視頻用戶佔據了前四席。所以可以總結描繪出觀眾人群畫像的基本特征為:東南沿海發達地區70后、80后中青年女性觀眾為主,她們有固定工作收入,生活較為穩定。
再以熱播搞笑迷你網劇《萬萬沒想到》為例,截至今年3月26日在土豆網的人群畫像統計中,男性觀眾佔到70%,約有8成觀眾在30周歲以下,而青少年(21周歲以下)又佔到了其中的一半。接近一半的觀眾為學生群體,緊隨其后的白領階層佔到2成。在學歷統計上,約有35%的觀眾為本科學歷,而這一數據在《大丈夫》中約為20%。結合以上對比,《萬萬沒想到》觀眾人群畫像的特征可以得出:中東部地區80后、90后年輕學生群體、年輕白領男性為主,接受過或正在接受高等教育的觀眾比看《大丈夫》的更為普遍。
(二)公開數據可以為廣告篩選目標客戶
收視人群結構的統計,對於廣告主在媒體投放方向和投放量上具有參考意義,通過描繪收視人群畫像,可以最高的性價比盡可能精准地尋獲目標客戶、提升業務平台的流量、增加注冊用戶規模,以實際的、量化了的各項指標,來達成營銷效果最優化。[5]從視頻網站基於海量用戶數據得出的分析看,類奢侈品、化妝品的廣告投放,應該更加針對沿海發達地區70后、80后有固定收入和消費能力的中青年女性觀眾群體,所以選擇《大丈夫》就比《萬萬沒想到》更具針對性和優勢。而運動品牌、數碼產品、經濟實用型汽車類產品,普遍更加適合大學在讀或剛工作沒有太多經濟基礎的年輕男性觀眾,所以相關廣告投放應該更加趨向於《萬萬沒想到》這一類。
除了視頻網站提供對用戶的性別、年齡、職業、地域等非隱私信息披露,通過第三方搜索模塊如“百度指數”,也可以進一步描述特定視頻背后所對應的人群畫像特征。通過百度指數獲得的數據,很大程度上有別於視頻網站獲得的數據。因為使用視頻網站檢索的用戶或觀眾所表現出的需求,基本簡單地表現為收看關鍵詞所對應的視頻,而通過搜索引擎檢索的用戶所表現的需求,可能更加多樣化、具體化和細節化,表現為對劇中特定單集、人物、劇情、花絮、衍生產品等關聯內容的需求。通過百度指數搜索《萬萬沒想到》,不僅可以獲得用戶性別、年齡、職業、地域等信息,還可以進一步挖掘用戶愛好標簽,如用戶喜歡動漫、網絡小說、體育運動、影視周邊等,而通過關鍵詞以外的關聯檢索需求情況分析(見圖5),同時可以獲知用戶對於“報告老板”、“奇遇記”、“島國奇欲記”等關聯關鍵詞的關注表現為持續上升,對於“小兵過年”、“傳奇”、“番外篇”的關聯詞的關注熱度在逐步淡化。這些關聯熱詞的檢索結果統計若被充分利用,可為《萬萬沒想到》衍生話題探討和節目開發,提供選題方向和素材支持,而其他選題內容開發亦是異曲同工。
目前,網絡公開站點數據來源存在真實性及透明度的問題,更多的數據成果還需要長期憑借科學化的技術分析工具和方法來進一步挖掘和反復驗証。從渠道角度看,多數傳統媒體由於缺乏互聯網基因,並不具備大數據搜集的能力,也就沒有建立海量樣本分析的可能性和延伸運用價值開發的可能性,但互聯網的開放性總是能夠在某時某刻通過某種方式,悄無聲息地打開大數據的冰山一角。
(特別說明:2014年3月19日,國家新聞出版廣電總局發布《關於進一步加強網絡劇、微電影等網絡視聽節目管理的通知》,多部網絡美劇及本土網劇先后調整下架,受此影響部分網劇鏈接、頁面、統計數據遭后台清空、刪除,部分數據和案例讀者無法進入原先頁面檢驗核實。)
(作者單位:無錫廣播電視集團)
注釋:
[1]張睿.變革2012——搜狐視頻:見風使舵的一年.TechWeb. http://tech.hexun.com/2013-01-05/149776509.html.
[2]熊忠輝.向著全產業鏈進發的電視劇行業.視聽界,2013(01).
[3]戴元初.電視節目影響力的新媒體指標.視聽界,2013(03).
[4]嚴謹.精心選購精品 對抗“雷劇”“神劇”.視聽界,2013(01).
[5]呂芹.大數據:讓互聯網金融的營銷更聰明.互聯網周刊. http://www.ciweek.com/article/2014/0326/A20140326562959.shtml.