人民網>>傳媒>>傳媒專題>>傳媒期刊秀——《視聽界》>>2013年第4期

大數據對電視產業意味著什麼?

陸地 靳戈

2013年12月13日13:50        手機看新聞

一、大數據帶來的新思維

(一)從樣本到大數據

以統計學為理論基礎的抽樣成為人們探索未知的主要方法,這實際上是以樣本取代全局數據的思路,甚至認為樣本就是研究對象的本來面目。長久的習慣使人們喪失了對大規模數據的追求,甚至對大規模數據產生了無所適從的恐懼。

“大數據”的思維強調回歸知識探索的本源,通過大規模的數據而不是樣本獲得知識。大規模的數據蘊含著樣本數據不具有的新特征。邁爾-舍恩伯格在《大數據時代》一書中舉了個例子:一幅馬的照片無論怎麼變,那還是照片,但如果每分鐘播放24張不同形態的馬的照片,就誕生了電影。這個例子的啟示在於,當我們改變事物的規模時,事物的狀態有時也會發生變化。

(二)從因果關系到相關關系

與抽樣方法相配套的是千百年來人們對因果關系的渴求。人們之所以渴望知道因與果,並不是為了附和歷史,而是期望預測未來。於是,人們建立了各種各樣的邏輯線條,把社會的發展與變化抽象為一個個公式,妄圖把每一種情況都視為自變量,在因果關系和因變量的作用下預測未來。且不說這種思維合理與否,單說推理出這樣一條條的邏輯路徑就足以使眾多先哲皓首窮經。

與2007年和2008年美國疾病預防控制中心的數據對比,谷歌對H1N1的預測與官方數據的相關度高達97%。[ ]最關鍵的是,谷歌的數據是即時的,帶有前瞻性的。這些數據對於谷歌先進的雲計算系統,隻不過是幾分鐘的運算時間。獲得這些數據的成本更是接近於零,它們原本就在硬盤裡呆著,如果不被用來分析,它們任何價值都沒有。谷歌的預測並不是建立在因果關系上的,而是建立在相關關系上的。相對於因果關系,相關關系的探索成本低、時間短,准確性卻毫不遜色。

(三)從精確分析到數據挖掘

人們對抽樣法的迷戀以及對因果關系的不懈探索,自然而然地產生了對精確分析的推崇。一直以來,研究者進行社會研究中使用抽樣法時必須保証數據的准確性,在定量研究中,還專門設計了尋找數據異常值的方法,如庫克距離。人們對“倒因為果”、“多因一果”等所謂因果聯系對立面的恐懼,使精確分析成為研究者的“護身符”。在大數據時代,因果關系已經不那麼重要,相關關系逐漸走上台前,研究相關關系的方法——數據挖掘,也應運而生。

數據挖掘(Data Mining),是通過分析大量數據來揭示有意義的新聯系、趨勢和模式的過程。[2]與一般的數據處理技術不同,數據挖掘針對的是零散的信息——非結構化信息,如網絡言論、圖片和視頻。同時,數據挖掘也繼承了傳統定量研究方法的優勢,可以通過某些值的測量還原社會人的行為。在繼承傳統的基礎上實現了對非結構化信息的處理,數據挖掘是大數據時代的必備工具。

分享到:
(責編:趙光霞、宋心蕊)



社區登錄
用戶名: 立即注冊
密  碼: 找回密碼
  
  • 最新評論
  • 熱門評論
查看全部留言

24小時排行 | 新聞頻道留言熱帖