祝建華
2014第五屆中國傳媒領袖大講堂於7月5日至19日在上海交通大學舉辦。本屆大講堂邀請50多位傳媒領軍人物,一線編輯、記者、主持人和著名專家學者,為來自海內外160余所高校的350余名學子講授傳媒業改革創新的經驗與教訓,幫助學子們了解傳媒業界和學界的最新發展動態,深化對傳媒業和新聞傳播學科的認識。以下為香港城市大學媒體與傳播學系教授祝建華7月7日上午在第五屆中國傳媒領袖大講堂上的演講。
祝建華教授演講的主題為:《從大數據到數據新聞》,主要包括大數據的真實與誤解﹔數據新聞的前世與今生﹔數據新聞的善用與誤用。
關於“什麼是大數據”這個問題。祝建華引用了IBM的“4V”理論:海量(volume)、 快速(velocity)、多樣(variety)與價值(value),引申到中文含義也就是“多、快、好、省”四個字。祝建華對當前學術界存在的一些關於大數據的觀點誤區進行了辨析,為大家提供了真實的大數據信息,傳達了最前沿的大數據理念。
祝建華對當下普遍認為“數據量(即個案的記錄數)越來越大”的觀點表示認同,但關於“數據量越大越好”、“數據信息(即個案的特征)越來越豐富”的觀點,提出了質疑。他認為,數據量大是好事,但是並不是數據量越大越好,這其中存在一個邊際效益遞減的問題。
至於為什麼大數據的信息反而不豐富這個問題,祝建華說,“傳統小數據,個案不多但變量豐富﹔理想的大數據,海量個案海量變量。但是現實中的大數據,海量個案極少變量,現在社會的數據更多的是‘胖數據’。”
祝建華還提出,當下有一種觀點認為“處理大數據的技術已經成熟”,這言過其實,適用於大數據的統計分析方法還在襁褓之中。他說,“現在所用的統計分析方法是100多年前發明的,這些經典方法以小數據的正態分布為前提,對大數據並不合適。這是大數據技術尚不成熟的一個重要標志。”
針對種種觀點與誤解,祝建華總結道,“大數據是真的,但是現在我們對大數據的了解、處理能力還有待提升。”(楊倩)
下一頁 |