淺談大數據在出版業的應用

李曉明

2016年09月29日09:43  來源:今傳媒
 

摘 要:隨著當今世界互聯網、移動互聯網技術的高速發展,大數據也逐漸被諸多行業所應用。中國新聞出版研究院2013年發布的《2012∼2013中國數字出版產業年度報告》中認為,大數據分析與挖掘將走進數字出版,是未來出版行業的發展趨勢。對於出版行業來講,這既是挑戰更是難得的機遇。本文將著重分析大數據對出版業的作用及大數據在出版界的應用前景。

關鍵詞:大數據﹔互聯網﹔出版業

中圖分類號:G230 文獻標識碼:A 文章編號:1672-8122(2016)09-0171-02

一、大數據的定義與特點

近幾年來,“大數據”一詞廣泛見諸於網絡、報紙以及電視等媒體,大數據的概念正在持續升溫,而2014年“大數據”首次被寫入我國《政府工作報告》,2015年9月,國務院印發《促進大數據發展行動綱要》,全面系統地部署了大數據未來的發展工作。值得一提的是,國務院總理李克強自2014年以來曾在各個場合多次提及“大數據”一詞,在他看來,大數據對各行各業都有很大的幫助,其價值和意義正在日益體現。

那麼,究竟什麼是大數據呢?大數據的定義實在太多,研究機構Gartner Group認為,大數據是需要特殊技術及新處理模式的信息資產。而麥肯錫全球研究所則認為,大數據是一種規模大到超出傳統數據庫工具能力范圍的數據集[1]。

作為全球最大的電子商務公司,亞馬遜的大數據科學家John Rauser 對大數據的定義則相對簡單,他認為,任何超過一台計算機處理能力的數據量即為大數據[2]。

以上幾個定義都是關於大數據的解釋,它們有不同之處也有相同之處,相同之處是突出了一個“大”字,這是大數據的重要特點之一。也正是因為數據量的巨大,使得它具有了一項重要功用,即在應用過程中能夠發現一定的規律和進行相應的預測研判。

由於這種功用,不少專家認為大數據將會成為推動社會經濟轉型發展的新動力,會促進生產模式的創新,對未來信息社會的格局產生深遠的影響,而大數據與其所進行的分析預測,會在未來10年內改變許多行業的固有模式。甚至有觀點認為,大數據作為重要的信息戰略資源,將有效提升國家的綜合競爭力。

聽起來,大數據的出現和應用將是顛覆性的,那麼為何它被認為在未來能改變幾乎所有行業呢?這正是源於大數據的幾大顯著特點。目前業界廣泛認可的,是大數據具有“4V”特征,首先是數量(Volume),也就是前文所提到的數據信息量巨大。第二是它的多樣性(Variety),也就是數據的類型很多,除了傳統的格式化數據之外,還包括文字、視頻、圖片等信息資料。第三是處理速度(Velocity)很快,也就是說雖然數據信息量巨大,但應用處理數據的速度並不因此而變慢。最后就是真實性(Veracity),即數據的准確程度和高質量。

二、大數據對出版業的作用

麥肯錫全球研究所的報告中認為,數據成為了重要的生產要素,慢慢滲透到各個行業中,大數據正在人類生活中被廣泛應用和延伸,而當今社會也正在從數字化向數據化轉變。

近年來,隨著互聯網的日益發展,作為傳統行業的出版業,受到了不小的沖擊。對於出版業而言,互聯網一方面是挑戰,另一方面也帶來了許多機遇,因而,轉型與發展是當今時代出版業的一項重要任務。但實際上,許多喊著轉型口號的出版商,只是被動的或者說是“稀裡糊涂”在轉型,他們甚至不知道、也無法預知轉型的結果。一個有趣的現象是,“互聯網+”“雲計算”這些互聯網詞匯屢屢會被傳統出版業提及,但很多時候他們並不知道具體的含義,只是盲目地追新。於是,當大數據時代即將到來之際,不少傳統出版業也不免顯得迷茫,或者說不知該如何應對。

(一)出版業運用大數據的方法

其實,從大數據的特征來看,它可以被視為互聯網時代給所有行業的一項恩賜,因為其解決了許多過去無法解決的問題,能讓復雜事物簡單化、清晰化。所以,首先不用懼怕或者抵觸這一新興事物。當然,這也並不意味著誰都能輕鬆地享受這一恩惠。一個重要的前提是,大數據平台的建立和使用是建立在前期數字化建設的基礎上,因此,出版社的當務之急是先完善自身的數字化信息基礎設施的建設,為大數據提供可靠支撐和信息來源。

對於出版業來說,如何利用好大數據?在這個行業裡,又有哪些是有價值的數據信息、哪些方面需要大數據分析研判?實際上,從選題策劃到出版發行,出版業的每一個環節都離不開大數據。例如,一個題材的書籍是否有必要發行,不應該是過去那種“經驗式”的決策方式,而應該是在一定數據統計下,經過分析后得出的可供參考的,相對客觀的預測結論。

同樣,基於數據的分析,例如該類書的市場受歡迎程度、作者受歡迎程度、已出版同類書籍的銷售庫存情況,也可以大概推測出這本書的首印量應該為多少。在圖書營銷環節,大數據可利用的范圍就更加廣闊,為圖書提供了精准營銷的可能性,在運用大數據之前,對讀者的閱讀喜好調查多為抽樣調查,而大數據可以通過對數據的分析和計算,如某地讀者的閱讀喜好與習慣、不同省份更喜愛的書籍類型,哪些書籍放在一起容易捆綁銷售等這些用戶行為,分析出讀者的需求和喜好,更好地進行推銷。通過對這些信息的收集、加工和整理,就可以得到有意義的統計規律。

除去傳統出版的環節,對數字出版來說,大數據也很有用處。大數據為按需出版提供了數據支持,出版社可根據讀者的用戶行為、偏好取向等進行全面分析,將有可能實現真正意義上的個性化定制內容和按需出版。

從長遠分析,出版社或出版集團甚至可以利用大數據建立自己的銷售平台,通過分析用戶消費數據、用戶地理位置數據、用戶行為數據等為出版的各個環節提供技術支持。而在出版效率、售后服務等方面,大數據也可以優化資源配置,為出版社提供服務。

(二)國外出版業運用大數據的實例

在利用大數據方面,國外出版業走在了我們之前。例如,Scholastic出版社出版的《39條線索》是結合了在線游戲和卡片游戲的系列叢書,在游戲中出版社可追蹤讀者最喜愛的線索和人物,而Coliloquy出版的電子書,通過讀者選擇人物劇情分支和線索來為劇情的下一步發展提供數據支持,保証劇情被大部分讀者所喜愛[3]。

國際知名的大眾圖書出版商西蒙·舒斯特,格外重視大數據的應用,他們為此還專門聘請了有關專家協助進行研究工作,通過對消費者購買圖書和閱讀行為的數據進行全面的收集分析,得出了許多有價值的信息,例如為何大家喜歡某位作者,為何一本書銷售情況不佳,哪種情況導致一本書銷售不暢。通過得到的信息,他們可以快捷地找出問題並有針對性地進行調整[4]。

三、大數據應用存在的問題

以上這些案例,足以說明大數據的運用對於出版業來說大有裨益。然而,作為傳統行業的出版業,在與新興事物“打交道”時,在探索與實踐過程中,可能在應用大數據時出現錯誤,出現一些偏差。實際上,大數據的應用也的確存在一些問題。

首先,不能“為了大數據而應用大數據”,如果要運用大數據的話,一定要樹立大數據意識,要落實到出版社的戰略改革層面,在沒有能力或者眼下條件還不成熟的情況下,盲目參與隻會適得其反。舉個簡單例子,如果出版商沒有相應的技術人才,或者相關的數據信息還是空白或者少之又少,達不到一定的條件,那麼再如何應用大數據分析也是徒勞,這就要求出版社要對相關人才進行培養,隻有了解大數據在實際工作中的作用,才能更好地使用大數據﹔第二,大數據也並非一味求大,掌握的數據越多也並不代表結論就一定正確,對於任何一家出版單位而言,要根據自身的情況來量體裁衣,大數據時代的到來,並不意味著就必須拋棄“小數據”﹔第三,基於大數據的分析,可以了解獲悉用戶的需求,但如果隻根據大數據提供的數據出版發行刊物,便有可能自覺不自覺地隻迎合了讀者的閱讀興趣,而忽略了其他因素,這或許會導致作品質量的降低。除此之外,還要注意數據的完整性,不完整的數據可能會有參考價值,但更有可能毫無任何價值,甚至給出錯誤的結論。而數據上的錯誤會影響公司解決問題的進程及決策的實施,造成不好的結果。

除了這些問題,資金的投入也是一個大問題,對出版社來說,想要擁有大數據平台隻有兩個方法,第一是自己建立,第二是採購成熟的第三方產品。從長遠來考慮,自建平台是最為理想的選擇,但自建平台的搭建周期,建設和管理費用讓許多出版商望而卻步。這樣看來,第三方產品似乎是一個不錯的選擇,但在與第三方合作時要注意的問題也非常多,這些都是需要認真考慮的。而出版社也需要明白一點,建立大數據平台的目的是為了探索數字化時代新的運營模式,最終是要為企業創收,所以建立大數據平台一定要與實際挂鉤,根據實際需求來建立。

四、結 論

目前在許多行業,大數據已得到應用並且卓有成效,而在出版業,盡管國外有的出版商已嘗到了甜頭,但整體來看還處於起步階段。在國內,它還處於摸索階段。盡管有不少人依舊在唱衰“大數據”,但更多的人相信它有利於社會的發展,是時代進步的產物。之於出版行業,詳實的數據、有價值的信息能讓出版社更好地了解圖書市場,可以說,大數據對於出版行業的革新是前所未有的,面對這種變革,出版社唯有做好充足的准備,真正了解大數據的意義和特征,才能發揮其優勢,實現社會效益和經濟效益的雙豐收。而大數據的合理運用,對於整個出版行業的體系重構也必將產生深遠影響。

參考文獻:

[1] Manyika J, Chui M, Brown B, et al. Big data: The nextfrontier for innovation,competition, and productivity [R/OL].2013-2-25.

[2] 趙國棟,易歡歡,糜萬軍,鄂維南.大數據時代的歷史機遇[M].北京:清華大學出版社,2013.

[3] 許靜.出版社如何玩轉大數據[N].中國新聞出版報,2014-08-18.

[4] 魏凱.大數據如何改變出版行業?[N].新華書目報,2016-07-11.

(責編:劉雨霏(實習)、宋心蕊)

推薦閱讀

粗制濫造情懷耗盡 國產青春片何去何從?
   經歷了近三年的井噴,題材泛濫、故事狗血、制作粗糙的青春片,終於在一片吐槽聲中逐漸失去了關注熱度,甚至被業內認定為一個注定失敗的類型。國產青春片未來出路何在?
【詳細】粗制濫造情懷耗盡 國產青春片何去何從?    經歷了近三年的井噴,題材泛濫、故事狗血、制作粗糙的青春片,終於在一片吐槽聲中逐漸失去了關注熱度,甚至被業內認定為一個注定失敗的類型。國產青春片未來出路何在? 【詳細】

自媒體智能分發平台蜂起 內容爭奪激烈
   如果說2015年是新聞客戶端的高峰年,那麼2016年各大網站掀起了自媒體智能分發平台的熱潮。進入2016年以來,我們可以明顯感覺到各大網站、平台等對內容的爭奪越來越激烈,這背后的原因是什麼?對內容創業者的影響如何?
【詳細】自媒體智能分發平台蜂起 內容爭奪激烈    如果說2015年是新聞客戶端的高峰年,那麼2016年各大網站掀起了自媒體智能分發平台的熱潮。進入2016年以來,我們可以明顯感覺到各大網站、平台等對內容的爭奪越來越激烈,這背后的原因是什麼?對內容創業者的影響如何? 【詳細】