智能化媒體與未來

2018年01月22日10:23  來源:● 沈 浩 元 方 新聞戰線
 
原標題:智能化媒體與未來

  人工智能和大數據正在改變媒體。近幾年,在內容生產、分發和管理三個方面涌現出了許多人工智能媒體應用﹔媒體呈現的內容和最主要的媒介——視頻、圖像、聲音、文字都能成為數據,並可借助深度學習技術實現更加智能化的建模。智能化已經是媒體未來的趨勢和發展方向。

  當下,“大數據”“雲計算” “機器學習”“深度學習”“人工智能”等新概念層出不窮。我們所處的世界被這樣的風潮所挾裹,每個行業都不能例外。這些概念所代表的技術,逐漸進入媒體行業,同時又改變著媒體行業,這讓新聞人意識到數據驅動未來的時代已經來臨。

  人工智能(AI)是計算機科學的一個分支,它是一種能夠模仿人類學習和解決問題過程的智能技術。機器學習(Machine Learning)和深度學習(Deep Learning)都可以視作廣泛意義上人工智能領域的子集。機器學習使得計算機能夠從數據中學習,而深度學習使用神經網絡獲得類似人類大腦的分析能力,將機器學習提升到更高的認知水平,使計算機能夠更好地學習人腦解決問題時的運作。人工智能中的幾個重點領域,包括機器人、視覺和聲音分析、自然語言處理等多個維度,無一不和媒體相關。機器人可以協助進行新聞報道,視覺和聲音分析可以實現視頻和音頻的自動化處理,而自然語言處理更是上述應用的基礎。

  媒體行業確實正在發生改變。在很長一段時間裡,媒體所擁有的數據大多是非結構化的文字、圖像、音頻和視頻,必須依賴人工處理,這阻礙了數據相關技術在其中的應用。但是,隨著人工智能和機器學習算法,特別是深度學習算法准確性已經達到與人類相當的水平,很多任務可以實現自動化執行,同時人們還可以從這些數據資產中獲得重要的洞察力。Netflix聲稱,人工智能技術能夠實現工作流自動化並減少客戶流失,每年可節約10億美元。

  技術一直在進步,而在許多行業中人工智能和機器學習的整合也取得了成功。人工智能帶來的技術可以完成大部分人力密集的項目,計算速度快,可重復性和可擴展性都非常好,從而帶來了大規模自動化及無與倫比的效率,這些先進技術在媒體的內容生產、管理和分發中體現出了前所未有的魅力。而現在只是媒體智能化之旅的開端。

  智能化內容生產

  在智能化內容生產中,應用較廣的是機器人新聞報道。2014年,美聯社就已經開始使用自動化洞察(Automated Insights)公司的wordsmith軟件撰寫每個季度的公司財經分析。該軟件可以挖掘公司財務報告,總結其中的關鍵要素,然后生成陳述。這個平台每秒鐘最多可以生產出2000篇此類新聞,而且由於是對財報的直接分析,出錯率非常低,發稿量是人工報道的13倍。同樣是在2014年的3月17日,洛杉磯地震發生后的3分鐘內,洛杉磯時報的網站就使用機器人Quakebot發出了關於這次地震的第一條新聞。除了這個地震報道機器人,洛杉磯時報還利用數據分析和人工智能技術建立了一個數據庫,並在此基礎上使用一個程序報道殺人事件,它可以追蹤事件並自動撰寫新聞。除此之外,美國紐約公共廣播電台的NailbiterBot機器人被用於報道“美國全國大學體育協會”的賽事。另一個叫做TreasuryIO的機器人則可以監測美國聯邦政府指數。

  中國本土對智能化內容生產的嘗試也是如火如荼,其中的領頭羊有騰訊、新華社、今日頭條等。2015年9月,騰訊財經發表了一篇文章《8月CPI漲2.0% 創12個月新高》,該文章的署名為自動化新聞寫作機器人Dreamwriter,可以視為自動化新聞寫作第一次在國內得到應用。同年11月,新華社也推出了自己的寫作機器人——“快筆小新”,輸入股票代碼,它3秒鐘就能完成一篇財報分析,稿件中大小標題一應俱全,還配有圖表等信息。然而,快筆小新只是基於人工錄入的知識庫和模板,寫出的稿件結構單一,內容乏味。2016年裡約奧運會期間,今日頭條推出了新聞機器人“張小明”。作為第二代新聞機器人,“張小明”除了生成賽事新聞報道,還能智能檢索並選擇圖片,根據比賽結果模仿人類語氣等。

  2017年11月騰訊舉辦的媒體+峰會上,人工智能成為峰會報道的重要參與者。在嘉賓演講的同時,“騰訊微信智聆”利用語音識別技術實時顯示演講內容,“騰訊翻譯君”利用深度學習的翻譯技術將演講內容實時翻譯成英語,而Dreamwriter更是以平均0.5秒/篇新聞的速度寫出了14篇新聞稿件,還能自動配上現場圖片。Dreamwriter還和武漢長江大橋“合體”,利用長江大橋上發出的交通數據,撰寫了一篇有文字有圖表的長江大橋交通流量新聞。

  機器人新聞的這些嘗試,展示了智能化內容生產令人激動的未來。隨著傳感器、智能硬件和物聯網的發展,可以提供機器人進行新聞寫作的數據源越來越多,機器人新聞報道的疆界將被拓寬。機器人視覺、圖像視頻等技術也為新聞攝影的未來帶來了其他可能。多種智能技術可以捕獲高質量的音頻、視頻,這種技術同樣可以獲取新聞事件的照片和視頻,甚至通過無人機等設備進行直播,從而實現多種媒介展現方式的融合。

  智能化內容分發

  智能化內容分發,就是指與電商、零售等領域的“個性化推薦”同義,但是更加體現媒體特性的個性化分發技術。這種技術更多應用於新媒體,新媒體的內容分發策略實際上決定了哪些信息能夠被用戶看到。這是眾多內容應用中最容易與算法產生聯系的領域之一,是伴隨著互聯網信息大爆發自然而然出現的。在傳統媒體時期以及互聯網早期,信息的篩選依賴編輯,決定受眾能看到哪些內容的是專業編輯。就像人工與計算機處理的對比一樣,編輯的處理能力是有限的,他隻能處理頭部的20%信息,而長尾則被完全忽視了。使用智能算法進行內容分發最大的優勢正在於此。算法可以根據用戶的屬性、行為、偏好等個性化特征進行推薦,實現“千人千面”,從而徹底解決信息過載的問題。算法可以處理的信息量幾乎是沒有上限的。

  主流媒體平台中最早使用算法推薦的是Facebook,他們在2006年就開始推出信息流,堪稱此領域的鼻祖。Facebook為每個打開其頁面的用戶呈現個性化的內容,這些內容不僅包括朋友的狀態更新,朋友們最近看了些什麼,重要的新聞推送,還夾雜了一些廣告或推薦文章。Facebook使用算法決定信息流中信息的權重。影響權重的因素也經過了多次調整,包括發布時間(更新的信息),提及朋友的數量,根據點贊、點擊、評論、分享等活動分析用戶的興趣點,經常互動的內容可能會得到更大權重,等等。用戶能看到的內容都是智能的推薦。在國內,提到新聞資訊的個性化推薦,大家更容易想到的是今日頭條。今日頭條運用算法、數據挖掘以及機器學習等技術,在用戶通過社交賬號登錄時,對用戶數據進行動態挖掘和了解,勾畫出用戶興趣圖譜,根據用戶畫像來推薦感興趣的文章﹔在用戶使用過程中,算法會根據用戶的點擊、搜索、訂閱等行為優化用戶畫像。在內容方面,今日頭條大概擁有220萬個興趣標簽,每隔五秒鐘后台系統就會自動進行調整並進行推送。

  前面所描述的是媒體根據受眾特點進行個性化的內容分發。這種分發可以是文字資訊,也可以是視頻內容。對於視頻媒體來說,由於視頻文件一般較大,不同的收看設備、收看條件下可能會帶來不同的體驗。ABR編碼可以通過將原始文件切分成不同比特率的小塊提供給不同帶寬下的客戶端,而人工智能將固定分塊轉變為基於場景的編碼,它可以學習不同場景的復雜程度,確定所需的壓縮級別,根據觀眾位置、網絡擁塞程度、基礎設施和帶寬的細節優化比特率,提高在線媒體的性能。人工智能還可以進行視頻質量評估,這是視頻內容分發之前的關鍵過程,大大減少了內容發布時間。

(責編:宋心蕊、趙光霞)

推薦閱讀

升國旗唱紅歌送祝福 盤點媒體國慶創意策劃
  今年10月1日,中華人民共和國迎來了68歲的生日,不少人的朋友圈裡也被各種各樣獻給祖國的祝福“刷了屏”。媒體們各出奇招,用MV、H5等新穎的形式“烹飪”出了不一樣的國慶報道“大餐”。
【詳細】升國旗唱紅歌送祝福 盤點媒體國慶創意策劃   今年10月1日,中華人民共和國迎來了68歲的生日,不少人的朋友圈裡也被各種各樣獻給祖國的祝福“刷了屏”。媒體們各出奇招,用MV、H5等新穎的形式“烹飪”出了不一樣的國慶報道“大餐”。 【詳細】

慶祝建國68周年 重溫媒體開國大典報道
  1949年10月1日,在天安門舉行的盛大的開國大典,向全中國、全世界庄嚴宣告中華人民共和國的誕生。在慶祝建國68周年之際,讓我們重溫當時關於開國大典的新聞報道,再次感受那一神聖而又偉大的時刻。 
【詳細】慶祝建國68周年 重溫媒體開國大典報道   1949年10月1日,在天安門舉行的盛大的開國大典,向全中國、全世界庄嚴宣告中華人民共和國的誕生。在慶祝建國68周年之際,讓我們重溫當時關於開國大典的新聞報道,再次感受那一神聖而又偉大的時刻。 【詳細】