人民網
人民網>>傳媒>>傳媒期刊秀:《新聞戰線》>>2018年·第8期

“MAGIC”對新聞智能生產的探索

沈 南 陳毅華
2018年12月21日09:48 | 來源:人民網-新聞戰線
小字號
原標題:“MAGIC”對新聞智能生產的探索

  人工智能 “MAGIC” 在俄羅斯世界杯期間驚艷亮相。這個新華智雲“媒體大腦”2.0版,具有全鏈路自動完成畫面分析、捕獲、制作、配樂、加標題、合成、發送等等功能,可高效地生產出有趣有料的短視頻。 “MAGIC” 提供了一條“數據+AI+計算資源”的解決路徑,成為新聞內容生產的好幫手。

  媒體大腦 新聞智能生產 視頻新聞

  俄羅斯世界杯前夕,由新華智雲自主研發的國內首個媒體人工智能平台“MAGIC”驚艷亮相。從6月13日俄羅斯世界杯開賽至7月7日16時,“MAGIC”平台生產世界杯短視頻35511條,播放總量已突破8330萬。截至7月7日16時,2018年俄羅斯世界杯共進球170個,MAGIC對所有進球都實時產生進球視頻,平均用時50.7秒,最快一條《俄羅斯2︰0領先埃及》的生產僅耗時6秒。這些短視頻在新華社客戶端、優酷、UC、今日頭條等平台同步推送,充分滿足了讀者的不同需求。

  同時,為了滿足用戶個性化定制進球視頻的需求,“MAGIC”平台應用人工智能技術,還成功研發出“MAGIC進球機器人”。7月4日,“MAGIC進球機器人”入駐新華社公眾號,為用戶提供世界杯開賽以來最全的進球視頻。手機用戶在進入新華社微信公眾號后,點擊下方菜單欄最左側的《世界杯》欄目,選擇“進球機器人”,根據提示向機器人“發出指令”,即可獲取相應進球視頻推送。機器人可接收的指令包括球員名字、球隊名稱、比賽名稱、進球類型以及不同關鍵詞的交叉搭配等。

  受眾對“MAGIC”平台生產的世界杯視頻產品給予積極評價,並期待后續有更優質的報道內容和更好的用戶體驗。

  從媒體大腦1.0到“MAGIC”

  2017年12月26日,新華社面向全球發布了中國第一個媒體人工智能平台——“媒體大腦”1.0。

  “媒體大腦”(www.shuwen.com)是由新華智雲自主研發的國內首個媒體人工智能平台,融合雲計算、物聯網、大數據、人工智能等多項技術,為媒體機構提供線索發現、素材採集、編輯生產、分發傳播、反饋監測等服務,使新聞場景下的應用和服務更加智能化。

  “媒體大腦”1.0包含八大功能:自動採集生產新聞的2410智能媒體生產平台﹔實時語音識別及自動轉寫的工具“採蜜”,幫助記者提高採訪及新聞生產效能﹔從圖片、視頻中識別特定人物身份,特殊標識的圖片識別工具﹔監測新聞信息內容在接近全網300萬個網站及頭部自媒體的傳播、版權行為狀況﹔面向未來的新聞信息傳播場景的新聞分發以及基於用戶閱讀偏好的新聞分發系統﹔為媒體機構提供描繪自身用戶群體特征、偏好的用戶畫像服務等。

  在“媒體大腦”發布時,同步生產了首條MGC(機器生產內容)新聞。隨著移動互聯網的發展,UGC(用戶生產內容)除指一般的受眾用戶生產內容外,還細分出PGC(專業生產內容)和OGC(職業生產內容),這些內容的生產者一般而言是人,新華智雲首創的MGC是基於“媒體大腦”,運用人工智能技術,由機器智能生產新聞。

  今年全國兩會期間, “媒體大腦”自動生成一系列兩會視頻報道,平均耗時不超過15秒。其中最經典的案例是:算法發現了歷年政府兩高報告中一些“消失”的司法名詞。新華智雲內容團隊和技術團隊對算法進行了定義。隨后,算法通過文本、視頻和圖片的識別和比對技術,對歷年兩會兩高報告的數據進行處理、比對和分析,從而得出了一些有意思的結論。比如“反革命”“投機倒把”等司法名詞在近些年的兩高報告中消失不見。最后,算法將這些結論自動合成為一個完整的新聞視頻。

  新華智雲基於媒體大腦各項技術及MGC的應用積累,在今年6月13日發布的“MAGIC”智能生產平台可以被看做是“媒體大腦”的2.0版,“MAGIC”這一名字是“MGC”(機器生產內容)和“AI”(人工智能)的結合。

  數據+算法、人機協作的“MAGIC”智能生產平台

  “MAGIC”智能生產平台以大數據處理技術、智能算法技術以及人機協作技術為核心,包含智能數據工坊、智能媒資平台、智能生產引擎、智能主題集市四大智能系統,自動產出成品視頻內容及文字、圖片內容。“MAGIC”的目標是要讓內容生產者更多地獲取新聞資源、更好地處理新聞資源、更快地傳播新聞信息。

  四大智能系統構成“MAGIC”

  智能數據工坊是數據採集中心、數據加工中心和數據產出中心,通過爬虫等算法挖掘各類視頻、圖片、文本中的數據,隨后將數據進行處理從而得到結構化的數據﹔智能媒資平台是內容資源的“倉儲中心”和“算法中心”,包含各類新聞信息、圖片、視頻等素材,記者可以在智能媒資平台上搜尋需要的素材﹔智能生產引擎,顧名思義,具體負責自動生成內容,通過分析時間、地點、人物等信息,調度相應的素材,自動剪輯合成一條視頻新聞﹔智能主題集市則更像是內容產品創意中心,為內容生產者提供選題和寫作思路。

  “MAGIC”智能生產平台如同零部件生產組裝流水線,智能數據工坊和智能媒資平台的任務,就是將新聞內容自動拆解為一個個顆粒化的零部件。智能生產引擎則是負責把這些零部件重新組裝。經過機器的拆解和組裝,更多新的內容就產生了。

  數據+算法是“MAGIC”的核心

  MAGIC的核心是數據+算法,可以概括為一個“業務數據化-數據業務化”的閉環反饋過程:一是讓傳統的業務資料成為數據,讓線下的數據走向線上,和計算相接,這個過程對應的就是業務數據化﹔二是讓數據形成閉環,回到業務的使用場景中,對業務進行改善並讓人工智能不斷自我進化,這個過程對應的就是數據業務化。

  人機協作在“MAGIC”必不可少

  人工參與和觀察的角色依然存在,“MAGIC”的本質是人的智慧+機器的智能,這是一種全量數據+人機協同的工作模式。首先,“媒體大腦”產出的內容以及質量在一定程度上依賴於人工的經驗和反饋。其次,在判斷黃色、暴力、敏感等內容方面,現有的智能技術可以進行初步篩選和校對,但最終還是需要人的再校對。相信隨著人工智能技術和計算資源量的提高,人工審核的依賴度會逐漸下降。

  “MAGIC”通過機器輔助,海量的歷史和實時內容將被精細化地自動拆解,並以顆粒的形式存儲在雲端,一旦有最新的事件發生,機器會自動調用雲端的數據顆粒,實時生成視頻新聞,內容經過數據化后,會產生新的內容,這就是“MAGIC”的魔法。

  通過對所有內容數據化后,在未來計劃中,“MAGIC”還能夠幫助內容生產者找到新聞角度。

  “MAGIC”智能生產平台的應用——實時自動生產俄羅斯世界杯視頻稿件

  世界杯4年一屆,是全球矚目的焦點,也是媒體角逐的熱點,同時,體育新聞事實性強、較為結構化,“MAGIC”的實戰運用選擇了世界杯報道,實時自動生產世界杯成品視頻稿件。

  “MAGIC”智能生產的最大特點是時效快。比賽進球后,MAGIC智能生產平台AI進球視頻鏈路非常高效,全鏈路自動完成畫面分析、捕獲、制作、配樂、加標題、合成、發送到優酷等視頻站點,整個過程不超過30秒。用戶在視頻網站可以看到《球進了!塞爾維亞0︰1落后巴西 比賽第35分鐘》《球進了!韓國2︰0領先德國 比賽第97分鐘》等世界杯所有進球視頻。通過對比發現,人工剪輯、合成並發布的同類進球視頻,最快需要4分鐘,算法和機器自動化的優勢非常明顯。

  “MAGIC”智能生產的特點還在於內容全和可學習性。基於視頻和圖片資源,生產全量內容。如韓國和墨西哥的比賽中,韓國隊被判罰點球,“MAGIC”智能生產平台第一時間生產《2018俄羅斯世界杯:14個點球全回顧 本屆點球數已超2014整屆》,將14個點球的進球視頻一一呈現。每場比賽,“MAGIC”都會依據設定的模板,自動生產賽事相關進球、射門、角球、任意球、精彩過人、紅黃牌、犯規、球迷表情、半場和全場集錦,全部球員比賽表現等視頻,時間不晚於比賽結束后3分鐘。每天自動生產射手榜、進球榜等盤點類集錦。“MAGIC”還對所有球員,尤其是明星球員、對位進行pk分析,產生pk類視頻集錦,關聯球員所在球隊、俱樂部,場外花絮,分析比對,挖掘價值點,生產視頻新聞。基本上,人工能找到的角度,能想到的選題,“MAGIC”智能生產平台都能及時生產相關視頻。人工定義的選題,機器通過算法學習后,可以復用到全部的比賽中。

  除了比賽集錦,“MAGIC”算法還生成了不少有意思的短視頻,其智能程度讓人大呼意想不到。“MAGIC”精准抓取了馬拉多納多場觀看不同比賽時的夸張表情和肢體動作,生成了《戲真多!馬拉多納:看台上一隻行走的表情包》(時長82秒)、《馬拉多納激情“作法”!梅西能為阿根廷逆天改命嗎?》(時長27秒)、《阿根廷慘敗,馬拉多納難掩失落》(時長23秒)、《緊張到吃手指,失球后馬拉多納很捉急》(時長6秒)、《你的好友【馬拉多納】進入了直播間》(時長17秒)等視頻。

  如果按照傳統的編輯部模式生產制作高時效、海量的世界杯短視頻,需要調動大量的人力物力。“MAGIC”提供了一條“數據+AI+計算資源”的解決路徑。

  新華智雲負責人表示:“MAGIC”將幫助內容生產者更多地獲取新聞資源,更好地處理新聞資源和更快地傳播新聞資源,在未來計劃中,它還要成為一個發現新聞的平台,機器通過數據之間的聯系比對,將會發現人發現不了的角度和新聞點。

  機器不是用來取代人的,而是來幫助人的。新華智雲最大的價值和核心及方向目標就是在MGC的領域有所突破。新華智雲將自己定位為:內容生產者的幫助者。“媒體大腦”的這些功能的本質是機器幫助內容生產者更多地佔有新聞資源,所有技術能力的釋放都圍繞著幫助記者佔有更多新聞資源來做。目前,我國媒體從業者和媒體機構對數據的使用能力不強首先表現在觀念上,很多記者可能還沒有意識到,經過處理以后的數據能夠對媒體產生什麼樣的幫助。他們在觀念上沒有意識到這一點。

  以“MAGIC”為核心的“媒體大腦”2.0可以看做是機器的智能+人的智能的雙贏和重生,這將開啟一個全新的AI內容生態系統。“媒體大腦”的目標是成為智能媒體時代的基礎設施,成為AI內容的定義者和發布者。“媒體大腦”不是要取代記者和編輯,而是要在更高層面上,把人與物的延伸連接起來,更快、更准、更智能地獲得新聞線索和新聞素材,賦能記者和編輯,幫助媒體提高生產力。

  (作者沈南系新華社體育部主任編輯,陳毅華系新華智雲科技有限公司董辦主任)

(責編:趙光霞、宋心蕊)

分享讓更多人看到

傳媒推薦
  • @媒體人,新聞報道別任性
  • 網站運營者 這些"紅線"不能踩!
  • 一圖縱覽中國網絡視聽行業
返回頂部