首頁
黨政
- 黨網 · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
- 經濟 · 科技
- 社會 · 法治
- 文旅 · 體育
- 健康 · 生活
- 國際
- 軍事
- 港澳
- 台灣
- 教育
- 房產
- 科普
觀點
互動
可視化
- 視頻
- 圖片
- 圖解
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陝
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
舉報專區
多語言
- |
合作網站
登錄

退出

人工智能時代新型播音主持專業人才培養路徑探析

鄧佳煜

2019年03月12日09:23 |

小字號

來源：《視聽》2019年第3期

摘要：近年來，人工智能技術（AI）席卷全球，在無數行業形成了推翻性革新升級的局面，很多人稱人工智能時代為第四次工業革命。在我們為這樣一個指數增長時代欣喜的同時，應當意識到播音主持行業正面臨著第五次行業危機。本文重點分析人工智能時代虛擬主播、主持人在傳媒行業中的優勢，基於此，對人工智能時代播音主持專業人才培養方式提出策略建議。

關鍵詞：人工智能﹔語音合成﹔播音主持﹔人才培養

人工智能時代的來臨勢如破竹，它的普及悄然改變著播音主持行業的發展格局。與新技術同期而至的新變化也給播音主持專業人才的發展帶來了史無前例的挑戰。2018年11月7日在中國烏鎮舉辦的第五屆世界互聯網大會上，新華社聯合搜狗隆重推出全球首位合成新聞主播——“AI合成主播”。我們在享受它帶來的便利的同時，必須掌握人工智能技術衍生物的優勢，才能做到知己知彼、取長補短，探索新時代播音主持專業人才培養的全新路徑。

一、人工智能技術機器人在播音主持行業的優勢

（一）“文轉音”式工作：人力、物力成本驟減

在2018年5月21日召開的微軟2018人工智能大會上，一款名為小冰的人工智能伴侶虛擬機器人大放異彩，她開放了“全雙工”和“人工智能創意”功能。家長可以為孩子設定故事的主人公、故事傾向等內容，小冰隻需花費20秒時間就可以為用戶定制（語音合成）一集10分鐘左右的有聲童話故事，而這項工作往往需要花費一名成熟的、採編播一體的主持人8個小時左右的工作時間。

由此看來，語音合成技術的成熟使得一篇文稿轉化為音頻的時間成本、人力成本、物力成本大幅降低。現在某些平台的語音合成音甚至完全可以取代播音員錄制的音頻，且受到用戶認可。例如我們常用的地圖類App，它的語音導航功能在經歷最初1.0版本的電子音直至今天n.0版本的人聲合成音的導航音已被用戶廣泛接受，除了我們熟悉的司機們會常常用到語音導航規劃路徑，國內、國外的街頭巷尾，游客們開著語音導航指引自己前往目標地游覽，外賣員們也因它實現了送餐效率的提升，在增添便利性的同時又將成本降到最低，語音合成技術已經深入我們每個人的生活之中。

（二）大幅提升工作效率

以人工智能語音合成現階段技術來看，雖然小冰前期需要大量真人真聲的錄制工作，但是錄制的聲音一旦訓練完成，小冰的工作效率將非常驚人且穩定，她可以全天24小時不間斷地在任何一台智能手機上工作，每20秒完成一位成熟主持人8小時的工作內容，大大提升了音頻產出的效率和穩定性。

穩定的工作效率是播音主持行業招聘人才非常重要的一點，正因如此，小冰也獲得了很多播音主持職場新人不可多得的機會：2015年12月，小冰作為東方衛視《看東方》的實習“主持人”播報每日的天氣﹔2017年7月，小冰搭檔張紹剛登上熒幕主持中國首檔原創科技秀《我是未來》。對於電視台、報社來說，小冰的出現不單單是降低了節目的成本，還大大增加了節目錄制的可控性，除了技術升級之外，小冰不會因病假、事假影響節目錄制、新聞撰寫等工作，工作穩定性無人能及。

（三）加強節目情感控制能力

很多業界人士認為，語音合成技術離受眾的生活還比較遙遠，雖然機器可以模仿人類的聲音、節奏，但很難模仿人類的表現力、自然度和情感度。事實上，這也是目前人工智能語音合成技術的瓶頸所在——在建模手段上還存在技術瓶頸，比如情感既具有實時變化性又具有長期記憶性，對於特征信號檢測與處理尺度的把握都造成困難①，在這些方面人工智能確實有很多技術難關需要攻克，但是不可否認的是，單從技術的角度來講，在一段足夠長的時間之后這一難題終將被解決——期刊《計算機工程》上刊登的論文《基於PSOLA與DCT的情感語音合成方法》中提出一種“結合和離散余弦變換的情感語音合成方法，實驗結果表明，該方法比單獨使用時域基音同步疊加算法合成的情感語音更具情感色彩，其主觀情感的識別率更高，合成的情感語音質量更好”②。就最近配音演員李立宏的聲音作為錄音訓練范本這個案例來說，他被錄入的人工語音成功訓練、合成之后，在情感度和自然度上已經有了很大提升，比我們現在聽到的高德地圖上合成的語音已經進步太多，因此，解決痛點缺乏的只是時間而已。

就筆者目前了解的情況來看，語音合成的可控性體現在兩個方面。一方面，它在受眾對音色的偏好上有很強的可控性，如今越來越多的“聽書”產品深入受眾的生活，用戶可以選擇自己喜歡的聲音，如大氣磁性康輝版、舌尖上的中國李立宏版等。甚至在技術成熟的未來，你可以訓練自己喜歡的任何聲音，為自己私人訂制一種音色，再選取自己喜歡的書籍、信息來進行播讀，這將會給用戶體驗帶來極強的自由度。另一方面，語音合成在情感度上的控制能力極強。它能將聲音角色的情感度降至冰點，進行零度寫作③，例如在2017年5月，小冰作為《異想天開》的主持人利用大數據為投資者和創業人分析出匹配度﹔不久之后，她還化身“助理主持人”登錄《非你莫屬》，為求職者們助力。因此，在某些需要在情感度上做出控制的角色身上，為了公平起見，需要以平等的感情面對每一位對象，隻有依靠語音合成極強的可控性才能做到相對的客觀平等。

二、人工智能時代播音主持人才培養策略及建議

（一）新版“一專多能”

2008年高校播音主持專業在人才培養改革方興未艾之時興起“一專多能”，“一專”指的是播音主持的基本功——播音，而“多能”是指節目的採編能力，採編播一體是那個時代對播音主持學生的培養目標。

如今，在媒介融合的大背景下，為了跟上新時代受眾的需求，高校對播音主持專業人才的培養方式也在不斷演變，播音主持專業對人才的培養應走向新的“一專多能”，使學生能根據自身喜好、特長引入跨學科學習交叉領域的相關知識。簡而言之，“一專”改為採編播能力，而“多能”則指將方向指向了“復合型人才”，播音主持專業人才應結合自身喜好跨學科修習其他專業的相關科目，例如體育、科技、財經、法律等，這樣的新型人才培養方式將有效提升學生們的學習能力。

新版“一專多能”的人才培養模式不僅可以應對科技浪潮帶來的危機，提升未來播音主持行業在細分領域的專業性，還可以有效提升學生在校的學習效率，獲取更多目標感、成就感，能有效為社會帶來更多優秀的、專業的體育解說員、財經記者、科技節目主持人，使他們未來在科技發展迅猛的大背景下仍能以核心競爭力自立。

（二）培養“同步互動”能力

基於長久以來對播音主持行業的研究和實踐，筆者認為著力培養學生“同步互動”的能力也是應對人工智能時代播音主持行業危機的方法之一。

以小冰為例，現階段的人工智能技術隻能實現小冰（主持人）與受眾的“異步互動”——小冰工作結束呈現內容，內容再呈獻給受眾這樣的模式。也就是說，小冰不具備類似訪談節目主持人這樣的能力，無法同台同時段與受訪嘉賓和觀眾進行互動。由此來看，培養學生“同步互動”的能力就是目前新型培養模式中很重要的一點，即主持人與嘉賓、觀眾在同一時間、同一地點下的互動能力。而這項能力除了培養基本功——語言表達能力之外，更重要的是在培養過程中突出整合信息能力、邏輯判斷能力、臨場反應能力，這三項能力能夠確保高校為未來播音主持行業培養的專業人才具備自己的核心競爭力。總而言之，“異步互動”場景中的播音員、主持人更容易被取代，也是首先會被取代的人，對學生“同步互動”場景下能力的培養是大勢所趨。

（三）注重個性化培養，提升個體辨識度

現代教育起源於17世紀的德國，那時的教育是為大機器時代服務，目標是為了使流水線上的工人經過教育后操作整齊劃一，實現標准化。現如今我們在媒介融合的大背景下進入了人工智能時代，這個時代的播音主持專業更需要培養專業學生的個性魅力、邏輯思維等。互聯網已經賦權了每個人更多的平等的權利，因此受眾的口味將更加挑剔，他們需要的更多的是能引起其共鳴的有辨識度的個體有個性的表達。例如網紅PAPI醬，她以自己獨特的語速、風格和解析視角吸引著自己的粉絲，主持人蔡康永、撒貝寧、小S等都以他們節目中個性十足的語言風格活躍在熒屏上，並且長久以來屹立不倒。

因此，隻有提升播音主持專業人才的辨識度，才能使他們擁有自己的核心競爭力，在人工智能時代堅守自己的立足之地。

注釋：

①高瑩瑩.面向情感語音合成的言語情感建模系統[D].北京交通大學,2016.

②李勇,魏珰,王柳渝.基於PSOLA與DCT的情感語音合成方法[J].計算機工程,2017(12).

③[法]羅蘭·巴爾特.寫作的零度[M].李幼蒸譯.中國傳媒大學出版社,2010.

（作者單位：上海體育學院傳媒與藝術學院）

(責編：趙光霞、宋心蕊)

分享讓更多人看到