李明強:AI鑒黃師"看懂"圖像迅速走紅

2018年09月11日07:00  來源:中國青年報
 
原標題:李明強:AI鑒黃師“看懂”圖像迅速走紅

  受訪者供圖

  “你的第一個產品,哪怕做得粗糙一點也沒關系,不要想太多!”5年前,李明強帶著騰訊高級副總裁張小龍的“臨別贈言”,躍入創業的大潮中。共事多年的張小龍給他的建議是,“產品並不需要做得完美無瑕再拿出去。隻要有客戶,就說明是有需求的。”

  1980年出生的李明強在騰訊工作了7年,先后參與QQ郵箱、微信等項目的開發,成了一名資深的項目經理和T4技術專家。“我離開騰訊時,公司隻有幾十個T4技術專家。但我在那裡太久了,再不出去創業就折騰不動了。”2014年,他創辦了國內最早將計算機視覺技術應用在互聯網內容審核上的AI公司——圖普科技。

  “內容審查怎麼不能做到?我就可以做!”

  圖普科技從“出生”時起,就打上了“鑒黃”的烙印。這源於曾經掀起輿論熱議的“快播案”。快播CEO王欣在法庭上稱:“快播最主要的功能就是播放,就像傳統意義上的DVD,無法知道上傳者是誰,更不知道視頻內容是什麼。用戶上傳什麼種子,它就播放下載什麼種子,它只是忠實地執行這個動作而已。”

  李明強說:“內容審查在當時的確很難。我就想怎麼不能做到?我就可以做!”

  根據《全國人民代表大會常務委員會關於維護互聯網安全的決定》的規定,互聯網公司內容涉黃,有可能被以制作、復制、出版、販賣、傳播淫穢物品牟利罪定罪處罰。快播破產的結局讓眾多網絡平台意識到,內容審核不僅是維護互聯網環境的政策要求,更是關及自身生死存亡的要事。

  如今,直播和短視頻市場風起雲涌,龐大的流量催生新產業的同時,審核難度也越來越大。據新華社報道,今年以來,“掃黃打非”部門加大工作力度。據統計,“淨網2018”行動從1月到4月,各地共處置淫穢色情等有害信息175萬余條,查辦淫穢色情信息案件390余起。

  被網友戲稱高薪和“福利”兼具的神奇職業“鑒黃師”,在如此大體量的內容檢測面前顯得勢單力薄。“培養一個鑒黃師至少需要兩周。”李明強說,“一天總共8萬多秒,去掉吃飯睡覺等時間,鑒黃師一天最多能看一兩萬張圖片。人工審核難免會有錯漏,還要考慮人員流動、不能實時監看等不穩定的因素。”

  受到快播案的啟發,李明強確立了用人工智能技術進行圖片識別的戰略,他帶著新建的團隊,在一周內做出demo(小樣),在給機器提供大量數據的基礎上,通過機器持續學習,確保系統甄別效能的更新和優化。

  隨后圖普迎來第一個客戶——迅雷。迅雷之前成立了自己的內容審核團隊。“他們的做法是將違規內容和審核視頻進行比對,將一樣的部分篩去,但是機器並不理解這個東西是什麼。”李明強說,“一個視頻版本傳播出去會有多個變種,分辨率不同、加個水印、字幕或者截取部分,就演變成完全不同的文件了。我們的創新點在於,我們的識別是基於圖像的理解,真的能‘看懂’視頻是否有色情內容”。

  “我們在識別的結果上,會劃線區分為確定和不確定部分。有的圖片非常隱晦,它介於兩者之間,系統的判定是不確定或者很模糊。因此我們也設立新的計費模式,隻對於確定部分收費,不確定部分不收費或者少收費,打消客戶的很多疑慮。”李明強解釋,圖普科技的准確率高達99%,對於系統無法識別或無法作出最終判斷的內容,推送至人工審核。盡管還需要鑒黃師的助力,但已經極大地提高效率和降低人力成本。

  目前,圖普科技的AI每天的處理量超過10億次,在雲端設有幾百個圖像識別接口,相關的算法也落地到不同的行業裡。

  “每次嘗試我都更興奮,會有這一次要成功了的錯覺”

  任何成功都不是一蹴而就。在圖普科技成長為“AI鑒黃師”之前,李明強有過一次失敗的創業經歷。

  2013年,李明強嘗試開發一個服裝和鞋帽的搜索引擎,通過圖片來了解用戶喜好並推薦適合用戶的款式。“在當時就能夠完成識別圖中衣物款式、顏色、紋理等一些當時看起來很有難度的事”,但初次創業不過一年便宣告失敗。

  李明強期望能從圖片為切口,突破單一的純文字搜索引擎模式,但高成本的流量和時間消耗難以承受。回顧過去的創業經歷,運營工作太重是失敗的主要原因。用戶對於服裝的偏好、對美的感受千差萬別,需要進行大量的運營工作。

  這成為李明強最頭痛的事,“盡管我們嘗試將每一次需求沉澱下來再去改進,但還是會有新的或者隱晦的需求,一次又一次遭受打擊。依靠技術難以量化和把握,無法完成完整的商業閉環。”

  “這是一次非常慘痛的創業經歷。”從騰訊的高級技術專家,到事無巨細考慮每一步的創業老板,身份的轉換帶給了李明強極大的不適應感,“就像一覺醒來漂流在海面上,狂風暴雨,又不知道該往什麼方向去走。”

  當初,李明強帶著幾位伙伴一起離開騰訊著手創業。他形容“自己的兄弟特別單純”,“他們就相信我這件事情能做成”。

  搜衣引擎的失敗給了李明強當頭一棒。比起自己的挫敗感,李明強對共同戰斗的隊友背負更深的愧疚。

  “帶著一幫兄弟,拿著投資人的錢花時間在這個地方,最后發現都是一些無效勞動。”那一次失敗,讓李明強損失了一半得力干將。他覺得,“失敗就像一個坑,陷進去了就得爬出來。如何找到方向爬出坑最重要”。

  “就是不斷嘗試。”李明強在接受中國青年報·中青在線記者採訪時說,“每一次嘗試我都更興奮,會有這一次要成功了的錯覺,但結果方向又不對,那就再來!”

  每一次調整狀態后,他又像打滿了雞血一般,迎接新的挑戰,“這件事情一年做不成,我就做十年。因為我知道肯定是存在一條路的。”李明強終於找到了這條路,開創了國內人工智能圖片識別內容審核的先河。

  員工的學習時間計入工時——拿工資學習

  “AI鑒黃師”迅速走紅。參加了多場人工智能研討會后,李明強發現,“隻要一說我們的產品是AI鑒黃,之后再說到其他業務大家就都不注意聽了”。

  “后來想想我們本來就是互聯網出身,能有這樣的免費熱點蹭,也沒什麼不好。 ”李明強介紹,如今圖普科技三條生產線並行:互聯網、商業智能、泛安防。鑒黃只是互聯網生產線的一個小分支。今年圖普科技在商業智能上持續發力,線下門店都開始嘗試配備AI的自動導購機,例如通過攝像頭來識別消費者的形象特征,隨后根據算法在屏幕上顯示推薦產品,在應用中增添很多趣味性的成分,“這實際上是我們做賦能型零售的破冰嘗試。”

  目前,圖普科技總部設在廣州,在北京、成都等地開設了分公司,160多人的團隊中研發人員佔70%。招到優秀的人是李明強最關心的事,他和程序員在工作之余“玩”出了5套謎題,以游戲的形式作為選拔人才的考卷。

  “這一套謎題是用算法摳出圖裡的馬裡奧,這張海報的圖標是《三體》裡的魚缸……”他甚至在公司開設解題課堂,定期講解這些內容。他還設計了打卡學習系統,員工的學習時間計入工時——拿工資學習。

  如今,李明強和公司成員溝通時,常常將“在用的過程中完善”這句話挂在嘴邊。李明強坦言,“我一開始總想要把產品做完善再拿出去,反而越做越糟。張小龍的忠告是對的,產品就是應該在推出后根據需求迭代的。我們也正在不斷更新產品,永遠在路上。”(實習生 黃暢 中國青年報·中青在線記者 王聰聰)

(責編:宋心蕊、趙光霞)

推薦閱讀

人民日報創刊70周年
  70年,25541期,25541個日夜,人民日報與黨和人民風雨兼程、一路相伴,一同走過革命、建設和改革的崢嶸歲月,一起走進更加昂揚的新時代。
【詳細】人民日報創刊70周年   70年,25541期,25541個日夜,人民日報與黨和人民風雨兼程、一路相伴,一同走過革命、建設和改革的崢嶸歲月,一起走進更加昂揚的新時代。 【詳細】

2018(第三屆)全國黨報網站高峰論壇
  2018(第三屆)全國黨報網站高峰論壇暨全國黨報網站總編輯看天津活動6月20日在天津市舉行,主題為“媒體融合:宣傳新時代 擁抱新時代”。
【詳細】2018(第三屆)全國黨報網站高峰論壇   2018(第三屆)全國黨報網站高峰論壇暨全國黨報網站總編輯看天津活動6月20日在天津市舉行,主題為“媒體融合:宣傳新時代 擁抱新時代”。 【詳細】