人民网
人民网>>传媒

算法+人工才是最有效识别工具

李雪昆
2017年06月20日15:40 | 来源:中国新闻出版广电报
小字号
原标题:算法+人工 才是最有效识别工具

  谈及算法,相信今日头条的实践是较有说服力的。在2017媒体融合发展高峰论坛期间,今日头条人工智能实验室总监李磊在谈到人工智能技术如何帮助解决信息治理困境时表示,目前的算法并不是万能的,仍需要人工确认。

  据了解,截至去年年底,今日头条算法模式对“头条号”低质、低俗内容的识别准确率已达到80%,并可将“头条号”平台上超过90%的低俗内容识别出来。通过智能算法可以辅助内容生产者选择封面图片;可以识别标题党文章,进而通过人工审核确认后进行相应撤回;可以自动识别文章质量,低质量文章后台会自动撤下进入人工复审环节,而高质量文章将被推送至重要位置。更有趣的是,通过智能算法,平台还可以对内容生产者的图片进行自我美化。

  “因为我们的产品和用户数量非常大,对人工智能的需求也非常大,我们如何把推荐做好,首先就是要学会运用机器学习、数据挖掘等技术来理解文章的主题、人物关系等。而且对于机器学习来说,数据越多越有意义。”李磊说道。

  如果您是今日头条的用户,是不是有时也会吐槽,首页打开并不是我想要的内容,甚至推荐大多是比较八卦的内容?

  对此,李磊表示,这其中涉及推荐算法中新用户启动的问题。“我们的算法是默认在你首次启动时给你推荐关注人数较多的新闻,但随着用户阅读、评论等行为的发生,机器能够更多了解用户的偏好,从而去推荐给用户相关的内容。”

  当然,有些用户会说,大家都关注的东西我并不感兴趣,针对这些情况,今日头条也在做对新用户的推荐算法调整,包括热点内容与其他内容的平衡等。但这样的平衡又往往涉及众多内容,比如有些人一段时间喜欢体育新闻,可过阵子又不关注了,毕竟,用户有时是善变的。

  在解读中,李磊表示,这又涉及另外一个问题。今日头条现在采用的推荐算法有两个:一个叫“利用”,就是说从分析用户过去的阅读行为,利用这些数据对用户进行预测。比如用户可能过去对体育感兴趣,今日头条就会为你推荐体育新闻;另一个叫“发现”,即尽可能去发现一些新的兴趣点,可能是用户喜欢的,也可能是其讨厌的。用户可以通过点击页面上的“不感兴趣”与客户端互动,不断去调整,让平台抓住用户额外的兴趣。

  “这个实际上到技术端是比较难的问题,我们也会想一些办法去更多地了解用户,比如希望用户关注一些头条号,我们通过用户的订阅行为来分析和推荐。”李磊表示,机器自动推荐每天的量非常大,这是人工不可能完成的任务,尤其是面对几千万日活用户,还要求每个人首页个性化,这是非常难的。当然,今日头条在过去一年也对算法进行了调整,比如对标题党以及低质内容的识别做了改进,随着数据的增多,其识别率会越来越高。

(责编:赵光霞、宋心蕊)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部