人民网
人民网>>传媒>>人民网奖学金>>哈尔滨工业大学>>哈工大2015

个性化推荐——人民网发展的利器

王维国
2016年03月16日10:46 | 来源:人民网研究院
小字号

摘要:在互联网蓬勃发展的今天,网络已经成为人们获取新闻咨询的的主要途径,人民网——新闻媒体行业的领先者,势必要将互联网作为其主要的传播途径,但是传统的通过简单地新闻内容展示的模式已经完全行不通了,本文通过介绍个性化推荐算法,以及结合人们网自身情况,为人民网的发展提出一些建议。

关键字:个性化推荐;人民网;用户;算法

一.引言

产生于电子商务领域的个性化推荐技术是基于对用户的偏好进行分析对用户推荐商品的一种创新性的方法,这种方法会大大提高商品成交的机率,如今个性化推荐的算法已经越来越完善,而且效果越来越好,如果我们将其应用到新闻媒体行业之中,是否会为这个行业注入新鲜的活力呢?本文通过介绍个性化推荐和个性化推荐算法并结合人民网的自身情况,为其发展提出一些可行的技术和对策。

二.个性化推荐

1.个性化推荐的简介

个性化推荐一词最早出现在电商行业,是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解决这些问题,个性化推荐系统应运而生

2.个性化推荐的发展历程

1995年3月,卡耐基.梅隆大学的Robert Armstrong等人在美国人工智能协会上提出了个性化导航系统Web Watcher; 斯坦福大学的Marko Balabanovic等人在同一会议上推出了个性化推荐系统LIRA

1995年8月,麻省理工学院的Henry Lieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Litizia;

1996年, Yahoo 推出了个性化入口My Yahoo;

1997年,AT&T实验室提出了基于协同过滤的个性化推荐系统PHOAKS和Referral Web;

1999年,德国Dresden技术大学的Tanja Joerding实现了个性化电子商务原型系统TELLIM;

2000年,NEC研究院的Kurt等人为搜索引擎CiteSeer增加了个性化推荐功能;

2001年,纽约大学的Gediminas Adoavicius和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro;

2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站;

2003年,Google开创了AdWards盈利模式,通过用户搜索的关键词来提供相关的广告。AdWords的点击率很高,是Google广告收入的主要来源。2007年3月开始,Google为AdWords添加了个性化元素。不仅仅关注单次搜索的关键词,而是对用户近期的搜索历史进行记录和分析,据此了解用户的喜好和需求,更为精确地呈现相关的广告内容。

2007年,雅虎推出了SmartAds广告方案。雅虎掌握了海量的用户信息,如用户的性别、年龄、收入水平、地理位置以及生活方式等,再加上对用户搜索、浏览行为的记录,使得雅虎可以为用户呈现个性化的横幅广告。

2009年,Overstock(美国著名的网上零售商)开始运用ChoiceStream公司制作的个性化横幅广告方案,在一些高流量的网站上投放产品广告。 Overstock在运行这项个性化横幅广告的初期就取得了惊人的成果,公司称:“广告的点击率是以前的两倍,伴随而来的销售增长也高达20%至30%。”

2009年7月,国内首个个性化推荐系统科研团队北京百分点信息科技有限公司成立,该团队专注于个性化推荐、推荐引擎技术与解决方案,在其个性化推荐引擎技术与数据平台上汇集了国内外百余家知名电子商务网站与资讯类网站,并通过这些B2C网站每天为数以千万计的消费者提供实时智能的商品推荐。

2011年8月,纽约大学个性化推荐系统团队在杭州成立载言网络科技有限公司,在传统协同滤波推荐引擎基础上加入用户社交信息和用户的隐性反馈信息,包括网页停留时间、产品页浏览次数,鼠标滑动,链接点击等行为,辅助推荐,提出了迄今为止最为精准的基于社交网络的推荐算法。团队目前专注于电商领域个性化推荐服务以及商品推荐服务社区——e推荐。

2011年9月,百度世界大会2011上,李彦宏将推荐引擎与云计算、搜索引擎并列为未来互联网重要战略规划以及发展方向。百度新首页将逐步实现个性化,智能地推荐出用户喜欢的网站和经常使用的APP

2.基本框架

·基于云计算的个性化推荐平台

消除数据孤岛,建立基于用户全网兴趣偏好轨迹的精准云计算分析模型,打通用户在多个网站的兴趣偏好,形成成用户行为偏好大数据中心。

·多种智能算法库

基于多维度的数据挖掘、统计分析,进行算法模型的建立和调优。综合利用基于内容、基于用户行为和基于社交关系网络的多种算法,为用户推荐其喜欢的商品、服务或内容。

电子商务推荐系统的主要算法有:

(1) 基于关联规则的推荐算法(Association Rule-based Recommendation)

(2) 基于内容的推荐算法 (Content-based Recommendation)

内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。

通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前喜欢的产品相似的产品。如新闻组过滤系统News Weeder。

基于内容过滤的系统其优点是简单、有效。尤其对于推荐系统常见的冷启动(Cold Start)问题,Content-based方法能够比较好的进行解决。因为该算法不依赖于大量用户的点击日志,只需要使用待推荐对象(item)本身的属性、类目、关键词等特征,因此该方法在待推荐对象数量庞大、变化迅速、积累点击数稀少等应用场景下有较好的效果。但该方法的缺点是对推荐物的描述能力有限,过分细化,推荐结果往往局限与原对象相似的类别中,无法为客户发现新的感兴趣的资源,只能发现和客户已有兴趣相似的资源。这种方法通常被限制在容易分析内容的商品的推荐,而对于一些较难提取出内容的商品,如音乐CD、电影等就不能产生满意的推荐效果。

(3) 协同过滤推荐算法 (Collaborative Filtering Recommendation)

协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。

与传统文本过滤相比,协同过滤有下列优点:

1)能够过滤难以进行机器自动基于内容分析的信息。如艺术品、音乐;

2)能够基于一些复杂的,难以表达的概念(信息质量、品位)进行过滤;

3)推荐的新颖性。 正因为如此,协同过滤在商业应用上也取得了不错的成绩。Amazon,CDNow,MovieFinder,都采用了协同过滤的技术来提高服务质量。

协同过滤推荐算法,可进一步细分为基于用户的协同过滤(user-based collaborative filtering)和基于物品的协同过滤(item-based collaborative filtering)。

基于用户的协同过滤的基本思想是:根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群,在一般的应用中是采用计算“K- 邻居”的算法;然后,基于这 K 个邻居的历史偏好信息,为当前用户进行物品的推荐。

基于物品的协同过滤的基本原理也类似,该方法根据用户和物品直接历史点击或购买记录,来计算物品和物品之间的相似度,然后根据用户的历史偏好的物品信息,将挖掘到的类似的物品推荐给用户

基于用户的协同过滤和基于物品的协同过滤各自有其适用场景。总的来看,协同过滤方法的缺点是:

1)稀疏性问题:如果用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确;

2)可扩展性问题:随着用户和商品的增多,系统的性能会越来越低;

3)冷启动问题:如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐。

4)长尾问题:对微小市场的推荐。

因此,现在的电子商务推荐系统都采用了几种技术相结合的推荐技术。

三.人民网简介

1.人民网概述

人民网,创办于1997年1月1日,是世界十大报纸之一《人民日报》建设的以新闻为主的大型网上信息交互平台,也是国际互联网上最大的综合性网络媒体之一,其前身是人民日报网络版。人民网主营业务主要涉及新闻信息采集及发布业务、互联网广告业、信息服务业及移动增值服务等。

人民网设有《人民日报》、PDF版和报系20多份报刊的电子版,网民覆盖200多个国家和地区。其旗下拥有人民在线、人民视讯、环球网三家控股公司,并在国内各省市设立了地方分公司。与此同时,人民网还积极推进全球化布局,先后在日本、美国、美西、韩国,英国、俄罗斯和南非成立分社并设立演播室,大大提升了人民网的国际传播力和影响力。人民网中国共产党新闻、中国人大新闻、中国政府新闻、中国政协新闻、中国工会新闻、中国妇联新闻、中国科协新闻等栏目构成中央网群板块,已成为发布国家重要新闻、权威解读政策法规和沟通人民群众的重要桥梁。

2.人民网现状

不难发现,人民网作为国内综合性网络媒体的领头羊,是新闻媒体行业的权威领导者。一方面,其极高的知名度带来了大量用户和媒体的关注与信任。另一方面,其丰富的资源为其优质新闻内容的推广打下坚持的基础。实力是有的,但是发展的情况在我看来不容乐观,拿一个同样是在新闻领域的应用——今日头条,今日头条于2012年3月创建,于2012年8月发布第一个版本,截至2015年5月,今日头条累计激活用户数达2.5亿,日活跃用户超过2000万, 而人民网呢,用户数量很少(请看上侧的图片),与人民网相比,今日头条根本不值一提,没有强大的原创能力,但是今日头条有一个优势,那时是个性化推荐,拿今日头条的app来说,不同的用户的APP界面是不同的,因为今日头条对用户进行分析,根据其各种的信息行为(就是指用户在互联网上的行为)分析出用户的偏好,然后根据这个对用户进行推送,这样用户会很容易被吸引,不必在众多的信息中寻找自己喜欢的新闻,极大地提高了用户体验,但是今日头条的新闻的实效性十分差,经常推荐给你的新闻不具有时效性,但是用户并不是十分在意,所以用户增长十分快,并且成为主流应用,人民网虽然新闻质量十分高,但是信息量过大,经常会有用户花好长时间才能找到自己喜爱看的文章,所以用户体验特别差,所以用户量不是很高,作为国家重点新闻网站的排头兵,传播能力很重要,但是如果用户的数量都不是很多,传播能力能够提高吗?

四.算法

大家请看下面的图

用户在浏览信息的过程中,如果用户A浏览过某一对象,用户B同样浏览过这个对象,则说明这两个用户之间存在偏好的相同或相近,这样的话,如果我们知道莫以用户的偏好,我们就可以根据这个用户的偏好,给另一个用户提供推荐,当然这只是两个用户之间,我们可以多个用户之间,虽然这样的推荐会有一定的的误差,但是比起没有规则的推送,我觉得这样更有意义。

在用户浏览信息的过程中,如果用户点击并浏览了某一个对象,我们就将用户与对象之间建立联系,如何建立呢?就是将对象自身所带的标签填充到用户自己的数据库中,然后在下次推荐用户的时候我们就可以根据我们之前存在数据库中的内容就行推荐,这种算法就要求用户有一定的使用,这样我们才能够使用这种,要求每次使用我们都要监视用户的使用情况,然后我们要根我们监视得到的数据对用户的数据库进行更新,不断完善我们对用户偏好的完善,这样我们推荐就会越来越准确。

这个说的就是我们要完善自己数据库(或者说是升级)就是我们首先要做的是将我们数据库中的对象加上标签(一个对象可以定义多个标签),然后我们运用计算机经行匹配,下面讲一下具体如何进行匹配。首先我们要明确标签的定义方式,针对一个对象,我们可以抽取他的要素经行匹配,即我们要利用时间、地点、人物、还有事件进行定义前三个好说,直接就是利用就可以,关键是最后一个事件,这个有一点难度,我想了两种方式:一是根据事件的类别精心划分,二是提取事件的主要内容,但是我觉得第二种不太可取,因为我们最后时要用计算机进行匹配,如果用这种方法的话,技术上会有一定的难度。标签定义完之后,我们开始要建立对象之间的联系,在推荐的时候,比如说,用户喜欢某个对象,然后我们就可以推荐与这个对象有联系的对象,这样做的最大的好处就是可以发现用户潜在的偏好,偏好越多,就对我们越有利。

解释一下这里的用户的相关信息指的是什么:就是用户在其他平台上的信息行为。虽然用户没有在我们的平台上产生信息行为,但是他在其他的平台上进行了一些信息行为,我们就可以利用用户在这些平台上的信息行为对用户的偏好进行分析。不过这里存在一个问题,就是我们如何才能得到用户在其他品台上的数据呢,我认为可以使用第三方登录的方法,获取一些权限,这样我们就可以使用用户的数据,具体的分析手段我就不去解释了,这些技术都已经公开,没用技术壁垒了。

五.与人民网实际结合

1.准备工作

·标签

标签就是指根据对象的情况,对对象进行概括、精简描述,比如说有一个关于习大大出访美国的新闻,这样我们就可以将这篇新闻定义出标签:习大大、美国等,就类似这样的,将每个对象都定义一个或多个标签。

·数据库

我们要建立多个数据库,第一个是用户的数据库,这个数据的功能是保存用户的偏好,即用户喜欢的标签。第二个是对象数据库,要求我们要对每一个对象进行“标签处理”,将定义的标签与对象绑定,同时建立相类似的对象之间的联系,同时记录在一定的时间内访问该对象的用户,(为了使用算法1进行推送)。

·编写程序

根据上面的4个算法,编写程序,要综合利用这4个算法,同时使用,只有这样才能将用户的偏好分析的更加全面、更加快速。

·内容编写

与第二个结合,重点完成对象数据库的建立,人民网具有强大的原创能力,所以要不断的开发新的内容,是我们的对象成为我们的核心竞争力。

2.具体实施

对人民日报的APP进行修改,运用我上面提到的算法进行完善,会有一个问题出现,就是新闻内容可能会出现内容是不会具有时效性,就是因为我们是根据用户的偏好进行推送,所以可能会出现我们推送了很久以前的文章,这个我个人认为没什么,因为如果不考虑这个的话,我们推送的话就可能有多种多样的选择,这样产生的效果会更好,但是如果一定要追求新闻的时效性的话,我们也可以在对象的数据库中设定时间这个条件,对已经失去时效性的文章删除。

六.总结

在移动互联的浪潮之中,真正的发现用户的需求,在这个信息大爆炸的时代,真正挖掘用户的偏好,提高用户的体验,已经成为了各大互联网公司的主要发力方向,人民网,作为中央重点发展的新闻媒体企业,应该迎头前进,充分发挥自身已有的优势,结合个性化推荐功能的实现,为用户带去顶级的体验,提高用户粘性,这不仅会给企业带来一笔不错的受益,更加会助力中央的各个文件精神的传播,守住人民网长久以来的领导和权威的地位!

七.参考文献

【1】高翔,电子商务个性化推荐系统中协同过滤算法的研究

【2】个性化推荐,百度百科http://baidu.baidu.com/link?url=NJJ5Wytz8qId9xD7Kh 6AvY087_rz3gIlpZqAUJtnef7TmqmYKMV96mnMEw1Thtn8sMiIPbILz7i0butx408hSq

【3】用户信息行为,百度百科 http://baike.baidu.com/view/11796757.htm 

(责编:王妍(实习)、燕帅)

分享让更多人看到

传媒推荐
  • @媒体人,新闻报道别任性
  • 网站运营者 这些"红线"不能踩!
  • 一图纵览中国网络视听行业
返回顶部