公务员期刊网 精选范文 个性化推荐范文

个性化推荐精选(九篇)

个性化推荐

第1篇:个性化推荐范文

关键词: 个性化推荐;算法;推荐系统

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)27-0162-02

1个性化推荐系统

随着互联网的飞速发展和云计算的兴起,人们已然处于一个信息爆炸的大数据时代。每天面对海量的数据信息,搜索引擎在一定程度上为人们解决了信息筛选问题,但当用户无法用准确的关键词描述自己的需求时,搜索引擎的筛选效率将会打折扣。用户如何在一个网站上快速而有效地找到自己所需要的信息?网站如何将用户最关注最感兴趣的信息筛选出来实时呈现在用户面前?推荐系统的出现解决了这些问题。

推荐系统是根据用户的兴趣爱好向用户推荐符合其需求的对象,亦称为个性化推荐系统。个性化推荐系统通过一定的方式将用户和信息联系起来,不仅可以帮助用户找到感兴趣的信息,而且能够将信息分类呈现在不同的用户面前,从而实现用户与信息提供商的双赢。个性化推荐系统已经全面运用到各个互联网网站中。在电子商务领域,网站通过使用个性化推荐系统向用户推荐其可能感兴趣的商品,提高用户的购买率和用户的忠诚度。Netflix网站使用个性化推荐系统为用户推荐喜欢的电影,豆瓣电台通过个性化推荐系统向用户推荐符合其口味的好音乐,Goodreads网站利用推荐系统为用户推荐适合其阅读的书籍。

2个性化推荐系统中关键算法分析

个性化推荐系统为用户提供个性化体验的同时,也日益受到越来越多的学者和互联网网站的关注。个性化推荐系统的工作原理是首先输入数据源(用户和项目的各种属性和特征,包括年龄、性别、地域、物品的类别、时间等),然后选择合适的推荐算法,最后将产生的推荐结果(按照用户喜好程度排序的项目列表)推荐给用户。不同的个性化推荐系统使用不同的推荐算法,因此个性化推荐系统最为核心之处在于根据不同的数据源选择不同的推荐算法。

目前,个性化推荐系统中主要使用的推荐算法有:协同过滤推荐算法、基于内容的推荐算法、基于人口统计学的推荐算法、组合推荐算法。下面对主要的推荐算法进行比较并分析它们的优缺点及适用场景。

2.1协同过滤推荐算法

协同过滤推荐是使用最广泛的个性化推荐算法之一。协同过滤有两种主流算法:基于用户的协同过滤和基于项目的协同过滤。

2.1.1基于用户的协同过滤

基于用户的协同过滤是根据不同的用户对项目的评分来测评各用户之间的相似性,基于用户间的相似性进行推荐。即通过用户的浏览记录、购买行为等信息分析各个用户对项目的评价,发现与当前用户最相似的“邻居”用户群(“K-邻居”的算法);然后将K个邻居评价最高并且当前用户又没有浏览过的项目推荐给当前用户。基于用户的协同过滤推荐算法是以用户与用户之间的关系为着眼点,因为兴趣相近的用户可能会对同样的东西感兴趣。如:Facebook网站首先对用户个人资料、周围朋友感兴趣的广告等相关信息进行分析,计算出各用户之间的相似性,进而对用户提供广告推销。所以说,在当前流行的社交网站中,基于用户的协同过滤推荐是一个不错的选择,若将基于用户的协同过滤推荐算法与社会网络信息相融合,会增加用户对推荐解释的信服程度。

2.1.2 基于项目的协同过滤

基于项目的协同过滤是通过用户对不同项目的评分来测评各个项目之间的相似性,基于项目之间的相似性做出推荐。即利用所有用户对物品或者项目的偏好,计算不同物品或项目之间的相似度,然后根据用户的历史信息,将类似的物品或项目推荐给用户。基于项目的协同过滤是以项目与项目之间的关系为中心,因为用户可能偏爱与他已购买的商品类似的商品。如在购书网站上,当用户看一本书时,网站会给用户推荐相关的书籍。此时,基于项目的协同过滤推荐成为了引导用户浏览的重要手段。对于一个电子商务网站,用户的数量远远超过商品的数量,同时商品的数据相对稳定,因此计算商品的相似度计算量较小,不必频繁更新。所以基于项目的协同过滤推荐适应于提供商品的电子商务网站。

协同过滤推荐算法优势在于:不需要各领域的知识;能跨类型推荐(如推荐音乐、艺术品、电影等);计算出来的推荐结果是开放的,可以共享他人的经验,能很好地发现用户潜在的兴趣爱好;自适应性好;随着时间推移预测精度会提高。

协同过滤的推荐算法不足之处在于对于历史信息依赖性较强;还有冷启动问题,当新用户或者新物品进入系统时,难以进行个性化推荐。同时在大规模网络中,数据极端稀疏,算法效率较低,难以处理大数据量下的即时结果。

2.2基于内容的推荐算法

基于内容的推荐算法是根据历史信息(如评价、分享、收藏过的文档) 学习用户的兴趣,建立用户偏好文档,计算待推荐项目与用户偏好文档的匹配程度, 将最相似的项目推荐给用户。如:在音乐推荐中,基于内容的推荐系统首先分析用户欣赏过的音乐的共性(歌手、曲风等),再推荐与用户感兴趣的音乐内容相似度高的其他乐曲。

基于内容的推荐算法生成推荐的过程主要依靠三个部件:(1)内容分析器:用一种适当的方式表示从项目信息中提取的有用信息。(2)文件学习器:该模块收集用户偏好的数据,生成用户概要信息和偏好文档。(3)过滤部件:通过学习用户偏好文档,匹配用户概要信息和项目信息,将生成一个用户可能感兴趣的潜在项目评分列表。

基于内容的推荐算法生成的推荐结果直观明了,容易理解。不需要领域知识,不需要很大的用户社区,仅需要得到两类信息:项目特征的描述和用户过去的喜好信息。

基于内容的推荐算法有三个主要缺陷:(1)过度规范问题:推荐给用户的项目与其消费过的项目很相似,不能为用户发现潜在感兴趣的资源。 (2)内容分析有限:只能预处理一些易提取的文本类内容(网页、博客等),而在提取多媒体数据(图像、音频、视频等)时较困难。(3)冷启动问题:当一个新用户没有对任何项目进行评分或没有浏览过任何商品时,系统无法向该用户提供准确的推荐。

2.3 基于人口统计学的推荐算法

基于人口统计学的推荐算法是根据人口统计学数据(即系统用户的基本信息:年龄、性别、工作、兴趣、爱好等),计算用户间相关程度,得到当前用户的最近邻集,然后将把“邻居”用户群喜爱的项目推荐给当前用户。

基于人口统计学的推荐算法优势在于:不需要用户的历史喜好信息,可以很好解决冷启动问题;不依赖于项目的属性,其他领域的问题都可以无缝接入;而且随着时间推移,预测精度也会逐渐提高。

但是在一些有较高要求的领域(如:音乐、艺术品、电影、书籍等)进行推荐时,此算法对用户基本信息进行分类过于粗糙。同时在收集人口统计信息时,不易获取比较敏感的信息,从而导致推荐系统在准确度方面不如其他算法,无法得到良好的推荐效果。

除了上述比较典型的推荐算法,还有其他一些推荐算法: 基于知识的推荐算法、基于效用的推荐算法和基于关联规则的推荐算法。基于关联规则的推荐算法是将用户的购买历史记录、浏览痕迹、打分记录作为数据源,挖掘出的关联规则就是推荐对象。关联规则挖掘是用来发现不同商品在销售过程中的相关性,而且关联规则的发现是算法的关键,也是算法的瓶颈。

2.4 混合推荐算法

任何一个个性化推荐算法都有它独特的优势和不可避免的缺陷,因此现实应用中,直接用某种算法来做推荐系统的很少,往往是将各种推荐算法组合起来,这样可以扬长补短,提高推荐的准确度和效率。尤其是大数据环境下,各种混合推荐算法的推荐效果要优于单一推荐算法。基于内容的推荐算法和协同过滤算法都无法解决冷启动问题,因为这两种算法都需要历史信息。若将协同过滤推荐算法与基于知识的推荐算法组合起来,则能很好地解决冷启动问题。

文献[2]以电影为推荐对象, 通过线性组合的方式将基于内容的推荐算法和基于协同过滤的推荐算法相融合, 得到最终的推荐结果。两种算法的组合很好地避免了基于内容推荐算法不适合推荐多媒体数据的缺陷, 解决了协同过滤算法中用户对电影评分少的数据稀疏的问题。

在一些大型的网站使用的就是融合了多种算法的推荐系统。比如淘宝网为顾客推荐商品时采用了基于内容和基于关联规则两种算法的组合。根据用户的浏览痕迹、收藏记录、购买行为以及反馈信息产生可推荐的关联规则,根据商品的相关属性(描述,评价,名称,收藏人气,累计销量等等)对优质商品进行评分,计算出用户带权重的标签,最后进行个性化推荐。

3 总结与展望

综上所述,个性化推荐系统将用户和项目有机地联系起来,是一个高效的信息服务系统。为增强个性化推荐系统的功能,未来的个性化推荐系统应该将企业的销售系统、客户关系管理系统等企业信息系统集成在一起,共同为企业发展提供决策支持。那么个性化推荐系统如何与这些系统集成,如何与社会网络相结合,改变用户购物模式,企业销售方式,都是未来的研究方向。

设计个性化推荐系统最终目的都是为了提高用户体验感和满意度。一个被用户接受和认可的推荐系统,在帮助用户发现潜在感兴趣的项目的同时还能够帮助项目提供商将项目投放给对它感兴趣的用户。一个好的推荐系统能够对公司或业务产生增值效应,会给用户带来更好的体验。但是如何将用户的体验感进行量化是一个具有挑战性的课题。

参考文献:

[1] 张亮,赵娜.改进的协同过滤推荐算法[J].计算机系统应用,2016,25(7)

[2] 马瑞敏,卞艺杰,陈超,吴慧.基于Hadoop 的电子商务个性化推荐算法――以电影推荐为例[J].计算机系统应用,2015,24(5).

[3] 乔亚飞,张霞,张文博.智能图书系统中的个性化推荐[J].计算机系统应用,2016,25(9).

[4] 朱郁筱,吕琳媛.推荐系统评价指标综述[J].电子科技大学学报,2012,41(2).

[5] 朱扬勇,孙婧.推荐系统研究进展[J].计算机科学与探索,2015,9(5).

[6] 刘鲁,任晓丽.推荐系统研究进展及展望[J].信息系统学报,2007(1).

第2篇:个性化推荐范文

2011年3月6日,推荐系统高峰论坛在北京举行,知名IT评论人洪波,豆瓣网首席科学家王守纷纷表示,WEB2.0时代的到来,互联网已经变得更为分享化和个性化,在今后的10年内,推荐技术会对人类生活产生越来越重要的影响。无论是在电子商务特别是B2C领域,还是SNS中好友的推荐,推荐算法都将变得无所不在。

随着WEB2.0时代的到来,个性化推荐系统受到越来越广泛的应用。在国内,无论是基于电子商务的淘宝、当当,还是基于网络社区的QQ、人人网、豆瓣,随处都可以看到它的身影,它为人们推荐商品进行消费,推荐友邻。淘宝在2011年3月31日提出向全球公布淘宝宏观交易数据,像国外的企业学习,在高校中建立自己的研究所,并且开展推荐算法的竞赛。

事实上早在1998 年,Amazon网站就已经开发出了自己的基于项目的个性化推荐系统,它通过用户的浏览历史、购买历史、物品的版本、他人的购买记录来得出推荐结果,如今Amazon的推荐系统为其提供了35%的商品销售额,并成为个性化推荐界的领袖。另一个知名个性化推荐例子是在线影片租赁提供商Netflix,它在2006年悬赏1百万美元把电影预测的效率提高10%以上,最终这个百万大奖由一个电脑专家、统计专家和人工智能专家组成的七人团队获得。

Hunch(预感)网站号称是一个在生活中可以帮你做决定的网站。它在2009年由麻省理工的学生开发,注册用户要先回答十个基本问题,再加上用户为推荐结果的打分,给出建议。用户如果点击推荐结果,就会链接到该产品的官方网站(例如Amazon),Hunch就可以从这些公司拿到分成。这样的模式现在被广泛用于豆瓣这样的SNS网站。

根据算法不同,目前的推荐系统可分为基于内容的推荐系统、协同过滤推荐系统以及混合推荐系统等。基于内容过滤的推荐系统通过分析资源内容与用户档案的相似度来产生推荐,但是目前无法实现对音乐图像、视频等信息的推荐。协同过滤式基于用户的评分计算相似度,所以不用分辨对象的属性也能处理各种复杂的对象。由于协同过滤和基于内容的推荐系统都有各自不足,所以将两者结合的混合推荐、神经网络推荐等算法被提了出来。

协同过滤算法就如同在实际生活中,遇到不熟悉的人事物,每个人都会先想到咨询身边熟悉的朋友,得到他们的判断和看法后,再做出自己的选择。打个比方,我们可以根据用户A的评分和评论等,在他的友邻中找出品位相似度最高的用户B、C、D,再根据B、C、D的兴趣或偏好项目集,计算出A对项目的预测评分,推荐高分项目给A,再将预测值与A的实际评分做出比较。

协同过滤技术成熟且出现时间长,但它存在许多问题。其中最严峻的是数据稀疏性问题,在实际中,用户并不会积极提供评分,即便是常年经营的电子商务网站用户评分和购买的商品也只占总商品数量的1%以下,这种极端的稀疏性使得相似性计算耗费巨大,因此难以成功定位邻居用户集,产生的推荐结果也将不理想。像Netflix、Amazon的推荐系统尚且依赖于多年积累的超大物品和用户的集体行为数据库,然而新公司要怎么样才能跟它们竞争呢?

一种借助遗传学思想的基于基因的推荐系统出现了。最早的潘多拉推荐系统就应用了这样的思维,将音乐分解成基本的基因片段,利用音乐片段之间的相似性做一个音乐推荐系统。这样电台今天已经随处可见,豆瓣网、人人网都有。它可以不需要知道用户的口味,因为它有自己的音乐DNA数据库,它可以在不知道用户喜欢什么的情况下,通过用户几次选择喜欢或不喜欢来了解用户的口味,用户只要选出一个艺人,或者一首歌,就可以建立一个始终播放类似音乐的电台,并且它还能为用户推荐其他类型的音乐,扩展兴趣面、转变用户的口味。

依靠用户注释标签的方式,这种基于基因思想的推荐方法已经被广泛用在书籍、电影、音乐等其他推荐领域。在豆瓣、淘宝,你都可以组建一系列自己的商品标签,也可以使用固定标签,通过组合你想要的标签,可以得到更个性化的、灵活的项目的推荐排名。经过一段时间的使用后,足够的标签就变为了项目的“基因”。

在不久的未来,推荐系统不将只是覆盖影视、阅读、购物的领域,而将推荐选择就读的学校、推荐合适的相亲对象,推荐实习、工作和朋友,覆盖到生活中的方方面面。未来推荐系统会“比我们更了解我们”的情节,将不再只是出现在科幻小说中。

参考文献

第3篇:个性化推荐范文

移动互联网大潮来临,基于移动端的各种新闻客户端成为人们获取资讯的主要媒介,这也成为新旧媒体融合发展中的一大主要态势。与过去典型以来编辑操作的传统媒体不同的是,如今的移动新闻客户端把机器的角色放在了首要位置中。这是新科技革命为媒体发展带来的福利,技术驱动型媒体平台如雨后春笋般搭建开来,共享经济环境下全民创作势不可挡。随着更多种类丰富的内容不断诞生,有限的编辑劳动力感受到了运营的负担,及时编辑部投入很大的运营成本增加运营人员,在个性化阅读者日益差异化的阅读兴趣面前仍显得微弱。在资本和技术的推动下,“大智移云”成为时代背景,技术公司成为主导媒体生态的一大重要角色,个性化推荐新闻客户端被广泛运用。

个性化新闻客户端最先由“今日头条”带动而来,如今在北京的大街上,到处可见它的商业广告,各方数据也不断说明今日头条所获得的用户群体已占客户端相当大的一部分;接着,腾讯新闻客户端、一点资讯客户端、搜狐新闻客户端陆续引入个性化推荐的机器算法,实现编辑+机器二力共同作用的新闻信息制作模式。任何一个人的手机页面中,都能够出现更多符合个人兴趣点的多方面内容,突破了新闻单一枯燥的特点,正在得到更多人的好评。

二、个性化推荐新闻客户端中的问题

个性化推荐新闻客户端让忙碌的人们不再受困于海量信息,能够在很快的时间内获得自己需要的信息。但这种机制的优势也容易带来不可忽视的缺陷。

(一)自媒体平台门槛低导致内容源参差不一

以个性化推荐新闻客户端为例,现在几乎每家客户端都搭建了自媒体平台,所有有能力参与创作的人都可以通过注册账号提供内容,而这些文章一经,便通过高度快捷的个性化推荐机制传播到各处。这种传播效率令人欣慰,但需要思考的是,这些科技媒体担负的不再是媒体的角色,新闻专业主义从来也不是他们需要考虑的问题。在商业化运营的过程中,这些提供内容制作的平台把海量内容当作吸引流量的入口,大肆鼓励各行各业的人们参与创作,既要满足大类阅读需求,更要满足小众群体的长尾阅读需求。我国网民呈现出低年龄、低学历、低收入水平的特点,而当这些人参与到个性化推荐客户端的制作中后,就很容易暴露出更多问题。

(二) 内容娱乐化、浅薄化带来乱象

以“今日头条”为例,笔者通过长时间的使用,观察发现其并不能做到基于读者兴趣的个性化推荐,首屏推荐内容多为娱乐八卦类内容。一点资讯客户端的首页推荐基本符合用户兴趣,但也夹杂着笔者并未订阅过的娱乐八卦内容。社交媒体环境下,碎片化的浅阅读已成为常态。技术的运用、硬件的升级,使得如今的个性化推荐新闻客户端打破了传统媒体单一的功能,它所承担的多功能价值已经对它自身的功能提出挑战,它已成为集媒体、社交、娱乐、购物于一体的多功能媒体,而这同时也折射出个性化推荐新闻客户端所面对的社交场景。事实上,人类已走进娱乐时代,任何人都深受着“娱乐至死”的影响,个性化推荐新闻客户端的内容除了新闻信息,同时提供了视频、游戏、小说、音乐等其他娱乐方式。数据表明,视频、游戏、音乐已经成为用户最热衷的移动娱乐方式。娱乐化时代,人们忽视了严肃新闻的方向,过多了关注了娱乐性,个性化推荐新闻客户端从内容和功能上来说,已是促使个性化推荐新闻客户端自身文化不断娱乐性的原因所在。

(三)个性化推荐客户端限制用户视野

个性化推荐新闻客户端的特点在于,人们基于“强关系”而产生的社会信任,使人们形成了较之以往更为密切的社会互动,个体与个体之间、个体与社会之间的联系日益紧密。人们为了感知世界的变化,不再主动去寻找自身需要的文化信息,而是依赖于社交媒体所形成的社群氛围,社群传递什么样的文化信息,人们就选择接受什么样的文化信息,因此,自身对于世界的认知过程已经变成了对这一社会群体中文化信息所形成环境的印象。在移动社交时代,人们的生活与个性化推荐新闻客户端注定彻头彻尾的捆绑在一起,正如麦克卢汉所说的,“媒介是人的延伸”,在一个快速变动而有丰富多元的移动化时代,移动互联网已成为一种普遍的生活方式,而个性化推荐新闻客户端也将这个时代的媒介文化呈现出不同特点。

三、个性化推荐新闻客户端的发展

以智能手机媒体为代表的个性化推荐新闻客户端,无论是对于电视环境下成长的一代,还是对于互联网环境下成长的一代,都带来了全新的改变。作为一种肩负文化传播的平台,它也应该营造出精英文化与大众文化和谐发展的场景,从而也使越来越多的优秀文化形态被传递。

(一)打破媒体局限,发挥新闻力量

当前,我国在继续推进社会改革的过程中遇到很多问题,突出了表现为社会转型过程中,由于人们的社会权利不平等造成的不均衡的利益表达机制,使得弱势群体的话语权被牢牢掌握在强势群体。个性化推荐新闻客户端的出现于普及,使得任何人都可以借助媒介平台进行公共活动的讨论,这是新时期为公民赋权的一个最好机会,应该牢牢把握这个有利的形式实现社会民主的进程。所以,现在应努力打破移动社交平台娱乐化、碎片化的信息传递局限。

(二)弥补法律空白,营造媒体环境

新闻客户端的迅速到来,对我国现有关于媒体文化的法律法规和政策监管提出了挑战,我国关于手机等个性化推荐新闻客户端的法律还依然存在空白。个性化推荐新闻客户端的快速性和网络传播模式,很容易在各个环节滋生问题,任何个体作为这张大网上的一个环节,其不良行为都有可能诱发社会问题的产生。面对当下对个性化推荐新闻客户端的控制越来越难的情况,政府应该观察这一新媒体的快速应用带来的危害,尽快完善监督管理立法,尽早出台个性化推荐新闻客户端方面的立法,从媒体终端运营到媒体内容制造等方面规范各个环节,减少由于技术失误带来危害媒介安全和意识形态安全的问题发生。

(三)提高媒体技术,丰富媒体内容

第4篇:个性化推荐范文

关键词:个性化推荐;icon;协同过滤算法;权值;关键点;

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)03-0250-03

1 概述

随着信息时代的不断发展,网络给人们的生活带来了翻天覆地的变化,人们可以足不出户就能够在网络上购买到自己想要的任何商品。网络的便利,使得人们的购物方式得到了改变,同时也滋生了很多购物平台的产生。无论大型还是小型的电子商务平台,都会存在着一些弊端,信息过载问题,就是商品的种类太过于丰富多样性,以至于用户不能很快地查找到自己喜欢的商品。所以平台开发商们就会想尽办法来避免这种情况,个性化推荐应运而生,个性化推荐就是在正确的时间把正确的商品推荐给正确的用户,来拉拢用户,防止用户的流失,从而提升自己平台的竞争力。

1.1课题背景及研究的目的

当今时代是信息的时代,每天人们都会被不同的海量数据所围绕,如何从这些繁杂的数据中找到自己想要的数据,是我们每个人都迫切需要的。我们都希望每个平台系统都能给我们展示出契合我么自己的数据,这样我们就不需要花费太多的精力在寻找数据上。

基于和老师同学们一起做的这个ICON项目(一个类似图片交际购物系统),因为用户的不断增加,所上传的图片也越来越多,为了满足用户查找数据的方便,就打算给系统添加一个个性化推荐策略。由于自己对推荐这一块比较陌生,阅读了多篇关于推荐系统的论文及报告,大多都会涉及诸多复杂的算法,就想到针对我们这个系统来设计一个较为简单的个性化推荐。

1.2 本文主要研究的内容和组织架构

1.2.1 本文主要工作

本文主要探讨了一下个人设计的简单个性化推荐策略及相关工作。介绍了该推荐策略的研究背景和目的,然后又详细地介绍了该策略算法。最后就该研究成果在ICON项目中的应用效果进行了展示,说明了我们算法的可行性。

1.2.2 本文的组织架构

第一章是绪论部分,介绍了个性化推荐系统的背景,以及研究目的。简单个性化推荐策略的由来。

第二章是算法简述部分,大概地介绍了一下算法。

第三章是算法详解部分,在本章节中详细介绍了算法的构成。

第四章是指标的权重计算部分,介绍了算法中一个比较重要的权重计算方法,并计算出了算法中各个特性的权重值。

第五章是结果分析部分,对推荐前后用户滞留系统的时间和点击look的数量进行观察比较,得出分析结果。

2 算法简述

1) 找出平台关键点;

2) 统计关键点数据;

3) 画出涉及关键点的表格;

4) 整理分析,推荐图片;

5) 通过图片推荐给用户商品。

3 算法详解

3.1 找出平台关键点

用户发表一个look(即图片),都会给这个look选择一个性别、季节、品牌、风格等,其中风格包含有正装、暗黑、韩国风、运动、嘻哈等多达20多种的不同风格,其中肯定会有一种是你发表的look风格。性别和风格是主要的,从这两个特性中我们就能看出你平时穿衣打扮,因为发表的每一张look都是对自己平时的一个真实写照。用户发表的每一张look都是对应自己所购买的衣服,从而我们就可以从look中对应到相应的商品中。

抛开性别这个普遍的共性来分析,我们可以根据用户平时发表的look的风格来观察该用户的穿衣习惯,从而得到用户可能喜欢的商品类型,继而向用户推荐他们想要看到或者想要购买的衣服。

在icon的系统中,用户看见自己喜欢的look时,可以对其进行点赞或者收藏。用户也可以关注其他的用户,成为他的粉丝,随时关注他(她)发表的look,你们之间也可以相互交流探讨穿衣打扮的技巧。

在认真观察项目后,可以看出用户发表look的风格就是所谓的关键点。

3.2 y计关键点数据

用户发表的look,关注的look,点赞的look,以及收藏的look我们都统一存到了数据库中。平台是用mybatis连接的数据库,所以,数据我们可以写sql语句直接获取到,而不用去分析历史数据或者网络爬虫去解析用户浏览行为等。

这个算法,我要求只需要能获取到用户偏重的前三个就行,所以常用到的mysql中的limit关键字,limit接受一个或两个数字参数,参数必须是一个整数常量,如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,第二个参数指定返回记录行的最大数目。在使用limit时,要先判断查询到的数据集的数目有多少,防止查询的时候出错。

举个例子,通过tbl_look表和tbl_user_likes表来查找id为131的用户点赞的look风格的前三个的mysql语句:

SELECT tul.id,tul.uid,tul.lookid,tl.style,COUNT(tl.style) AS sc FROM tbl_user_likes tul ,tbl_looks tl WHERE tul.uid=131 and tl.id=tul.lookid GROUP BY tl.style ORDER BY sc DESC LIMIT 3

3.3 画出涉及关键点的表格

为了更形象的观察用户的自己的风格以及自己和其他人的风格,我们将查询的数据用表格的形式展示出来。这样就可以一目了然的通过观察表格得出合理的结论。

3.4 整理分析,推荐内容

分析表1,因为用户发表、点赞和收藏的数量差别可能比较大,所以我们就按照表格中展示的三项以及它们的权值来计算每个用户表侧重的风格。

每个用户的风格评分计算如下:

[fur=i=03wiri]

[fur]表示u用户r风格的评分,其中[wi]表示每个i指标的权值,会在第四章详细介绍权值算法;[ri]表示u用户r风格是否存在i指标的参数,存在为1,不存在为0。

经过计算,我们得出甲用户和丁用户都比较侧重ABC折三种风格,并且甲和丁也互相关注了,那么我们完全就可以认为甲和丁用户风格类似,可以看成是相似用户。按照基于用户的协同过滤算法来考虑的话,我们可以把E风格的服饰推荐给丁用户,而把G风格的服饰推荐给甲用户。

我们还可以得出,BC风格总是在一起,EF风格总是在一起,我们就可以这样认为,喜欢B风格服饰的人通常也会喜欢C风格的服饰,喜欢E风格服饰的人通常也会喜欢F风格服饰的人,反过来也一样。按照基于内容的系统过滤算法考虑的话,我们就可以把B风格的服饰推荐给乙用户。

3.5 通过图片推荐给用户商品

整个系统的模式是这样的,通过用户的各项特征找到一个关键点,再由该关键点给用户推荐look,最后由推荐的look来决定用户可能喜欢的商品(服装)。如图1所示:

4 指标的权重计算

各项指标的权重根据定量统计法算法计算得出。

定量统计计算权重的步骤如下:

1) 按照没有关联、有点关联、关联和非常关联四个等级绘制出统计表格。

2) 以67%(2/3)位界限,若选择“关联”和“非常关联”的比例合计小于67%,就删除该指标,不予考虑。

3) 分别把没有关联赋值为1,有点关联赋值为2,关联赋值为3,非常关联赋值为4,选择出没有关联之外以上数据都进入统计,那么三种选项的权重分别为[w′1]=2/(2+3+4)=0.22;[w′2]=3/(2+3+4)=0.33;[w′3]=4/(2+3+4)=0.45。

4)指标权重计算:

[wi=pii=13pi]

其中[pi]为指标i的统计权值和:

[pi=j=13w′iaij]

其中,[aij]表示i指标除没有关联外的其他关联度的统计数,[a11]就表示指标1有点关联的统计人数,[a32]就表示指标3关联的统计人数。

我们对使用该系统的用户进行了一次统计,随机抽出统计过的100名用户来计算权值。

首先画出统计的表格如下:

分别代表用户发表、点赞和收藏look的风格权值。通过计算得到的数值可明显看出,用户发表和收藏的look风格所占比重比较大,点赞风格所占比重较小。所以,发表和收藏风格的特性能较大反映出用户的风格类型,而点赞风格的特性稍次于发表和收藏特性。

5 结果分析

项目中我们引入了cnzz流量统计、网络分析数据专家,可以通过cnzz来获取到用户滞留平台的时间和点击各个look的数量。

为了验证该个性化推荐策略的可行性,我们随机抽取了四名用户,利用cnzz获取到在推荐系统应用的前后,用户滞留系统的时间(从进入系统到退出系统的滞留时间),以及用户点击look的数量,描绘成线形图如下:

通^这两个柱状图,可以明显的观察到推荐策略应用前后的效果,证明了我们所做的工作的可行性。

参考文献:

[1] 丁宏飞,黄战.个性化电子商务系统中用户兴趣模型的研究[D].广州:暨南大学,2008.

[2] 王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012(9).

[3] 刘玮.电子商务系统中的信息推荐方法研究[J].情报科学,2006(4).

[4] 米鹏,段建勇,付晓宇.面向社区用户的推荐策略研究[D].北京:北方工业大学,2016.

[5] 曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002(5).

[6] 于波,陈庚午,王爱玲,等.一种结合项目属性的混合推荐算法[J].计算机技术应用,2017(5).

第5篇:个性化推荐范文

关键词 网络营销 个性化推荐系统 用户关注度 协同过滤算法

中图分类号:G202

文献标识码:A

一、前言

社会在发展,科技在进步,在以物质、能源、信息为三大支柱的社会体系下,信息已然成为人们生活中至关重要的一部分。随着网络信息技术的不断发展,网络营销作为一种新时代的营销模式,正以其成本低、信息量大、传播范围广、速度快、无时间地域限制、形象生动、可双向交流、反馈迅速等特点显示出传统营销无法比拟的优越性。

人类通过网络搜集信息资源,进行交流和购买等行为,人类的生活在网络信息的影响下变得更加方便和快捷。但是同时随着企业网络营销事业的迅速发展,随着商品种类和个数的增加,顾客在购物的时候需要从海量的信息里进行大量的筛选才能找到自己想买的商品,这就导致了信息过载的问题,让消费者浏览大量的无关信息,浪费了用户的时间和精力,甚至会导致很多的用户在这些繁琐的购买过程中流失。

为了很有效地解决信息过载问题,企业可以采取很多新的网络营销手段,尽量为顾客减少时间或者物质上的浪费,把握住更多顾客的眼球,其中一个很好的网络营销策略就是为顾客提供个性化的网络营销。这样,基于个性化推荐的网络营销就应运而生了。

二、网络营销简介

(一)网络营销的概念。

网络营销(On-line Marketing或E-Marketing)就是以国际互联网络为基础,利用数字化的信息和网络媒体的交互性来辅助营销目标实现的一种新型的市场营销方式。简单的说,网络营销就是以互联网为主要手段进行的,为达到一定营销目的的营销活动。具体有如下几方面的含义:网络营销是市场营销的特殊表现形式;网络营销以互联网为信息沟通手段;网络营销的运作建立在虚拟空间的基础上。

(二)网络营销的方法。

随着网络营销的快速发展,常见的网络营销方法主要包括交换链接、网络广告、网上商店、信息、博客营销、个性化营销、会员制营销、网上视频营销、论坛营销、WIKI营销、网络营销联盟、竞价推广、电子书营销、事件营销、视频营销、品牌营销、整合营销、IM工具营销、微薄营销、病毒性营销等。

(三)我国网络营销的现状。

在我国,网络营销起步较晚,到1996年才开始被我国企业尝试,1997—2000年这三年是我国网络营销的起始阶段,越来越多的企业开始注重网络营销。2000年至今,网络营销进入应用和发展阶段,网络营销服务市场初步形成。目前,网络营销已开始被我国企业采用,各种网络调研、网络广告、网络分销、网络服务等网络营销活动,正异常活跃地介入到企业的生产经营中。据有关国家信息中心统计数字表明,目前我国有8万余家企业已加入互联网,并涉及网络营销,其中以计算机行业、通讯行业、金融行业较为普遍,计算机行业占34%,通讯行业为23%,金融行业为11%,其他为32%。网络营销已经成为电子商务最重要的组成部分,成为许多企业的重要营销策略,营销型的网站越来越成为企业建设的主流,同时网络营销越来越倾向于网络整合营销。中国网络营销已经具备了快速成熟成长的基础。

三、个性化网络营销的应用

随着用户越来越多的各种各样的需求,面临着越来越严重的信息过载的现象,个性化网络营销在快速的发展着,并且逐渐的渗入到各个领域之中,比如Goodreads进行的个性化书籍营销……个性化网络营销已全面运用到互联网网站中,各个企业对不同的物品和不同的用户提供各种各样的服务,进行个性化的网络营销。目前,个性化网络营销发展到的领域最成熟最广泛的领域就是电子商务领域。

(一)电子商务领域。

在电子商务领域,个性化推荐的网络营销已经形成了较为成熟的应用模式。有关数据显示,有三分之一的用户都会根据电子商务的网站推荐买东西,这比任何一个广告给电子商务网站带来的效益都大,这些电子商务网站对用户的推荐很广泛,大到对房子的推荐,小到对袜子的推荐。好多个电子商务的网站中都有“购买该商品的用户也购买了”的信息推荐,还有类似的个性化的模块,比如“我的京东”、“我的淘宝”、“我的亚马逊”、“我的凡客”等等。这些个性化推荐几乎已经遍布各个有名的电子商务网站。

目前,全球电子商务零售类增长最快的三大巨头——亚马逊、Staples和Netflix都已经全面应用了个性化的推荐系统。亚马逊将个性化的网络营销做的最淋漓尽致,打开亚马逊网站的界面,映入眼帘的就有“更多供您考虑的商品”,其中包括“您浏览过”和“查看此商品的顾客也查看了”,还有“与您浏览过的商品相关的推荐”和“根据浏览记录为您推荐”,甚至还你推荐“最受关注的产品”等等。

第6篇:个性化推荐范文

关键词:实时推荐系统;R语言;BP算法;FP-tree关联规则算法;商品时效

DOIDOI:10.11907/rjdk.161723

中图分类号:TP319

文献标识码:A文章编号:16727800(2016)010012303

0引言

近几年来,电子商务推荐系统发展迅速,个性化及多样化的推荐系统为企业带来了丰厚的利润。有研究表明,电子商务零售行业提供个性化推荐服务后,其销售额会提高2%~8%[1]。目前推荐方式主要有:协同过滤推荐、基于内容的推荐、基于知识的推荐、混合推荐。随着大数据时代到来,数据量急剧增长以及用户多样性的需求对推荐系统的实时性提出了更高要求。因此,更有效、更多样性的实时推荐系统已成为电子商务领域研究的热点之一。

1实时推荐相关技术

在提高电子商务推荐系统实时性的问题上,国内外专家学者研究出一些切实可行的解决方案,其中主要包括云计算技术、Cookie技术、站外广告推荐技术等。

1.1基于云计算的实时推荐技术

国内著名的电子商务平台阿里云主要采用云计算[2]推荐方式,它是基于先进的云计算系统,支持海量网页数据和用户行为数据的分析计算,从而可以在很短时间内完成对大量用户数据的分析及计算,从而达到实时推荐的目的。目前运用较多的基于云的实时推荐框架主要有Spark框架、Kiji框架和Storm框架3种[3]。一定程度上,这些框架都是通过缩短模型训练时间,从而提高实时推荐速度。

1.2基于Cookies的实时推荐技术

基于Cookie的实时推荐是将Cookie技术与模式识别算法相结合,根据用户与相关站点、内容或服务互动时所提供的信息,实时捕捉用户兴趣偏好,然后在电子商务平台所有站点以及其它站点上显示以兴趣为基础的广告。亚马逊电子商务平台就使用了这种推荐方式,使得企业可以快速了解用户浏览了哪些广告、点击了哪些广告,以及追踪用户在各种站点上进行了哪些操作,以便收集用户的站点操作数据,并实时分析用户的兴趣偏好,为用户提供更有效的推荐。

1.3站外广告推荐的实时推荐方式

随着Web2.0技术发展的成熟,许多电子商务网站都采用了站外广告推荐,它们采用将推荐广告投放到其它网站的方式进行实时推荐,当用户浏览某门户网站时,会发现网站上投放的广告会是不久前搜索过的商品。这种推荐方式使用户浏览网站的同时可以点击了解自己心仪的商品详情,这样做既符合用户心理,又可提高商家的销售额。

1.4存在的问题

综合以上3种实时推荐方式发现:云推荐系统搭建成本很高;基于Cookies技术推荐方式存在较大的用户隐私泄漏风险;基于站外广告投放的实时推荐方式,相对而言其成本较低,运用也很广泛,但目前该平台是基于社会广告的投放方式,在推荐时根据用户搜索过的商品进行实时推荐,会造成推荐浪费,即:用户通过推荐购买了推荐的商品,下次仍出现相似甚至相同商品的推荐,但对于一些商品,用户在短时间内,一般不会购买同样商品,而更愿意看到更多样化的商品实时推荐。

2系统框架

为解决实时推荐系统推荐效率不高、推荐商品多样性不强,造成企业推荐成本浪费并影响用户满意度的问题,本文重点对用户历史行为数据进行研究,运用挖掘算法挖掘用户购物商品的特征属性,根据每位用户对应的商品特征属性集合,为用户制定个性化的实时推荐。本文所设计的推荐系统主要创新点就在于可以追踪用户在一段时间内所购买商品的特征属性,为用户制定更有效、更多样的商品实时推荐。推荐系统框架如图1所示。

如图1所示,本文设计的个性化实时推荐系统框架主要包括以下3个部分:数据预处理、数据挖掘、实时推荐,其中实时推荐是推荐系统的核心部分。本文采用基于FPTree关联规则的推荐模型[4],并在其基础上提出建立商品时序推荐模型,根据商品的特征属性设定主动推荐商品的时序。例如,对于服装类商品,用户在购买搜索过的商品后,通常在很短时间内不会重新购买类似产品,此时可将此类商品推荐时效后延,保证推荐的多样性和新颖性。

3系统实现

3.1数据预处理

本文运用R语言工具对收集的输入数据进行预处理,R语言是一个用于统计计算和统计制图的优秀工具,具有一套完整的数据处理、计算和制图软件系统[5]。对用户购买商品的历史表格进行统计,按照用户ID统计购买对应的商品信息,然后对数据进行筛选,检查数据类型是否统一,是否存在明显的数据错误。另外,从服务器上收集的Web日志数据也同样需要进行处理,一般Web数据预处理主要包括数据融合与清理、用户识别、交互识别、路径完善阶段[6]。

3.2基于商品特征属性的数据挖掘

通过以上两个阶段的数据预处理,“脏数据”[7]已基本被清理干净。利用电商平台提供的商品分类表及商品对应的属性编码库,整理并统计出每位用户在最近一段时间的购物情况表,然后运用数据挖掘方法探究商品的哪些属性影响用户购买行为。本文主要采用BP神经网络算法[8]对数据进行训练并挖掘出商品属性中影响用户购买行为的特征属性。

现假设用户集合为Q={q1,q2,q3…qi},其中qi表示第i个用户的属性集合;商品集合为X={X1,X2,X3…Xi},其中Xi表示第i种商品的属性集合,每种商品具有相应的属性值,用xij表示第i种商品的第j个属性编码值;用0、1标记已购买和未购买两种行为,则yi={0,1}。本文随机抽取了一部分用户历史购物情况数据,其中包括一定量的正例和反例两种样本数据。

神经网络模型结构主要包括:节点输出模型、作用函数模型、误差计算模型、自学习模型。其中,作用函数模型:f(x)=11+e-xx∈(0,1),反映下层输入对上层节点刺激脉冲强度;自学习模型:Δwij(n+1)=h*δi*oj+a*Δwij(n),h为学习因子,δi为输出节点i的计算误差,oj为输出节点的计算输出,a为动量因子。

运用以上模型训练数据后,可挖掘出商品属性集合中有几种属性对用户购买行为发生的权重较大,将这些权重较大的属性提取出来即为特定用户偏好的商品属性,即商品特征属性。当然每位用户因为购买的商品不同,其商品特征属性也是不相同的,因此针对不同的用户,需不断通过神经网络模型来挖掘其特征属性集合。

3.3基于商品特征属性的实时推荐

假设提取商品的特征属性值的集合为P{p1,p2,p3…pi},从每位用户对应的商品特征属性集合,就可基本掌握该用户的购物偏好。例如,商品特征属性中若包括单价,则该用户购买商品时应比较看重商品单价这一因素,可根据其购买商品的平均价格为其进行实时推荐。本文通过对挖掘出的商品的特征属性集合进行研究,根据相关文献[8]提出建立基于商品特征属性的关联规则模型及基于商品时效属性的推荐模型。

3.3.1基于商品特征属性关联规则的推荐模型

基于关联规则的推荐模型也属于经典的推荐算法之一,其主要优点在于可以提高推荐结果的多样性。将这一算法运用于探索商品的特征属性集合的关联规则,可为用户提供更为精准多样的推荐,提高用户满意度。

已知用户所购商品的特征属性值的集合为P{p1,p2,p3…pi},则可结合用户购物情况表,可提取出用户所偏爱购买的商品记录。假设存在如下购物记录{a,b,c,d;a,b,c;d,e;a,c,d,e;e,f;d,f;a,b,c,d,e,f},运用FP-tree关联规则算法进行频繁项集的搜索,首先对数据库扫描一遍,将其中的频集按照关联的方式生成一棵频繁模式树(FPtree),随后将其划分,形成若干条件库,每个库都和长度为1的频集相关,最后分别对具体的条件库实行挖掘。在用户购物时,该关联规则推荐模型可为用户推荐其感兴趣的产品及其相关产品,提高实时推荐的多样性,从而进一步提高用户满意度,达到留住客户的目的。

3.3.2基于商品特征属性的时序推荐模型

为提高实时推荐效率,在基于商品特征属性关联规则的推荐模型上,考虑商品属性的时效性。商品时效是指商品可被使用的一般时长或者为用户对某种商品的喜好时长。根据一般购物经验,用户在接受某个商品推荐后即购买该产品,短时间内若系统多次向其推荐相同或相似商品,则用户购买的兴趣度会大打折扣,甚至可能会拒绝推荐,从而影响实时推荐效率。

本文主要以电子商务领域中涉及到的衣、食、用为研究对象。不同类别的商品所对应商品的时效不同,因此本文在商品属性关联规则推荐的基础上,提出建立基于商品特征属性的时序推荐模型。假设挖掘出涉及衣、食、用这3个方面的商品类别属性集合分别为N{n1,n2,n3…ni}、M{m1,m2,m3…mi}、O{o1,o2,o3…oi},设推荐时效权重值集合为Wj={w1,w2,w3…wi}。

本文结合一定的统计信息及相关的专业领域知识,为商品设定以下几条时序规则:①在用户可接受价格的范围内,畅销类品牌的食品、服饰、日用品优先推荐,即在进行关联规则推荐时,为这类商品及其相关商品设定较大的权重值Max{wi},使其排序靠前;②对于用户在短时间内购买过的食品,可根据其含量及专家建议食用意见,给予定时推荐,即实时推荐,时间间隔T一定,T值大小由商品用途及含量决定;③对于用户购买过的同类服饰,可在一定时间内不予推荐,即推荐时权重值设定得较小或直接滤过,另可结合当前用户所在地区的天气情况,给予每日主动推荐;④与人类健康有关的用品,结合领域专家的意见定时推荐[10],如内衣、牙刷、抹布等。

这些商品时效推荐规则构成了商品时效推荐模型,在搭建好实时推荐平台后,运用这一模型可为用户带来专属的个性化实时推荐。

4结语

本文通过研究用户购买商品的数据,提取出商品的特征属性,并将其作为主要研究对象,探索用户购买商品的偏好,提出建立基于商品特征属性的个性化实时推荐系统框架,在一定程度上可以有效捕捉用户的购物偏好,并可为用户提供推荐效率更高、多样性更加丰富的实时推荐,具有较强的智能性、实用性。但其也存在一些不足,主要表现在商品实时推荐模型中的规则很简洁,后续可深入研究。

参考文献参考文献:

[1]ZAIANE.Building a recommender agent for eleafing systems[C].2002 International Conference on Computers in Education,2002:5559.

[2]应毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111117.

[3]陈敏敏,王新春,黄奉线.Storm技术内幕与大数据实践[M].北京:人民邮电出版社,2015.

[4]卢健,刁雅静.Web日志挖掘中的数据预处理研究[J].江苏科技大学学报:自然科学版,2012(1):8185.

[5]NORMAN MATLOFF.R语言编程艺术[M].陈堰平,邱怡轩,潘岚峰,等.译.北京:机械工业出版社,2013.

[6]刘华,张亚昕.基于FPtree算法的推荐系统设计与实现[J].电子设计工程,2015(2):8184.

[7]朱智林,左天军,牛淑龄.基于日志的脏数据检测与恢复[J].电子科技,2004(5):912.

[8]刘钊,蒋良孝.基于神经网络的数据挖掘研究[J].计算机工程与应用,2004(3):172173,190.

第7篇:个性化推荐范文

【关键词】个性化信息;移动网络;影响因素

移动互联网用户的增加,将给移动互联网企业带来更大的利润空间,随之而来的是更多的移动互联网企业的出现,更多移动互联网信息载体的出现。Internet上的个性化信息推荐已经得到了很好的应用,国内外都有一些应用中的个性化推荐系统,而在移动网络上进行个性化推荐还处于起步阶段,还没有成熟的产品投入使用。

1.个性化信息推荐技术

个性化推荐系统是应用知识发现技术,在与用户互动的过程中为用户提供个性化的信息,产品与服务。个性化推荐系统主要融合了用户建模技术,数据库中的知识发现,Web挖掘技术等。个性化推荐技术主要分为三类:基于规则的推荐,基于内容分类的推荐和基于协同过滤技术的推荐。

1.1 基于规则的推荐技术

基于规则的推荐主要根据用户历史浏览记录,采取一定的方法,分析出信息之间的潜在的关联关系,根据这种关联关系建立规则库,在其他用户再次访问某信息条目I时,在规则库中查找与条目I对应规则,根据这些规则决定向用户推荐的信息集。于规则的推荐结构简单,易于应用。主要缺点是:规则的数量随着数据量的增大急剧增加;规则集的确定依赖于支持度-可信度模型,而支持度、可信度的确定并没有确定的标准,支持度或可信度的改变对规则集的大小影响较大;对用户的推荐是根据当前已有的规则,并不能发现新的用户偏好

1.2 基于内容分类的推荐技术

基于内容分类的推荐(Content-based Rec-ommendation)是建立在信息内容的基础上,而不需要依据用户对信息的评价,主要采用机器学习的方法将信息进行分类。并且根据用户提供的定制信息类型或者用户的兴趣模型,将同类信息或者与用户模型最为相似的信息条目推荐给用户。基于内容的推荐是建立在信息内容的基础之上的,因此基于内容的推荐技术比较适用于机器容易识别的信息载体,如文本,而不适用与音频,视频等信息内容不容易获取的信息载体。基于内容的推荐系统的另外一个关键技术是文本特征的提取,基于内容的推荐技术是根据文本的特征与用户的兴趣模型进行匹配的程度来决定是否向用户推荐该文本信息。因此文本的特征选择在基于内容的推荐算法中尤为重要,特征选取的优劣决定了个性化推荐的质量。

1.3 协同过滤推荐技术

协同过滤推荐建立在群体性和多数原则的基础之上,由于人具有社会属性,因此个人的行为一定是包含了某类群体行为的表现,在此假设基础之上协同过滤推荐才会有意义。协同过滤推荐主要分为基于用户的推荐(User-based),基于项目的推荐(Item-based),基于模型的推荐(Model-based)三类。当前协同过滤推荐已经广泛的应用到电子商务网站,某些社会化网络中。比较成功的应用主要有亚马逊,当用户购买某本书籍时系统会向用户推荐可能喜欢的书籍列表。还有一些如豆瓣,一些视频音乐网站等也都应用了协同过滤推荐技术,基于协同过滤的个性化推荐也应用到了博客、微博等网络产品上。

协同过滤技术较基于规则与基于内容的推荐优点:(1)能够过滤机器难以进行自动内容分析的信息类型,如音乐,视频等;(2)应用统计学原理,对大量的历史记录进行分析,推荐的精确度更高;(3)可以发现用户兴趣的变化,并且获得用户的新兴趣;(4)利用了用户的反馈信息,可以即时修正推荐集。但是,协同过滤也不是完美无缺的,比如它存在冷启动,历史记录稀疏性,新项目推荐失效等问题,这需要在具体的推荐算法实现中去解决。

2.影响移动个性化信息推荐的主要因素

移动网络较传统Internet具有更多的特殊性,因此移动网络上的个性化信息推荐质量不但受到推荐算法本身的影响,也会受到移动网络资源的影响,本节将介绍影响移动网络个性化信息推荐质量的关键因素。

2.1 信息时效性

个性化推荐技术需要一定的历史信息作为依据来对用户进行推荐,个性化推荐技术是建立在历史信息记录的基础之上的,或是用户显性输入的信息,或是通过机器学习分析出来的信息。而信息具有时效性和时滞性,信息在一定时间内是有效的信息,一旦超过了一定的期限它就没有意义,此时就是无效信息。信息本身从信息源产生到需要该信息的宿主都需要一定的时间,因此信息又具有时滞性。因此时间的价值随时间的流逝而变得越来越小,因此历史信息在产生用户推荐集的过程中发挥的作用是不尽相同的,如何使各个历史阶段的信息发挥不同的作用是移动网络个性化推荐系统要考虑的问题之一。

2.2 初始信息不足

系统初始化时由于系统积累的用户信息或者浏览记录信息不足,造成不能产生用户推荐集,或者推荐集不准确,这个问题被称为推荐系统的冷启动问题。冷启动在大多数软件系统都存在,由于信息的积累需要一定的时间,因此在系统刚刚运行时不能产生正确的结果集。个性化推荐系统是建立在大量事实信息基础之上的,因此要产生比较满意的推荐结果需要积累大量的事实信息。因此如何解决推荐系统的冷启动问题是改进推荐质量的又一关键问题。

2.3 移动终端的限制

移动终端的私有性可以保证用户获取到有效的用户信息需求。但是移动终端设备在内存,处理能力方面比较有限,决定了移动终端设备不能处理复杂的人机交互功能,因此移动网络信息推荐系统不能像传统的Internet信息推荐系统那样在客户端运行监控用户行为特征的程序。移动终端屏幕大小的限制,以及操控能力的限制决定了移动终端在显示能力方面的不足,它不可能像PC上以图文并茂的方式进行信息显示以及动态的输入客户端请求。移动设备的电源以及数据存储能力方面的限制,决定了移动推荐系统不能不间断的向终端用户推荐信息。因此,针对移动终端设备的种种不足,对移动个性化推荐系统的推荐准确性,推荐信息类型,推荐方式以及终端的显示与信息反馈形式都提出了新的要求。

2.4 移动网络条件的限制

移动网络具有移动性,灵活性,使得人们获取网络信息不再约束在固定的位置上。移动网络质量受到自身带宽,地理位置等因素的限制,传输能力不能与传统的有线网络相比。因此移动网络上进行信息传递需要考虑更多的问题,比如传递信息的格式,信息文件的大小,降低网络延时等。移动网络的个性化信息推荐对推荐的准确度,系统响应速度,获取用户信息反馈等方面都提出了新的要求。因此一个高效的移动个性化推荐系统应该具有运行简单,响应速度快,推荐准确及时的特点。当前移动终端的计算能力相对有限,为了提高用户的使用体验,移动客户端程序应该尽量减少计算数据量。

3.结束语

移动互联网的迅速发展,势必会使移动互联网获取有价值信息变得越困难,移动个性化推荐成为今后解决移动互联网信息膨胀的主要方式。文章主要论述了与移动网络中应用个性化信息推荐技术相关的技术,以及影响移动网络个性化信息推荐的主要因素分析。

参考文献

第8篇:个性化推荐范文

关键词: 个性化推荐; 协同过滤; 学习资源推荐; 用户影响关系; 教育推荐

中图分类号: TN911?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)19?0029?04

Abstract: A collaborative filtering recommendation method based on user influence relation is proposed in allusion to the personalized recommendation of learning resources. The user project grading information adopted by the traditional collaborative filtering recommendation is used to find out the interaction relation among the users by mining the users′ time sequence interactive comments and recovery behavior data, so as to optimize the user′s interest matrix. On this basis, the collaborative filtering method based on users was improved for recommendation. The experimental results of dataset show that the hidden user influence relation mined with the time sequence interactive behavior data among users can improve the accuracy of prediction.

Keywords: personalized recommendation; collaborative filtering; learning resource recommendation; user influence relation; learning recommendation

个性化推荐技术早已在电子商务、电影、音乐等领域得到了广泛应用,如今随着网络在线教育的发展,个性化推荐技术也逐渐引起了教育领域的重视及应用的需求。面对复杂多样的网络学习资源,根据用户的历史行为轨迹,分析用户兴趣,推荐能够反映用户学习兴趣的学习资源,实现“因材施教”变得越来越重要,研究学者们也纷纷开始探索个性化推荐技术在教育领域的应用[1]。面对着当前网络上的学习资源的特点是形式多样化,资源类型多媒体化,资源组织异构化,且变得海量的学习资源,网络教育的发展也使得个性化学习成为当今世界网络教育领域的发展趋势,那么个性化地给用户推荐学习资源也变得更加重要,具有应用价值和科研意义[2]。

1 基于用户影响关系的推荐方法概述

目前,获取用户关系的方式主要分为显示和隐式两类,显示的社交网络关系和隐式的标签信息往往在学习系统中是不一定都具备的,但是普遍都存在用户对资源的评论及回复的信息,而并没有研究者去挖掘这些数据中是否有有助于对用户进行个性化资源推荐的信息,这些信息是否能提炼出有助于用户个性化推荐的信息[3]。

本文基于该假设提出了基于用户影响关系的协同过滤推荐方法(简称CCR?UCF),该推荐方法通过挖掘用户评论和回复的时序行为数据信息,获得其中潜在的用户影响关系,然后借助该影响关系改善基于用户的协同过滤推荐算法。提出的CCR?UCF方法主要包括四个步骤:获取用户时序交互信息――评论和回复;挖掘用户之间的影响关系;重构用户兴趣矩阵;将新用户兴趣矩阵应用于User?basedCF推荐算法进行Top?N推荐。

2 具体步骤分析

2.1 获取用户时序交互信息

在一般的推荐系统中,用户会浏览资源,进行评分,标注是否喜欢,在某些资源下留言评论。例如,用户A在看了某个资源后将其标注为喜欢或者在资源下面进行留言评论,用户B在用户A之后较短时间内也标注喜欢该资源或者留言评论。如果这种情况多次出现的话,那么很可能A对B存在潜在的影响关系,而且这种关系是双向不对称的,也就是说A对B的影响很大,但A受B的影响相对很小。如果A对B的影响较大,那么就可以将用户A感兴趣的资源推荐给B。在这里,用影响值Inf来表示这种影响关系的大小。

通过挖掘用户的时序评论和回复行为数据得到用户的影响关系[4]。先假设从这种时序行为数据中挖掘出的用户影响关系,依据得到的用户影响关系填充稀疏的用户项目兴趣矩阵,以期望提高推荐的准确率和召回率,之后将TED数据集上的实验对该假设进行论证[5]。对数据集进行预处理时,统计的是用户与用户之间的时序评论和回复次数。统计用户[i]在用户[j]评论之后对相同资源也进行评论的总次数,用[Ci->j]表示,统计用户[i]回复用户[j]的总次数,用[Ri->j]表示,用户集合为[U,][i∈][U,j∈U。]下一步使用[Ci->j]和[Ri->j]进行影响关系的挖掘。

2.2 挖掘用户之间的影响关系

2.3 重构用户兴趣矩阵

在一些在线教育系统中,有的资源用户可以对其进行评分,如0~5,而有的学习系统中,只是提供给用户标注“喜欢”的功能[5]。由于在本实验的数据集中,仅有用户是否喜欢某个资源的数据,因此,在对用户兴趣矩阵的初始化时,将用户标注喜欢的资源的兴趣值为1,用户未标注喜欢的默认值为0。假设现有[n]个用户,资源数为[m]个。最初的用户项目兴趣矩阵是仅有0和1两个值的矩阵[M(u,i)n×m。]

将从上节得到的用户影响关系矩阵[Inf(U)n*n]考虑进最初的用户项目兴趣矩阵[M(u,i)n×m]之后,得到一个新兴趣矩阵[M(u,i)n×n,]该矩阵是考虑用户影响关系后得到的新的用户项目兴趣矩阵。该矩阵将作为下一步基于用户协同过滤算法的输入。

2.4 结合User?based CF推荐

在该部分将新得到的用户项目兴趣度矩阵作为User?based CF(基于用户的协同过滤)推荐算法的输入[8]。本文方法在原有的非评分数据的基础上,通过加入挖掘用户时序行为得到用户影响关系,从而得到一个基于用户影响关系的用户?项目兴趣矩阵。

3 实验设计

3.1 实验数据

相比于推荐系统在电子商务、电影、视频等领域的数据集,如MovieLens和Netflix等,在网络教育领域,因为学习系统的多样性,很少有开放的数据集。选取TED网站7的用户数据及TedTalks数据,并且开放给研究者用于研究网络教育领域的资源推荐。使用2014年9月10日的数据集,该数据集包括12 605个用户,1 203个talks资源。数据集主要分为两部分:一部分是TEDUsers,是用户行为数据,favorites是用户标注喜欢的TEDtalks的ID;另一部分是TEDTalks,是TED演讲视频的详细信息,其中comments部分有用户评论的时间、内容以及回复。

3.2 实验设置

提出方法的实验通过在TED数据集上验证。选取数据集中至少对12个学习资源做过评价的所有用户,包括3 107个用户对1 203个学习资源的103 612个评价,同时有这些用户的112 571条评论,617条相互的回复。在该数据集中的评价是被标注为favorite,也就是说只有正反馈而没有具体评分。本文使用到的数据统计说明见表2。

实验时将整个数据集随机地分为5份,分别是test1.txt,test2.txt,test3.txt,test4.txt和test5.txt,每次实验使用其中4份作为训练集,另外1份作为测试集。推荐算法使用训练数据生成推荐结果,用测试集验证推荐效果,实验共进行5次交叉验证。

为了评价本文推荐算法的有效性,将使用准确率和召回率评测指标对推荐算法的准确度进行评价,并与User?based CF推荐算法和Item?based CF(基于项目的协同过滤)推荐效果进行对比。

3.3 参数分析

针对提出的CCR?UCF算法,首先通过实验分析参数[λ]和[θ]不同设置对推荐效果的影响。评测标准包括准确率和召回率两方面,图1和图2分别展示了参数[λ]和[θ]对准确率和召回率的影响。

4 实验结果及分析

在Top?N推荐中,通常推荐列表的项目个数不超过20个,这也是符合实际应用场景的。实验在TED数据集上进行,将从推荐的准确率和召回率两方面对三种算法的推荐效果进行分析、比较。本文将分析两方面的影响:一方面是近邻个数对推荐效果的影响;另一方面是推荐个数的变化对推荐效果的影响。

4.1 近邻个数的影响

在协同过滤推荐算法中,近邻个数的设定会对推荐效果产生影响。在实验近邻个数对推荐效果影响时,近邻个数从10调整到50,步长为5,在该部分实验时设置推荐项目的个数为5。

准确率和召回率的变化如图3和图4所示。从图中可以看出,在TED数据集中,User?based CF推荐算法和Item?based CF推荐算法两个相比,在准确率方面,Item?based CF推荐算法效果要稍微好于User?based CF推荐算法。而本文提出的基于用户影响关系的CCR?UCF在准确率和召回率方面是Item?based CF的5倍以上。User?based CF推荐算法和CCR?UCF推荐方法在近邻数为20时都达到最高值,且都随着近邻个数的递增而减小。而Item?based CF推荐算法随近邻个数的变化不明显。

实验在召回率方面,随着近邻个数的增加,Item?based CF推荐算法的变化不大,而User?based CF推荐算法的准确率有所下降,本文提出的CCR?UCF方法随近邻个数的增加而递增,在近邻个数大于25后增速放缓。CCR?UCF方法很明显地提高了召回率。

4.2 推荐个数的影响

在实验推荐个数对推荐效果影响时,Top?N推荐个数从1~10,步长为1,设置近邻个数为20。综合近邻个数对准确率和召回率的影响,在比较推荐个数的影响时,设置近邻个数为20。图5和图6是在TED数据集上三个算法的准确率和召回率随着推荐个数的增加的变化曲线。在准确率方面,随着推荐个数的增加,User?based CF推荐算法的准确率在0.005附近,Item?based CF推荐算法在0.008附近,CCR?UCF推荐方法在0.09 附近,提升了10倍以上。召回率方面,随着推荐个数的增加,CCR?UC的召回率效果远高于其他两种算法。

综合两方面的比较,CCR?UCF推荐方法在准确率方面远远好于两个基线算法User?based CF推荐算法和Item?based CF推荐算法。有效地证明了挖掘用户时序交互行为数据得到的用户影响关系能够在准确率方面有效地帮助提高推荐的效果。

5 结 论

针对学习资源个性化推荐,提出基于用户影响关系的协同过滤推荐方法。该方法不需要用户标签、社交关系等复杂信息,借助用户间的影响关系改善传统的基于用户的过滤推荐算法,从而提高推荐效果。通过在TED数据集上的实验结果表明,本文提出的基于用户影响关系的学习资源个性化推荐方法与基于用户的协同过滤推荐和基于项目的协同过滤推荐相比,在准确率和召回率方面都得到了明显提高,验证了本文提出方法的有效性。

参考文献

[1] PAPPAS N, POPESCU?BELIS A. Combining content with user preferences for TED lecture recommendation [C]// Proceedings of 2013 11th International Workshop on Content?Based Multimedia Indexing. Veszprem: IEEE, 2013: 47?52.

[2] 赵向宇.Top?N 协同过滤推荐技术研究[D].北京:北京理工大学,2014.

[3] 刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1?15.

[4] 陈孝文.基于社交网络的协同过滤推荐算法研究[D].广州:华南理工大学,2013.

[5] KOREN Y. Collaborative filtering with temporal dynamics [C]// Proceedings of 2009 15th ACM SIGKDD International Confe?rence on Knowledge Discovery and Data Mining. New York: ACM, 2009: 447?456.

[6] 孙光福,吴乐,刘淇,等.基于时序行为的协同过滤推荐算法[J].软件学报,2013(11):2721?2733.

第9篇:个性化推荐范文

关键词:推荐系统;系统过滤;用户相似性;影响因子

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)28-0088-02

1 背景

协同过滤算法给我们的生活带来了极大的便利,特别是当我们在网上购物时,网站总是能推送我们需要的商品,简化了购物过程,方便了我们的生活。协同过滤算法可以根据用户偏好和其他特征为用户推荐相似物品,面对海量的图书馆图书资源,如果可以将协同推荐算法用于图书馆图书推荐,将能极大地方便学生的学习生活。

2 相关工作

以前图书馆推荐算法直接依据图书评分数据,按评分高低向用户进行推荐,没有考虑到用户的偏好和需求。随着技术的发展,图书推荐算法也得到了改进,目前常用的图书馆推荐算法大致分为三种:

1)基于内容的推荐算法:该算法的基本思想是根据用户的借阅历史记录,分析借阅书籍,提取用户标签数据,然后将用户标签和图书标签进行匹配,观察匹配程度,选取前N本图书,生成图书推荐列表。

2)协同过滤推荐算法:该算法在基于内容的推荐算法上进一步改进,加入相似度概念,考虑有着相似兴趣爱好的读者对用户的影响。我们需要计算用户相似度,找到与该用户最相似的top-N用户,然后分析用户对这些相似用户已借阅读书的感兴趣程度,得到图书推荐列表。目前有三种常用方法用于计算用户之间的关联度。

欧几里得距离法:将用户对读书的评分转换成向量的形式,由此我们得到一个n维的评分向量,利用欧几里得公式计算两个向量之间的距离,距离值越小相似度越高,欧氏公式为:

余弦相似性:将用户评分看成一个n维的向量,利用余弦公式计算两个用户向量夹角余弦值,值越大两个用户就越相似,余弦公式为:

相关相似性:利用Pearson相关系数计算两个读者之间的相似程度。

3)基于用户个性化协同过滤推荐算法:根据高校的实际情况和需求,应运而生了一种基于用户背景的个性化推荐方法。一般情况下,用户多会借阅本专业的相关书籍,所以在进行推荐的过程中可以重点考虑相关专业同学的借阅记录,将他们借阅过的书籍进行重点推荐。

3 基于个性化的协同过滤推荐算法

3.1 图书初始评分

每天图书馆会有大量的新书上线,这些新书由于之前没有人借阅,需要为这些图书人为的划分类别和设置评分初值,根据《中图法》可以将图书划分成不同的22个大类。

3.2 计算用户对每一类别图书的偏好

根据用户的借阅历史和历史评分,结合之前的图书分类数据,计算用户对一类书籍的总评分。用户借阅不同类别书籍的数量不同,可以反映用户对某类书籍的喜爱程度,为此我们为用户已评价类别赋予不同的权重值:。为某类别图书借阅统计次数,为所有借阅图书的总次数。由此我们可以计算出用户对该类图书的评分,评分公式为:

表示读者a对类别书籍的评分,i属于类别的图书,是用户对类别图书的总评分。

3.3 根据用户偏好,计算用户相似度

上一步我们得到了用户对图书类别的评分,根据这个评分,使用皮尔逊相关系数算法计算用户之间的相似度,找出用户的近邻集合U。皮尔逊相关性公式为:

M为用户a和b的共同评分项,和分别为用户a和用户b的平均评分,利用图书类别计算用户间的相似度可以大大减少计算量。根据上式我们得到用户之间的相似度,依据相似度大小进行排序,选取前N个用户作为用户a的邻居集合U。

3.4 预测用户对其他书籍的评分产生推荐

我们根据用户的近邻集U可以产生图书推荐列表,为了使推荐列表更准确,我们引入读者相似度的影响因子。考虑到实际情况,影响因子的主要有用户专业、职位和以往评分准确度这三个方面。

1)专业:

众所周知,相同专业的学生对书的需求是相似的,所有相同专业学生的借阅书籍对推荐影响较大(),影响因子表达式如下:

2)职位

学校内老师、研究生和大学生是借书的主力军。不同职位的人对图书好坏的判读力是不同的,因此老师对图书推荐的推荐影响力应该最大。下表中的,,呈现逐渐递减关系:

3)历史评分准确度

不同用户有不同的评分习惯,对图书评分的标准不同,为了确保推荐的准确度,我们引入第三个影响因子。如果用户评分越接均分则用户评分越准确,影响因子也就越大,影响因子计算公式为:

其中S为用户评分图书集,为用户对图书i的评分,为图书的平均评分,max和min分别为图书i获得评分的最大值和最小值。

综上所述,用户的综合评分影响因子表达式为:

用户对某本图书的预测评分公式为:

n为属于U集合的用户数量,和分别为用户a和用户b的平均评分,为用户b对j图书的评分。

由用户对某本图书的预测评分公式,我们得到用户对推荐列表内每本图书的预测评分,根据实际情况,我们选择前N本图书进行推荐。

4 结束语

随着科技的发展,推荐系统在我国得到广泛使用,图书推荐系统也逐渐进入学生的学习生活。根据高校的实际情况,我们提出了一种改进的图书推荐系统,引入影响因子概念,提高推荐准确度。使学生在面对海量的数据时可用更方便地找到符合自己的学习资源。

参考文献:

[1] 刘建国, 周涛, 汪秉宏. 个性化推荐系统的研究进展[J]. 自然科学研究进展, 2009, 19(1): 1-15.

[2] 张怡文, 岳丽华, 张义飞. 基于共同用户和相似标签的好友推荐方法[J]. 计算机应用, 2013, 33(8); 2273-2275.

[3] 吕果, 李法运. 基于改进协同过滤的移动个性化推荐服务研究[J]. 情报探索, 2014(20): 101-105.

[4] 杨涛, 曹树金. 图书馆用户的个性化服务需求实证研究[J]. 大学图书馆学报, 2011(2): 76-85.

相关热门标签