公务员期刊网 精选范文 个性化推荐系统范文

个性化推荐系统精选(九篇)

个性化推荐系统

第1篇:个性化推荐系统范文

关键词:个性化推荐;电子商务;购物网站

中图分类号:F713.1 文献标识码:A 文章编号:1001-828X(2012)08-0-01

一、个性化推荐

1.定义。随着电子商务规模的逐渐扩大,网上商品的种类和数量也快速增长。商品不断丰富,顾客购物选择的余地大大扩展,但顾客往往需要花费大量的时间才能找到合适的商品。这种浏览大量无关信息和商品的过程无疑会给消费者带来极大的不便,从而可能造成客户流失。为了解决这些问题,个性化推荐系统应运而生。个性化推荐是根据用户的资料信息、兴趣爱好和以往购买行为,向用户推荐其可能感兴趣的信息和商品。个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物过程提供完全个性化的决策支持和信息服务。

2.个性化推荐的作用。成功的个性化推荐系统,向用户推荐他们感兴趣的商品,从而促成交易,即将电子商务网站的浏览者转变为购买者;在用户购买过程中向用户推荐自己确实需要但在购买过程中没有想到的商品,有效提高电子商务系统的交叉销售;为用户提供个性化的推荐服务的同时,与用户建立长期稳定良好的关系,从而有效保留客户,提高客户的忠诚度,防止客户流失。

3.知名购物网站中个性化推荐应用。淘宝网站为例,在登录已买到的宝贝页面,除了可以查看到用户购物历史记录,还有推荐内容,如:“您可能对这些宝贝感兴趣”;购物车页面的推荐,如:“您可能感兴趣的宝贝”“猜你喜欢的”。

当当网为例,网站商有个性化推荐模块网站上有专门栏目“猜你喜欢”,点击进入,再分为“您可能感兴趣的商品”“和您兴趣相似的顾客还关注”;在已购商品页面,有推荐“根据您购买的商品,当当猜您会喜欢”。

进入卓越亚马逊网站,提示用户“您好,请登录以获取为您订制的推荐”。

二、个性化推荐系统主要算法

完整的推荐系统由3个部分组成:收集用户信息的行为记录模块、分析用户喜好的模型分析模块、推荐算法模块。其中,推荐算法模块是最核心的部分。根据推荐算法的不同,推荐系统可以分为如下几类:

1.关联规则推荐。关注用户行为的关联模式。如买了香烟的人大多会购买打火机,因此可以在香烟和打火机间建立关联关系,通过这种关系推荐其他产品。这种算法最为简单直接,往往也会把用户理解的过于简单,是不太智能的算法,所以这种算法基本被淘汰了,只有少数小规模购物网站还是这种推荐模式。

2.协同过滤推荐。利用用户的历史信息,计算用户之间的相似性;利用与目标用户相似性较高的用户对其他产品的评价来预测目标用户对特定产品的喜好程度;根据喜好程度来对目标用户进行推荐。协同过滤又可分为两种:基于用户的协同过滤和基于商品的协同过滤。

基于用户的协同过滤是第一代协同过滤技术,原理也很简单:人以群分,即在网站上购买相同商品的消费者应该有相似的兴趣偏好。系统找出这些有相同商品购买记录或浏览记录的用户,然后把他们还没购买的商品相互推荐,如把用户A买过、但用户B还没有购买的商品推荐给B,反之亦然。当然,在实际推荐应用中,系统会找到与A相似的多位用户,将那些A未购买而其他人已经购买的商品,计算概率,再进行排序,最后把排名靠前的商品推荐给A。

基于商品的协同过滤,是目前使用最多的个性化算法。因为大型的购物网站,其用户数量远远大于商品数量,使用基于用户的个性化算法会造成很多问题。相应的,基于商品的协同过滤技术的原理:物以类聚,系统先判断哪些商品之间有潜在关联,再根据用户的购买记录,把关联度高的商品推荐给用户。比如“啤酒-尿布”看似风牛马不相及的商品,如果在销售记录中同时出现的频率越高,说明商品的潜在关联就越强,就可以向用户推荐。

协同过滤算法可以发现用户潜在的兴趣偏好,从而为其推荐新信息;能推荐难以进行内容分析的产品;但由于是基于用户对产品的评分,所以对新用户进行推荐或者是对用户推荐新产品,精度不高。

3.基于内容的推荐。基于内容的推荐是协同过滤技术的延续与发展。分别对用户和产品建立配置文件;比较用户与产品配置文件的相似度;推荐与其配置文件最相似的产品。如,在商品CD推荐中,基于内容的系统首先分析用户买过的打分较高的CD的共性(歌手、风格等),再推荐与这些用户感兴趣的内容相似度很高的其他CD。基于内容的推荐算法根本在于信息获取和信息过滤。

基于内容的推荐算法能处理新用户、新产品的问题(冷启动);能推荐新产品和非流行产品,发现隐藏信息;但是如果两个不同的产品恰好使用了相同的描述词,这两个产品就无法区分;而且如果系统只推荐与用户的配置文件高度相关的产品,那么推荐的只是与用户之前购买过的产品相似度很高的产品,无法实现推荐的多样性。

4.基于网络结构的推荐。要先建立用户—产品二维关联网络。把用户和产品的内容特征看成抽象的节点,所有算法利用的信息都藏在用户和产品的选择关系中。对于任意目标用户A,假设A选择过所有的产品,每种产品都具有向A推荐其他产品的能力,把所有A没有选择过的产品按照他喜欢的程度进行排序,把排名靠前的推荐给A。

基于网络结构的推荐同样面临着新用户新产品的问题。而且如果把用户与产品的所有关联关系都考虑在内,无法区分出长期兴趣和短期兴趣点,大大降低推荐准确度。

5.混合推荐。上述几种方法的有机结合,实际的推荐系统中最常见的是基于协同过滤和基于内容的结合。

三、个性化推荐技术的新应用

一般情况下,网站针对已注册用户根据用户信息或购买记录进行推荐。同时,个性化推荐还应该考虑到匿名购买者,也就是购买者不需要注册或者登录也能使用个性化推荐功能。这类技术的实现要选择合适的匿名用户行为特征识别方法,如服务器端日志挖掘技术和客户端信息采集技术等,从而实现对此类用户的个性化推荐。

针对用户存在多兴趣或兴趣发生转移情况,一些网站提出了基于项目相似性的邻居用户协同推荐算法。该算法改进了传统协同过滤算法,使之适合用户多兴趣下的个性化推荐。

个性化推荐最热门应用就是将推荐和社会网络结合起来,把社会网络加入个性化推荐系统,借助顾客的朋友、家人的评分信息来进行推荐产品。它让顾客的朋友和家人做“导购”,把他们买的而且评分较高产品推荐给顾客。

参考文献:

[1]刘洋.面向电子商务网站的个性化推荐系统[J].中小企业管理与科技(上旬刊),2012(01).

第2篇:个性化推荐系统范文

随着互联网走进各家各户,电子商务发展越来越快,服务和产品也越来越多,这就造成信息过于冗杂,客户面对海量选择,往往要浪费很多时间来挑选自己需要的商品。为了使消费者避免浪费时间,已更加从容的心态来购买商品,电子商务推荐系统可以精确识别消费者的喜好,模拟销售人员帮助消费者完成购买,给消费者想要的推荐,让挑选变得简单。统计学、人工智能数据挖掘等技术都应用于电子商务推荐系统(Recommendation Systems)中,想要引导消费者完成购买行为,就要先分析消费者的购买意愿,所谓知己知彼百战不殆,分析消费者访问网站的行为,并最后给出令客户满意的推荐结果,来产生丰厚的利润。所以说,推荐系统的核心便是推荐结果是否准确,如果是客户需要的,则会提高顾客的购买意愿;反之如果推荐结果不合顾客的意,那便是端起石头砸自己的脚,客户也会对推荐系统产生怀疑,购买兴趣大大降低。

1 推荐系统介绍

对客户行为信息进行收集的记录模块、对用户喜好进行分析的模型分析模块、推荐系统的核心推荐算法模块以及处理售后服务的反馈处理模块组成了一个完整的推荐系统。将对的商品推荐给对的人就是推荐系统的目标,常见的推荐机制算法有三种,分别是基于关联规则的算法(Association Rule_based Recommendation)、基于内容的推荐算法(Content-based Recommendation)、协同过滤推荐算法(Collaborative Filtering Recommendation)。算法数据的表示不是很复杂,一个二维表或者是一个MXN的矩阵足以。把日志或消费类的数据通过一定的预处理,所有的商品类目用列表示,所有用户用行表示。

把用户的购买需求转化成购买结果,这是一个电子商务推荐系统的终极目标,也是衡量推荐机制好坏的标准。在实际生活中,消费者去实体店购买商品,会有“导购员”进行服务,提高消费者的购买意愿,而在电子商务网站中,推荐系统就是这个“导购员”。一个好的推荐系统就像一个好的“导购员”一样,让消费者了解商品后更加愿意购买商品。主要实现一下功能:①完善用户体验,给出个性化推荐;②更好的向消费者展示商品,提高转换率;③发现消费者潜在需求,挖掘更广的市场。

网站的推荐形式多种多样,经常用到的有三种:①根据会员的历史购买记录,来进行推荐机制的营销;②由购物车或物品收藏来做相似物品推荐;③针对消费者的历史信息来做相关推荐。

个性化推荐系统能够深度挖掘电商消费者的兴趣,增强消费者持续购买的意愿,从而形成信任关系达到维系老客户,减缓以及解决现在电商平台存在消费者持续购买意愿不强的问题。我们假设一下,如果没有了推荐系统的精准推荐,消费者可能将要花更多的时间来找自己中意的商品;如果失去了系统的热门推荐,消费者将很难买到质量好价格低的产品;如果失去了推荐系统的辅助政策,消费者做出的选择往往不是最优的,这样也不会购买到自己感到满意的产品,对网站也不会有好感度,二次购买也不会再有了。这对卖家和买家来说都是损失,因此电商平台是一种双赢的表现。

2 协同过滤推荐

假如两个用户过去有相似的喜好产品,那么他们现在依然有相似的喜好产品,这是基于用户(user-based)的协同过滤;假如有用户过去喜好某产品,那么他现在任然喜好与该产品类似的产品,这是基于项目(item-based)的协同过滤。传统协同过滤算法一般就分为这两种,协同过滤不需要获得产品或用户特征,而是凭借相似性度量方法和评分数据来进行预测,只要评分数据越多,预测也会变得更精准。

协同过滤作为目前最成功的推荐技术之一,已被广泛应用于各类电子商务推荐系统及互联网的相关领域,譬如国外的Amazon, eBay, NetFlix以及国内的淘宝网和当当网等等。伴随电子商务的不断发展,用户数量也飞速增加,用户―项目评分数据的维度急剧增高,可是用户给予的评价却不是很多,使得传统的协同过滤推荐面临严峻的用户评分数据稀疏性问题。同时,用户的需求也在随着时间改变,而传统协同过滤并不能很好的解决这个问题,存在着局限性。所以,如何捕捉移动的用户感兴趣的信息已经变成电子商务亟待解决的问题。

3 典型应用

亚马逊作为电商平台的领头羊,推荐商品占销售总量的百分之四十,同时也是较早使用推荐系统的电子商务平台,当然他们的推荐形式也是别出心裁。例如,一位顾客买了一个相机,系统就会自动的给他推荐能用到的电池产品。但是由于商品多样化的趋势,亚马逊电商平台不断更新后数据分析能力的增强,推荐系统可以推荐购买过该产品的用户还购买的其他产品。

由于使用真实的购买数据,而不是假设消费者会购买什么商品,亚马逊能够提出非常精准的提?h。例如提示“购买此商品的用户同时购买”,就是一种很机智的营销手法,可以让消费者横向比较,开阔自己的眼界,更加容易找到自己的需要。

亚马逊使用的是“协同过滤”算法,这种算法把消费者串联起来,有相似兴趣行为的划为一组,参照消费者的购买历史,经常做到事半功倍。任何人的兴趣都不是孤立的,这就是“协同过滤”算法的出发点,应该处于一个群体所感兴趣的产品中,就是如果一群消费者对一个商品的评分很相似,那么他们对另一个商品的评分也不会相差很多。该推荐算法的核心在于采用技术找到于目标消费者有相似兴趣的消费者,然后根据相似消费者对目标商品的评分做出推荐,并且把测试评分最高的多项商品作为该消费者推荐列表。

亚马逊的页面分为非登录用户和登录用户。对于非登录用户,亚马逊会推荐各个类目的畅销品,换言之就是排行榜。查询浏览页面和详细的商品页面则会有关联推荐,比如“购买此物品还可购买”;通过人的相似兴趣来推荐,像“购买此物品的顾客也购买了”,“看过此商品的顾客购买的其他商品”。

而对于登录用户,亚马逊的推荐方式却截然不同,首页的页面会有一个今日推荐的栏目,这个栏目是由用户的历史浏览记录生成出来的,在下面是最近一次购买商品给的记录以及类似商品的推荐,如“根据浏览推荐给我的产品”,“浏览XX商品的用户会买XX的概率”,有意思的是,每个页面的最下方都会根据消费者的浏览内容给出对应的推荐,没有浏览记录的会推荐系统畅销。

4 结论

第3篇:个性化推荐系统范文

[关键词] 电子商务 体育营销 个性化推荐系统

近年来,电子商务的快速发展极大地改变了传统的贸易模式,为企业和消费者提供了一个相互交流的便捷平台。本文旨在提出一个适合于体育营销的个性化推荐模式,以期使电子商务能广泛、高效地为发展体育事业服务。

一、国内电子商务个性化推荐系统的现状

目前个性化推荐已开始在国内电子商务领域初现端倪,PC零售业的巨头——Dell公司正是通过提供个性化推荐在电子商务活动中获得了巨大的成功。然而,在电子商务推荐系统的应用方面,国内电子商务网站与国外网站相比差距还较大,主要表现在:

1.缺乏个性化的推荐: 由于很多推荐笼统地粗放地面向所有用户,而非个性化的推荐,其结果与每一用户的特殊兴趣并不相符合,这是我国电子商务推荐系统最主要的缺陷。

2.推荐的自动化程度低: 大多数的推荐功能都需要用户经过一段时间与计算机进行交互,输入自己感兴趣的信息,然后才能得到结果。并且,系统不能保存用户每次输入的信息。总体来说,所有的推荐策略都基本上停留在查找这一层次上,不能实现自动推荐。

3.推荐的持久性程度低: 目前大多数的推荐策略都是建立在当前用户会话的基础上,不能利用用户以前的会话信息,因而推荐的持久性程度非常低。这也是国内推荐系统的不足之处。

4.推荐策略单一: 大多数推荐系统所用的推荐策略基本上就是分类浏览和基于内容的检索,缺乏多种推荐策略的结合使用,尤其缺少个性化与非个性化推荐策略的混合使用。

产生以上问题的主要原因,首先是消费者对电子商务不信任的社会心理还比较普遍,不愿提供真实的个人信息。其次,是现实生活中电子商务个性化推荐不到位,管理制度不完善,无法达到消费者要求的水平,建立提供电子商务个性化推荐的网络系统的技术也欠发达。

二、电子商务个性化推荐系统及其分类

电子商务个性化推荐系统(Personalized Recommendation Systems for E -Commerce)的正式定义由Resnick & Varian在1997年给出:“电子商务个性化推荐系统是利用电子商务网站向用户提供产品信息和相关建议,帮助用户决定购买什么产品,通过模拟销售人员帮助用户完成购物过程的系统”。这个定义现在已被广泛引用,推荐系统的使用者是用户(电子商务活动中的用户)(user),推荐的对象是项目(item)。项目是推荐系统提供给用户的产品或推荐,也即最终的推荐内容。

根据推荐对象的特点,目前存在的推荐系统可以大致分为两类:一类是以网页为主要推荐对象的推荐系统,它主要采用Web数据挖掘,尤其是使用Web日志挖掘的方法来分析用户的兴趣,向用户推荐符合其兴趣爱好的网页链接。另一类推荐系统的推荐对象主要是产品,这种系统主要在电子商务网络购物环境中使用,帮助用户找出他真正想要的产品。

三、电子商务个性化推荐系统模块

1.输入模块(Input):主要负责对用户信息的收集和更新。输入来源按时间划分,可分为用户当前行为输入和用户访问过程中的历史行为输入;也可以分为个人输入和群体输入两部分。输入形式主要包括:用户注册信息输入、隐式浏览输入、关键字输入、编辑推荐输入、用户购买历史输入等等。

2.推荐方法模块(Recommendation method)是整个推荐系统的核心部分,它直接决定着推荐系统的性能优劣。推荐方法模块是以推荐技术和推荐算法为技术支撑。

3.输出模块(Output)负责将推荐结果输出给用户。输出形式主要包括相关产品输出、个体评分输出、相关推荐输出等。

四、电子商务个性化推荐系统的体系结构

与传统的网站系统相比,个性化的电子商务系统有一个很大不同之处:个性化的电子商务网站一般都没有静态页面,这是由HTTP协议的“无状态性”所决定的。浏览器与Web推荐器之间的一个交互过程如图1所示。

从上图可见,客户机浏览器与Web推荐器之间采用TCP连接,并且该连接状态在此次连接过程中尚能保持。但是,Web推荐器在发送给客户机应答信息后,便“遗忘”了此次交互,无论Web推荐器和客户端浏览器都不会记忆上一次连接的状态。目前,解决这个问题的方法一般有两种:

1.使用Cookie。Cookie是存储在Web客户端机器上的一个小文本文件。Web推荐器端的处理程序可以创建一个Cookie,然后让推荐器把该信息发送给客户端的浏览器。浏览器收到信息后即把数据存储在客户端的硬盘上。以后,当该客户再次访问该站点时,推荐器的处理程序向客户机的浏览器请求该Cookie。 通过Cookie,可以使推荐器端的处理程序具有交互性。

2.采用全动态的页面。“全动态”是指在获取用户的身份信息后,在用户访问的每一个页面中都写入系统分配给顾客的一个唯一标识,当用户向推荐器提交推荐请求时,这个标识也一起传送到了推荐器。这样,推荐器端的处理程序可以从这个标识中获取用户的身份信息。采用这种方式,不同的用户拥有不同的标识,不同的顾客也就有了一套不同的页面。这些页面只可能通过处理程序来动态生成。

因此,一个个性化的电子商务系统一般是没有静态页面的。综上所述,一个个性化电子商务网站的基本结构如图2所示。

五、个性化处理单元的设计

1.个性化处理部分:这是个性化处理单元中一个很重要的部分,它与接口部分协作,完成了个性化网页的生成工作。个性化处理部分一个大致的工作流程如下:(1)确认用户身份,以便对不同的用户提供不同的推荐。如果由于输入错误或其他一些原因,用户可能无法通过身份认证,对此系统可以有不同的处理方式。(2)获取用户配置信息。用户在通过认证后,系统将从后台数据库中获得用户配置信息,如用户的兴趣、爱好等等。根据系统的不同,需要的用户配置信息也会有所不同。(3)生成动态页面。匹配中心根据用户的配置信息,与相应的数据库进行交互,动态生成页面。 最后通过连接管理模块将结果页面发送给Web推荐器,最终由推荐器将页面返回给发送请求的用户。

2.管理部分;其工作是在后台管理整个系统的运行,对于一个个性化系统来说,管理部分还有一些特殊的地方:(1)管理工作的内容比较繁杂。管理工作有的是直接为访问网站的用户推荐的,有的是为网站后台应用服务的。(2)进行管理工作的人员也比较复杂。在一个个性化的系统中,高级决策人员、销售人员、网页维护人员等都可以进行相应的管理工作。正因为如此,管理部分成为个性化系统中一个不可缺少的部分。管理部分共有内容管理模块、规则管理模块、后台管理模块三大块,每个模块的功能都不相同。

3.接口部分:这一部分包括接入管理模块和数据库接口两部分。个性化处理单元处于Web推荐器与后台数据库之间,它通过接口部分与Web推荐器和数据库连接。因此,接口部分在 Web推荐器、个性化处理单元和数据库间起到了一个“桥梁”的作用。(1)接入管理模块。接入管理模块的主要功能是接收Web推荐器发送的请求信息,并将产生的结果页面返回Web推荐器。根据Web推荐器中HTP网关的不同,接入管理模块可以是一个外部的应用程序,或者是一个连接入推荐器的模块。(2)数据库接口。数据库的接口大致可以分为两类:通用接口和专用接口。通用接口,如ODBC, JDBC等,可以连接到多种数据库。专用接口只能对应于某种专用的数据库。但通用接口在速度方面不如专用接口。根据网站规模的不同、经营项目的不同、硬件设备的不同,库接口都会有所不同,这需要具体问题具体分析。

六、结束语

电子商务网站为终端客户和分销商等商业个体提供商业信息交流的平台,如何对系统留下的大量冗余的商业数据再利用是一个具有挑战性的问题。随着数据挖掘技术的成熟,尤其是Web挖掘技术的产生,如何提供电子商务网站个性化推荐越来越受企业关注,也是保障企业生存发展的重要因素之一。

参考文献

[1]余力:电子商务个性化——理论、方法与应用.清华大学出版社,(2006)

第4篇:个性化推荐系统范文

【关键词】电子商务 专家系统 电子商务个性化推荐技术

电子商务个性化推荐技术是指在电子商务网站在客户进行电子商务交易的过程中,根据用户的个性化完成对用户产品的推荐工作,通过对其网站系统内部超多的数据挖掘来有效的匹配到客户心目中的理想产品类型,为客户提供符合其个性化要求的产品购买信息以及相关服务功能。事实上,随着电子商务行业的不断进步以及发展,电子商务个性化推荐技术已经形成了专业成熟的电子商务个性化推荐系统,在电子商务网站的运营过程为客户的购买行为提供者非常重要和直观的技术支撑,保证客户个性化要求的满足。而在电子商务个性化推荐技术的组成结构中添加相应的专家系统模式,能够更加有效的分析出客户在电子商务购买行为中的购买需求、购买期望、购买目的,更好的帮助电子商务个性化推荐系统完成对不同客户的定位和识别,促进客户完成交易过程。

1 专家系统的主要内容

专家系统指的是一种专用的智能计算机程序系统,其内部含有大量的某一领域的专家水平的知识与经验,能够通过对这种经验的分析和应用有效的解决这一领域中出现的诸多问题。事实上,专家系统的组成结构与电子商务个性化推荐系统的组成结构是较为相似的,其二者都共同存在输入模块、数据收集以及分析处理模块和最终的输出模块等等,在电子商务个性化推荐系统中添加关于专家系统的智能程序,能够有效的提升电子商务个性化推荐系统中的智能型,使其能够更加充分的面对客户在电子商务交易行为中的种种决策并提供相应的信息帮助。

2 基于专家系统的电子商务个性化推荐系统的主要组成

正如上文所述,专家系统的强大之处在于其可以利用某一领域的专家知识,模拟专家决策时候的决策方式以及相应的推理和判断方式来解决某一领域中出现的诸多问题。在电子商务个性化推荐系统中应用专家系统这一程序,首先应该确定专家系统的主要领域以及相关的信息知识内容。具体来讲,电子商务个性化推荐系统中专家系统应该包含的领域和知识内容应该包括消费领域以及心理领域等等,其具体的知识内容应该包括电子商务客户的行为需求特征分析、电子商务客户的行为适宜行为需求特征分析、电子商务客户的决策行为需求特征分析等等,而专家系统在电子商务个性化推荐系统中的主要应用流程应该包括消费者描述自身的需求、专家系统分析适合消费者的需求、专家系统提取相应的产品信息满足消费者的需求以及专家系统在最后的过程中对于产品的优点介绍和竞争优势介绍等等,为消费者的最终决策提供信息帮助。

根据上述分析,基于专家系统的电子商务个性化推荐系统的主要结构应该包含专家系统的核心规则数据库(静态数据库)和电子商务网站的商品数据库以及客户数据库(动态数据库),同时使用咨询子系统、规则子系统以及结果子系统来实现专家系统核心规则数据库以及电子商务网站动态数据库之间的有效衔接和运用。

2.1 专家系统核心规则数据库

逻辑上个性化推荐系统的静态数据库可以使用专家系统的核心规则数据库作为程序建立的核心内容,用来存放专家系统运行的领域知识结构以及内容,并设置相应的辅助参数保证专家系统核心规则数据库的良好运行。

2.1.1 规则特性

每一个规则包括四个特性,例如PREMISE规则的前提部分、ACTION规则的操作部分等等,同时注意CATEGORY规则按照上下文分类,每条规则只能用于某几个上下文,以便调用;

2.1.2 设置参数

每个设置参数应该各自存储一组属性,用来咨询以及程序调用,同时规定好每一个参数的参数组名称、参数取值范围、参数的类型结构。

2.2 动态数据库

电子商务网站的用户数据库以及产品数据库都隶属于动态数据库的存储范围,每一次客户登录或者登出的过程中,电子商务网站的动态数据库都会随之实时更新一次,添加相应的动态数据内容。动态数据库对数据的主要存储方式是根据相关对象、相关对象的具体属性以及相关对象的具体参数数值(对象可信度、对象参数、对象跟踪次数)来确定对该对象的信息存储、追踪和使用过程。

2.2.1 电子商务用户数据库

电子商务用户数据库的存储信息主要是商务网站浏览和登录登出过程中各个用户的主要信息,包括用户的性别、年龄、职位、爱好、收藏、收入、购物经历以及其他相关信息等等。

2.2.2 电子商务商品数据库

电子商务商品数据库的存储信息主要是诸多网站商户的产品细细,包括产品的名称、品牌、价格、尺寸、重量、功能、材料、生产日期、保质期、售后服务以及其他相关的产品信息等等。

2.3 资讯子系统

资讯子系统的主要功能是根据客户在电子商务网站上的登录、访问、收藏、购物等一系列信息对网站的客户数据库提供对客户的定位信息,更好的做好客户个性化产品的推荐工作,同时有效的满足客户产品咨询的功能。

2.4 规则子系统

规则子系统的主要功能是专家系统的核心规则内容,专家智能系统能够凭借自身的核心规则以及规则子系统的有效连接来实现客户的产品推荐工作。

2.5 结果子系统

结果子系统的主要功能是记录客户浏览、咨询以及最终购买的过程,为客户的可信度数值提供相应的资讯信息,并记录下客户本次的操作内容,为客户的下次购买提供信息支持。

3 结语

综上所述,本文对基于专家系统的电子商务个性化推荐系统的主要组成结构以及相关功能进行了分析,电子商务网站在应用专家系统的过程中仍然需要注意对专家系统智能模块以及网站个性化推荐模块两者之间的有效连接和应用,使专家系统能够有效的融入在电子商务个性化推荐系统中并发挥功用。

参考文献

[1]马丽.电子商务个性化推荐技术分析及比较[J].计算机系统应用.

第5篇:个性化推荐系统范文

关键词:搜索引擎;推荐;系统

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)22-5370-03

基于社会计算的个性化推荐系统的搜索引擎是系统开发的一个重要环节,该搜索结果质量直接关系到系统的性能,从而直接影响到系统的整体性能。本系统中解析的文档类型以html文档为主,采用Lucene搜索引擎,独立于运行平台的方式,实现了文档的解析和索引的创建。

1 Lucene搜索引擎简介

1) Lucene

Lucene 是一个出色并且是开源的全文搜索引擎。他并不是一个完整的全文检索应用,但是它提供了大量的 API ,可以方便能够高效快捷地地对全文创建索引,最主要的是,他可以对现有的在各种各种的系统增加全文检索的功能,官方也一直维护、更新版本,使用越来越方便,深受广大编程者和用户的青睐。

Lucene是一个高效的、 可扩展的全文检索库, 仅支持纯文本文件的索引(Index)和检索(Search), 并不处理从其他格式的文件中抽取纯文本文件, 或从网络中抓取文件。简单地说, Lucene实现两个功能,分别是索引和检索。索引所做的工作是为各种各样的文档构建Lucene 所能够识别的索引文件。

Lucene作为一个非常优秀并且开源的全文搜索引擎,不仅性能高,架构清晰,扩展性强,而且其建立索引后的文件格式也独立于应用平台,从而使索引文件能够跨平台共享,对任意可转换为文本格式的数据都能够进行索引和搜索。例如html网页、本地中的ppt,txt,pdf等等都可以对其建立索引。

首先, Lucene集成了多种文档解析器, 能够对大部分主流文本文件 如:html, pdf, MS Word, Text File等等进行解析, 抽取纯文本内容。由于Lucene只能索引纯文本, 所以必须借助于上述各种不同功能的解析器对各种不同类型的文档进行解析。

然后, 使用Lucene的分词器(Analyzer),对提取出的纯文本内容进行索引, 并生成索引项,以供做搜索之用。

最后, Analyzer把生成的信息写入索引文件之后。搜索所做的工作是使用反向索引找出与用户请求相匹配的文本内容并返还给用户。 因为,Lucene 默认情况下不对用户输入的搜索关键词进行分词处理。所以,这部分不重点讨论搜索的内容,相关内容在下面的章节中讲解。

2) 引擎结构

Lucene搜索引擎对系统的要求不高,既可以运行在Windows系统上,也可以运行在Linux系统上。搜索引擎使用的一般是集中式。把多个服务器的网络资源通通下载到本地,目的是为建立索引和文本搜索做准备,这就是集中式的处理方法。如果按照按结构分,Lucene引擎结构可由搜索器、 索引器和检索器等组成。

搜索器就是网络机器人(网络蜘蛛)。利用这种爬虫程序,在遵从机器人排除协议的前提下,从某个网页开始,提取URL网址,如此循环,不断地提取到新的 URL 网址,同时取出相应 URL 的资源。

索引器的则是利用下载的到的各种网络资源,提取各种资源的索引项,为生成文档库的索引表做准备。

检索器主要任务是通过辨识用户的查询需求,在文档库中进行快速匹配查找并且检索出相应的文档,之后就是对文档进行相关性排序,并提供一个网页链接供用户操作。所以,,一个出色的搜索引擎如果把这三个部分都做得好,用户的使用需求就一定可以得到满足。

3) 解析网页和索引入库

把网页中的元素标记( Token) 及其标记之后的内容提取出来,目的的是利于入库,这就是网页的解析。一个字段都要有一个Token与之相对应。可以理解为此字段的内容就是Token 的内容。

使用的实现方法:自定义一个 Parser 解析类,接着实现网页文件流的读入,然后把这个流解析成以字符串格式输出,为下一步处理做准备,最后循环提取 Token 及其相关内容。提取每一个Token 的目的是给不同的 Token 加上不同的权值。这样在搜索出结果的时候,就可以根据不同的权值来排序。提取 Token便可以入库:

2 Lucene分词器

1) Lucene分词简介

lucene将关键词出现频率和关键词出现位置分别作为词典文件(Term Dictionary)、频率文件(frequencies)、位置文件 (positions)保存。其中词典文件不仅保存有每个关键词,还保留了指向频率文件和位置文件的指针,通过指针可以找到该关键词的频率信息和位置信息。

Lucene特点是关键词是按字符顺序排列的,其内部没有集成使用B树结构,所以可以用二元搜索算法快速定位Lucene的关键词。

Lucene中也使用了field(域)的概念,用于表达信息所在位置。如标题、内容、url等等。需要指出的是这些域(field)是可以自定义设置的。在索引文件中,每一个field(域)的信息也记录在词典文件中,每个关键词都有一个field信息,因为每个关键词一定属于一个或多个field。 关键词没有在field(域)中出现,就意味着用户想要找的内容没有出现在数据库中。

为了减小索引文件的大小,Lucene对索引使用压缩技术。首先,对词典文件中的关键词进行了压缩,关键词压缩为,例如:当前词为“广东省东莞”,上一个词为“广东省”,那么“广东省东莞”压缩为。

其次大量用到的是对数字的压缩,数字只保存与上一个值的差值,目的是减小数字的长度,进而减少保存该数字需要的字节数。例如当前文章号是1279(不压缩要用3个字节保存),上一文章号是1273,压缩后保存6(只用一个字节)。使用压缩技术的好处就是提高搜索的速度和效率。需要指出的是,Lucene3.5版本后,不需要手动处理索引文件,当索引的文件大到一定的程度之后,Lucene会自动的压缩索引文件。

2) Lucene分词原理

a. 建立倒排索引。同时记录关键词在文章中出现频率和出现的位置。如何用普通的顺序匹配算法,不建索引,而是对所有文章的内容进行字符串匹配,这个过程将会相当缓慢,当文章数目很大时,时间往往是长到无法忍受的。

b. 获得文章/记录中的关键词,并对关键词进行处理。如:lives,livinglive

3 IKAnalyzer分词器

1) IKAnalyzer分词简介

对信息进行索引前,需要要对关键词进行分词。英文使用空格和标点来分隔单词 而中文使用表意文字,不能通过空格和标点来进行分词。Lucene 自带的分词器,有StandardAnalyzer, StopAnalyzer ,SimpleAnalyzer,WhiteSpaceAnalyzer。这些分词器要么是单字分词 要么采用停用词分词,要么采用简单的分词,要么是按空格分词。

但是,它们并不能有效地解决中文分词的问题。目前中文分词算法工具包大致包括paoding、imdict、mmseg4j、IK。其中最常用的是IKAnalyzer,下面我大致介绍一下这个中文分词器,结构图1所示。

2) IKAnalyzer特点

IKAnalyzer支持多子处理器语言分析模式:中文、数字、字母,并兼容日文、韩文。它采用“正向迭代最细粒度切分算法”的算法,支持细粒度和最大词长两种分词方式,速度最大支持80W字/秒,即1600KB/秒。此外,它扩展lucene的扩展实现,采用歧义分析算法优化查询关键词的搜索排列组合,提高lucene检索命中率。同时,它具有较小的内存占用,优化词库占有空间,用户可自定义扩展词库。

IKAnalyzer由org.wltea.analyzer.IKSegmentation和org.wltea.analyzer.lucene.IKAnalyzer两大主要类组成,其中,org.wltea.analyzer.IKSegmentation是IK分词器的核心类,真正分词的实现类。而org.wltea.analyzer.lucene.IKAnalyzer则是IK分词主类,基于Lucene的Analyzer接口实现。

4 基于Lucene的IKAnalyzer分词器

1) paoding、mmseg4j和IKAnalyzer

目前流行的几大开源分词器主要有:paoding、mmseg4j、IKAnalyzer,它们三个都是基于JAVA语言开发的,各有优劣,具体如下:

mmseg4j:有两种分词方法,Simple和Complex,目前 complex 1200kb/s左右,simple 1900kb/s左右,但内存开销了50M左右。采用MMSeg算法,代码复杂度是2500行左右代码。有英文文档,原理比较简单。有自带搜狗的词库,支持自定义词库,不支持自动检测。 自带词库16W个。Lucene和solr的支持:支持Lucene2.4、solr1.3。

Paoding:采用基于“不限制个数”的词典文件对文章进行有效切分算法,使能够将对词汇分类定义,代码复杂度是7000行左右代码。1秒可准确分词100万汉字。支持不限制个数的用户自定义词库,自动检测词库的更新。自带词库22W个。

IKAnalyzer:每秒80W字。采用正向迭代最细粒度切分算法,代码复杂度是4500行左右代码,有一个中文使用手册,支持自定义词库,不支持自动检测。 自带词库27W个。

根据上面介绍,结合本系统特点,本系统采用基于Lucene的IKAnalyzer分词器。

2) 自定义同义词分词器

Lucene分词机制:索引过程和查询过程都用到了一个关键工具分词器analyzer。它将要被索引的内容以流的形式读入,经过词语切分、过滤干扰词等一系列处理,最终输出一个语汇单元流、每个语汇单元携带了一个文本值和它的一些元数据,原文本从起点到终点的偏移量、语汇单元类型和position incremen。

同义词索引原理:索引器将语汇单元写入文件时会丢弃每个语汇单元的起点偏移量和终点偏移量。位置增量是语汇单元携带到索引文件的唯一附加元数据。这个值的意义是当前单词与前一个单词的位置偏移量。当这个值为 0 是表示当前单词与前一个单词被索引到同一个位置上。但是 Lucene 对中文语言处理能力十分有限,无法中文语义分词只能将一句话机械性的分成单字或双字 。例如: 用单字分词会将“我来自广东” 切分成 :“我” “来” “来” “自” “广” “东”。显然,这种情形为每个字添加同义词索引是没有意义的 因此 需要一个功能更强大的中文分词器来支持。

本系统采用堆栈的形式来保存同义词的词组或单词。如(“中国”,“大陆”),(“我”,“咱”)等等都可以是同义词。自定义同义词分词器使用四个类来实现。

MyDefinedSameAnalyzer类主要是加载的搜狗中文分词器。使用栈来定义过滤器是MyDefinedSameTokenFilter类。DefinedSamewordEngine类是一个接口,使用接口有利于程序的扩展。DefinedSimpleSameword类是定义同义词字典,并判断如果有同义词就返回true

3) 自定义停用词过滤分析

在关键词处理过程中,有可能会经常出现没有意义的词。如,“是”,“来”等等。除此之外,停用词分析器StopAnalyzer也已经把没有意义的英文单词收录到停用词表中。默认情况下,这个表被用来滤词用户输入关键词中的词汇,还可以过滤掉一些特定字符,如&,*等,也会把英文的大写字母自动转换成小写字母。

还有就是,当搜索系统需要屏蔽掉一些用户输入的中文敏感词的时候,就得把敏感词自动的过滤掉。这个时候就得使用lucene强大的停用词分析器。由于Luene自带有停用词分析器StopAnalyzer,这使得要过滤掉停用词就变得非常简单。而且使用Lucene3.5的版本,也支持中文分词。

自定义一个停用词表就可以过滤掉自己设定的中文或者英文的敏感词。默认情况下,Lucene会把系统自带的英文停用词加载在停用词分析器中。TokenStream读流属性中的数据即读出数据。另外,停用词分析器StopAnalyzer自动把数字给过滤掉了,所以要实现数字的搜索需要经过特别的处理。具体的处理过程可以参考GxjtController类的searchcont( )函数的代码部分。

为了实现该功能,搜索的关键词要先经过过滤器处理,再经过同义词的处理。

参考文献:

[1] 冯斌.基于 Lucene 小型搜索引擎的研究与实现[D].武汉:武汉理工大学,2008.

[2] 杨馥显,刘嘉勇.基于JSP的数据库开发技术研究[J].通信技术,2011,44(3):51-53.

第6篇:个性化推荐系统范文

协同过滤推荐技术采用协同过滤推荐算法,是当前最成功的推荐技术,具有良好的推荐效果,得到了广泛的应用。协同过滤算法是对传统推荐算法的改进,它的基本思想是基于最近邻居,即根据评分相似的最近邻居(也称相似用户)的评分数据向目标用户产生推荐信息。它基于这样一个假设:如果用户对于一些项目的评分相似,那么他们对其他项目的评分也相似。

协同过滤推荐系统使用统计技术获得目标用户的最近邻居集,然后根据最近邻居对项目的评分来预测目标用户对相应项目的评分,再根据推荐结果筛选算法产生目标用户的推荐列表。此过程一般分4步完成:数据的表述、计算最近邻居集、评估目标用户对项目的评分、产生推荐数据集。

1)数据表述中,涉及的数据有用户属性数据、项目属性数据和用户对项目的评分数据等。输入数据通常表述为一个s×t的用户-项评估矩阵R,m为用户数,n为项目数,Ri, j表示用户i对项目j的评分。

2)根据用户相似性计算规则,求得目标用户与其它用户的相似度,对其进行排序、筛选可得用户的最近邻居集。

3)根据最近邻居对项目的评分数据评估目标用户对相应未评分项目的评分,由此得到目标用户对任意项目的评分数据(评分越高,越感兴趣)。

4)根据推荐标准,对目标用户-项目评分数据进行筛选,从而得到top-N推荐集。

1 协同过滤算法分析

1.1 相似度计算

用户相似度计算和项目相似度计算在协同过滤推荐技术中起着关键性作用,所用算法的优劣直接影响系统的推荐质量。常用的相似度计算算法有:

1.1.1 皮尔森相关系数

皮尔森相关系数也是一种基于相关系数的相似度计算方法,一般为了使计算结果精确,需要找出共同评分的用户。

1.2 基于协同过滤的推荐分析

基于以上分析,本文提出了一种改进算法,以求产生更精确的个性化推荐结果。

2 算法设计

2.1 推荐系统中的数据表示

在一个推荐系统中至少涉及3个基本的数据表:用户信息表,项目信息表和用户对项目的评分信息表。我们分别将其记作R1、R2和R。

当一个新用户注册时,他的基本注册信息就加入到用户信息表R1中;当一个新项目加入推荐系统时,它的相关属性信息将加入到项目信息表R2中;而当一个用户对一个项目进行评分时,他对该项目的评分信息将加入到USER-ITEM矩阵R中。

为了提高推荐结果的准确度,应尽量使记录的用户信息和项目信息充分、详细。

2.2 计算目标用户的最近邻居集

协同过滤推荐技术是基于最近邻居的一种推荐技术,它根据与目标用户最相似用户的喜好记录计算推荐结果集。因此,为了得到更精确的推荐结果,必须保证目标用户的最近邻居集的精确度。

2.4 使用混合推荐技术整合推荐结果

为了提高推荐结果的准确度,我们采用了混合推荐技术,针对不同的情况,使用不同的推荐算法:

1)当新用户加入时,我们使用基于人口统计学的推荐算法为其计算推荐结果,从而解决新用户的冷启动问题;

2)当新项目加入时,我们使用基于内容的推荐算法为用户计算推荐结果,使得新项目得到推荐,从而解决新项目的冷启动问题;

3)当系统中的用户和项目相对稳定时,我们同时采用基于用户和基于项目的协同过滤推荐算法为用户计算推荐结果,并使用调整系数对两种推荐结果进行线性组合。

2.5 收集用户的反馈信息,提高系统的准确性

随着用户数据的增加,系统规模越来越大,用户的参与度也不断增大,系统会通过收集用户的反馈信息,对项目的相似性度量因子 、用户的影响因子 和推荐结果的调整系数 进行调整,使推荐结果集不断优化,使推荐结果的准确度不断提高。

3 测试与结果分析

4 小结

本文首先分析传统协同过滤算法的优缺点,然后建立了一种基于条件概率的相似度计算的模型和方法,提高了推荐结果的准确性。

参考文献:

[1]C C Aggarwal On the effects of dimensionality reduction on high dimensional similarity search,2001.

[2]赵亮、胡乃静,张守志个性化推荐算法设计,计算机研究与发展,2002(08).

[3]周军锋、汤显、郭景峰,一种优化的协同过滤推荐算法,计算机研究与发展,41卷第10期.

[4]张海荣、朱信忠、赵建民、徐慧英,一种优化的基于用户聚类的过滤推荐策略,计算机系统应用,2008(11).

[5]高滢、齐红、刘杰、刘大有,结合似然关系模型和用户等级的协同过滤推荐算法,计算机研究与发展,2008(9).

[6]B Kitts;D Freed Cross-sell: A fast promotion-tunable customeritem recommendation method based onconditionally independent probabilities 2000.

第7篇:个性化推荐系统范文

关键词:数据挖掘;高校图书馆;个性化推荐

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)35-7901-03

1 课题背景

随着Internet技术及信息技术的快速发展,高校图书馆传统的借还服务方式也面临着新的挑战。读者已不满足于图书馆提供的图书借还和资料查询的简单服务方式,他们希望图书馆能够通过认真分析读者的个人特征和图书借阅数据,来发现读者的潜在需求,根据每位读者的不同需求提供应的图书推荐服务。因此,高校在这样的需求下,开发一个图书馆个性化推荐系统是极为必要的。

2 高校图书馆个性化推荐系统结构设计

2.1结构设计

高校图书馆个性化推荐系统根据需求分析可以分成界面层、个性化服务层和基本数据库层。如图 1所示。

2.2功能描述

1)界面层

界面层既可以让读者输入个性化需求,又可以将个性化推荐结果输出。

2)个性化服务层

个性化服务层主要是从图书信息库和读者信息库,采集图书信息、读者信息和读者的借阅信息,并利用数据挖掘技术对采集到的信息进行挖掘和归纳分析,根据归纳分析结果,为每位读者推荐感兴趣的图书。该层分为数据采集、数据挖掘和个性化推荐三个模块:

1)数据采集模块:用于从图书信息数据库、读者信息数据库和借阅记录数据库。采集图书馆的图书信息、读者的基本信息和读者的借阅信息。

2) 数据挖掘模块:对数据采集模块采集的信息实施关联规则挖掘,建立规则库。

3) 个性化推荐模块:实现将读者的基本信息和借阅信息与规则库进行比对,进而预测读者的兴趣爱好,向读者主动推荐符合其兴趣爱好的图书。

3)基本数据库层

用于存储图书信息,读者信息和读者借阅信息,这些信息能够为个性化服务层提供基础数据。

3 利用关联规则挖掘实现个性化推荐

3.1 借阅信息收集

本次数据挖掘的对象是某高校图书馆系统中的真实借阅数据,先利用Clementine软件从借阅记录信息库提取出读者的借阅信息。部分读者借阅信息如图2所示。

3.3实施关联规则挖掘

在Clenmentine软件中,关联规则是通过设定支持度和置信度的阀值,计算各类图书之间的关联程度的大小,从而发现图书之间的潜在关联性。本次Clenmentine关联规则算法中Apriori节点的参数设置情况如图4所示,即先找到所有前项支持度大于最小支持度的项集,这里最小支持度设置为1%;然后从找到的项集中产生期望的规则,即置信度大于20%的规则,最后产生关联规则结果。

以第一条规则为例,借阅《独行侍卫》的读者中有21.429%的读者也借阅了《王中王》,是所有读者中借阅《王中王》阅读率的93.929倍。从业务角度来说,在《独行侍卫》读者中有阅读《王中王》倾向的用户比例会比所有读者中有阅读《王中王》倾向的用户比例高。图书管理系统可利用此规则,在做《王中王》图书推荐时,优先向有借阅《独行侍卫》书籍的读者进行推荐,从而达到提高推荐命中率,提升读者满意度的效果。

4 结论

本文首先对某高校图书馆个性化推荐系统进行结构设计,然后利用Clenmentine软件提取某高校图书馆的真实借阅信息,进行数据转化和实施关联规则挖掘,最终建立规则库。高校图书馆个性化推荐系统通过将读者的基本信息和借阅信息与规则库进行比对,来预测读者的兴趣爱好,为不同的读者提供个性化的图书推荐服务。

参考文献:

[1] 潘旭武.陈玲洪.基于数据挖掘的图书馆读者需求分析[J]. 浙江高校图书情报工作,2008,24(3).

[2] 李玮平.关联规则数据挖掘方法的研究[D].西安:图书馆论坛,2007.

[3] 赵群礼.数据挖掘在数字图书馆中的应用研究[D].西安科技大学,2007,6(9)

第8篇:个性化推荐系统范文

电子商务推荐系统(RecommendationSystemsforE-Commerce)定义是:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。

推荐系统面对的是用户(user),任务是为用户提供对项目(item)的推荐。用户是指推荐系统的使用者,也就是电子商务活动中的客户。项目是被推荐的对象,是指电子商务活动中提供给客户选择的产品和服务,也就是最终推荐系统返回给用户的推荐内容。在一个电子商务活动中,用户数和项目数是非常多的。推荐系统面对的当前用户,称为目标用户或者活动用户。推荐系统的当前工作,就是为根据一定的算法,给出对目标用户的推荐项目。

电子商务推荐系统主要由三大部分构成:输入模块、推荐方法模块和输出模块。输入模块用来接受用户的输入信息,用户的输入信息中最重要的是用户对项目的评价(rating)数据;推荐方法模块用来根据一定算法,根据用户数据,得出对目标用户的推荐,该模块是整个推荐系统的核心部分,个性化推荐方面的研究的很大一部分,都集中在找到好的推荐方法。输出模块主要是指得到的推荐以何种形式反馈给用户。

根据项目的特点,目前主要有两种类型的推荐系统,一种是以网页为对象的个性化推荐系统,主要采用Web数据挖掘的方法与技术,为用户推荐符合其兴趣爱好的网页;另一种是网上购物环境下的、以商品为推荐对象的个性化推荐系统,为用户推荐符合其兴趣爱好的各类产品,如各种书籍,音像等,这种推荐系统也称电子商务个性化推荐系统。

二、电子商务个性化推荐系统的作用

电子商务推荐系统的最大的优点在于它能收集用户兴趣资料并根据用户兴趣偏好为用户主动作出个性化的推荐,也就是说,当用户每次输入用户名和密码登录电子商务网站后,推荐系统就会按照目标用户偏好程度的高低推荐用户最喜爱的N个产品,而且系统给出的推荐是实时更新的,也就是说当系统中的产品库和用户兴趣资料发生改变时,给出的推荐序列会自动改变,大大方便了用户,也提高了企业的服务水平。

总体说来,电子商务推荐系统的作用主要表现在以下几个方面:一方面,使用户从无限的网络资源和商品世界中解脱出来,大大节约了用户采购商品的时间和成本;与此同时,推荐系统的个性化推荐服务,提高了客户对电子商务网站的忠诚度(BuildingLoyalty),将更多的电子商务网站浏览者转变为商品的购买者,从而提高电子商务网站的交叉销售能力(Cross-Selling),为电子商务企业赢得了更多的发展机会。

研究表明,在基于电子商务的销售行业使用个性化推荐系统后,能提高销售额2%-8%,尤其在书籍、电影、CD音像、日用百货等产品相对较为低廉且商品种类繁多的行业,以及用户使用个性化推荐系统的程度高的行业,推荐系统能大大提高企业的销售额。

电子商务推荐系统和销售系统(MarketingSystems)、供应链决策支持系统(Supply-ChainDecision-SupportSystems)既相似又有不同。销售系统是帮助销售人员如何把产品销售出去;推荐系统最终目的帮助用户,辅助用户购买什么产品做出决策。供应链决策支持系统是帮助生产者决定什么时候生产多少什么产品,以及仓库应该存贮多少各类产品,其最终目的是为企业生产者服务的,而同样推荐系统是面向用户的系统。

三、电子商务个性化推荐系统的研究内容

电子商务个性化推荐的研究有四方面的问题:首先,要解决推荐系统的信息来源问题——推荐系统的基础是用户兴趣资料信息,如何在电子商务环境下尽可能获得更多用户的相关信息,并以合适的形式表示是进行个性化推荐的前提;其次,要实现被顾客接受和认可的个性化推荐,设计准确、高效率的个性化推荐算法是核心;另外,要让推荐系统为广大用户所接受,必须对推荐系统作出客观、综合的评价,尤其要注意从准确率、个性化、安全性、用户满意度等多方面进行评价;推荐系统的应用是最终研究的落脚点,推荐系统不仅能为用户提供完全个性化购物环境,更应为企业的销售决策和客户关系管理提供支持。

在电子商务环境下,用户信息收集表示是电子商务个性化推荐的基础。根据当前对电子商务环境下用户信息收集表示的研究来看,主要着眼于研究如何有效地收集能反映用户兴趣偏好的信息,以及如何通过网络数据挖掘等的方法更自动化地收集用户的隐式信息,解决用户信息收集过多的依赖于显式评价数据的问题。

个性化推荐技术是电子商务自动化推荐系统的核心问题。目前的推荐技术有协同过滤推荐(包括基于用户的和基于项目的)、基于用户人口统计信息的推荐、基于内容的推荐、基于效用的推荐、基于知识的推荐、基于规则的推荐等等。协同过滤推荐是个性化推荐中研究和应用最多的方法,广泛应用于电子商务网站、数字图书馆、网页搜索、新闻过滤等,著名的推荐系统有Tapestry、GroupLens/NetPerceptions、Ringo/Firefly等,其前提假设是存在具有相似兴趣爱好的用户群,每个用户都有与其兴趣爱好相似的邻居用户。预测用户对某一项目的偏好是根据邻居用户对该项目的偏好程度计算的,也就是说如果其邻居用户喜爱某项目,则该用户也很可能会喜爱该项目。协同过滤最大优点是不需要分析对象的特征属性,所以对推荐对象没有特殊的要求,能处理非结构化的复杂对象,如音乐、电影等。

对推荐系统总体性能的评价是推荐系统研究的重要组成部分。目前大都只是采用准确率、召回率等评判尺度对推荐算法进行评价,并没有真正意义上的、提升到对整个推荐系统进行的评价,尤其缺乏从个性化程度、持久性程度、系统的安全性以及用户接受程度等多方面对推荐系统进行综合的评价。

四、研究现状

推荐行为产品或其它项目的软件已经在许多应用中使用在电子商务领域,为了增加购买经验并满足客户需求,已经推出了充分利用消费者的访问和购买行为的推荐系统。推荐者通常通过给用户展示他们可能感兴趣的产品或服务来促进购买。例如,诸如就是通过利用偏好或其他用户购买信息来介绍书籍或者其它产品给用户的推荐系统。然而,使用的技术相当简单,而且并非很精确和有效。基本上,程序将当前客户购买的一系列产品与其他客户购买的一系列产品作比较,选择客户购买较多的产品与当前客户购买的产品集合的交集,最后从中选出一些尚未被客户所购买而仍然在顾客购物篮中的产品,并将它们作为推荐列表呈现给客户。该技术也用于类似于协作过滤的文本文档的信息抽取。电影或音乐唱片的推荐,例如,通过预知一个人的偏好与其他人偏好的线性权重集合,并运用协作过滤技术来实现。

对于推荐系统的研究可分为三个种类:技术系统开发研究,用户行为研究和隐私问题研究。其中技术系统开发是重点。目前各种推荐技术,例如数据挖掘,和推理,都已经应用到了推荐系统中。现存的推荐系统从广义上可以划分为基于规则的系统和信息过滤系统。信息过滤系统又可分为基于内容过滤的系统和协作过滤系统两种。

基于规则的系统,N1如:IBM的WebSphere,BroadVi-sion,ILOG等。他们允许系统管理员根据用户的静态特征和和动态属性来制定规则,一个规则本质上是一个if-then语句,规则决定了在不同的情况下提供不同的服务。基于规则的系统,其优点是简单、直接,缺点是规则质量很难保证,而且不能动态更新。此外,随着规则的数量增多,系统将变得越来越难以管理。

基于内容过滤的系统,例如:PersonalWebWather,SysKill&Webert,Letizia,CiteSeer,ifWeb,SIFTER,PVA,WebMate,WebACE,ELFI和WebPersonalizer等。他们利用资源与用户兴趣的相似性来过滤信息。基于内容的推荐系统通过将顾客的偏好与产品内容自动匹配来给顾客提供建议,例如网页和消息条目的推荐。在基于内容的系统中,产品由其普通属性描述。顾客偏好通过分析产品比率以及相应的产品属性来预测。基于内容过滤的系统,其优点是简单、有效。缺点是难以区分资源内容的品质和风格,而且不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源。在基于内容的推荐系统中,一个核心问题是识别关键属性集合。如果该集合太小,显然,这对于识别用户剖面是不充分的。因此,基于内容的推荐系统不能用于仅仅实施一次购买行为新顾客,或者访问了该网站,却没有实施任何购买行为的潜在顾客,以及购买他不是特别经常购买的一种产品的顾客。

协作过滤系统如:WebWather,Let'sBrowse,Tapestry,GroupLens,Fab,Alexa,Firefly,SELECT,LikeMinds和Site-Seer等。他们利用用户之间的相似性来过滤信息。协作性的推荐系统估计顾客对特定产品的偏好是根据顾客对该产品的偏好率以及其他顾客对同一产品的偏好率的比较来实现的。协作性的推荐系统与基于内容的推荐系统之间的主要区别是协作性的推荐系统通过跟踪一组顾客过去的行为来给该组中的个别顾客提供建议。使用该方法,顾客现在就可以接受建议,而在基于内容的推荐系统中,只要具有相似意向的其他顾客的偏好,顾客就己经具有先前预测了。基于协作过滤系统的优点是能为用Web数据挖掘的研究及其在网络学习个性化推荐中的应用户发现的新的感兴趣的信息,缺点是存在两个很难解决的问题,一个是稀疏性,亦即在系统使用初期,由于系统资源还未获得足够多的评价,系统很难利用这些评价来发现相似的用户;另一个是可扩展性,亦即随着系统用户和资源的增多,系统的性能会越来越低。协作性的过滤方法用来识别与既定客户具有相似兴趣的顾客,所推荐的产品也是这些给定客户喜欢的产品。该方法的一个主要局限是稀疏问题。在基于协作过滤的推荐系统中,很难精确确定下相似客户和识别要推荐的产品。不仅如此,系数问题的极端形式是first-rater问题,当市场引入一种新产品时,不存在可用的先前估计信息。

还有一些个性化服务系统如:WebSIFT,FAB,Anatagon-omy和DynamicProfiler等,同时采用了基于内容过滤和协作过滤这两种技术。结合这两种过滤技术可以克服各自的一些缺点,为了克服协作过滤的稀疏性问题,可以利用用户浏览过的资源内容预期用户对其他资源的评价,这样可以增加资源评价的密度,利用这些评价再进行协作过滤,从而提高协作过滤的性能。

近来,许多因特网公司还引进了有关信息产品的推荐系统,它包括Web站点推荐,音乐推荐,视频推荐,书籍推荐等等(例如,以及等等)。因特网行销机构运用推荐系统对某一广告公司推荐用户(例如Ac-tiveAgentWerbenetz。

通过将书籍推荐给已经购买过特定书籍的顾客实现个性化推荐的。.所推荐书籍概括的分为有两种:小说书籍和非小说书籍。小说书籍的推荐很简单,就是将同一作者的其它小说书籍推荐给特定用户,这样最终就将由该作者撰写的相似类别的小说书籍推荐给了有相似背景的用户。而非小说书籍的推荐将是将每个作者的相似类别的小说书籍推荐给了有相似背景的用户。

五、电子商务推荐技术存在的问题和发展方向

综合目前电子商务中个性化推荐系统的现状可以看出,现存的个性化推荐系统技术大都是基于规则的系统,基于内容过滤的系统,以及协作过滤系统三种。而且,这些个性化推荐系统所运用的技术也仅仅限于基于内容的过滤,KNN(L-NearestNeighboring)技术,基于聚类的(Clustering-based)协作过滤,基于项目的(Item-based)协作过滤,序列模式,规则分析等等。由于这些推荐系统各自应用范围的局限,而且都不同程度的需要人工参与,因而导致目前推荐系统的推荐精确度较低。不仅如此,大多数个性化推荐系统只是给用户推荐一些不同类别的资源,这与普通的搜索引擎比较相似,而且对用户正确行为的推荐却比较少。

未来电子商务推荐技术研究的发展主要体现在以下几个方面:

1.组合推荐技术的研究

众所周知,现存的推荐技术已经得到推广和应用,但各种技术都存在一些缺陷,能否将各种推荐技术融合起来作到取长补短是未来电子商务推荐技术研究的重要课题。

2.推荐技术准确度的研究

目前的推荐技术推荐的准确性还得不到保证,准确度的研究还局限在手工实验阶段,因此,研究出自动的准确性验证理论模型就显得非常重要。

3.数据获取方面,主要还是依赖用户的显式评价,在自动获得用户的隐式信息方面做得不够。

4.研究过于集中解决推荐算法性能的提高,对推荐系统的开发与应用,尤其是与企业其它系统的集成应用,在辅助企业的市场销售,客户管理和企业商务智能方面缺乏研究。

参考文献:

[1]CooleyR,MobasherB,SrivastavaJ.Dataprepara2tionforminingworldwideWebbrowsingpatterns.JournalofKnowledgeandInformationSystems,1999(1):230~241

[2]GoldbergD,NicholsD,OkiBM,TerryD.Usingcol-muni-cationsoftheACM,1992,35(12):61~70.

[3]ResnickandVarian.RecommendationsystemsCommu-nicationsoftheACM,40(3):56C58,1997.98-122

[4]R.D.Lawrence,G.S.Almasi,V.Kotlyar,M.S.Viveros,S.S.Duri,Personalizationofsupermarketproductrecommenda-tions,IBMResearchRport,2000.43-75.

[5]邓爱林,朱扬勇,施伯乐.基于项目评分预测的协同过滤推荐算法[J].软件学报,2003,(9).

[6]曾春,邢春晓,周立柱.个性化服务技术综述[J].软件学报,2002,(10).

[7]赵亮,胡乃静,张守志.个性化推荐算法设计[J].计算机研究与发展,2002,(8).

第9篇:个性化推荐系统范文

2017年1月22日,CNNIC第39次《中国互联网络发展状况统计报告》,截至2016年12月,在网上预订过机票、酒店、火车票或旅游度假产品的网民规模达到2.99亿,较2015年底增长3967万人,增长率为15.3%。可见,在线旅游发展迅速,但这对于旅游者并不一定是好的现象。因旅游者常被困在大量的信息和产品当中,无法做出选择。而旅游推荐系统则是解决信息过载现象的有效方法。它为用户推荐符合其需求和偏好的旅游产品,以帮助用户快速做出旅游决策。

笔者通过检索中国知网电子期刊全库,共收集到“旅游推荐系统”相关文献100多篇,经过筛选剩下69篇。国内最早出现关于旅游系统推荐的文献是在2006年,并正在成为当前的研究热点。从文献的学科属性来看,主要集中在计算机学科、地理学科、管理学科以及信息技术与旅游的交叉学科中。这主要是因为旅游推荐系统是推荐系统在旅游行业中的应用之一,而推荐系统最初也是来源于信息抽取技术及信息检索技术等与计算机紧密相关的领域,在实现这一系统时往往要用到这些与人工智能相关的理论与技术。国内学者对旅游推荐系统的研究主要集中在旅游推荐系统的研究与设计、旅游推荐系统的方法与技术、旅游推荐项目的研究等方面。

二、旅游推荐系统的研究与设计

推荐系统已经被广泛应用于推荐书、文章、电影、电视节目、新闻、音乐网页等。推荐系统最早的概念是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。1997年AT&T实验室提出了基于协同过滤算法的个性化推荐系统,在eBay、Youtube等大型电子商务网站等应用广泛。许多学者基于数据挖掘技术、LBSN(基于位置的社交网络)数据、上下文感知技术、约束、垂直搜索引擎、基于内容的推荐技术和混合推荐技术、加权关联规则、本体、3G手机、云计算、物联网等技术对旅游推?]系统进行研究和设计,向旅游者推荐满足其需求的旅游包、旅游产品、旅游线路、旅游景点推荐及行程路线等。

陈传敬的个性化的旅游推荐系统,根据移动用户的偏好自发的为游客做出个性化的推送服务,帮助用户找到最适合自己的酒店、景点、餐厅、娱乐场所、购物场所等。严杰的旅游电商个性化推荐系统,在大数据的精确分析基础上,再将推荐结果以服务的展示形式推送到旅游电商的各个营销环节,极大的推动了产品购买的转化率。麻风梅,高文的基于Internet平台的安康旅游景点在线推荐系统,不仅帮助游客做出旅游决策;还可以提供给旅游企业和相关管理部门,使其更好的管理安康的旅游资源。姚海涛的旅游信息推荐系统,为游客提供各种旅游信息的查询,使游客拥有一个准备充分的出游计划。

三、旅游推荐系统的方法与技术

1.基于内容的推荐

根据用户选择的产品,向用户推荐与该产品属性相似的其它产品。这种技术是利用用户的历史内容来产生用户描述文件的,新的项目将会用于匹配用户描述文件来发现最接近的项目。徐盼等认为应用数据挖掘技术的朴素贝叶斯方法可以为特定需求的用户提供个性化路线推荐。黄飞龙通过收集用户行为数据为用户实时推荐所需信息,使用户在有限时间内游玩景区内感兴趣的景点,为用户的游览路线提供建议。

2.基于协同过滤的推荐

根据用户对产品的偏好,将与该用户偏好相似的其他用户选择的产品推荐给该用户。协同过滤技术可以分为两个子类:一是根据用户的兴趣进行协同过滤,二是根据产品的共性进行协同过滤。张伟伟等、郑外辉、吴清霞等、麻风梅、杨晓飞根据用户兴趣为用户进行个性化的路线、景点或信息服务的推荐。侯新华等利用在线旅游网站上游客对旅游景点的评价数据,使用协同过滤算法为游客推荐旅游景点。李倩等利用互联网上用户口碑,为用户推荐个性化的旅游计划。曹阳考虑了用户评论和各个用户之间的回复关系及各个用户之间回复的时间关系,提出了一种基于游客信息的协同过滤帖推荐方法。方潇通过为目标用户建立邻近用户集来改进协同过滤的算法。史一帆等在协同过滤算法中引入景点标签,使得为用户推荐的景点更准确。

3.基于知识的推荐

这种方法通过对特定领域的知识指定规则进行基于约束的推荐和基于实例的推荐。王显飞等提出一种基于约束的旅游推荐系统的设计方案,系统以会话的方式逐步启发用户的偏好和需要,可以为用户提供更加准确、个性化的旅游推荐服务[8]。方潇、曾令伟等基于关联规则挖掘经典算法Apriori,为用户推荐相关服务。张华、陈志刚等基于关联规则的算法,从海量数据库中挖掘个性化信息,为旅游电子商务的用户提供智能推荐。刘小燕等提出了基于增强学习技术的旅行会话推荐系统,帮助用户进行互动式对话获得目标。虞娟基于本体CBR的旅游产品案例方法,为用户推荐相似的旅游产品。

4.基于社会媒体的推荐

这种方法是利用集体智慧,将社会媒体中用户间的社会关系或其它媒体数据运用于推荐中。AbdulMajid、刘义海、卢昕根据社会化媒体网站上(如Flikr网站)用户上传的带有地理标签和时间信息的照片,和用户的需求、兴趣为用户提供个性化的旅游路线、旅游信息和旅行计划。刘艳等、胥皇等基于位置的社交网络上关于位置和活动的信息,建立地点和用户偏好模型,根据用户需求为用户提供个性化的旅游景点、旅游包。四、旅游推荐项目的研究

推荐系统应用到旅游领域中,包括对旅游景点、酒店、餐馆等单个旅游产品的推荐,也包括对旅游活动、旅游包、旅游目的地、旅游线路和旅游信息服务等涵盖多产品、多项目的推荐。

1.单个旅游推荐项目

从搜集到的文献中的内容来看,单个旅游项目的推荐主要是对旅游景点、酒店的推荐,文献并不多。胡乔楠、麻风梅等、侯新华等、史一帆等、刘艳等、于蓓佳这些学者利用不同的技术和算法,为用户推荐符合其要求和兴趣的旅游景点。它考虑了用户兴趣偏好和景点流行度的CIAP通过设置相似用户的景点推荐权值和景点流行度权值,得到最优推荐结果。

2.组合旅游推荐项目

胡纳纳等根据用户的兴趣推荐用户喜欢的旅游活动包括运动、景区、交通工具等。胥皇等通过交互地获取用户旅游意向,实时生成多个旅游包供用户选择。杨晓飞根据旅游者不同阶段的兴趣特征,向旅游者推荐目的地。方潇依据用户的历史行为其推荐旅游行程,并能将推荐后的行程进行地图可视化表达。

对于旅游路线的推荐,黄飞龙、曾令伟等、张华、吴春阳、吕红亮等学者根据用户数据和信息为用户推荐满足其个性化需求的旅游线路。郑外辉考虑了游玩景点时影响旅客旅游体验因素及旅游线路中影响游客旅游体验因素,为游客推荐符合其口味的景点旅游路线。卢昕利用含有地理位置信息的照片以及游记所涵盖的旅游信息,根据用户的需求为用户提供个性化的旅游路线规划。尹华罡利用互联网用户分享的海量图片数据通过挖掘用户信息和行为为用户提供个性化的路线推荐服务。

赫磊基于云平?_构建了一个快捷、智能、实时地旅游信息推送系统。张晗的旅游服务智能推荐系统,能够根据用户所提出的需求,结合用户的注册信息和浏览记录,智能地推荐旅游信息服务。许文雕利用云计算、物联网技术,对景区进行智能管理。郁娇娇将云模型的短时交通流预测模型以及交叉口信号优化的模型应用智能旅游系统中,为游客推荐行驶的最佳路线,减少出行时间,缩减出行费用。佘新伟在J2EE平台实现旅游服务推荐系统为游客提供旅游景点推荐、旅游行程规划、旅游线路推荐等服务及旅游相关信息查询服务。

五、旅游推荐系统研究的展望

1.旅游推荐系统的实时性

因为用户兴趣偏好以及对旅游需求会随着时间、地点、身体状况以及心情等的变化而变化,目前的推荐技术还没有考虑到这一点,所以下一步的研究就是随时跟踪捕捉到用户兴趣偏好和旅游需求的变化,根据其变化实时的向用户推荐旅游相关内容。

2.旅游推荐系统的针对性

大部分的推荐方法是基于一些对用户和项目的描述文件的理解来生成评价,而没有充分地利用用户的交互历史和其他可获取的信息。而且现在推荐技术因为缺乏基本的见解而没有能力模仿人的意见与用户进行交互。因此充分利用用户的历史信息和增强与用户交互的能力进而提高旅游推荐服务的的针对性是下一步研究的方向。

3.旅游推荐系统的多元性

传统的推荐系统仅仅是根据用户和产品的信息,而没有考虑其他的上下文信息,这些信息可能对旅游推荐是非常关键的。推荐系统在产品推荐中必须考虑时间、地点、用户的同伴等,如推荐一个旅游包,应该考虑时间、地点、用户跟谁一起去旅行、旅行条件和限制以及其他上下文信息等。规划最合适的旅行计划必须同时考虑几个因素,如景点的访问、当地酒店的选择、旅游预算的计算等。因此,旅游推荐系统从单一性向多元性发展是下一步的研究重点。

相关热门标签