公务员期刊网 精选范文 搜索引擎研究范文

搜索引擎研究精选(九篇)

搜索引擎研究

第1篇:搜索引擎研究范文

Internet又是一个无穷无尽的信息源泉,它已深入到人们生产、生活的各个领域,向人们提供着巨大的并且还在不断增长的信息资源和服务,越来越多的公司、企业通过网页宣传自己,越来越多的科研机关和学校通过网页交流科研成果,越来越多的组织和个人拥有了自己的主页,越来越多的报刊、杂志加入了Internet的大家庭,足不出户而知天下事已不再是神话。据不完全统计,1996年Internet上的网页数已达到1900万,时至今日,这个数目决不会少于4亿。

为了让用户能够在如此庞大、杂乱、瞬息万变的信息海洋中,方便、快捷地找到自己感兴趣的信息,而不是茫然不知所措,仅靠网页上的超文本链是远远不够的,提供WWW信息导航服务的搜索引擎(Search Engine)是解决这个问题的一个途径。传统的Spider式搜索引擎通过被称为Spider的程序自动地在网上循着超文本链递归地访问、收集WWW网页,分析页面的内容,生成索引和摘要,并向用户提供WWW查询页面,根据用户的查询请求在索引库中查找相关信息在网上的位置,最后将查询结果按照相关度排序后返回,帮助用户尽快地找到所需的信息,给用户带来了极大的便利。这类搜索引擎的代表有Infoseek和Alta Vista基于人工分类的目录式搜索引擎稍后出现,它在人工的参与下建立分类目录,对收集的网页按主题或者学科进行分类,编写摘要,用户可以沿着分类目录的层次结构,进入自己感兴趣的主题,进而找到所需的信息。这类搜索引擎的代表是Yahoo和Sohoo。

比较这两种搜索引擎,Spider式搜索引擎自动地收集、分析和处理网页,因而它索引的网页数多,信息量大,并且能定期重新收集网页,更新索引库的内容,向用户提供最新的导航信息,但由于它只提供基于关键词或全文的检索,用户只有确切地知道自己想查什么,自己感兴趣的网页应当含有哪些关键词时,查询的效果才比较理想,否则,返回的结果很可能和用户的实际需要相距甚远;目录式搜索引擎在对网页的分类和网页内容的理解上引进了人工干预的机制,因而在查询的准确性方面要优于Spider式搜索引擎。它支持基于分类目录的查询,当用户对某个领域感兴趣但并不熟悉这个领域的关键词时,这种查询方式能很好地为用户提供服务,而此时Spider式搜索引擎则基本上无能为力。由于人工分类和摘要编写的效率低,网页更新困难,目录式搜索引擎在索引的网页的数量上受到了很大的限制,维护管理工作量大,Infoseek,Alta Vista等Spider式搜索引擎索引的网页数早以突破千万,而yahoo则还停留在百万级的水平。

信息量大是Spider式搜索引擎的一大优点,但这也常常使得返回的查询结果成千上万,用户经常需要在一大堆不感兴趣的信息中费很大力气才能找到自己感兴趣的网页,有时甚至还会一无所获,无功而返。如果搜索引擎能够对收集的网页按学科或者主题进行分类,用户可以选择只在自己感兴趣的领域内查询,这样就能将许多无关网页排除在返回结果之外,极大地提高查询结果的准确性,方便用户的使用。目前,支持分类目录是Spider式搜索引擎发展的趋势,Alta Vista在查询页面上增加了分类目录,当用户基于分类目录进行查询时,系统实际上是使用目录式搜索引擎人工处理的数据提供服务。除了采用人工的方法对网页分类之外,还可以人工建立分类目录,利用人工智能领域研究的一些技术对网页自动分类。搜索引擎大家庭中的后起之秀Northern Light采用的就是这种方法,它参照美国国会图书馆图书分类的方法,人工建立基于主题的分类目录,然后通过Spider在网上自动地收集网页,采用离线的方式,应用文档自动分类技术对网页自动分类,建立索引,向用户提供导航服务。

所谓文档自动分类就是指定文档和预先定义好的一些类之间的类属关系,分类的工作由计算机自动完成。从分类的准确性来看,文档人工分类要优于自动分类,但这并不说明自动分类就没有存在的价值。首先,自动分类在速度和效率上要大大优于人工分类,它能节省大量的人力、物力和资金;其次,对于人工分类,如果分类人员的素质不够高,或者面对不熟悉的领域,分类的准确性很难保证,在这个时候,自动分类系统可以作为人工分类的辅助工具,分类人员可以参考自动分类的结果,作出正确的判断,提高分类的准确性。

第2篇:搜索引擎研究范文

“条条大路通罗马”,每个seoer对搜索引擎排名的看法角度不同,但很多都能获得想要得到的排名。许多做搜索引擎优化的同胞们,在做网站优化的时候会遭到搜索引擎的惩罚,搜索引擎惩罚的界限在哪里?网站获得好的排名后如何才能维护好排名,使其在搜索引擎算法调整中利于不败之位。针对这些问题,本文和大家分享一下,本人在研究搜索引擎优化数年的研究方法,希望对各位同行有参考作用,对后者有指导作用。

研究方法一:排序结果研究法

所谓的排序结构研究法,不言而喻就是针对关键词检索结构的研究。通过搜索结果的分析可以寻找到,关键词布置的位置与频率。针对关键词采集搜索引擎排名的前十名的页面进行信息采集分析,统计出网页关键词密度、页面标签使用情况、和其他可能影响排名算法的因素,进而进行整理汇总,形成一套调整页面和网站结构的优化方法。

搜索引擎优化是个外科手术,永远不知道内在的算法是什么,但是我们知道最终的结果是什么,通过对黑盒的测试,可以让我们知道我们应该做什么。

目前排序结构研究法很受推崇,国外的一些优化软件如IBP、webCEO等都是基于这种思想开发的。

研究方法二:相关产品研究法

谷歌的竞价排名有这样一个规则,当你的广告在用户搜索结果中出现时,用户点击了你的广告,而没有点击其他广告,或者说,在搜索结果中你的广告的点击率很高,说明你的广告和用户搜索结果相关性很高,谷歌竞价系统就会给你的这个广告很高的指标,即使和你的广告放在一起的、竞价价格比你的还要高,你的还会排在他们的前面。谷歌公司应用用户行为学理论与数据统计理论,利用先进的数据处理技术,不断调整搜索引擎检索数量、和质量,改善用户搜索体验,技术总是相通相容的。大多搜索引擎都有其他的产品,百度和谷歌是善于将自己的先进的搜索引擎技术用于其他产品之上的。所以研究搜索引擎的其它产品总是可以寻找到蛛丝马迹,来提高搜索引擎优化技术。

.研究方法三:技术性研究法

做搜索引擎优化,如果不懂搜索引擎技术的话就不是一个好的SEOER。懂搜索引擎技术不仅仅是要明白搜索引擎的工作原理、搜索引擎分词原理、信息处理技术,更应该深层次的搜索引擎处理信息的技术核心点,把握住技术走向,做到知己知彼。我们永远不会知道搜索引擎算法中最核心的东西,不过可以把握到核心的方向。搜索引擎改善用户体验必须要做到速度要快、准确度要高、歧义消除、表现形势多样。例如,谷歌搜索结果中有种分栏效果,如果不懂技术的话就会天马行空的猜测,而懂技术的一眼就能看出眉目,有方向有步骤的,将网站优化成分栏效果。

研究方法四:用户体验研究法

第3篇:搜索引擎研究范文

关键词: 垂直旅游搜索引擎; SNS; 旅游信息; 合作模式

中图分类号: C931文献标识码: A文章编号: 1009-055X(2013)05-0039-05

垂直旅游搜索引擎为用户提供旅游行业深度资源整合和专业旅游信息检索服务。近年来, 国内垂直旅游搜索引擎发展迅速, 先后出现了去哪儿、 酷讯等数十家专注于提供旅游产品和信息的垂直旅游搜索引擎。2010年中国垂直旅游搜索市场规模达到17亿元, 旅游搜索用户大幅增长, 旅游搜索引擎已成为网民获取旅游资的第一平台, 同时成为旅游用户在线预订重要入口[1-2]。

现有的垂直旅游搜索引擎研究成果相对较少, 并且主要都是围绕于垂直旅游搜索引擎系统内部的检索及服务机制的纵向研究, 对于其横向的模式拓展, 则在一定程度上有所欠缺。基于六度分割理论和网络外部性的SNS一度成为凝聚人气的良好平台, 部分学者对基于SNS机制发展在线旅游进行了初步研究。王国钦等人从旅游营销角度对两岸SNS网站进行旅游营销提出了评析与建议[3]; Yinghua Huang等人研究了用户在SNS上分享旅游信息的潜在动机和壁垒, 并分别探讨了主要的影响因素[4]; Zheng xiang、 Ulrike Gretzel主要从旅游信息来源角度深入研究了包括SNS在内的社会媒体在旅游信息搜索中扮演了重要角色[5], 这些为本文模式的提出提供了契机。

本文主要针对目前垂直旅游搜索引擎存在的问题进行分析基础上, 提出与SNS合作模式, 从信息和用户两个基本维度出发, 以整合SNS与垂直旅游搜索引擎专业优势, 为用户提供更好服务。

一、 垂直旅游搜索引擎价值分析与存在问题

(一) 垂直旅游搜索引擎价值分析

垂直旅游搜索引擎针对在线旅游市场, 通过对各大旅游产品服务供应商或分销商的旅游产品信息进行直观比较, 为旅游用户提供了有价值的旅游信息和服务, 并逐渐改变了旅游用户搜索和预定旅游行程的方式。当前, 垂直旅游搜索引擎模式在不断发展和演变, 在基于搜索和推荐基本功能上, 融合的点评功能和交流社区等形式在一定程度上体现了Web20特性。罗龙艳、 窦厚玺对垂直旅游搜索引擎的特点进行了分析[6], 笔者在其基础上对垂直旅游搜索引擎价值进行了总结:

1. 作为中立的第三方, 垂直旅游搜索引擎能够为中小型旅游分销商、 航空公司和酒店等旅游产品供应商提供专业的网络营销平台;

2. 深度聚合了行业内旅游信息, 为旅游用户提供了包含食、 住、 行、 游、 娱、 购在内的全方位的旅游产品信息;

3. 其比价搜索模式为旅游用户提供了“货比三家”的服务, 让用户自行排序或者过滤得到所需的数据, 做出关于旅游产品科学合理的决策依据, 满足用户需求;

4. 集成了目前流行的点评功能, 与旅游用户形成了一定的互动机制, 大量用户评价结果和经验分享形成的口碑数据库对旅游用户决策具有良好的参考价值, 同时也能为旅游产品供应商直接提供了服务反馈结果。

总之, 当前的垂直旅游搜索引擎为旅游用户提供的服务已经成为旅游产业链的重要一环, 贯穿于旅游产品决策前、 旅行行程中和旅行后评价整个旅游过程中。

(二) 垂直旅游搜索引擎存在问题

在垂直旅游搜索引擎取得快速发展的同时, 其局限性与劣势也日益凸显, 吴晓翠运用SWOT分析法对旅游搜索引擎的内部优劣势和外部环境进行分, 并提出其劣势主要表现在易遭遇著作权侵权问题和用户群体没有固定[7]。笔者认为, 目前垂直旅游搜索引擎普遍存在以下不足:

华 南 理 工 大 学 学 报(社 会 科 学 版)

第5期刘文斌 等: SNS与垂直旅游搜索引擎合作模式研究

1. 旅游数据采集来源单一

垂直旅游搜索系统主要旅游数据采集来源都是各大旅游产品服务供应商或分销商网站上关于旅游产品的信息描述。旅游数据来源渠道单一。

2. 用户对检索结果信任度不高

由于垂直搜索引擎本身的搜索机制和形式, 可能会发生不公正甚至虚假的检索结果。同时, 用户对检索出的旅游信息供应商信任度不高。

3. 用户粘性和忠诚度不高

垂直旅游搜索引擎主要为用户提供一次性的检索服务, 即使目前出现的“搜索+社区”形式, 但总体上也难以有效的形式增强用户的粘度。同时, 垂直搜索引擎行业竞争日趋激烈, 用户对垂直旅游搜索引擎选择选择空间较大。

4. 旅游信息检索服务同质化

垂直旅游搜索引擎主要以比价搜索模式存在, 在旅游数据采集来源, 旅游信息处理机制、 服务内容和盈利模式等各方面没有明显的区别。垂直旅游搜索引擎为用户提供服务出现同质化。

垂直旅游搜索引擎存在的问题是其自身发展的结果, 根本原因在于受限于当前的商业模式缺乏创新, 一方面上游旅游信息获取渠道有限, 且大部分旅游信息缺少自主的著作权; 另一方面没有很好的形式培养下游旅游用户的粘性和忠诚度。

二、 SNS与垂直旅游搜索引擎合作模式可行性分析

(一) SNS特性分析

SNS, 全称 Social Networking Services, 即社会性网络服务, 旨在帮助人们建立社会性网络的互联网应用服务。目前国内外对SNS研究相对比较成熟, 高欣对SNS特征进行了总结, 并从信息传播的视角对SNS进行了深入研究[8]; 闫幸、 常亚平对以往SNS研究进行了梳理、 总结和评述[9]。SNS较好的满足了用户感情依赖心理, 其特性主要体现在以下几个方面:

1. 完善的好友关系网络, 实名制程度比较高

SNS相比于一般的社区, 具有比较完善的用户资料信息, SNS用户一般都具有较完善的基于用户熟悉或具有相同兴趣爱好的好友关系网络, 实名制程度相对较高。

2. 用户交互方式多样, 互动性强, 黏性较高

SNS一般聚合了包括日志、 相册、 群组、 分享、 个人状态以及游戏应用等在内的多种用户交互方式, 用户活跃度高, 且具有相对较好的用户互动性和黏性。

3. 内容由用户自主产生, 全面且多样

SNS作为Web20的典型的代表, 其内部信息主要都是由用户自主产生, 并且以个人为中心来组织信息, 内容形式灵活多样, 范围广泛且信息聚合效应明显。

4. 完善的信息传播和分享机制

基于好友机制的人际网络为信息分享和传播机制提供了基础。分享机制通过简单的操作即能满足用户日益增长的信息需求, 同时使得SNS中的信息有着裂变的传播效果。

(二) 合作可行性分析

垂直旅游搜索引擎与SNS合作可行性主要基于以下几个方面:

1. SNS可以为垂直旅游搜索引擎提供重要旅游信息

在Web20时代, SNS中散播着大量的旅游信息。艾瑞咨询2011初调研数据显示, SNS超越旅游点评类网站, 成为用户分享旅游经历最主要途径。(Zheng Xiang、 Ulrike Gretzel, 2010)一文中也定量分析了SNS提供了重要的旅游搜索信息[5]。由于SNS屏蔽网络爬虫对其信息的抓取, 垂直旅游搜索引擎不能检索到SNS中的旅游信息。但是这些基于用户亲身体验和分享的旅游信息是非常重要的, 不可忽视。相比传统的垂直旅游搜索引擎, 这些旅游信息具有如下特点:

① 离散分布。SNS中旅游信息离散分布不仅表现在对于同一SNS平台上的不同用户之间, 还表现在不同SNS平台上。SNS中旅游信息主要离散分布于旅游相关个人日志和话题小组中。

② 口语化, 内容纪实。SNS充分体现了Web20特性, 旅游信息由用户自己产生, 内容主要是关于用户实际旅游经历的分享, 多以时间或事件为主线的纪实。

③ 可靠性、 真实性高。基于好友机制、 分享机制和传播机制的SNS具有较好的信任关系, SNS内部旅游信息具有很高的可靠性和真实性。

艾瑞咨询的研究发现, 亲朋好友是中国用户获取旅游信息的最主要途径。SNS中的旅游信息和SNS本身的运行机制决定了SNS中的旅游信息可以成为垂直旅游搜索引擎重要的旅游信息来源。

2. SNS和垂直旅游搜索引擎用户可以相互渗透和转化

一方面, SNS用户具有一定的旅游信息检索需求, 另一方面, 垂直旅游搜索引擎可以通过SNS机制提高用户粘度和忠诚度。垂直旅游搜索引擎与SNS合作模式, 促使SNS中的旅游信息会出现在垂直旅游搜索引擎检索结果中, 为垂直旅游搜索引擎用户转化为SNS用户提供了契机。同时, 通过在SNS下加载垂直旅游搜索应用等方式, 使得SNS用户可以转换为垂直旅游搜索引擎用户。

3. SNS可以为垂直旅游搜索引擎提供良好营销方式

基于SNS自身的特有优势, 可以为垂直旅游搜索引擎提供良好的营销方式。例如SNS可以通过加载垂直旅游搜索引擎应用, 为垂直旅游搜索引擎拓展营销渠道。通过SNS用户分享垂直旅游搜索引擎较好的检索结果, 达到快速的营销宣传效果。

4. 垂直旅游搜索引擎可以为SNS提供检索结果评价与反馈

通过与SNS合作, 垂直旅游搜索引擎用户可以对来源于SNS中旅游信息检索结果进行评价, 以点评类机制形式提供良好的用户反馈功能, 为其他用户提供更好的参考价值, 最终将整体上提高用户对垂直旅游搜索引擎的用户满意度和忠诚度。

三、 SNS与垂直旅游搜索引擎合作模式

(一) 合作模式整体框架

垂直旅游搜索引擎与SNS合作模式主要基于两个维度: 信息与用户。此模式下合作框架如图1。在此框架下, 对于信息维度, 信息是指旅游信息在SNS与垂直旅游搜索引擎之间的流动, 垂直旅游搜索引擎的信息来源从目前的专业旅游网站扩展到SNS。SNS为垂直旅游搜索引擎提供旅游信息, 垂直旅游搜索引擎对于来自SNS中的旅游信息检索结果具有评价反馈功能。对于用户维度, 用户是指SNS用户与垂直旅游搜索引擎用户之间可以相互渗透和转化。原本独立的垂直旅游搜索引擎用户会与SNS用户产生部分转化, 从而使得自身用户增加, 而整个用户将是此合作模式下的整体用户群体。图1垂直旅游搜索引擎与SNS合作框架图(二) 合作模式实现

从系统形态上来看, 此模式下垂直旅游搜索引擎与SNS属于两个独立的系统。在具体实现上主要是针对旅游信息以及评价反馈在两系统间的信息流动。垂直旅游搜索引擎与SNS合作实现机制如图2所示。

图2垂直旅游搜索引擎与SNS合作实现机制

如图2, SNS为垂直旅游搜索引擎提供旅游信息主要分为两个过程, 即SNS旅游信息处理机制和SNS旅游信息提供机制。

SNS旅游信息处理机制即SNS对其内部的旅游信息进行处理。由于SNS中的旅游信息是由用户自主产生, 且多以日志形式出现, 其离散分布以及口语化的特点要求SNS旅游信息处理机制首先对旅游信息进行处理。在具体的处理过程中, 主要分为两个方面内容: SNS用户旅游信息隐私设置机制和SNS旅游信息筛选机制。由于SNS中的旅游日志是由用户自主产生, 其中涉及到用户个人隐私等问题, 在与垂直旅游搜索引擎进行合作过程中, SNS平台首先需要尊重用户自身意愿, 在原有系统基础上进行适当改造, 增加上用户可选择其旅游日志是否愿意被垂直旅游搜索引擎检索到的隐私设置。由于SNS中的旅游信息离散分布, 且在与垂直旅游搜索引擎合作过程中, 涉及到合作信息内容限于旅游信息, SNS应该对其内部旅游信息事先进行预处理, 主要内容将包括旅游信息的筛选等。

SNS旅游信息提供机制即选择恰当的方式将SNS中处理好的旅游信息提供给垂直旅游搜索引擎。在具体方式上, 主要需要考虑以下技术可行性和具体合作模式两个方面。本文中给出以下两种可实施方案:

① 共享数据库。SNS将其内部的旅游信息经过SNS旅游信息处理机制处理完成后, 将旅游信息的具体信息URL, 作者(SNS用户), 发表时间, 其他用户评价等具体信息储存于一个单独设立的数据库中, 并与垂直旅游搜索引擎共享此数据库。垂直旅游搜索引擎可以直接操作此共享数据库, 以此完成旅游信息的摘录。

② 开放API。SNS将处理好的旅游信息访问接口进行封装, 对垂直旅游搜索引擎开放API, SNS需要向垂直旅游搜索引擎提供API调用地址、 API的调用地址和参数、 支持格式、 HTTP请求方式和应答形式以及API访问权限限制等。具体访问认证形式上可以采取Basic Access Authentication认证授权机制。

垂直旅游搜索引擎对来源于SNS中的旅游信息检索结果反馈机制是指垂直旅游搜索引擎用户对于检索到的来源于SNS中的旅游信息在遵循旅游信息所有者的个人设置的前提下能够对其进行评价与反馈, 具体评价形式可以与当前SNS中用户日志回复机制类似, 也可以对检索结果标注喜欢等级等形式。

(三) 合作模式中的关键问题

1. SNS中旅游信息筛选问题

SNS主要是以个人为中心来组织信息, 用户需求和兴趣的多样性决定了信息的种类和内容千差万别。大量用户产生大量的信息沉淀和积累, 并且信息内容不具有指定的主题特征。这就使得从所有的信息中筛选出特定旅游信息的难度增加。SNS中旅游信息的口语化特点又决定了并非所有的旅游信息都满足需求。另外, 在筛选的同时, 还要从筛选的结果中进行语义分析, 抽取出相关的时间、 地点、 价格和路线等相关的旅游特征词汇, 并分别建立主题, 以便于向垂直旅游搜索引擎提供信息。同时, 垂直旅游搜索引擎在判定SNS中的旅游信息页面权重方面将会存在较大困难。

2. 用户隐私问题

SNS中具有大量的用户私密信息。SNS中的大量“弱关系”的存在使得网民需要通过隐私设置来管理远近亲疏不尽相同的朋友关系[10]。隐私问题成为用户在SNS上分享旅游信息的主要考虑因素[4]。对网络用户而言, 隐私权对于主要体现为决定是否向他人公开个人信息的权利。在与垂直旅游搜索引擎合作过程中, SNS需要充分做好用户信息隐私保护问题。一方面使得合作范围限于旅游信息, 另一方面要做好用户信息隐私设置问题, 对于用户不愿被垂直旅游搜索引擎检索到的信息决不能向垂直旅游搜索引擎提供。在隐私设置机制上, 原有的SNS隐私设置主要是SNS内部基于好友关系, 此合作模式下将需要增加专门针对垂直旅游搜索引擎检索的隐私设置机制。

3. 安全问题

安全问题一直是互联网上最为关注的问题之一。在本文提出的合作模式下, 新的安全问题将主要表现在SNS旅游信息提供机制环节上。本文中给出了两种可行的信息提供方式, 无论哪种方式下, 安全问题都需要得到充分保证。

4. 为用户提供服务形式问题

基于本文提出的合作模式, SNS中的旅游信息将能出现在垂直旅游搜索引擎检索结果中, 在实际的合作过程中, 需要全方位的考虑到为用户提供服务的形式问题。例如: 旅游用户对于检索的结果, 是否必须登录SNS后才能看到连接内容, 还是可以通过将垂直旅游搜索引擎用户与SNS用户进行帐号关联即可直接看到结果?垂直旅游搜索引擎用户具体通过何种形可以对来源于SNS中的旅游信息进行评价?在基于用户SNS隐私设置的前提下, 如何实现检索结果与SNS用户隐私设置的一致性和后续可操作性?这些问题不同解决方式将直接影响到用户的体验, 从而直接影响此模式的实际效果。

5. 组织协调、 整合及利益分配问题

本文中给出了具体的合作实现方案, 主要是从实现上进行的考虑。在实际的合作过程中, 将会牵涉到组织的协调、 整合以及利益分配等方面问题。具体选择哪些合作对象, 采用何种合作方式, 如何界定、 评价合作效果, 如何进行公平客观的利益划分等, 这些问题对于合作成效具有决定性的影响。

四、 总结与展望

本文主要针对垂直旅游搜索引擎与SNS合作模式进行了详细探讨, 分析了当前垂直旅游搜索引擎中存在的问题和此模式下合作的可行性。提出了具体的合作框架和实现机制, 主要从信息和用户两个维度来阐述问题, 并就合作中的一些关键问题进行了分析。本文提出的合作模式较好的融合了当前SNS与垂直旅游搜索引擎各自的优势, 在一定程度上能够较好解决当前垂直旅游搜索引擎存在的问题, 为用户提供更好的服务。在实际的实现过中, 还需要考虑到实际的行业情况, 针对不同的合作对象具有不同合作形式和策略上的调整。

随着互联网的不断发展, 垂直旅游搜索引擎在不断的发展和演变。在整合上下游产业链, 发展和维系与合作伙伴的良性关系的同时, 垂直旅游搜索引擎必将不断引入更多的新的元素, 把握住内容和用户是垂直旅游搜索引擎发展的两个根本基石, 形成差异化、 具有特色的竞争优势。寻求更广泛的商业模式, 提供更好的内容和更好的形式留住用户, 将是垂直旅游搜索引擎发展的根本方向。

参考文献:

[1]艺恩咨询. 2011中国旅游电子商务研究报告[M]. 北京: 艺恩咨询. 2010.

[2]艾瑞咨询. 2010-2011年中国在线旅游预订用户行为研究报告[M]. 上海: 艾瑞咨询, 2011.

[3]王国钦, 曹胜雄, 葛丽芳等. 两岸十SNS网站内容与产品置入分析―以旅游营销为视点[J]. 旅游学刊. 2011, 25(7): 40-46.

[4]Yinghua Huang, Choton Basu, Maxwell K. Hsu. Exploring Motivations of Travel Knowledge Sharing on Social Network Sites: An Empirical Investigation of U. S. College Students[J]. Journal of Hospitality Marketing & Management. 2010, 19(7): 717-734.

[5]Zheng Xiang, Ulrike Gretzel. Role of social media in online travel information search[J]. 2010, 31(2): 179-188.

[6]罗龙艳, 窦厚玺. 基于AHP的旅游搜索引擎评价分析[J]. 科技管理研究. 2011(9): 1-75.

[7]吴晓翠, 旅游搜索引擎的SWOT分析及发展策略[J]. 科技信息. 2011: 525-526.

[8]高欣. SNS社区网站传播模式研究[D]. 武汉: 华中科技大学. 2010.

第4篇:搜索引擎研究范文

关键词:搜索引擎; 分类; 类目

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)18-4174-03

目录型搜索引擎采用网站登录收录方式,依据主旨、用户对象及网络资源状况构建分类体系,把收集到的本地的网站页面进行人工编辑,层层类分,形成纵向隶属、横向关联的网站目录数据库。用户依据类目体系及其规则分类检索,逐类浏览,直至获得所需资源[1]。

目前,中文分类搜索引擎正蓬勃发展,犹如雨后春笋般相继出现,但各家搜索引擎的分类目录多为自编,这些自编的分类类录或多或少的存在着问题,不能完全的满足用户的检索需求[2]。所以笔者认为,建立统一的分类类录体系势在必行。该文在研究多数分类搜索引擎的基础上,归结出分类类录的大致类别,以期为相关研究机构和人员提供参考。

1 样本来源及研究方法

1.1样本来源

本文选取的样本来自于中国网站排名(.cn)。中国网站排名由中国互联网协会主办,主要提供网站综合排名TOP榜、网站流量趋势、统计工具、互联网市场信息等业务。

本文主要研究的是搜索引擎的分类,所以选取的搜索引擎须满足两个条件:一是目录型搜索引擎;二是综合性门户网站。结合这两点,在网站排名TOP100中,剔除掉全文搜索型引擎(如, 、.hk、等),以及专项式搜索引擎,例如购物网站(、等),银行网站(如.cn类),视频网站(如 、等),游戏网站(、等),交友网站(、等)等等,选取11个具有代表性的目录式综合搜索引擎进行研究,分别是:腾讯网()、新浪网(.cn)、凤凰网()、搜狐()、网易()、中华网()、新华网()、中国雅虎()、人民网(.cn)、北方网(.cn)、环球网()(表1)。

1.2研究方法

根据中国网站排名,选择具有代表性的11种目录式综合搜索引擎,收集并整理目录(表2),为方便统计,将同一意思的目录统一名称,例如,“购车”转换为“汽车”、“IT”转化为“科技”、“图库”转化为“图片”、“台湾”转化为“台海”、“尚品”转化为“时尚”、“地方站”简化为“地方”、“悬赏问答”简化为“问答”等等;统计搜索引擎类目,计算个类目的词频;按词频的高低进行排序;最后对词频表进行分析研究。

2 数据分析

将表2进行统计整理,总共获得105个不同类目,对每个类目出现次数进行统计,并将结果降序排列,得到类目的词频统计图(表3)。再将表3中的类目词频进行统计,获得高频词低频词统计表(表4)。

由表3可知,类目“汽车”、“新闻”、“科技”、“体育”、“娱乐”、“财经”、“房产”“旅游”是词频排名前三名的类目,说明它们是分类体系的主流类,目录型搜索引擎基本上都有着几大类;由表4可知,高词频(词频[≥]7)类目数很少,只占到总数的12.38%,相反,低频词(词频[≤]3)类目数却很多,占总数的76.19%,这显然是不合理的。

3 类目词频统计结果分析

3.1搜索引擎类目分类存在的问题

1) 分类类目数差距大

根据表1显示,搜狐的一级类目有34个,凤凰网和人民网的类目有32个,而环球网的类目只有19个,网易和北方网也只有21个,最大的差距有多大15个。类目数过多,分类过于庞杂、外延溢出,例如搜狐的“高考”属于“教育”的外延溢出,其完全可以并入“教育”类;类目数过少,知识覆盖不全,体系过于简单,查询者需要层层遍历,才能找到所需信息,浪费时间,例如想在环球网查找体育相关的信息,就必须同时查找“新闻”、“社会”、“评论”等类目,层层遍历,直到找到体育相关的信息。

2) 归类不科学,划分有失恰当

许多搜索引擎的分类体系未能严格的按照类目的内涵和外延进行科学地归属类目[3],其分类体系划分失误的种类主要有以下几种:①划分出来的类目相包容。例如,新浪网的“新浪大片”类目完全可以归纳在“视频”类目中,搜狐网的“”类目可归纳在“财经”类目中;②划分过窄。例如,环球网的“历史”类目,内涵过窄,可以开辟一个“文化”大类,将“历史”这一类目作为它的二级类目;③划分过宽。例如,北方网的“文娱”类目,外延过于宽泛,可以拆分成“文化”和“娱乐”两个类目。

3)类目排列随意,界面欠友好

某些网站的界面友好层度比较低,广告太多,类目布局不合理,以及类目和二级类目混杂,版面混乱,给查询者的视觉效果不良[4];凤凰网的左侧右侧均插入了广告,并且随滚动条滚动,版面不够洁净,然让看了不舒服。例如,搜狐网的一级类目和二级类目混杂在一起,且字体大小一样,导致类目过多,看的人眼花。相反,新浪网设有网页导航,左侧边栏为一级目录,右侧为二级和三级目录,一目了然,分类清晰。

4)类名不规范,缺乏统一的类名体系

搜索引擎分类体系中普遍存在类名不统一的现象,各家搜索引擎同内涵和外延的类目却分别标示着不同的类目名称。例如,搜狐、人民网、北方网出现了“IT”这一类目,而腾讯、新浪、凤凰网、网易用的是“科技”这一类目;腾讯、新浪的“女性”类目和搜狐、网易、中华网的“女人”这一类目也是同属一个概念。

5)出现生僻类,类下缺乏注释

中文搜索引擎在其分类体系中采用了网页制作者自己自编的类目名称或是广大网名自发形成的网络用语、俗称、简称、英文缩写、惯称等自然语言[3],但有些类名缺乏规范化处理,类下有无注释,用户很难判别其内涵和外延,增加用户的额外负担。例如,搜狐的“白社会”、北方网的“18街”、中华网的“有料”、中国雅虎的“心香一脉”等,在没有注释的情况下,用户无从知道这些类目到底代表着什么样的内容[5]。

4 对搜索引擎类分类体系的思考

根据各类目出现的频次,将类目体系分为四类:主流类,次流类,商榷类,修改类(表5)。

4.1 主流类和次流类

主流类中的类目频次都是大于或等于7的,即它是由高频词组成的,这些类目是搜索引擎的主流类目,几乎所有的搜索引擎基本上都有这13个类目,在编制搜索引擎类目体系时,这13个类目可保留,直接使用;次流类是由类目频次小于7大于等于4的类目组成,这些类目是搜索引擎的基本类目,将近一半的搜索引擎都有这12个类目,对于这12个类目,可直接保留使用,也可稍作微调,例如,将“读书”归入“文化”类、“手机”纳入“数码”类、“微博”与“博客”合为一类,搜索引擎分类体系可根据自身情况借鉴使用。

4.2 商榷类

商榷类类目是由频次等于2和3的类目组成,这一类类目比较庞杂,界限不明确,需要调整后使用,分两种情况:

1)保留型,将其比较典型的类目,与其他类目外延交叉较低的类目保留下来,例如“亲子”、“女性”、“环保”、“问答”等;

2)调整型,将外延重叠交叉的类目进行调整,例如,“历史”纳入次流类的“文化”类,“动漫”归入“游戏”类,“”纳入“财经”类,“女人”和“女性”合并为一类等。

4.3 修改类

修改类全部是由频次等于1的类目构成,对于这类类目,要进行大幅修改,才可以投入使用。修改方式有四种:

1)保留型,一些类目虽然不常使用,但也是属于一种新类别或是实用价值比较高的类目应予以保留,例如“男人”类目(因为有“女性”这一类目,为公平,应也有“男人”这一类目)导航(实用性很强);

2)包容型,一些类目的外延与其他类目交叉重叠了,所以不必要单独列出来,例如,“教育”已经包括“高考”这一类目,“新浪大片”包含在“视频”类目中,“华人佛教”属于“文化”范畴等等。

3)注释型,一些类目太过标新立异,仅看名字无法理解其内涵,不方便用户使用,因此,需要加以注释,例如,“白社会”、“节会”、“宽频”、“18街”、“有料”、“心香一脉”。

4)摒弃型,一些类目是完全不必要出现在一级类目中,需要直接舍弃掉,例如,“服饰”、“高尔夫”、“心理测试”等。

综上所述,一般性综合搜索引擎的一级类目应大致有:“新闻”、“财经”、“科技”、“体育”、“娱乐”、“教育”、“房产”、“汽车”、“旅游”、“论坛”、“视频”、“公益”、“健康”、“游戏”、“地方”、“博客”、“读书”、“邮箱”、“军事”、“文化”、“时尚”、“数码”、“图片”、“环保”、“女性”“问答”、“国际”、“男人”、“导航”这28个类目。在编制搜索引擎的类目体系时,考虑自身搜索引擎的特点、偏向,具体问题具体分析,借鉴使用。

参考文献:

[1] 罗德一.农业分类搜索引擎分类体系研究[D].南京:南京农业大学,2004:3.

[2] 刑志宇.分类搜索引擎探析[J].河南图书馆学刊,2006(10).

[3] 余义芳.中文搜索引擎分类体系存在的问题及对传统分类法的借鉴[J].图书与情报,2004(3).

第5篇:搜索引擎研究范文

关键词:网络 搜索引擎 发展 使用技巧

中图分类号:G520文献标识码: A

1 搜索引擎技术发展史

从搜索引擎所采取的技术来说,可以将搜索引擎技术的发展划分为4个时代。

1.1 分类目录的时代

这个时代也可以称为“导航时代”,Yahoo和国内hao123是这个时代的代表。通过人工收集整理,把属于各个类别的高质量网站或者网页分门别类罗列,用户可以根据分组目录来查找高质量的网站。这种方式是纯人工的方式,并未采取什么高深的技术手段。

采取分类目录的方式,一般被收录的网站质量都较高,但是这种方式可扩展性不强,绝大部分网站不能被收录。

1.2 文本检索的时代

文本检索的一代采用经典的信息检索模型,比如布尔模型、向量空间模型或者概率模型,来计算用户查询关键词和网页文本内容的相关程度。网页之间有丰富的链接关系,而这一代搜索引擎并未使用这些信息。早期的很多搜索引擎比如Alta Vista、Excite等大都采取这种模式。

相比分类目录,这种方式可以收录大部分网页,并能够按照网页内容和用户查询的匹配程度进行排序。但是总体而言,搜索结果质量不是很好。

1.3 链接分析的时代

这一代的搜索引擎充分利用了网页之间的链接关系,并深入挖掘和利用了网页链接所代表的含义。通常而言,网页链接代表了一种推荐关系,所以通过链接分析可以在海量内容中找出重要的网页。这种重要性本质上是对网页流行程度的一种衡量,因为被推荐次数多的网页其实代表了具有流行性。搜索引擎通过结合网页流行性和内容相似性来改善搜索质量。

Google率先提出并使用PageRank链接分析技术,并大获成功,这同时引进了学术界和其他商业搜索引擎的关注。后来学术界陆续提出了很多改进的链接分析算法。目前几乎所有的商业搜索引擎都采取了链接分析技术。

采用链接分析能够有效改善搜索结果质量,但是这种搜索引擎并未考虑用户的个性化要求,所以只要输入的查询请求相同,所有用户都会获得相同的搜索结果。另外,很多网站拥有者为了获得更高的搜索排名,针对链接分析算法提出了不少链接作弊方案,这样导致搜索结果质量变差。

1.4 用户中心的时代

目前的搜索引擎大都可以归入这个时代,即以理解用户需求为核心。不同用户即使输入同一个查询关键词,但其目的也有可能不一样。比如同样输入“苹果”作为查询词,一个追捧不iPhone的时尚青年和一个果农的目的会有相当大的差距。即使是同一个用户,输入相同的查询词,也会因为所在的时间和场合不同,需求有所变化。而目前搜索引擎大都致力于解决如下问题:如何能够理解用户发出的某个很短小的查询词背后包含的真正需求,所以这一代的搜索引擎称之为以用户为中心的一代。

为了能够获取用户的真实需求,目前搜索引擎大都做了很多技术方面的尝试。比如利用用户发送查询时的时间和地理位置信息,利用用户过去发出的查询词及相应的点击记录等历史信息等技术手段,来试图理解用户此时此地的真正需求。

2 网络搜索引擎的发展趋势

2.1 个性化搜索

互联网的发展已经进入了新的阶段,即以用户为中心的阶段。如何通用用户的网上行为建立用户的个人模型,并基于此提供精准的个性化服务成为各种研究的重点。搜索引擎也不例外,个性化搜索即是为了解决这个问题而提出的技术领域。

对于搜索引擎用户来说,由于其个人兴趣不同,即使是同一个查询词,也可能其搜索意图迥异。如用用户发出查询“Ajax”,如果这个用户是计算机工程人员,那么很有可能希望查找的是技术资料;而如果这个用户是个球迷,那么很可能希望查找的是了阿贾克斯球队的信息。所以即使是相同的查询词,如何为不同的用户提供个性化的搜索结果,成为衡量搜索引擎搜索质量非常重要的标准。

2.2 社会化搜索

随着Facebook的逐日流行,社交网络平台和相关应用占据了互联网的主流。社交网络平台强调用户之间的联系和交互,这对传统的搜索技术提出了新的挑战。传统搜索技术强调搜索结果和用户需求的相关性,社会化搜索除了相关性外,还额外增加了一个维度,即搜索结果的可信赖性。对于某个查询,相关的搜索结果可能成千上万,但是如果是处于用户社交网络内其他用户的信息、点评的评论或者验证过的信息则更可依赖,这是与用户的心理密切相关的。社会化搜索即结合了这种相关性和可依赖性,为用户提供更准确、更值得信任的搜过结果。

社会化搜索的本质是信息过滤与推荐,即对用户的疑问,社会化搜索系统推荐合适的人来回答用户疑问,或者通过社交关系过滤掉不可依赖内容,推荐可依赖内容。根据其他用户和提问者的关系,社会化搜索系统重点关注4类关系:直接有社交联系的成员,比如熟人或者朋友;有相同兴趣的成员;用户所加入网络社区的成员;领域专家。直接具有社交联系的成员对搜索者具有直接影响力,比如购物搜索时对产品品牌的评价;有相同兴趣的成员则形成了有效的信息过滤者或者推荐者;搜索者所在社区的成员从本质讲也是有相同兴趣的成员,对于搜索者的问题能够开有效的信息过滤和推荐;而领域专家则对问题的解答具有权威性。通过结合或者分别使用以上4类社区成员的信息,社会化搜索系统可以给搜索者提供合适的回答者或者值得依赖的信息。

2.3 实时搜索

随着Twittet、微博等微信息的个人媒体平台逐步兴起,对搜索引擎的实时性要求日益提高。微博平台和传统的信息平台比如网页、博客、新闻等相比,有其特殊性。其中一个突出的特点是时效性强,越来越多突发事件的首次出现的微博平台上,比如某地地震或者社会事件,这是有其必然性的。

实时搜索与传统的网页搜索有很大差异。实时搜索的核心强调“快”,即用户的信息能够第一时间被搜索引擎发现、索引并搜索到。传统搜索引擎在实现机制上很难达到这一点,所以实时搜索在搜索引擎的爬虫、索引系统和搜索结果排序方面都有自己独有的特点。在索引构建方面,实时搜索要求第一时间对新的内容进行索引,即用户则信息可搜。这对传统的索引机制提出了挑战,要求索引系统支持在建立索引的过程中,也能够提供搜索服务。

在搜索结果排序方面,实时搜索也有其特点,除了内容相关性要求外,时间因素是搜索排序中首要的考虑因素,很多实时搜索系统默认按时间顺序排序,即最新的信息排在前列。对于一个完善的实时搜索排序算法来说,一般重点考虑以下4方面的因子:

(1)内容相关性:信息是否与用户查询主题相关。

(2)时效性:时间越近的信息,其搜索排名应该越靠前。

(3)信息重要性:越重要或者越流行的信息排名应该越靠前,作为重要性或者流行性的判断指标有很多,比如信息来源是否可靠(微博中信息者的重要性)、被转发次数多少、被评论次数多少等都可以作为判断指标。

(4)社交性:一般来说,微博平台同时也是一个社交平台,微博用户的关注人和被关注人体现了这种社交性。排序时,应该将搜索结果的社交性体现出来,即用户关注人的信息排名应该靠前。

2.4 移动搜索

随着智能的快速发展,基于手机等移动设备的搜索日益流行。移动设备对搜索应用的需求与PC等不同,主要源于其与PC相比资源的有限性,比如手机的屏幕较小,可显示区域不多;手机存储和计算资源能力较弱;手机设备打开网页的速度较慢;手机输入较为烦琐等。所以针对移动设备的搜索需要根据手机等移动设备自身的特点,开发适合其资源和设备的搜索应用。

使用手机搜索与PC搜索一样,由3个步骤组成:用户输入查询,搜索引擎提供搜索结果信息,用户点击打开感兴趣的页面。考虑到移动设备的资源有限,在这3个步骤都要考虑如何增加用户的体验。对于用户输入查询这一环节来说,因为输入难度比桌面设备大,不够便捷,包括移动设备中的中文输入法由于资源所限,智能性不足,所以对于移动搜索来说,如何让用户输入更便捷是最主要的问题。由于移动设备屏幕较小,如何在这么上的展示面积早让用户更快、更直接地找到答案至关重要。所以,移动设备搜索对搜索的精度及搜索结果的展示方式要求更高。如果用户在搜索结果的摘要区域无法获得答案,就必须点击网页,查看页面内容,以搜索引擎目前的搜索精度来看,这步多多少少是难免的。既然如此,目标网页往往内容很多,包含导航栏、广告栏、大量图片等既消耗带宽资源,又与用户搜索内容无关的信息,所以在这上步骤,移动搜索的问题就转化成了如何提供给用户页面中最重要、最相关的部分。搜索系统可以为用户提供加工过的目标页面,通过分析目标网页的结构,自动提取重要内容,只将这部分内容展示给用户,有效增加用户体验。

3 网络搜索引擎的使用技巧

21世纪是信息社会,由于Internet的广泛应用和发展,世界范围内的信息交流、信息资源共享成为现实,网络已成为人们进行交流、获取信息的重要途径。但因特网上的信息内容庞杂,缺乏统一的组织和管理,使用者只有掌握一定的搜索技巧,才能准确、及时、有效地获取自己所需的信息,实现网络信息存在价值,提高信息资源使用效率。

3.1 选择合适的搜索引擎

不同的搜索引擎特点不同,优势不一,信息覆盖范围也有所差异,合理的方式应该是依据检索目的和具体要求选择不同的搜索引擎。如果需要查找综合性、概括性的主题概念,或是对检索准确度要求较高的课题,可以使用目录式搜索引擎。如果需要检索特定的信息,或是较为专、深、具体或类属不明确的课题,应该用关键词索引式搜索引擎。

3.2 适当使用垂直搜索引擎

一个搜索引擎很难收集所有主题的网络信息,很难将各主题都做得精确而又专业。垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。比如股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高。

3.3 使用元搜索引擎

采用不同的搜索引擎,检索效果的不同,在一个搜索引擎上找不到的信息却可能在另一个搜索引擎上找到,每个单一搜索引擎的搜索范围只能达到整个www资源的30―50%,查准率不到50%。所以,用户常常要切换多个搜索引擎进行检索,并要了解多个搜索引擎,这给用户带来了不便。元搜索引擎通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用一个或多个合适的搜索引擎来实现检索操作,并将检索结果集中统一处理,以统一的格式提供给用户,是对分布于网络的多种检索工具的全局控制机制,查全率和查准率都比较高。

3.4 提炼准确的搜索关键词

使用搜索引擎进行信息搜索,最重要的是关键词的选择,关键词选择得准确与否直接影响到检索效果的好坏。因此,用户提供的关键词必须能准确表达自己的检索意图。尽量不要选择常用词汇进行搜索,尽量不要使用自然语言,尽量使用多个页不是一个关键词。

3.5 使用限制指令

限制指令把检索限制在某些指定的字段内,限制了检索词在数据库中出现的位置,以提高检索效果。如:使用site命令指定在某个特定的网站内查找相关信息,使用inurl命令指定仅在网页的url搜索,使用intitle命令指定仅在网页的title中搜索,使用filetype命令指定搜索文件的特定类型,等等。

3.6 尽量使用“高级搜索”

大多数搜索引擎都提供高级搜索功能,其选项在默认值、灵活性、定位精确性等方面都优于普通搜索功能。利用“高级搜索”中的选项限制可以有效且更加方便地控制检索结果的范围,可以省去用户自行设定检索式的麻烦。搜索引擎提供的范围限制类型大体有分类范围、地域范围、时间范围、网站类型范围,以及其他特殊范围。一些搜索引擎提供了许多特殊范围的限定,如域名后缀(com、gov、org等)、文件类型(文本、图形、声音等)。

结束语:随着科学的进步与技术的发展,Internet上信息数量也越来越庞大,而且含有大量的多媒体信息,如何充分利用这一巨量的信息资源,是用户所渴望和追求的,而通过搜索引擎来查询是查找信息最方便、快捷的途径。但是搜索引擎数量众多、各有所长,使用者应充分利用各个搜索引擎的优势与特点,灵活运用并加以综合利用,以最快捷的方式获得最佳搜索结果。

参考文献:

[1] 马志杰 我国搜索引擎评价研究的现状、问题及对策 图书馆学研究 2013(04)

第6篇:搜索引擎研究范文

关键词 搜索引擎;SEO优化;学校网站;网站排名

中图分类号:TP393 文献标识码:A 文章编号:1671-7597(2014)07-0111-02

随着网络的飞速发展,万维网成为大量信息的载体,人们早已习惯于使用搜索引擎这一快捷的方式获取信息。学校网站是学校的对外展示自己的窗口,体现了学校的风貌与文化,各大高校都纷纷建立了自己的门户网站。学校网站在搜索引擎中的排名决定着其访问量的多少。因为用户往往只会留意搜索结果最开始的几项条目,所以网站在搜索引擎中的排序显得尤为重要。SEO中文名称是“搜索引擎优化”,是一种利用搜索引擎的搜索规则来提高目前网站在有关搜索引擎内的排名的方式。搜索引擎蜘蛛是搜索引擎的重要组成。它按照一定的规则,在万维网中自动的抓取信息的程序或者脚本。使蜘蛛程序爬行并成功抓取网页数据对于一个网站的搜索引擎优化是非常有利的。

1 影响学校网站权重和排名的因素

搜索引擎给网站赋予一定的权威值,对网站权威进行评估评价,一个网站权重越高,在搜索引擎排名就越好。下面仅介绍几个影响网站权重和排名的关键性因素。

1)稳定的网站服务器。学校网站服务器的稳定性,是影响蜘蛛访问网站和用户体验最主要、最关键的因素之一。稳定的服务器可以使蜘蛛在固定时间段访问网站,从而提高蜘蛛的访问频率和次数。服务器应该是24小时不间断运行的,如果经常宕机,则会影响到网站在搜索引擎的信任程度。

2)高质量的友情链接。友情链接也是提高网站权重和排名的关键因素之一。在建立和维护本校网站的友情链接时,需要注意网站快照、网站内容的收录数量、网站级别(PR值),网站关键词排名等基本参数在搜索引擎中的表现如何,尽可能寻找高权重的网站作为本校网站的连接伙伴。另外,友情链接的伙伴一定要与学校网站相关。

3)高质量的网站内容和更新频率。网站内容是网站的基础,可以有效吸引读者的访问,内容越高的网站,被搜索引擎收录的可能性越大。内容因素不仅仅要求质量,而且对于更新时间和频率也会有一定的要求。而且稳定的更新也是为了吸引蜘蛛进行大范围的抓取,增加网站的抓取机会,从而提高网站整体的收录量和权重。需要注意的是,要防止站内大量重复或者相似的文章,否则会影响到整个网站的权重,也容易被搜索引擎误认为是作弊行为。

4)网站用户体验优化。网站用户体验优化是面对用户层面的网站内容性优化,本着为访客服务的原则,改善网站功能、操作、视觉等网站要素,从而获得访客的青睐,提高流量转换率。学校网站的用户体验要考虑学校网站的访问速度、构建网站时候的物理路径和站内的连接结构、网站栏目的组建、符合学校网站特色的色彩搭配等等,做好这些基本的用户体验,对我们网站的长远发展肯定会有良好的促进作用,无疑对于提高网站权重具有积极的作用。

2 学校网站诊断与分析

2.1 网站的排名统计

通过关键词排名查询,可以快速得到网站的关键词在百度或谷歌的排名情况。关键词排名统计反映了学校网站所受关注度情况。以查询天津科技大学网站在百度排名为例,在“站长之家”网站进行关键词排名查询。首先以关键词“科技大学”进行查询,结果显示该网站在百度上的位置是第四名;而后,我们再以“天津高校”为关键词查询,结果显示为无排名,而天津大学排名为第四名。这说明,天津大学网站在关键词排名方面做得非常成功,而天津科技大学网站还需要进一步优化其排名。

2.2 网站的诊断和分析

网站诊断可以帮助学校网站的建设者更好的对网站进行优化。以天津科技大学网站为例,在“站长之家”网站上使用免费站长工具对该网站进行诊断检测,其结果和分析内容如下。

1)同IP网站数:4个。这是对网站服务器的诊断,说明该学校网站所使用的网站服务器承载了四个网站。空间数和流量处于合理的范围内。

2)网站收录查询:百度收录19条,谷歌收录1条,360收录3条,搜狐收录2条。这是指网站被搜索引擎收录页面的数量,该网站被收录的数量太少了。

3)友情链接检测:出站链接1个(有1个没有本站链接);反向链接0个;图片链接0个;文字链接1个。结果说明友情链接权重不高,不够丰富、合理。

4)Google RP值:查询结果是0。PR值全称为PageRank(网页级别),级别分别是0到10,PR值级别越高,说明该网页越受欢迎。因此,PR值为0说明该网站不太具有流行度。

5)响应时间:293毫秒。说明该网站的反映速度很快。

6)网站meta标签信息:标题title为10个字符;关键词keywords为无;描述description为无。该网站中关键词和描述都为空,这对蜘蛛抓取信息非常不利。

根据以上六点检测情况,说明该学校的网站除了反应速度测试结果尚可,其他各向方面均有待提高。因此,天津科技大学网站如果想获得更高的关注度,必须实行SEO整体优化。

3 学校网站优化设计策略

学校网站不仅仅是其功能很重要,还需要将学校网站的页面设计得符合SEO规范,才可以起到提高排名的效果。对学校网站进行SEO优化的思路主要有以下几点。

3.1 优化网站的结构层次

学校网站每一个页面的结构都必须保证清晰的层次结构和文本链接,绝不要出现死角。网站存储页面文件的路径不宜太深,可以把目录的级数控制在三层的最佳范围,否则会影响被收录的数量。学校网站的主导航条最好采用文字链接。位置导航不仅可以显示访问者目前所在的页面的位置,有利于访问者返回到上一层目录,并且还有利于增加当前所在页面的关键词密度。最好建立网站地图页面,可方便网站访问者索引到他们所需的信息,更方便蜘蛛快速遍历整个网站。

3.2 热点内容的更新和原创率

SEO业内流传着这样一句话:内容为王,外链为皇。不断更新的动态内容可以使网站更富有生气。学校网站要做好“学校新闻”“校内公告”等动态的版块,将新的文章内容贯穿到网站中,组织和构建校园站内文章,撰写高质量的热点内容,保证内容的更新量和原创率,吸引用户阅读和转载。将学校新闻热点给知名度高且流量大的新闻网站,并与PR值高的教育类网站、兄弟学校、合作伙伴相互友好链接,从而保证高质量的丰富的反向链接。

3.3 保证网站的访问速度和稳定性

学校网站不仅是向校外用户宣传学校文化的一种手段,还为校内师生提供功能服务。应该选择稳定的服务器来学校网站的访问速度和稳定性。如果服务器不稳定,或者经常处于宕机状态,不仅严重影响学校师生对学校网站的使用,也会影响网站收录和排名。选择性能好的服务器,保证网络环境稳定高效。只有优质的网络环境才可以提高搜索引擎蜘蛛的光临次数。

3.4 修改不利于搜索引擎的弊端因素

1)关键词优化。关键词优化是学校网站进行SEO优化比较重要的一个环节。搜索引擎是以关键词为搜索条件进行检查的,对于学校网站的关键词应进行分析和合理选择。首先要确定网站的核心关键词,再围绕核心关键词定制相关关键词。网页中的关键词可以放置在title标签、meta标签、alt标签和网页正文内容中。关键词的密度不仅迎合搜索引擎,还要注意用户体验,一般不要超过10%。针对天津科技大学的诊断结果,可以将网页中放置关键词的代码修改为:

天津科技大学欢迎您!_欢迎光临天津科技大学网站

通过上面的修改,可以看出关键词“天津科技大学”的密度比较高。优化时,还应在每个静态页面都加上title,keywords和description标签,以增加关键词的密度并平衡关键词的分布。

2)alt标签优化。搜索引擎无法识别图片内容,因此制作网站的时候网页上的每张片都应添加alt标签进行文字说明,以帮助搜索引擎理解图片的内容。但是在alt标签中不要堆砌关键词,其内容应与图片内容相符合。

综合本文分析,学校网站要想提高在搜索引擎上的排名,必须使网站符合搜索引擎的搜索习惯。但是,搜索引擎技术也在不断的变化,学校网站的优化也是一个长期的过程,我们还应该不断探索与研究,来迎合搜索引擎技术的发展,更好地发挥学校网站的宣传作用。

参考文献

[1]解俊.基于SEO的职业学校网站诊断与整体优化研究[J].软件导刊,2011(10).

[2]张鸽,刘娜.基于搜索引擎优化的校园信息网站开发与推广[J].企业家天地,2010(10).

[3]廖文军.基于SEO技术网站建设优化研究[J].科技信息,2010(11).

[4]张涛针.针对企业网站的搜索引擎优化策略[J].湖北工业大学学报,2009(5).

第7篇:搜索引擎研究范文

关键词:元搜索;相似度;去重;排序

中图分类号:TP311 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.06.016

Meta Search Engine Results to Weight and Sorting of

【Abstract】Go heavy and sorting are two key issues to improve the quality of the results of the meta-search engine, the article analyz

es the cosine similarity, three kinds of text similarity based on tf-IDf weight algorithm, using the UrL, title, and calculation of summary similarity toweight; Board sort stars sort, the polling method, location, sort, and the concept of feasible search results, a comprehensive sorting algorithm. the experimental results show that the integrated sorting algorithm accuracy, recall rate of better than other algorithms.

【Key words】Meta-search; Similarity; to heavy; Sort

元搜索引擎是指通过集成多个独立的搜索引擎,将用户的检索请求转换处理后提交给它们,并将每个独立搜索引擎返回的结果统一进行去重,并重新排序后反馈给用户[1][2]。由于元搜索的数据来源是独立搜索引擎,返回的结果中通常会有重复数据,同一条结果在不同搜索引擎中返回结果的位置也不一样,因此,如何去除重复数据,同时将质量好的结果排序靠前是元搜索要解决的两个关键问题。

元搜索的结果来自用多个独立的成员搜索引擎,虽然不同的成员搜索引擎的覆盖范围不一样,但返回的结果中会出现重复数据,降低了检索结果的质量[3]。因此,在将结果返回给用户前,需要将重复内容去除。重复内容通常会有如下两种情况:一种是内容完全一样,另一种是内容相似,如同一个内容主题,在不同的网站用了稍微有区别的表示。

第一种重复只需要判断URL或网页标题即可识别,第二种内容重复则需要计算返回结果中的标题、摘要的相似度,达到某一相似度即可判断为重复。因此,在结果去重时首先判断两网页的URL和标题是否相同,若是,则认为重复;否则,提取两网页的摘要并进行相似度计算,判断两网页是否为重复网

文本相似度的计算方法通常采用文本挖掘中的余弦相似度来衡量,基本思想是将待检测的文本表示为一个特征向量,通过计算向量的夹角余弦值来判断。余弦值接近于1,说明相似度较高。特征向量通常用字或者词出现的次数来表示,如:令Di为待检测文档,其特征向量表示为:

Di=D((ti1,wi1),(ti2.wi2),…,(tin.win))

其中tij表文档i的第j个特征词,wij表示该特征词的频次。文档Di和Dk之间的相似度利用公式(2)计算:

TF-IDF算法是通过统计文档词频来计算词权重[4],基本思想是:一个词在特定文档中出现的次数越高,说明它在区分该文档内容属性方面的能力越强(TF),一个词语在文档中出现的范围越广,说明它区分文档内容的属性越低(IDF)。其计算公式为:

wij=tfij×idfj=tfij×log(

其中tfij指词语tj在文档di中出现的次数;idfj指出现词语tj的文档的倒数。N表示文档总数,nj指出现词语tj的文档数。wij表示了词语tj在文档的权重,使用该值来表示文档特征向量。

元搜索的结果排序是指对其调用的所有成员搜索引擎返回结果重新进行排序处理。目前元搜索引擎采用的排序算法多种多样,有的是对成员搜索引擎返回的结果信息进行综合,根据各个成员搜索引擎的排序信息,来重新进行排序;有的则先将成员搜索引擎的结果收集起来,再重新选择某种排序方法对这些结果进行处理;有的是给不同成员搜索引擎的检索结果分配一定的分值,对其进行融合处理,之后按序显示给用户[5]。常见的算法有如下几种:

Board排序类似于选举,根据票数多少进行排序。在元搜索中,对于某个查询,它被几个成员搜索引擎检索到,则该结果记录就得几票,最后统计各个结果记录的票数,按照票数多少排序。为了更好地利用原来成员搜索引擎的排序信息,对每个成员搜索引擎的结果按照从前到后的顺序分配一定的权值,统计结果时乘以相应的权值,可细化每个结果所得票数。

星星排序是首先统计某个搜索结果记录在多少个成员搜索引擎的前面几条信息中出现,以此作为相关度评价指标。对于某个查询结果,若在一个成员搜索引擎的前几条中出现,就得到一个“星”,得到的“星”越多,则该记录就越重要。最后比较每个结果所得的“星”的个数,并以此排序。

轮询法( round-robin)首先把成员搜索引擎根据其性能按照一定次序排列好,然后按照这些次序将每个查询结果中的第一项依次列出,再把每个查询结果中的第二项依次列出,依此类推。一个结果出现在多个搜索引擎中的以第一次出现该结果的为基准,后面出现的不再参加排序。中途出现某搜索引擎的结果已经取完时,则跳转到下一个搜索引擎。

第8篇:搜索引擎研究范文

关键词:搜索引擎;旅游营销

中图分类号:F27文献标识码:Adoi:10.19311/ki.16723198.2016.24.027

1引言

搜索引擎(Search Engine)是指运用特定的计算机程序对网民的搜索指令进行系统挖掘,并对信息进行相关性处理后最终为网民展示的系统。截至2015年6月,我国搜索引擎用户规模达5.36亿,使用率为803%。随着当今网民数量的日益增长,搜索引擎在旅游业中的应用越发广泛,旅游政府通过主题网站、社交媒体网站等搜索引擎相关旅游信息,提高自身知名度,促进游客数量的增长;旅游企业通过自身网站的营销推广来提升其在游客搜索关键词排名中的地位;游客通过利用搜索引擎进行相关资讯的搜索,确定其旅游路线。本文在此网络背景下,通过整合国内外学者在旅游方面对搜索引擎的研究,丰富旅游网络营销方面的认知,并期望能够在实践层面上为我国各大旅游地提供营销参考。

2搜索引擎研究内容分类

本文结合国内外学者对游客使用搜索引擎的相关研究,通过大量的资料收集整理、分析研究,从网站质量、检索效率、游客搜索与体验、网络口碑、营销对策五个方面对相关论文进行整理,将那些零散、杂乱的基础理论知识系统化。

2.1搜索引擎网站质量

1973年兰开斯特(Lancaster)提出评价搜索引擎性能的6个标准:涵盖范围、查全率、查准率、响应时间、用户方便和输出格式。雷雪冰(2006)对e龙旅行网早期在搜索引擎上的投资进行分析,指出其网站不集中、关键词太局限的缺陷,最终从网络品牌搜索、搜索引擎优化、关键词的选择、目标用户行为分析等监督提出建议;莫云峰(2009)从目前的搜索引擎优化规则出发,利用分析搜索引擎的定量算法,从网站功能、内容、结构、布局等关键要素进行合理设计,为网站开发提供策略;徐蓉艳(2013)以杭州某度假酒店网站为例,从网站结构、页面、内容等要素提出搜索引擎优化营销建议。

2.2搜索引擎检索效率

Harter(2011)等指出:信息检索系统和信息检索系统的使用是有不同层次的,因此评估也要分不同层次进行。由于目前搜索引擎大都提供免费服务,因而对用户而言,时间和质量是衡量搜索引擎检索效率的主要指标,此外,费用一收益评价往往只能由搜索引擎开发商完成,研究人员很难进行这方面。Allan Cheng Chieh Lu,Dogan Gursoy(2015)通过开发一个概念模型,论证消费者的在线旅游信息混乱的前因后果,得出消费者由于所获取的信息太多/太相似并且太模棱两可时,导致了消费者体验过量/相似性和模糊性的混乱。闫兵(2007)通过探讨国内目前搜索引擎盈利模式体系,从搜索引擎主要盈利模式角度出发,从第三代搜索引擎、介入其他服务平台、企业本土化运营三大角度提出其看法建议;徐晓乐(2009)通过构建营销效果评价体系,对“中国点击”网站营销效果进行测量,从用户、网站、效果跟踪、付费营销四方面提出营销优化策略。

2.3游客搜索与体验

Nassab Reza,Hamnett Nathan(2010)调查了公众对接受整形外科手术的公众意见,并指出网站的在线搜索页面上存在明显的对潜在患者信息的缺乏问题,提出有必要提高公众意识和教育关于医疗旅游中的固有思考;何小丽(2007)肯定了用户体验在搜索引擎营销中的核心地位,并指出损害用户体验会给企业营销带来不良后果,然后提出用数据分析和监控优化来提升企业以用户体验为中心的搜索引擎营销方式;郑春香(2009)以旅游供需角度出发,探究搜索引擎对消费者行为产生何种影响;柴海燕(2011)以网络口碑传播为出发点,通过测量旅游者在搜索引擎上的搜索行为,得出社会网络媒体被游客浏览点击占比最大;赵媛(2012)通过分析互联网环境下旅游者在网站搜索中的决策行为,从降低游客感知风险、增强游客体验、多渠道网络营销方式角度提出自身建议;陈怡(2014)通过对搜索引擎营销决策影响因素进行分析,分析用户网上搜索行为,最终构建搜索引擎营决策模型;刘雪婷(2014)以浙江省赴台旅游游客为研究对象,用百度指数、调查问卷利用因子分析、方差分析研究互联网信息对省内国内游客网络行为影响、时空引导作用。

2.4网络口碑检索

Ying-Chuan Wang(2015)通过研究网络口碑对旅游者旅游意图的影响,指出美食旅游网络口碑形象对游客的意图有显著的正向影响,而游客认为社交网络要比网络口碑更具有可靠性。Cheng-Hao Chen, Bang Nguyen等(2015)探讨网络口碑对游客决策过程的影响作用,从人种学角度,在决策阶段从理论和实践方面研究和探讨影响网络口碑变化的因素。柴海燕(2011)以网络口碑传播为出发点,得出社会网络媒体被游客浏览点击占比最大的结论。郭莎莎(2008)指出web2.0营销模式与旅游业融合应用下其主要口碑营销模式为博客营销与RSS营销,并指出博客营销是WEB2.0营销最典型的口碑代表,以此提出基于门户网站、企业自建、第三方、个人的四类企业网络营销博客平台。

2.5搜索引擎营销建议

Greg Kerr,Clifford Lewis,Lois Burgess(2012)定义了吹牛的权利,讨论了其相关的旅游业,并提出了一个概念模型,通过模型提出目的地营销人员如何利用吹牛权利去提高自身知名度从而增加访问量;刘明达(2006)从电子商务与人才、口碑营销、软营销角度提出搜索引擎营销的建议;崔师远(2009)以垂直搜索引擎营销为研究重点,以搜驴垂直搜索引擎为代表,探讨“搜驴模式”的旅行社网络营销对策;刘聪(2013)从旅行社网络广告投放、搜索引擎体系、E-mail营销三大角度分析旅行社营销策略研究;崔丽敏(2013)通过构建世园会客流量预测与预警模型,为景区工作人员预防突发事件提供技术支持;向俊松(2013)通过测量四川省世界遗产景区网络营销效果得分,从信息的角度提出策略。孙伟宇(2014)采用灰色关联分析法统计各省市网络关注度在时间与空间上的演变,为工业旅游提出建议;王芳(2015)我国5A级景区为关键词,利用中心度、密度、扩散指数、结构洞四项指标对我国5A景区网络关注度进行空间分析,从省份、地带、主题、相关配套设施四方面提出优化建议。

3搜索引擎营销面临的机遇与未来

目前国外的搜索引擎营销理论研究还不够系统,国内的研究也主要是围绕企业搜索引擎营销策略进行研究。从现有的学术期刊中真正对搜索引擎营销进行系统的理论研究,或是在某些方面有独到见解的内容非常少见。而且将搜索引擎应用于旅游研究领域中的主要研究方向也主要是集中于旅游流、游客量及行为研究、旅游网站三大方面。而未来的营销主体是游客,如何系统的从游客角度对搜索引擎的网站质量、搜索效率、内容完整性以及更新性等影响游客信息搜寻评判的种种方面进行系统分析也是未来搜索引擎营销所面临的机遇与挑战。

参考文献

[1]Allan Cheng Chieh Lu, Dogan Gursoy.A conceptual model of consumers’ online tourism confusion[J].International Journal of Contemporary Hospitality Management,2015,27(6):13201342.

第9篇:搜索引擎研究范文

【关键词】校园网;OmniFind;搜索引擎

一、引言

随着信息技术的迅猛发展,学校的教育信息化建设取得了长足的进步,目前几乎所有的学校均建立了校园网,并建立大量的网上资源。这些资源大多分布在不同的管理系统和站点中,用户在查找资源时需要分别进入不同的系统进行搜索,操作繁琐,且搜索出的结果不是整个校园网中的相关资源,具有一定的局限性。因此建立一个校园网内的全文搜索引擎,使用户能够在所有校园网信息资源中,方便、高效地找到所需的信息,已成为各学校在信息资源建设过程中所面临的一个亟需解决的问题。本文分析了校园网的资源及应用特点,并提出了一种在中小型校园网中建立全文搜索引擎的解决方案。

二、搜索引擎简介

简单来说,搜索引擎是为用户提供检索服务的系统,即根据设定的策略、运用计算机程序在网络中搜索相关信息,对信息进行组织和处理后,将信息呈现给用户。根据工作机制的不同,搜索引擎分为四种基本类型[1]:

(一)机器人搜索引擎

机器人搜索引擎也称为全文搜索,由搜寻器程序(也称为“蜘蛛”或“爬虫”程序)以某种策略自动地在网络中搜集和发现信息,并建立相应的索引库,由检索器根据用户的查询关键词来检索该索引库,并将查询结果返回给用户。该类搜索引擎的优点是信息量大、更新及时、无需人工干预,缺点是返回信息过多且有很多无关信息,用户必须从结果中进行筛选。因特网中的Google和百度就属于这种类型。

(二)目录式搜索引擎

目录式搜索通过人工或半人工方式来获取网络中的文档,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎由于加入了人的智能,所以信息准确、导航质量高,但缺点是需要人工干预、维护量大、信息量少、信息更新不及时。目录式搜索中最具代表性的是Yahoo、新浪分类目录搜索。

(三)元搜索引擎

元搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除和重新排序等处理后,作为自己的结果返回给用户,服务方式为面向网页的全文检索。这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所各搜索引擎的功能,用户需要做更多的筛选。著名的元搜索引擎有Dogpile、Vivisimo等。

(四)垂直搜索引擎

垂直搜索引擎是近几年逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求,如旅游搜索、小说搜索、视频搜索等。相比通用搜索动辄数千台搜索服务器,实现垂直搜索所需的硬件成本较低。

在这几类搜索引擎中,机器人搜索引擎能很好地适应网络的分布式和形式多样性的特性,最适合用来实现校园网内的全文搜索功能。

三、校园网的特点及其对搜索引擎的要求

校园网的主要目的是用于学校的信息、辅助教学和办公管理,在网络结构、资源特点和使用对象等方面都有一些不同于因特网的特点。所以,在校园网中部署的搜索引擎首先要能够适应这些特点,又应该相对经济可行。具体来说,校园网中部署的搜索引擎要求能够适应以下这些校园网的特点:

(一)与广域网相比,校园网中的信息资源数量较少,用户使用搜索服务的频率较低,并且对搜索引擎的效率和服务器硬件性能的要求不像广域网那样苛刻,校园网搜索引擎应该更关注于搜索结果的全面性和精确性。

(二)校园网中的异构资源较多,除了常规的网页文本外,还包括大量其他类型的信息资源,如图书馆全文电子图书、期刊、课件等资源(通常是诸如Word、PDF、PowerPoint等格式的文件)。与网页文本相比,实现这些文件的全文检索具有一定的难度,而这些文件中的内容却往往是校园网用户的搜索目标。所以校园网搜索引擎应能够较好地支持这些异构资源的全文搜索[2]。

(三)校园网的网站之间链接较为稀疏,有时由于分工管理等原因,有些校园网内甚至存在信息孤岛,校园网搜索引擎应能自动定期对网上资源进行较为完全的检索,以便为用户提供更全面的搜索结果。

(四)有时校园网中网页的重要性与访问量不一定成正比。例如新闻和论坛类网站的网页数量多,链接密集且访问量较大,但这些内容的重要性相对较低;而类似于各部门网站的访问量通常较低,但却较为重要。所以校园网搜索引擎应能够对搜索结果的排序方式进行灵活定义,而不能单纯根据网页访问量来进行排序。

(五)虽然多数校园网都与因特网相连,但用户在执行校内搜索时,通常只是想获取校内资源,如校内新闻、通知公告、学科专业网站、课程资源等。在查找校外资源时,用户通常会使用更为专业和全面的因特网搜索引擎。所以校园网搜索引擎应能对搜索范围进行限定,使其只工作在校园网内部,以免在索引库中生成大量无用的外部资源信息而降低检索效率。

四、基于OmniFind实现校园网搜索引擎

(一)IBM OmniFind Yahoo!Edition简介

随着企业网络的发展和商业利益的驱动,很多厂商在企业网搜索技术方面做了大量的研究工作,推出了一些较为成熟的产品,如Google的面向小型企业的Google Mini、微软推出的Search Server 2008等,但这些产品大都售价不菲。近几年IBM公司也加入了局域网搜索的研发队伍,并推出了企业搜索软件OmniFind,该产品分为企业版和与Yahoo合作开发的入门级产品IBM OmniFind Yahoo!Edition,其中Yahoo!Edition是一个完全免费的产品,支持Windows和Linux平台,最多可支持50万个文档、5个搜索集合和200多种文件类型。对于中小型校园网来说,完全可以基于IBM OmniFind Yahoo!Edition,以零成本实现校园网的全文搜索。

(二)添加集合与站点

IBM OmniFind Yahoo!Edition的下载和安装都非常简单。安装完成后,使用浏览器打开网址.

作者简介: