公务员期刊网 精选范文 分布式系统基础理论范文

分布式系统基础理论精选(九篇)

分布式系统基础理论

第1篇:分布式系统基础理论范文

关键词:综合布线;课程改革;项目驱动

中图分类号:G642文献标识码:A文章编号:1009-3044(2011)29-7317-02

Based on the Project-driven Reform and Exploration of Network Cabling

SHEN Yuan, NIE Li-ming

(Pingdingshan University, Pingdingshan 467000, China)

Abstract: To improve didactical effectiveness and meet the social needs of the personnel training, it is necessary to do a series of innovations of the curriculum, such as the instructional design and the teaching methods, this paper summarized the teaching mode of projects-driven in network cabling course. This mode deepens the understanding of the network cabling engineering, enabling its use in teaching activities to improve teaching quality and effectiveness.

Key words: network cabling; teaching reform; projects-driven

随着网络基础建设和计算机信息技术的飞速发展,以及物联网的兴起和广泛应用,目前对于建筑物的智能化程度有了更高要求,而综合布线技术是智能建筑网络基础体系建设的重要组成部分。因此,综合布线技术受到人们的重视,各高校网络类专业开设了综合布线技术的相关课程。

1 网络综合布线课程定位

《网络综合布线技术》是计算机类网络技术专业的一门重要专业课程。课程的特点是知识量大,概念多,实践性强,覆盖了网络基础、建筑学、管理学、写作等基础理论。课程强调培养学生拥有过硬的实践操作能力和掌握综合布线工程的需求分析、方案设计、工程实施、测试验收、管理等方面的知识。目标是培养既懂专业知识和工程技术,又有一定施工经验的网络综合布线人才。

2 网络综合布线课程教学设计改革

我院为培养出符合市场需求的网络综合布线人才,将传统的知识驱动式教学法和任务驱动式教学法相互结合,形成了新的一体化教学模式。采用新的教学模式使得《网络综合布线技术》成为一门理论与实践紧密结合的课程,教学模式主要由三个部分组成:

第一、课堂教学:课堂教学覆盖了整个的综合布线知识体系结构,包括系统组成、系统标准、发展趋势、产品及选型、系统设计、工程施工技术、工程管理、岗位技能和系统测试及验收等知识点。这一部分按照知识聚合程度分章节进行教学,在掌握各个知识点的基础上通过若干个综合布线工程案例进行从知识点到知识体系综合,使学生对整个课程知识融会贯通;

第二、实验环节:实验课主要针对学生应掌握的操作技能的训练,包括:布线工具、传输介质和连接器件的认知,双绞线跳线的制作,110型和快接式通信配线架端接,PVC管槽安装,信息面板端接安装,机柜安装,光纤熔接和FLUCK测线仪使用等方面的实验。通过这些实验,使学生能够很好的掌握综合布线从业人员所掌握的基本的操作技能;

第三、课外环节:每班学生划分项目小组,这些小组模拟完成综合布线项目从招标、用户需求分析、产品选型、工程施工、系统测试验收和用户支持等阶段,并将管理工作贯穿其中。小组之间进行工程质量的监督。这样,将综合布线的理论知识和项目开发融合在一起,加强了理论联系实践的环节,并且通过小组之间的监管和交流,取长补短,有了这种“学习―实践―反馈”的环节,使学生能够达到掌握小型布线工程的设计与施工技术的教学要求,能够较好的满足市场对综合布线人才的需求规格。

3 课程改革的实践

为了实现理想的教学效果,本课程的理论教学和实验教学课时比达到了1:1;同时,在教学方法上采用项目驱动式教学,多种教学方法配合的教学模式,充分利用现代教育技术,达到良好的教学效果。

第一、项目驱动式教学:在课堂教学中以具体的项目做为学习目标,将要讲授的知识放在项目模块中,学生通过对所提出要完成的任务进行分析、讨论,明确其中涉及到的知识点,最后通过任务的完成实现对所学知识的体系构建。利用情景模拟角色带入的方式激发学生的学习兴趣。

在《网络综合布线》教学中利用学校自身条件,以学校在建和完善的教学楼、实验楼和宿舍楼等建筑为主线,组织学生参观学习和参与综合布线工程施工。本课程以实际工程和案例为基础,组织并安排课程教学,通过课堂与实践想结合的方式,将基本理论和方法与实践步骤融合与具体的项目开发之中,使学生实现一个综合布线项目的需求分析、方案设计、布线安装、测试验收和用户支持,最终完成整个项目的开发。

第二、实物教学:为了更好的让学生认知综合布线系统的部件,在课堂上通过实物展示和让学生自己动手的方式来加深理解和知识点的掌握。并且在学生实践后进行作品点评,通过这种学生参与、师生互动的方式能够很好的提高学生的学习兴趣,同时也可以很好的掌握学生理解的误区,及早发现问题。

第三、现场教学:为了更好的让学生掌握综合布线系统结构,理解综合布线各模块的含义,了解综合布线线缆的路由情况,在讲授综合布线系统结构时,组织学生到我校网络中心进行现场教学,使学生能近距离接触综合布线的各个子系统,了解各子系统的实施情况,并请网络中心工作人员进行现场讲解。让学生将理论知识和现场工程实际情况相互比较学习,融会贯通。

第四、现代教学:在教学手段上,引入现代化的网络和多媒体教学手段。理论教学采用多媒体教学,将所有内容以图形图片,视频动画的方式表现出来,使呆板的理论知识形象化。同时通过网络,将综合布线相关的各种标准,设计图纸,施工工艺和案例文档发送到学生的交流群中,使学生的自主学习有了更大的空间和时间的选择。

4 结论

项目驱动的教学模式在我院实施以来获得了广大同学的认可,由于贴近工程,学生学习和参与的积极性很高,同时通过参观,专家讲解,讨论和实践,学生们的专业技能有了非常大的提高。

下一步,我院将与校外综合布线单位进行合作,将教学模式由校内工程发展至校外,开展工学结合,保证这种教学模式的可持续性和先进性,并不断完善改进。

参考文献:

[1] 于鹏, 丁喜纲. 网络综合布线技术[M]. 北京:清华大学出版社,2009.

[2] 王公儒, 孙社文. 网络综合布线人才需求规格和培养模式探讨[J]. 计算机教育,2009(9):44-49.

[3] 张奇. 项目驱动式教学在《管理信息系统》中的应用探讨[J]. 计算机教育,2007.

第2篇:分布式系统基础理论范文

关键词:分布式计算模型;COM;CORBA;RMI;WEB

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)09-1932-02

分布式计算早已不是新生话题,其早在20世纪70年代就因为因特网的率先出现而备受重视和关注。也是从那时候开始,对于分布式计算模型的研究工作一直都在持续着,随着时代的变迁,计算机技术的发展,分布式计算的优势越加明显:经济效益高,性能发挥良好,容错能力超高。也是因为这个原因,使得计算机分布式模型渐渐成为计算机网络发展的前沿技术,无论是网格计算,云计算,还是物联网都严重依赖于分布式计算模型的特点的。从这个角度来讲,积极探析分布式计算模型的概况,深刻理解其工作原理,技术种类,模式特点,都将有利于我们更加全面的使用分布式计算模型,以促进计算机网络事业的发展。

1 分布式计算的概况

1.1分布式计算的含义

分布式计算作为一种计算方式,其运作原理是:组成应用程序的不同组件和对象位于已连接到网络上的不同计算机上。也就是说基于分布式计算模型,我们可以得到的是一种基础性结构,无论在网络中的什么位置都可以实现对于对象函数的调用。上述过程中的对象相对于应用程序来说是显性的,能够在功能处理上提供相应的服务。

1.2分布式计算的特点

分布式计算具备自身的特点,其主要表现在:其一,信息传输延迟,也就是说在通信网络实现数据信息交换的过程中,可能出现难以预计的数据信息传输延迟现象,这一点是客观存在的因素;其二,全局存储器不共享,处理器以通讯传输网络为基础来开展数据通信操作;其三,不存在全局物理时钟;其四,异步运行时出现的故障现象增多,可能出现严重超时,重发,失效,阻塞,中断的情况,继而导致信息失真,丢失问题;也就是是分布式计算模型在复杂程度上要远远高于其他计算模型的计算。

1.3分布式计算的全局状态

对于分布式计算的全局状态来说,其主要可以归结为进程状态和通信状态两种。其中进程状态是以本地存储器的状态来实现描述的,也就是说受制于使用环境的情况;通道状态是以通道中信息传送来实现描述的,受制于通道中的信息情况。全局状态是分布式系统中的一个关键概念,分布式系统也需要一个集中的环境,如并发,互斥处理,在分布式系统中的死锁问题,在该问题的处理更为复杂的。

2 分布式计算模型的常用技术

2.1 OMG的 CORBA

众所周知,OMG 在1990 年提出了对象管理体系结构OMA,并在此基础上实现了对象模型和参考模型两部分的分类,其中参考模型中首次提到了CORBA。从理论上来讲公共对象请求结构CORBA 可以归结为四个部分:第一部分,应用对象,第二部分,对象服务;第三部分,公共设施;第四部分,对象请求。其中的对象请求是整个OMA的核心,其不仅仅是CORBA的对象总线,还担负建立联系,开展通信,使对象在分布式环境中透明地收发请求和响应的任务。从本质上来讲,CORBA 体系结构以对象管理体系结构OMA 为基础的。

2.2基于Java的RMI

JAVA远程方法调用,其实是JSDK的一部分,其名称为JAVA RMI,其定位是能够使得支持分布式计算应用远程的远程方法能够调用和返回的API。对于RMI来说,远程对象实际上就是网络对象,处于此环境下的地理位置信息是显性的,可知的,不仅仅可以是同一个网址范围内,同时也可能实现互联网之间的调用。但是这种技术的使用大多都是以JAVA编程语言为基础的,无论是调用方法,还是被调用方法都是在此语言环境中来执行和实现的。RMI对于接口依赖性很大,主要以存根和框架的机制实现远程对象之间的通信。

2.3微软的COM

微软的COM主要界定的是组件和客户之间的作用方式,实现了组件与客户之间的零距离接触,不再需要过多的冗余的中介组件。在此基础上,实现组件模块的建立,并将其使用到计算机设备中去,其使用环境是Windows,所以COM对象可以持续被调用和使用。在此过程中,COM组件是以DLL和EXE文件形式来实现二进制执行代码的,功能性很强,具备一定的灵活性和自主应变能力。另外,COM能够在隔离的状态下实现客户和组件的更新和升级,极大的简化了客户组件升级的步骤;再加上包容和聚合作用,使得COM组件能够更好的发挥作用。

2.4 WEB服务

所谓WEB服务,是一种web协议下的分布式软件服务,其主要以WEB服务为语言文件的说明方式,在统一描述中,发现和集成规范的作用下实现注册规模。其核心思想是:应用程序会在网络服务基础上形成和发展。其设计到三个层次的内容:其一,基本的通信格式;其二,服务描述;其三,服务的发现。其在描述语言上是一种XML的语法,开发人人员和工具以此为基础开展各种功能的实现;WEB服务体系结构是基于对象分析和设计慢慢演化来的,对于电子商务组件化发展有着最直观重要的作用。

综上所述,对于这四种常见的分布式计算模型来说,它们各自具有相应的优势,在计算机分布模型建立的过程中它们始终发挥着重要作用,我们应该结合不同计算方式来配合选取和使用不同的技术,从而保证分布式计算模型的有效性。JAVA RMI与CORBA和COM都是远程过程调用技术,三者之间有类似的地方,也存在对应的关系,区别性也是很大的。RMI对于程序语言有着过多的要求,所以只能够适用于java环境语言中,安全性和兼容性较好,可以避免恶意程序的攻击;COM是微软的产品,其对于操作系统有着要求,可以被广泛的适用于微软操作平台中,需要在注册和之后才能够得以使用,严重依赖于COM;而CORBA需要特定的环境才可以使用,其多层次的异构问题,软件构建服用上有着很明显的优势;最后的WEB,主要优势在于其可以规避上述三者在互联网扩展,客户和服务之间耦合性上出现的问题,这是因为其服务性质属于松散耦合性质的,可以以HTTP和SMTP以及XML的形式去实现标准协议的连接,从而使得人员能够以信息的异步技术来实现可靠系统的建立。

3 结束语

综上所述,分布式计算模型被广泛的使用到计算机网络系统中,其在未来的专业发展将会随着时间的延长以展现出更大的优势。无论是上述所讲的哪种技术,它们势必会受到特定的环境的影响所表现出它们的优势和劣势,但是在技术发展的时代,信息交流的时代,人机交互的时代,这样的技术随着我们的需求而不断发展和创新,未来的分布式计算模型将会更加完善。

参考文献:

[1] 徐志勇,任志刚.分布式计算模型的分析和比较[J].科技信息,2007(27).

[2] 段孝国.分布式计算技术介绍[J].电脑知识与技术,2011(22).

[3] Ndumu D T,Collis J C,Nwana H.Towards Desktop Personal Travel Agents[J].BT Technology Journal,2008(3).

第3篇:分布式系统基础理论范文

[关键词]:综合布线 工作任务 课程目标与内容

本课程是计算机网络技术和计算机通信技术专业核心技能课程,其目标是训练学生运用综合布线国家规范、标准,进行综合布线系统设计、施工、测试验收的能力。本门课程的先修课程包括计算机网络基础、网络工程制图等,是网络互联设备配置、服务器技术与应用、中小型网络设计与集成等课程的学习基础。通过学习,学生应达到综合布线工程师任职资格相应的知识与技能要求。

一、设计思路

综合布线应用于智能建筑和网络信息化建设领域,是计算机网络技术专业学生毕业后的主要就业方向,网络系统集成、网络运维管理等其它就业岗位也需要综合布线知识和技能,因此综合布线实施与管理课程在计算机网络技术专业课程体系中具有重要的地位,应作为专业核心课程和必修课程。本课程的主要任务是培养学生综合布线系统需求分析能力、综合布线系统方案设计能力、综合布线系统安装施工能力、综合布线工程项目管理能力和综合布线系统测试验收能力。

综合布线实施与管理课程立足于职业能力培养,采用项目为逻辑主线组织教学内容和实施课程教学,打破以知识传授为主要特征的传统学科课程模式,将完成工作任务必需的相关理论知识构建于项目之中,学生在完成具体项目的过程中学会完成相应工作任务,掌握必备的的理论知识,训练职业能力。

按照工作顺序,综合布线系统有设计、施工、验收三个工作过程,这是一个完整的大项目,它涵盖了本门课程需要学习的所有工作任务;根据工作任务界线,把这个项目划分成以下九个小项目:构建综合布线系统、选择综合布线产品、设计综合布线系统、安装综合布线系统环境、安装双绞线系统、安装光缆系统、管理综合布线工程项目、测试综合布线系统性能、验收综合布线系统。其中设计工作过程包括构建综合布线系统、选择综合布线产品、设计综合布线系统三个项目,由于综合布线系统结构和综合布线产品选型在综合布线系统中具有重要的地位,因此将这两个项目从设计综合布线系统工作过程中单列出来。施工工作过程包括安装综合布线系统环境(管槽路由环境、设备间和电信间环境、工作区信息插座环境)、安装双绞线系统(双绞线敷设、端接)、安装光缆系统(光缆敷设、端接)和管理综合布线工程项目(项目经理岗位、监理工程师岗位)四个任务项目,前三个项目按安装施工工作任务组织教学内容,后一项目按项目经理和监理工程师工作岗位组织教学内容。验收工作过程包括测试综合布线系统性能、验收综合布线系统二个项目,由于综合布线系统性能测试验收是验收工作过程中一个独立而重要的工作任务,因此将综合布线系统性能测试从验收任务中单列出来。学生按照工作顺序分段逐步完成各小项目,最终完成整个项目。

项目课程是以项目为主线而非以知识为主线,某些知识点如综合布线系统结构、布线标准与规范等理论知识,在不同的工作任务项目有不同程度的需求,理论知识存在被割裂、零散化的倾向,因此,设计工作任务项目时,尽可能将理论知识用工作任务穿起来,理论知识内容在符合工作任务职业行为的同时,也符合学生的认知规律,做到由易到难,由简到繁,分散难点,前后衔接,循环前进。

本课程融合了综合布线工程师职业资格相应的知识与技能要求,教学效果评价采取过程评价与终结性评价相结合的方式,通过理论与实践相结合,重点评价学生的职业能力。

二、课程目标

总体目标:本课程是计算机系网络技术专业的技能课。要求学生在掌握计算机网络技术相关基础知识的前提下,掌握网络布线工程的基本概念和规范,掌握常用传输介质和工具的使用,培养具备相应职业素质、能够熟练完成网络布线工程的高技能专业人员。通过本课的学习,学生在网络工程布线系统施工中具有能顶岗操作的技能。

具体目标:

(1)能力目标

一、能设计中小型综合布线系统方案;

二、能绘制各种综合布线图;

三、会综合布线产品选型和材料预算;

四、能按规范安装管槽路由、设备间、电信间、工作区等综合布线系统环境;

五、能按规范敷设和端接双绞线和光缆;

六、能编制施工方案;

七、能以项目经理和监理工程师的身份管理和监理中小型综合布线工程;

八、能根据设计方案和验收标准对工程进行测试和验收;

九、具备勤劳诚信、善于协作配合、善于沟通交流等职业素养。

(2)知识目标

1.了解智能建筑与综合布线的概念与关系。

2.熟悉综合布线系统设计、工程项目管理。

3.掌握传输介质及连接件的区别、线缆安装技术、管槽及设备安装技术。

4.熟悉综合布线测试及验收。

5、理解综合布线设计与验收国家标准。

三、课程内容和要求

综合布线技术岗位要求学生必须掌握网络综合布线设计的标准和工程施工的技术规范,因此“综合布线技术”课程内容须涵盖网络综合布线设计标准(GB50311)和网络综合布线验收标准(GB50312)的内容。同时,课程内容的设计参考实际工程施工技术规范以及行业职业岗位能力要求,把课程内容构建在基于工作任务的需求上,着眼点和终极培养目标是满足工作岗位的要求,使学生在掌握相应的知识技术基础上,具备社会沟通能力、团队协作能力、创新能力和良好的职业道德,从职业规划角度为学生奠定就业基础。课程内容以工作任务需求为依据,划分为九大模块。具体内容与要求如表1。

四.教学方法建议

1、本项目课程适合于在实训室和现场开展以项目小组(4-6人)为单位的“教学做”一体化教学,实训室应包括多媒体教学系统、综合布线系统结构模型、产品展示、基本技能训练台和模拟建筑物,能同时开展讲授、训练和项目教学,

2、根据课程操作性和工程性的特点,在教学中多采用现场教学、案例教学、示范教学、和实物教学等方式。在学习布线产品时采用实物教学;学习端接等安装技术时,采用示范教学方式,做到精讲多练、边讲边练、讲练结合。

3、公司模式运作工程项目教学。在综合的工程项目教学中完全按网络工程公司模式运作。

4、教学多与行业企业融合。一是请进来,可以请企业兼职教师完成部分教学任务,二是走出去,到网络工程现场教学。

5、重视学生培养爱岗敬业精神、团队协作精神和创业精神,帮助学生树立质量意识、节约意识、安全意识、环保意识、文明施工等职业意识。

五.课程资源的开发与利用

配套的课程资源包括:课程标准、实训指导书、授课计划等教学文件,课件、习题、案例库、网络方案、布线标准、工具软件等。另外,网络资源包括互联网上的“千家综合布线网”、“安恒网络”、“赛迪网”、“中国IT认证实验室网”、“FLUKE公司网站”、“唯康通信公司网站”等专业网站。

参考文献:

第4篇:分布式系统基础理论范文

关键词:云计算;Hadoop;大学计算机基础;系统设计

中图分类号:TP3-05 文献标识码:A DoI: 10.3969/j.issn.1003-6970.2012.06.029

Cloud Computing University Computer based Learning System Design

oUYaNG Chun-juan, LIU Chang-xin, SUN Ling-yu

(Jinggangshan University of electronic information engineering college, Jiangxi Ji’an 343009, China)

0 绪 论

随着互联网的飞速发展,基于Internet的多媒体学习资源建设得到了广泛地应用。然而传统以计算机网络为基础各种学习系统的性能一直是阻碍其发展的关键因素。例如,大学计算机基础课程学习系统应用中,当学生向服务器提交作业时,由于所有的学生几乎都在同一时间段提交,大量的数据同时上传到服务器,服务器负载过重导致服务器瘫痪。按传统的方法,解决该问题需对计算机硬件及网络带宽提出更高的要求,这在实际操作中不易达到。而云计算时代的到来,为解决以上问题提供了理想的技术支持。目前,云计算已在各类学习系统中得到应用[1-3]。本文采用Hadoop并行编程模型,搭建了实验性的云计算平台大学计算基础课程学习系统,解决了大量数据的传输问题。该系统具有分布式计算,管理不同系统资源及存储大量数据等特点,为实现一个同时满足学生和教师的学习系统提供了新的设计思路。

1 云计算的基本原理

云计算(Cloud Computing)[4]是一种新型的基于互联网的计算模式。其核心思想是通过计算机网络将庞大的存储和计算处理程序分布到大量非本地或远程服务器的分布式计算机中,并为用户提供服务。按最通俗地理解云计算就是把计算资源都放到互联网上,然后通过网络以按需,易扩展的方式获得资源。提供资源的网络被称为“云”,其可以无限扩展,随时获取,按需使用,按使用付费。

Hadoop[5]为分布式系统基础架构,是一个更容易开发和运行处理大规模数据的软件平台,具有扩容(Scalable)、成本低(Economical)、高效率(Efficient)和可靠性(Reliable)等特点。 Hadoop实现了一个分布式文件系统HDFS(Hadoop Distributed File System)。HDFS提供了分布式存储底层支持,具有高容错性特点。Hadoop还实现了MapReduce分布式计算模型。MapReduce将应用程序的工作分解成很多工作小块,将它们放置在服务器群的计算节点中,在节点上直接处理数据。本文利用Hadoop开发实验性的云计算平台大学计算基础课程学习系统。

2 搭建云计算平台的大学计算机基础课程学习系统

本系统根据本校大学计算基础课程的实际教学情况,采用6台计算机来搭建大学计算机基础课程系统的云计算平台。在Hadoop系统中,需要1台机为Master,其余5台机器作为Slave。Master用来配置NameNode并负责JobTracker工作。该工作主要负责整个分布式数据的管理和分解任务,并调度和跟踪各个任务的执行。Slave配置DataNode并负责完成TaskTracker工作。该工作主要根据本地数据,存储分布式数据,具体完成Map任务和Reduce任务。Hadoop集群的构建具体实现步骤描述如下:

(1)由于Hadoop要求所有机器上hadoop安装目录结构要相同,并且具有一个相同的用户名的帐户。本系统的帐户设置为dxjsj,主目录是/home/dxjsj。

(2)将hadoop0.12.0压缩包解压至HadoopInstall文件夹中。所有的配置文件都在/hadoop/conf/目录中,所有执行程序都在/hadoop/bin目录中。将 /hadoop/conf/目录中的hadoop_site.xml,slaves,hadoop_env.sh三个文件拷贝到hadoop-config/目录中。

(3)配置6台机器的IP。

对于Master机器,其机器名和IP分别dxjsj-1:192.168.8.61。其余的5台Slave机的机器名和IP依次设置为:dxjsj-2:192.168.8.62 ……, dxjsj-6:192.168.8.66。为了确保6台机器之间能相互正确解析,可通过ping主机名来实现,通过修改/etc/hosts文件打开达到Ping通。

(4)建立Master到每一台Slave的SSH受信证书。

Hadoop启动以后,Namenode是通过安全协议SSH(Secure Shell)来启动和停止各个节点上的各种守护进程的,因此在本系统中需要配置SSH使用无密码公钥认证的方式。具体操作为在Master和所有Slave机器上执行ssh-keygentrsa命令后,在/root/.ssh/目录下将产生一个名为id_rsa. pub的证书文件,采用scp命令将其复制到每个Slave上。

(5)Hadoop安装完成之后,执行/hadoop/bin/hadoop namenode-format命令格式化namenode。

(6)正式启动hadoop。执行Master上的start-all. sh启动所有的Hadoop守护;执行stop-all.sh停止所有的Hadoop。

至此,基于云计算大学计算机基础课程学习系统中的云计算平台搭建完成。整个学习系统是由客户端、网络平台和云计算平台三部分构成:

1)客户端 本系统学生机作为客户端,安装windows XP操作系统。 整个学习系统为不同类别的用户提供不同的界面和功能。在客户端的学生使用的操作系统是windows XP,而云计算平台的系统是FC5。为此,本系统采用WebDAV(Web-based Distributed Authoring and Versioning)协议访问软件包,来解决客户端和云计算两个不同平台之间的数据交换。

2)网络平台 网络平台是整个系统的基础。该平台的作用是识别用户终端不同需求,通过接口在该系统的云计算平台层上调用相关服务。其主要功能模块介绍如下。

①管理模块:该模块主要对用户基本信息进行登记和管理。用户通过唯一的帐号进行注册。

②学习模块:学习模块是最主要的模块。在该模块中,学生可进行自主地学习。包括课程内容的学习,辅导和测试,以及教师对学生学习的掌握情况等内容。

③交流模块:提供教师与学生、学生与学生、教师同行之间提供一对一,一对多,多对多的实时交互,可以发表个人日志,留言等。

④存储模块:在存储模块中主要是实现虚拟硬盘的功能。用户可下载学习资料进行学习,并上传学习资源供他人共享。

3)云计算平台 该平台是本系统的核心部分。用户终端根据网络平台上各功能模块需要的服务,通过接口,建立起与系统中云计算平台的连接。连接成功后,所有的任务都由云计算平台处理通过Hapood分布式系统,采用任务拆分的方式完成,再将处理完毕后的数据通过接口传递给用户。在云计算平台中,可实现数据存储、分布式计算和数据管理等功能。

3 实验仿真

本实验使用6台计算机采用Hadoop0.12.0分布式系统Hadoop搭建云计算平台, Java版本为jdk6.0。用户端为150台机器,用于学生学习,操作系统为Windows XP。当传输的文件的比较小时,如小于1M,则单机服务器能够承受,但当学生传送的文件较大时,且在规定的时间段内上传文件至服务器时,则服务器的负载将大大加重,收集时间呈指数级增加,最终导致服务器崩溃。使用云计算平台收集学生上交的各类文档资料时,多台服务器同时协同工作,应用程序的工作分解成很多小的工作小块,并将它们放置在服务器群的计算节点中同时进行,系统运行稳定。

4 结 语

将云计算技术运用到各种网络学习系统建设中,是对高校教学模式改革一种新的探索。本文采用Hadoop并行编程模型,搭建了实验性的云计算平台的大学计算基础课程学习系统,解决大量数据传输导致服务器负载过重问题。随着云计算技术的日渐成熟,其必将在各类学习系统中得到广泛的应用。

参考文献:

[1] 饶少阳.向云计算靠扰[J].信息网络,2008,(8):5-9.

[2] 张智威.信息以人为本——云计算时代的社交网络平台和技术[EB/OL].,2011-07-11.

[3] 俞华锋.基于云计算的三维虚拟学习环境的设计与应用[J].计算机仿真,2009,27(9):315-318.

第5篇:分布式系统基础理论范文

分布式计算是一种计算方法,和集中式计算是相对的。随着计算技术的发展,有些计算应用需要非常巨大的计算能力才能完成,如果采用集中式计算,需要耗费相当长的时间来完成。简单来说,分布式计算将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。本书使用开源工具及相应技术的开发并实现了大规模分布式处理系统,提出了构建高性能分布式计算系统的先进材料,提供实际的指导、相关练习以及软件框架的理论描述。

全书分为2部分,共8章。第1部分 高性能分布式计算的编程基础,包括1-4章:1.引言:包括分布式系统的介绍、分类,分布式计算体系结构与分布式文件系统,最后指出分布式系统面对的挑战与发展趋势;2.开始使用Hadoop:包括Hadoop的发展历史、生态系统、HDFS的特性、单个节点的集群安装与多个节点的集群安装,最后介绍Hadoop编程与流;3.从Spark开始:包括Spark装置、应用实例、Python编程及应用等内容;4.Spark和Scalding的内部编程:包括其安装步骤与编程指南。第2部分 使用Hadoop、Scalding和Spark的实例,包括5-8章:5. 案例研究1:使用Scalding和Spark进行数据聚类:包括聚类技术、聚类过程、K均值算法和相应的例子,最后进行实现;6.案例研究2:使用Scalding和Spark进行数据分类:包括分类及概率论的相关概念,朴素贝叶斯及其分类器的实现,最后对Scalding的实现进行实验并说明结果;7.案例研究3:使用Scalding和Spark进行回归分析:包括线性回归的代数方法和梯度下降法,并分别使用Scalding和Spark进行了实现;8.案例研究4:使用Scalding和Spark的推荐系统:包括推荐系统的介绍、技术应用、实现规则并使用Scalding和Spark进行了实现。

作者K.G. Srinivasa是卡内基梅隆大学计算机科学学院机器人研究所的副教授;是电脑专业资格认定协会(ICCP,International Conformity Certification Programm)、国际计算机视觉期刊(IJCV,International Journal Computer Vision)、国际计算机视觉与模式识别会议(CVPR,Computer Vision and Pattern Recognition)等多个国际会议的委员会委员,发表超过20篇期刊及会议论文。他的研究领域包括计算机视觉、图像处理、动态场景的计算机视觉监控、基于人的行为和生物特征的人物识别与身份鉴定以及数字多媒体数据的水印处理等。

本书描述了构建高性能分布式计算大规模数据处理的软件系统新模式的基本原理;介绍了Hadoop生态系统并一步步地指导安装、编程和执行;对Spark的基础知识,包括弹性分布式数据集进行了介绍,并对使用Spark和Scalding进行数据聚类、分类和回归进行了分析,提供了详细的案例研究方法;最后使用Scalding和Spark实现了一个实用推荐系统。本书适合计算机体系结构、计算智能、数据挖掘等专业的科研人员及研究生阅读参考。

第6篇:分布式系统基础理论范文

关键词 概率 统计

中图分类号:G642 文献标识码:A

经过近几年的不断教学探索、改革,概率统计课程形成了一套符合高职院校各专业开设的课程模式和标准,在大学的第二学期开设,微积分结束后,再开设概率统计,主要是建筑系各专业、商学院各专业、电信系各专业、电子系各专业等开设。实际上,概率统计一直是本科各专业开设的一门重要基础课,研究生入学资格必考的一门课程。我们现在开设的课程体系还主要是仿照本科院校的课程体系,从知识性、数学理论的逻辑性开设,先讲古典概率,概率的基本概念,各种概率类型,然后讲随机变量,从一维随机变量推广到多维随机变量,几个重要的分布定理,接着,再讲统计学,统计学先讲简单随机样本,描述统计,参数估计,假设检验、回归方程等。这样的教学模式和课程体系已经沿用了几十年,但是随着计算机概率统计软件的不断出现,结合高职学生的数学基础,应该改革本科概率统计的课程模式和体系,减少理论,增加应用,结合数学软件,使应用问题更符合生活,使繁杂的概率统计计算可以实现。

1概率论

第一章随机事件及概率,这一章是概率统计的基础,必须讲,但是现在中小学课本几乎有一半的内容,大学主要是从概率类型、概念公式体系教学,而中小学主要从解决问题的方法教学,每年高考概率都是重点考试内容,这一部分的确是生活中应用最多的内容,每时每刻我们都和运气打交道,即和随机问题打交道。根据高职院校学生的数学基础和几年的教学经验,高职院校的学生还是适合从解决问题的方法教学,从数学体系教学:概念、公式、定理、推导、举例、练习,前面四个环节他们是很难接受的。还是从问题出发,通过排列、组合、数学分析、数学分类讨论解决问题,他们更能接受。用问题驱动进行教学,对条件概率、全概率、贝叶斯、二项式概率这些教学难点用问题驱动,重点学习转化方法,避免用繁杂的公式教学这样效果更好。同时建议教学中引入数学软件:excel或spss,因为许多有趣的概率案例需要大量的计算,比如,生日问题、抽奖问题、小概率事件问题,往往计算复杂,一般教学是直接给出结果,这样往往减少学生的兴趣。通过软件学生感到他们身边的很多问题可以用数学解决。

第二章随机变量,这一章是概率论的核心,也是教学难点,主要需要大量的基础知识,极限、连续、导数、积分、多元微积分等必不可少。高中理科的学生学了少数内容,而文科学生就没有沾边了,高职院校的学生学习当然是很困难的,微积分的内容很多就没有开设。像我们这类学校,多元微积分就没有开设,而一元微积分的知识也达不到,所以凡是遇到理论的推导,学生学习非常困难,因此我们可以重点开设随机变量、期望、方差,介绍分布函数等,对多维随机变量只作了解。这部分数学软件应用更多,比如,遇到正态分布、指数分布、泊松分布等概率计算,以往都是查表,需要较多课时介绍转化和查表,像正态分布不需转化成标准正态分布直接查表。像计算数学期望、方差、分布函数、概率,不需复杂的积分运算,直接用软件计算。

第三章大数定理,中心极限定理,抽样分布,这是我们概率统计的桥梁部分,没有它,统计学的理论无法建立、证明。但是难度超出了高职学生的基础和能力。因此只能做介绍而已。

2统计学

传统的教学是先讲简单随机样本,参数估计,假设检验,回归分析等。这样的教学模式需要较多的课时,一般要30课时左右,而且学生不敢兴趣。实际上生活中,主要还是应用描述统计,而我们的课本几乎不讲,从这几年的数学建模竞赛试题来看,都有描述统计的试题,比如2012 全国大学生数学建模竞赛D 题,脑卒中发病环境因素分析及干预,学生们往往不知道如何下手,因为实际问题往往数据较多,我们的课堂教学案例往往把问题理想化,数据较少,计算简单,问题很特殊,实际问题一般需要结合软件解决,数学软件的学习是一个空点,当今计算机应用日益普及,优秀的软件不断出现,目前较好的统计软件有:excel、matlab、spss 等,现在比较流行的是spss 软件,社会科学统计软件包,SPSS 是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来,使用Windows 的窗口方式展示各种管理和分析数据方法的功能,对话框展示出各种功能选择项。用户只要掌握一定的Windows 操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。SPSS 采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便地从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。输出结果十分美观,存储时则是专用的SPO 格式,可以转存为HTML 格式和文本格式。对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS 程序。

所以,统计学部分的教学有很大的改革空间,完全可以可以通过计算机软件进行教学,增加最近几年全国大学生数学建模竞赛的案例,使统计部分的教学更有趣、更生动。

第7篇:分布式系统基础理论范文

面对我国在水资源利用中的各种问题,清华大学水文水资源研究所,改革开放以来,先后承担国家科技攻关、国家自然基金、国家“973”、 “863”等国家和省部级项目近百项,逐渐形成了以应用水文学、水资源规划与水战略、灌溉与排水、水生态环境,防洪减灾、数字水利等为主要研究方向的学科体系,并结合国内外学科动态和国民经济重大需求,开展与宏观经济、生态环境信息科学技术和公共政策等学科的交叉研究。其中,该研究所水文水资源方向研究团队,也在干旱半干旱区的流域水循环机理、水资源高效利用机理,以及水资源规划理论与实践等领域取得了突出的成绩。

流域水文循环机理研究

可以说,流域水文循环机理研究是当今水文学最具希望的前沿领域。针对现有的水文分析方法,清华大学水文水资源研究所利用地面观测与卫星遥感相结合、流域宏观规律与微观机理相结合的方法积极探讨和建立这一新的水文学理论。

2004年起,他们开始在山东省位山引黄灌区筹建生态水文综合试验站,并于2005年3月正式开始观测。该试验站采用了国际水一能量观测计划(GEWEX)中的通量观测设备和观测项目,同时还增设了土壤物理、作物生理、地下水监测。另外,还定期和不定期对土壤水分、地下水水质、作物长势等进行强化观测。通过田间直接观测研究地下水一土壤一作物一大气耦合系统中的水热循环机理及田间蒸散发规律;结合田间观测、卫星遥感建立灌溉条件下区域分布式水文模拟模型,分析和评价我国北方大型灌区水资源消耗的时空变化规律。在长期观察的基础上,他们参考我国其他干旱半干旱地区的实地观测与试验,将水文数据分析方法和水动力学理论相结合,在水文学的基础理论方面进行了探讨,从水能量(热)耦合平衡概念出发,统一了关于蒸发的三个假设即Penman假设、Bouchet假设和Budyko假设,一经刊出即获得国际学界的高度评价。此外,他们还重新推导了流域的水热耦合平衡方程,并建立了基于水热耦合平衡假设的流域蒸散发模型,为预测气候变化的区域水循环响应提供了理论依据。

水热循环基础理论研究之外,水沙科学与水利水电工程国家重点实验室还是国内较早开始流域分布式水文模型研究的单位之一,甚至多位成员早在上世纪90年代于国外留学期间就开始对其进行研究。近年来,又陆续推出了GBHM模型、基于代表性单元的分布式水文模型以及散耗性分布式水文模型。

其中,基于地貌特征的分布式水文模型《GBHM》充分考虑了流域的地形地貌特征,以Gls为工具,利用分形理论对分布在不同气候条件的流域进行了地形地貌特征分析。在此基础上,独立提出了一套有别于常用的方形网格和三角形网格的离散单元划分方法,将流域宏观水文特性与水动力学过程结合描述流域水文过程,既提高了计算效率又保证了精度,从而有效地解决了特大流域分布式水文模拟的瓶颈问题。在GBHM模型的基础上,耦合了土壤侵蚀和泥沙输移,污染物的地表径流冲刷及在土壤中的迁移转化等过程,构建了分布式的流域水量水质耦合模型。

他们提出的“基于代表性单元的分布式水文模型”,不仅总结了流域水文本构关系建立的方法,提出了具有较强适应性的基于蒙特卡罗模拟的数值法,构建了适用于一般流域水文模拟的完整的本构关系,与基本方程一起构成的闭合常微分方程组,还采用先进的数值计算方法,大大提高了模型求解的计算效率、稳定性和鲁棒性,已在中国和美国的近10个不同类型的流域进行应用和模型结构与参数的诊断研究。

同样地,“干旱区散耗型水文模型”的提出也是他们不断积累与创新的结果。在对干旱区绿洲水文过程的长期研究之上,他们突破传统的流域概念,根据干旱区绿洲的水文过程以径流的散耗为主的特点,提出了水文模型。该模型描述了干旱区完整的水文过程,包括出山口以上的径流产汇和出山口以下的径流散耗,将流域相应地可划分为径流产汇区和径流散耗区,对干旱区绿洲内水分转化过程建立各种计算方程和转化关系,从而可对整个绿洲的水资源的转化和消耗进行计算和分析,并可为其他地区的水文模拟提供新的思路。四水转化与水资源高效利用机理

“四水”是指大气水、地表水,土壤水和地下水,其转化规律及水热耦合迁移和转化机理是SPAC(土壤植物一大气连续体)研究中的重点,是农田水循环研究的基础。

上世纪80年代初,当时的水文教研组就开始了土壤水领域的研究,在土壤水分运动机理、土壤水分运动参数测定,植被蒸发蒸腾原理、降雨入渗机制等方面取得了一系列研究成果,他们编著出版的《土壤水动力学》已是国内该领域的权威著作。建立新疆叶尔羌灌区地下水和土壤水,盐观测基地在国内较早地开展了SPAC相关研究,形成了SPAC机理、模型与应用的一系列成果。微观机理方面,包括陆面蒸发和腾发的机理、饱和一非饱和土壤中的水分运动机理、田间土壤一植物一大气系统中水热的耦合运移机理、伴随水循环的作物生态过程机理。宏观区域水循环方面,他们又应用“3S”技术将微观(田间)水循环机理应用到灌区或区域,用以研究区域水资源消耗,特别是蒸散发的时空变化规律并评价农业节水潜力。

由于长期在新疆塔里木河流域开展四水转化与水资源高效利用研究,他们提出干旱区绿洲四水转化模型,并进一步提出了以耗水平衡为基础的干旱半干旱地区水资源高效利用理论,为新疆叶尔羌、山东位山、宁夏青铜峡等大型灌区的节水改造及水资源的合理高效利用提供支撑,为干旱区水土资源的可持续利用提供了理论支撑。此外,结合遥感技术的发展,他们还开发了遥感腾发模型PT-VITT,为大尺度非均匀区域的腾发研究提供了新途径。

水资源规划理论与实践

在不断的探索中,他们逐渐寻找出水资源研究的突破口,将研究重点从水资源系统本身的规律,扩展到对水资源系统与社会经济系统及生态环境系统的耦合问题的研究,研究尺度也从单个水利工程向覆盖全流域和相关区域的范围发展,研究成果主要集中在流域尺度的宏观经济水资源理论,面向生态环境的宏观经济水资源合理配置理论与方法上。

针对流域生态用水管理与调度评估关键技术,他们结合塔里木河流域生态用水问题,建立了干流地表水、地下水、土壤水监测系统,取得了系统的监测资料建立了干流上中游,干流下游水均衡模型,测算了不同根系深度、不同地下水埋深对应的潜水蒸发量,确定了自然植被的年耗水量,计算了塔里木河干流生态需水量。一系列成果在干流下游水资源配置和工程规划以及应急输水的效果评估等工作中发挥了重要价值。

针对水权理论框架和实施关键技术,以及基于水权的水资源管理理论与方法的研究,他们在全国水资源综合规划,石羊河流域近期综合治理、中澳水权项目、中日水权项目中

得到体现,提出了我国初始水权分配的理论、原则和模型方法。相关成果已成功应用于石羊河流域综合治理规划中,该规划于2007年12月国务院正式批准实施。

针对流域人与自然用水冲突协调关键技术,他们又提出了以耗水为中心的,社会经济发展与自然生态保护相协调的,干旱区绿洲水资源配置规划的思路和方法,应用于叶尔羌河流域规划修编及水资源合理配置研究,提出干旱区社会经济用水比例,适宜灌溉面积,合理地下水位,自然生活耗水量等指标,为干旱半干旱区水资源高效利用以及人与自然用水冲突协调提供了理论支撑。

而针对干旱半干旱地区的地面地下水联合调度关键技术,他们在大比例尺水文地质条件勘查、流域地下水监测网络、大型水均衡试验场等试验观测的基础上,建立了基于Gls平台的灌区地表水一土壤水一地下水,溶质垂向运移与二维水平扩散耦合的模型体系,运用数量化理论进行了区域水文地质参数的评估,应用于疏勒河流域的水土资源综合规划,对世行项目规划的移民方案提出了重要的修正意见并得到采纳。

流域水量统一调度

不唯如此,在水沙科学与水利水电工程国家重点实验室平台上,他们整合水文水资源的研究成果并应用于流域水量统一调度。以黄河流域和塔里木河流域水量统一调度工作为背景,他们提出了系统流域水量调控的理论方法和模型体系,建立适用于流域水量统一调度的管理系统和情景模拟平台,应用于两个流域的水量统一调度实际工作中,对防止河道断流和提高水量统一调度的科学性具有重要作用。在理论方法层面,提出了水量统一调度的两个理论基础,即水流演进与水量调控机理和水资源与社会经济系统耦合作用机理;在模型层面,提出了流域水量调控的自适应模型和基于复杂适应系统理论的整体优化模型;在应用层面,更是开发了黄河流域水量调度决策支持系统和塔里木河流域水量调度决策支持系统,并投入使用。

理论方法与模型暂且不论,仅是应用层面的工作就大大值得称道。经过反复的实践,他们将现行水量调度方法方案编制由原来的人工计算变为计算机控制,而且应用自适应理论和基于复杂适应理论的水资源优化配置理论,建立了水量自适应分配模型和优化调度模型,克服了以往调度中存在的多项缺点,不仅能根据国务院分水指标,实时跟踪动态目标,快速精确地将水量分配给各用水单位,也能对全流域年水量调度分配指标进行优化,并通过三维仿真对调度方案进行模拟仿真。应用实践表明,所建立的模型系统,克服了实际调度中存在的关键技术难题,增强了水量统一调度的科学性和预见性,提高方案编制的效率和调度精度,为黄河和塔里木河流域水量统一,科学调度提供了操作平台和决策环境。两个流域水量调度系统的建立,产生了巨大的经济效益和社会效益。

桩桩件件,不一而足,在水文水资源研究所师生的共同努力下,该研究所在水文学方向上先后荣获多项部级、省部级科技奖励;编写出版了一批优秀的科研成果专著,在国内外著名学术期刊发表了大量具有影响力的学术论文。

第8篇:分布式系统基础理论范文

关键词 信息检索 检索模型

中图分类号:G354 文献标识码:A

信息检索模型是运用数学或其它的语言和工具,对信息检索的主要要素―查询和文档,及其之间的匹配程度―相似度进行表示和计算的框架和方法。它基于以下观点: 文档和查询共有的词项越多,则认为这篇文档和该查询越相关。

1布尔检索模型加权布尔检索模型扩展布尔检索模型

布尔模型是信息检索中第一个被提出的模型,其表达提问的方式与人们的思维方式相近,人们习惯于采用此种模式进行检索查询。它侧重于结构化查询表达式,即通过AND、OR 和NOT 构造查询表达式,反映用户需求,并通过精确匹配来返回文档。布尔检索实际是通过对若干个文献集合的并、交、补运算回答用户提问的。布尔模型最显著的特点是将用户查询与文献标引进行逻辑的、而非数值的比较而获得检索结果。这种模型把复杂的检索过程简单化,将复杂的情报提问按其概念组面的逻辑关系描述出来,使机器根据事先确定的程序进行自动匹配,简化了运算。

但是,布尔逻辑式的构造不易全面反映用户的需求,匹配标准存在某些不合理的地方,检索结果不能按照用户定义的重要性排序输出。针对这些缺陷,提出加权布尔模型,通过对标引词进行加权,解决了传统布尔检索的一些缺点,比如传统布尔模型的运算符在加权布尔模型中无法使用,为解决此问题,提出了扩展布尔模型,该模型通过对标引词加权值,同时将向量检索模型与布尔检索模型融为一体,克服了传统与加权布尔逻辑模型的缺陷。其扩展规模是传统布尔检索模型完全匹配的严格性和向量模型提问的无结构性的折中,在保持布尔逻辑检索的结构式提问的同时,吸纳了模糊检索和向量检索模型的长处。

2概率模型贝叶斯网络检索模型

概率论可以用来计算查询和文档的相关性,概率模型通过计算文档与查询相关的概率作为相似度。这就使相关性排序问题降为概率论应用问题。概率模型基于以下论点: 基于一个词项分别在相关文档和不相关文档中出现的频率来估计该词项的权重。概率模型完全基于概率论,采用严格的数学理论为依据和基础来进行检索决策,具有坚实的理论基础。它的主要缺点是增加存贮和计算资源的开销、参数估计难度较大、系统的检索性能提高不明显。

贝叶斯网络检索模型是从传统的概率理论中分离出来的,以概率理论为基础,是概率检索模型的扩展。贝叶斯网络是一个带有概率注释的有向无环图,图中的点表示所要解决的问题中的变量。这种概率图模型能表示变量之间的联合概率分布,分析变量之间的相互关系,因而贝叶斯网络模型可以用来表示术语间的条件概率和概念语义,并对查询与文档间的相似度进行预测,从而实现基于语义概念的查询。尽管关于贝叶斯网的理论研究还很不完善,应用研究还处于起步阶段,但已通过不同的方式应用到了信息检索领域,随着技术的进步,贝叶斯网模型将发挥越来越重要的作用。

3向量空间模型隐性语义检索模型本体向量空间模型

向量空间模型是目前最为流行的信息检索模型之一。其通过使用空间的相似性来解决语义上的相似性,把文档和查询在高维空间中用向量表示出来,每一个维对应着文档集合中的一个词。

向量空间模型最显著的缺陷是基于关键词的向量空间模型无法反应术语间的语义关系,为使处理水平从离散的关键词匹配深入到概念匹配的层次上,提出了隐性语义检索( LSI)。

LSI 可以看作是扩展的向量空间模型,其简化了计算的复杂性,但语义空间不够完整。本体为向量空间模型提供了更为丰富、详细的概念空间,涵盖了领域内的所有知识及关系。在本体的支持下,文档中语义相关的术语彼此间有了丰富的语义联系,如上下位关系,同义、近义、成员、属性等内在联系,每种关系的关联程度也不同。

在获得丰富而详细的本体的前提下,对基于本体的向量空间模型定义如下: 所有的文n组成信息对象集合D = { di | 1≤i≤M} ,M 为信息对象的总数。根据向量空间模型,每条信息di都可以用一个特征向量v( s) =[s1,s2,…,sN]来表示。si对应于本体中的实体ei,表示某个信息对象中术语ei的权重。本体向量空间模型有着良好的前景,但由于构建完善的本体难度太大,因而基于本体的向量空间模型仅在小范围有试用,如Gene Ontology。

4模糊集检索模型粗糙集检索模型

模糊集合理论研究的是边界不明确的集合表示,其中心思想是把隶属函数和集中的元素结合在一起。该函数的取值在区间[0,1]上,0表示不隶属于该集合,1表示完全隶属于该集合,隶属值在0 和1 之间表示集合中的边际元素。模糊集合模型被用来定义查询语词和文献之间的模糊关系。每一个查询语词定义了一个模糊集合,每个文献在相应的语词集合中有一个隶属度,取值通常小于1。

模糊检索主要是建立隶属函数,即为查询条件使用的模糊语言定制适当的函数,用于计算数据库中各记录相应字段的匹配度。合适的隶属函数则能准确把握用户的意愿,满足用户的检索需求。传统的模糊集合模型只考虑利用语词共现关系来进行模糊检索,给出了文献隶属度的计算。由于它没有考虑语词与整个查询概念的相似性,模糊程度有限。

粗糙集理论由波兰数学家Z.Pawlak 于1982 年提出,建立在分类的基础上。它将分类理解为在特定空间上的等价关系,而等价关系则构成对该空间的分类,且每个分类后的集合称为概念。模糊集和粗糙集虽然都是集合理论,但模糊集侧重集合中的元素,而粗糙集侧重于集合与集合之间。粗糙集理论应用于信息检索是利用粗糙集的上下近似函数设置相等、粗糙相等、粗糙包含于、粗糙包含和粗糙相交几种匹配等级标准,提出一种扩充和优化用户查询的新方法,此方法可根据用户查询和等级匹配标准实现检索,从而得到检索结果的排序输出。基于粗糙集的检索模型目前还在研究阶段尚无大范围应用。

参考文献

第9篇:分布式系统基础理论范文

1 云计算概述 

云计算诞生于二零零六年,二零零八年云计算得到大面积推广,云计算的诞生立即引起全球信息行业的广泛关注,云计算的出现给IT行业发展带来了新的改革浪潮,云计算的特征是:按需服务、共享资源、按需付费、网络面广。云计算作为二十一世纪新兴的技术,彻底改变了传统软件工程。云计算现如今已经被应用到了各个领域。云计算的核心技术有海量数据存储与计算、虚拟化技术、分布式存储技术、并行编程模式技术。云计算实现了将庞大数据拆分成若干子程序进行分布处理,处理后发送给服务器群计算,最后将分析处理结果统一融合后回传给用户。狭义上来说云计算是通过计算机和各类用户终端实现信息交互和应用。广义上讲云计算是一种强大的网络服务模式。云计算的虚拟化技术将一台计算机虚拟化成多台计算机,使资源利用率提高,从而降低成本。云计算的分布式计算技术,实现了根据使用需求情况分布资源。另外,云计算相比传统硬件平台相比,维护费用低廉,管理方便易操作,无需大量的资金支持。 

2 物联网概念 

物联网是互联网的重要组成部分,物联网是物物相联的互联网,物联网的基础仍然是互联网,物联网是以互联网为基础发展和延伸出来的网络。物联网最早提出于一九九零年。一九九一年麻省理工学院开始对物联网进行研究,一九九九年麻省理工学院对物联网做了实验。物联网底层数据的感知是物联网技术的基础,在物联网感知层中,呈现出的特点是数据量大、种类多。物联网感知采用了信息后,通过传输层实现数据与传递。物联网按照功能分为三层:应用服务层、网络传输层、感知控制层。物联网应用十分广泛,现如今几乎已经渗入到人类生活的各个方面。例如:智能交通、智能家居、资源管理、科研实验、医疗领域、军事领域。物联网的发展和推广受到了国家的重视。但就目前来看,物联网技术不论是技术上,还是理论上仍然处于发展阶段,距离物联网普及和大面积应用仍然有着一定的距离。 

3 基于云计算的物联网系统架构 

从物联网技术的特征来看,未来物联网技术更新和改革离不开对云计算的应用,云计算的优势是物联网技术所需要的,物联网的推广和应用必然不能缺少云计算,物联网数据产生和收集过程具有实时性和不间断性,处理时间的延迟必然会导致数据量的扩大。但由于数据量大、节点有限、存储点等技术限制,必然影响物联网性能。云计算的分布式技术,便可很好的解决这些问题,使物联网实现有效的控制多源、多位置的不同数据处理。云计算和物联网的融合,使物联网获得了强大的计算能力和存储能力,云计算搭建了一个辅助物联网的平台。 

基于云计算的物联网系统架构主要包括了三个层次:物联网中间件层、物联网基础设施层、物联网应用层。这三层相互协调融合构成了物联网系统,向人们提供服务。 

3.1 物联网应用层 

物联网应用层是整个物联网系统架构的核心内容,应用层通过应用管理中提供管理工具,其中包括:用户管理、资源管理、安全管理、影像管理。每一个管理工具能够为用户提供不同的服务,用户管理包括:用户账户管理、计费管理等等。安全管理包括:用户身份验证、用户资料保护等等。资源管理包括:资源恢复、故障检测等等。影像管理包括:应用生命周期管理、影像部署等等。 

3.2 物联网中间件 

物联网中间件层是整个物联网的连接媒介,包含着整个物联网的所有中间件产品。所包括的功能有:感应设备管理、智能终端接入等等,除此之外,还具有面向服务的物联网应用的功能。 

3.3 物联网基础设施层 

物联网基础设施是物联网系统实现的基础,离开了物联网基础设备,物联网系统无从谈起。物联网基础设备层包含了:虚拟集群、物理硬件及感应终端。虚拟集群是基于云计算的虚拟化技术的基础上实现的,以虚拟化方式为用户提供服务。物理硬件包括:云计算必要的网络设备、存储设备、服务器设备等等。感应终端包括传感器、控制器等智能终端设备。物联网基础设备由物联网中间件负责管理和协调运作。