公务员期刊网 精选范文 云计算与分布式技术范文

云计算与分布式技术精选(九篇)

云计算与分布式技术

第1篇:云计算与分布式技术范文

关键词:云计算 分布存储 技术探析

中图分类号:TP393.08 文献标识码:A 文章编号:1007-9416(2015)09-0000-00

网络的大规模使用是目前的大时代环境。与时俱进是政府不断强调的技术进步的核心,计算机相关技术广泛应用在社会各个领域中,各种电子数据的数据量和数据类型均出现迅速增长。数据的存储及传输在数据应用中是一个颇为重要的分类,云计算与分布存储的结合应用是目前计算机技术的一个新的开拓方向。

1 云计算的定义及其特点

云计算是以互联网为基础发展的关于互联网络服务的交付与使用模式,通常是指一种虚拟化的资源。目前,对于云计算的基本定义仍然存在多种不同说法。对于云计算的定义,能够找到高达约100种解释。[1] 在现在这个阶段多为社会各界所接受的一般概念是美国国家标准与技术研究院(NIST)共同进行定义的,云计算是指按照其总使用量为计费标准来付费的模式,它能够有效快速地为用户提供可用性较高、可靠性更高、针对性更强的网络引擎访问,能够直接进入配备相关配置的资源共享池,使用户所需的资源能够更加快速、更加具有针对性的被搜索到,且由于是网络控制,因此只需要投入较少成本的管理工作,或者与服务的供应商进行少量的交互即可。云计算具有以下几个明显特征,也是其优势所在。

(1)规模大。“云”并不是指某一个具体的东西,而是一个概念。而云最明显的特征之一就是其超大的规模。Amazon、Yahoo等知名公司均拥有几十万台服务器,Google云计算已拥有100多万台服务器。而一般企业的私有云基本拥有成百上千台云计算服务器。成倍的扩大了用户的计算机处理能力。(2)可靠性高。“云”采用了数据同时拥有多副本制,计算机节点同为可进行互换等措施,有效的防止了数据的丢失和错漏,增加了其可靠性,也为用户带来更好的数据体验。(3)通用性和可扩展性。“云”是一个虚拟的存在,不特指某一个硬件或软件,具体来讲,“云”是一种将私人数据上传网络但不一定共享的一个模式或者一种状态。不同的“云”可以帮助缔造万千种数据应用,同一种“云”也可以同时支撑数种应用及多个数据的运行和应用。由于“云”的虚拟性,它的存在是动态可拉伸的,而不是固定不变的,因此具有较强的可扩展性与适应性。(4)成本低廉且针对性强。“云”计算采用的是特殊的容错结构,由成本极其低廉的节点构成,且“云”采用的是自动化集中式管理模式,企业只需投入少量的人力资本和资金投入。由于“云”是根据用户的实际需求来进行计费,因此其具有较强的针对性,同时也提高了资源利用效率,并有效地节约了企业在云计算方面的投资。[2]

2 分布式存储

目前,社会活动中仍以集中式存储技术为主要存储方式,集中存储,是指在建立一个大数据库的基础上,将各种信息存储于数据库,功能模块围绕其周围对数据信息进行录入、搜索等。区别于集中存储的分布式存储,则是利用网络便于沟通交流的特点,使用分散存储在企业个体计算机的磁盘空间的数据信息构成一个虚拟的存储中心。这种结构使数据分散存储在个体中,减少了成本投入,便于管理,同时可以帮助用户可以按照其实际需求来进行数据的录入、查询及输出下载。分布式存储是以网络为基础存在以实现资源的存储与共享。云计算技术背景下的分布式存储最大的优势之一是强调了用户能够按需对数据资源进行购买或租赁,这样可以使用户最大可能的在节约成本投入的前提下满足其对数据资源的需求。同时,由于分布式存储的存储是以各个单体计算机的硬盘存储为基础的,有效的减少了系统崩溃导致数据丢失的情况。

3 云计算环境下的分布式存储

(1)产生背景。随着社会各方面的深入发展,单独的数据库已不能满足社会生产的要求。云计算就是在这种困境下为适应现代计算机的技术进步及各行业对数据资源需求而产生发展的。云计算背景下的分不存储,强调的是用户按需购买,以实现在满足用户数据资源需求的前提下尽量节约成本投入。(2)以交换机为结构核心。云计算背景下的分布存储技术发展起来之前,多数用户均采用交换机作为其数据中心。其采用的架构是树形结构,包括核心层、聚合层、边缘层三个层面。其主要优势体现在具有可操作性,连接简单,扩展弹性大等特征,但其存储空间有限,并不能满足大数据环境下的今天人们对数据资源的要求。因此,云计算技术的发展可以很好地弥补这个缺陷。由于“云”是一个虚拟的存在,并没有固定的容量及存储空间,因此在存储容量上,它具有无限的可能。以交换机为结构基础的存储技术的可操作性结合云计算在存储空间上的优势,能够更好地满足用户的数据资源需求。(3)扩展弹性大。在云计算技术支持下的分布存储发展之前,用户采用的数据存储方式多以计算机服务器为主,这种方式的存储方式主要通过不断提高其扩展性增加存储容量以满足数据录入及输出功能。而云计算技术背景下的分布存储拥有天然的存储空间庞大的优势,在存储模式选择中具有相当大的竞争优势。现今,数据存储中心的数据资料一般以BP及EB为计量单位来进行简单运算。[3]云计算背景下的数据规模正在随着社会的发展呈指数型函数出现爆发性增长。云计算背景下的分布存储具有相当大的扩展弹性,能够根据数据资源及用户需求的实际情况对数据库进行调节。

4 结语

云计算技术的不断深入研究,带来更多在计算机领域上的拓展思路。发散的思维帮助云计算实现更多的可能。基于云计算技术基础的分布式存储的核心技术是计算机的兼容问题及数据存储的冗余问题,在探究这些问题的过程中,提高数据的筛选水平更是一个基础问题。准确有效地为用户提供数据服务是云计算环境下分布式存储的发展目标。

参考文献

[1]程宏兵.容淳铭.杨庚.曾庆凯.基于路径映射加密的云租户数据安全存储方案[J].南京邮电大学学报(自然科学版),2015.06.02.

[2]刘月.云计算环境下分布存储关键技术研究[J].江苏科技信息,2015.03.30.

[3]郭苹.基础设施云关键算法研究与实现[J].信息与电脑(理论版),2015.01.08.

第2篇:云计算与分布式技术范文

关键词:云计算;发展

1 引言

如今,云计算技术打破了高端技术“独享”的局面,让每个普通用户和中小企业都能以极低的成本享有原先只有大型企业才能享有的高端技术服务。云计算彻底改变了我们的工作方式和商业模式,云计算已经走入我们的生活。

2 云计算的概念及其基本原理

狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数据中心或超级计算机,以免费或按需租用方式向技术开发者或者企业客户提供数据存储、分析以及科学计算等服务。

广义的云计算指的是厂商通过建立网络服务器集群,向各种不同类型的客户提供在线软件服务、硬件租借、数据存储、计算分析等不同类型的服务。广义的云计算包括了更多的厂商和服务类型。

通俗地讲,云计算是一种基于Internet的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云。因此,云计算甚至可以让你体验超乎想像的运算能力,用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。

云计算的基本原理是,通过使计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,企业数据中心的运行将更与互联网相似。这使得企业能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。

3 云计算的特点及其关键技术

基于云计算概念及原理,云计算应至少具备如下特点:一是以网络为中心,云计算的整体架构是建立在由多台计算机或其他硬件设备构成的网络环境中;二是以服务为提供方式,以按需服务的方式根据不同用户的个性化需求推出多层次的服务;三是高扩展性和高可靠性,基于网络构建的云计算可以快速灵活地适应用户不断变化的需要,同时通过网络冗余机制实现高可靠性;四是资源透明化,底层资源(计算、存储、网络资源等)对用户透明,用户无需了解资源具体实现和地理分布等细节。

为了实现上述特点,云计算采用了如下关键技术:一是数据分布存储技术,通过采用分布式存储的方式存储数据,采用冗余存储的方式保证存储数据的可靠性,提高软件可靠性弥补硬件的不可靠,从而提供廉价可靠的系统;二是并行计算编程模型,将任务自动分解成多个子任务,通过Map和Reduce两个步骤实现任务在大规模计算节点中的调度和分配;三是高效数据管理,通过采用列存储的数据管理模式实现在规模巨大的数据中高效地找到特定数据;四是分布资源管理,云计算系统在多节点并发执行环境中可以保障关键节点出现故障时的自动迁移及其状态的同步。

4 云计算的服务方式

云计算已在日常网络中随处可见,以各种形式提供服务,云计算的主要服务方式有:IaaS(Infrastructure as a Service,基础设施即服务)、PaaS(Platform as a Service,平台即服务)和SaaS(Software as a Service,软件即服务)三种形式,其中IaaS是把计算、存储、网络及搭建应用环境所需的一些工具当成服务提供给用户,使得用户能够按需获取IT基础设施。它由计算机硬件、网络、平台虚拟化环境、效用计算计费方法、服务级别协议等组成,其表现形式是为用户提供按需付费的资源服务,例如虚拟服务器、存储等;PaaS是把分布式软件的开发、测试和部署环境当作服务,通过互联网提供给用户,其表现形式是为用户提供基于可扩展的大规模基础设施的平台能力与资源服务,例如云应用开发与运行环境、用户数据、信息资源、公共服务能力;SaaS是一种基于互联网来提供软件服务的应用模式,它通过浏览器把服务器端的程序软件传给千万用户,供用户在线使用,其表现形式是为用户提供基于云基础架构的应用软件服务,例如CRM、文档编辑,典型的商用代表是Google公司基于云计算平台提供的Google办公套件,只用浏览器即可访问使用。

5 云计算的发展现状及前景

随着网络技术的不断完善和成熟,以及云计算应用的不断深入,越来越多的人开始重视云计算,不仅仅大中小企业广泛应用云计算,人们的日常生活也会像离不开煤气、水电那样,离不开云计算。

云计算已经从前期的起步阶段开始进入实质性发展的阶段。互联网公司、基础运营商、软硬件IT企业及各地政府等多方力量都在积极推动云计算发展。我国已将云计算列为新一代信息技术产业的重点领域,“十二五”将给予大力扶持。与此同时,运营商在主管部门的大力支持下,已经开始大规模部署云计算解决方案来加速云实施。云计算在企业中正变得无处不在,大多数公司正在尝试云计算。目前,已经有相当一部分大中型企业开始应用私有云及混合云,而针对小型企业的公有云项目也开始启动。“十二五”期间我国云计算将步入高速发展期。

参考文献

[1]中国云计算网..

第3篇:云计算与分布式技术范文

关键词:云计算 虚拟化技术 编程模型

中图分类号:F307.3 文献标识码:A 文章编号:1672-3791(2011)09(a)-0017-01

1 云计算思想的产生

我们每天都要用电,但我们不是每家自备发电机,它由电厂集中提供;我们每天都要用自来水,但我们不是每家都有井,它由自来水厂集中提供。这种模式极大得节约了资源,方便了我们的生活。面对计算机给我们带来的困扰,我们可不可以像使用水和电一样使用计算机资源?这些想法最终导致了云计算的产生。

云计算的最终目标是将计算、服务和应用作为一种公共设施提供给公众,使人们能够像使用水、电、煤气和电话那样使用计算机资源。

2 云计算的概念

狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数据中心或超级计算机,以免费或按需租用方式向技术开发者或者企业客户提供数据存储、分析以及科学计算等服务,比如亚马逊数据仓库出租生意。

广义的云计算指厂商通过建立网络服务器集群,向各种不同类型客户提供在线软件服务、硬件租借、数据存储、计算分析等不同类型的服务。广义的云计算包括了更多的厂商和服务类型,例如国内用友、金蝶等管理软件厂商推出的在线财务软件,谷歌的Google应用程序套装等。

通俗的理解是,云计算的“云“就是存在于互联网上的服务器集群上的资源,它包括硬件资源(服务器、存储器、CPU等)和软件资源(如应用软件、集成开发环境等),本地计算机只需要通过互联网发送一个需求信息,远端就会有成千上万的计算机为你提供需要的资源并将结果返回到本地计算机,这样,本地计算机几乎不需要做什么,所有的处理都在云计算提供商所提供的计算机群来完成。

3 云计算的核心技术

云计算系统运用了许多技术,其中以编程模型、数据管理技术、数据存储技术、虚拟化技术、云计算平台管理技术最为关键。

3.1 编程模型

MapReduce是Google开发的java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算。严格的编程模型使云计算环境下的编程十分简单。MapReduce模式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)的方式,先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理,达到分布式运算的效果,再通过Reduce程序将结果汇整输出。

3.2 海量数据分布存储技术

云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。

GFS即Google文件系统(Google File System),是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。GFS的设计思想不同于传统的文件系统,是针对大规模数据处理和Google应用特性而设计的。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。

一个GFS集群由一个主服务器(master)和大量的块服务器(chunkserver)构成,并被许多客户(Client)访问。主服务器存储文件系统所以的元数据,包括名字空间、访问控制信息、从文件到块的映射以及块的当前位置。它也控制系统范围的活动,如块租约(lease)管理,孤儿块的垃圾收集,块服务器间的块迁移。主服务器定期通过HeartBeat消息与每一个块服务器通信,给块服务器传递指令并收集它的状态。GFS中的文件被切分为64MB的块并以冗余存储,每份数据在系统中保存3个以上备份。

客户与主服务器的交换只限于对元数据的操作,所有数据方面的通信都直接和块服务器联系,这大大提高了系统的效率,防止主服务器负载过重。

3.3 海量数据管理技术

云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据。云计算系统中的数据管理技术主要是Google的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase。

BT是建立在GFS,Scheduler,Lock Service和MapReduce之上的一个大型的分布式数据库,与传统的关系数据库不同,它把所有数据都作为对象来处理,形成一个巨大的表格,用来分布存储大规模结构化数据。

Google的很多项目使用BT来存储数据,包括网页查询,Google earth和Google金融。这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星图象)不同,反应速度不同(从后端的大批处理到实时数据服务)。对于不同的要求,BT都成功的提供了灵活高效的服务。

3.4 虚拟化技术

通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化。

3.5 云计算平台管理技术

云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效的管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战。

云计算系统的平台管理技术能够使大量的服务器协同工作,方便的进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。

4 云计算技术发展面临的主要问题

尽管云计算模式具有许多优点,但是也存在的一些问题,如数据隐私问题、安全问题、软件许可证问题、网络传输问题等。

数据隐私问题:如何保证存放在云服务提供商的数据隐私,不被非法利用,不仅需要技术的改进,也需要法律的进一步完善。

数据安全性:有些数据是企业的商业机密,数据的安全性关系到企业的生存和发展。云计算数据的安全性问题解决不了会影响云计算在企业中的应用。

用户使用习惯:如何改变用户的使用习惯,使用户适应网络化的软硬件应用是长期而艰巨的挑战。

网络传输问题:云计算服务依赖网络,目前网速低且不稳定,使云应用的性能不高。云计算的普及依赖网络技术的发展。

参考文献

[1] 中国云计算网[EB/OL].省略/.

[2] (美)海吉(Bhai Ji,Y.).网络安全技术与解决方案[M].人民邮电出版社,2010,1.

第4篇:云计算与分布式技术范文

关键词 云计算 教学资源库 云服务

中图分类号:TP311.52 文献标识码:A

1教学资源库存在问题分析

20世纪90年代,我国教育部为促进校园数字化建设,实现教育信息化,提出了构建教学资源库的方案。各级学校在该方案的指引下开始教学资源库建设的探索,目前已取得了一定的成效,例如许多学校实现了远程视频教学、多媒体教学等等。但由于各级学校分布在不同的地理区域,同时各级学校之间的差异较大,使得教学资源库的建设仍然存在诸多的问题,具体体现在个性化缺失、重复性建设、新技术应用水平低、管理与维护不专业、硬件资源无法共享等。针对这种现状,有必要对教学资源库的建设展开专项研究。

2教学资源库构建的关键技术

2.1云计算技术简介

云计算(Cloud Computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源,是分布式计算(Distributed Computing)、并行计算(Parallel Computing)、效用计算(Utility Computing)、网络存储(Network Storage Technologies)、虚拟化(Virtualization)、负载均衡(Load Balance)、热备份冗余(High Available)等传统计算机和网络技术发展融合的产物。云计算技术的产生是继1980年代大型计算机到客户端-服务器的大转变之后的又一种巨变,具有超大规模、虚拟化、通用性、高扩展性、高可靠性与廉价性的特点。

2.2虚拟化技术

虚拟化技术是将计算机的各种资源打破实体间的障碍,使用户能够采用更好的方式将计算机的各种资源进行组合,提高各项资源的利用率。因此,虚拟化技术可以理解为一种资源管理技术,能够打破地域、物理、架构方式组态的限制,使得虚拟化技术成为云计算技术实现的基础。虚拟化技术根据其虚拟化特征,可以划分为硬件虚拟化、桌面虚拟化、数据库虚拟化、软件虚拟化、服务虚拟化等。

2.3分布式技术

分布式技术是一种基于计算机的处理技术,通常分为分布式计算与存储。分布式计算是将复杂的计算任务划分为多个小的计算任务,然后分配至多台计算机进行计算处理,最后汇总计算结果再进行综合计算得出最终结果。分布式计算充分利用了各台计算机的硬件资源,同时也降低了各台计算机的计算压力,实现了负载均衡,提高了计算效率。分布式存储是将存储的资料、信息或数据划分为多个信息块,然后存储于不同的计算机设备中,由位置服务器定位各信息块所存储的计算机。

3基于云计算技术的教学资源库构建方案

3.1教学资源库云服务的整体架构

教学资源库是一个专门的管理教学资源平台,不仅需要具备较大的教学资源存储空间,同时也需要专门的管理与维护团队来保障平台的稳定运行。并且需要打破当前教学资源库孤立的格局,实现教学资源库的共享,解决当前教学资源库构建中所存在的问题。而云计算技术的出现,为解决这些问题提供了可能。基于此,本文将基于云计算技术完成教学资源库构建方案的设计。图1是基于云计算技术构建的教学资源库云服务的整体框架。

3.1.1用户层

用户层即教学资源库面向用户的层次。用户可通过计算机、移动终端设备接入网络随机随地的访问教学资源库。同时为了提高用户对教学资源库的体验,建立更多的个性化功能,例如建立用户个人档案功能,并通过个人档案记录用户的行为偏好,以便能够给用户精准的推送相应的教学资源,为用户提供更多的个性化服务。

3.1.2资源库层

资源库层采用云计算技术进行实现,可集成更多的服务资源,同时也不再需要过多的考虑服务资源扩展而购置软件与硬件。并且能够在保障教学资源库安全稳定运行的条件下,为用户提供更多、更好的服务。具体所提供的服务包括用户体验式服务、协同服务、知识服务、网络社区化服务等。

3.1.3云端层

云端层即架构教学资源库的基础设备、云平台与服务器端应用等。云计算机技术具有极强的基础设施集群能力,可为教学资源库构建提供强有力的支持。同时,通过云端层提供的云管理平台提供的集中式管理服务,能够为用户提供更加优质的服务。

3.2教学资源库云服务的基本功能

基于云计算技术所构建的教学资源库要保证稳定可靠的运行,以及能够吸引更多用户使用教学资源库,必须具有强大的功能。本次构建的教学资源库方案的基本功能包括资源目录索引管理、文献资料管理、课件管理、教学素材管理、试卷管理、案例库管理、常见问题解答库管理等。以及用于教学资源库云服务管理的配置管理、故障管理、性能管理与安全管理等。教学资源库云服务的基本功能如图2所示。

3.3教学资源库云服务的部署模式

本次设计的教学资源库以云计算技术为基础,采用云服务模式进行部署。在云服务模式下,以各学校的教学资源共享为基础,教学资源库负责教学资源的管理与存储,以及教学资源元数据的规范,使得各学校能够随时随地的获取教学资源库中的教学资源,并且可根据学校自身的软件与硬件环境部署云服务节点或管理平台,这样便能够实现各学校对教学资源库的独立运行与管理。教学资源库云服务的部署模式如图3所示:

4结沦

本文构建的教学资源库充分利用了云计算技术的理念与优势,有效的解决了当前我国许多学校构建教学资源库中所存在的问题,实现了各学校软件与硬件资源、教学资源的共享,避免了重复部署,降低了部署教学资源库的成本。同时,各学校教学资源的共享,丰富了教学资源库,使教学资源库更加完善。

参考文献

第5篇:云计算与分布式技术范文

关键词:计算机网络专业;大数据;云计算;Hadoop

中图分类号:G642.0;TP393 文献标识码:A 文章编号:2095-1302(2016)12-0-02

0 引 言

随着云计算、物联网以及“互联网+”技术的兴起,数据正以前所未有的速度在不断增长和累积,互联网大数据正在实时影响人们的工作、生活乃至社会发展。2012年 3月,美国奥巴马政府公布“大数据研发计划”,旨在提高和改进人们从海量、复杂的数据中获取知识的能力,发展收集、储存、保留、管理、分析和共享海量数据所需要的核心技术。2014年大数据高速发展,中国互联网三巨头BAT(百度、阿里、腾讯)纷纷建立大数据研究院、大数据实验室等,提供大数据专业服务,一批大数据专业分析公司应运而生。我国的开放、共享和智能的大数据时代已经来临,同时对专业人才的需求也日益增长。

大数据的发展与计算机网络密切相关,因此适时调整高职计算机网络专业方向的培养目标,可以更好的适应大数据发展要求。大数据背景下计算机网络专业学生的目标是培养具有计算机网络、大数据及云计算的专业知识,实践能力强、职业道德素养高,具备云平台的管理能力和网络软件开发能力,能够从事网络工程设计实施、网络高级管理维护、网络开发、云平台组建及管理以及大数据存储、计算及分析等岗位的高级技能型人才[1]。

1 大数据与云计算

根据维基百科的定义,大数据[2,3]是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据主要具有4V特征[2],即数据体量巨大(Volume)、数据种类繁多(Variety)、流动速度快(Velocity)、价值密度低(Value)。

从技术角度上看,大数据必然无法用单台计算机处理,必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。目前应用最为广泛的大数据分布式处理平台就是Hadoop,Hadoop是由Apache基金会所开发的分布式系统基础架构,能够对大量数据进行分布式存储、分析和处理的云计算平台,已经在网络大数据领域得到了广泛运用。例如Yahoo使用4 000个节点的Hadoop集群来支持广告系统和Web搜索的研究;Facebook使用1 000个节点的集群运行Hadoop,存储日志数据,支持其上的数据分析和机器学习;百度用Hadoop处理每周200 TB的数据,进行搜索日志分析和网页数据挖掘工作;淘宝的Hadoop系统用于存储并处理电子商务交易的相关数据。

2 课程体系改革研究

2.1 课程体系现状

目前,高职院校计算机网络专业类课程大多围绕计算机网络工程和计算机网络开发两条主线,主要课程包括网络基础、路由器及交换机配置与管理、Windows网络服务器配置与管理以及动态网站开发相关技术等。这些课程内容传统,课程内容严重同质化,教学内容已不能满足大数据时代人才培养的要求,这些将直接影响学生的理论实践能力和就业机会。

大数据、互联网+、物联网及云计算技术的发展和应用给高职计算机网络专业人才培养带来了新的要求与挑战,与市场需求存在脱节现象。计算机网络专业应紧跟大数据、云计算等先进技术的步伐,不断进行专业课程的创新性研究,重视实践类课程和教材的研发,适时调整人才培养目标和专业教学计划,以期满足工作岗位的实际要求。

2.2 研究思路

计算机网络专业经过多年的发展,其课程体系比较成熟,形成了各自的特色教学。因此,本文的研究内容是对原有课程体系的补充和完善。

2.2.1 有针对性的进一步优化传统的专业职业技能课程

传统的专业职业技能课程已经比较成熟,经过了实践的考验,也已得到了学生的认可。尽管如此,还要有针对性的进一步优化,使得课程体系的理实比达到更优,提升课程教学实施的效果。

2.2.2 采用增加模式,补充完善课程体系

基于大数据和云计算技术研发新的职业技能课程,充实现有的课程体系。大数据和云计算紧密相联,因此要增加云计算和大数据的理论和实践课程。在研发课程的过程中,以岗位需求为导向,以培养技能型人才为目标,合理安排理论教学内容和课时,着重开发实践教学案例和内容,明显区别于本科课程教学设置。

2.2.3 课程体系相互作用,相互促进

网络技术是大数据、云计算技术的基础。因此计算机网络传统课程也是新研发课程的基础。新研发课程既是传统课程的有效实践,又是对传统课程的有效扩展和提升。

2.3 具体内容

由于大数据、云计算技术是基于网络的技术,因此,计算机网络专业人才培养具有先决条件。根据以上研究思路,具体方案主要包括强化现有课程体系,增加基础理论课程、完善知识体系,增加实践课程、锻炼岗位能力三个部分。

2.3.1 强化现有课程体系

针对现阶段存在的问题,学校应强化现有课程体系,使学生具有扎实的网络管理能力和一定的网络开发能力。现有的课程体系使学生具备了相关能力。熟悉ISO/OSI互联网模型,并掌握常见的互联网协议如TCP/IP、ARP、OSPF、SSL、DNS、DHCP及HTTP等。能够配置管理Windows和Linux服务器,熟悉使用常见的网络命令,具备远程网络控制学习能力。掌握程序设计语言Java,具备Windows和Linux下的程序开发能力,包括编写shell程序。能够配置交换机和路由器,具备组建局域网的能力。熟悉信息安全、系统安全及网络安全攻防技术。

2.3.2 增加基础理论课程,完善知识体系

针对人才需求,增加大数据、云计算等基础理论课程,完善知识体系。虽然大数据、云计算等课程教学的最终目的是培养实践技能,但基础理论仍非常重要,主要包括熟悉大数据的基础概念和常见技术架构;熟悉云计算原理和架构,并了解虚拟化技术如KVM;熟悉分布式系统和分布式计算原理;了解大数据、云计算的最新应用。

2.3.3 增加实践课程,锻炼岗位能力

在课程体系设置中,实践课程比例应超过理论课程。增加大数据、云计算等实践课程,锻炼学生的岗位能力。主要包括主流云平台管理软件的使用,如华为FusionSphere、VMWARE等;分布式系统管理、分布式并行计算以及Map/Reduce编程;Hadoop集群、HBase分布式数据库的构建与管理;Hadoop、HBase等案例实践与应用。

通过以上方法,使得计算机网络专业学生在原有专业基础上,掌握大数据和云计算的原理,具备云平台的管理能力,并能基于Hadoop等云计算平台实现大数据程序,对大数据进行计算分析。

2.4 Hadoop课程实施

通过以上分析可知,增加的课程内容主要是大数据、云计算相关课程,最终采用Hadoop云计算平台相关技术实现大数据的存储、计算与分析。通过理论教学,使得学生深入了解掌握大数据技术、云计算原理及Hadoop架构。通过实践教学,使得学生能够掌握Hadoop集群的配置与管理,并且能够基于Hadoop实现大数据程序设计,使得学生具备基本的大数据处理能力。因此Hadoop课程是核心课程。

2.4.1 Hadoop原理

Hadoop是把大数据集分发到计算集群中各个节点上共同处理以实现大数据的快速处理。用户无需了解分布式底层细节就可开发分布式程序,充分利用集群的威力进行高速运算和存储。Hadoop最核心的设计是HDFS文件系统和MapReduce编程模型。HDFS为海量数据提供存储,而MapReduce则为海量数据提供了计算。如图1所示,Hadoop运行的基本过程如下[4,5]:

(1)客户端可以将文件上传至HDFS文件系统,NameNode则会根据文件大小和Block大小配置将文件的物理属性分成若干个Block文件块,并分布式存储至DataNode数据节点,同时将块存储信息保存至NameNode节点,以方便文件进行资源管理。

(2)文件上传完成后,客户端提交具体Job任务至Hadoop集群,各DataNode节点根据任务要求可以读取相应的文件Split,并完成Map和Reduce计算任务,将结果作为输出文件传输至HDFS文件系统。

(3)在任务执行过程中,可以通过JobTracker、TaskTracker及ResourceManager监控任务的执行情况和资源消耗信息等。

2.4.2 Hadoop教学平台配置与部署

Hadoop教学平台需配置、部署一些部件。基于现有实验室的计算机和网络环境,网络服务器系统采用Linux Ubuntu,构建Hadoop集群网络。基于Cloudera Hadoop开源框架实现Hadoop教学平台。

2.4.3 Hadoop分布式文件存储及大数据处理实现

Hadoop分布式文件存储及大数据处理实现包括:HDFS文件系统的使用;HBase的使用;MapReducer程序实现;大数据案例分析与实现。

3 结 语

本文分析了大数据背景下高职计算机网络专业的培养目标和课程体系的改革思路,在优化计算机网络专业传统课程的基础上,增加大数据、云计算等相关课程,并以Hadoop课程的具体教学实施来培养学生的实践能力,使得学生能够紧跟大数据、云计算的技术步伐,满足工作岗位的要求。

参考文献

[1]赵伟艇,夏栋梁.基于岗位能力培养的云计算课程群知识体系构建研究[J].电脑知识与技术,2016,12(2):167-169.

[2]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统仿真学报,2013(S1):142-146.

[3]孟小峰,慈祥.大数据管理概念技术与挑战[J].计算机研究与发展,2013,50(1):146-169.

[4]王铮.基于Hadoop的分布式系统研究与应用[D].长春:吉林大学,2014.

[5]陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学,2013,35(10):25-35.

[6]曾文英,吴积军,曾文权,等.基于云计算的IT课程体系改革[J].计算机教育,2014(17):40-44.

[7]鲍爱华,陈卫卫,刘鹏,等.云计算课程内容体系的建设与实践[J].计算机工程与科学,2014,36(A02):42-45.

第6篇:云计算与分布式技术范文

【关键词】云计算 可靠服务 军工科研单位

一、引言

云计算是一种基于网络的新型计算模式,它具有易管理、易扩展易储存以及分布式计算等优势。从原理上来说,云计算将海量数据集中在分布式服务器端,从而形成了“云”,用户再向“云”发送请求,然后在云端完成计算。云计算是一种全新的C/S模型,它与传统的网格计算最大的区别在于调度资源模式的不同。

由于网格计算需要以计算为中心,那么对于数据传输的要求是非常高的,阻碍了网格计算的发展,而云计算则摆脱了海量数据传输的束缚。因此,云计算必将成为未来信息技术的发展趋势。目前,我国军工科研事业发展迅速,如何借助云计算实现更大的发展,从而形成集约化与规模化发展,是我们面临的一个巨大的挑战。

二、云计算的技术特征

目前,云计算技术得到了广泛的研究与应用,其技术特点也是非常明显的,主要体现在以下几点:

(一)编程模型技术。

该技术的研发初衷就是为了满足有特殊要求的云端用户,使其能够自由地组织云端的各种资源,完成云端的所有计算操作。编程模型技术是在Map-Reduce编程模型上发展而来的,该模型具有较强的容错能力。将其运用在云计算中,可以降低客户端的压力,客户端不需要对调度与分配以及数据分块进行处理,全部交给节点通讯进行管理,提高了客户端的执行效率。

(二)数据库管理技术。

数据库管理技术是为了满足高效数据定位以及大规模数据管理而产生的技术。它主要是基于对结构化数据进行管理而设计的一套数据存储系统。通过使用Big-Table对数据进行操作与访问,提高了数据操作的效率,其基本构成元素有记录板、时间戳、行、列等,其模型如图1所示。

(三)数据存储技术。

云计算中的所有分布式存储都是利用数据存储技术实现的,它保证了数据的反馈高效性、传输有效性以及存储安全性等。目前比较流行的技术代表有HDPS(Hadoop Distributed File System)和GFS(Google File System)。

GFS是Google公司开发的一种管理大型分布式数据密集型计算的可扩展的分布式文件系统,它可以为用户提供大量的高效数据服务。其基本存储流程如图2所示。

三、云计算在军工科研单位中的应用优势

(一)监控与集中管理的优势。

在云计算中,要实现对数据的监控与集中管理是件非常容易的事情。在数据中心单元中,使用的是安全控制、软件部署、负载均衡以及资源分配,这样就实现了对数据的统一管理。此外,利用网络节点中的定时检测反馈,可以轻松实现对不同终端的访问监控,满足了军工科研单位的实际需求。

(二)安全性的优势。

云计算技术最大的特点就是具备了高安全、高可靠的数据存储中心。所有的终端用户不必担心病毒入侵以及数据丢失等问题。在云计算的分支中,云安全通过接入到“云”中的可信终端进行监控与记录,有效地阻止了恶意程序与木马的入侵,满足了军工科研单位对数据安全性的要求。

(三)效率与成本的优势。

目前,我国军队的装备科研水平不断提高,每个子单位都有属于自己的数据、软件以及硬件等。在传统的数据存储中,使用的都是本地存储的方式,那么对于软件的升级来说,这个成本是巨大的。而云计算技术对于终端的设备要求较低,并且大部分计算都在云端完成,提高了资源的共享程度,降低了软件升级的成本。

云计算利用权限授予和网络连接,为个人或者科研单位提供数据处理与计算服务,极大程度地提高了军工科研单位的工作效率,降低了项目的成本。

四、云计算技术的不足

云计算技术的发展前景是非常诱人的,但是作为一项新兴技术,它仍处于不断发展之中,还是存在一些技术问题的。首先,目前的云计算技术没有统一的技术标准,这样无法未来的发展进行科学地预测,不利于军工科研单位的长久发展;其次,虽然云计算相对于传统的网格计算具有更高的安全性,但是它也不是绝对的安全,比如云端的内部结构安全以及访问权限安全等。

综上可知,在引入云计算技术的同时,对于军工科研单位来说,还是要充分分析技术本身存在的不足与缺陷。

五、实例研究

云计算为军工科研单位提供了巨大的发展空间,使得我国军队信息化建设水平有了大幅度提高。首先,在部队的长期发展过程中,购买了大量的武器装备,但是随着技术的进步,这些装备逐渐老化。那么,以云计算为技术基础,对我国军队现有装备和资源进行整合,把不同的硬件资源整合成一个虚拟的源池,不仅可以为各级部队带来技术便利,同时还可以获取云计算带来的超值服务;其次,将传统的GIS与云计算技术进行整合,可以高效地处理海浪战场地理数据,保证了系统的稳定性和高效性为军队提供了演习数据支持;最后,建立基于云数据挖掘的平台,提高部队在海量数据中挖掘知识的能力,从而为军队发展提供决策支持。

六、结束语

虽然云计算还存在诸多的不足,但是还是为我国军工科研单位的信息化建设带来了机遇。尤其是云计算在数据管理、可扩展、海量存储以及分布式计算方面的优势,提供了比传统网络应用技术更优越的服务,受到了军工科研单位领导的高度重视。云计算技术的出现,标志着大数据以及超级计算机时代的到来,它将网络应用提升到了一个新的台阶,发挥出了计算机超强的处理能力。随着我国军工科研单位信息化建设水平的不断提高,云计算必将成为未来装备科研领域的主流趋势。

参考文献:

[1]刘晓乐;计算机云计算及其实现技术分析[J];电子科技;2009年12期

[2]陈岩,戴伟;云计算在军队信息化建设中的应用[J];四川兵工学报;2010年09期

[3]杨文潇;谈军队信息化过程中存在的问题和对策[J];硅谷;2008年02期

[4]丛友贵;加速构建军队信息安全保障体系[J];信息安全与通信保密;2002年11期

第7篇:云计算与分布式技术范文

关键词:云计算 虚拟化 体系构架

中图分类号:TP393.03 文献标识码:A 文章编号:1007-9416(2016)10-0232-01

1 引言

近年来,随着新一代大规模互联网应用的快速发展,其快速的业务增长速度以及对数据存储量的较高要求催生了“云计算”这一构想。云计算最早是由Google、Amazon等公司在2006年提出的[1]。计算机资源服务化是其最重要的表现形式,它为用户屏蔽了数据中心管理、大规模数据处理、应用程序部署等问题。用户可以根据自身实时业务量购买或者释放资源,有效降低了运营成本。

2 云计算体系架构

根据实际应用可以把云计算模型分为部署模型和服务模型两类。

云计算部署模型包括公有云、私有云和混合云三种[2]。公有云主要服务于小型机构,由云计算服务商提供相关基础设施;私有云则服务于某一特定的数据较庞大的行业机构比如银行等,由相应的大、中型机构内部提供云计算基础设备;混合云主要提供接口服务以便云与云之间进行联系。

云计算服务模型主要有软件即服务、平台即服务、基础设施即服务三个层次。如图1所示。所谓软件即服务主要是提供用户云计算服务商的相关基础设施,Google的Apps 就属于软件即服务;平台即服务提供云计算创建和定制应用的服务;基础设施即服务提供云计算的计算资源,用户可以根据自己的实际需求运行部署相关应用软件和操作系统。

3 云计算的关键技术

3.1 实现云计算的两种关键基础技术

3.1.1 虚拟化

虚拟化技术是云计算的基础,它在构建一个逻辑层的基础上将硬件服务器虚拟化成若干虚拟系统,将物理资源与用户使用分开为上层的云计算应用提供基础架构。虚拟化屏蔽了底层的复杂性,用户可以以最优的方式自主选择拆分、组合资源,实现IT资源的动态分配、灵活调度、跨域共享,为IT资源的弹提供了强大的基础[3]。虚拟化技术不仅可以实现底层硬件资源如PC机,存储器,服务器,网络等的虚拟化,也可以对操作系统、应用系统等进行虚拟。

3.1.2 分布式计算

分布式计算是除虚拟化之外的云计算的另一项重要支撑技术,它是与集中式计算相对的一种计算方法。简单来讲,分布式计算就是把一个大的计算项目分解成很多小任务,由若干台不同的计算资源分别进行处理,然后再将计算结果上传统一合并处理。分布式计算能够有效解决成本、效率和扩展性之间的平衡。近年来,随着大数据概念的兴起,很多大型的计算项目需要非常巨大的计算能力,使用集中式计算,需要耗费相当长的时间,效率低下,这就为分布式计算的提供了十分广阔的应用前景[5]。在云计算服务模型的软件即服务和平台即服务领域有着不可替代的地位。

3.2 云计算技术最新演进

云计算技术当前的最新发展前沿是SDX,即软件定义一切,它通过把计算机资源池化、封装、隔离、服务化等手段,是用户可以自由的使用计算资源,它是云计算向纵深演化的结果。可以说SDX集中了分布式计算与虚拟化,它使人们可以在分布的时间空间下突破物理资源的时空限定,在虚拟世界更高效更自由得使用资源,对于企业更好的使用分布式资源而言是一种全新且重大的变革。目前SDN即软件定义网络、SDS即软件定义存储、SDDC即软件定义数据中心等概念已经相当成熟并且产品化。其中SDN是目前网络通信领域最重要的发展方向之一,它通过软件技术方法实现人们对资源使用与物理资源本身进行切割和解除绑定,从而实现人们利用物理资源的自由。

4 结语

云计算作为一种新兴的信息技术发展迅速。在未来10 年以内,一些新的技术如大数据、物联网、3D打印、可穿戴设备等将会逐渐普及。一场新的信息技术革命正在降临,而云计算是此次信息技术革命当之无愧的核心。此次信息技术革命的革命性意义在于,改变了人类利用机器智能的方式,将拥有机器智能升级为使用机器智能,而云计算在人们使用机器智能方面发挥了关键作用,是它让计算资源变得能够连续分发并无处不在,可以说云计算带来了信息技术领域颠覆性的变化。

参考文献

[1]陈益.基于云计算架构的数字图书馆特点探析[J].内幕古科技与经济,2014.

[2]杨青峰.信息化2.0+:云计算时代的信息化体系[M].北京:电子工业出版社,2013.

[3]冉旭,钟鸣,程放,许勇,刘佳。云计算安全防护体系研究[J].信息通信,2013,(01):81-82.

[4]刘彦.云计算安全风险与对策分析[J].硅谷,2013,(02):132+70.

[5]大数据时代的云计算安全征文通知[J].信息网络安全,2013,(03):28.

第8篇:云计算与分布式技术范文

随着网络技术的急速发展,云计算已经成为目前技术发展的主旋律,云计算作为一种新型的资源,加强利用可以大大的提高对数据的处理和存储的安全性,并将其应用于分布存储的技术之中,可以极大的提高分布存储的高效性和实用性。本文将从在云计算环境下分布存储技术的现状开始,对云计算环境下的分布存储技术的结构以及关键技术进行具体分析。

【关键词】云计算 分布存储 关键技术

在如今信息技术与科学技术不断发展的大环境下,云计算作为一种新型的应用手段,在全球的范围内都在发挥着至关重要的作用,但正是因为云计算的数据存储量非常的大,会经常出现数据上的各种问题,这样就在很大程度上影响和阻碍了云计算的使用及推广,因此对云计算环境下的分布存储的关键技术进行分析具有极大的现实意义。

1云计算环境下分布存储技术的结构

确保云计算正常运行的核心基础便是数据中心了,主要是包含软件与硬件两个部分。在云计算的环境之下,软件主要是指在数据中心中提供的服务和所需要安装的程序;硬件则是指数据中心的基础设施,主要包含了计算机的设备与支撑系统。云计算中如果想有可靠的数据和高效的存储都与数据中心的节点结构密不可分,因此,通过对数据中心的路由转发功能的节点类型的不同进行分类,大抵可以将云计算环境下的分布存储技术的结构分为三大类。

1.1 服务器为核心的结构

以服务器为核心的这种结构是利用网线将每个服务器中安装的多个网卡进行相互连接的结构。这种结构中,服务器即需要对数据进行处理和存储,还要将数据包的转发功能完全负责。这种以服务器为核心的结构相对来说在线路的连接以及结构的组成方面较为简单,不存在交换机这种硬件设备,可以很好的使服务器与底层的网络进行交互,便于开发高效实用的路由算法。但是此种结构也存在着一定的弊端,比如链路稍有冗余,服务器中占用的计算资源较大,服务器的负载压力加大从而导致服务器的整体计算效率大大降低,这样,便会带来成本增加以及性能损失等问题。

1.2 交换机为核心的结构

传统的数据存储都是通过交换机进行的,因此在云计算的环境尚未盛行之前,诸多的用户都是采用交换机作为彼此数据存储的中心,也就是说用户是将网络体系与数据中心联系在一起,而二者的纽带便是交换机。这种以交换机作为核心结构的存储技术,主要是采用的树形结构,主要包含的是聚合层、边缘层和核心层三个部分。树形结构的特点主要是简单的操作方法、连接较为容易、扩展性强等。而这种以交换机为核心的结构也存在着一定的弊端,比如有限的存储容量、较落后的存储技术等,但是在数据存储过程中,能够将操作的灵活性和存储的高效率等方面进行优化处理,将会有很大的提升空间。

1.3 服务器与交换机相结合的结构

正是由于单一的以服务器为核心的结构或者是单一的以交换机为核心的结构都或多或少的存在诸多的弊端,因此可以将两者结合起来,成为混合的结构模式,扬长避短。这种混合的结构模式的优点主要可以从网络结构方面、路由费用方面、可扩展性方面以及构建成本方面有所体现。在网络结构方面混合的结构可以同时采用由交换机和服务器提供数据的路由转发的功能,使网络结构更加的自由和灵活;在可扩展性方面来看,这种混合结构是受每个服务器安装的网卡数目限制的,数据中心的节点规模也是有限的;成本构建方面则是因为混合结构同时能够结合交换机结构和服务器结构的优点,会使的具备同样性能的条件下降低所需的成本。

2 数据容错技术

在分布式存储的研究领域一项关键技术便是数据容错技术,良好的容错技术对于提高系统的可用性和可靠性以及数据的访问效率等都能大大的提高。数据的容错技术往往是通过增加数据冗余来实现,因为冗余的数据能够确保当数据失效或丢失之后查找的到,正是因为出现了太多的数据冗余,也同时加大了存储资源的消耗,那么,如何既能保证容错的同时还能够降低成本来提高存储资源的利用率,目前,最为常用的便是纠删码容错技术以及复制容错技术。

2.1 纠删码容错技术

纠删码容错技术是一类基于信道传输的编码技术,当多个数据块丢失可以容忍,并将其引入到分布式存储的领域,纠删码容错技术可以减少存储的空间,基于编码的这种容错技术可以利用多个数据对象进行编码,生成编码的数据对象,出现巨大的存储可以实现对完全复制数据的降低,但是却在下载数据量的方面大于失效的数据大小,但是这种纠删码的容错技术却有着计算的开销大、修复的成本好的弊端。

2.2 复制容错技术

复制容错技术是指在一个数据对象中创建出多个相同的模块,将其分布到不同的存储节点之中,即使当某个数据对象失效之后,仍然可以利用其它有效的数据模块来获得相同的数据。复制容错技术主要包括两个方面,即:数据复制策略以及数据组织结构。复制容错技术的优点主要是方面实现、简单直观、读取效率高,在目前的云计算环境中深受用户的喜爱,并且得到了广泛的应用,但同时也存在一定问题,就是因为每个数据对象都需要建立一定的数据模块,所以对于存储空间有着较高的要求。

3 节能技术

在云计算的环境下,数据存储是重要的部分,但是同时存储系统的消耗占据到了数据中心的40%以上,所以一定要考虑节能技术,主要从软件节能和硬件节能两个方面入手。软件节能技术主要是指确保系统性能的基础上,降低存储数据中心的能耗,包括节点管理和数据管理;硬件节能技术主要有两个方面,一是从数据中心进行考虑,将高性能和高能耗的硬件设备被低性能和低能耗的设备所替换,另一种是从计算机整体部件考虑,采用新型体系结构,实现计算机数据存储能耗的降低。

4 结束语

总之,在这样科学技术不断发展的今天,云计算已经作为一种新型的计算模式正在全世界的范围内改变着真个数据存储的环境,云计算可以将庞大的数据节点与网络设备有效的进行连接,从而形成一个或一些大规模的数据中心,为用户提供基本服务来满足不同的需求。但是尽管云计算存储数据的规模很大,但是也存在着数据失效等问题,本文则对云计算环境下的数据存储的技术进行分析,希望能够有一定的现实意义。

参考文献

[1]王意洁,孙伟东等.云计算环境下的分布存储关键技术[J].软件学报,2012(04).

[2]宋国平,邱阳.云计算环境下的分布存储关键技术[J].吉林广播电视大学学报,2014(09).

第9篇:云计算与分布式技术范文

【关键词】云计算;关键技术;应用实例

一、云计算的概念

云计算(Cloud Computing)是由分布式计算(Distributed Computing)、并行处理(Parallel Computing)、网格计算(Grid Computing)发展来的,是一种新兴的商业计算模型。目前,对于云计算的认识在不断的发展变化,云计算没仍没有普遍一致的定义。

中国网格计算、云计算专家刘鹏给出如下定义:“云计算将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务”。

狭义的云计算指的是厂商通过分布式计算和虚拟化技术搭建数据中心或超级计算机,以免费或按需租用方式向技术开发者或者企业客户提供数据存储、分析以及科学计算等服务,比如亚马逊数据仓库出租生意。

二、云计算的核心技术

云计算系统运用了许多技术,其中以编程模型、数据管理技术、数据存储技术、虚拟化技术、云计算平台管理技术最为关键。

(一)编程模型

MapReduce是Google开发的java、Python、C++编程模型,它是一种简化的分布式编程模型和高效的任务调度模型,用于大规模数据集(大于1TB)的并行运算。严格的编程模型使云计算环境下的编程十分简单。MapReduce模式的思想是将要执行的问题分解成Map(映射)和Reduce(化简)的方式,先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理,达到分布式运算的效果,再通过Reduce程序将结果汇整输出。

(二)海量数据分布存储技术

云计算系统由大量服务器组成,同时为大量用户服务,因此云计算系统采用分布式存储的方式存储数据,用冗余存储的方式保证数据的可靠性。云计算系统中广泛使用的数据存储系统是Google的GFS和Hadoop团队开发的GFS的开源实现HDFS。

GFS即Google文件系统(Google File System),是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。GFS的设计思想不同于传统的文件系统,是针对大规模数据处理和Google应用特性而设计的。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。

(三)海量数据管理技术

云计算需要对分布的、海量的数据进行处理、分析,因此,数据管理技术必需能够高效的管理大量的数据。云计算系统中的数据管理技术主要是Google的BT(BigTable)数据管理技术和Hadoop团队开发的开源数据管理模块HBase。BT是建立在GFS,Scheduler,Lock Service和MapReduce之上的一个大型的分布式数据库,与传统的关系数据库不同,它把所有数据都作为对象来处理,形成一个巨大的表格,用来分布存储大规模结构化数据。

Google的很多项目使用BT来存储数据,包括网页查询,Google earth和Google金融。这些应用程序对BT的要求各不相同:数据大小(从URL到网页到卫星图象)不同,反应速度不同(从后端的大批处理到实时数据服务)。对于不同的要求,BT都成功的提供了灵活高效的服务。

(四)虚拟化技术

通过虚拟化技术可实现软件应用与底层硬件相隔离,它包括将单个资源划分成多个虚拟资源的裂分模式,也包括将多个资源整合成一个虚拟资源的聚合模式。虚拟化技术根据对象可分成存储虚拟化、计算虚拟化、网络虚拟化等,计算虚拟化又分为系统级虚拟化、应用级虚拟化和桌面虚拟化。

(五)云计算平台管理技术

云计算资源规模庞大,服务器数量众多并分布在不同的地点,同时运行着数百种应用,如何有效的管理这些服务器,保证整个系统提供不间断的服务是巨大的挑战。

云计算系统的平台管理技术能够使大量的服务器协同工作,方便的进行业务部署和开通,快速发现和恢复系统故障,通过自动化、智能化的手段实现大规模系统的可靠运营。

三、云计算的主要服务形式和典型应用

云计算还处于萌芽阶段,有庞杂的各类厂商在开发不同的云计算服务。云计算的表现形式多种多样,简单的云计算在人们日常网络应用中随处可见,比如腾讯QQ空间提供的在线制作Flash图片,Google的搜索服务,Google Doc,Google Apps等。目前,云计算的主要服务形式有:SaaS(Software as a Service),PaaS(Platform as a Service),IaaS(Infrastructure as a Service)。

(一)软件即服务(SaaS)

SaaS服务提供商将应用软件统一部署在自己的服务器上,用户根据需求通过互联网向厂商订购应用软件服务,服务提供商根据客户所定软件的数量、时间的长短等因素收费,并且通过浏览器向客户提供软件的模式。这种服务模式的优势是,由服务提供商维护和管理软件、提供软件运行的硬件设施,用户只需拥有能够接入互联网的终端,即可随时随地使用软件。这种模式下,客户不再像传统模式那样花费大量资金在硬件、软件、维护人员,只需要支出一定的租赁服务费用,通过互联网就可以享受到相应的硬件、软件和维护服务,这是网络应用最具效益的营运模式。对于小型企业来说,SaaS是采用先进技术的最好途径。

以企业管理软件来说,SaaS模式的云计算ERP可以让客户根据并发用户数量、所用功能多少、数据存储容量、使用时间长短等因素不同组合按需支付服务费用,既不用支付软件许可费用,也不需要支付采购服务器等硬件设备费用,也不需要支付购买操作系统、数据库等平台软件费用,也不用承担软件项目定制、开发、实施费用,也不需要承担IT维护部门开支费用,实际上云计算ERP正是继承了开源ERP免许可费用只收服务费用的最重要特征,是突出了服务的ERP产品。

目前,是提供这类服务最有名的公司,Google Doc,Google Apps和Zoho Office也属于这类服务。

(二)平台即服务(PaaS)

把开发环境作为一种服务来提供。这是一种分布式平台服务,厂商提供开发环境、服务器平台、硬件资源等服务给客户,用户在其平台基础上定制开发自己的应用程序并通过其服务器和互联网传递给其他客户。PaaS能够给企业或个人提供研发的中间件平台,提供应用程序开发、数据库、应用服务器、试验、托管及应用服务。

Google App Engine,Salesforce的平台,八百客的800APP是PaaS的代表产品。以Google App Engine为例,它是一个由python应用服务器群、BigTable数据库及GFS组成的平台,为开发者提供一体化主机服务器及可自动升级的在线应用服务。用户编写应用程序并在Google的基础架构上运行就可以为互联网用户提供服务,Google提供应用运行及维护所需要的平台资源。

(三)基础设施服务(IaaS)

IaaS即把厂商的由多台服务器组成的“云端”基础设施,作为计量服务提供给客户。它将内存、I/O设备、存储和计算能力整合成一个虚拟的资源池为整个业界提供所需要的存储资源和虚拟化服务器等服务。这是一种托管型硬件方式,用户付费使用厂商的硬件设施。例如Amazon Web服务(AWS),IBM的BlueCloud等均是将基础设施作为服务出租。

IaaS的优点是用户只需低成本硬件,按需租用相应计算能力和存储能力,大大降低了用户在硬件上的开销。

目前,以Google云应用最具代表性,例如GoogleDocs、GoogleApps、Google-sites,云计算应用平台GoogleApp Engine。

GoogleDocs是最早推出的云计算应用,是软件即服务思想的典型应用。它是类似于微软的Office的在线办公软件。它可以处理和搜索文档、表格、幻灯片,并可以通过网络和他人分享并设置共享权限。Google文件是基于网络的文字处理和电子表格程序,可提高协作效率,多名用户可同时在线更改文件,并可以实时看到其他成员所作的编辑。用户只需一台接入互联网的计算机和可以使用Google文件的标准浏览器即可在线创建和管理、实时协作、权限管理、共享、搜索能力、修订历史记录功能,以及随时随地访问的特性,大大提高了文件操作的共享和协同能力。

GoogleAPPs是Google企业应用套件,使用户能够处理日渐庞大的信息量,随时随地保持联系,并可与其他同事、客户和合作伙伴进行沟通、共享和协作。它集成了Cmail、GoogleTalk、Google日历、GoogleDocs、以及最新推出的云应用GoogleSites、API扩展以及一些管理功能,包含了通信、协作与、管理服务三方面的应用,并且拥有着云计算的特性,能够更好的实现随时随地协同共享。另外,它还具有低成本的优势和托管的便捷,用户无需自己维护和管理搭建的协同共享平台。

Googlesites是Google最新的云计算应用,作为GoogleApps的一个组件出现。它是一个侧重于团队协作的网站编辑工具,可利用它创建一个各种类型的团队网站,通过Googlesites可将所有类型的文件包括文档、视频、相片、日历及附件等与好友、团队或整个网络分享。

Google AppEngine是Google在2008年4月的一个平台,使用户可以在Google的基础架构上开发和部署运行自己的应用程序。目前,Google AppEngine支持Python语言和Java语言,每个Google AppEngine应用程序可以使用达到500MB的持久存储空间及可支持每月500万综合浏览量的带宽和CPU。并且,Google AppEngine应用程序易于构建和维护,并可根据用户的访问量和数据存储需要的增长轻松扩展。同时,用户的应用可以和Google的应用程序集成,Google AppEngine还推出了软件开发套件(SDK),包括可以在用户本地计算机上模拟所有Google AppEngine服务的网络服务器应用程序。

参考文献

[1]雷万云.云计算——技术、平台及应用案例[M].清华大学出版社,2011.

相关热门标签