公务员期刊网 论文中心 正文

移动视频网络发展阶段对比分析

移动视频网络发展阶段对比分析

一、第一阶段:C/S移动视频网络

上个世纪90年代初期,移动视频网络开始逐步发展起来.一方面,无线网络(例如GSM、DECT、WirelessLAN)开始商业化部署;另一方面,移动终端(例如笔记本电脑)开始生产销售.用户逐渐通过移动终端访问视频服务.但由于接入网技术、移动终端能力以及移动视频业务使用成本等方面的限制,这时的移动视频网络仅能将低码率的视频业务提供给小规模的移动用户.

1C/S移动视频网络架构

C/S移动视频网络架构是移动视频网络发展初期所采用的架构,如图2所示.这种网络架构包括视频源,移动视频网关,无线接入点以及移动终端.视频源隶属于内容提供商,负责产生原始编码的视频内容,并将内容下发给移动终端移动视频网关位于移动网络的边缘,负责将通过Internet传送过来的视频数据重新压缩编码,发送给移动网络,并由其转化为无线信号;无线接入点负责将无线信号发送给移动用户;移动终端含有特定的视频解码器,负责将接收到的视频无线信号解码后播放给移动用户.该网络架构的主要目标是减轻视频源的负载,为尽可能多的移动用户提供视频业务.归纳起来,C/S移动视频网络的核心技术主要有移动IP技术,移动IP层组播技术,可伸缩视频编码技术,以及缓存技术.这些技术也是后续阶段移动视频网络的基础.

2C/S移动视频网络关键技术研究

移动IP技术:为了保证移动终端在移动漫游的过程中能够持续无间断获得移动业务,IETF提出了移动IP技术[10-13].移动IP技术为每个移动终端设置一个归属;当移动终端在移动漫游的过程中获取数据业务时,移动IP采用发现、注册和隧道封装三项技术为之提供移动性支持,移动终端在不同的网络之间移动时能够保持IP地址不变,从而保证了会话的连续性与一致性.移动IP层组播技术:移动IP层组播技术的提出是为了在移动业务过程中提高网络带宽利用率,从而节省数据发送服务器的资源以及网络资源,它是移动IP技术和IP层组播技术的结合.移动IP协议分为IP组播提出的双向隧道(MIP-BT)和远程加入(MIP-RS)两种基本方式,它们是移动IP组播技术的基础.然而这两种算法都还存在着较大的缺陷,无法较好地解决移动环境中IP组播所面临的新问题(例如管理动态的组成员、建立和维护组播转发树,组成员位置动态变化,外地链路没有支持组播的路由器等问题).为此,IETF和IRTF以移动IP的解决方案为基础,对移动环境中的IP组播问题进行了深入的研究[14-17].这些研究主要集中于对这两种算法中存在的缺陷进行改进,或者对这两种算法加以综合,提高整体性能.例如,RBMoM[14]协议主要寻求在取得最短数据包转发路径和频繁重新建立组播树之间达到折衷,使得组播数据包总是能够以"接近"最优的路径进行转发,并且无须为维护组播树消耗过多的资源.MobiCast[15]引入了分层化的节点移动性管理,将节点移动性与主要的组播转发树分割开来;它主要服务于较小的移动蜂窝网络,具有节省移动终端能耗,提高数据吞吐率,优化无线频谱资源使用等优势.可伸缩视频编码技术:移动网络是一个高度异构且变化的环境,不同的接入网络所支持的传输速率不一致,不同移动终端接入网络的方式以及其处理能力也不一致,并且可用带宽随着环境的变化(例如用户移动的速度,到接入点的距离等)也会产生波动,这时如果仍然保持视恒定的频码率,会大大降低用户的服务体验.可伸缩视频编码技术[18]的提出,能够保证视频编码器提供既有高压缩率,又有良好的容错性和伸缩性的视频码流,以适应不同的网络环境和用户终端的需求;它将视频编码成低速率的基本层码流和高速率的增强层码流,并对不同层次的码流给予不同等级的保护策略,从而能够在保证移动用户最低等级服务质量的同时,根据其网络环境和处理能力动态调整其服务质量,从而有效降低网络负载并提高其利用率.缓存技术:在没有部署缓存的情况下,视频网络的服务能力仅取决于视频源的处理能力及其出口带宽.缓存能够将本地最近访问过的或者最经常访问的视频内容缓存在服务器(例如移动视频网关)上;当有用户请求这些视频内容的时候,可以直接由服务器提供服务,从而减轻了视频源的压力.缓存技术包括部署策略,缓存替换策略等方面[19,20].

二、第二阶段:Overlay移动视频网络

从本世纪初期开始,移动视频网络步入了快速发展阶段.首先,无线宽带网络开始商用化:2001年10月,NTTDoCoMo正式商用全球第一个W-CDMA网络拉开了3G时代的序幕;与此同时,Wi-Fi、WiMax等无线接入技术也逐步发展起来,用户可以通过拥有更高接入带宽的无线网络访问视频业务.其次,移动终端的种类越来越多,处理能力越来越强,智能化越来越高,移动用户期望通过这些移动终端享受更高码率的视频业务.最后,移动数据业务和移动终端的成本大幅下降,越来越多的用户能够负担得起移动视频业务,使得移动视频用户规模扩大.截止2004年全球移动互联网用户已经超过了1亿[21].此时,C/S移动视频网络的局限性逐渐体现出来:C/S模式由单一服务器提供视频源,存在单点失效(Singlepointoffailure)的问题,并且视频源服务器成为整个视频网络的性能瓶颈,整个视频网络可扩展性差,运行成本极高,无法满足大规模移动用户的高质量视频服务需求.为此,学者们提出了基于覆盖网架构的移动视频网络.从构成覆盖网节点的种类来看,覆盖移动视频网络可分为内容分发网络(ContentDeliv-eryNetwork,CDN)[2,3]移动视频网络和对等网络(Peer-to-peer,P2P)[4,5]移动视频网络.

1CDN移动视频网络架构

CDN移动视频网络是对C/S移动视频网络中视频源服务器处理能力和网络传输能力的增强.图3表示了一个典型的CDN网移动视频网络的架构.与C/S移动视频网络不同,它在网络的边缘部署多个(surrogate)服务器,并将视频源服务器上的内容到各服务器上,这些服务器之间有机协同工作为移动用户提供视频业务;它能够将用户对内容的请求重定向到最近的服务器上,从而能够从整体上提高服务响应速度.它主要包括请求路由技术,部署技术,视频分发与缓存技术,以及视频会话切换技术.

2CDN移动视频网络关键技术研究

请求路由技术:请求路由技术[22,23]是CDN移动视频网络中最为核心的技术,它综合考虑一系列性能指标,将移动用户的请求重定向到一台最合适的,服务性能最好的服务器上.通常,请求路由技术主要包括域名服务器(DNS)重定向和统一资源定位符(URL)重写等两种方式.DNS重定向根据预先设定的准则,如服务器负载、移动用户位置和网络状况来为终端用户动态地指定一台服务器,具有很好的网络适应性,但DNS的查找延迟会导致服务响应时延增加,也使DNS自身成为服务瓶颈;URL重写技术既能在内容前重写,也能在响应用户请求时根据用户位置动态改变,从而能够在一定程度上提高用户体验.例如在Yoshimura等人所提出的MSM-CDN中,用户根据用于描述视频属性及位置的SMIL文件来请求视频内容;MSM-CDN接收到用户请求后根据用户位置,网络状况,服务器缓存状态、负载等因素为用户选择最佳服务器,并通过修改SMIL文件中的视频属性和位置的方式将用户请求定向到最佳服务器[24].部署技术:由于在CDN移动视频网络中,移动用户最终通过服务器来获得视频服务,服务器部署的好坏将直接影响服务成本与服务质量.服务器部署问题从理论上看属于选址问题,文献[25]从数学建模的角度讲服务器选址模型分为基于确定信息的选址模型、基于概率模型的选址模型和基于博弈论的选址模型.Zhou等人从视频网络可扩展性的角度出发,将部署问题建模为最小化平均响应跳数的优化问题[26];Cahill等人将该问题建模成为一个优化目标为用户到服务器连接成本和服务器存储成本之间融合的优化问题[27];Ahuja等人以优化视频网络服务质量为优化目标对该问题进行建模[28];Chekuri等人则从非合作博弈的角度出发对该问题来建模[29].视频分发与缓存技术:在CDN移动视频网络中,推(PUSH)和拉(PULL)是两种最常用的视频分发技术.其中,PUSH主动地将内容分发到服务器,属主动分发技术,视频网络根据用户访问统计信息和预设分发策略主动推送到特定的服务器.PULL是一种被动式的分发技术,用户向视频网络发起用户请求,服务器判断自身是否已缓存该数据;如果没有缓存,则向视频源请求数据,并转发给用户,同时按照一定的策略决定是否缓存该数据.为了进一步减轻视频源负载,Kontothanassis等人提出将服务器构成一个应用层组播(ApplicationLayerMulticasting,ALM)网络来进行覆盖网内的视频内容分发[30].然而由于视频文件一般较大,服务器存储能力有限,并且移动用户不一定会访问完整的视频内容,将完整的视频文件缓存到服务器上会降低其存储空间利用率,并且浪费网络带宽.为此,一些学者提出视频分段缓存技术[58,59].他们预先将视频文件切成小段,并且根据每个小段的本地访问流行度决定是否将其缓存在相应的服务器上,这样能够有效提高缓存命中率,从而提高用户体验.视频会话切换技术:当移动用户从一个位置移动到另一个位置的时候,其最佳服务器可能发生改变.视频会话切换技术可以保证用户在移动的过程中一直能够从最佳服务器获取服务.文献[24]提出将用户最新位置信息包含在简单对象访问协议(SimpleObjectAccessProtocol,SOAP)消息中,并利用它来为移动用户重新选择最佳服务器;文献[31]提出了一种上下文管理系统(ContextManagementSystem,CMS)用于存储服务会话以及移动终端的上下文信息,一旦移动用户进行服务器重新选择之后,新的最佳服务器能够从CMS获得最新的会话上下文信息,从而保证会话从之前间断处继续开始,既能提高用户体验,又能节约带宽资源.

3P2P移动视频网络架构

P2P移动视频网络是C/S移动视频网络向另一个方向上的演化,它则充分利用了移动终端自身的资源及能力来为其他移动终端提供服务,从而降低了对视频源资源的依赖,并且系统服务能力能够随移动终端规模动态增长,具有C/S移动视频网络和CDN移动视频网络所不具备的可扩展性.下页图4表示了一个典型的P2P网移动视频网络的架构.概括起来,P2P移动视频网络包括下面的三个关键技术:视频发现技术,网络拓扑一致性保证技术以及视频分发技术.

4P2P移动视频网络关键技术研究

视频发现技术:在P2P移动视频网络中,移动终端需要从高度动态变化的对等移动终端而非固定不变的服务器获取视频资源,因此有效地视频发现策略能够提升整个视频网络的效率和性能.文献[32]将其分为技术移植和量身定制两大类.其中,技术移植是指将InternetP2P相关技术移植到移动网络环境中,实现移动网络视频资源发现.如文献[33]设计了一种支持移动访问的Gnutella网络.该网络以移动(mobileAgent,MA)为核心设备,它代表移动设备,并以正常主机身份来执行Gnutella协议,但与移动设备以轻量级通信协议实现信息交互.量身定制则完全根据移动环境设计全新的搜索算法,例如文献[34]以接入点为资源索引,实现移动网络视频流的共享与分发;文献[35]则用公交车充当移动P2P网络的超级节点,实现P2P网络中的节点控制功能.在此基础上,提出一种由这些超级节点构建的移动P2P主干网络;文献[36]在Gnutella的洪泛资源发现算法的基础上提出一种类似的移动网络资源查找算法.该算法通过底层MA-NET路由协议来实现P2P网络的多数功能,并利用移动节点控制协议实现MANET层与覆盖成之间的交互.网络拓扑一致性保证技术:网络拓扑一致性问题是指当移动终端位置频繁发生变化时,覆盖层无法保持长久的稳定性,且与底层物理链路不匹配.一部分学者利用对覆盖层的优化设计来解决这个问题:Dabek等人通过引入网络坐标的思想在构建覆盖成的时候尽可能选择在物理上节点的移动终端作为邻居节点[37];Liu等人提出周期性地向终端发送探测消息,并调整其编号,从而即保证了网络架构不变,又降低了平均服务延迟,从而达到逐渐匹配物理网络与覆盖网的目的[38].另一部分学者采用跨层优化的方法来解决这个问题:Wang等人提出了跨层设计模型CLASS,允许非相邻层之间直接进行信令交互,并在协议栈中引入本地信令机制,解决了跨层移动性管理的问题[39];Delmastro提出了跨层的路由协议CrossROAD,在adhoc底层和P2P覆盖层之间增加一个数据共享模块来实现两层之间的交互[40].视频分发技术:由于在P2P移动视频网络中,移动终端存储空间小,并且可用性较低,因此C/S和CDN移动视频网络中的视频分发技术不能直接应用到P2P移动视频网络中来.因此学者们提出了一些解决方案,文献[32]将这些解决方案分成了路由驱动和路由无关两种类型.路由驱动分发策略通过修改底层网络路由协议来提高数据分发效率.Musole-si等人提出了一种可感知环境的自适应路由技术,它采用智能化传输机制,使得部分处于不同网络区域内的移动节点也能够分享数据[41];Repantis等人提出了一种内容驱动的自适应路由及数据分发技术,每个移动终端都为自身所共享的数据提供内容摘要并共享给其他移动终端,从而可以有效提高数据分发速度[42].路由无关分发策略通过对资源进行编码的方式或者一些启发式算法来实现高效的数据分发.Goel等人将Tornado编码应用到移动自组织网数据分发中,它将数据分为多个数据段,接收方只需接收所有特定的数据段即可解码数据[43].Eugster等人则通过模仿传染病毒在人群中的传染模式在MANET中进行数据分发[44].

三、第三阶段:CON移动视频网络

从2006年开始,3G网络在全球范围内大规模部署,大型社交化视频网站(如YouTube,优酷等)纷纷建立,各种明星智能移动终端(如iPhone,iPad,AndroidPhone等)也开始大规模销售,越来越的多用户通过各种移动终端访问视频内容,移动视频网络开始步入爆炸式发展阶段.据统计,2011年移动视频流量占移动网络总流量的比例首次过半,达到56%,预计2015年这一占比将增至三分之二,其年复合增长率高达104%[45].面对如此快速增长的移动视频流量,基于覆盖网的解决方案仍然显得力不从心.一方面,CDN移动视频网络的服务能力等于其服务器的服务容量总和.为了满足用户访问需求,往往需要按照访问峰值来设计和部署服务器,但硬件成本太高,网络的管理、运维成本昂贵等因素都制约了它的发展.另一方面P2P移动视频网络仍有很多技术问题(例如大规模用户情况下的高效数据分发问题,ISP友好问题等)并未得到最终解决;同时出于运营策略的考虑,大部分移动运营商对都不支持P2P网络,因此到目前为止还没有商业化的P2P移动视频网络出现.最后,无论是C/S移动视频网络,还是覆盖移动视频网络,都建立于最初为固定终端所设计的传统互联网之上,它们假设数据源和目的之间存在端到端的路径,任何一对节点之间的最大往返延迟不会太大,并且网络丢包率较小.但不断增长的移动互联网用户数量使得终端的移动性逐渐成为一种常态;无线网络环境的变化、移动终端自身能耗等因素都会导致较高的网络延迟、丢包率,甚至网络不可达.为此,研究者们期望通过下一代面向内容的移动视频网络来满足未来巨大的移动视频业务需求.

1CON移动视频网络架构

CON[6-9]移动视频网络在设计之初引入两个重要的思想.第一个是视频内容的命名与地址分离(SeparationofNa-mingandAddress).一般而言,移动用户并不关心视频是由哪个主机提供的,而更关心的是视频传送过来的速度、质量以及是否安全;通过将视频内容的命名与服务器地址解耦,保证命名的持久性,能够有效提高视频服务的可用性,并且更加灵活的适应上层应用的变化.第二个是网内存储利用(In-networkStorageUtilization)与逐跳(Hop-by-hop)路由.基于摩尔定律,存储开销越来越小,在普通的转发路由器上增加存储功能(本文称之为存储路由器),够能有效降低服务延迟,提高传输效率;当出现由于终端移动而导致视频对象发生迁移或者视频内容暂时不可用等情况,逐跳路由能够比传统的端到端路由提供更高的可靠性.图5表示了一个典型的CON移动视频网络的架构.存储路由器是整个网络架构中最核心的组成部分,它分布于不同的自治域网络内,按照一定的缓存替换策略(例如LRU、LFU等)缓存视频数据,通过检测邻居路由器状态与网络拥塞程度独立决定路由,并且通过ACK应答机制保证视频数据转发的有效性与视频数据自身的可用性.命名解析服务器则负责将视频内容或终端的命名绑定到具体的网络地址,帮助存储路由器完成视频资源定位以及视频数据路由.具体来说,CON移动视频网络的有效视频分发依赖于内容命名,内容定位以及移动感知路由三项关键技术,本文将在下一节中对它们进行详细描述.

2CON移动视频网络关键技术

内容命名技术:在CON移动视频网络中,所有元素(视频内容、移动终端甚至是会话上下文)都被赋予命名.目前,学者们对命名技术的研究主要分成了两类:分级式命名技术[47,48]和平坦式命名技术[49,50].分级式命名技术将内容命名成为类似于WebURL的标识符(例如www.hust.edu.cn/main/video.mp4).这种命名方式能够与现有的基于URL的视频网络相兼容,并且层次化的特性能够通过对内容的聚合(例如,所有用户www.hust.edu.cn前缀命名的内容存储在同一个位置)有效的缓解路由的压力.然而,由于用户需要尽可能持久地根据内容命名来获取内容,内容拥有者的改变,将导致内容与命名的不匹配.为了解决分级式命名技术的不足,平坦式命名技术被提出来,它将所有内容统一命名成为其公共密钥的哈希值(如128位GUID),这种平坦化的命名方式保证了内容的持久性.然而由于这种命名方式无法表示出具体的语义,因此需要额外在人们可读取的(human-readable)命名和内容命名之间提供解析服务.文献[51]对两种命名技术的安全性,可扩展性以及灵活性做出了详细的对比,并指出平坦式命名技术能够更好地抵御DoS攻击,在灵活性方面更胜一筹,但是可扩展性却处于劣势.内容定位(命名解析)技术:在现有Internet架构下,用户只有借助搜索工具(如Google)、门户网站(如Yahoo)查询到资源域名才能获取到某一资源.而在CON移动视频网络中,资源定位将由网络内部的定位机制来完成.当前研究中主要有两种定位方式:基于哈希的分布式方式[52]和基于服务抽象的集中式方式[53,9].分布式方式的核心思想是利用了内容标识符到网络地址的哈希映射来定位内容.例如在Mobility-First[52]项目中,内容者利用哈希函数将某一内容的GUID映射到多个存储路由器,并将<内容GUID,内容存储位置>二元组信息到这些存储路由器上.当用户请求内容时,用户的接入存储路由器根据内容的GUID以及相同的哈希函数找到存储了上述二元组信息且离自己最近的存储路由器,查询到该内容的地址后,再将该地址转发给用户.集中式方式的核心思想是视频搜索服务和DNS服务的整合抽象.在Alicante[53]项目中,内容者在内容时须向一个视频入口服务注册以便于用户查询、访问;在XIA[9]项目中,用户向WEB服务器明确描述连接意图,通过WEB服务器搜索可获得的内容标识符,然后以该内容标识符为目的地址建立连接并享受服务.

移动感知路由技术:传统Internet采用了端到端的路由方式进行通信,它在网络状况良好的固定环境中能够很好地工作,然而在面对恶劣的移动网络环境却面临了巨大的挑战:终端的移动,无线信道的恶化等因素会使得终端暂时不可达,当与终端重新建立连接并分发视频内容时,需要在传输路径上耗费大量延迟,同时浪费了大量的网络资源.CON移动视频网络采用了类似于延迟容忍网络(Delay-TolerantNetwork,DTN)[54-57]的逐跳路由的方式来应对这些挑战:当内容在路由器之间转发时,需要通过ACK应答机制保证转发的有效可靠.在没有收到转发目标的ACK消息时候,源路由器必须一直缓存该内容,以保证内容的高度可用性.当移动终端暂时不可达时,内容可以缓存在用户出现概率最高的位置,一旦移动用户重新接入到网络中,它可以在最短时间获取内容.为了提高通信效率,CON移动视频网络还采用了后期绑定(LateBinding)[46,52]的方式来进行命名解析:在内容被路由到目标移动终端所在的自治域前,仅仅将移动终端命名解析到自治域级别的地址;当内容到达目标移动终端所在的自治域边缘时,再将其命名解析到具体地址.后期绑定能够在组播通信、多宿主通信时有效聚合路由,降低通信开销.

四、总结与展望

从上述移动视频网络三个发展阶段中,可以清晰地看到移动视频网络的架构和关键技术以无线接入技术和终端技术为基础,以用户需求为向导,不断发展和革新.早期移动视频网络出现的时候,数字移动通信的商业化刚刚起步,移动终端还不够成熟,此时移动视频用户数量较少,视频的码率较低,应用类型较为单一.因此,这个时期的视频网络主要表现为提高开始、最后一公里的带宽利用率.伴随着3G网络的商业化,移动视频网络的发展进入了第二个阶段,这一阶段用户规模大规模增加,用户服务质量需求也有所提高,然而传统的Internet端到端通信的效率极为低下,大大降低了用户体验.因此,这个阶段的视频网络集中在提高中间一公里传输效率的问题上.移动互联网的迅猛发展促使移动视频网络进入的第三个发展阶段.这时移动网络的接入速率已经可以和固定网络媲美,移动用户规模以及视频内容都呈现出爆炸式增长,为固定网络通信所设计的Internet已经不能够满足移动用户随时随地享受高质量视频业务的需求.此时,学者们期望借助于面向内容的未来网络来满足用户这一需求.表详细对比了视频网络三个发展阶段的特征以及关键技术.不难看出,在充分利用网络资源、提高服务能力、降低内容分发成本的同时,移动视频网络逐步融入到人们生活中.伴随着网络技术的不断发展,视频网络呈现出三大发展趋势.社会化:社交网络的出现使得人们之间的联系更加紧密,它逐步承担人们生活的重要角色,移动视频网络将面临着社会化变革,如社交化视频应用趋势.泛在化:射频、红外感应等技术的快速发展使人们能够将任何物品与互联网相连,移动视频网络将扩展到互联网范围之外,人们将享受"随物"视频服务.融合化:电信网、广播电视网、互联网的逐步融合,使得移动视频网络与传统电视网络的界限越来越模糊.一个能够为当前以及未来各种视频应用服务的移动视频网络需要学术界和业界共同探讨和研究.(本文作者:刘然、王德胜、邹礼见、朱光喜、喻莉 单位:华中科技大学电子与信息工程系)