公务员期刊网 精选范文 大数据时代的定义范文

大数据时代的定义精选(九篇)

大数据时代的定义

第1篇:大数据时代的定义范文

大数据时代到来,认同这一判断的人越来越多。

接下来人们最关心的问题是,大数据意味着什么,它到底会改变什么?仅仅从技术角度回答,已不足以解惑。大数据只是宾语,离开了人这个主语,它再大也没有意义。

我们需要把大数据放在人的背景中加以透视,理解它作为时代变革力量的所以然。

变革价值的力量

王立军有句名言,我读过的书可以把你们火化了。翻译成大数据的术语,相当于在说数据有多大。现在许多人定义大数据,只强调大,那意思跟这没什么两样:大数据有多大?大到可以把你们都活埋了。

预料到人们会有这种误解,所以《大数据时代》的作者舍恩伯格,马上出了第二本谈“大数据的取舍之道”的书,书名就叫《删除》,提醒人们,趁还没被大数据埋了的时候,赶紧删除那些垃圾。

为此,我提出一个有针对性的公式:数据+意义=智慧。我认为数据只是客体,一旦离开主体的意义,就会事与愿违。大数据好还是不好,判断标准要看意义的有无:有意义的数据是智慧的,没有意义的数据只是垃圾。

仅从大数据的“大”望文生义,很容易演化为又一场圈钱、圈地运动。象云计算、物联网那样,一哄而起,盲目建设。最后只是让那些推销设备的赚大钱。过去这样的事情太多了。这次必须吸取教训。

大数据值不值得中国重视,首先要看这件事的意义在哪里。大数据不是为了堆一大堆数据摆在那里漂亮,而是为了让我们做的事更有意义。由于做的事更有意义,而使我们变得更加智慧。一句话,大数据是为了大智慧。

再说得鲜明一点,大数据针对的反面是什么,它最大的变革对象是变什么?我认为,大数据针对的是人们净做有价值但没有意义的事,要把它改变为让做的事情既有价值更有意义。大数据所能触及的变革的最高层面(现在还不敢肯定中国能不能触及到),是将GDP导向,转为幸福导向。

当代中国做的最大的事里边,属于价值有余但意义不足的,要算GDP上去了,但环境更加污染和社会更加紧张。表现为有钱但不快乐——有钱(有价值)的部分上去了,但不快乐(意义缺失)的问题总难以解决。智慧不智慧,针对的就是有意义没意义。大数据就是通过意义识别,将GDP中无意义的部分——不会带来满意的部分(如污染和腐败)——剔除出去,只留下既有价值,又有意义的部分。

智慧地球,不是说让地球上的砂子变智慧了,而是说利用大数据,把仅仅能增加GDP但对人没有意义的资源耗费(污染和浪费)节省下来,只让GDP中有意义的部分得以精准保留。

智慧政府,不是说让政府办公大楼上的砖头变智慧了,而是说利用大数据,以办实事的方式为人民群众服务,同时让人民群众满意不满意这种意义信号,通过官员博客之类碎片化的渠道,进行无孔不入的官民交互。不是4年双方才呼吸一次,而是7(天)乘24(小时)地呼吸。这是没有政治体制改革形式但更实质的创新。

从时代的角度讲,人类正在通过大数据,从一个以温饱和小康决定生存的时代,进入一个以意义决定生存的时代。从大块头的时代,进入大智慧的时代。在世界民族之林,丛林竞争的法则,将进入用大智慧灭大块头的时代。一个GDP上的大块头,哪怕它达到清朝1820年的水平(GDP世界第一),但如果没有大智慧,不用20年,就会输得比清王朝还惨。

大数据时代的国家竞争,将变成意义控制权之争。无论中国进入不进入大数据时代,要不要大智慧,世界各国都会进入这个时代。中国不进入,顶多是使中国显得更愚蠢一些而已。未来,美国要亡中国,日本要亡中国,没别的路,仅此一条通路。就是让中国吃成个大块头,但意义的话语权完全掌握在别人手中,因此显得傻傻的。而中国要图存,必须抓住大数据这个最后机遇,夺回意义的主导权,做到大块头有大智慧。大数据不扣这个题就是帮闲,扣这个题才是帮忙。

不懂技术的人,请从我下边这个比喻中理解什么是大数据。罗丹说,什么是雕塑?那就是在石料上去掉那些不要的东西。什么是大数据?那就是在GDP中去掉那些不要的东西。如果用罗丹的“思想者”代表有意义的,如幸福和快乐,石料代表有价值的,如GDP。大数据就是根据意义的需要,把不属于“思想者”的石料去掉,把GDP中那些凡是有价值但没有意义的部分剔除。这就是“大数据的取舍之道”。

光围着圈钱圈地来建设大数据就瞎了,中国要围绕大智慧来建设大数据。未来十年,决定中国是不是有大智慧的核心意义标准(那个“思想者”),就是国民幸福。一体现在民生上,通过大数据让有意义的事变得澄明,看我们在人与人关系上,做得是否比以前更有意义;二体现在生态上,通过大数据让有意义的事变得澄明,看我们在天与人关系上,做得是否比以前更有意义。总之,让我们从前10年的意义混沌时代,进入未来10年意义澄明时代。

变革经济的力量

大数据再能,也不可能光靠自己就能。大数据转化为经济能量,要同经济主战场的重量级难题的解决联系起来。以下仅仅列举一些具有万亿级能量的影响。

大数据激发巨大的内需增量,引发产业的巨大变革。

阿里巴巴已经提出,要利用电子商务,用互联网的方式能聚合消费力,引导和激发消费力,从而激发巨大的内需增量,引发产业的巨大变革。当前,阿里巴巴正致力于通过数据和C2B的结合,启动内需。双十一电子商务交易达到191亿元,2012年全年突破1万亿。预计到2015年,阿里巴巴交易额会达到2.5万亿,到2010年会达到10万亿。这相当于现在十个大省的实体交易量。须知,一天一个191亿,全年才7万亿。由此可见,电子商务在启动内需方面有多么大的潜力。

对于启动内需来说,大数据最大作用和发力点在于,推动经济从B2C,转向C2B。野村综合研究所在预测2010年至2014年的发展趋势时,称之为“产消逆转”,即B(生产者)与c(消费者)关系的逆转。在沙集,我们看到,普通农民通过电子商务拿到订单,马上就从弱势群体,变成了龙头。生产者跟在他们后面,按他们的订单组织生产。这就是从启动内需开始激活经济的新形式。

产消逆转与大数据有内在的关联。B2C与C2B涉及的数据问题完全不同。以往,经济过程都是以生产者为起点,以消费者为终点的过程。生产者信息,一对多地向消费者传播,数据相对简单。今后,这个过程倒过来以后,是消费者向生产者发送信息,生产者根据这些信息定制产品。由于消费者非常分散,多对一或多对多地交互信息,要求大数据在其中发挥作用。

在青岩刘村,电子商务不是先有实物,再去找消费者。而是店主先与消费者打交道,从几千种数据包(包含商品说明和图片)的排列组合中,定制好消费者需求,再到网货超市中,根据数据包提货。而网货超市则根据数据包的需求信息,去组织货源和生产。不久前,龙永图先生与我起谈网购时,听到刘文高说青岩刘村在双十一,有的人一天就做了2000万元的生意,不禁大加赞赏。认为这是一条启动内需的新路。

生产者是有价值的,消费者是价值的意义所在。有意义的才有价值,消费者不认同的,就卖不出去,就实现不了价值;只有消费者认同的,才卖得出去,才实现得了价值。大数据帮助我们从消费者这个源头识别意义,从而帮助生产者实现价值。这就是启动内需的原理。

建设比城市现代化水平更高的智慧城乡

智慧城市建设是大数据与经济主战场结合的又一领域。城镇化的本意是打破城乡二元对立,推进现代化建设。并不是非得农村向城市靠才叫现代化。

美国从上世纪50年代开始,就出现了城市向农村靠的更高的现代化过程。十多年前,我去硅谷的时候,看到环境非常好,就问硅谷的市长,你们是怎么“先污染后治理”的。市长说,硅谷一起步,就没想过搞工业化,是从葡萄园一步迈入信息社会的,因此没有“先污染后治理”的问题。

以往的城市化建设,走的是一条物质资源高度集中,高能耗、高物耗、高污染的道路。大数据使城镇建设走上以数据流动的方式配置资源的新型发展道路。智慧城市强调以数据流来配置资金流、物流,要从片面强调城市集中,向城乡一体化的方向发展。

有了大数据,我们可以把城镇化的目标进一步提升,建设比智慧城市现代化水平更高的“智慧城乡”。今天,我们许多农村地区的条件不亚于起步时的硅谷,大数据通过物联网、智能地图、智能交通、智能物流、智能社区、智能医疗、智能教育等新的方式,使资源可以在农村那样分散的条件下,也可以象集中的城市那样高效配置资源。新农村建设,如果能象硅谷、班加罗尔那样跨越式地实现的更高水平的现代化,就没必要把落后的城市化道路再走一圈,可以直接建设“大数据+青山绿水”型的智慧城乡。

基础设施和资源腾笼换鸟

大数据带来基础设施和资源腾笼换鸟的新机遇。在传统发展方式下,基础设施是铁公鸡(铁路、公路、机场),资源是有形资源。但大数据时代一旦来临,以实体的笼养实体的鸟这种方式,难以进行高层次的国际竞争。别的不说,美国人提出所谓“第三次工业革命”,要以大数据+制造,例如DIY+3D打印等方式,重振美国制造。一旦实现,对中国的制造业就是一大冲击。中国未来10年还照搬前10年的铁公鸡那一套,就会吃亏。因此需要腾笼换鸟,笼要换成数据基础设施,鸟要换成数据。

我们以前提的宽带、云计算、物联网等等,都只是智能基础设施的子集。未来10年,对智能基础设施要有更全面的理解。

首先,基础设施的核心不仅是宽、快这些表面的东西,更主要的是智能化。要高度重视语义网建设。语义网带来的变革,既不是宽,也不是快,而在于对大数据分析的基础支撑,核心是对复杂生态系统的把握能力。

现有的互联网只能在简单系统水平处理信息。一旦上了大数据,它要求对数据背后的隐含意义进行挖掘,实现从数据到意义的飞跃。

其次,围绕大数据形成的信息产业,将形成规模庞大的基础产业,对各行各业而言,也将具有基础设施的意义。一是数据技术产业,包括硬件方面的智能管道、物联网、服务器、存储、传输、智能移动设备等,软件方面的语言、数据平台、工具、结构与非结构数据库、应用软件等,服务方面的IDC、云计算、WEB应用等;二是数据采集业,包括定位、支付、SNS、邮件等行业;二是数据加工业,包括数据挖掘、数据分析、数据咨询等产业;三是数据应用业。

未来我国产业从制造业向服务业升级中,由于大数据推动,服务本身也将升级,笼子里的鸟也会被替换,从实体的服务,转向数据服务。从人工即服务,如搓脚服务、跪式服务,转向分析即服务(AaaS)。广义的分析即服务,包含一切以大数据为基础的高附加值的创造,例如面向制造的创客服务(DIY+3D打印)、基于咨询数据平台的生活方式设计师服务、基于统计数据挖掘的商业分析服务、基于设计平台的创意服务,还有基于大数据的设计服务、管理服务、教育服务、翻译服务以及基于行业或价值模块细分的服务等等。

数据业务主营化带来各行各业转型升级

大数据将带来的另一个始料未及的变革性影响,是将使数据业务成为各行各业的主营业务,从而改变各行各业的业态。

在上个世纪中期美国学者将信息经济分为第一信息部门(相当于信息技术产业部门)和第二信息部门(各行各业内部的信息部门,如信息中心)。如今,大数据的兴起,使第二信息部门的工作从各行各业的辅助业务,变为各行各业的主营业务。

至少在三个传统行业,这个变革过程已经开始。在电信业,原有的主营业务是语音业务,数据业务只是辅业务。但在移动互联网中,数据业务上升为主营业务(有的占到76%以上),而语音业务成为副业。在流通业,交易是原来的主营业务,为交易服务的数据分析是副业。但对阿里巴巴来说,交易可以免费让店主去做,但数据业务却成为未来的主营业务之一。在金融业,以往的主业是做金融业务,靠佣金赚钱;未来可能清算结算免费,利用支付信息的衍生信息增值业务赚钱。等等。

各行各业数据业务的主营化,有一些共同的规律,与大数据内在相关。它们都伴随着业务转型,从因大为美,转向因小而美:从集中但赢利越来越薄的大企业服务,转向分散但高价值的最终消费者服务。大数据的优势,正在这个方面。

数据业务主营化,实质反映的是意义的专业化。以往以GDP为导向的经济。在价值的生产上是专业的,但在把握意义上是业余的。数据业务成为主营业务,标志着业态从价值形态升级为意义形态。

变革组织的力量

大数据的特点在于意义主导价值,它将引起组织结构的变革。

对于组织来说,价值体现在结构之中,意义也体现在结构之中。原有的组织形式,是为价值而建立的,其结构是价值的结构。未来的组织形式,是为意义而建立的,其结构是意义结构。

组织的价值结构与意义结构非常不同,最核心的不同在于,价值结构是机械结构;意义结构是生态结构。具体表现在:第一,机械结构是自上而下控制的,生态结构是自下而生涌现的;第二,价值结构是以集中方式控制的,意义结构是以去中心的方式自组织自协调的。

大数据所赖以存在的语义网,就是一个自下而上涌现生成意义,在分散的节点间自适应与他适应的网络。

随着具有语义网特征的数据基础设施和数据资源发展起来,组织的变革就越来越显得不可避免。大数据将推动网络结构产生无组织的组织力量,最先反映这种结构特点的,是各种各样去中心化的WEB2.0应用,如RSS、维基、博客等。

第2篇:大数据时代的定义范文

关键词:房、地基础数据,数据标准,要素描述

中图分类号:F293

文章编号:1001-9138-(2012)06-0053-61 收稿日期:2012-04-28

1 引言

目前,我国关于房、地基础数据的标准比较多(涉及房产测量规范、各种比例尺地形图图式、基础地理信息要素标准、土地利用数据库及城镇地籍数据库标准等),现有标准都是单一定义且均为纸质描述,不能被计算机自动识别,无法进行快速阅读与检索,更难以满足当前基于数据库管理的房、地基础数据库的建设。

深入研究现有相关技术规范、图式、标准,结合地理信息系统(GIS)技术和数据库管理技术,建立一个可被计算机自动识别的房、地基础数据标准,对于开展房产测绘、土地调查、地籍测绘、建立房、地基础数据库等工作都有非常重要的实用价值。从信息管理角度分析,建立数据标准可实现纸质标准的计算机自动识别,为房、地基础数据的制作、检查、转换提供可执行的标准,从而有效提高信息处理软件的开放性和独立性,同时提高房、地基础信息的开放性和利用效率。

2 数据标准特征及定义

2.1 数据标准特征

房、地基础数据不同于一般管理数据,既包括对要素图形特征的表述,这在现有的标准中属于图式的范畴,包括对要素图形信息如:位置、线宽、字体、形状、符号大小等要求;还包括对要素纯属性特征的描述,这在现有标准中属于数据库标准的范畴,包括对要素纯属性,如房屋结构、楼层、产权人名称、房屋编号、宗地编号等的要求。

“地理信息系统(GIS)是地理学的第三代语言”,在管理空间数据和属性数据方面发挥着不可替代的作用,房、地基础数据可通过GIS进行表现和管理。建立房、地基础数据标准,必须符合GIS数据特征的表述和管理。GIS数据特征主要有空间特征和属性特征两个方面。空间特征主要通过点、线、面、文字等实体(文字也可作为一种点实体)表达,可以涵盖房、地基础要素的图形表达。GIS属性特征主要通过关系型数据库表格进行管理,可以涵盖房、地基础要素的属性表达。

2.2 数据标准定义

考虑GIS数据特征,我们把房、地基础数据标准分为要素图形定义和要素属性定义。要使标准能被计算机自动识别,还需要将数据标准进行“翻译”。目前,房屋基础数据表达执行的是测量规范和相关图式,而土地基础数据表达执行的是地形图图式、土地利用数据库标准等图式、标准,房、地合起来需要表达的基础要素多,同时表达涉及标准也多。综合考虑房、地图形,属性数据标准定义,可以采用关系型数据库管理技术建立管理房、地基础数据标准的数据库;而关系型数据库管理中,我们采用可管理多个表格的MDB数据库格式。

我们通过对所有房、地基础要素分类进行分析和研究,将房、地基础数据标准定义具体分解为要素描述表定义、图层表定义、属性表定义、属性值表定义等4类表格定义。

要素描述表是结合要素代码定义,用于描述要素的空间特征信息,是要素绘制的依据。要素描述表定义主要包括YSBM——要素编码、YSMC——要素名称、YSLX——要素类型、TCDM——图层代码、YS-颜色、XX——线型、XXBL——线型比例、XK——线宽、ZT——字体、ZG——字高、CKB——长宽比、FHMC——符号名称、FHBL——符号比例、BZ——备注等定义。

图层表是结合GIS点、线、面、文本特征要求,用于描述要素分层属性并记录对应属性的表格名称。图层表定义主要包括TCDM——图层代码、TCMC——图层名称、YS——颜色、XX——线型、YJFL——一级分类、EJFL——二级分类、JHTZ——几何特征、SXBM——属性表明、YSTJ——要素条件、BZ——备注等定义。

属性表是结合要素属性分类,用于描述要素的属性信息。属性表定义主要包括NO——序号、ZDMC——字段名称、ZDDM——字段代码、ZDLX——字段类型、ZDCD——字段长度、XSWS——小数位数、ZY——值域、YSTJ——约束条件、DMB——代码表、BZ——备注等定义。

属性值表即为枚举型属性字段代码表,主要描述要素属性表中的枚举型属性值范围和定义。属性值表定义主要包括DM——代码、FL——属性值等定义。

若以上4类表格不能完全满足要素定义需求,还可根据实际增加要素表格或约束条件,建立的房、地基础数据标准数据库内容如图1所示。

2.3 表间关系描述

结合关系型数据库管理关键字技术,建立各类标准定义的关联和融合,减少标准定义的冗余,实现数据标准计算机的可自动识别和有效管理。要素描述表中,要素编码是数据空间属性的索引值,通过要素编码可从要素描述表中获得该要素的颜色、注记、符号等信息,同时可获得该要素的图层定义即图层代码;通过读取图层表定义中该图层代码所对应的属性表名,可获取该要素属性表的具体信息;如果该属性表记录的代码表有属性值表名,则可读取相应的属性值表。经过严密的数据读取流程,可以获得该要素的所有图形信息和属性信息,从而用于数据的转换、绘制、检查等。四大类表的关系描述如图2所示。

3 基础数据要素分类

第3篇:大数据时代的定义范文

云计算、大数据等新技术的异军突起,打破了传统IT基础设施的运行模式,也带动了数据中心的新一轮增长。放眼望去,各种大型云数据中心如雨后春笋般拔地而起,似乎在向世界昭告―人类已经进入一个数据为王的时代。

与此同时,为了支撑起规模越来越庞大的应用,满足企业、用户越来越高的需求,数据中心自身也面临着一系列发展阻碍和瓶颈,转型成了当前数据中心的燃眉之急。

2011年8月,华尔街日报刊登了题为《为什么软件正吞噬整个世界》的文章,被认为是拉开“软件主世”序幕的信号。事实上,近些年,软件确实渗透进了人们生活的每个角落,它甚至在悄然改变着数据中心,而且随着软件定义网络(SDN)等概念的出现,业内人士认为,软件定义的数据中心将会是传统数据中心转型升级的方向和趋势。

无论你是否相信,从当前的各种反应来看,软件定义的数据中心,这一新生概念正在被越来越多的人接受,而且已经被付诸实践……

为云计算铺路搭桥

对于生活在互联网时代下的人们而言,数据中心并不算陌生名词,但加上“软件定义”4个字之后,我们又该如何定义这个新概念呢?

事实上,对于软件定义的数据中心,目前并没有规范的定义,比较常见的解释是指将数据中心软件与硬件(包括服务器、存储、网络等)剥离,抽象成纯软件的解决方案,从而实现IT资源的灵活配置和自动调度。如果用全球著名虚拟软件厂商VMware(威睿)全球副总裁李严冰博士的话来说,软件定义的数据中心更直观的定义就是把数据中心所有传统、物理、硬件的资源进行虚拟化和软件化。

清华大学计算机系副教授李丹认为,通过软件定义数据中心主要有三个好处:首先,能有效控制成本。数据中心能够运行哪些应用主要由具体的服务商决定,不同服务对数据中心的网络基础设施架构有不同要求。如果是传统数据中心,则需要根据用户个性化的服务定制配套的硬件设备,成本非常高。而进行软件定义之后,用户可以利用控制器对数据中心上的物理资源和拓扑进行集中管理,运行相应服务时只需在控制器上对资源进行分配即可。这种方式不仅能有效控制成本,也能方便用户灵活地管理数据中心。

其次,能使数据中心功能演进和革新的周期变短。按照传统做法,如果用户有新需求,需要告知设备制造商,然后制造商按要求将设备做好,再进行一系列标准化测试工作后,才能交付用户使用,周期非常漫长。如果是软件定义的数据中心,用户自己就能通过编程进行升级换代,省去了中间很多环节。

最后,可以更好地支持云数据中心的虚拟化。虚拟化是云计算和云数据中心的核心技术,当有多个使用者时,云计算就像一个动态的资源地,通过软件定义的方式,对资源进行动态的调度、管理、分配和释放则会非常灵活和方便。

据了解,VMware应该是软件定义的数据中心的最早提出者和实践者。近年来,为了抢占发展先机,VMware先是高调收购软件定义网络领域的先锋厂商Nicira,随后又收购或投资Puppet Labs、GemStone、WaveMaker等数十家相关厂商和企业。透过这些“疯狂”的举动足以看出,VMware正在编织一张大网,网的核心就是软件定义的数据中心。

面对这个新兴领域,我国的反应也十分迅速,国家863计划、基金委等在第一时间启动了许多相关的重大基础研究及关键技术攻关。今年3月,国家973计划青年科学家专题“软件定义的云数据中心网络基础理论及关键技术”项目也正式启动,由清华大学和华中科技大学共同承担完成。

李丹是5名研究人员之一,也是项目负责人。他告诉记者,作为973项目,意味着这次项目必须符合重大基础研究的要求―既要解决国家和社会发展面临的重大战略需求,又要在技术上、理念上拿出很好的原始创新成果。这也是此次项目与其他项目的区别所在。

此外,李丹还介绍,此次项目将面向建设新一代云计算和互联网基础设施、培育战略性新兴产业的国家重大战略需求,研究云计算数据中心环境下网络设计的科学规律与技术原理,探索支持可软件编程网络节点和可扩展控制器的软件定义云数据中心网络架构,对网络、计算和存储资源进行联合优化,保障云计算租户的网络性能要求,为新一代云计算和互联网基础设施建设、关键技术研发和产业化提供科学理论支持和核心技术支撑,进而推动国家战略新兴产业的发展。

为此,李丹团队计划围绕可定制的网络架构、资源利用率优化、多租户资源管理和能耗系统控制等4个科学问题展开相关研究,力争取得一系列高质量的学术成果,形成具有我国自主知识产权的核心技术,为国家培养一批优秀的青年学术带头人,以及建立一支理论知识扎实、技术攻关能力强、战斗力过硬的研究队伍,使我国在本领域的研究整体上达到国际先进水平,甚至在一些关键点上能够达到国际领先水平。

“软件定义的云数据中心的概念脱胎于软件定义网络(SDN),但其实无论是SDN,还是虚拟化,或者是软件定义的数据中心,这一切都依附于云计算这个大背景。软件定义的云数据中心与云计算、下一代互联网及大数据之间,有着十分密切的关系。我们的研究某种程度上是为了解决这些领域在发展中所遇到的部分技术难题。”李丹认为,从这个层面看,软件定义的数据中心,能够推动云计算等相关产业的发展和进步,它所带来的影响是深远的。

紧密结合实际,避免流于形式

对于软件定义的数据中心,有人投入其中,自然也有人“看热闹”。“看热闹”的人们认为:“当初云计算、虚拟化概念刚出现时被炒上了天,后来事实证明有些所谓的新技术、新平台,并没有像描述的那样达到期望的目标。所以,谁知道软件定义的数据中心是真的‘有料’,还是只是新的炒作?”

在李丹看来,一项新的技术出现,避免不了被质疑。如果要让人们信服,就不能只是新瓶装旧酒,而是真真正正拿出新理念、新技术,同时还要转化成成果,让人们实实在在体会到好处。具体到李丹等人这次的项目而言,他们也希望研究成果不仅仅停留在论文层面,而是能在相关产业得到应用。

但是,成果转化并非易事,很多研究最终没能令人满意多半是在这个环节出问题。对于初次承担如此重大研究的李丹团队而言,这是一个非常大的考验,他们并不畏惧。李丹说:“理论与实践并重,研究成果与实际紧密结合,一直是我们做研究的特点,也是团队的指导思想。我们也时刻以此警戒自己,尽最大努力把这个项目做好,让它发挥切切实实的作用。”

据悉,项目启动半年至今,李丹等人已经在利用软件定义网络技术实现数据中心的虚拟化方面取得了初步成果,各项研究工作也在有序推进中。同时,为了更好地了解产业需求,解决实际问题,李丹表示,目前除了定期开会交流探讨,他们还积极与中石油、华为、中兴、百度、腾讯等公司、企业开展合作,争取让团队的创新想法和技术能够落地,甚至还能起到示范作用。

不是终极,但会是变革和趋势

随着关注度的不断上升,有人认为,软件定义的数据中心将会成为云计算数据中心的终极形态,但这种说法李丹并不认同,他认为:“技术发展是不断演进的,很难说哪种技术会是终极,只能说现阶段,软件定义的数据中心是一种能够很好地解决数据中心所面临问题的比较前沿的方案和方法。”

据李丹介绍,现在很多新建的数据中心,都使用了大量SDN技术,而一些传统数据中心,也在谋划着转型升级。未来,软件定义的数据中心很可能会完全取代传统数据中心。因此,李丹更认同“软件定义的数据中心会是IT界的变革”这样的说法。他说:“软件定义的核

心理念之一就是开放化整个系统,将设备软件化,功能开发化,这其实也是整个信息技术、IT技术发展的大趋势。”

李丹举例说:“最初IBM大型机软硬件一体,没有开放系统,也没有应用软件,用户都是靠敲命令完成操作。后来微软出了Windows操作系统,将硬件的各种功能通过应用编程接口开放给用户,才有今天这样方便的操作。手机的发展也是同样趋势。诺基亚手机是软硬件一体的典型代表,最初用户不能自行安装、运行其他软件。但后来除了打电话和发短信,用户还希望手机能上网、玩游戏,甚至用户还能随时安装自己需要的软件。这就需要开放手机功能,于是手机操作系统安卓出现了。”

李丹说:“通过这些例子可以看到,不同的IT行业、领域都会经历设备软件化,功能开发化的过程,数据中心也一样。传统数据中心的设备都是硬件化的,全部装在一个黑盒子里,用户不知道盒子里装了什么,只是通过黑盒子上提供的接口使用数据中心资源,不可能进行编程和控制。而软件定义数据中心,就是要把黑盒子打开,将里面的功能开放,提供标准接口,让用户通过这些接口对设备进行编程。所以,从这个角度来说,软件定义的数据中心符合整个信息技术的变革趋势,可以认为它也是IT界的变革。”

第4篇:大数据时代的定义范文

信息时代的到来不断改变着我们的生活和工作方式,在当前不断发展的新型大数据时代之下,我们必须要不断促进大数据软件工程技术的融合和发展,这样才能够不断提高各行各业的工作效率和工作质量,不断降低生产成本。在未来很长一段时间的发展过程中,我们必须要不断研究大数据时代下软件工程的应用和创新。

1大数据与软件工程技术概述

当前大数据已不断渗透到我国各行各业的发展和创新中去,迅速成为社会主义现代化事业发展的重要组成因素,对于数据的搜集整理和应用都具有非常重要的作用,大数据是未来世界发展不可避免的趋势,在经济、文化等众多领域得到了大规模的应用和发展。当前我国社会主义现代化事业不断发展,各个行业的生产力发展水平也越来越高,大数据技术开始不断创新和融合,正式带领人类进入大数据时代。软件工程技术的不断发展为当前各行各业的生产和创新提供了较大的动力,能够不断减少各个行业的财力投入以及人工资源。当前社会主义下的软件工程技术是指应用标准化系统化的过程方法对软件进行开发以及维护,从而研制软件信息工程技术,涉及到的领域众多,存在着多种多样的研究方法,在当前各个行业的发展中至关重要。近些年来科学技术不断进步社会也不断发展,人们开始不断尝试将大数据与软件工程技术互相融合和发展,在大数据的时代之下充分发展软件工程,技术不断减少各行各业成本开支,促进社会主义现代化事业的平稳发展。

2大数据时代下软件工程技术的应用

2.1数据搜集以及处理

大数据对于当前社会和时代的基本作用就是不断收集社会主义发展过程中产生的数据,在不断发展的软件工程技术当中,数据的搜集、储存、分类、整理也是一个非常重要的部分,因此我们必须要将当前不断发展的软件工程技术与大数据技术互相结合,使大数据时代下的软件工程技术拥有更多的突破和创新,对产生而来的信息进行有效的整理和快速的分类,使各个软件的协同能力迅速提升,建立起一个科学、规范、完整的现代化空间进行信息的储存,这样才能够方便各行各业发展过程中的信息使用需求。

2.2数据信息的存储

当前我国社会主义现代化事业不断发展,大数据时代的到来也加快着各个行业的发展和创新,因此产生了越来越多的数据信息,由传统的文字储存发展到图片、视频共同组成的现代化数据。我们在进行数据信息储存的过程中,需要对大量的信息进行整理和储存,不断要求计算机性能的提高以及储存空间的扩大。运用传统的信息储存方法已不能满足当前信息产生的需要,极其容易产生信息缺失现象,因此必须要不断应用软件工程技术,这样能够不断节省信息储存的空间,同时能够保证信息储存的完整性和安全性。通过对软件工程技术进行创新和应用能够极大地为计算机节省必要的空间,不断提高信息储存效率及使用效率。

2.3利用大数据进行软件服务工程建设

近些年来我国计算机科学水平不断进步,软件工程技术研究领域也不断创新和发展,不断拓展和延伸软件工程技术的发展方向。在当前大数据时代的不断发展之下我们必须要对大数据技术以及软件工程技术进行融合和创新,进一步对网络数据进行编程,使各个软件具有可操作性、稳定性、安全性和科学性,能够更好地实现数据的协调,不断提高软件工程系统的集成度。

2.4信息安全技术的应用

大数据时代之下各行各业的发展都会产生大量的数据信息,而众多的数据和信息容易互相干扰和影响,因此为了不断提高数据的安全性,必须对数据进行进一步的管理和提升。当前必须要运用到大数据时代之下软件工程技术,对当前可能存在的网络风险进行查杀以及预防不断提高数据收集以及储存的安全性。

3结束语

总而言之,信息时代的到来大大改变了人们的生活和工作方式,也在一定程度上促进着社会主义现代化事业的不断发展当前大量涌出的数据信息存在着一定的风险,因此必须要运用软件工程技术,促进数据信息产生以及储存应用的安全性,不断促进大数据时代之下软件工程技术的创新和发展,推动软件工程技术建设。

参考文献

[1]杨品军.解析大数据时代下软件工程关键技术[J].网络安全技术与应用,2020(3):54-55.

[2]黄恺.大数据时代下软件工程关键技术探讨[J].计算机产品与流通,2020(2):32.

第5篇:大数据时代的定义范文

关键词:模糊时态;数据库;数据模型

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2012)30-7156-02

随着人们对数据库的使用率越来越高,也越来越觉得现有的数据库技术跟不上时代要求,往往不能对现实的客观世界作出更为准确的反映。由于每个事物总是随时间而不断产生变化,有关物理流信息流包中包含时间信息、相对时间信息及时间区间信息等时态信息内容。通常数据库系统在处理时态数据的过程中仅仅将其时态属性做简单处理,处理后的时态数据往往不能精确地反映事物的真实信息,造成部分时态信息缺失。随着数据库的建立并不断完善,时态信息技术也得到了迅速发展,自上世纪末开创至今已具产品化、模型化,时态信息的发展过程中,大量的科研成果相继应用到其中,如事物时间、区间时间、双时态、有效时间等概念。目前,时态数据库已成为众多学者和专家的共同研究领域,全球范围有关的科研团队有近百个,建立起的各种模型有近20个,相关报道及发表的文章也越来越多。

能够准确反映客观事物的数据信息往往都是模糊的,而有关模糊时态数据库技术方面的报道和文献还很少,目前只能在试验阶段的模型中实现时态系统,还不够规范、完整,并缺少有效的信息挖掘技术支持,如文献[2、3]中所建立起的时态关系代数。在本文中,介绍了一个与参考文献[4、5、6]中数据库模型相对应的模糊时态代数理论,包含时态日历、模糊度等信息,并加以模糊时态约束,同时还做了相关规则及操作元素的语义演算和分析。

1 模糊时态及相互关系

为了将历史事件在表达其区间关系时能更符合人们的观察习惯,用数学理论上的实数轴代表时间轴,并用R表示,根据现实时间状态时间粒度用年、月、日、h、min、s、ms表示。在这里时间轴被时间粒度划分成无数个很小的等长段,长度是根据信息需要的以粒度表示的最小时间单位,即时刻,也就是现实事物的时间点,并用ti表示。这里的时间点可以是一个精确的值,也可以是模糊的集合,精确的值包含于模糊的集合内,只是集合的一个特例。各时间点的相互关系类型分为定性关系及定量关系。定量关系在时间轴R上将时间点间的定量关系体现为距离函数,f(n):{n=Δt |Δt =( tje-tis ,tjs-tie)},式中tis、tie是R轴上的时间点,其定性关系是表达两个或多个时间点在时间轴上的距离关系,时间点定性关系同样可以是一个精确的值,也可以是模糊的集合。

时间区间与时间点不同,但同时又来源于时间点代数理论,是由两个在时间轴R上的时间点划分出来的时间段。时间区间同样可以是精确的值或模糊的集合,分别用二元组T =(T-,T+)及T*=(T-,T+)表示。由于时间点的不确定性,又可将T*=(T-,T+)分为三种情况:T*=(T*-,T*+)、T*=(T-,T*+)、T*=(T*-,T+)。式中,T-、T+代表时间区间的时间点;*代表模糊算子,用来表达时间点或时间区间的不确定性。

2 模型的建立和演算

设模糊集是一个端点模糊的实数区间,则该区间是规范化的、凸的,其表达函数在论域X上是分段连续的,即“模糊数”。定义一个-T为模糊集,表示为二元组形式:T=(α,Γ),α是χ在论域X的值,Γ是χ相对于论域X的隶属度,Γ∈[0,1]。定义-T1、-T2为2个模糊集,其语义距离可用D(T1,T2)表示,D(T1,T2)=Δ1-1n∑ni=1|TT1(Γi)-TT2(Γi)|。同时也可以加权科夫基距离来进行定义。对象T1,T2,…,Tn构成一个有限集合,即模糊集R。这里的每个对象Ti均与其值域d(Ti)成对应关系。由上述模糊数的定义可知,每个对象Ti在其值域上所有的分布值共同组成了它的模糊集,这一集合便是对象Ti的模糊值域。因此,对象模糊值域也可分为两类:有限和无限,固Ti={(α,Γ)|α∈X}中,若X为有限的对象模糊值域,则上式可由Ti=∑Ti(αi) /αi代替,若X为无限的对象模糊值域,则上式可由Ti=∫Ti(αi)/αi代替。其中的“/”只是一个特定符号,仅用来说明论域X中对象α和隶属度Ti(αi)间的相互对应关系,并不是普通意义上的分数线;式中的“∫”及“∑”也不同于积分及求和的一般定义,均用来表示论域X中对象α和隶属度Ti(αi)间相互对应关系的总体。模糊数可分为定性模糊数据和定量模糊数据,在处理定性的模糊数据时,可仅做“=”及“≠”处理,而在处理定量模糊数据时,我们要做大小比较。在特定的时间内发生的事件,其实际模糊值和时间的关系可表示为模糊数据-T=(α,Γ),若Γ的值为0,则α不存在,在这里模糊值Γ与时间t的关系可以用一个映射函数来表示。

3 结论

本文中我们在模糊集理论的基础上建立了1NF模糊时态数据库数据模型,以对确定的及不确定的模糊时态数据做出模拟表达。同时还做了相关规则及操作元素的语义演算和分析。并介绍了模糊时态数据库数据模型理论,引进了模糊映射知识,利用模糊的时态数据将事件的不确定性映射出来,从而提高了时态数据库有关模糊时态信息的直观性。

参考文献:

[1] 邓立国,马宗民,张刚.基于模糊集的不精确时态关系建模[J].东北大学学报:自然科学版,2007(10).

[2] 赵鹏,谭萍,王小龙,等.面向对象的本体建模应用研究[J].科学技术与工程,2008(10).

[3] 赵晓,陈桦,侯勃峰.一种实现数据库数据到XML文档的转换方法[J].西安工业大学学报,2007(4).

[4] 蒋夏军,吴慧中,李蔚清.高层体系结构中的时态数据管理[J].兵工学报,2006(3).

第6篇:大数据时代的定义范文

[关键词]大数据;企业;管理决策

正确的决策是企业公共竞争优势的源泉,一项良好的决策能帮助企业产生更优的组织绩效,其效果积累也会为企业造就更强的竞争优势。伴随云计算、移动计算等新兴技术的兴起,数据模式的高度复杂化和数据规模的爆炸式增长标志着全球已进入网络化大数据时代。数据成为最重要的决策依据和基础,能够帮助企业进行更高效、更及时的管理决策,从而尽快创造新的商业机会和契机,转变企业以往僵硬的商业模式。当前我国对大数据方面的研究多基于或限定于技术层面,鲜有从管理学角度、大数据角度来分析企业管理决策的研究。管理决策和大数据应如何定义?大数据是如何发挥影响企业管理决策效应的?诸如此类的问题尚需要系统研究。

1大数据的定义

维基百科对大数据所作出的定义是:难以在一定时间内,通过常规软件工具来对其内容进行采集、管理、处理等工作的数据集合。此外,麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。就笔者而言,以上均是基于大数据特征方面来对其进行定义的。国内很多学者也对大数据的定义作出了探索。以李国杰先生为代表的学者们将大数据定义为:不能在一定时间内通过传统软硬件工具和IT技术对其进行获取、管理等的数据集合。而以冯芷艳为代表的学者们则认为大数据与大规模数据以及海量数据的概念相似,但相异之处是大数据在数据复杂性、产生速度等方面远超现有的技能处理能力,且产生了巨大的产业创新契机。而以刘玉枫先生为代表的学者们认为大数据是指所涉及的资料量超过现有主流软件和工具的承载能力,通过合理时间内采集、管理、整理等为企业经营决策提供更为积极的一种资讯。作为一种基础性资源,大数据的商业价值绝不是只来自于数据本身,其更多源于企业采集、存储、使用大数据的能力。如果对学者们的观念进行整理归纳可以发现,这些基于大数据特征的定义多数强调大数据规模巨大到现有技术手段的处理能力难以承载。而那些基于其价值的定义也更多是对其价值实现的关注。当然,目前也有学者认为大数据的价值并不局限在数据本身,其只有上升到能力高度,其价值才能充分挖掘出来。

2大数据对企业管理决策产生的影响

决策贯穿于企业管理的全过程,管理决策过程可分为情报收集、计划选定等阶段。企业的管理决策应涵盖战略决策以及在战略决策过程中的各项具体决策,此类决策注重对组织未来和组织环境的预测,也注重组织内部资源配置和协调的实现。作为一项高度动态性和复杂性的管理行为,决策面对着信息收集、筛选、模糊性及各类冲突。大数据技术的逐渐成熟、数据的飞跃式碰撞,这些都对当前企业的管理决策产生重要影响。这方面的影响既涵盖了决策主体和思维模式,也涵盖了决策文化和组织模式等方面。

2.1大数据对管理决策主体方面的影响

一项有效的决策需具备相应的决策程序、文化、组织等,但究其核心还是决策的制定者,即决策主体。企业决策主体一般分为两类,一是企业高层管理者,高层管理者的职位权限能让其在重大决策中发挥关键作用。二是基层员工或一般管理者。对一般管理者和基层员工来说,他们创造的产品、服务和价值等更贴近社会大众的需求,这为其正确决策提供了便利。在此过程中,普通员工可以主动引导用户参与到产品的设计、推广、客户关系管理等环节中去,并依据用户的反馈,对产品、服务等加以改进,从而帮助企业实现快速发展。可见,普通员工也是企业获取决策信息的重要来源。在互联网经济时代,不同产业间的界限性越发模糊,而社会化决策也应用而生。在大数据背景下决策主体发生了转变,从决策权归属来看,一些表现出色的员工开始参与决策,决策主体并不再局限于管理层;从企业决策信息来源分析,因信息技术快速爆炸和普及,普通民众也可以成为大数据时代中的主角,均能通过数据利用参与或作出决策,这也意味着决策主体开始呈现多元化,正从企业精英向普通民众扩展,决策者之间的特征也越发复杂化。

2.2大数据对管理决策权配置方面的影响

大数据除影响决策主体外,也对企业管理决策权的配置方面产生着影响。笔者认为决策权配置主要包涵3个层面:①组织之间的决策权配置;②组织和外部环境间的决策权配置;③组织内部人员和部门、团队之间的决策权配置。此外,决策权配置分权程度也决定企业的决策权配置模式究竟是集中式还是分散式。集中式决策权主要指在组织系统中,决策权被较高程度地予以集中,其意味着企业较高、甚至最高的管理层掌握着企业组织的大多数决策。而分散式决策主要指决策权在较低管理层次上的分散,让各部门的管理者具备一定程度的自。在大数据背景下,企业所能获取的信息越来越多,决策组织也开始扁平化发展。信息技术能让中低层管理者基于全局视野制定更好的决策,以金字塔型为标志的传统组织结构逐渐被具备企业管理网络化等特征的扁平式组织结构所取代。企业决策权的配置也应遵循此变化,分散式决策注定要成为大数据背景下主流决策模式,普通员工也将拥有决策权限。随着大数据时代的到来,企业决策需更多人参与其中,因此,扁平化组织结构模式的优势更为明显。

2.3大数据对管理决策思维方面的影响

作为决策中的重要构成因素,决策主体思维的不同表现也决定在制定决策时,所依据的信息、方式等必然不同,且在决策制定的过程中也会予以表现。决策思维分为理性和感性,在大数据时代背景下,企业要尽量系统、全面、准确地收集信息,并通过数学方法来对其进行建模分析,从而挖掘出背后关系。传统管理决策模式对管理者经验和直觉判断非常依赖,而新的管理决策模式将会改变此种现象,即由“依靠直觉进行的决策思维模式”,向“依靠数据进行的理性决策模式”转变。

2.4大数据对管理决策文化方面的影响

在不同文化作用下,企业管理决策的选择方面必然存在差异。决策主体在目标确定、方案设计和决策完成的过程中,其文化价值观均在这些方面发挥着作用。传统管理决策多数取决于管理者对企业内外部环境的评估,主观性显著,企业更多关注管理者的思维情感,且管理者制定决策的决策文化也充斥着各种潜在的决策风险和事务。大数据时代来临后,也为规避这些风险和失误提供了契机。日渐成熟的分析技术及爆炸式的数据增长,都为企业更精准的预判提供了更多可能性。企业数据资源的获取渠道越丰富,决策者作出正确决策的概率性就越高。随着大数据时代的到来,企业要提升预判准确性须确立通过真实数据来确定企业决策的文化机制。有学者指出,管理者应注重相关关系,而非对因果关系分外关注,意思是企业应将关注的重点放在如何充分利用自身现有数据来发挥最大价值上,而不是只关注企业管理者脑中思考什么。

3大数据和企业管理决策管理影响因素分析

大数据时代的到来既为企业带来了大量商业机遇和契机,也产生了许多亟待解决的问题。同时,管理数据和大数据之间的关系也受到了多方面因素的影响,为此,笔者对影响大数据和管理决策关系因素予以充分关注,并在前人研究的基础上,通过宏观层面和微观层面展开分析,对大数据中的数据政策、行业结构、政府支持、技术发展及人才配置等进行探究。

3.1数据政策

数据在大数据时代中具有无与伦比的价值,其也成为新型商业模式和经济投入的基础因素。伴随着数据规模扩展及数据价值被日益注重,大数据时代数据趋于跨组织便捷化和数字化,因此,在宏观大数据背景下,数据政策是影响管理决策的最重要因素,此种数据决策一般包涵数据安全和责任、知识产权、隐私保护等方面的政策。数据本身存在可复制、可反复利用、泄密性高等特性,企业因此在为作决策而收集数据时经常要面对知识产权、隐私保护等方面的问题,为制定正确决策,获取充分数据,企业必须攻克数据获取障碍的难题。

3.2行业结构

麦肯锡研究报告指出,大数据价值获取难度很多时候会取决于行业结构和行业差异性。基于数据存储角度,行业总体的大数据增长趋势都很明显,各个行业在数据存储量上存在差异,产生和存储的类型也各有不同。企业的数据强度高,进行决策时则更为有利。

3.3政府支持

大数据不仅能为企业发挥卓越功效,在提高国家创新能力方面也起到重要作用。为此,大数据也被上升到了国家层面。政府扮演着政策制定者的重要角色。大数据可从信息通信技术基础设施建立、数据安全保护和信息机制共享的建设等方面为管理决策提供帮助。

3.4技术发展

相当比例的数据价值不是直接呈现给使用者的,其需要使用者对其进行创新性释放分析。大数据技术是作为基础对大数据和管理决策发挥着重要影响作用。容量大和速率较快的大数据工具也是大数据战略中不可分割的组成部分。对决策来说,大数据技术是不可或缺的因素,企业应保持其技术和技能方面的不断创新,从而有效应对数据洪流暴涨对其产生的新挑战。

3.5人才配置

随着数据越来越廉价,数据处理和提取能力的价值便越发凸显,而这期间,数据科学家和其他相关的信息专业处理人员地位尤为重要。数据分析和挖掘方面的人才匮乏,会严重制约企业数据分析挖掘能力的提升,也必然会对企业管理决策的质量和速率产生影响。为此,人才方面也是大数据影响管理决策的因素之一。

4结语

大数据引发了企业管理决策多方面的变化,也为管理决策创新提供了更多的机遇和思考方向。此外,大数据支持下的科学管理决策对企业商业模式和服务等的创新都极有裨益,因此,在大数据时代背景下,只有不断提高决策速率和决策准确性,企业的效益才能实现长久、良性增长。

主要参考文献

[1]何建华.大数据对企业战略决策的影响分析[J].当代经济管理,2014(10).

第7篇:大数据时代的定义范文

【关键词】GCC;C++;对象模型

1.引言

C++对象模型是C++编译器在编译时将代码中各种数据对象映射为二进制代码的映射方法和运行时对这些数据的检索方法的统称。一个C++编译器采用的对象模型很大程度上决定了该C++编译器的设计质量,也部分地体现了该编译器的设计思路。

本文以目前实际项目开发中广为使用的开放源代码C/C++编译器GCC为例,分析其C++对象模型的实现。选择GCC的原因主要是由于GCC允许程序员在编译过程中将其语法中间表示导出为数据文件[1]。程序员在分析GCC的过程中可以通过该中间语法表示直接获取GCC生成代码中的内部信息[2],从而大大降低分析的难度;另一方面,尽管GCC在实际项目开发中被广泛使用,但是探讨其C++代码生成逻辑的文献却相对较少。因此,分析GCC的C++对象模型实现可以作为学习GCC编译器设计的一种有效途径。本文以下的讨论均以GCC v3.3.3作为分析目标。

C++对象模型实际上包括两部分,即C++与C公有数据类型的对象模型,以及C++用于支持面向对象程序设计风格的对象模型。由于C语言数据的对象模型相对较为简单,因此本文后续的讨论中将仅仅关注GCC编译器对象模型中支持C++面向对象程序设计风格的部分。

2.GCC生成代码中的对象内存布局分析

C++面向对象机制对其对象模型中的内存布局规则存在相当的影响。其主要体现在两个方面。

(1)C++多态机制需要对象的数据成员提供支持。GCC采用文献[3]描述的虚函数表机制实现了对C++多态语义的支持。但为了支持多态语义,GCC还必须在对象中添加某些辅助数据成员;

(2)C++复杂的继承语义影响了对象布局的设计。C++语言中的类继承方式分为两种,即非虚拟继承与虚拟继承。根据ISO C++98规范[4],这两种继承方式在多重继承情况下的语义存在差异。而两者的差异必然影响GCC对象模型的设计。

需要注意的是,在GCC的对象模型中,类的静态数据成员完全不影响类对象的布局。这是因为在实现时GCC总是将类静态数据成员映射为全局变量。因此,本文将不对其进行讨论。

2.1 非虚拟继承情况下的GCC对象布局模型

在非虚拟继承情况下,GCC生成代码中的对象内存布局规则可以通过如下算法表示:

算法1:非虚拟继承情况下的类对象布局生成算法

输入:派生类Derived的类定义及其直接基类Base1、Base2、……、BaseN的对象布局。

输出:派生类Derived的对象布局。

步骤:

1)检查Derived类定义中是否存在虚函数声明,若是则转3,否则转2;

2)遍历Base1、Base2、……、BaseN,检查其对象布局中是否存在虚函数入口指针,若存在则转3,否则若所有基类对象布局中均不存在虚函数入口指针,则转4;

3)检查Derived类第一个直接继承基类Base1的对象布局中是否存在虚函数入口指针,若存在则转5,否则转4;

4)在Derived类定义中添加一个隐含的非静态成员数据指针,作为Derived类对象的虚函数入口指针,并作为Derived类的第一个数据成员加入Derived类对象布局,然后转5;

5)根据Derived类继承顺序遍历基类列表,将各个直接基类的对象布局依次添加到Derived类的对象布局的末尾,然后转6;

6)根据Derived类定义中非静态数据成员的定义次序遍历每一个数据成员,将其对象布局依次添加到Derived类的对象布局末尾。

由算法1可知,非虚拟继承情况下GCC中的类对象布局可以认为是基类数据成员和派生类数据成员的简单迭加。因此在非虚拟继承情况下,GCC生成代码中派生类的基类数据成员的对象布局与真正的基类对象的布局总是保持一致。

2.2 虚拟继承情况下的GCC对象布局模型

在虚拟继承情况下,GCC生成代码中的对象布局规则可以通过如下算法表示:

算法2:虚拟继承情况下的类对象布局生成算法

输入:派生类Derived的定义及其直接和间接基类VBase1、VBase2、……、VBaseN的对象布局。

输出:派生类Derived的对象布局。

步骤:

1)在Derived类的定义中添加一个隐含的非静态数据成员指针,作为Derived类对象的虚函数入口指针,并作为Derived类的第一个数据成员加入Derived类对象布局,然后转2;

2)根据Derived类定义中非静态数据成员的定义顺序,将每一个非静态数据成员的对象布局依次添加到Derived类对象布局的末尾,然后转3;

3)从Derived类基类列表中的第一个直接基类VBase1开始,在虚拟继承树中沿继承关系逆向深度优先遍历每一个虚拟基类,将该基类自身定义的数据成员(不包括该基类的基类部分数据成员)根据其在基类对象布局中的次序依次添加到Derived类对象布局的末尾。

由算法2可知,在虚拟继承情况下,当派生类多次重复继承同一基类时,该基类数据成员在派生类对象中包含的实体有且只有一个,从而满足了C++虚拟继承语义的要求。但是在虚拟继承情况下,GCC的模型无法保证派生类中基类部分数据成员的布局与真正的基类对象保持一致。

2.3 混合继承情况下的对象布局

当程序中某个类同时使用了非虚拟继承与虚拟继承时,GCC采用如下两个步骤计算对象布局:

1)忽略虚拟基类,对该派生类执行算法1,为其生成非虚拟继承情况下的对象布局;

2)将派生类非虚拟继承布局中的数据成员看作派生类中的自定义数据成员,执行算法2,得到的即为该派生类的最终对象布局。

显然,相对于单纯的非虚拟继承与虚拟继承,混合继承情况下的GCC对象布局生成逻辑更加复杂,但其规律仍然可以通过单纯非虚拟继承和虚拟继承情况下的对象布局算法描述。因此,本文不对混合继承情况下GCC对象布局规则的具体细节进行讨论。

3.GCC对象模型中的数据成员定位策略

3.1 基类指针或引用指向派生类对象时的指针调整操作

当待编译代码中某个基类指针(或引用)指向派生类对象时,GCC总是令该基类指针(或引用)指向派生类对象中该基类数据部分的起始地址。在非虚拟继承情况下,这种策略能够使该指针(或引用)指向对象的数据成员布局与真正的基类对象保持一致,从而确保对象成员引用操作的正确性。

而在虚拟继承情况下,上述策略至少可以保证基类指针(或引用)可以正确检索派生类对象中基类部分的数据成员。但由于虚拟继承情况下派生类对象中基类数据成员的内存布局与真正的基类对象不能保证一致,此时还GCC需要引入其它的机制对其数据成员执行检索操作。

3.2 虚函数调用之前的this指针重定位操作

C++多态机制允许C++代码在运行时使用指向派生类对象的基类指针(或引用)调用派生类重定义的虚函数。但是此类函数调用成功的前提是:在调用时,被调函数的this指针必须指向派生类对象的起始地址。为了在这种情况下正确检索对象数据成员,GCC引入了thunk函数[3]作为解决方案。

一个thunk函数负责完成一个转发调用操作。其首先根据自身的this指针计算出派生类对象的起始地址,然后用该地址初始化真正虚函数的this指针,并调用真正的虚函数。每一个thunk函数总是对应一种特定的“基类-派生类”类型转换操作。由于该转换操作的源类型与目的类型静态可知,因此GCC可以在编译时为虚函数调用操作生成偏移量计算式。同时,为了保证同一段代码可以正确操作同一基类的不同派生类,当派生类重定义基类虚函数时,GCC总是将该虚函数对应的thunk函数入口地址填入派生类虚函数表,以允许对象在运行时计算其数据成员的起始地址.。

文献[3]对thunk函数的实质进行了描述,但其没有明确说明C++编译器应当如何处理thunk函数的调用时机。GCC的方案可以被看作是文献[3]所给方案的一种具体实现。

3.3 虚拟继承情况下的对象数据成员定位操作

由2.2节可知,在虚拟继承情况下,当某个对象指针(或引用)指向对象的真实类型未知时,GCC编译器无法在编译时确定该对象中虚拟基类数据成员的布局。因此在虚拟继承情况下,GCC不能简单地使用3.1节和3.2节描述的地址计算机制,而必须引入其它的处理手段。

GCC采用在虚函数表中记录偏移量的方式处理虚拟继承情况下的对象数据成员定位操作。当程序中某个类存在虚拟基类,且该虚拟基类中存在非静态数据成员时,GCC会立即为该派生类生成虚函数表,同时将虚函数表中记录的虚函数入口地址根据该类中虚拟基类数据成员的对象布局分组。在每一分组之间,GCC将派生类中各个基类数据成员的起始地址与当前分组代表的基类数据成员起始地址的相对偏移量填入虚函数表。当程序代码中通过基类指针(或引用)对其指向的基类数据成员进行访问时,此类访问操作总是被转化为两步操作:

1)根据当前对象虚函数表指针指向的起始地址反向查找,在对应的位置上找到相应的基类数据成员与当前对象首地址的偏移量,并计算该基类数据成员的起始地址;

2)根据计算得到的起始地址检索需要访问的数据成员。

需要注意的是,上述两步操作仅仅适用于程序中以对象指针(或引用)的形式对虚拟基类数据成员进行访问的情况。当程序中对某个派生类对象的虚拟基类数据成员进行直接访问时,GCC仍然采用直接确定偏移量的方式对数据成员进行访问,以保证代码的执行效率。

4.结论

至此本文对GCC对象模型的实现模型进行了讨论。在实际工作中,GCC对象模型可以作为一个典型的C++对象模型实例,在C++编译器开发、C++程序设计以及C++程序安全分析等领域中获得广泛的应用。

参考文献

[1]GCC Manuals,http:///onlinedocs/gcc-3.3.3 /gcc/

[2]GCC Internal,http:///onlinedocs/gcc-3.3.3/gccint/

[3]Stanley B.Lippman著.侯捷译.深度探索C++对象模型[M].武汉:华中科技大学出版社,2001:85-88,147-152,162-164,165-167

第8篇:大数据时代的定义范文

【关键词】收视率;大数据;大收视时代;广义收视率

所谓收视率,按照全球电视受众测量指南(Global Guidelines For Television Audience Measurement,GGTAM)的定义,是指根据抽样调查所估计的,某个特定时段里收看电视人口占所有电视渗透人口的平均百分比,其中电视渗透人口是指拥有电视收视手段或工具的人口(也指所调查空间里的所有人口)[1]。通过收视率调查,获得样本家庭或个人在连续观测的各个时间段内是否收看电视以及收看什么频道、什么节目等记录信息。用于收视率指标,包括与收视率相关或由此而衍生的其他指标,如市场占有率、观众构成、开机率、总收视点、到达率、观众忠诚度等。电视收视率的数据收集方法主要有四种:电话访问法、日记法、人员测量仪法以及海量样本回路数据收视研究。随着电视业的发展和市场竞争的加剧,电视节目收视率,现在已成为电视人头顶上的一柄达摩克利斯之剑。电视台要依据它来确定哪一个栏目将被淘汰;电视从业者要依据它来确定哪个月可以得到更多的奖金;制片人要依据它来决定一种革新的进退。这一切都缘于广告客户依据电视节目收视率来确定投放还是不投放或者投放多少商品广告。

但是以往传统的收视率依赖抽样数据、局部数据和片面数据,而且片面追求收视率使得收视率造假、节目同质化成为众矢之的。大数据时代的来临使得人类第一次有机会和条件,深入获得全面数据、完整数据和系统数据[2],就像望远镜能够让我们感受宇宙,显微镜能够让我们观测生物,这种能够收集和分析海量数据的新技术将帮助我们更好地理解信息化时代的收视率,成为诊治传统收视率弊端的一剂良方。

一、我国传统收视率的主要弊端

收视率是一个从西方引进到中国的舶来品,其在我国已经有80年的发展历程。随着市场竞争的加剧、国家对电视业的“断奶政策”、广告公司唯收视率为其投放广告的风向标,电视收视率调研在我国得到迅速发展,其在促进我国电视节目的平民化浪潮、摆脱过去“以传者为中心”的传播模式,最终使得中国电视走下传播者“神坛”,回归“服务于民”,起到了积极的促进作用。但是,市场竞争越激烈,这种纯粹的商业利益主导下的传统收视率的弊端也日益显现出来。这些弊端主要表现在:

第一,定量抽样调查容易带来数据污染。随着电视业的发展和市场竞争的加剧,电视节目收视率,现在已成为电视人头顶上的一柄达摩克利斯之剑。电视台要依据它来确定哪一个栏目将被淘汰;电视从业者要依据它来确定哪个月可以得到更多的奖金;制片人要依据它来决定一种革新的进退。这一切都缘于广告客户依据电视节目收视率来确定投放还是不投放或者投放多少商品广告,而这又直接决定了电视节目的生存与否和电视人的收入高低。因此各电视台各个电视节目均争相提高收视率。而传统收视率是基于一定范围内的定量样本户的统计数据,这样就给贿赂样本户的不良操作行为提供了可乘之机,从而造成统计数据的污染。

第二,统计数据范围狭窄,影响了统计数据的全面性和公正性。传统收视率是一种狭义的收视率,是统计在一定时段内收看某一节目的人数(或家户数)占受众总人数(总家户数)的百分比[3],是仅仅基于电视屏幕的收视率。这对于已经信息化、网络化的今天,其统计数据的范围过于狭窄,影响了统计数据的全面性和公正性。因为三网融合背景下,不少观众是通过互联网或移动互联网收看电视节目,直播、点播、回播,论坛、社区、微博、微信等均成为受众收看电视节目的新平台,因此,统计收视率时也应该将这些数据也纳入进去。

第三,定量抽查的小样本数据带来的高收视率容易以偏概全。受众的口味千差万别,但同时受众作为一个群体概念,又有着从众心态。如果定量抽样的范围过于狭窄,媒体的议程设置同受众的从众心态相结合就会产生强大的蛊惑力,比如越是低俗化、庸俗化的节目越容易契合某些受众的收视心理,这样就会造成一段时间一定范围内的较高收视率。而如果从较长时间来看,这些节目只能红于一时而不能红于一世,更不可能遍及更大更广范围内的全部受众的收视行为,因此,这样的定量抽样的小样本数据不足以反应全面范围内的收视情况。

此外,这种追求片面范围内、片段时间内的定量抽样数据也很容易误导节目的同质化、低俗化甚至庸俗化。因为在高电视节目收视率的幻影之下,各电视节目为了追求高收视率,试图以貌似大众化实则低俗化的节目来吸引某些受众,而某个节目一旦红火,换汤不换药的类似节目就会跟风而上。在频道资源相对有限的情况下,这种同质化、低俗化的电视节目必定会抢占高雅节目的收视空间,从而会影响另外一部分受众的收视需求。同时这些高雅节目的长时间潜移默化的吸引力才能达到的收视峰值自然又会脱落于追求较短时间、一定范围内的传统收视率的范围,从而成为了无效数据。

二、传统电视节目收视率的批判性反思

总体上来说,我国电视节目收视率调查业的发展历程,也是电视节目收视率在中国不断引发争议的过程。在20世纪90 年代末期和21世纪初,对电视节目收视率的争议主要还是有关调查数据科学性、准确性的质疑。2003年后,由于电视低俗化日趋泛滥并逐渐成为一个行业上下普遍关注的问题,电视节目收视率更多地是被视为电视低俗之风或节目质量、品位下降的元凶而遭到批判。例如,时任重庆电视台台长李晓枫就针对电视节目越来越庸俗化、低俗化现象,直接提出“收视率是万恶之源”的论断。

中国有句老话,“萝卜青菜,各有所爱”。正如同人们可以根据自己的喜好选择不同品牌的电视机一样,对于不同类型的电视节目,必然因为不同的知识背景、个性喜好、年龄差异等等因素而存在着巨大的分歧。从这个意义上来说,电视节目质量本身的高低与观众欣赏人数的多少并不存在着必然的联系。“叫座”的并不一定“叫好”,反过来说,“叫好”的也不一定能“叫座”。因此,笔者认为,传统的收视率太过于追求短时间、一定范围内的抽样样本数据,而这种数据必然是片面的,充其量只是一种了解喜好某一个电视节目的受众群体的人群数量、性别比例、背景状况等等的参考数据,不足以反应全部受众的收视行为,更不能作为短期内节目质量高低的客观依据。

因此,在商业利益的作用下,传统收视率的出现从根本上说是商品经济体制下电视市场运作的必然结果,是电视节目市场为了实现经济利益最大化的商业利润原则而处心积虑生产出来的“话语霸权”[4]。电视节目传统收视率终归是商业电视的产物,从某种程度上来说,它带有商业社会的“原罪”。正如法国文化批评学者布尔迪厄曾指出的那样,电视节目传统收视率的出现形成了一个时刻对电视施加影响的经济场,而电视节目收视率成了一个隐匿的上帝,它统治着这个圈子[5]。

三、颠覆与重构――大数据大收视时代的广义收视率

传统收视率的这种数据造假、数据范围狭窄、片面以及高收视率带来的电视节目畸形发展现状一直为社会所诟病。鲍红志的新作《收视率》以短篇小说的形式生动地展现了调查样本用户如何被收买地整个过程,以艺术地手段再现了现实中普遍存在的传统收视率“数据被污染”的造假现实。今年全国两会期间,著名导演冯小刚则直接公开炮轰国产剧的收视造假问题。而在前不久针对冯小刚两会期间再度炮轰收视率造假问题,国家标准委应声颁布了国内首个电视收视率调查国家标准《电视收视率调查准则》(简称“国标”),并将于今年7月实施。但对于这种并无具体法律约束力,仅依靠自愿建议性的标准,其落地执行究竟有无实际效果阻断收视率造假行径,尚在各方的怀疑之中。

笔者认为,在三网融合背景下,大数据、大收视时代的广义收视率能够为广受诟病的传统收视率带来新的启示:

第一,大数据集的无需抽样能够终结传统收视率调查样本被污染、调查数据造假等难题。大数据统计的内容包括电视机顶盒(既包括有线数字电视机顶盒,也包括IPTV和OTT TV等网络机顶盒)回路数据、基于移动终端视频消费的回路数据,社会化媒体或具有社交元素的即时通信媒体中有关视频分享和用户讨论的数据,以及与在线视频服务有关的ISP服务器后台数据等共同组成的大数据集[6]。大数据的本质在于无需抽样,是将自该节目产生以来所有时间段、全部范围内、全部平台上的数据统一汇总,这样就直接杜绝了传统收视率定量抽样、样本户少导致的贿赂收买样本户、以不良手段提高收视率的不良行为。以海量的收视数据来反映真实的收视率,这样便能从技术上避免了传统收视率因为抽样而造成的数据污染问题。

第二,全媒体、大收视时代的广义收视率能够克服传统收视率的片面性偏向。在全媒体时代,不少网络用户直接通过网络来收看电视节目,因此统计收视率也应该将数字电视、IPTV、OTT TV、互联网平台的直播、回看、点播等所创造的收视价值均应该纳入收视率的统计范围之中,使得不仅要测量现实社会中直接打开电视机下的收视率,更应该评价电视节目在网络中的影响力。例如泽传媒的全屏收视率便是以传统收视率与网络收视率之和作为判断节目整体收视率的指标。这种广义的收视率较之传统收视率统计的数字会更为全面,也更为公平。

第三,大数据的多样性、高速率能够实现对任一收视行为的发生时点及其持续时长的数据提取,其数据的共享性要求客观上触及到单纯的市场竞争中商业保护利益的底线,促进了电视节目的公平、公开、公正化竞争,一定程度上克服了收视率自身具有的商业社会的“原罪”。

综上所述,正如维克托在其《大数据时代:生活、工作与思维的大变革》一书中所说,“世界的本质是数据”[7],在当今只能惟收视率是瞻的情况下,以大数据的无需抽样来终结传统收视率的造假难题,以全媒体、大收视时代下的广义收视率来克服传统收视率的片面性偏向,努力消除数据污染,努力改进数据统计的先进性、真实性、普遍性,应该成为改革传统收视率弊端的一剂良方。

参考文献

[1]郑维东.收视率与收视率调查//聚焦收视率[M].王兰柱.北京:北京广播学院出版社,2002:3.

[2][7]维克托・迈尔-舍恩伯格,肯尼思・库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:IV-V,V.

[3]柯宜坤.电视节目有效收视率的思考[J].长江大学学报(社会科学版),2012(03).

[4]张兴龙.收视率时代的文化危机――以《丑女无敌》的收视率现象为个案[J].广告大观(综合版),2009(3):38-40.

[5]时统宇.电视批评理论研究[M].北京:中国广播电视出版社,2003.

第9篇:大数据时代的定义范文

关键词:货币替代;动态分析;VEC模型

中图分类号:F822 文献标识码:A 文章编号:1002―2848―2007(01)-0010―05

一、引 言

根据Miles的定义,货币替代是指经济主体在边际上持有国内货币和国外货币无差异的情形。货币替代是一国居民对其现金资产的多元化配置,这种现象一般发生在货币实现了自由兑换的国家。而姜波克认为货币替代通常是指一国居民对本币币值的稳定失去了信心,或本币资产收益率相对较低时发生的大规模货币兑换,从而外币在货币职能方面全面或部分地取代本币,并且不需要货币的完全自由兑换。

中国由于资本管制的存在,货币替代应该如何来界定?货币替代现象究竟有多严重?影响货币替代的主要因素是什么?对我国今后的宏观政策制订有什么借鉴?随着人民币汇率制度的改革和资本项目自由兑换的逐步开放,这些问题就更值得我们关注了。

苑德军和陈铁军认为货币替代的概念可以从广义和侠义两种层次来理解,广义的货币替代是指本国对外国货币的需求,而狭义的货币替代是指将外国货币充当国内交易媒介的情况。并且货币替代和资产替代是有区别的,货币替代也不同于资本流动。在本文的研究中,我们更倾向于这种广义货币替代的概念,这在货币替代指标的选取中有着明确的涵义。

对于货币替代对宏观经济的影响,各国学者提出了很多看法。如Miles重点强调了货币替代在浮动汇率下对货币政策造成的影响,他认为当利率或预期汇率变动时,公众在本币和外币之间的持有比例会改变,从而会造成国内货币需求的不稳定,影响货币政策的有效性。Mckinnon认为货币替代引致了不稳定的货币需求函数,并且能导致价格和汇率水平的短期波动。Guidotti从消费者最优化模型人手,得出在货币替代的情形下,金融创新会导致国内货币名义汇率和实际汇率的相反变动。Mizen和Pentecost认为货币替代过程有助于区域货币一体化进程的加快和货币联盟的成立,他们对欧元区其他国家货币和英镑的货币替代性作了研究,这对于东亚国家正在开展的货币合作也是有借鉴意义的。

按照Mizen和Pentecost的说法,货币替论可以分为两个阶段,第一阶段是Miles,Daniel等人使用的货币服务的生产函数法,这种方法把货币替代现象视为经济主体的两种决策:一是将财富分为货币和其他资产,二是选择不同货币。可以看出,这一理论把货币替代和资本流动割裂开来,更多地强调货币的交易功能。第二阶段是由Cuddington等人使用的资产平衡法,他们强调货币的预防需求,资产在货币和债券间的划分不再被看作是孤立的决策,所有资产都根据风险和预期回报来持有。

国内学者也对货币替代现象进行了实证分析。杨军利用Miles的模型估计了人民币和外币存款的替代弹性,得出中国存在货币替代现象,但人民币存款和外币存款的长期替代弹性较低、短期替代弹性不显著。李富国和任鑫提出了中国货币替代模型的货币需求函数并采用OLS法进行了估计,得出了中国货币替代程度较低,国内外名义收益率之差和通货膨胀率是决定中国货币替代的主要因素,本外币生息资产的替代是货币替代的主要形式。

然而这些分析有的在决定货币替代的变量选取上存在问题,有的所用的实证分析方法过于简单,因此没能揭示出中国货币替代现象背后的真正动因。本文通过对中国货币替代现象建立VEC模型,试图细致刻画影响货币替代的因素及其政策涵义。

二、模型设定

由于本文的重点是分析货币替代和其他经济变量的动态关系,所以我们着重介绍一下货币替代计量模型的选择。在文献中,货币替代的分析和开放经济条件下货币需求的分析是密不可分的,影响开放条件下货币需求的因素必然也会影响货币替代,所以我们在下面的分析中对这二者不作严格区分。在最后的动态分析时,我们再通过选取货币替代指标来将其和货币需求理论区分开来。

货币服务法模型设定的思路是这样的:假设有本币和外币两种货币,分别用和来表示,那么国内的货币需求可以表示为

其中P是价格水平,r是名义利率,KD和Kf是货币流通速度的倒数,Y是实际国内收入,带号的表示相应的外国变量。

为了简化分析,进一步假定国内居民没有货币替代的需求而外国居民对本币有替代的需求,则上述模型可以简化为

根据这一模型,用于经验估计的模型一般采取以下形式:

在这一模型中,货币指的是现金余额,主要强调居民的交易动机,所以利率是作为持有现金的机会成本出现的。运用这种方法时,货币替代中的货币应该是现金余额而非生息资产,国内有些学者采用了这一模型,但同时货币替代指标又用了生息资产,这是有问题的。

资产平衡法假设国内居民的财富采用四种形式:国内货币M,外国货币 ,国内债券B,外国债券B,本国居民的实际货币需求为:

其中r为本币利率,e是本国货币预期贬值率, 为本国和国外的通货膨胀率。假设 ,因此本外币的相对回报可以用通货膨胀率来表示,在假定购买力平价理论成立的前提下,有 。这样一来, 就不会出现在货币需求中。

因此,该理论的经验估计式为:

这种方法考虑了货币的预防和投机动机,所以比较全面地衡量了货币替代的实质,在本文的计量模型设定时,更多的参照了这一理论。

综合上述两种理论,影响开放经济中货币替代的主要因素可以归结为规模变量和机会成本,在文献中,规模变量一般用实际GDP来表示,而机会成本则包括两国的名义利率,通货膨胀率预期,汇率变动预期等。对于汇率预期变动这一指标,Brissimis和Leventakis使用的是汇率的过去值。而Frenkel则使用了外汇远期市场的升水。

在本文中,货币替代的指标选取了FD/M2,其中M2是中国广义货币存量,FD则是国内外币存款的余额。M2能更好地衡量经济主体对本国货币的需求,FD的选取则纯粹是出于数据可得性的问题,因为经济主体对国外货币的需求要包括本国居民在国外的外币资产,而这些数据很难获得,所以一般文献中都用FD/M2来作为货币替代程度的近似指标。图1我们给出了1994年第一季度到2005年第四季

度中国货币替代指标的趋势,可以看出,这一指标总体的趋势是下降的,这好像与我们的直觉相悖,因为随着经济开放度的提高和外汇管制的逐渐放松,这一指标应该上升才对,但考虑到M2指标在近年来增长很快的前提,这种趋势也是合理的。

机会成本指标选取了中美两国名义利率的差额,中国的通货膨胀率以及中国的名义有效汇率。这里要对名义有效汇率的选取作出说明,因为在浮动汇率下,影响货币替代的一个主要因素是汇率的预期变动,而中国由于制度的原因,名义汇率的波动幅度极小,运用名义汇率作为机会成本显然不能反映实际状况,而名义有效汇率更能体现出经济主体对人民币币值的预期,所以我们用名义有效汇率来刻画人民币汇率的变动。规模变量选取的是中国的实际GDP。

据此,我们可以对货币替代指标FD/M2(用SUB来表示,取自然对数)、实际GDP(取自然对数)、国内通货膨胀率仃、名义利差RR和人民币名义有效汇率NEER(取自然对数)建立一个动态VAR系统,

p为滞后期, 为误差向量, 为系数矩阵。

将上述VAR系统变形后就能得到VEC模型

下面我们就通过建立这一模型来具体分析一下货币替代和其他变量的动态关系。

三、实证分析

(一)数据来源

货币替代指标(FD/M2)1994―2000年的数据转引白杨军(2002),2001~2005年的FD数据来自国际货币基金组织IFS,M2数据取自《中国统计数据应用支持系统》,货币替代指标取自然对数。GDP数据来自《中国人民银行统计季报》,利用价格指数得出了实际GDP①,由于是季度数据,为了消除季节性影响,利用X11方法进行了季节调整,并取了自然对数。人民币名义有效汇率来自IFS,并取自然对数。中国的通货膨胀率指标取自IFS,用CPI的变化率来代替。中国的利率指标用一年期存款利率来代表,美国的利率指标用财政部一年期国库券利率代表,这两个数据都来自于IFS。

数据的范围是1994~2005年,这么做是因为1994年中国进行了汇率制度改革,此后经常账户及资本账户开放进程不断加快,对货币替代的研究也更有意义。

(二)单位根检验

在协整检验之前,必须对各个变量进行单位根检验。我们采用ADF检验,具体结果见表1:

五个变量的一阶差分都通过了单位根检验,所以都是I(1)单整,我们可以在此基础上进行协整检验了。

(三)协整检验

VAR模型中的一个重要问题就是滞后阶数的确定。在选择滞后阶数时,一方面应该使滞后阶数足够大,这样才能完整反映出所构造模型的动态特征。但滞后阶数的增加会使得待估参数增加,模型自由度减少。所以进行选择时,需要进行权衡。我们这里根据AIC和SC值来进行判断,最后决定滞后两阶,即选用VAR(2)模型。

然后使用Johansen的方法进行协整检验。

从中可以看出,模型中存在两个协整向量。这样我们就可以得出,模型系统的五个变量间存在着长期的均衡关系,正规化后,我们可以有下面的长期关系式。

从上式中我们可以看出,实际GDP对货币替代有一个负的影响,即实际GDP的增长会导致货币替代的降低,而名义有效汇率、通货膨胀率和名义利差对货币替代的影响都是正的,这意味着人民币名义有效汇率的增加(即人民币升值)、国内通货膨胀率的上升和中美名义利差的增加都会导致货币替代的上升。当然,这是一种长期均衡关系,更加深入的分析还需要通过误差修正模型来进行。

(四)VEC模型

在VAR系统的基础上,我们可以建立误差与修正模型(VEC),由于我们重点分析决定货币替代的短期因素,这里我们只列出其中的一个式子。

从误差修正模型中可以看出,误差修正项的系数为正,这说明货币替代对长期趋势的偏离不能在短期内得到纠正,另外还可看出,名义有效汇率在短期内对货币替代的影响也很显著。

(五)脉冲响应函数

图2给出了货币替代对名义有效汇率和利差冲击的响应,在第一期给名义有效汇率一个正冲击后,货币替代在第二期会达到最高,然后开始下降,第七期后变得比较平稳。这表示名义汇率受到外部冲击后,经过一个季度就能给货币替代带来最大的影响,此后影响逐渐降低。第一期给利差一个正的冲击后,货币替代在第五期后开始逐渐增加。这表明利差受到外币冲击后,在第五期后将对货币替代产生影响,并且这个影响有逐渐上升的趋势。

四、结论及政策建议

由实证分析中我们可以看出,名义有效汇率是影响我国货币替代的重要因素。人民币名义有效汇率的上升意味着人民币升值,由于人民币在2005年7月之前采取的是和美元挂钩的政策,2005年7月进行了人民币汇率改革,人民币开始盯住一篮子货币,但美元在篮子中的权重依然很高,人民币事实上实行的是软盯住美元的汇率安排。在这种汇率制度下,实际上是美元对其他货币的升值导致了人民币名义有效汇率的上升,因此名义有效汇率的上升反映了人民币对其他货币有贬值的压力,这时国内经济主体就会通过货币替代来释放这种贬值预期。这和易行健的观点也是一致的。同时,通过动态分析,我们也可以看出,当人民币名义汇率受到一个正的冲击后,货币替代在一期后即一个季度后达到最大,这说明经济主体对汇率因素很敏感,能够对人民币的升值马上作出反映。

和很多学者研究不同的是,名义利差在长期内并不是影响中国货币替代的主要因素,短期内利差对货币替代的影响有一个较长的时滞,这可能是由于在人民币利率没有实现市场化的情况下,把人民币名义利率作为货币替代的机会成本并不合适。

相关热门标签