公务员期刊网 精选范文 数量关系论文范文

数量关系论文精选(九篇)

数量关系论文

第1篇:数量关系论文范文

论文关键词:雷竹,海拔高度,出笋数,笋产量

 

雷竹(Phyllostachys praecoxC.D.Chu.et.C.S.Chao)属禾本科(Gramineae)竹亚科(Bambusoideae)刚竹属(Phyllostachys),为早竹的一个变种;雷竹是小径竹中属优质、高产、高效的笋用竹品种,具有优良的固土保水能力[1]。雷竹竹笋销售市场很大,闽浙一带已大面积推广种植,开展对雷竹保留不同海拔高度与笋产量关系研究,通过对不同海拔高度雷竹的效应进行分析对比,确定其较合理的雷竹种植区农业论文,旨在为雷竹的集约经营提供参考依据,对提高山区竹农经营效益,促进增收具有现实意义。

1试验地概况

试验地根据寿宁县不同海拔高度分别设在:斜滩镇渡船头村、斜滩镇印潭村、平溪乡长溪村、南阳镇官洋村、托溪乡双坑村、大安乡后西溪村、坑底乡榅当洋村。属北亚热带季风气候类型,年平均气温13.5~18.9℃,年平均降水1800-2200mm之间,无霜期210~310d,平均相对湿度为82%,土壤类型为红壤、黄红壤和黄壤,坡度在15°-25°之间。不同海拔高度的试验地,除土壤类型不同外其余立地条件相同,均为良好立地条件,林下植被为芒萁、杂草、蕨类、小杂竹、五节芒等。

2试验方法

2007年春选择立地条件相同仅海拔高度不同的地段,立竹密度均为12000株·hm-2,按随机区组试验设计方法[2-6],设置7个不同海拔高度农业论文,分别为:A. 海拔高度130~140m、B.海拔高度280~290m、C.海拔高度430~440m、D.海拔高度580~600m、E.海拔高度720~740m、F.海高度拔920~930m、G.海拔高度1070~1100m。每个海拔高度3个重复,共设置面积为20m×20m的标准地21个。前2a的5、9月份分别对A、B、C、D、E、F、G等7个不同海拔高度的标准地进行锄草、松土各一次,冬季按设计密度进行疏伐,采伐老(5年生以上)、弱、病、小及密度过大的竹,留下1~3年生无病虫害的幼壮龄竹,调整好立竹度和均匀度,龄级结构合理(1年生、2年生、3年生、4~5年生竹数之比为3:3:3:1),第3a出笋时节调查21个标准地的出笋数和笋产量(在笋高25~30㎝时采挖)。

3结果与分析

3.1 不同海拔高度出笋数与笋产量

不同海拔高度标准地的出笋数和笋产量见表1、表2。从表1、表2可以看出,不同海拔高度的标准地A、B、C、D、E、F的出笋数均大于标准地G;不同海拔高度的标准地之间的出笋数和笋重量存在差异,单个笋平均重量从重到轻的顺序为A(0.2530kg/个)>B(0.2491kg/个)>C(0.2355kg/个)>D(0.2186kg/个)>E(0.2128kg/个)>F(0.2021kg/个)>G(0.1981kg/个)。不同海拔高度的标准地之间的出笋数和笋产量表现出明显的差异,出笋数和笋产量两者之间出现正比例关系,雷竹笋产量与海拔高度成反比。A标准地的笋产量最高,G的笋产量最低。A标准地的平均出笋数和笋产量分别达25892个?hm-2?a-1和6.55 t?hm-2?a-1,分别为B(24650个?hm-2?a-1、6.14 t?hm-2?a-1)的1.05倍和1.07倍;而C标准地的平均出笋数和笋产量分别达23092个?hm-2?a-1和5.44 t?hm-2?a-1农业论文,为D(22917个?hm-2?a-1、5.01 t?hm-2?a-1)的100.8%和108.6%; F标准地的平均出笋数和笋产量为E的86.2%和81.2%; G标准地的平均出笋数和笋产量仅为A的66.5%和52.1%。

以最大海拔高度G的平均出笋数和笋产量为100%,将不同海拔高度A、B、C、D、E、F的出笋数和笋产量分别与G相比较,进而排出各海拔高度标准地的出笋数和笋产量的顺序(表1、表2)。其出笋数和笋产量排序由大到小均为:A>B>C>D>E>F>G。因此,对于雷竹而言,海拔高度过大则会影响出笋数和笋产量,进而影响其经济效益。若海拔高度在800 m以上时,出笋数和笋产量均很差,相对经济效益自然也差。

3.2 差异性显著检验

以产量和出笋数最差的G为对照,采用单因素方差分析,对不同海拔高度的笋产量和出笋数进行方差分析,分析结果表明:不同海拔高度的笋产量和出笋数间均有极显著差异(F值分别为14.61、7.80,均大于F0.01=4.46)。采用最小显著差数进行多重比较,结果见表1、表2。从表1可以看出,不同海拔高度各处理之间的出笋数除A与B、B与C、B与D、B与E、C与D、C与E、D与E之间的差异不显著外农业论文,其它处理之间的差异均为显著至极显著。从表2可以看出,不同海拔高度各处理之间的产量除A与B、D与E、F与G之间的差异不显著外,其它处理之间的差异均为显著至极显著。

表1 不同海拔高度出笋数

 

海拔

高度

顺序

出笋数/(个?hm-2?a-1)

占G出笋数的

百分率/%

平均

A

1

25150

28525

24000

25892Aa

150.4

B

2

24950

22925

26075

24650ABab

143.2

C

3

25225

20975

23075

23092ABb

134.1

D

4

24100

21475

23175

22917Bb

133.1

E

5

21075

22850

24175

22700Bb

131.8

F

6

20550

18425

19650

19542Cc

113.5

G

7

14525

19225

17900

第2篇:数量关系论文范文

冉光华

(贵阳市二中,贵州  贵阳  550001)

摘  要:函数的文化性近年来颇受关注,有诸多论点:历史论,三说论,思想论,模型论,应用论等。这些论点却忽视了离我们最近的汉语文化和社会文化,再探函数文化有:1、汉语字义诠释函数本意;2、联系实际,尊重社会准则,合理解释唯一对应;3、函数符号的断想、实验及欣赏。

关键词:再探;函数;文化

函数的文化性近年来颇受关注,主要有以下观点的论述:

历史论:追溯最早函数概念的提出,过程的历史变迁及相关数学家的贡献。

三说论:变量说——函数是刻画变量与变量之间依赖关系的模型;映射说——函数是连接两类对象的桥梁;关系说——函数是“图形”。

思想论:运动变化的思想,应用模型的思想。

模型论:用数量关系表示变量之间的依赖关系,并通过数及其运算等研究变化规律。

应用论:函数来源于社会,应用于社会,一方面,用函数解决现实生活中一些简单的实际问题,另一方面,用函数思想讨论其它的数学问题。

    对函数再作如下文化探讨:

一、汉语字义诠释函数本意

“近水楼台先得月。”汉语是离我们最近的文化,我们天天都在汉语中生活,我们随时在不自觉地继续着汉语学习。汉语是最宽和最近的社会文化,数学文化的自身发展要自觉吸收社会文化、民族文化,数学教育也要自觉借鉴其它文化,函数概念的教学可以先从汉语角度教学,即先解释字面词义:

    函:①﹤书﹥匣;封套;②信件。古代也有用套囊代替信件的。

大家知道三国演义中刘备到吴国相亲的过程中,赵云总是在关键的时候把诸葛亮事先给他的套囊拿出来看,每每使危机化解。由此看来,套囊有两种涵义:一种是指信件,一种是指装有计谋或便条的嚢袋。匣—匣子:装东西的较小的方形器具,有盖儿。无论是匣、套囊或信件,都是装有东西的一件物体的意思,或都是装有关系的一样东西的意思。于是仅凭字义,函数意思则可以解释为:

    函数——装有关系数(量)的器具或东西,或用器具或东西装的关系数。由此而知函数是什么的大致意思了。 

    讲了函数的概念后,把 是 的函数记为 ,这就是一个器具或东西,它里面装着对应关系的变数(量) , 。每一个函数式,就是一个物件式的对应关系,而表格、图像又何尚不是呢。 因此, 函数即为变量 , 的对应关系器(式)。这里的函是对应关系器(式)的意思。

二、联系实际,尊重社会准则,合理解释唯一对应

函数的定义:……对 的每一个取值, 都有唯一确定的值与之对应……这里的“唯一对应”都认为是天经地义的——这是规定,只需按此准则去理解函数概念就是。相信大多数数学教师均是如此或类似教学唯一对应的。武断地规定式的教学“唯一对应”显然有悖于教育本质。“数学文化就在数学里面”,函数定义中的唯一对应有着极好的社会文化:

数学来源于社会生活,社会生活方方面面都遵循着普遍的准则

——唯一对应性。如:几千年来的道德规范,每个妇女都是唯一的丈夫与之对应;每个人都是唯一的生母与之对应,每个公民都是唯一的祖国与之对应;和谐社会每个地方都是唯一的政府与之对应;每套住房都是唯一的合法主人与之对应……。这种唯一对应性,正是生活的准则,道德的准则,社会的准则。数学来源于社会,服务于社会,天经地义的是数(学)社(会)合一,数(学)道(德)合一。这种唯一性是社会有序的基石,社会诚信的基石,社会和谐的基石,社会稳定的基石。这种唯一性也是数学真的基石,是数学善的基石,是数学美的基石,是数学严谨的基石,数学理性的基石。同时也要指出,不唯一对应也是存在的,但不是主流,社会如此,数学如此,看对什么而言,这才符合辩证法。

这种唯一的文化论同样能对映射概念中的唯一性对应进行合理解释。

针对唯一对应性,设计练习:

1、有否存在关于 轴对称的函数?

2、下列方程是 的函数吗?

① ;② ;③ ;④

3、设 , ,问集合 的交集有多少个元素?

三、函数符号的断想、实验及欣赏

数学教学长期忽视了数学符号(下简称符号)的文化教学,至少是符号学习只是大学教师研究的课题,少有在中小学课堂中探索和实践。符号是数学语言主流,也是现实问题数学化的标志。中国数学史表明:符号(字母)创造匮乏,这与汉字文化不无关系。符号蕴含的文化价值被数学教育忽视了。符号的文化从一种角度反映了一个民族的文化史,乃至创造史,中华民族则是在汉字符号上体现了独特的创造力,但在科学符号的创造上相对匮乏。现实是,许多学生因符号化(字母化)而怕数学,部分学生因符号化而喜欢数学,滑稽的是数学教学恰恰没有从符号(形式)角度去化解学生的学习障碍,更谈不上借助符号文化去培养学生学习数学的兴趣,去提高数学教学质量。符号(字母)学习有它的过程性和规律性,但被中国教育者忽略了。

表示函数的符号 似乎是天经地义的,最初是怎么来的?其历史如何?如果是信函,应该怎么用符号表示?你如果是第一个来创造函数符号的人,你用什么表示?笔者用此在我校学生中作为学生课外研究性课题,结果得到了许多表示函数的符号:

 ; ; ; ; ,其中 是值域英语单词 的缩写, 表示函数的中文的第一个字母, 表示自变量的中文第一个字母; ; ; ; ; ; ;等等。

把这些来自学生中的创造符号写在黑板上,让学生欣赏,选出好或比较好的表示函数的符号,并说明理由,结果是:

好—— 、 ,都表示有自变量与因变量的确切关系,对每一个自变量的取值,都有表示确定对应的函数值。但后者美中不足的是 不是我们习惯用的自变量 ,字母 , 容易使人想到高度及半径。

较好—— 、 ,除具有前者特征外,符号 、 从视觉和书写上有点别扭,不流畅。 中的符号 少了形和状。 、 中在书写 时则不但别扭,而且形状怪怪的,视觉不顺。

不好—— 、 、 三者都难以表示函数的确定对应取值。 中表示自变量 、因变量 的对应关系模糊,且符号 太过平庸。

并且,让学生审视 与 的优缺点,学生明显感觉到后者的优点,好像前者的 是不平等的。

我们再来欣赏通常的函数 ,它的优点有哪些?如何欣赏这一景点?为此,引导学生发表自己的观赏感言。归纳起来,对该符号等式有如下评价:简约性,包容性,蕴含性,畅通性,对应性,唯一性,轻盈性,平等性,并且比较前面的学生创造的符号式,该符号式似乎不但简洁,而且美观。

再欣赏:把函数 比喻成一座桥。“ ”这不正是一座桥吗?!有流通的功能,不但形似,而且神似。桥有互逆性,该符号式有互逆性。这种看法多么体贴!

无疑,函数符号式 是函数表示方法中的最简单明了的。

参考文献:

[1]现代汉语词典(第五版) .商务印书馆,2008.

[2]王尚志. 高中数学课程中的函数 .中学数学教学参考(上半月),2007,(10).

[3]黄传军. 高中数学新课程中函数的教学建议 .中学数学教学参考(上旬),2009,(8).

[4]章建跃.数学概念的理解与教学 .中学数学教学参考(上旬),2010,(11).

第3篇:数量关系论文范文

【关键词】复数;矢量;复矢量;复数除法;矢量除法

一、绪论

(一)关于矢量

矢量是数学和物理学中的基本概念之一,指同时具有大小和方向的一类抽象的几何对象.矢量最初起源于约公元前350年古希腊哲学家、科学家亚里士多德的研究.1687年牛顿在《自然哲学的数学原理》中提出三大运动定律,其中的推论之一提到:“当两个力同时作用于一个物体时,这个物体将沿着平行四边形的对角线运动,所需时间等于两个力分别沿两边所用时间之和.”这个推论从作用效果上说明了力的合成和分解定理.从18世纪末到19世纪初,欧拉在力矩研究、拉普拉斯在动量矩研究以及泊松在坐标系及射影研究中,都使用了矢量的方法.

矢量思想的孕育不仅有明确的力学背景,而且和位置几何有着直接关系.1840年格拉斯曼在《潮汐理论》中历史上首次建立了矢量分析系统,同时代德国数学家麦比乌斯在《重心计算》中也给出了一个与矢量系统类似的空间分析系统,在《几何加法和乘法》中给出了矢量的矢量积、数量积与混合积的概念.

(二)关于复数

提到矢量,就不能不提及复数.最早有关复数方根的文献出于公元1世纪希腊数学家海伦,16世纪意大利米兰学者卡当在《重要的艺术》一书中公布了三次方程的一般解法,首次把负数的平方根写到公式中.17世纪的代数学比几何学占有更重要的地位,出现了大量新的数学概念如导数、积分等,虚数的概念也是在这一时期由法国数学家笛卡尔在《几何学》中提出的.18世纪经过法国数学家达朗贝尔、棣莫弗以及瑞士数学大师欧拉的一系列工作,复数渐渐被接受,复数研究也日渐深入.1799年挪威-丹麦测量学家、数学家卡斯帕尔・维塞尔在丹麦皇家科学与文学会上发表的论文中,提出用复数表示平面上的点的方法,明确地给出复数的几何意义,并利用复数的运算来定义平面向量的运算.这一基本数学思想和方式沿用至今.

第4篇:数量关系论文范文

[关键词] H指数;R指数;传统计量指标;人才评价

科学计量学凭借其客观的数学方法和数量工具,已经广泛应用于各个学科领域,特别是在科研评价方面发挥了重要、独特的作用,人们也常使用此方法来达到评估和比较科研人员个人绩效的目的。本文采用“H指数”来对农业烟草专业人员的个人绩效进行刻画和描述,并辅之以R指数及传统计量指标,以期更好地说明农业烟草专业人员研究工作的影响力。

一、数据来源

本文的研究对象为国内农业烟草专业的研究人员,选择CNKI 引文数据库为统计源,检索式为:((被引题名=(烟草+烤烟)+(被引关键词)=(烟草+烤烟))*被引时间=(1997-2006),检索范围限定在“农业”专辑的“期刊类型引文”中,检索时间为2007年11月,共检出论文5998篇,总被引次数为26372次,论文的篇均被引次数为4.3968次。

二、结果分析

1.H指数

Hirsch指数(简称H指数)是由Jorge E.Hirsch提出的旨在评价个人成就的一种指标,Hirsch定义H指数为:一个科学家的分值为H,当且仅当在他/她发表的Np篇论文中有H篇论文每篇获得了不少于H次的引文数,科学家剩下的(Np-H)篇论文中每篇论文的引文数都小于H次。根据统计数据,笔者计算出农业烟草专业科研人员的H指数(表中列出了H指数在4以上的75位著者),由表1可看出,75位著者的H指数分布在4~15之间,H指数为15和8的各1人,H指数为9的3人,为7和6的各4人,为5的有23人,为4的达39人。若从全部统计数据来看,本专业著者的H指数普遍较低,主要集中在1~3之间(有2791人,占著者总数(3317)的84.14%),其中, H指数为1的达2229人(占著者总数的67.20%),H指数最高的为15(韩锦峰),均值为1.17。但由于H指数带有很强的学科特点,如当选为2005年美国国家科学院生物学和生物医学领域的36名院士的H指数均值为57;当选2005年美国国家科学院物理和天文学领域的院士的H指数均值为44;而科学计量学领域高产

和高影响力的普赖斯奖获得者的H指数均值仅为13.9。因此,不同科学领域之间的H指数没有可比性。

2.R指数

由于H指数相同著者的论文被引频次、篇均引文、被引论文数等指标均存在较大差异,因此,H指数不能反映出各著者的个人绩效差异。金碧辉提出了用R指数作为补充指标,R指数是指H指数划定的绩效核内总被引频次的平方根。如表中H指数相同的著者排名均相同,但从R指数却能看出排名差异。如按H指数排名在第4位的四位著者(宫长荣、刘卫群、汪耀富、许明辉)按R指数排名时则分别排在16位,12位,6位和7位。由此可见,用R指数作补充就解决了H指数不能区分科研人员科研绩效水平高低的问题。

3.其他传统计量指标

(1)总引文数

为了区分研究对象的影响力,鼓励科研人员在提高产出能力的同时提高产出质量,通常是用被引总次数(即总引文数)作为评价指标之一,论文的被引次数越多,说明该论文的质量越高,含原始创新的成分越多。有人统计:获诺贝尔科学奖的论文,大体被引次数均在l000次以上,而农业烟草专业单篇论文被引次数最高的仅为97次(梁峥等人撰写的“菠菜甜菜碱醛脱氢酶基因在烟草中的表达”),且还有部分论文未被引用过;而从总引文数来看,排名第一的是韩锦锋(被引539次),其次是胡国松(被引273次)。另外,还有447位著者,被引总次数为0。

(2)篇均引文

篇均引文是总引文数除以论文总数。篇均引文数能够对从事科研时间不同的科学家进行比较,从表1中可看出,篇均引文数较高的著者一般不是和被引论文最多的高产著者,与被引论文数均排第一的韩锦锋,以篇均引文排名则排第十三位,篇均引文排名第一的是和被引论文数均为4篇的宾金华。因此,篇均引文会在某种程度上鼓励低产作者而低估高产作者。

(3)被引论文总数

被引论文总数可以反映出科研人员论文的总体质量,被引论文越多,说明其的质量越高。被引论文数最多的是43篇(韩锦锋),最少的为0。有447位著者(占著者总数的13.48%)发表的480篇论文(占论文总数的8%)从未被引用过,这说明烟草专业部分科研论文的质量还有待进一步提高。

三、H指数与其他计量指标之间的相关关系

根据表中的数据可计算出H指数与R指数、总引文数、被引论文数、篇均引文数之间的回归方程及相关系数(见图1~-图4),由此可见,H指数与R指数、总引文数、被引论文数呈显著正相关关系,相关系数分别为0.7528,0.8678,0.5921,如H指数排名前9位的,R指数有7人排在前9位,总被引次数有8人排在前9位,被引论文数有6人排在前9位;但H指数与篇均引文数呈弱相关关系,相关系数为0.0793,H指数排名前9位的篇均引文数只有3人排在前9位。从图1~图4的散点图及趋势线也可看出其相关性。

四、小结

用H指数评价科研人员绩效最大的优点就是可以遏制片面追求论文数量的不良倾向,同时又能激发科研人员探索深层次科学问题的热情。但缺点是:H指数不能分辨H指数相同而被引频次相差较大的情况;H指数不会超过论文总数的界线,因此,可能出现的情况是发表少数高被引论文的作者其H指数偏低;H指数是一个相对稳定性、累积型指标,一方面不论是排在引文高端(即被引次数大于H指数)的论文获得新的被引还是被引次数小于H指数的论文的数量增加都不会使H指数增加,因此不能反映这两种代表作者影响力和产出的变化;等等。而总论文数却能克服H指数不会随被引次数小于H 的论文数的增加而增加的情况,R指数、总引文数可以克服H指数不能分辨H指数相同但是影响力不同的科学家的缺点,篇均引文能够弥补H指数不利于评价低产但高影响作者的缺陷;但是,单独用传统计量指标中的任一个作为评价指标也存在各自的缺点。如:由于引用有自引和他引两种,而CNKI引文数据库在统计时并不区分二者。虽然自引次数与论文的影响力毫无关系,但不能排除有些科研人员故意频繁自引,从而制造论文被引次数和篇均引文均高的假象。因此,总引文数与篇均引文均不能较好地评价科研人员的科研绩效水平。但若用H指数、R指数以及总引文数三项指标配伍,却能较好地说明科研人员的绩效水平。从表1中的计算结果来看,前5位著者的前三项指标(H指数、R指数、总引文数)排名没有位次变化,第六位~第十位著者的前三项指标排名位次的变化在1位~5位,从第十一位著者开始,前三项指标位次变化绝大多数也在1位~15位以内(只有个别例外,如刘国顺、许美玲位次变化达30位以上)。但第四项指标(被引论文数)、第五项指标(篇均引文数)排名与前三项指标(H指数、R指数、总引文数)排名相比较,著者位次变化大多数都在20位~30位,最高的达50位左右(如刘卫群,前四项指标排名在7位~12位,篇均引文排名为58位,宾金华前三项指标排名9位~11位,被引论文数排在69位,篇均引文排在第1位,等)。因此,从H指数与R指数和传统计量指标之间的相关性(H指数与总引文数的相关系数最大(0.8678),其次是与R指数的相关系数(0.7528),与被引论文数的相关系数较小(0.5921),与篇均引文的相关系数最小(0.0793)),以及各指标的实际计算结果从表来看,用前三项指标(即H指数、R指数、总引文数)配伍,基本能较好地反映科研人员的科研绩效水平。由此可见,在农业烟草专业,科研绩效水平最高的是表中的前5位著者(他们的前3项指标排名均在前5位),可以认为,这5位著者是国内农业烟草专业最核心、最权威的著者。

参考文献:

[1]J.E.HirscH,衡量科学家个人成就的一个量化指标[J].科学观察,2006,1(1)

第5篇:数量关系论文范文

【关键词】数学期望 相关系数 条件数学期望

【中图分类号】O211 【文献标识码】A 【文章编号】2095-3089(2013)12-0164-01

1.引言

在本科生的概率统计相关课程的教学中,数学期望、相关系数和条件数学期望,是非常重要的概念,具有重要的数学函数,蕴含丰富的数学思想。例如:数学期望描述一种平均,相关系数刻画随机变量间线性程度的大小,条件数学期望可以看作是在某些限制条件下的数学期望。但对于初次接触的学生来说,较难理解,通常的教材[1],[2]一般没有这些的概念的几何解释。基于大多数本科生在学习概率统计时已有线性代数和高数的基础,为此我们用几何的语言来解释数学期望、相关系数和条件数学期望,希望这种方式能让同学们更容易接受。

该文是这样安排的:第二节介绍基本概念的定义;第三节是主要内容,给出前面所述概念的几何性质;简短的证明在第四节给出。

2.基本概念

为方便起见,我们记随机变量X的分布为FX(x)。

定义1:设X为一随机变量,如果积分

注1:在上述定义中FX(x)可以用来统一表达连续、离散或奇异随机变量的分布,对于初学的读者可以分布看作连续型随机变量对应的积分

其中f(x)为连续型随机变量的密度函数,和离散型随机变量对应的和式

其中a1,a2,…,an,…为离散型随机变量的所有可能取值。

定义2:设X和Y为两随机变量,如果二者的方差Var(X)和Var(Y)存在,称

为随机变量X和Y的相关系数,其中

为随机变量X和Y的协方差。

注2:上述定义中方差存在与二阶矩存在是等价的,即上述的式子只对二阶矩存在的随机变量有定义。

定义3:设X和Y为两随机变量,称E(X|Y)为随机变量X在随机变量Y下的条件数学期望,如果:

1)E(X|Y)∈K(Y);

2)对任意的f(Y)∈K(Y),有E(f(Y)E(X|Y))=E(f(Y)X)。

注3:见命题3,上述的定义条件数学期望在几乎处处意义下是唯一的。

3.几何性质

命题1:记全体的随机变量全体为K,对X,Y∈K,定义二者之间的距离:

注4:该结论具有直观的几何意义,它表明数学期望在度量(1)下为从随机变量X到实数空间最短距离所对应的实数,如图1。

命题2:记全体二阶矩存在随机变量构成的向量空间为L2,对X,Y∈L2,定义内积为:

(X,Y)=E(XY)-E(X)E(Y)

如果记θ为向量X和向量Y的夹角,则二者之间的相关系数为cosθ。

注5:该结论表明,相关系数可以看作是向量X,Y的夹角的余弦值,见图2。如果夹角为锐角,二者正相关,相关系数为正;如果夹角为90度,二者线性无关,相关系数为0;如果夹角为钝角,二者负相关,相关系数为负。

命题3:K如命题1中所定义的,对X,Y∈K,记E(X|Y)为给定随机变量Y下随机变量X的条件随机变量,则:

其中K(Y)={f(Y):f为任意的实可测函数}。

注6:与注1类似,该结论也具有直观的几何意义,见图1。

4.结论的证明

命题2的证明:由向量空间的知识,我们有

命题1和命题3的证明:我们首先证明命题1,我们只需证明数学期望E(X)是实数里面离X最近的点。为此,令b∈R,且b≠E(X),则

这样命题1得证。

下面我们证明命题3:我们只需证明数学期望E(X|Y)是K(Y)里面离X最近的点。为此,令Z∈K(Y),且Z≠E(X|Y)(几乎处处意义下),则

参考文献:

第6篇:数量关系论文范文

关键词:价格波动;交易量;信息流;GARCH―M模型;MDH理论

金融资产的价格波动与金融资产的交易量是研究金融市场常选用的数据,长期以来对证券市场中量价关系的研究一直是金融市场研究的热点课题。由Clark(1973),Epps(1976),Tauchen & Pitts(1983)等,建立并发展的量价关系的混合分布假说(MDH)理论奠定了量价关系研究的根基。混合分布假说(MDH)理论认为,价格波动与交易量是由潜在的不可观测的信息流共同决定的,信息流的冲击将同时产生交易量和价格波动,信息流即为混合变量,日交易次数和交易量均可以作为信息流的替代指标。

国内外有大量文献对交易量与价格波动之间的关系进行了实证研究。Karpoff(1987)研究包括股票市场、期货市场和国库券等不同金融市场,证实了交易量与价格波动之间存在正相关关系。Hendrik Bessembinder和Paul J.Seguin(1992,1993)把交易量分解为预期交易量和非预期交易量,发现非预期交易对价格波动的冲击更大。Roger和Ronald(2003),通过分析FTSE100指数,发现交易频率和平均交易量影响小额交易的价格波动,而在大额交易中只有交易频率影响股票价格波动,交易频率比交易量对股票价格波动的影响更大。国内的陈怡玲、宋逢明利用随机抽样股,验证了中国股市存在不对称的交易量―价格变动关系,指出了一般认为股价变动与交易量正相关的结论是不准确的。李双成、王春峰运用GARCH―M模型检验中国股票市场波动与交易量之间的存在正相关关系,得到中国股票市场的短期波动主要是由非预期交易量所隐含的新信息的冲击所产生的结论。赵秀恒、李双成、梁建英研究中国股市价格与交易量动态因果关系,得到交易量和收益序列存在即期的正相关关系,中国股票市场交易量和收益序列存在双向的线性因果关系。

本文利用上证综指和深圳成指的历史数据,运用GARCH―M模型方法,分析中国股票市场交易量与价格波动之间的关系,并把交易量分为预期交易量和非预期交易量,分别检验它们对价格波动的不同效应。

一、样本数据及处理

本文选取能够代表中国股市的上证综指深证成指作为研究对象。数据时间跨度均为1997年7月25日至2008年6月6日,剔除节假日和个别不交易的数据,沪深指数均包含2611交易日的收盘价(数据来源省略)。在数据处理上,通常有两种方法。一种是对数收益率,即rt=ln(pt)-ln(pt-1,其中pt为股价指数在时刻t的收盘价。另一种是简单收益率,即rt=pt-pt-1pt。本文t采用对数收益率进行计算(由于对数收益值很小,故均扩大100倍,以减少由计算精度引起的误差):

Rt=100(ln(pt)-ln(pt-1)),(t=1,2,…,n)。

其中:pt表示从1997年7月25日算起的第t个交易日的收盘价(t=1,2,…,n)。本文的研究对象就是这些有效收益日的收益率序列{Rt}(t=1,2,…,n),沪深指数在考察的样本时间范围内分别有2610个收益率。表1提供了上证综指与深证成指在样本期间内收益的基本统计量。

由表1发现:无论沪市还是深市,股指收益序列的均值都非常小,对应的标准差相对较大;且都具有正的偏度,正的偏度表明两市从整体上看其收益率低于自身时间序列均值的交易天数较多;峰值均显著大于3,显示了明显的尖峰厚尾现象;表明股指收益序列拒绝正态分布假定,这与大部分文献中的研究结论一致。进一步分析两市收益率序列及收益率平方序列的自相关和偏相关系数,见图1。由图1可知:收益序列的自相关系数很小,表明股指收益序列不存在明显的短期相关,而由收益率平方序列发现,收益的平方序列具有很强的正序列相关性,即收益的二阶矩具有显著的ARCH效应。

图1 上证综指与深证成指收益率序列及其收益率平方序列的自相关和偏相关图

考虑两市的交易量序列,见图2。

图2 上证综指与深证成指日交易量序列图(单位:百万手)

两市日交易量序列基本上表现出相似的变化趋势,总体上表现出略微的增长趋势,都表现出波动的群集性。考虑其相关和偏相关函数图,见图3。两市日交易量序列均表现出自相关系数均为正值且缓慢缩减,偏相关系数都表现为急剧缩减,说明交易量序列存在高度的序列相关性,即高度可测的,这为其分解为预期和非预期两部分提供了理论基础,同时也反映了交易量所替代的信息流过程也是序列相关的。

图3 上证综指与深证成指日交易量序列自相关和偏自相关图

结合交易量序列的特征,我们首先生成100天的移动平均序列作为交易量的长期趋势部分;然后考虑去掉长期趋势的交易量序列,其自相关和偏相关函数图如下,结果发现该序列仍高度相关,因此是可预测的。

图4 上证综指与深证成指日交易量序列剔除长期趋势后的自相关和偏自相关图

表2 沪深股市量价关系波动方程的参数估计结果及残差检验

上市综指深市成分

模型参数参数值标准差Z统计量参数值标准差Z统计量

α10.1455190.01191412.214610.1241980.01057011.75006

α20.8152350.01460155.835290.8374420.01365561.33007

α1+α20.9607540.961640

Log likelihood-1832.888-1993.793

Akaike info criterion1.7238391.874923

α10.1363490.01254410.869680.1141050.01106510.31259

α20.8168520.01609150.763610.8416190.01462957.53084

β1-0.0132490.002909-4.554049-0.0126340.003183-3.969434

β20.0051770.0034481.501500-0.0025280.008276-0.305491

β30.0132150.0183540.7200150.0326600.0298861.092821

α1+α20.9532010.955696

Log likelihood-1710.466-1866.091

Akaike info criterion1.6902671.843517

根据数据本身的特点,结合ARIMA模型的建模技术,根据AIC、SC最小信息准则,对于沪市与深市去掉长期趋势的交易量序列,我们分别采用ARIMA(1,1,1)和ARIMA(1,1,1)模型,模型的残差作为非预期交易量,模型的预报值作为预期交易量。预期交易量反映了交易量中短期可预期成分,而非预期交易量可以解释为由于新信息的冲击而产生的交易量,用100天的移动平均序列来描述交易量中长期趋势,这三部分之和等于原交易量序列。

二、模型及方法

根据上面的分析,股票价格收益序列具有很强的条件异方差性,结合ARCH模型及扩展GARCH模型的特点,本文选择GARCH模型来研究价格收益序列的波动性。但是GARCH(p,q)模型,主要用来描述时序变量的条件方差特征,一般与Rt的条件期望无关,而实际上,时序变量条件方差的变化往往直接影响其条件期望的值。因此,我们使用对均值方程的条件期望和条件方差都作了描述的GARCH―M模型。一般的GARCH―M模型描述的随机过程时序变量{Rt}的条件均值方程,有如下表示形式:

Rt=Xtβ+δ・g(ht)+εt(3)

其中,g(ht)为条件方差ht的函数,一般地设g(ht)=ht,δ反映了条件方差对时序变量{Rt}条件均值的影响。具体地,在本文中,使用GARCH(1,1)-M模型,并设g(ht)=ht,得到方程(4)和(5)式:

Rt=α+δht+εt,εt|Ωt-1~(0,ht)(4)

ht=a0+a1ε2t-1+a2ht-1(5)

其中各个参数的含义与上面相同。

根据MDH理论,可以把交易量作为弱外生变量直接加入GARCH 模型的波动方程。按照Bessembinder,Seguin(1992)的方法,我们把交易量分解后的移动平均交易量、预期交易量和非预期交易量三部分一起加入到(5)式的条件方差方程。于是得到方程(6): ht=α0+α1ε2t-1+α2ht-1+β1Vpmat+β2Vet+β3Vut(6)

其中,Vpmat表示移动平均交易量,Vet表示预期交易量,Vut表示非预期交易量。β1、β2 和β3分别反映了移动平均交易量(即长期趋势部分)、预期交易量和非预期交易量对股价波动的影响,其它参数的含义同上。联合方程(4)和(6)式,得到本文的实证模型:

Rt=α+δht+εt,εt=htet,et~IID(0,1),

ht=α0+α1ε2t-1+α2ht-1+β1Vpmat+β2Vet+β3Vut

三、模型检验及分析

根据MDH理论,如果MDH 模型能够有效解释价格收益的ARCH效应,在GARCH模型的条件方差方程中加入交易量,则交易量前的系数估计值应该显著大于零,而作为潜在信息流变量的替代指标,一定会部分吸收价格波动的持续性,方程中的持续性参数(α1+α2)一定会减小。我们利用上证综指和深证成分指数1997年7月25日一2008年6月6日的数据资料,对模型方程(4)和(6)式中的参数进行估计,其实证结果如表3所示。对沪、深股市量价关系波动方程残差序列进行ARCH效应检验,结果表明在滞后阶数为1~12时均接受原假设,即加入交易量的GARCH(1,1)―M模型,其残差不再具有ARCH效应;图5的残差方差序列的自相关与偏相关系数都落入随机波动区域,说明残差方差序列已不存在自相关。这证明在波动方程中添加交易量之后的GARCH(1,1)―M模型能够很好地描述股票市场收益波动序列的持续性与自相关性。

对模型深入分析可以得出:

(1)加入交易量之前的GARCH(1,1)-M模型,沪、深两市条件方差方程的持续性参数(α1+α2)均约等于1,说明我国股市具有很强的波动集群效应和波动持续性特征;加入交易量之后的条件方差方程中,持续性参数(α1+α2)有所减小,这意味着价格

图5 沪、深股市量价关系波动方程残差序列及其残差平方的自相关和偏自相关图

收益波动的持续性部分被加入的交易量吸收,也就是说,在中国股票市场,交易量对价格波动确实具有一定的解释能力,交易量所替代的信息流过程是价格收益时变条件异方差的重要源泉,这基本上和MDH假说相吻合。

(2)在条件方差方程中加入交易量,发现移动平均交易量前的系数估计值均为负值,并且在5%的显著性水平上显著,说明我国股市的波动与长期交易量负相关,从前面对我国沪深指数收益率表现出来的正的偏度和两市日交易量表现的增长趋势的关系可以得到同样的结论,这与一般地认为我国股市交易量与价格波动正相关的结论是不同的。

(3)在条件方差方程中加入交易量,发现沪市和深市短期预期交易量前的系数估计值正好相反,并且在5%的显著性水平上不显著,与我国股市这些年来的表现不佳是分不开的,从前面两市收益率的均值的差异可以得到同样的结论,这与我国一些相关研究的结论并不一致,可能是选取的具体数据方面的原因。

(4)在条件方差方程中加入交易量,非预期交易量前面的系数都为正(但是t统计值不很显著),说明非预期交易量对股票收益率的具有正相关影响,这基本上与相关的研究结论想符合。

(5)需要强调的是,沪市非预期交易量的估计系数大约分别是移动平均交易量和预期交易量估计系数绝对值的1倍和3倍(深市分别为3倍和16倍),这就说明,非预期交易量对股市波动的解释能力要比预期交易量和移动平均交易量的解释能力更重要,即中国股票市场的短期波动主要是由非预期交易量导致的,这和国内外的研究基本吻合。

五、结论

本文运用GARCH―M模型,实证检验了中国股票市场波动性与交易量之间的关系,得到中国股票市场并不完全符合国际上研究量价关系的混合分布假说(MDH)理论的结论,具体地:(1)交易量所替代的信息流对中国股市的波动性具有一定的解释能力,中国股市的波动性在短期部分是由非预期交易量导致的;(2)非预期交易量所替代的信息流对中国股市波动的解释能力要比预期交易量所替代的信息流对中国股市波动的解释能力更重要;(3)中国股票市场并不完全符合国际上研究量价关系的混合分布假说(MDH)理论,部分交易量所替代的信息流是引起股市波动的根源,主要体现在由新信息流引起的非预期交易量是引起股市波动的根源,而大量的移动平均交易量所替代的长期信息流和短期预期交易量所替代的信息流对股市波动的解释作用并不是很明显,出现不同程度的负相关(或者影响并不显著),反应了中国股票市场的运行效率尚未达到弱式有效,这和部分中国学者的研究结论相悖。

参考文献:

[1]Clark P K. A subordinated stochastic process model with finite variance for speculative prices [J].Econometrica,1973, 41 (Jan. ) : 135- 155.

[2]Epps T W, Epps M L. The stochastic dependence of security p rice changes and transaction volumes: implications for the mixture of distributions hypothesis [J]. Econometrica, 1976, 44 (Mar.) : 305- 321.

[3]Tauchen G, Pitts M. The price variability-volume relationship on speculative markets [J]. Econometrica, 1983, 51(March) : 485-505.

[4]陈怡玲,宋逢明.中国股市价格变动与交易量关系的实证研究[J].管理科学学报,2000,(3).62-67.

[5]李付军,达庆利.中国股市量价波动性关系的实证分析[J].东南大学学报(自然科学版),2005,33(2):308-310.

第7篇:数量关系论文范文

阅读本作,感到有以下特点:

1 研究视角新

科学计量学研究专著,在中国从上世纪80年代中期赵红州的《科学能力学》第二篇,到90年代初,谷兴荣先生《科学技术发展的计量研究》出版发行,至今已有相当一批科学计量学学术成果。但绝大多数专著都是运用文献计量学的方法进行研究。谷先生对它的整体结构功能规律进行探讨,采用的是计量经济学与数理经济学的研究方法。谷兴荣认为:用文献计量学研究科学计量学主要是研究科学技术的文献资料的分布结构和结构变化规律,这只是科学计量学研究内容中的一部分。另外还有科技机构、科技人员、科研经费的分布结构和演变规律问题,社会环境、科技经费、科技人才与科技成果的数量、质量之间的因果关系,科技发展对经济社会的影响关系,这些内容的研究是文献计量学方法不能解决的,只有计量经济学方法能解决。反过来,计量经济学、数理经济学的方法可以研究科技文献与科技成果的分布问题。而且,年轻一代的管理学者,运用经济数学与管理数学方法写了不少科学学与科技管理的计量研究论文。可见这是一个大的发展方向,谷先生在本作中概括出一个庞大而系统的论著是有重要意义的。

2 观点新,创新程度大

此专著运用计量经济学方法,对科学学与科技管理的结构、功能、发展规律等提出了一系列的理论观点,并用数学方法给予表述。在第34页把全书的基本论点的来源列了一张表。从表中可见,全书共有61个论点,其中,由本书作者在过去首次提出,并且先后以论文形式发表过的有42个论点,占68.8%;吸收其他学者的论文论点有19个,占31.2%。由此说明本书作者对科学学与科技管理计量研究的理论创新程度是相当大的。而且,多数论点都是有理论与实际意义的基本理论问题。比如:科学技术区际结构三大发展规律(两极分化、梯度转移、中心转移规律)的统一性原理等等,提法新颖,论证清晰, 很有意义。

3 内容广泛,涉及到科学学与科技管理领域多方面的基本理论问题

任何学科都是讨论研究对象的结构,外在表现形式和自身活动的方式,活动功能、演变和发展规律三个问题,此专著对科学技术体系各方面的结构和结构演变规律都作了详尽的定量探讨,如科技研发的要素结构及其演变机制,科学技术的门类结构、学科结构、知识结构、区际结构及这些结构的演变规律,以及这些结构的内在各部分的弹性替代关系等。这部分内容将近30万字,是目前科技结构研究中最广泛最详细的研究成果之一。

关于科学技术的运作方式、运作机制和经济社会功能与研究效益问题,从五个方面写了近15万字。包括科学技术发展的三大动力机制,科学技术与经济的链锁关系与替代关系,科学技术的社会经济功能及作用规律的定量研究,科学技术的社会经济功能及作用规律的定量研究,科学技术研发效益的历史变化规律等,都进行了系统的量化分析。

在科学技术的传播、渗透、转化发展及其评价方面, 分为五个方面写有20多万字。包括科技传播与渗透效应的几个问题研究, 科技发展与科技转化的质量指标和质量诊断问题, 科学技术发展历史规律与新陈代谢机制的定量研究; 科学技术活动的三大基本法则与行为边界的定量研究; 科学技术评价的四大指标与四大环节, 四大指标即数量指标, 质量指标, 效益指标和综合指标。四大环节即指标的选取与选取标准环节, 指标分类环节, 指标的组合建模环节, 指标的测算与检验环节等, 都作了全面的量化研究。

由此可见, 本作是科学学与科技管理领域中涉及面较广的大部头基础研究成果之一。

4 内容的系统性与逻辑性强,全书结构有科学性和合理性

由于研究时间较长,内容较多,相互之间已经构成了完善的理论体系。从编的层次看,第一编是讨论科学技术结构及其演变规律,是科学技术的横向结构,以及横向结构在科学技术发展中的变化。第二编讨论科学技术运行发展的机制和社会功能,前者是横向的,后者是纵向的。但都是指科学技术体系内在各部分之间的空间结构和各部分之间的时间依存关系和变化关系。第三编讨论科学技术传播发展与评价理论,这是科学技术体系的整体性发展规律,科技发展状态和科技活动结果的测评,与第一、二编相对应。每一编的各章之间,每一章的各节之间等都具有互为联系的系统性,相互间有较强的逻辑性。

5 计量分析的普及面较广,定量分析的程度较高

第8篇:数量关系论文范文

关键词:移动通信GPRS,网络资源配置

 

引言

随着移动通信业务量和网络规模的迅猛发展,如何在兼顾资源利用效率和客户感知的前提下,最大限度地合理调配网络资源已成为无线网络运营商解决网络容量与资源矛盾的重要课题。博士论文,移动通信GPRS。

在实际网络优化中,网络资源配置是影响GPRS服务质量的最主要因素之一,配置的好坏在很大程度上就决定了GPRS平均吞吐速率的大小。博士论文,移动通信GPRS。因此,本文从特定环境下的数据业务速率需求入手,建立起了其与数据业务流量及空口信道资源三者之间的相互推导关系,从而得到了基于速率期望的GPRS资源配置算法。

1 现状分析

目前对于GPRS数据业务最常用的理论方法是根据爱尔兰C表求口口信道配置数。爱尔兰C表针对的模型特征虽然在“信道占满后呼叫不会被拒绝”这一点上符合数据业务的特征,但基于“排队服务系统”有悖于GPRS 的“信道共享”系统特征,即“同时占用信道而不是排队等待”。因此,如何为GPRS/EDGE业务提供一个符合其系统本质特征的模型计算方法,就成为计算结果可靠性的关键。博士论文,移动通信GPRS。

2 算法提出

针对GPRS网络“带宽共享”这一特点,本文根据用户数量及状态转化的概率分布,建立了一个近似GPRS系统特点的数学模型,如图所示:

图1 GPRS用户状态转换系统模型图

根据以上GPRS用户状态转换系统模型,推导出了“数据量”、“业务质量”及“信道资源”三者的数学关系公式,对应到统计变量即为:“数据等效话务量”、“每用户速率期望”及“GPRS信道配置数”,从而得到基于速率期望的GPRS空口信道配置算法,公式如下:

其中,数据等效话务量可由数据业务流量得到;每用户速率期望可由每信道速率V 与每用户平均速率n计算得到;n为手机终端支持的最大下行接收时隙个数,可根据地区实际情况在现网中统计得到。

在实际应用中,一般以“每用户速率期望”作为质量要求的限制条件,从而可以得到一定信道配置情况下可以支持的最大数据业务量或者一定业务量需求下所需的信道配置数量。博士论文,移动通信GPRS。

目前,本算法已申请专利保护。

3 实践应用

在本文提出的“基于速率期望的GPRS空口资源配置方法”基础上,通过多次实验修正,结合长期实践经验,总结出了从空口到Gb口一系列相关资源的标准化调整方法与流程。博士论文,移动通信GPRS。

图2 GPRS相关接口及网元资源分布图

为满足实际网络维护工作的需要,中国移动吉林有限公司通过网管支撑平台实现了“一键式”的快捷IT支撑,并在全省范围内进行了推广。博士论文,移动通信GPRS。在保证资源配置合理性的前提下,极大的提高了GPRS/EDGE网络资源优化的工作效率。

由本文算法衍生的《数据资源管理一键式服务》项目,不仅在保证客户感知度的基础上,为吉林移动降本增效达400余万元,更实现了GPRS网络资源配置的标准化、流程化管理。

结语

基于速率期望的GPRS资源配置算法,是在创新系统模型架构前提下,通过科学的理论推导与实验修正,结合长期实践经验,总结出的可靠性高、可用性强的新型GPRS资源配置算法。通过现网实践应用证明,通过速率期望、数据流量与资源配置三者的科学计算,可以有效地平衡GPRS业务的服务质量与资源成本,为企业与客户创造价值。

第9篇:数量关系论文范文

关键词:协方差分析;偏最小二乘;结构方程模型;综合评价

一、 引言

近年来,综合评价方法有了更多的发展。更为复杂的统计模型被引入到综合评价领域,其中,结构方程模型就是最近几年经常被用于综合评价的新方法之一。结构方程模型是潜变量模型与路径分析模型的结合,可以分析不能被直接观测的潜在概念间的关系,因而在社会学、心理学、教育学、市场研究等学科中有着独特优势。从参数估计的角度分,有两种类型,一种基于方差-协方差分析(CB-SEM),另一种基于偏最小二乘(PLSPM)。通过查阅近几年的文献发现,两类方法的综合评价研究都有不少成果。例如,前者的文献涉及的领域有:医学(刘享辉等,2009;刘岭等,2009),教育(周平红等,2011;王理峰,2012),管理(任等,2007;谷晓燕,2009),经济发展(高文杰和高旭,2010;张瑛和王惠文,2008),竞争力评价(易丽蓉,2006;罗玉波和王玉翠,2013)等等。后者涉及的领域有:医学(杨威和张拓红,2012),教育(孙继红等,2010),管理(莫一魁和沈旅欧,2009;鲜思东和彭作祥,2011;林盛,刘金兰和韩文秀,2005;关子明等2009,区晶莹等,2011),经济发展(阮敬和纪宏,2006)等等。可见,两类方法在综合评价应用的领域有很多交叉。并且,从目前的研究成果可以看出,两类方法进行综合评价的方式也基本类似,都通过设计指标体系,建立理论模型,然后计算综合指数得分实现综合评价。但是,从统计学方法论角度而言,这两类方法的除了目标都是路径模型之外,没有任何内容上的交叉(吴喜之,2013),因此模型的实质和解释都有很大差异。为此笔者认为,在综合评价实践中,两类方法不能用相似的方式应用,但是如何区分对待?目前为止,鲜有文献对此问题做出明确回答。本文将围绕该问题,结合结构方程模型理论要点和综合评价要求,分析如何正确使用这两类结构方程模型进行综合评价,并给出建议。

二、 两类结构方程模型的理论要点

虽然两类结构方程模型在理论上有差别,但是在实际建模中,都需要事先设计指标体系,设定理论模型,才能进行估计。指标体系和理论模型的设定由实际问题的理论背景支撑,模型的估计有现成的软件,例如CB-SEM的常用软件有AMOS,而PLSPM则有smartPLS等,因此,应用这两类方法正确与否的关键在于对模型估计的理解。为此我们分析两类结构方程模型参数估计的理论要点。

1. CB-SEM的参数估计。CB-SEM由结构模型和测量模型组成,分别刻画潜变量与潜变量之间的关系,潜变量与可测变量之间的关系。建模时,需要对可测变量划分为不同的组,每组对应一个潜变量,并且设定好潜变量与可测变量以及潜变量与潜变量之间的关系。关于模型的表达式参见易丹辉(2008)。关于模型的参数估计,有很多种方法,在实际应用中常见的估计方法为似然方法,其拟合函数为:

FML=ln|?撞(?兹)|+tr(S?撞-1(?兹))-ln|S|-(p+q)

这里的p和q分别为内生可测变量和外生可测变量的个数。还有一些其他方法,如未加权最小二乘,拟合函数为:

FULS=■tr[(S-?撞(?兹))2]

以及使得拟合函数

FGLS=■tr{[(S-?撞(?兹))W-1]2}

最小的广义最小二乘方法。此外,还有利用工具变量的两步最小二乘等。其中,S为总体协方差矩阵,用样本协方差矩阵代替。?撞(?兹)为模型预测值的协方差矩阵,含有未知参数?兹,这些方法最终都可以归结为?撞(?兹)与S尽可能接近的原理,即协方差矩阵的重复问题。如果模型是正确的,协方差矩阵就可以被准确地重复出来,这是CB-SEM参数估计的出发点和核心。

我们指出两点需要注意的地方:

(1)由模型产生的协方差矩阵?撞(?兹)重复的是总体协方差矩阵S,但是在实际应用中,总体协方差矩阵不可能知道,为此实际中的S是样本协方差矩阵。这就导致了代替的合理性问题,即样本协方差矩阵能在多大程度上反映总体协方差矩阵呢?这个问题很难回答,但是如果样本量不够的话,代表性一定不好。这就要求在实际中使用大样本,使得样本协方差矩阵能够更好地刻画总体协方差矩阵。

(2)可测变量的总体协方差矩阵刻画了各变量间的相关关系,因此,?撞(?兹)对总体协方差矩阵的重复本质上是用总体协方差矩阵去考察模型所设定的不同组可测变量间关系的合理性,如果参数通过显著性检验和合理性检验,就认为模型设定的关系得到了总体信息的验证。这意味着CB-SEM首先是一种验证性的方法,验证的是模型设定的结构。本质上是各可测变量间的相关关系。为此需要注意,CB-SEM只是刻画了不同组可测变量间的相关结构,并通过潜变量具体表达。至于各组可测变量能在多大程度上被对应的潜变量刻画,该方法并不能回答。

2. PLSPM的参数估计。相比CB-SEM,PLSPM完全是另外一套逻辑,为了分析其特点,我们通过分析其参数估计过程入手。PLSPM的参数估计由迭代算法完成,分为两个部分,第一部分是利用一系列最小二乘和加权运算进行迭代,得到潜变量的估计值,第二部分利用第一部分的结果得到路径模型中的载荷系数和路径系数。这两部分中,第一部分是核心。

具体而言,首先要分划好可测变量的归属,一个潜变量对应一组可测变量。假设有Q个潜变量?孜1,…,?孜Q,第j个潜变量对应的可测变量为Xj=(xj1,…,xjpj)′,j=1,…,Q。则有xjh=?姿jh?孜j+?着jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?着j,前者为反映型(Reflective),系数为载荷;后者为反映型(Formative),系数为权重,选择何种形式需要根据实际问题决定,这种反映可测变量与潜变量关系的模型为测量模型。其次要设定好潜变量与潜变量之间的关系结构,即?孜i=?撞j≠i?茁ij?孜j+vij。这部分模型称为结构模型,模型中的系数为路径系数。潜变量的得分(即潜变量的估计值)是进行综合评价的关键,对其估计通过迭代实现。由三大步骤组成:

外部逼近:

Yj∝■wjhxjh

Yj是?孜j的外部逼近估计量,∝表示左边是右边的标准化,Wj=(wj1,…,wjpj)′是外部权重。

内部逼近:

Zj∝■ejiYi

其中,i:i?圮j表示与第j个潜变量直接有关的潜变量的下标。eji是内部权重,有三种不同的形式(Tenenhaus M 2005)。

更新权重:

内部权重由潜变量间的结构决定,迭代过程中需要更新的是外部权重,当测量模型为反映型时,对于xjh,其新权重为以Zj为自变量,xjh为因变量的一元线性回归系数,但由于Zj被标准化,因此有wjh=cov(xjh,Zj)

当测量模型为构成型时,新的权重以Zj为因变量,与之对应的可测变量xjh为自变量的多元线性回归的回归系数,即

Wj=(Xj′Xj)-1Xj′Zj

上述步骤反复迭代,直到权重变化不大,就认为收敛,得到最终的权重估计值,潜变量的得分就是可测变量的加权平均值。

通过上述对迭代过程的描述,我们也得到两点关于PLSPM的认识:

(1)在PLSPM框架下,没有涉及总体协方差矩阵。迭代过程完全基于样本信息展开。事实上,Dijkstra. T(1983)证明,PLSPM的迭代本质上是不动点的迭代算法,具体为:

反映型:Wj∝?撞i:j?圮ieji・SjiWi,其中Wj′SjjWj=1;

构成型:Wj∝S-1jj?撞i:j?圮ieji・SjiWi,其中Wj′SjjWj=1

其中,Sji为第j组可测变量与第i组可测变量的样本协方差矩阵,Sjj是第j组可测变量的样本方差矩阵。

因此,PLSPM挖掘的是样本信息,对样本量的要求没有CB-SEM高。

(2)PLSPM的迭代过程本质上通过一系列的最小二乘(OLS)实现,因此不必假定分布。另外,PLSPM的迭代事实上是不断逼近某个潜变量估计值的过程。每次迭代都适用最小二乘,追求潜变量与可测变量间的距离最小化。因此是寻找最能刻画可测变量的潜变量的过程。而不是CB-SEM那样验证可测变量间相关关系的过程。这意味着两种方法的目的很不一样。

三、 综合评价中实践中的问题和评述

将结构方程模型引入综合评价领域的优势已经被很多学者认同,这是因为,在综合评价实践中很多方法都面临一个共同的问题:很多方法没有考虑到指标变量之间的相关关系,因此,当所选择的指标变量集合中存在严重的多重相关性时,很可能会夸大系统中某些特征的作用,从而得到不合理的评估结论。王惠文和付凌晖(2004),张瑛和王惠文(2008)都认为结构方程模型可以解决这样的问题。但是目前很多研究都利用结构方程模型构建综合指数实现综合评价,将两种理论上存在差异的方法以类似的方式进行综合评价,笔者认为需要推敲其合理性。为此我们提出:CB-SEM和PLSPM是否都可以通过构建综合指数实现综合评价?

下面回答这个问题。我们有以下结论:

1. CB-SEM不能用于构建综合指数。

首先我们要明确综合评价的要义,苏为华(2005)指出,综合评价需要将多个因素和指标综合起来,因此,综合方法构成了评价的基本模型。为此,利用综合指数进行综合评价时,对指数的基本要求是能够概括多个指标各方面的信息。

当利用结构方程模型构建综合指数时,这个要求就变成:首先,每个潜变量是否在某种准则下对其对应的可测变量进行了概括。其次,这些潜变量是否反映了各组可测变量的多重相关性。对于CB-SEM而言,其参数估计方法决定了该方法构建的综合指数只能反映各组可测指标的多重相关性。这是因为其参数估计依据的优化准则本质上都是使得由模型得到协方差矩阵逼近总体协方差矩阵。如果模型是正确的,那么总体协方差矩阵就能被准确地重复出来(易丹辉,2008),所以,模型正确是指正确反映了各组可测变量的协方差结构,即它们的多重相关性。但是每组可测变量对应的潜变量是否将可测变量的信息进行了充分的概括,我们是不知道的。利用这样的潜变量得分作为综合指数不能反映真实情况。事实上,在实际应用中,利用CB-SEM分析数据时,我们只需要知道一个样本协方差矩阵就可以利用软件估计。言下之意,我们不用去关心可测指标如何取值,量纲如何等综合评价中关键的问题,只要协方差矩阵相同,即使具体指标完全不同也可以得到相同的估计结果,这个事实反过来说明CB-SEM构建综合指数是值得商榷的。

2. PLSPM可以构建综合指数。与CB-SEM不同,PLSPM的参数估计是从潜变量在平方损失角度下概括可测变量的角度出发的,其迭代过程由最小二乘和加权运算构成,本质上是在xjh=?姿jh?孜j+?着jh(h=1,2,…,pj)或者?孜j=?撞pjh=1wjhxjh+?着j中,使得?撞j?撞hE(?着2jh)最小或者?撞jE(?着2j)最小,且结合各潜变量之间的关系不断迭代实现的参数估计。为此,利用PLSPM得到的潜变量得分是在平方损失意义下对各组可测变量的概括,符合构建综合指数的基本要求。相对CB-SEM,PLSPM更适合构建综合指数进行综合评价。但是需要注意的是,PLSPM的最小化准则是最小化平方损失,虽然在统计学中,这是一种十分常用的方法。例如线性回归模型、主成分分析、因子分析等都是如此,但是是否适用于综合评价需要根据实际问题。关于这个问题的讨论是多元统计方法应用于综合评价的共同问题,苏为华(2000)曾详细讨论。

3. 两类方法适用性评述。前面已经支出,CB-SEM不适合构建综合指数,但是不意味着这个方法在综合评价时就一无是处。通过分析其参数估计的实质,我们认为,CB-SEM适合考察多组可测指标间的多重相关性。如果只是通过相关系数,只能很粗略地知道多个可测变量之间的相关结构。但是通过CB-SEM可以更细致地考察多个可测指标间的复杂结构关系。PLSPM可以用来构建综合指数,但其参数估计方法决定了其不能像CB-SEM那样从整体上对所有可测指标的相关结构进行考察,为此有学者认为,两种方法是互补的(邱皓政,2011)。笔者认为,这种相辅相成性是由于两种方法处理的问题本质上是不一样的,实际应用中可以将两种方法结合起来一起使用,可能效果更好,但目前在学术界没有看到这方面的研究。

另外,前面分析也指出两类方法对于样本和分布的要求是不同的。PLSPM不需要大样本和分布假定,这被很多人认为是CB-SEM不具备的优势。笔者认为,进行综合评价从统计学角度讲是利用已有样本信息,去推测为止的信息,本质上是预测的过程。因此建议,无论用哪一种方法,都尽量使用大样本,才能得到更加可信的结果。

四、 结论和建议

本文通过分析两类结构方程模型(CB-SEM和PLSPM)的参数估计理论,明确了两种方法是两种不同的方法。结合综合评价的要求,我们有以下结论:

1. CB-SEM的参数估计过程决定了该方法不适用构建综合指数,因为其中的潜变量在多大程度上概括了对应的可测变量是不清楚的;

2. CB-SEM适用于评价多组可测指标的多重相关性,利用该方法可以得到多个可测指标间细致的相关结构的刻画;

3. 相比CB-SEM,PLSPM更适合用于构建综合指数进行综合评价。因为,这个方法是基于平方损失下最大化概括可测指标信息实现潜变量得分估计的。符合综合评价的基本要求。

4. PLSPM没有从整体上直接对多个可测指标的多重相关性进行刻画,为此从适用性上,评价多个可测指标的相关结构不如CB-SEM合适。从这个意义上讲,两种方法是互补的。

在实际进行综合评价时,我们建议,首先需要明确实际问题的侧重,如果侧重评价多重相关结构,就推荐使用CB-SEM,如果需要构建综合指数,就使用PLSPM。

参考文献:

1. 高文杰,高旭.基于SEM的我国重要城市现代化水平综合评价模型研究.数学的实践与认识,2010,(18):56-64.

2. 谷晓燕.基于结构方程模型的岗位评价研究.中国管理科学,2009,(2):146-151.

3. 关子明,常文兵,王薇.基于结构方程模型的银行员工绩效考核方法.经济论坛,2009,(2):108-109.

4. 刘岭,程迪祥,陈洪,易东.结构方程模型在综合评价中的应用.自动化与仪器仪表,2010,(2):74-75.

5. 刘亨辉,王建生,周脉耕,王骏,王黎君,胡以松,王玉英,葛辉,杨功焕.结构方程模型在中国居民自报健康状况评价中的应用.中国健康教育,2009,(5):333-337.

6. 罗玉波,王玉翠.结构方程模型在竞争力评价中的应用综述.技术经济与管理研究,2013,(3):21-24.

7. 林盛,刘金兰,韩文秀.基于PLS-结构方程的顾客满意度评价方法.系统工程学报,2005,(6):653-656.

8. 莫一魁,沈旅欧.城市公交系统公众评价的偏最小二乘通径模型.深圳大学学报(理工版),2009,(4):436-440.

9. 区晶莹,张淞琳,俞守华.基于偏最小二乘通径模型的农民工信息能力综合评价.农业系统科学与综合研究,2011,(4):495-501.

10. 阮敬,纪宏.基于PLS结构方程模型的中国西部地区经济发展综合评价.统计教育,2006,(8):4-7.

11. 孙继红,杨晓江,缪榕楠.我国高等教育发展统计特征的PLS通径模型分析.数理统计与管理,2010,(2):362-371.

基金项目:国家自然科学基金(项目号:11361019);广西自然科学基金重点项目(项目号:2013GXNSFDA019001)。

相关热门标签