评价方法论文精选(九篇)

时间：2023-09-20 15:44:40

评价方法论文

第1篇：评价方法论文范文

[关键词]统计公信力评价方法

统计公信力的评价方法就是指对统计公信力进行评价所依据的原则，采取的步骤、程序及其理论体系。合适的统计公信力评价方法、其本身不仅要具有科学性、系统性、完整性，而且要具有简单性、易理解性、可操作性和通用性。因此，在探讨统计公信力评价方法时，既要遵循评价客观事物发展变化应遵循的一般规律，又要体现我国统计理论和统计实务发展变化的特点，还可以借鉴评价相关的社会经济活动如企业、政府偿债能力、会计公信力等的评价方法以及国际上一些常用的做法和习惯。这样提出的统计公信力评价方法可能会更实用和有效。

一、建立统计公信力评价方法应遵循的原则

建立统计公信力评价方法应遵循的原则主要包括科学性、系统性、完整性、明晰性、可操作性、适用性以及通用性原则。这些原则为建立统计公信力评价方法提供了指南，以便对统计公信力评价方法进行思考和探讨。

1.科学性原则。这是人的任何思维活动都应遵循的普遍原则。对于建立统计公信力评价方法来说，科学性原则就是指所建立的统计公信力评价方法要符合统计公信力评价方法内在固有的规律性即固有的知识体系。因此，只有遵循这一原则，所建立的统计公信力评价方法对统计公信力的评价才会更准确。得出的结论才能为人们接受，从而影响人们的活动，促进统计工作的完善。当然，签于人们的认知水平，所提出的统计公信力评价方法未必能够达到完全的科学程度，但这并不妨碍人们在思考统计公信力评价方法时，从出发点到结果，应当遵循科学性这一原则的要求。

2.系统性原则。统计公信力评价方法涉及到多方面的内容，主要包括统计。公信力的定义，统计公信力评价方法的定义、目标、任务、对象、要求、内容、运用以及相关的其他问题等。系统性原则是指在研究统计公信力评价方法时，要对统计公信力评价方法所涉及的全部要素进行系统的研究，即将其看成是一个系统，研究系统包含的各种要素及其相互关系。这才能统计公信力有全面的认识，所提出的统计公信力评价方法在理论上才会具有较为普遍的意义。

3.完整性原则，统计公信力评价方法从涉及内容来看，包括定义、目标、任务、要求以及内容等诸多要素构成，但从要达到目的的角度来看，统计公信力评价方法是一种程序，解决问题的步骤。完整性的原则是指建立统计公信力评价方法时，不仅要求学统地研究统计公信力评价方法所涉及的各项要素，根据研究结论构建统计公信力评价方法，更重要的是所构建的方法，其程序、步骤要完整、各步骤上的内容要完整，甚至包括使用说明也不能缺少。这样统计公信力评价方法才会被更有效地使用。

4.明晰性原则。建立统计公信力评价方法的目的首先在于相关使用者能够使用其对统计公信力进行评价。如果评价统公信力的方法过于复杂，使用者对其中的内涵、内容等不能全面掌握，那就难以做对统计公信力有效评价。时晰性原则是指统计公信力的评价方法要简单、明了，通谷易懂易于理解。这样有利于使用者准确，完整地把握统计公信力评价方法包括的内容、要求等。从而更如地对统计公信力评价方法加以使用。

5.可操作性原则。统计公信力评价方法的可操作越强，越便于使用，越是有普遍性。统计公信力评价方法不仅要应简单、明了、通谷易懂、易于理解，而且要便于使用。如果使用者在使用统计公信力评价方法时，所需素材不易收集，成本较高等，这就会影响使用者对方法使用，进而影响对统计公信力的评价，达不到方法要实现的目的。操作性原则是指统计公信力评价方法使用的条件应易于满足。在建立统计公信力评价方法的，遵循可操作原则有于利于开展对统计公信力的评价。

6.多样性原则。方法是达到目的手段，会随着条件而变化，也会因人们思考问题的方式不同而有所不同。多样性原则是指统计公信的评价方法应当有不同层次，不同类型，不同使用者从不同角度对统计公信力进行考察的选择余地。不是局限于某一种方法。这样各种方法可以相互印证，也便于使用者灵活运用。

7.通用性原则。提高统计公信力是世界各国统计工作追求的目标之一。为此，各国统计部门及其统计研究机构都会设法达到其中的目标，对统计公信力进行评价就是重要的提高统计公信力的措施。在对统计公信力评时，不同的国家会根据自己的情况探索出一些实用有效的方法。这些方法由于使用的目的、对象、任务、作用等方面区别不大，因此方法具有通用性可以相互参考，相互借鉴。从另一个方面来看。评价是人类认识事物，检查自身活动是否有效，是否达到目标的基本手段，基本环节。因此有活动就有与之对应的评价方法。各种活动虽有所不同，但评价方法的原理基本相似，也可以相互参考、相互借鉴，对统计公信力评价方法来说，通用性原则就是指设计统计公信力评价方法时，尽可能地参考，借鉴和使用其他有关相似活动的评价方法以国际上的一些评价方法，使统计公信力评价方法更容易理解和使用。

8.适用性原则。统计公信力评价方法的提出，其目的是为使用。适用性原则是指统计公信力评价方法要符合我国的社会经济环境，符合统计工作的实际情况，在用于评价统计公信力时是比较有效的。具体体现在统计公信力评价方面，就是方法的繁简要适当，耗用的时间要适当，使用的成本要适当，评价的结果要适当。通过对统计公信力的评价基本能反映出我国统计公信力的高低。有肋于采取措施促进统计公信力的提高。

二、统计公信力评价方法的探讨

根据建立统计公信力评价方法的原则、我国统计工作的实际情况以及其他相关学科、实务评价活动的理论和实践，对统计公信力评价所设想的方法主要有统计内部评价法，统计外部评价法，国内评价法，国际评价法，历史评价法，综合因子评价法，指数评价法等。

1.统计内部评价法。统计公信力内部评价方法是指通过统计机构、统计人员以及与统计工作相关的主体对统计公信力进行评价所形成的方法。提出这种方法的主要理论依据是统计质量的高低是影响统计公信力的主要因素。统计质量越高，统计公信力才能越高。由于统计主要是采集、加工、产出和供应统计信息。因而统计的质量主要取决于统计信息的可靠性、准确性、及时性以及有用性等。统计信息的可靠性、准确性、及时性以及有用性越好、统计质量就越高。统计信息是否可靠、准确、及时和有用、应当说统计机构、统计人员以及与统计相关的主体最有发。因为他们经历了统计信息形成的全过程。尤其对统计信息的准确性、可靠性最了解。因此，出自统计系统内部的统计公信力评价在一定意义上更有价值。这种方法的基本步骤是由统计公信力信息调查收集、信息加工、整理、分析和综合以及得出评价结论三部组成。统计公信力信息调查收集主要是通过向统计内部的相关主体调查收集对统计公信力的评价资料，然后对所收集的评价资料进行加工、整理、分析和综合，最后得出统计系统内部对统计公信力高低的评价结论。

2.统计外部评价法。这种方法是指由统计系统以外的不同主体对统计公信力做出评价的方法。从统计公信力的含义来看，统计公信力就是统计对政府、社会、公众的影响力。这种影响力主要取决于公众、社会、政府对统计的信任程度。在一定意义上，可以认为是统计的公共“信用”能力。这种“信用”能力越强、统计公信力越高；相反，则越低。因此，统计系统外部对统计公信力进行评价具有直接的意义。与内部评价法基本相同也通过三个步骤，最后得出对统计公信力评价的结论。

3.国内评价法。即由国内不同主体对统计公信力作出评价的方法。这种方法主要是通过对国内不同主体调查，收集其对统计公信力评价的信息。然后进行综合得出对统计公信力评价的结论。当然，也可以将统计系统内、外部对统计公信力评价的结论进行综合得出国内对统计公信力评价的结论。

4.国际评价法。即由国际上的组织或机构对我国统计公信力作出的评价方法。目前，我国已成为世界第四大经济体，是国际经济政治活动的主要参与者，是各种国际组织和机构的主要成员。享有各种国际权利，承担着与权利相匹配的国际义务。统计部门提供的各种信息受到世界各国及其国际组织的广泛重视。国际评价法就是通过广泛收集国际组织和机构，如联合国、世界银行、国际货币基金组织、亚洲开发银行以及世界贸易组织等对我国统计活动的评价，以判断我国统计公信力，得出对我国统计公信力评价的结论。

5.历史评价法。通过考察我国不同历时期统计在我国社会经济生活中的地位和作用来评价统计公信力的方法。某一时期，如果统计在社会经济生活中的地位和作用比较高和比较大时，统计公信力相应就比较高；相反，也就比较低。总体上看，统计公信力在历史上是不断提高的，但在某一时期或某几年，统计公信力是波动的，有时高，有时低。通过对历史上统计地位和作用的观察和对比，可以对不同时期的统计公信力作出比较合理的评价。

6.综合因子评价法。这种方法就是根据影响统计公信力的因子以及各种因子对统计公信力的贡献，通过综合来评价统计公信力的方法。其基本过程就是分析影响统计公信力的因子，然后对各种因子影响程度进行量化、综合、根据量化综合的结果，得出对统计信力进行评价的结论。

7.统计公信力指数评价法。通过编制统计公信力指数以反映统计公信力变化状况，评价统计公信力的方法。指数法是描述评价经济活动变化情况的常用方法，将其引入到评价统计公信力范畴也应当是可行的。选择一些能够反映统计公信力且具有代表性的指标，以选定年度为基期，编制统计公信力指数，这样就做能到对统计公信力的动态评价，随时掌握统计公信力的变化情况。

三、统计公信力评价方法运用应注意的几个问题

统计公信力的提出本身就是一个比较新的课题，要为之提出一套比较合适的评价方法是比较困难的。本文尝试着提出了建立统计公信评价方法的一些原则以及多种评价统计公信力的方法，这些原则和方法在实际运用时还有一些问题需要注意。

1.统计公信力评价方法的具体化问题。本文中所提出的统计公信力评方法只是一些基本的想法和思路。因此，在具体运用于评价统计公信力时，还要需详细化，步骤化、规范化以及结论的具体化。这样才能实现真正的应用，做到对统计公信力的有效评价。

2.统计公信力评价方法的结合使用问题。评价统计公信力的方法具有多样性，如何将各种方法有效使用，既能体现出不同方法特点，又能体现出各种方法的共性，应当说以某一种方法为主，其他方法为辅、相结合起来比较理想。在文中所提的七种方法，应当以综合因子评价法为主，以其他方法为辅，最终建立起统计公信力指数评价法是统计公信力评价法的方向。

第2篇：评价方法论文范文

论文摘要在综合评价中,评价指标的选取是否合适,直接影响到综合评价的结果.介绍评价指标选取得一般原则,定量指标的筛选方法,以及如何对定性指标进行量化.

1选取评价指标的一些原则

1.1目的明确

所选用的指标目的明确.从评价的内容来看,该指标确实能够反映有关的内容,决不能将与评价对象、评价内容无关的指标选进来.

1.2比较全面

选择的指标要尽可能地覆盖评价的内容,如果有所遗漏,评价就会出偏差.比较全面的另一说法就是有代表性,所选的指标确实能反映评价内容,虽然不是全面,但代表了某一侧面.

1.3切实可行

用通俗一些说法,说是可操作性.有些指标虽然很合适,但无法得到,就不切实可行,缺乏可操作性.

2定量指标筛选方法

在按一些原则确立指标体系后,这些量都是可以观察、测量的.在这个基础上,可以用统计分析中的方法来选出一部分,它们有很好的代表性,使我们综合评价时,工作更容易些.

2.1条件广义方差极小法

从统计分析的眼光来看,给定P个指标X1,…XP,的n组观察数据,就称为给了n个样本,相应的全部数据用X表示,即

每一行代表一个样本的观察值,X是n×p矩阵,利用X的数据,可以算出变量xi的均值、方差与xi,xj之间的协方差,相应的表达式是:

由Sii,Sij形成的矩阵S=(Sij)p×p(1)

称为X1…XP这些指标的方差、协方差矩阵,或简称为样本的协差阵.用S的行列式值|S|反映这P个指标变化的状况,称它为广义方差,因为p=1时|S|=|S11|=变量X1的方差,所以它可以看成是方差的推广.可以证明,当X1,…XP相互独立,广义方差|S|达到最大值;当X1,…XP线性相关时,广义方差|S|的值是0.因此,当X1,…XP既不相互独立时,又不线性相关时,广义方差|S|的大小反映了它们内部的相关性.下面来考虑条件广义方差,将(1)式分块表示也就是将X1…XP这P个指标分成两部分(X1,…XP1)和XP1…XP),分别记为X(1)与X(2),即

这样表示后,S11,S12,表示X(1),X(2)的协差阵.给定X(1)之后,X(2)对X(1)的条件协差阵,从数

学上可以推导得到(在正态分布的前提下)

S(X(2)|X(1))=S22-S21S11-1S12(2)

(2)式表示当已知X(1)时,X(2)的变化状况.可以想到,若已知X(1)后,X(2)的变化很小.,那么X(2)这部分指标就可以删去.即X(2)所能反映的信息,在X(1)中几乎都可得到,因此就产生条件广义方差最小的删去方法.方法如下:

将X1,…XP分成两部分(X1,…XP-1)看成X(1),XP看成X(2),用(2)就可算出S(X(2)|X(1)),

此时是一个数值,它是识别XP是否应删去的量,记为tp.类似地,对X1,可以将X1看成X(2),余下P-1个看成X(1),用(2-2)就可以算出一个数值,记为ti.于是得到t1,t2,…tp这P个值,比较他们的大小,最小的一个可以考虑是删去的,这与所选的临界值C有关,C是自己选的,认为小于C就可删去,大于C不宜删去.给定C之后,逐个检查ti<C,(i=1,2…p)是否成立,有就删,删去后对留下的变量,可以完全重复上面的过程,直到没有可删的为止,这就选取了既有代表性,又不重复的指标集.

2.2极大不相关法

显然,如果X1与其它的X2…XP是独立的,那就表明X1是无法用其它指标来代替的,因此保留的指标应该是相关性越小越好,在这个方法指导下,就导出极大不相关方法.首先利用(1)式求出样本的相关阵R,

rij称为xi与xj相关系数,它反映了xi与xj的线性相关程度.现在要考虑的是一个变量Xi与余下的P—1个变量之间的线性相关程度,称为复相关系数,简记为ρi.ρi可以用下面的公式计算.先将R分块,例如要计算ρP,就将R写成

(注意R中的主对角元素rij=1,i=1,2,……,p)于是ρ2p=rTpR-1-prp.类似地,要计算ρ2i时,将R中的第i行.第j列进行置换,放在矩阵的最后一行,最后一列,此时

于是ρ2i的计算公式为ρ2ii=rTiR-1-iri,i=1,2,…p.算得ρ21,…ρ2p后,其中值最大一个,表示它与其它变量相关最大,指定临界值D之后,ρ2i>D时,就可以删去Xi.

2.3选取典型指标法

如果开始考虑的指标过多,可以将这些指标先进性聚类,而后在每一类中选取若干典型指标.典型指标的选取,可用上述2.1,2.2所述方法,但这两种方法计算量都比较大.用单相关系数选取典型指标计算简单,在实际中可依据具体情况选用.假设聚为同一类的指标有N个,分别为a1,a2,an.第一步计算N个指标之间的相关系数矩阵R

第二步计算每一指标与其它n-1个指标的相关系数的平方ri.

则ri-2粗略的反映了ai与其它n-1个指标的相程度.第三步比较ri-2的大小,若有rk-2=max1≤i≤nri-2则可选取ak作为a1,a2…an的典型指标,需要的话,还可以在余下的指标中继续选取.

3定性指标的量化方法

在综合评价时,会遇到一些定性指标,通常总希望能给予量化,使量化后的指标可与其它定量指标一起使用.定性指标有两类:名义指标和顺义指标.名义指标实际上只是一种分类的表示.这类指标只能有代码,无法真正量化.顺序指标可以量化,所以,本段只考虑顺序指标的量化.如果已将全部对象按某一种性质排出了顺序,我们用a>b表示a优于b,a排在b的后面.全部对象共有n个,用a1,…an表示,并且不妨假设a1<a2<…<an.现在的问题是,如何对每一个ai赋予一个数值xi,xi能反映这一前后顺序.设想这个顺序是反映了某一个难以测量的量,例如一个人感觉到的疼痛程度,从无感觉的痛到有一点痛,到中等痛,一直到痛的受不了,比如分成n种,记为a1<a2<…<an.这个疼痛的量是无法测量的,只能比较而排出顺序.设想这个量X是客观存在的,可认为它遵从正态分布N(0,1),于是a1,a2…an分别反映了X在不同范围内的感觉,设xi是相应于ai的值,由于ai在全体n个对象中占第i位,即小于等于它的成员有i/n,因此可以想到,若取Yi为正态N(0,1)的i/n分位数,即P(x<yi)=i/n,i=1,2,…n-1那末,y1y2…yn-1将(-∞,+∞)分成了n段.显然ai表示它相应的xi值应在(y1,yi-1)这个区间之间,在(y1,yi-1)内选那一个比较好,自然要考虑概率分布,比较简便可以操作的方法就是选中位数,即xi满足

其中X服从N(0,1)分布.于是利用正态分布表可查出相应的各个X1,这样就把顺序变量定量化了.把这个方法稍做推广,就可以处理等级数据的量化.

参考文献

第3篇：评价方法论文范文

关键词：层次分析法（AHP）；法学硕士学位论文；综合评价；模糊理论

中图分类号：G642 文献标识码：A文章编号：1006-4311（2012）04-0212-030引言

法学硕士学位论文是培养法学专业学生的创新能力、实践能力和专业技术能力的重要实践环节。同时，法学硕士学位论文也是衡量法学专业院校教学质量、学生理论水平和学位资格认证的重要依据[1]。因此，科学、有效地评价方法，不仅关系到法学硕士学位论文质量的评价，而且关系到法学专业院校研究生教育的水平。目前，我国专业法学院校都制定了一套符合自身情况的学位论文评价体系，通过校内专家和校外专家的双盲审制度，对答辩前的硕士学位论文进行评价。国务院学位办和各省学位办也通过抽检的方法，加强对硕士学位论文质量的监督。这种双盲审加抽检的方式，对保证法学硕士学位论文质量起到了很好的作用[2]。但是，法学硕士学位论文评价是一个复杂的评价和决策问题，整个评价过程伴随着一定的随机性、模糊性、不确定性和不稳定性。传统的论文评价方法在论文成绩的评定和评价指标的确定方面存在着一些缺点，主要表现在以下几个方面：

学位论文指导教师、盲审专家和答辩专家组采用平均法对学生的硕士学位论文给予评价打分，甚至于主要由答辩专家组和学位论文指导教师确定论文成绩，这样有时难免存在客观性和真实性的问题。

在学位论文的评价体系中，影响论文成绩的因素是多种多样的，每种因素的重要性也存在着一定的差异性，这就造成了评价指标的模糊性。然而，在论文成绩评定中，专家往往直接给出一个精确的分数，这种处理方式是片面的和不可靠的。

当对学生论文成绩存在争议时，缺乏一整套完整的法学硕士论文评价标准作为参考，常常是通过少数服从多数的原则举手表决，对学生缺乏说服力。

同样为法学专业，但不同学科之间硕士学位论文所涉及的内容差异较大，评审专家和指导教师很难采用学校制定的分类标准对学位论文进行评价。

根据上述问题，一般的简单线性方法很难解决这一复杂的评价和决策问题。这就需要采用一套合理、有效和简便的法学硕士学位论文评价方法，从系统工程角度处理这样一类复杂的评价和决策问题。本文在传统AHP模型的基础上，结合法学硕士论文评价过程中的特点，提出了基于改进AHP的综合评价方法，该方法将群组AHP模型和模糊AHP模型引入法学硕士学位论文评价中，根据评审专家的评价体系、评审专家的可变性、指标权重值、论文属性值的差异，构建了法学硕士论文综合评价方法。通过对法学硕士学位论文的评价，表明该方法具有简便、客观、公正和准确的特点，对法学硕士学位论文的评价具有很强的实用价值。

1AHP决策优化模型

层次分析法（Analytical Hierarchy Process，AHP）是美国著名运筹学家T.L.Satty等人提出的一种定性与定量分析相结合的多准则决策方法。这一方法的特点是在对复杂决策问题的本质、影响因素以及内在关系等进行深入分析之后，构建一个层次结构模型，然后利用较少的定量信息，把决策思维过程数学化，从而为求解多目标、多准则或无结构特性的复杂决策问题，提供一种简便的决策方法[3]。本文将评价的有关元素分解成目标层、准则层和指标层，用一定的标度对专家的主观判断进行客观量化，把专家的思维过程层次化、数量化，从而确定准则权重和指标权重，通过模糊算子的集结，得到法学硕士学位论文的总体评价结果。

1.1 指标权重值的确定AHP主要包含2方面的内容，一是各层次指标权重的确定，二是根据最低层次各指标的权重和各方案的属性值对方案做出综合评价[4]。如果同层次指标数大于7个，会造成判断矩阵的不一致，所以需将指标分层归类。鉴于AHP本身在求取各层次指标权重的有效性和合理性，本文采用群组AHP模型来综合确定多位评审教师的意见。

在AHP的同层次确定单权重步骤中，可以采用对数最小二乘法[5]，求Z=∑■■∑■■lna■-lnω■/ω■■的最小值，得出ω=ω■，ω■，…ω■■，将其归一化得w=w■，w■，…w■■，∑■■wp=1，其中，aij表示第i个目标与第j个目标的相对重要程度，ω■/ω■表示Saaty标度[6]。当评审的专家数n?燮6时，假设评审专家的判断较为理性，忽略判断矩阵的一致性检验工作。在硕士论文评审时，一般都有多个专家参加评审，所以，判断矩阵中表示不同专家或小组的意见的aij可能取多个值，通过扩展Z，可得有多位评审专家或评审小组的判断矩阵Z=∑■■∑■■∑■■lna■-lnω■+lnω■■，其中b为评审专家或评审小组数目。

对扩展后的Z求ω■（p=1，2，…，n）的偏导数，令其等于0，由于lna■=ln1/a■，所以求偏导数后得：

nlnω■-∑■■lnω■=■∑■■∑■■lna■ （1）

简化后得：

ω■=■■ω■■·■■a■■=t·■■a■■（2）

其中，t=■■ω■■，归一化得w=w■，w■，…w■■，∑■■wp=1。故同层次之间指标权重值为：

wp=■■a■■∑■■■■a■■ （3）

本文利用群组AHP模型，不仅考虑了评审专家个人意见的模糊性，而且还充分考虑了专家群组的意见，对两者进行了有效地综合，解决了同层次之间指标权重值的获取问题。

1.2 模糊算子的集结利用群组AHP模型得到了多层递阶中各层次指标的权重向量。为了能够得到法学硕士论文进行综合有效地评价结果，还需要将各层次方案属性值与对应的指标权重值进行集结，将集结后的评价结果作为论文评价的依据。评判着眼于因素和评语构成的二元要素系统，而因素和评语一般都带有一定的模糊性，很难用精确的数学语言进行描述，这就需要对其进行模糊化处理，利用模糊的AHP综合评价法[7]对论文进行不受其他因素影响的评价。

设U=u■，u■，…，u■为刻画法学硕士论文的m种因素（即评价指标）；V=v■，v■，…，v■为刻画每一个因素所处状态的n种决断（即评价等级），m为评价因素的个数，n为评语的个数。

论文因素集U中的单因素ui（j=1，2，…，m）对抉择等级vj（j=1，2，…，n）的隶属度为rij，则m个因素的评价集，构成了总评价矩阵R，即每一个被评价对象确定了U到V的模糊关系R。

第4篇：评价方法论文范文

期间内含报酬率法

（一）期间内含报酬率法的原理与运用

期间内含报酬率法（IIRR，interiminternalreturnrate）计算方便，原理简单，它由传统的投资评价方法—内含报酬率法（IRR，internalreturnrate）演绎得出。内含报酬率是使风险投资基金净现值为零的报酬率，其公式为：

式（1）中，Ci是ti时期风险投资基金产生的现金流。在评价仍处于运作中的风险投资基金时，往往假定风险投资基金当期被解散，并可获得相当于其投资企业净资产价值（NAV）额度的净现金流入。在各期的现金流都已明确的情况下，式（1）可写为：

式（2）中，T为评价期风险投资基金已设立的年数；NAV为评价期风险投资基金的净资产价值；Ci为评价期前风险投资基金在ti期产生的现金流；IIRR为评价期T风险投资基金的期间内含报酬率。

假设某风险投资基金创建于2001年3月1日，约定存续期为10年，2005年3月1日该基金拥有3个未上市企业股权，股权比率均为50%，这三个企业的净资产价值分别为1500万、1800万和4500万元。2002年、2003年和2004年这三年该基金的净现金流分别为-1300万、-1480万、-2220万元。利用式（2）计算该基金的期间内含报酬率为：

从上式可知，该风险投资基金在2001年3月1日到2005年3月1日间的期间内含报酬率为26.43%。期间内含报酬率可用来比较风险投资基金的收益状况。如当期市场平均投资收益率为10%时，上例中该风险投资基金的收益则为市场平均收益的2.643倍，表明该基金的风险投资家因向受资企业提供增值服务而获得了市场平均投资收益的2.643倍。

（二）期间内含报酬率法的局限性

运用期间内含报酬率法评价风险投资基金的效益，有计算简单、受主观因素影响少、易于操作等优点，但在运用中还应注意到以下几点：

1.期间内含报酬率忽略了风险投资基金在评价期后投资产生的现金流，从而低估了风险投资基金的投资效益。式（3）表示风险投资基金在整个存续期间产生的现金流。由于风险投资基金在设立时都规定大约十年的存续期，因此，以评价期T为界，风险投资基金存续期间产生的现金流由三部分组成：风险投资基金在评价期T前所投资企业组合产生的现金流、评价期T仍存在的投资企业组合未来产生的现金流、未来新增投资产生的现金流。即：

计算期间内含报酬率所利用的风险投资基金在T期的净资产价值（NAV）相当于式（3）中等号左边的第二项，即T期风险投资基金拥有的投资企业组合产生的净现金流。因此，期间内含报酬率法忽略了式（3）中等号左边第三项，即风险投资基金在评价期后投资产生的现金流，从而造成了风险投资基金评价的整体低估。

2.风险投资基金成立后的最初几年里，由于存在着较高的管理费用、启动成本及对受资企业价值的保守估计，计算的期间内含报酬率较低。因此，计算期间内含报酬率时，还需利用历史数据拟合校正系数，以校正最初几年期间内含报酬率存在的系统性低估。由于我国风险投资基金设立的时间短、缺乏数据积累，难以对风险投资基金的各期期间内含报酬率拟合合理的校正系数，以实现风险投资基金内含报酬率的无偏估计。内在年龄法

（一）内在年龄法的提出

风险投资基金的内在年龄法（internalage）是仿照人的生理年龄概念而提出的。风险投资基金与人类相似，从最初投资到最终兑资要经历大约十年的约定生命期，但由于所投资企业的发展进程与退出时机不同，风险投资基金的资金回报速度与额度也各不相同。如A、B两个风险投资基金同设立于2000年1月1日，到2006年1月1日，风险投资基金A已基本完成了预定的投资与兑资任务，实现了预期的投资回报；风险投资基金B却因为所投资企业发展缓慢而仍不能回收资本。因此，风险投资基金设立后已经历的年份也不能反映它的真实成熟程度。在风险投资基金最终完全清算的假定下，内在年龄法等于评价期风险投资基金投资比率与兑资比率之和的一半，以公式表示为：

式中，T为评价期，L为风险投资基金的生命期即约定存续期。

风险投资基金的内在年龄取值范围在0到1之间，当风险投资基金在初设立时，投资项目尚未选定，资本投入和投资收入均为零，故其内在年龄为零；当风险投资基金接近规定解散期，各类资本投入均已完成，投资项目基本完成增值并已实现退出，此时内在年龄接近1。在实务中，总投资额可用风险投资基金设立时的资本承诺额近似表示；总收入中除包含评价期前各期收入外，还需估计当前及未来投资组合在基金完全清算前的收入，这可通过两种方法实现：数量分析法，专家意见法。外部投资者不了解风险投资基金的真实投资状况，一般采取数量分析法，即以评价期风险投资基金的净资产价值和未履行资本承诺额（undrawncommitment）作为未来收入额的近似值。而基金管理者则可在专家评价投资组合未来收入的基础上加和未履行资本承诺额来估计风险投资基金的未来收入。

假设风险投资基金A设立于2000年1月1日，设定资本承诺额为1000万美元，约定期限为10年。到2006年1月1日，该基金已向企业组合投入资本600万美元，实现收入1000万美元；未履行资本承诺额300万美元，当前风险投资基金的净资产价值为1200万美元，专家评价投资组合的未来收入为1500万美元。则利用数量分析法计算该风险投资基金的内在年龄为：

（二）内在年龄法的特点

内在年龄法虽不能像期间内含报酬率那样提供明确的、可供比较的收益报酬率，但在运用中，却具有独特的魅力：

1.针对风险投资市场高度的信息不对称性，向不同的信息掌握者提供了不同的估算方法，有较强的适用性。在风险投资基金的投资与收入方面，风险投资基金管理者能结合投资时间长短来测算风险投资基金的现金流；内在年龄法在对风险投资基金未来收入的估算中采取了数量分析和专家意见两类方法，使各类评估者都能利用自己掌握的信息对风险投资基金作出最佳评价，并且评价结果不会相差悬殊。

2.对于风险投资基金管理者而言，内在年龄法不仅是评价风险投资基金运行状况的有效手段，而且是一种简单有用的风险管理工具。风险投资基金管理者能借助内在年龄法迅速感知其所管理的每个风险投资基金的成熟程度，并根据风险投资基金的成熟期归类投资组合，检查设立年份相同但严重脱离平均内在年龄的风险投资基金所存在的问题。

第5篇：评价方法论文范文

关键词：人文社会科学研究评价体系评价理论评价应用

中图分类号： G304 文献标识码： A 文章编号： 1003-6938（2013）06-0133-02

从科学研究活动产生时，就产生了科学研究评价。随着科学研究活动不断发展，其社会影响不断扩展，科学评价工作越来越受到各国政府和社会各界的重视。人文社会科学在整个科学体系中占有重要地位。人文社会科学研究评价体系是对人文社会科学研究活动及其结果进行评价的基本依据；其评价工作是人文社会科学事业管理的重要组成部分；也是规范和促进人文社会科学健康、有序发展的不可缺少的重要措施。

改革开放以来，我国人文社会科学进入了一个繁荣发展的新时期，在规模和职业化程度上都得到了很大发展。然而在其发展中也暴露出许多问题。在学科建制的发展上，运行机制过分市场化倾向、学术失范；在学术精神、学术传统的传承上，浸透着过多的学术功利性；在人文社会科学学科管理上，成果评价行政化、非规范性。这些行为与现象的蔓延，已经引起学界及社会的普遍关注并严重阻碍了我国人文社会科学研究的进一步发展。造成这些问题的核心症结就是人文社会科学研究评价的错位和失范。

如何科学、客观、公正地评价人文社会科学研究，如何在已有研究的基础上，建立与完善我国人文社会科学研究成果的评价机制、评价标准和评价体系，已成为刻不容缓的重大理论和现实问题。2012年1月，武汉大学出版社正式出版了的《人文社会科学评价理论与实践》（以下简称“本书”）。本书是邱均平教授主持完成的国家社会科学基金重点项目“我国人文社会科学研究评价体系的构建与实证分析”的优秀研究成果，是我国人文社会科学领域第一本理论、方法和实践相结合的全面系统的专著，该书大量开拓性的工作和理论建树，对我国人文社会科学研究评价的理论研究和实施工作必将产生深远的影响。

1 构建了中国特色的、科学的人文社会科学研究评价体系

科学评价体系是学术标准、学术价值、学术方向和学术期望，其核心是决策者意志和现行价值观结合的一种浓缩体现，是国家与民族精神的培育及发展的内容。当前我国人文社会科学研究评价领域大多数的论文都是成果评价方面的，而且数量较少，不全面、不系统，远没有形成一个与国际接轨的、具有中国特色的、国内公认的人文社会科学评价体系。本书开创性的提出了我国人文社会科学评价体系。

本书提出 “评价体系”是评价活动的各种构成要素及其相互关系、运行机制的总和；包括评价的不同主体、对象、目的、标准、程序、方法、工具、指标、制度规范，其相互关系、制约条件、组织系统等。并运用一定的评价理论，同时考虑评价活动的外部环境，提出了人文社会科学研究评价体系的总体框架。人文社会科学评价体系包括四层结构：（一）学科发展评价体系、（二）学科研究评价体系、（三）学科教育评价体系、（四）学科社会影响评价体系。其中学科研究评价体系是重点，包括：（1）科研计划评价、（2）科研项目评价、（3）科研成果评价、（4）科研机构评价、（5）科研人员评价。科研成果评价是核心，在对科研成果的评价研究中，又包括①国际评价比较分析、②评价理论研究、③评价方法研究、④评价指标体系研究、⑤评价机制研究、⑥评价实例研究、⑦宏观发展研究、⑧评价结果管理应用。

2 理论、方法和实践的紧密结合

评价学是应用性非常强的学科，而其在实践中的应用又离不开科学理论的指导。当前评价学发展中存在着的重要问题是怎样将评价学理论和方法与评价实践相结合的问题。本书为我们提供了理论、方法与实践紧密结合的典范，沿着“人文社会科学研究评价理论基础——人文社会科学研究的评价体系——人文社会科学研究评价的实证与应用”这一思路进行了阐述。

本书考察了当代国内外人文社会科学研究评价现状，指出西方发达国家在研究方法上比较注重研究的规范性，重视数据和实证；对同行评议的研究，重视基本概念和程序，逻辑分析严密；对定量评价方法的研究也很多，包括各种科学计量学方法的应用。然而在我国人文社会科学研究评价的环境之中，国内的研究规范性上普遍不够，实证性普遍较弱，以思辨性的研究为主；对定量评价方法的研究侧重于指标打分的计算处理模型方面，对科学计量学及定量评价的本质等重视不够；从许多关于“指标打分法”的研究来看，依靠个人主观感觉、好恶设计评价指标体系的很多。

本书在深入探析了当代人文社会科学研究评价的要素体系、分类体系、运作体系、指标体系、人文社会科学成果、机构及项目评价的研究理论问题基础上，对相关评价理论进行了实践应用。进行了h指数用于科研人员成果评价的探索实践，中国学术期刊国际影响力的计量分析与评价的探索实践，以及我国人文社会科学机构评价的实证研究，本书还详细介绍了人文社会科学发展与评价信息系统集成平台的构建与应用。

3 研究方法科学

本书采用了一些科学的研究方法，保证了内容的科学性、可靠性，论证的充分性，主要包括： ①对比分析方法，例如对国内外人文社会科学研究现状进行了比较分析，对国内外人文社会科学学术机构及其评价进行了比较；②实证方法，例如本书进行了基于中国引文数据库的h指数的实证研究，包括作者、期刊、研究院所、研究专题的h指数分析，对我国人文社会科学机构评价的实证研究，包括对中国社会科学院研究所、教育部人文社会科学重点研究基地、中国高校人文社会科学研究竞争力评价的实证分析；③分类方法，例如本书对人文社会科学评价要素进行了科学分类，根据见诸于各类研究文献中的名词、概念，通过逻辑分析，归纳总结了人文社会科学研究评价的要素包括：评价主体（委托方、评价方、被评价方），评价对象，评价目的，评价标准，评价内容，评价指标，评价方法，评价程序，评价数据，与评价结果等10个基本要素。本书在分类基础上对这些各类要素作了分析。

4 价值巨大

作为我国人文社会科学领域第一本理论、方法和实践相结合的全面系统的专著，本书既具有很高的科学理论价值，又具有很强的实践指导意义。

在理论贡献方面：由于当代科学评价工作是一个复杂的过程，科学评价系统是社会活动大系统的一个子系统，涉及到众多的理论问题。本书不仅研究了人文社会科学研究评价的理论基础和方法论基础，而且还研究了人文社会科学研究评价中其他方方面面的理论问题，其中包括的重要理论问题有：人文社会科学评价理论体系自身的构成、梳理和构建，我国人文社会科学评价的社会环境体系及其对评价活动与研究的影响，人文社会科学研究评价活动体系，人文社会科学研究评价活动的规范体系等。构建了系统的、完善的人文社会科学评价理论，因此在我国评价学领域具有非常高的理论价值。

第6篇：评价方法论文范文

关键词：可拓评价；毕业设计；教学改革

作者简介：董非（1982-），男，江苏常州人，江苏大学汽车与交通工程学院，讲师；尹必峰（1975-），男，江苏泰州人，江苏大学汽车与交通工程学院，副教授。（江苏镇江212013）

基金项目：本文系江苏大学教学改革与研究项目（项目编号：JGY2007051）的研究成果。

中图分类号：G642.477 文献标识码：A 文章编号：1007-0079（2012）11-0099-03

本科毕业设计（论文）是高校本科教学过程的最后一个实践教学环节。通过毕业设计（论文）环节，不仅可以检验学生综合运用所学知识解决实际问题的能力，同时也是对高校本科实践教学质量水平的检验。[1]目前，国内高校在对毕业设计（论文）成绩评定时大多仍采用传统方法进行，即学生毕业设计（论文）成绩是由指导老师、评阅人和答辩小组三方面成绩简单加权平均得到，对于一些很难量化的定性指标，评价时主观性过强，缺乏科学统一的评价依据；此外，在对学生毕业设计（论文）成绩有疑义时往往是由几位专家讨论确定，缺乏说服力。因此，对毕业设计（论文）质量进行科学、客观、统一的评价是当前我国各高校教育教学研究的一个重要课题。

在此背景下，本文根据工科毕业设计（论文）的特点，建立工科毕业设计（论文）质量多级评价体系，提出一种基于多级可拓的工科毕业设计（论文）质量综合评价方法，并结合具体实例阐述该方法的应用过程，并对该方法的可行性、有效性进行分析。

一、工科毕业设计（论文）质量评价体系

1.工科毕业设计（论文）的特点

工科专业不同于其他学科专业，其毕业设计（论文）的特点通常表现[2]为“一人一题”，以工程实际或模拟设计为主要研究内容，采用常规或现代设计方法和手段展开研究，研究内容紧密围绕学校、生产企业、科研院所以及指导教师的科研项目，主要成果形式包括工程设计图纸、三维CAD软件建立的参数化模型和虚拟装配结果以及用CAE软件进行的工程设计分析等。

2.工科毕业设计（论文）质量多级评价体系

针对工科毕业设计（论文）的特点，结合江苏省普通高等学校本专科优秀毕业设计（论文）评选标准，笔者制定了与其研究方法和成果形式相应的质量评价细化指标，并综合考虑指导教师、评阅教师和答辩小组三者对毕业设计（论文）质量审视角度不同，建立了如图1所示的工科毕业设计（论文）质量多级评价体系。

二、毕业设计（论文）质量评价多级可拓模型

可拓评价[3]是以可拓学和物元理论为基础，将要评价的对象视为物元，通过物元分析确定评价的不同等级，然后利用关联函数计算和划分各待评价对象隶属等级，相对客观地实现待评价对象的分类排序，进而明确待评价对象的质量水平。可拓评价与层次分析法[4]、灰色聚类法[5]等其他评价方法相比，能够减少人为因素对评价预测结果的干预，规范性好，具有简捷、严密的特点。经查阅大量资料发现，可拓评价方法在教学质量管理、命题质量综合评判等方面得到了一定的应用[6]，但鲜有将可拓评价运用到毕业设计（论文）质量评价中的报道。

1.物元可拓模型

在物元分析中，任何事物都可以由事物M、特征C和量值X组成，记为R=（M，C，X）。[3]

（1）待评物元矩阵的建立。对于待评毕业设计（论文）质量评价系统，将待评指标的相应数据用物元模型来描述，记事物P0为待评对象；Xi为P0关于Ci的量值（i=1，2，…，m，m为指标个数）。

（2）经典域物元矩阵的建立。假设毕业设计（论文）质量评价等级分为n级，记Moj为第j级别的事物，令表示级别为j第i个指标Ci的量值域（j=1，2，…，n）。

（3）节域物元矩阵的建立。节域为各指标对应的所有取值范围，记Muj为物元系统中级别的全体，令表示第i个指标Ci全部等级的量值范围。

（4）关联度函数的构造。根据物元理论，定义待评毕业设计（论文）评价指标i关于等级j的关联度函数为：

（1）

其中

式中，为关联度，为第i个评价指标关于等级j的关联度。

（5）各级指标权重的确定。由图1可知，工科毕业设计（论文）质量评价体系包含多个层次，且每个层次所含的评价指标很多，为此在进行综合评价时低一层指标对其上一层指标的影响作用（即权重）是不相同的。本文在确定各级指标权重时采用了不同的处理方法，具体为针对子指标层中各项指标，由于其数据丰富，可充分挖掘原始数据本身蕴涵的信息，采用熵权法；对于其余各级指标，由笔者任教学校多年的教学经验和优秀毕业设计（论文）评选标准加以确定，详见表1所示。熵权法是指根据各子指标提供的有用信息量确定各子指标的权重。

第i项子指标的熵权计算公式为：

（2）

其中

式中，为第i项子指标的熵权，m为指标个数，n为等级数。

2.多级可拓综合评价思路

多级可拓评价基本思路为：首先计算子指标层各指标的关联度矩阵，根据熵权法确定子指标层对于指标层中各指标的权重系数ω，将ω与相乘得到指标层关联度矩阵，再由表1给定的指标层对准则层的权重α与相乘得到准则层关联度系数，依次类推，逐级计算直至目标层，得到目标层关联度矩阵。

若满足，则认为毕业论文质量综合评价属于等级j。

（3）

其中

式中，j*为目标层即毕业设计（论文）质量总评的级别特征值，即属于某评价等级的程度。

三、案例分析

以笔者任教学校2010级某学生毕业设计为例，介绍其多级可拓综合评价过程，并对评价结果进行分析。

1.经典域、节域和待评物元的确定

本文将毕业设计（论文）综合评价质量分为优秀、良好、中等、合格、不合格五个等级，依次赋值为1、2、3、4、5；与各等级对应的经典域分别为[0.9，1]、[0.8，0.89]、[0.7，0.79]、[0.6，0.69]和[0，0.59]，指标对应的节域均为[0，1]。该学生子指标层下各指标得分见表2所示。为了方便，将子指标层下各指标得分进行归一化处理。

2.子指标层指标对指标层指标权重系数的确定

在确定子指标层指标对指标层指标权重时采用的是熵权法。下面以“指导教师评分”子指标层指标对指标层指标权重为例。

由式（5）和式（6）计算得知，“指导教师评分”下子指标层指标对指标层指标权重向量分别为：

注：表示指标层第i个指标下各子指标的权重向量。

3.多级可拓评价

通过计算，该学生子目标层及目标层评价结果如表3所示。由表3可见，该生毕业设计指导教师评价为1级，属于优秀；评阅教师和答辩小组评价均为2级，属于良好；最终该生毕业论文质量总评成绩为2级，属于良好。表中数据为负，表示关联度不属于该质量等级以及不属于该质量等级的程度；数据为正，表示关联度属于该质量等级以及属于该质量等级的程度。进一步，由式（8）计算可知，该生质量总评综合关联度特征值j*为2.029，数值更趋向于2，表明该生毕业论文成绩更偏向良好级别。

四、结语

本科毕业设计（论文）质量评定是衡量高校人才培养质量的重要参考依据。本文将多级可拓综合评价的方法引入工科毕业设计（论文）质量评价中，建立了基于可拓评价理论的毕业设计（论文）质量评价指标体系，并根据各级指标的特点采用不同方法确定指标权重，逐级计算，直至确定目标层与各评价等级的关联度，明确评价结果。实例计算表明，该方法不但能评定出毕业设计（论文）质量等级，而且能从不同的审视角度反映毕业设计（论文）质量的优劣，提高了评判结果的可靠性和准确性，故该方法在评价毕业设计（论文）质量方面是有效且可行的，具有较强的推广和实用价值。

参考文献：

[1]孟梅等.高校毕业设计(论文)论文质量管理的研究[J].武汉理工大学学报,2007,(1):83-86.

[2]徐晓美,张永辉.工程设计类毕业设计(论文)质量评价研究[J].中国电力教育,2010,(27):42-43.

[3]蔡文,杨春燕,林伟初.可拓工程方法[M].北京:科学出版社,1997.

[4]韩瑞娜.模糊层次分析法与大学生毕业设计(论文)质量评价的数学建模[J].科技信息,2011,(5):186,401.

第7篇：评价方法论文范文

关键词:医学文献;评价体系;证据分级

1医学文献的定义及类别

“文献”一词出现在中国已有2000多年的历史，从春秋战国时期就有关于文献的记载，最早见于《论语八佾》。随着人类文明的发展，“文献”的概念也发生了巨大的变化，人们对文献的研究一直持续至今。文献的具体定义尚缺乏统一的定论，《现代汉语词典》对文献的定义是“有历史价值或参考价值的资料”［1］;《中华人民共和国国家标准—文献著录总则》将文献定义为“记载有知识的一切载体”［2］。有学者将文献定义为“文献就是将知识、信息用文字、符号、图像、音频等记录在一定物质载体上的结合体”［3］。有历史价值和研究价值的知识、一定的载体、一定的方法和手段、一定的意义表达和记录体系这4个方面构成文献的基本要素。医学文献(medicalliterature)就是与医学有关的有参考价值的资料。按照文献的研究类型分为:系统评价、随机对照临床试验、队列研究、病例对照研究、病例系列研究、病例报告和专家经验总结等。决定文献质量的关键部分:研究有首创性或提供了新证据、研究对象的选择合理、科研设计合理、偏倚得到有效控制、研究样本量足够大和研究的时间足够长。然而医学文献是如何发挥作用的，前提就是该文献必须有一定的价值，而且有可靠的等级评价体系。医学文献的价值就是根据其文献内在及外在真实性及临床意义的重要性去评判，是根据医学研究的方向不同确定评价的原则和方法［4］，其中内在真实性是文献评价的重点。

2西医文献评价体系

2.1证据分级

20世纪60年代，首次提出证据分级概念，将随机对照研究的质量定为最高，并引入内部真实性和外部真实性的概念。证据分级为西医识别文献可靠性的准则。最初3级标准:1级:设计良好的随机对照试验(RCT);2级:1级和3级中间的类型;3级:专家经验。老5级标准:1级:收集所有质量可靠的RCT后做出的系统评价或Meta分析结果，大样本多中心随机对照试验;2级:单个大样本的RCT结果;3级:设有对照但未用随机方法分组的研究病例对照研究和队列研究;4级:无对照的系列病例观察;5级:专家意见、描述性研究和病例报告。新5级标准:1级:治疗/预防，病因学/危害;1a:随机对照的系统评价;1b:随机对照;1c:全或无病案研究;2级:对例或随机;2a:队列研究的系统评价;2b:队列研究或较差随机对照研究;2c:“结果”研究;生态学研究;3级:病例对照;3a:病例对照研究的系统评价;3b:病例对照研究;4级:单个病例系列研究;5级:未经明确讨论或基于生理学、实验室研究或“第一原则”的专家意见。新9级标准:1级:系统评价/Meta-分析;2级:随机对照双盲研究;3级:队列研究;4级:病例对照研究;5级:病例系列研究;6级:病例报告;7级:概念、述评、意见;8级:动物研究;9级:体外(试管)研究。文献的证据分级是评价文献最可靠的标准，上述几个历程是文献评价证据分级的历史演变，随着时间的推移及科技的进步，评价的方法进一步细化，由最初的3级标准逐步演变成新9级标准，每一次的改变都意味着评价系统的进一步完善，对文献的要求更加严格，更有利于临床的实用性。

2.2文献评价的流程及常用工具

对于文献内容的评价首先要区分是随机对照试验(RCT)还是非RCT，两种不同的文献所用的评价指标及方法各有不同，评价文献时应根据不同类型的研究选取合适的评价指标和工具。RCT文献评价的指标:1)研究对象(样本量、纳入标准、基线情况);2)随机过程;3)盲法;4)分配隐藏;5)干预;6)统计方法;7)随访。涉及RCT的评价工具有很多，但常用的且公信性较高的有CONSORT声明、Jadad量表、Chalmers量表和Delphi清单。非RCT文献评价的指标:1)研究对象;2)对照的选择;3)偏倚;4)暴露;5)混杂因素;6)统计方法。应用较多的评价工具有纽卡斯尔-渥太华量表、质量指数(qualityindex)、Reisch评价工具、DownsandBlack清单、Anders评价工具和Baker工具等。文献的评价无论是采用哪种方法都应该根据研究的方向和本学科的特色，合理运用评价的工具，并对其进行相应的补充和修改。CONSOTR声明推出后，被全世界500余家医学杂志引入稿约(包括167家高影响因子杂志)［5］，可以根据这个声明指导研究者、评审专家和编辑等人员对RCT研究的质量进行评价和鉴别。目前，国内外很多著名医学期刊都采用CONSORT声明的要求规范RCT的报告，例如TheLancet(《柳叶刀》)、JournaloftheAmericanMedicalAssociation(《美国医学会杂志》)和BritishMedicalJournal(《英国医学杂志》)等［6］。在美国申请NIH资助、英国申请NHS资助和在中国申请国家自然科学基金资助的课题均必须提供系统评价的研究结果。

3中医文献评价体系

中医是中国传统医学，有其本身的理论体系，目前中医文献尚缺乏自身的评价方法，仍然是借鉴西医文献的评价体系，但尚需进一步规范和验证。

3.1证据分级

中医学是中国的一门传统医学，古代医家经验传承是中医学自身的特点，由于其研究方法的独特性，决定了其源于临床研究的临床证据比较少，所以中医文献的证据分级难以建立。有研究者［7］提出了一些建立中医特色证据分级体系的思路:古代医家经验质量评价体系，古代医家经验数据库，证据体的证据分级体系等，但由于中医学的特殊性，及古代医家经验传承的独特性，使得这3种方法的建立都有困难，难以推广;最终又提出了应建立符合中医特色证据分级体系，要从古代医家的经验入手，选择经典方剂及治疗方法，结合中医专家意见，制定相应的证据分级，大概分为5个等级。Ⅰ级:大样本，随机研究;Ⅱ级:小样本，随机研究，结果不确定;Ⅲ级:非随机，同期对照研究和基于古今文献的中医专家共识;Ⅳ级:非随机，历史对照和当代中医专家共识;Ⅴ级:病例报道，非对照研究和专家意见。

3.2文献评价

中医是以辨证论治为基础，根据不同的症状确定治疗的方案，方药的配伍原则是其自身的特点。从而就可以从辨证论治为切入点对文献进行评价，分为辨证论治的研究，非严格辨证论治的研究，非辨证论治的研究。从这三个大的方面入手再根据文献研究的内容进行综合评价。中医文献评价体系起步晚，依据不完善，证据等级和评价的方法还处于研究阶段，亟待补充，以便进一步发挥我国传统医学的优势，更好服务于临床。

第8篇：评价方法论文范文

【关键词】建成环境使用后评价 POE

1 使用后评价POE简介

使用后评价（Post Occupancy Evaluation）是20世纪60年代从环境心理学领域发展起来的一种针对建筑环境的研究，英文缩写POE。是指建筑物或环境建成若干时间后，研究者用规范化、系统化的方法，收集使用者对建筑或环境某方面的评价信息，并通过科学分析了解使用者对目标环境的评判。

POE的研究重点和应用方法是相似的。使用者是其评价核心，建筑性能是其重要概念，研究方法主观与客观相结合。建筑性能是POE的重要概念，它构成评价所需要的参照系统。

2 我国建成环境使用后评价的研究状况

目前，POE在西方发达国家已发展成熟，许多学者从不同研究角度发展出一系列的评价理论和方法，POE研究也呈现出多元化发展的态势。国外POE研究的发展已有学者进行过总结，笔者则要对国内的POE研究情况作一番梳理。

20世纪70年代末80年代初，建筑界的一些专家学者利用学术交流及翻译著作等方式，陆续从欧美、日本等发达国家引入环境心理学等理论，使用后评价也随着环境心理学一起进入我国学者的研究视野，对建成环境的评价研究由此初步展开，但在实践上还处于不自觉的理论吸收阶段。20世纪90年代后，更多学者特别是青年学者涉足此领域，在理论和实践上均有不同程度的探索，且取得了一定的成绩。

1982年常怀生先生在哈尔滨建筑工程学院介绍建筑环境心理学，首先在国内传播建成环境评价理论。他1984年翻译出版了《环境心理学》一书，其书中介绍了日本的建成环境评价实践。1992年起，常先生着手进行了住宅、医院和办公室等建筑类型的使用后评价。他的评价实践偏重于研究人与微观环境的心理互动关系。他还于1999年出版了《室内环境设计与心理学》一书，书中较系统地介绍了使用后评价的基本原理和操作方法。

杨公侠教授也是国内较早涉及环境评价的学者之一，他在理论推广和实践方面都做了大量的工作。他结合视觉理论进行了许多建成环境的评价研究，他于1981年将研究成果编著成《视觉与视觉环境》一书出版。之后，他发表《环境心理学的理论模型和研究方法》一文，重点介绍了英国学者坎特（D.canter）的“目标场所评价理论”和“块面语句法”。他还通过指导研究生及参与环境评价实践、结合上海地方情况做了一定范围的评价应用方法探索，其研究成果发表在《上海居住环境评价》一文中。

华南理工大学的吴硕贤先生于1990一1993年间在国家自然科学基金及浙江省自然科学基金的资助下，对4城市17个居住区进行生活与环境质量使用后评价。以人群的主观评价为核心，利用量化的方法，初步建立了建筑环境综合评价的科学架构。在实践探索的同时，吴先生一直致力于使用后评价理论的推广，1998年，吴先生《提倡建筑师进行使用后调查》一文收录在《建筑百家言》一书中，文中强调了我国建筑界开展使用后评价的重要性。2009年发表《建筑学的重要研究方向——使用后评价》一文，介绍了使用后评价的意义和重要性、使用后评价的发展简史以及使用后评价的常用方法，再一次提醒国内建筑界关注这一领域的研究。同时，吴先生还招收博士生开展使用后评价的系统研究。

庄惟敏先生于1999年出版了《建筑策划导论》一书，他在书中系统介绍了日本住宅空间的评价方法，并结合建筑策划理论研究，系统地发展了以“语义差异法”为中心的建成环境评价方法，强调利用社会学的调查研究方法评价现状环境实态、收集建筑策划基础信息的重要性。另外，庄生先还指导研究生在硕士论文中讨论建筑策划与使用后评价之间的关系，提出使用后评价为建筑策划中的预评价提供了参考依据和评价方法借鉴。

胡正凡和林玉莲先生于2000年出版《环境心理学》一书。他们在“环境——行为”理论研究基础上，利用认知地图对校园环境和风景区质量做了评价研究。该书还介绍了POE的一些基本知识和特点。

北京大学的俞孔坚先生以生态和人文精神对景观评价方法进行了研究，偏重于景观美学、偏好及敏感度评价等方面。他的使用后评价研究对象主要是城市公园等景观环境，在他指导下，其研究生对具体公园进行使用后评价实践，并将实践总结整理成硕士学位论文。

同济大学的徐磊青教授目前已经是国内从事建筑和城市空间与行为关系研究的重要学者之一。在硕士论文《场所评价理论和实践》中，徐磊青先生集中介绍了国外基于环境心理学的评价理沦、使用后评价的理论和方法，并通过案例建立了上海居住环境评价模型。在博士论文中，他运用环境行为理论和方法对上海市中心区的广场与步行街进行分析与用后评价，系统揭示了人与开敞空间交互作用的影响因素。

朱小雷是吴硕贤先生的学生，在吴先生的指导下完成自己的博士论文。文中他系统总结了自己读博时期参与评价实践，在对比国内外研究成果的基础上提出了一种“结构——人文”的主观评价方法体系。该论文于2005年整理为《建筑环境主观评价方法研究》一书出版，对国内的建成环境评价产生在很大的影响。

为了了解近几年国内对使用后评价的研究情况，笔者通过“读秀学术搜索”以“使用后评价”作为关键词进行了搜索，并将搜索到的学术论文进行了分类整理：

从数量上看，总体研究趋势是上升的，越来越多的研究者对“使用后评价”感兴趣；从研究机构的分布情况看，使用后评价的主要研究中心在以吴硕贤先生为核心的华南理工大学。从权威杂志的发表情况看，《建筑学报》作为学界学术方向的领军期刊，2008年后就没有再刊登相关论文，《建筑师》《世界建筑》《城市规划》等其它学界权威期刊从没刊登过相关论文。这说明尽管有吴硕贤这样的学者在呼吁关注使用后评价的研究，但建筑学术界对此并没有显示出足够的热情。

3 我国建成环境使用后评价的研究特点

结合上面的讨论，我国建成环境使用后评价的研究特点可以归纳成以下几点：

（1）对建成环境进行使用后评价的研究仍处于理论探索阶段，研究内容偏重于对国外理论体系的推介，以及对评价理论和方法的探索。

（2）建成环境使用后评价没有受到普遍重视。学术上，引领学术界研究方向的权威学术期刊，对使用后评价的关注度不高，国外大量的评价实践研究著作也没有翻译引进；实践上，主要是个别研究机构或研究者根据自己的研究需要进行评价，少有由政府和学术组织发起的持续性评价研究实践，而且市场也缺少对评价需求的刺激。

（3）缺乏有效的反馈机制，评价结果没能有效地促进设计水平。评价对象虽然从居住区、幼儿园、宿舍、老人院扩展到城市街道、公园、广场等，但由于社会观念和发展的限制，评价研究同设计实践脱节，评价未能从根本上提升设计品质。

（4）具体评价方法的理论研究仍十分薄弱。目前大多数实践中使用的评价方法引用了

社会学、环境心理学等学科中的研究方法，还没有建立起符合国情的、本学科的、实用的评价方法体系，这也是在业内推广使用后评价的重要障碍之一。

参考文献

[1] 朱小雷.建成环境主观评价方法研究.南京：东南大学出版社，2005

第9篇：评价方法论文范文

学术期刊质量关系到期刊的生存和学术理论的发展。对学术期刊质量进行科学评价，具有重要的意义。随着网络技术和计量方法的发展和广泛应用，学术期刊评价方法和评价指标体系也得到进一步完善。研究表明，学术期刊质量的高低可以通过一系列指标体现出来，各种指标的作用有一定的差别。学术期刊的管理者和编辑人员，可以借助这些指标分析期刊质量，并以此为指导提高学术期刊质量。

〔关键词〕学术期刊；期刊质量；评价方法

中图分类号：G232 文献标识码：A 文章编号：10084096（2013）05009004

学术期刊（以下简称期刊）质量关系到期刊的生存和发展，对学术理论发展和社会实践具有重要的影响。在长期的发展中，学术期刊发展分化明显。有人按照期刊的主管部门和主办单位的行政级别把期刊分为部级期刊、省级期刊和地市级期刊，但这种划分方法不仅不科学，还存在很多弊端。目前，有关部门和一些机构运用相对科学的方法对期刊质量进行评价，根据有关评价指标，把期刊分为核心期刊与非核心期刊、CSSCI（中文社会科学引文索引）来源期刊与非CSSCI来源期刊。提高期刊级别，向核心期刊和CSSCI来源期刊发展就成为许多期刊努力的方向。期刊的分类是根据期刊质量评价指标确定的。那么，期刊的评价方法和评价指标体系，就成为许多期刊在提高质量时必须关注的方面。

一、期刊质量评价的方法

期刊评价是有关机构和部门通过一系列指标对期刊质量优劣进行的考量，从而促进期刊提高质量，科学发展。它的意义非常明显，通过期刊评价可以促进期刊的重组，引入竞争机制，实现优胜劣汰；通过期刊评价，还可以了解期刊的学科分布情况，了解不同专业期刊的发展状况、学术水平、在本学科中的影响力，从而为期刊的宏观管理提供客观依据。

我国期刊评价活动自20世纪60年代开始，它由期刊编辑工作者和期刊管理人员对各种类型的期刊质量进行评价，主要对期刊的政治质量、学术质量和编辑质量进行评价。采取的方法主要有专家评估法、文献计量评估法和综合分析评价法，也有引文法、文摘法、科学计量法、层次分析法和模糊数学法等，随着计算机网络技术的发展，评价方法逐步向网络化和数量化发展，特别是数据库的统计评价功能日益完善和增强，为期刊评价提供了科学的方法和有效的途径[1]。

1专家评估法

这种方法的具体做法是：首先从各部委、各省市所属期刊进行初评，按照期刊总量的百分比推荐参加总评。由专家、期刊主编及期刊管理人员组成评委，按各评委的专业和专长分成若干个专业评审组，分别对应各类期刊进行评比，采用“抽样审读、全面浏览、横向比较、量化打分、核实汇总”的评审方法，评出比较优秀的期刊。这个方法在第二届全国优秀期刊评选中被使用。

专家评估法可以分为定性评估和量化打分法。定性评估就是通过专家阅读一定量的期刊后，进行比较分析并评出各个期刊的优劣。专家的意见就成为评估的标准，主观性较强。目前在各类评估中这种方法已经很少使用。量化打分法就是把评估内容分为若干项指标，每项指标有几级评分标准，由专家审读一定量期刊后，针对每项评分标准进行对比打分，再综合打分情况得出评估结果。这种评估方法增强了对比分析的客观性，但是专家本身的水平和倾向性等主观因素依然影响着各指标权重分配与打分。专家评估法存在着一些无法克服的弊端。因此，这种方法在期刊的评估活动中逐步被更加科学的方法代替。

2文献计量评估法

目前主要的方法是布拉德福定律法、引文分析法、文摘统计法和利用率法等[2]。这些方法依靠大量的统计数据进行统计分析，统计的对象是期刊的载文量或所载文献被引证量等数据。

（1）布拉德福定律法

它是依据布拉德福定律，将期刊按其登载的某学科论文数量的多少排列，然后将它们分成三个区域，使每个区域中有关某一学科的论文数量大致相等，使每个区域期刊数量呈1︰a︰a2的关系，则第一区域内的期刊就是该学科的核心期刊。其缺点是忽视了期刊质量。

（2）引文分析法

通过统计各种期刊上发表的一次文献被引用次数的多少，靠前被大量引用的期刊就是某学科的核心期刊。由于期刊论文被引用次数的多少，极好地测定了论文学术水平和期刊的价值，因此，引文分析法较好地反映了期刊刊载论文的质量。论文被引用的次数多，体现了它的学术水平较高，发挥了它的利用价值，客观上体现了论文的质量较高。

（3）文摘统计法

它是根据某种期刊被二次文献摘录的频率来确定核心期刊的一种方法。按照此方法，某种期刊被二次文献摘录的论文数量较多，就可以成为核心期刊。例如，目前被《新华文摘》、《全国高等学校文科学报文摘》和中国人民大学书报资料中心转载等，作为评价期刊质量的一个因素。由于在编制二次文献时，必须在大量的一次文献中进行筛选，只有质量较高者才作为报道和检索的对象。因此，文献统计法能够在一定程度上表明了期刊刊载论文的质量。但是，受到可选对象选题范围和载文数量的影响，文摘统计法也存在一些缺陷。

除了以上常用的计量评价方法外，一些机构和单位也用利用率法给期刊进行分类。它们利用读者对每种馆藏期刊的使用频次的高低，也就是利用率的高低，来确定本馆的核心期刊。因为读者对每种期刊的阅读、复制的情况很容易掌握，统计数据容易得到，因此，通过统计可以知道每种期刊的利用率，从而可以给每种期刊排出先后顺序，比较靠前的期刊就是本馆的核心期刊。

3综合分析评估法

综合分析评估法是运用层次分析法、相关分析法甚至模糊数学与灰色系统理论等方法对多指标体系进行综合分析评估，从而确定期刊质量优劣的一种方法。在进行综合分析评估时，首先，要建立评价指标体系，明确各指标的量化依据和计算办法；其次，按学科进行分类，采集、统计各项指标数据；再次，建立综合评价模型，确定各指标的权重，计算得出定量评价结果；最后，征求专家意见进行个别调整。这种方法着重对期刊质量的评价，综合反映了科学研究工作者、专家和二次文献工作者和读者对期刊质量的评价。

二、期刊质量评价指标体系

目前，我国期刊评价指标体系来自于中国科技信息研究所开展的中国期刊综合评价指标体系的研究[3]。1999年中国科技信息研究所根据科学技术部“关于建立中国期刊综合评价指标体系”的精神，首先确定主要评价指标，经过几年的实践，再不断补充、完善，逐步形成了稳定的、规范化、可操作实施的综合评价指标体系[3]。该体系有八项学术评价指标：总被引频次、影响因子、即年指标、平均引文率、地区分布数、基金资助论文比例、普莱斯指数和他被引率，如图1所示。

由图1可见，中国期刊综合评价指标体系包括期刊经营管理水平、期刊学术水平和期刊编辑水平三大子体系，其中期刊学术水平是评价期刊质量的关键，因而本文重点列示了期刊学术水平的评价指标及指标含义。

在以上基本指标基础上，近年来还有一些指标被用来对期刊进行评价。如被引半衰期、自引率、来源文献量、参考文献量、海外论文比例、学科扩散指标、学科影响指标、扩展H指数和文献选出率等。

2000年，结合中国科学院正在实施的知识创新工程试点，为了对现有期刊择优支持，中国科学院自然科学期刊编辑研究会联合中国科学引文数据库课题组开展了“自然科学学术期刊综合评价指标体系”研究，并提出了相应的评价体系。这个体系基本与上述体系相似。但又有完善和突破，主要是更加细化和科学化。该体系包括两个系列、两项水平、两个层次和19项评价指标。其中两个系列是静态评价指标系列（优秀期刊评比指标）和动态评价指标系列；两个水平是编辑出版水平和学术水平；两个层次是表明期刊整体质量的层次和体现学术质量在期刊评价总的位置的层次。19项指标中有6项表示编辑出版水平，有13项表示学术水平。

三、期刊评价指标与期刊质量的关系

期刊评价指标是根据影响期刊质量的因素进行的科学选择，反映了各因素与期刊质量的关系。在这些指标中，它们与期刊质量的关系有所不同。有些因素的作用大，有些因素的作用相对小[4]。《中国科技期刊引证报告》（2011年扩展版）在其收录的期刊中，使用了期刊被引用指标和来源期刊指标。前者包括扩展总被引用频次、扩展影响因子、扩展即年指标、扩展他引率、扩展被引半衰期、扩展引用期刊数、扩展学科影响指标、扩展学科扩散指标和扩展H指数；后者包括来源文献量、文献选出率、平均引文率、平均作者数、地区分布数、机构分布数、海外论文比例和基金论文比例。本文选取经济管理类部分期刊的指标进行对比，如表2所示。

参考桂文林等的实证分析[3]，笔者认为各个指标与期刊质量的关系是：

在被引用指标中，扩展总被引用频次、扩展影响因子、扩展即年指标、扩展引用刊数、扩展被引半衰期、扩展学科影响指标、扩展学科扩散指标和扩展H指数与期刊质量显著地正相关。具体地说，扩展总被引频次越大，扩展影响因子越大，期刊质量将会越高，学术影响力和作用越大。扩展即年指标越大，扩展引用刊数越多，期刊越受到关注，因而质量也越高。扩展被引半衰期越长，扩展学科影响指标越高，学科扩散指标越大，期刊质量将会越高。而扩展他引率对期刊质量无明显影响。

在来源期刊指标中，与期刊质量显著正相关的指标有：文献选出率、平均引文率、平均作者数、海外论文比例、基金论文比例。说明这些指标越高，期刊质量越高，影响力越大。文献选出率越高，平均引文率越高，表明论文更符合学术规范和有学术深度。平均作者数与期刊质量正相关，表明平均作者数越多，期刊质量将会越高。海外论文比例与期刊质量正相关，表明海外作者比例越高期刊质量越高。基金论文比例越大，表明论文中受基金资助的比例越高，由于基金项目的审核比较严格，因此论文的质量一般较好，期刊质量越高。与期刊质量关系不显著的指标是地区分布数，表明期刊质量高，地区分布数反而小。可能的原因是高质量的期刊的载文量不如普通期刊，导致地区分布范围小。与期刊质量显著负相关的指标是机构分布数。说明期刊质量越高，作者机构分布的范围越有限。其原因是高水平的科研机构极其有限，导致作者机构分布数较少。

四、结论和启示

期刊评价对提高期刊质量具有较大的促进作用。目前，我国期刊评价的方法经过了定性分析阶段，并向定性分析与定量分析结合发展，而且评价方法的科学性日益提高。

在评价指标方面，被引用指标是期刊质量的主要影响因素，来源期刊指标对期刊质量的影响相对较弱。被引用指标中，对期刊质量有显著影响的因素有总被引频次、影响因子、引用刊数、即年指标、被引半衰期、学科影响指标和学科扩散指标。来源期刊指标中，对期刊质量有显著影响的因素是文献选出率、平均引文率、平均作者数、海外论文比例和基金论文比例。

以上分析表明，为提高学术期刊质量，应当重视被引用指标，通过提高总被引频次、影响因子、引用刊数和即年指标等，扩大期刊的影响，加强引用指标管理，提高期刊质量。在期刊编辑出版中，。同时，设法提高文献选出率和平均引文率，努力增加海外论文和基金论文比例。参考文献：

[1]游苏宁对科技期刊评价指标的反思[J]中国科技期刊研究，2002，（1）：63-64

[2]陈冠初对中国科技核心期刊评价的探讨[J]中国科技期刊研究，2005，（6）：802-804

[3]桂文林，韩兆洲，潘庆年基于逐步回归模型的期刊质量影响因素分析[J]情报杂志，2010，（3）：76-78

[4]黄劲松期刊影响因子的偏差分析[J]编辑学报，2004，（1）：77-78

[5]北京万方数据股份有限公司中国科技期刊引证报告（扩展版）[R]北京：科学技术文献出版社，2012

评价方法论文精选(九篇)

相关热门标签

相关文章阅读

精选范文推荐

相关期刊推荐

药品评价

考试与评价

考试与评价

药物评价研究

考试与评价