公务员期刊网 论文中心 正文

学术期刊的评价指标权重讨论

学术期刊的评价指标权重讨论

0引言

定量的学术期刊评价通常离不开指标权重的确定,然而期刊评价指标之间往往存在多重共线性,如影响因子与五年影响因子以及他引影响因子有高度的相关性,当我们选取的指标存在多重共线性时,一般期刊评价中消除指标多重共线性的方法常用的是因子分析或者主成分分析降维处理,从而确定指标权重[1],但对于小样本多指标数据或者不服从正态分布的指标数据,因子分析与主成分分析不太适合[2]。然而用偏最小二乘结构方程模型的方法来确定指标的权重,该方法的优点有:PLS结构方程模型不要求指标数据服从正态分布;PLS结构方程模型结合了多元线性回归、主成分分析、典型相关分析等统计学方法;PLS结构方程模型对样本量的要求低,最小样本要求是30至100,然而协方差结构方程模型一般要求最小样本量在200以上,所以该方法对于小样本研究也有较好效果[3];PLS结构方程模型能较好的处理指标数据多重共线性的问题。俞立平等[4]研究发现偏最小二乘法可以对非线性的评价方法的结果做出较好的检验,且能有效消除指标间多重共线性。PLS结构方程模型作为偏最小二乘回归的拓展,能够得到指标的权重分布,现在应用也愈加广泛,罗玉波等[5]讨论了结构方程模型存在的缺陷,提出使用偏最小二乘法构建的“软模型”的建议。孙继红等[6]采用PLS结构方程模型,对全国31个省区的高等教育发展水平做出了与实际情况相符的综合排名,说明指标权重的分配较为合理。程慧平等[7]建立PLS结构方程模型研究我国31个省区的图书馆发展水平,得到了各指标权重分布,并得到了综合排名。现阶段,在期刊评价中通过PLS结构方程模型的方法得到指标的权重的研究极少,另外由于期刊评价指标中流量指标过多、存量指标过少,本文提出一个新的存量指标历史被引影响因子(HCIF)(历史被引影响因子(HCIF)=总被引频次/(期刊办刊年限*期刊出版频率)),该指标能反映期刊的办刊历史,出版频率对期刊质量的影响,总被引频次指标完全没有考虑到期刊的办刊年限和出版频率[8],我们都知道办刊年限长或者出版频率高的期刊在总被引频次指标上占据了较大的优势,评价结果势必对一些办刊历史较短或者出版频率较低的期刊造成一定的不公。不妨想象一下,某期刊一年只出版1次只发表数十篇的文章在总被引频次上如何才能比得上一年出版12次发表数百篇文章的期刊。但是加入历史被引影响因子指标可以一定程度弥补这一缺憾。所以本文将通过构建PLS结构方程模型来确定期刊指标权重的分配,探索历史被引影响因子以及其他评价指标的权重,对结果做出合理解释并进一步提出相关建议。

1指标选取及数据来源

在指标选取中,除了本文提出的历史被引影响因子(HCIF)外,另外选择了常用的指标有影响因子、五年影响因子、总被引频次、他引影响因子、即年指标、可被引文献量、基金论文比、平均引文数、被引期刊数、web即年下载率、总下载量,总共12个指标。样本综合选择了多个学科的刊物,剔除有缺失指标数据样本后靠前选取了综合性科学技术类期刊37种,物理学类期刊31种,地质学类期刊32种,中医学与中药学类期刊44种,综合性农业科学类期刊43种,自动化技术、计算机技术类期刊39种,食品科学技术类期刊35种,总共261种期刊。数据来源于最新出版的2015年《中国学术期刊影响因子年报(自然科学与工程技术)》[9]。为消除量纲影响,使得指标数据存在可比性,本文利用如下公式对指标数据进行标准化处理:对于正向指标:rji=(aji-minjaji)/(maxjaji-minjaji) 对于负向指标:rji=(maxjaji-aji)/(maxjaji-minjaji)(其中,i代表指标,i=1,2,…,12;j代表样本,j=1,2,…,261),按照上述公式可以得到标准化的指标数据.

2指标权重的确定

2.1唯一度检验

本文将所选指标分为篇均影响力与规模影响力两大类,最终在构建PLS结构方程模型时,篇均影响力与规模影响力将作为潜变量,两个潜变量分别对应各自的观测变量,在构建PLS结构方程模型前,需要首先对这两组显变量做主成分分析,即唯一度检验,检验结果如表2所示,可以看到篇均影响力与规模影响力所对应的显变量组都只基于特征值大于1的原则提取了一个主成分,所以通过了唯一度检验。

2.2PLS结构方程模型的构建

建立PLS结构方程模型,可以看到左边是篇均影响力与规模影响力所对应的指标构成的显变量组。右边是所有的指标组成的显变量组,将其命名为综合影响力。最终通过smartPLS2.0可以得到了模型路径系数如图1,这样可以看到相应指标在篇均影响力和规模影响力上重要程度,同时也能从综合影响力上具体反映该指标的重要程度。从图中可以看到篇均影响力和规模影响力对综合影响力的路径系数分别为0.909(t=41.676)和0.227(t=4.994),说明篇均影响力所包含的信息量要大于规模影响力,即与规模影响力相比,篇均影响力更能反映期刊的质量。

2.3模型的检验

借助smartPLS2.0的PLS技术进行迭代计算,模型信度和效度检验的结果如表3,其中信度检验由CronbachsAlpha值(内部一致性系数)和CR值(组合信度)来体现,结果显示全部潜变量的CronbachsAlpha值和CR值都大于0.8,高于0.7的一般水平,说明模型中选用的指标数据信度较好。效度检验分为聚合效度和区分效度检验,聚合效度通过看AVE值(抽取的平均方差)来体现,一般来说要求AVE值大于0.5[10],而篇均影响力与规模影响力的AVE值都大于0.5,说明指标数据聚合效度较好;区分效度则通过R2(测定系数)的大小来衡量,一般来说要求R2大于0.3[11],由表3可知潜变量综合影响力的R2为1,说明指标数据区分效度较好,同时说明综合影响力对篇均影响力和规模影响力的解释能力非常好。此外模型的整体适配度可以用公因子方差和测定系数的几何平均数来度量[12],潜变量的公因子方差值如表3所示,所以本文评价模型的整体适配值为0.7041,说明模型的适配较为理想。

2.4模型的结果

根据smartPLS2.0得到如表4(见下页)的结果,表中包含了各指标与潜变量篇均影响力、规模影响力、综合影响力的相关关系以及在这三个潜变量上的外部权重。综合影响力可以反映期刊的办刊质量以及学术影响,从各指标在综合影响力的外部权重的大小可以衡量该指标对期刊评价结果的影响能力。历史被引影响因子的综合影响力外部权重为0.1299,仅次于影响因子、五年影响因子、他引影响因子、即年指标4个指标,说明历史被引影响因子对期刊评价结果的影响较大。总被引频次的在综合影响力外部权重为0.1237,与历史被引影响因子的外部权重相当,两者分别属于篇均影响力指标和规模影响力指标,如果同时选用总被引频次和历史被引影响因子两个指标,这样可以综合考虑被引数量的多少和被引效率的高低,就能一定程度上弥补单纯以被引数量的多少来衡量期刊质量的缺陷。历史被引影响因子与影响因子的Pearson相关系数为0.496(p=0.000),相关程度一般,因为历史被引影响因子是存量指标而影响因子为流量指标,这也是合理的,历史影响因子可以作为一个较好的存量指标。本文发现基金论文比、可被引文献量、被引期刊数、总下载量在综合影响力上的外部权重都较低,这4个指标也并不能很大程度上反映期刊的质量。可以发现影响因子与五年影响因子的权重较为接近,且权重也较大,两者之间的Pearson相关系数为0.932(p=0.000),两者属于趋同性指标,建议在今后的学术期刊评价中两者选其一即可,否则将过度强化了期刊的篇均影响力,这与黄贺芳等[13]研究结果相符。

3结论与建议

学术期刊评价指标权重的确定是评价期刊质量的关键所在,结合现有的研究,本文提出构建期刊评价指标体系的PLS结构方程模型,旨在消除期刊评价指标间的多重共线性的情况下得到指标的权重。另外,由于期刊评价指标体系中存量指标过少,没有考虑到期刊的办刊时间以及期刊出版频率对期刊质量的影响,所以指标选择中增加了一个“历史被引影响因子(HCIF)”指标。该指标的加入可以一定程度上削弱那些办刊历史较长或者出版频率较高的期刊在总被引频次上占据的绝对优势,同时也能让那些进步较快或者说办刊历史较短、出版频次低的期刊在评价中得到较为公正的对待。包括历史被引影响因子指标,本文共选取了12个指标,将指标分为反映篇均影响力和规模影响力的两类。构建PLS结构方程模型,模型构建合理,利用smartPLS2.0的迭代计算得到各指标的外部权重,其中历史影响因子的权重较高,且与影响因子的相关关系为0.496,虽然相关性不高,但是两者分属于存量指标和流量指标,相关性可以说较高了,也说明历史被引影响因子可以一定程度上反映期刊的质量水平。基金论文比、可被引文献量、被引期刊数、总下载量的外部权重都较低,这种结果也是合理的。基于此,本文提出以下建议:(1)历史影响因子可作为一个较好的存量指标,主要反映了期刊的篇均影响力,总被引频次作为存量指标主要反映了期刊的规模影响力,建议在今后的学术期刊评价中,可以考虑同时被选用,综合考虑被引数量的多少和被引效率的高低。(2)可被引文献量、基金论文比、被引期刊数、总下载量这4个指标对期刊质量的影响有限,在主观赋权时不宜过大。(3)影响因子与五年影响因子的权重较为接近,且权重也较大,两者有很强的相关性,属于趋同性指标,建议在今后的学术期刊评价中两者选其一即可,否则将过度强化了期刊的篇均影响力。