公务员期刊网 论文中心 正文

国际三大顶级期刊的iSchools研究热点

国际三大顶级期刊的iSchools研究热点

0导言

2017年9月教育部、财政部、国家发展改革委联合《关于公布世界一流大学和一流学科建设高校及建设学科名单的通知》,公布了世界一流大学和一流学科建设高校及建设学科名单[1],其中武汉大学、南京大学和中国人民大学的图书情报与档案管理学科被列入“双一流”建设学科名单。与国际图书情报领域的发展相比,我国图书情报与档案管理学科的科研水平和科研实力存在一定差距,尤其是在高质量的学术成果方面。就国际三大顶级期刊(Nature、Science和Cell)而言,iSchools已经有21所学院发表过相关研究成果,而我国图书情报领域还没有相关研究成果。由此可见,当前我国图书情报领域与世界一流学科的差距体现在国际顶级期刊的研究成果未实现零的突破。为了建设世界一流学科,使我国图书情报与档案管理学科的建设与国际接轨,了解国际图书情报领域在国际顶级期刊的研究热点,促进我国图书情报学科和国家“双一流”建设,提升我国图书情报领域的研究水平和研究实力,本文以iSchools成员在国际三大顶级期刊所发表的研究成果为对象,分析国际信息领域(iField)的研究热点和发展趋势,为我国图书情报领域开展高质量的研究提供参考。

1数据分析方法和工具

词频分析法是利用能够揭示或表达文献核心内容的关键词或主题词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法[2],其依据的基本理论是齐普夫定律(Zip’slaw)。关键词共现分析方法基于如下假设:作者都很认真地选择所使用的词语,作者认可在同一篇文章中不同的词语之间存在某种联系,并且如果这种联系被足够多的作者认可,那么可以认为它在某个学科领域具有一定的意义[3]。内容分析法的实质是对文献内容所含信息量及其变化的分析,从而根据数据对文献内容进行可再现的、有效的判断[4]。本文在获取文献的题录信息和全文信息的基础上,利用词频分析、关键词共现分析、内容分析法对文献的发表时间、文献的主题领域、机构的合作情况以及三者之间的相互关系进行可视化分析。涉及的工具主要包括3个:(1)利用MicrosoftExcel对文献的题录信息进行数据透视统计;(2)利用Bibexcel对提取的主题词进行词频共现分析;(3)利用Gephi对共词关系和机构合作情况进行可视化分析。

2数据获取与预处理

本文在WebofScience数据库中利用高级检索,限定出版物名称为Nature、Science和Cell,根据83所iSchools的地址进行文献检索,如检索匹兹堡大学信息学院在国际三大顶级期刊的发文情况,其检索式为:AD=(UnivPittsburgh,SchInformatSci)ANDSO=(NATUREORSCIENCEORCELL)。文献类型和时间均不限制,去重后最终检索到55篇文献(检索时间是2017年12月10日)。将所有文献的题录信息导出,所选字段包括作者、标题、来源出版物、文献类型、被引频次等信息。由于三大顶级期刊中大部分文献缺少关键词和摘要,因此首先进行数据的预处理。主要包括两方面:(1)识别高频词和标题词作为文献的主题词。由于三大顶级期刊的大部分文献的关键词和摘要有所缺失,为了方便对文献内容的分析和理解,首先需要根据全文信息提取文献的主题词。一方面对全文的词频进行统计,识别高频词,并选取出现比例在2%及以上的词语作为文章的高频词;另一方面,作为高频词的补充,将文章标题中非停用词识别出来,作为文献主题词的来源之一。通过获取文献的高频词和标题词作为主题词来替代关键词,作为词频统计的基础。(2)机构地址的规范化和统一化。本文根据WebofScience导出的文献题录信息,利用python编程的文本处理功能,将作者的机构进行规范化和统一化的处理,方便后续的机构合作情况等其他内容的分析。

3研究结果及分析

3.1基本可视化分析

3.1.1国际三大顶级期刊中iSchools文献数量和类型分布iSchool运动作为图书情报领域发展中具有历史意义的重要事件,其成员从2004年的19所学院发展至今83所学院,分布在26个国家和地区,成员涵盖图书情报领域一流的学院及机构[5]。通过对iSchool学院在三大顶级期刊上的发文情况进行调查和统计发现,共有21所iSchool学院(25.3%)共发文55篇。其中,发文最多的学院是印第安纳大学的信息与计算机学院(IndianaUniversity:SchoolofInformaticsandComputing,在Nature发文6篇,在Science上发文4篇),其次是密歇根大学信息学院(UniversityofMichigan:SchoolofInformation,在Nature发文4篇,在Science上发文5篇)。马里兰大学信息学院(UniversityofMaryland:CollegeofInformationStudies)发文量也达6篇(在Science上发文6篇)。从单个期刊发文量来看,在Nature杂志上发文最多的是印第安纳大学的信息与计算机学院,其次是密歇根大学信息学院;在Science杂志上发文最多的是马里兰大学信息学院,其次是密歇根大学信息学院。1981年iSchools成员怀卡托大学计算与数学科学系(UniversityofWaikato:FacultyofComputingandMathematicalSciences)第一次在三大顶级期刊上发表文章,直至2000年,iSchools在三大顶级期刊上的发文量出现小幅增长,如图1所示。iSchools在国际三大顶级期刊的发文呈现两个阶段。第一阶段是2008年以前,11所iSchool学院共发文20篇,其中伊利诺伊大学信息科学学院的Lancaster,FW和Schatz,BR共发文4篇,远超过其他iSchool学院。第二阶段是2008年至今,iSchools在三大顶级期刊上的发文数量猛然增长,涉及成员从9个增至21个,发文量增加到55篇,涉及领域主题更加广泛。从整体看,2008年以后的年均发文量较2008年前都有较大的增长。其中,印第安纳大学的信息与计算机学院发文最多(共10篇),一跃成为发文最多的iSchool学院。从文献类型来看,iSchools在三大顶级期刊的发文以“Article”类型最多(41.82%),其后依次是“EditorialMaterial”(34.55%)、“BookReview”(12.73%)和“Letter”(10.91%).3.1.2国际三大顶级期刊中iSchools机构合作分析对iSchools在三大顶级期刊的发文的机构合作情况分析,发文最多的21所iSchools中,印第安纳大学的信息与计算机学院作为在三大顶级期刊发文最多的信息学院,与其他机构合作的次数也最多,涉及机构多达247个,包括华盛顿大学医学院(WashingtonUniversity:SchoolofMedicine,4次)、加州大学人类遗传学研究所(UniversityofCalifornia,SanFrancisco:InstituteforHumanGenetics,3次)、加州大学格莱斯顿研究所(UniversityofCalifornia,SanFrancisco:GladstoneInstitutes,3次)、加州大学生物统计系(UniversityofCalifornia,SanFrancisco:BiostatisticsDivision,3次)等,这些机构主要集中在生物医学信息学相关领域。密歇根大学信息学院作为在三大顶级期刊上发文仅次于印第安纳大学的信息与计算机学院的iSchool,发表的9篇文章涉及合作机构43个,包括密歇根大学复杂系统研究中心(UniversityofMichigan:CenterfortheStudyofComplexSystems,3次)、密歇根大学福特公共政策学院(UniversityofMichigan:TheGeraldR.FordSchoolofPublicPolicy,2次)。与印第安纳大学信息与计算机学院不同的是,密歇根大学信息学院合作最多的机构来自本校的科研机构和研究中心,与其他学校或机构的合作相对较少,且合作领域更加广泛。马里兰大学信息学院、加州大学伯克利分校信息学院、伊利诺伊大学信息科学学院、新泽西州立罗格斯大学通信与信息学院等iSchools的合作机构也相对较多。从图中还可以看出,密歇根大学信息学院、伊利诺伊大学信息科学学院和马里兰大学信息学院之间的合作较为密切,三者之间均有直接合作。而加州大学伯克利分校信息学院与其他iSchools之间的合作较少,只与华盛顿大学信息学院合作了一次。由此可见,在三大顶级期刊中,iSchools之间的合作较少,更多的是与其他机构的合作,如医学领域研究机构、计算机数学领域研究机构等。

3.2文献主题分析

文献的主题分析能够清楚地了解三大顶级期刊中iSchools的研究热点和主题。根据识别出来的文献主题词,利用Bibexcel对文献主题词进行共现计算,并利用Gephi将主题词之间的共现关系可视化展示出来,随着大数据时代到来,数据驱动下的科学研究成为主流。在数据驱动下,iSchools在三大顶级期刊发表的文献中,“Data”一词位于所有主题词的核心位置。从图中的主题词聚类结果来看,可大致将iSchools在三大顶级期刊上的研究热点归纳为6个方面,从上到下、从左到右依次是:生物信息学、计算机技术、信息通信理论、用户信息行为、科学发展研究、信息经济学,其中科学发展研究领域是指从宏观的角度研究大环境对科学发展的影响。3.2.1iSchools机构的研究方向和主题通过对55篇文献的机构合作情况的分析发现,iSchools在一些研究成果中只是参与了其中研究的一部分。为了了解iSchools在三大顶级期刊中的研究方向和主题,以“第一作者的机构是iSchools”为筛选条件,进一步对55篇文献进行挑选,共得到24篇研究文献,其中17篇研究成果(70.83%)都是iSchools作为唯一作者独立发表的。从单个机构来看,密歇根大学信息学院作为第一作者发文最多,共5篇;其次是马里兰大学信息学院,共4篇。从机构合作情况来看,iSchools既有与iSchools其他院校的合作,如华盛顿大学信息学院与加州大学伯克利分校信息学院、田纳西州大学诺克斯维尔分校信息科学学院与匹兹堡大学匹兹堡大学计算与信息学院;也有与其他机构的合作,但主要集中在计算机科学相关机构,如华盛顿大学信息学院与计算机科学与工程学院(WashingtonUniversity:ComputerScience&Engineering)、马里兰大学信息学院与马里兰大学高级计算机研究所(UniversityofMaryland:InstituteforAdvancedComputerStudies)。从研究方向和研究主题来看,iSchools主导的研究领域分布广泛,除生物信息学领域外,iSchools为主要的研究文献在科学发展研究、用户信息行为、计算机技术、信息经济学和信息通信理论领域都有涉及。在科学发展研究领域,密歇根大学信息学院和伊利诺伊大学信息科学学院具有较大优势,马里兰大学信息学院在计算机技术领域的研究最为突出,怀卡托大学计算与数学科学系则在信息通信理论领域有较大的贡献。3.2.2时间发展与研究主题的变化科学研究的对象一直随着时间的变化而变化,iSchools在三大顶级期刊中的研究热点也出现了明显的变化.1981年iSchools的怀卡托大学计算与数学科学系(UniversityofWaikato:FacultyofComputingandMathematicalSciences)率先在Nature上发表Arecoronalloopsstable[6],信息通信理论领域成为最初的研究主题,随后iSchools的关注焦点开始向生物信息学、科学发展研究、用户信息行为等方向转变。国际三大顶级期刊中iSchools的研究热点与时代背景和社会环境的发展变化密切相关:1998年互联网技术发展,网络环境下的用户行为成为iSchools关注的重点之一,包括用户的合作行为、选择和决策行为等,并且随着数据挖掘技术的发展,预测用户行为也成为研究方向之一;2008年世界金融危机的发生,信息经济学成为iSchools研究的主题之一,并开始利用数据信息发现世界或某一地区的贫富差距。总的来看,宏观层面探讨社会大环境对科学发展的影响是iSchools一直关注的对象,1985-2017年iSchools在科学发展研究领域共发表15篇研究成果,占27.27%;其次,生物信息学领域自2004年出现第一篇研究成果后,短短几年内发表12篇研究文章,占21.82%;在互联网环境影响下,用户信息行为领域出现11篇研究成果,占20%;计算机技术虽然从1994年就出现第一篇研究成果,并且研究内容较为广泛,既涵盖计算机协议、计算机历史的发展,也包括对计算机算法的改进和语音识别技术的讨论,但整体研究成果只有8篇,占14.55%;信息经济学作为2009年出现的新研究领域,仅有5篇研究论文,占9.09%;而信息通信理论领域只是iSchools中少数学者的研究对象,虽然是iSchools在三大顶级期刊中最早发表文献的研究主题,但只有4篇文章,仅占7.27%。由此可见,用户信息行为、生物信息学以及科学发展研究是当前国际三大顶级期刊中iSchools的研究热点。3.2.3六大主题的研究内容可视化分析根据整体聚类结果,本文对55篇文献进行主题划分,并对每个主题领域的文献主题词的共现矩阵进行可视化,从微观层面发现各个主题的研究方向和研究热点。(1)科学发展研究领域。作为发文最多的研究主题,科学发展研究领域的文献主题和方向也更加广泛。科学发展领域共有15篇研究文献,其中“Article”类型有2篇,“EditorialMaterial”类型有6篇,“Letter”类型有4篇,“BookReview”有3篇。从主题词共现关系图来看(图7),“data”“science”“information”“scientist”“model”“system”是该领域核心的主题词,由此可将该领域下的研究分为两个方面。①研究社会环境变化对科学发展的影响。一方面iSchools探讨了包括互联网技术的发展[7]、政治环境的变化[8]、法律政策的调整[9]等在内的整个社会环境对科学发展的影响;另一方面科学家的个人属性和活动也影响着科学研究的发展和传播,如科学家的性别差异、科学家研究生活的地点变化[10,11]。研究者还对科学发展过程中出现的种种现象进行思考,在宏观层次上关注整个学术环境中出现的问题和现象,包括同行评议[12]、引文量的变化规律[13]、经典规律模型的适应性探讨[14]等问题;同时,在微观层次上思考图书情报领域学科发展过程中出现的矛盾[15]。②数据管理和数据挖掘。数据驱动的科学研究中,对数据的管理和挖掘至关重要。在大数据环境下,数据的有效共享和利用能够促进科学研究,但也要保证数据管理的安全性。将信贷、奖励与数据共享相结合,并在管理数据的过程中保证资助者、机构和科学家等多方合作是建设安全可信的数据共享平台的前提[16,17]。随着数据挖掘技术的发展,iSchools开始利用这些技术探讨人类社会历史过程中的变化规律和趋势[18]。此外,该领域涉及的3篇书评文章主要围绕互联网环境下出现的新现象进行思考,包括机械自动化的生产和生活环境对人们工作选择的影响[19]、基于情境的自主学习和传统授课学习的效果的差异[20]以及互联网的发展给“数字原住民”的生活带来的改变[21]。虽然3篇书评的主题各不相同,但其主题和视角都有较大的新颖性,并且有作者的思考和讨论。(2)生物信息学领域。作为近年来国际三大顶级期刊中iSchools的研究热点之一,生物信息学领域2004-2016年产生12篇研究成果(21.82%),其中“Article”类型有1篇,“EditorialMaterial”类型有11篇。从主题词共现关系图看,“genome”“gene”“species”“phylogenetic”“data”是该领域核心的主题词。该领域的研究主题可分为两个方面。①研究生物基因组的特征和功能。人类微生物的研究是其中一个重要方向,包括对人类微生物组的功能和组成的研究[22]、分析健康人群微生物群落结构和功能结构的正常范围[23],为描述人类微生物群落的流行病学特征以及人类微生物组的转化应用提供研究基础。除了对健康人群的基因有所研究,iSchools针对糖尿病[24]等遗传病患者的基因进行分析,并为疾病病理生理学的识别提供了重要线索和依据。同时,对猩猩[25]、长臂猿[26]、疟蚊[27]、甲壳类[28]等为代表的动物的基因组的研究也是生物信息学领域关注的一个方向。分析不同动物的基因组的组成和特征,一方面对比动物之间基因组的差异,另一方面通过研究基因的组成实现基因的可塑性。此外,还包括针对基因中氨基酸信号传递介质的研究[29]、对微生物感觉视紫红质的结构研究[30]等。这些研究都关注与不同生物的基因组成及其功能,从微观层次上研究基因组的差异,并通过研究猩猩、长臂猿等生物的基因组成,确定基因中对某一功能起关键作用的部分和特征。②以基因遗传进化、物种分化问题为研究对象。iSchools除了研究生物的基因组成外,还对基因的遗传进化进行研究,通过追溯生物同胞物种的系统发育的关系,确定物种分支,从而研究生物系统的发育和分化[31]。除了传统的生物信息学分析方法外,iSchools也尝试利用数据算法验证基因组数据的同质性[32,33]。总的来看,三大顶级期刊中iSchools以生物信息学领域为研究主题的探讨主要围绕生物基因组的结构和功能以及生物系统的发育和进化两个方面开展相关的研究。(3)用户信息行为领域。iSchools在用户信息行为领域的研究是伴随着互联网的发展开始的。1998年出现该领域的第一篇文章便是研究互联网是如何影响用户之间的社交活动和社区参与的,并且认为互联网是一种可以发展网络友谊的媒介[34]。用户信息行为领域从1998-2016年共产生11篇研究成果(20%),其中“Article”类型有4篇,“EditorialMaterial”类型有5篇,“Letter”类型有1篇,“BookReview”有1篇。从主题词共现关系图来看,“users”“model”“social”“media”“community”“cooperation”“data”等是该领域核心的主题词。该领域的研究主题可分为两个方面。①社交网络中的用户行为。社交网络作为互联网环境下的产物,对用户的行为产生了潜移默化的影响,越来越多的用户在社交网络中产生了信息浏览、分享等互动行为,改变了传统的信息交流方式,因此,对社交网络中的用户行为研究成为用户信息行为领域的主要方向。iSchools不仅探讨了用户利用社交网络构建和扩展社交圈的现象[34],还针对网络环境下信息的混杂和不确定性现象,提倡构建社会信任网络,保证信息来源的真实性和可靠性[35]。随着社交网络技术逐渐成熟,越来越多的人从信息的接收者转变为信息的发送者,人们可以便捷地参与社交网络,利用公民组成的社会网络,及时应对各种危机灾难成为新兴的研究主题。个人作为在社会媒体中最容易表达观点的部分[36],利用社会网络能够第一时间消息,从而应对各种危机灾难的发生[37,38],提高相应部门的响应和恢复能力。②预测用户的选择和决策行为。除了互联网环境下的用户信息行为是iSchools研究的主要方向,网络环境下对用户的选择和决策行为进行预测也是其关注的焦点之一。首先是用户的合作行为,iSchools重点讨论了人们出现和维持合作的条件,以及人们出现合作情况时的基本特征,并利用计算机模拟人们合作特点,预测人们合作的可能性[39,40];其次,早在2008年iSchools就开始利用神经网络等数据挖掘方法,通过算法和大数据来理解和预测人们的经济决策乃至生活中各方面的选择[41,42,43]。除了健康人群的用户行为分析,iSchools也探讨了特殊患者的识别行为,如失语症患者对说谎者的识别能力的研究[44]。这也说明,在三大顶级期刊中,iSchools始终保持着独特的研究视角和多样化的研究方法。用户信息行为领域的研究视角和研究方法在一定程度上代表了iSchools在三大顶级期刊中发文的优势。在关注研究热点的同时,也善于从研究中总结和发现新的研究方向,同时注重利用新的研究方法提高研究水平。(4)计算机技术领域。计算机技术领域与图书情报学的发展密切相关,在三大顶级期刊中,iSchools在计算机技术领域共有8篇研究文献,其中“Article”类型有1篇,“EditorialMaterial”类型有4篇,“Letter”类型有1篇,“BookReview”有2篇。从主题词共现关系图来看,“machine”“technology”“information”“global”“science”“compute”等是该领域核心的主题词,由此可将该领域下的研究分为两个方面。①计算机历史和技术发展的研究。计算机技术领域的研究首先是围绕计算机本身的发展历史[45,46]、计算机的存储、通信和计算能力[47]等主题展开。随着社会进步和技术发展,一些新兴的计算机技术,如语音输入和识别技术的发展引起了iSchools研究者的兴趣[48,49],并对新技术与传统技术的共同发展保持乐观的态度。②利用计算机算法解决相关问题。计算机算法是计算机技术领域研究的主要内容,通过算法对数据的观测,构建数据模型以解决人类生活中的问题成为主要的方式[50],但是计算机算法并不是万能的,还存在两个主要的不足:一是通过数据训练出来的算法一旦出现偏差,将很难进行修改[51];二是并非所有的问题都能通过计算机算法得到解决[52]。iSchools在计算机技术领域的研究没有涉及太多专业的程序算法等方面的问题,主要是围绕着计算机技术的变化对人们的信息生活和信息需求带来的影响和改变的讨论,更多是从宏观层次上的探讨。(5)信息经济学领域。信息经济学领域作为2008年世界金融危机后出现的新兴领域,2009-2016年共发表5篇研究成果,其中“Article”类型有2篇,“EditorialMaterial”类型有2篇,“BookReview”有1篇。从主题词共现关系图来看,“data”“metadata”“wealth”“poverty”“mobile”等是该领域核心的主题词。该领域的研究方向相对较为集中―利用元数据识别经济活动。这一方向的研究是伴随着移动支付和移动消费的发展而出现的,也是近年iSchools在三大顶级期刊上探讨的热点话题之一。其探讨的主要内容利用机器学习等方法挖掘手机交易元数据,通过评估数百万个人的消费数据评估地区的资产分布和贫富区域分布,甚至构建整个国家的财富分布情况[53,54]。另一方面,经济活动中元数据的可识别和可获取性导致人们开始关注信用卡消费元数据的安全性[55]。数据的匿名性力度不够是当前经济活动中存在的安全隐患。此外,iSchools尝试从经济学角度看待经济活动中的现象和问题,利用博弈论、实验经济学和计算机科学[56,57]等观点讨论改善经济和社会结构的运作,从而创造一个稳定的金融市场和社会网络。由此可见,信息经济学领域的研究是在新的社会环境下,灵活运用元数据本身的功能和作用,通过机器学习等数据挖掘技术和方法,发现日常的经济活动中存在的问题和现象,并根据经济活动的特点和出现的问题及时采取相应的措施,保证金融市场的正常运作和发展。(6)信息通信理论领域。作为最早在三大顶级期刊发表文章的研究领域,iSchools在该领域的发文并不多,是因为随着社会环境和科研环境变化,图书情报的研究对象发生了转变。1981-2009年共发表4篇研究文献,其中“Article”类型有3篇,“EditorialMaterial”类型有1篇。从主题词共现关系图来看,“entanglement”“diamond”“temperature”“loop”“coronal”等是该领域核心的主题词。信息通信理论领域的研究文献数量很少,并且主要利用构建数学公式和模型的方式,运用信息通信理论从微观上揭示各种现象,包括天体表面的等离子循环的不稳定现象[6,58]、以金刚石为代表的物体内部不同的量子纠缠态的选择对量子信息处理的影响[59,60]。该领域的4篇研究文献是对信息通信理论领域专业问题的探讨,与iSchools其他研究主题相比,该领域的研究较少。总的来看,信息通信理论领域只是早期iSchools在三大顶级期刊上探讨的一个主题,但是近年来iSchools的研究方向逐渐向其他领域转变.