公务员期刊网 精选范文 即时通信基本概念范文

即时通信基本概念精选(九篇)

即时通信基本概念

第1篇:即时通信基本概念范文

在密涅瓦大学,学生们将接触并学习100多个思维习惯和基础概念,大二至大四在全球六大城市学习中,他们将在跨文化场景中使用这些习惯和概念,接受挑战,合格的学生才算毕业,并将运用这些习惯和概念去解决全球面对的挑战。

密涅瓦大学艺术与人文及社会科学学院教学主管Kara Gardner女士接受本刊专访,阐述思维习惯和基础概念。

《大学生》:请谈一谈思维习惯和基础概念。

Kara:思维习惯与基础概念是不同的。思维习惯,这种能力将会成为一种无意识(automatic)的行为。基础概念则更深层次,在这些概念之上可以构建自己的知识体系。

请看以下三对思维习惯和基础概念。

如何找到合适的信息阐述观点(finding information needed to make an argument),即在辩论中能迅速想到合适的信息支撑观点,这是无意识的。分析和解释视觉形式的交流(analyze and interpret visual-form communication)则是基础概念,比如视觉艺术画、雕塑,如何解释视觉形式的交流可能会用到几种不同的工具,且需要一定的时间才能形成。

另一个思维习惯是如何区分相关性和因果关系(the distinguish between correlation and causation)。两件事相互关联,其中一件事并不会导致另一件事的发生;另一种情形是一件事导致了另一件事的发生,那这两件事是因果关系(cause and effect)。这种区分相关性或因果关系的能力就是一种无意识的思维习惯,即能迅速地区分。还有一个基础概念是如何评价假设是否真实可信或能被检测(a hypothesis is plausible and testable)。经验分析关乎科学方法,怎样才能做出一个可以被证明为真的假设,怎样才能做出一个可以用科学方法证明真假的假设,这不是无意识的,需要几个步骤。

讲一对都与解决问题相关的思维习惯和基础概念。类比和解决问题(analogies and problems solving)是一个思维习惯,解决问题时其实是无意识中快速而自发地想出一个类比,尝试解决问题。诠释和使用正式的问题表述(interpret and use formal representations of the problems)则不然,是基础概念。我们必须知道哪种表述更符合当前的特定问题,这个过程并不是无意识、自发的,需要一定的时间。

总之,思维习惯是无意识的能力;基础概念是如何更好解决问题的方法,须将许多不同信息片段综合起来,是建造知识体系的基础性知识。

密涅瓦大学强调四种核心能力,批判性思维、创造性思维、有效沟通和良性互动,每一个核心能力又由不同的思维习惯和基础概念构成,找到合适的信息阐述观点这项思维习惯归属于有效沟通。

《大学生》:为什么密涅瓦大学把思维习惯和基础概念放到如此重要的地位?

Kara:因为它们代表了可转移的技能(transferable skills),学生不仅仅学习课本知识,我们称之为信息传递(information transmission)。现有大量有价值的信息,比如在智能手机上可以查阅信息。许多研究表明当关注信息本身时,学生们会死记硬背,然后快速忘掉,并未消化、理解信息。所以,我们在不同的情景下教授学生们思维习惯和基础概念,然后他们运用到实践中,这样就可以很好的消化、理解,并真正记住它们。此外,学生们将变成真正的思考者,并把它们运用到工作、学习,甚至日常生活中。

这样的理念并不是我们闭门编造的,许许多多的大学或教育机构都想实现这样的目标,即拥有富有创新和创造思维的学生,同时他们还能清晰有效的沟通、具有团队协作精神和具备解决问题的能力。我认为,我们恰好理解了前人研究的成果,即学习过程中有效的部分。要知道,有许多研究都证明了这些内容,我们只是系统地认识了,清晰地做了定义,并在课堂上实践了它们。我们将思维习惯和基础概念建立在学习科学之上,做法更具系统性。

《大学生》:在密涅瓦大学,大学生如何掌握思维习惯和基础概念?

Kara:在大一,我们的四门核心课程――理论分析(formal analyses)、实证分析(empirical analyses)、系统分析(complex systems analysis)和多元模式沟通(multimodal communication)――就向学生介绍思维习惯和基础概念。所以,每一个核心课程都有一套思维习惯和基础概念,都在大一教授给学生。学完一门课程,学生反复地把思维习惯和基础概念运用到其他的课程;再运用到整个大学四年中。

我们如何做到这一点?我们有人数不超过19人的小型研讨班,在每一堂课中我们会给教职人员规定课程计划,每一个课程计划集中讲解一种习惯或概念。以“找到合适的信息阐述观点”思维习惯为例,我们把它运用到课堂中去,运用到多元模式沟通中。课前,学生们要阅读文章或材料,形成自己的观点。接下来,他们在课堂上想办法为自己的观点辩护,并形成自己的结论。为此,他们必须找到合适的信息支撑自己的观点,并在课堂上阐述出来,其他同学提出问题后,他们需找到更多信息支持自己的观点。这就是课堂上的交互式对话。

《大学生》:如何检测学生们是否掌握了思维习惯和基础概念?

Kara:我们有几个不同的检测方法,每一个思维习惯或基础概念都具备一个衡量标准(rubics),依此衡量学生课前的阅读材料、课堂上运用思维习惯或基础概念的情况……我们会对课堂进行全程记录(课堂使用的学习平台会自动记录上课的全过程),课后,教授观看这些记录,进行打分给予评价。教授使用的衡量标准都是相同的,共分为五个等级,每个等级都对学生掌握思维习惯和基础概念的程度进行了细化。

《大学生》:思维习惯和基础概念是否是大学生所必须掌握的技能?

Kara:肯定是的。事实上,这就是我们选择教授这些技能的决定性原则之一。不仅在第一年,而是在整个大学四年;不仅在一个科目或专业上,而是在不同的专业领域上,大学生都将使用思维习惯或基础概念。同样,它们还会被运用于在课堂之外的日常生活中。所以,它们目的是为实用知识服务,即可用得上的知识。

第2篇:即时通信基本概念范文

关键词:本体;本体检索;语义相似度计算

1 引言

随着internet的日益发展和普及,本体在信息采集、信息检索及本体集成等方面的应用越来越广泛。2002年12月18日berners-lee在国际xml2000的会议提出semantic web(语义网)的构想[1]。在semantic web中,语义相似度算法是实现基于本体的检索、采集等的关键问题。因此语义相似度算法的好坏成为信息检索效率高低的重点,于是改良语义相似度算法是一个迫切的问题。

关于语义的相关性,国内外专家已经做了大量的工作:resnik根据两个词的公共祖先节点的最大信息量来衡量两个词的语义相似度。agirre等在利用wordnet计算词语的语义相似度时,除了结点间的路径长度外,还考虑到概念层次树的深度、概念层次树的区域密度。鲁松研究了如何利用词语的相关性来计算词语的相似度。li sujian等提出了一种词语语义相似度的计算方法,计算过程综合利用了《知网》和《同义词词林》。朱礼军等引入了计算语言学中的语义距离思想来计算领域本体中概念间的相似度。

本文总结前人的经验,并将概念的数据类型考虑其中,这样概念的语义相似度就更加精确。

2 本体与领域本体

本体(ontology)作为一种能在语义和知识层次上描述信息的概念模型,自被提出以来就引起了国外众多科研人员的关注,并在计算机的许多领域得到了广泛的应用,如知识工程、数字图书馆、软件复用、信息检索和web上异构信息的处理、语义web等。

2.1 本体的概念

目前对本体的定义有很多,专家们认为由studer等人在1998年提出的“本体是共享概念模型的明确的形式化规范说明。[3]”最为精确。它包含4层含义:概念化(conceptualization)、明确(explicit)、形式化(formal)和共享(share)。

(1)概念化:指通过抽象得出客观世界中一些现象(phenomenon)的概念模型。

(2)明确:指所使用的概念及使用这些概念的约束都有明确的定义。

(3)形式化:指本体是计算机可读的(即能被计算机处理)。

(4)共享:本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。

2.2 本体的分类

guarino[5]在1997年对本体依照领域依赖程度,分为顶级(top-level)、领域(domain)、任务(task)和应用(application) ontologies共4类。其中:

(1)顶级ontologies描述的是最普通的概念及概念之间的关系,与具体的应用无关,其他种类的ontologies都是该类ontologies的特例。

(2)领域ontologies描述的是特定领域中的概念及概念之间的关系。

(3)任务ontologies描述的是特定任务或行为中的概念及概念之间的关系。

(4)应用ontologies描述的是依赖于特定领域和任务概念及概念之间的关系。

本文主要就是基于领域ontology来设计与研究语义相似度计算方法。

3 语义相似度计算

语义相似度是判断几个概念之间的语义的相似程度。在信息检索中,它反映的是用户查询关键词的意义上的符合程度。

3.1 语义相似度计算原则

语义相似度的计算原则是为了本体内部概念间相似度计算更加准确而提出的[2],其内容如下:

(1)量化原则:相似度是一个数值,取值范围应该在[0,1]之间[3],如果两个概念完全相同,那么他们的相似度为1,完全不同,相似度为0。

(2)简单性原则:计算相似度的同时应该考虑计算复杂度[4],复杂度应该尽量降低。

(3)充分利用本体的特性。

(4)可调节性:可调节性是指相似度的计算结果可通过某些参数来调节,词语相似度是一个主观性比较强的概念,可调节性可以满足不同的需求,适应不同的情况[2]。

(5)类型性:在计算概念相似度的时候,也应该将概念的数据类型考虑其中,这样能提高概念相似度的精度。

(6)对称性:sim(c1,c2)= sim(c2,c1),对称性有利于概念相似度之间的对比与换算。

3.2 相似度计算方法

本文建立了一个简单的医疗系统的本体,如图1所示。class:表示的是类,subclassof:表示的是本体中最主要的关系,即概念之间子类的关系,也就是继承关系。例如:c0是c1,c2的父类,而c1与c2则是c0的子类。

利于owl语言构建此本体的代码片段,如下:

xmlns:rdf="/1999/02/22-rdf-syntax-ns#"

xmlns:xsd="/2001/xmlschema#"

xmlns:rdfs="/2000/01/rdf-schema#"

xmlns:owl="/2002/07/owl#"

xmlns="/ontology1243997987.owl#"

xml:base="/ontology1243997987.owl">

……

……

(1)语义距离:是两个概念在本体树中的最短距离,记作distant(a,b)。①语义距离越大,其语义相似度越低。反之越大。②两个概念的父节点是同一个,那么distance=1/n(n表示与该节点有共同父节点的子节点的个数)③同一概念的语义距离为0。例如:图1中所示的distance(c5,c5)=0,distance(c7,c8)=0.5。

(2)datatype(数据类型属性)的相似度:是两个概念的数据类型的比较得出来的一个参数值,记作simdt(a,b)。如果两个概念的数据类型相同,则simdt(a,b)=1。如果不同,则simdt(a,b)=0。

(3)objectproperty(对象类型属性)的相似度[5]:是类与类之间的关系,记做simobject(a,b)。和分别表示概念和的对象类型属性的个数。 的对象类型属性所对应的概念为,的对象类型属性所对应的概念为,则概念的对象属性的语义相似度为:

(4)本体概念的深度:是概念在本体树中的层数,记作depth(a)。

(5)调节因子:是为了满足系统的特定需要而设定的特定参数。由于词语相似度是一个主观性比较强的概念,所以必须使用调节因数来具体情况具体分析。它通过对本体树的广度与深度的控制来调节特定的语义的相似度。本文用k来表示调节因数。

综合得出语义相似度算法的公式:

式中sim(c1,c2)表示概念c1、c2的语义相似度,distance(c1,c2)表示概念c1、c2的语义距离,simdt(c1,c2)表示概念c1、c2的数据类型的相似度,simobject(c1,c2)表示概念c1、c2的对象类型的相似度,k表示调节因子,depth(c1)表示c1的的深度(即本体树中的层数),分别是数据类型属性和对象类型属性在属性相似度中的权值,,且。

3.3实验结果

根据本文得出的语义相似度算法,即上述公式计算出表1所示的本体树的语义相似度。

3.4 基于本体语义相似度的应用

begin;

input:查询表达式 q={w1,w 2,……,wn} and 语义相似度的临界值k;

result = null,i=0;

while(q[i]的语义相似度>=k){

result[i]=q[i]+相关概念集;

i++;

}

return result;

end;

4 结束语

人与机器之间的有语义的交流近年来成为了人们研究的焦点与瓶颈。本体由于其共享性和明确性以人与机器的语义交流的基础进入了人们的视野。本文通过建立本体树,利用其层次之间的关系来设计概念的语义相似度算法。同时将概念的数据类型与对象类型也考虑其中,这大大提高了概念的语义相似度算法的精度。但是由于本文只考虑了基于单个本体的相似度算法,不能满足多个领域本体间概念的相似度算法。在以后的研究中,会将此算法扩展到多个领域来设计,以便大幅度提高概念的语义相似度的精度,进而优化基于本体的信息检索及信息采集。

参考文献

[1]berners-lee t,hendler j,lassila o.the semantic web[j].scientific american, 2001,284(5):34-43.

[2]李鹏,陶兰.一个改进的本体语义相似度计算及其应用[j].计算机工程与设计,2007,28(1):226-228.

[3] 刘建,李素建.基于《知网》的词汇语义似度计算[j].中文计算机语言学, 2002,7(2):59-76.

[4] andreasen

第3篇:即时通信基本概念范文

一、概念整合理论

概念整合理论(ConceptualIntegrationTheory)又称概念融合或者交织理论,是认知语言学家福柯尼耶(Faucon-nier)在心理空间理论的基础上提出的一种新的意义构建理论。心理空间是人们思考、交流时为了达到理解与行动目的而构建的概念包[3]。概念整合是基于心理空间的一种人类基本的、普遍的认知方式,是综合不同认知域框架的一系列的认知活动,也是进行创造性思维和活动时的一种认知过程。其整个过程包括了类推、递归、心智建模、概念范畴以及建构框架等[4]。概念整合理论关注4个基本的心理空间之间的映射。四位空间模式包括两个输入空间(InputSpaces),一个类属空间(GenericSpace)和整合空间(BlendingSpace)。两个输入空间的共有结构及其共有的抽象信息被投射到第三个空间类属空间里;而同时,在这两个输入心理空间的基础上,通过跨空间地部分映现、匹配并有选择地投射到第四个空间-整合空间。整合空间从两个输入空间中提取部分结构,形成层创结构(EmergentStructure)。这样,这4个空间通过投射链彼此连接起来,就构成了一个概念整合网络[5]。概念整合过程可分为3个基本过程:第一是构建过程(Composition),即从输入空间投射到整合空间的过程。第二是完善过程(Completion),即输入空间的投射结构与长期记忆中的信息结构相匹配的过程,它是层创结构内容的来源。第三是扩展过程(Elaboration),即根据它自身的层创逻辑,在整合空间中进行认知运作的过程。合成空间理论是一种在线的、动态的、创造性的认知活动。福柯尼耶认为,“概念整合”是一种非常普遍的认知操作,是心理空间理论的延续和发展;是人们进行思维和活动,特别是进行创造性思维和活动时的一种认知过程。

二、翻译的概念整合观

福柯尼耶提出的概念整合理论为意义成因机理的探索做出了里程碑性的贡献;对语言、符号学、形式和意义、概念的映射与整合、新创机构和新创意义等重大理论问题提出了理据性的阐释。概念整合思维模式引导人们从一个新的视觉去认识世界、认识心智空间、概念空间、意义生成、表现与内涵、外部世界与人的心智世界;概念整合理论跨越了语言学、哲学、心理学、社会学、自然科学等领域。此理论对翻译特别是文学翻译也具有理论指导价值和研究意义,其根本原因源于目前我国翻译界理论研究的侧重点以及概念整合理论对文学翻译过程研究的极大解释力。传统的翻译隐喻观将翻译看成是一个具有明显的方向性的过程,即从原文到译文。翻译就是将源语言中的意义和信息投射到译入语中去。传统的翻译观过于局限在两个概念域之间客观意义的单向投射上而忽略了人的因素。概念整合网将翻译带入一个动态运作系统,其同类空间相当于源语言和译入语共享的文化心里图示,因为有了它源语言向译入语的投射才有可能。概念整合之所以能将翻译带入一个动态的运作系统就是因为交织空间中有层创结构存在。翻译的概念整合观改变了人们对翻译的看法,动态交织运作很可能会比较容易地解释传统翻译观中一直难以解决的矛盾,诸如意译和直译、等值与可译性等。翻译过程超越了传统的“编码、传达、解码”,而是一种言语交际行为,中间涉及了广泛的认知运作。原文作者和译者构成一对交际的双方,译者和译文读者又构成了另一对交际者。翻译是译者通过原文文本与原作者及潜在的译文读者进行交流的过程,在此过程中,译者即时进行在线空间合成和概念整合。译文正是经过多次合成、整合后的层创结构,与原文和译者空间都不同的新显形式。整合空间中的层创结构是概念整合之所以能将翻译带入一个动态的运作系统的原因。

三、文学翻译中的认知运作

翻译的过程是译者将源语空间与译者空间进行创造性整合的过程,译文是源语文本的思想内容与目标语表现形式在第三个概念域内的整合。由于文化差异的存在,翻译时译者通过投射链动态地将源语和目标语两个心理空间连接起来,这种认知运作机制正是翻译整合观的体现。文学作品的概念整合翻译是一个由阅读、体会、沟通、整合到表现的审美创造过程。源语言的符号反映到译者的大脑转化为概念,由概念组合成完整的思想,然后发展成为更复杂的思维活动,如联想、评价、想象等等。英国翻译学家纽马克(New-mark)最早关注了文学作品的隐喻翻译问题。他在Ap-proachestoTranslation(《翻译问题探讨》)一书中辟专节讨论文学翻译大环境下的隐喻翻译方法[6]。我们认为文学作品的翻译认知运作是个复杂的动态创造过程:1.源语文本空间:译者对源语言文本的解读,分析原作者的创造心理空间及与原文相关的信息。源语文本空间主要由源语文本结构及相关的文化心理图式构成。2.译者空间:译者创造过程中将与解读文本相关的百科知识、生活阅历、审美倾向、文化底蕴、社会历史知识等输入此空间。译者空间主要由译者文化心理图式及其语言表现形式构成。3.类属空间:译者和原作者共享的意义和心理图式构成了类属空间。4.整合空间:经过源语文本空间与译者空间之间的相互映射,融合,有选择地投射到最后的整合空间,并产生译文的层创结构,最终创造出翻译作品。以上步骤只是翻译中概念整合的大致构成,具体的翻译操作时译者还须根据具体的情况,通过投射链动态地将源语言和目的语空间连接起来,进行多次整合才能达到比较理想的译文[7]。下面以红楼梦的不用译文实例来探析概念整合在翻译过程中的运作。例一:(凤姐)又向平儿笑道:“我如今是骑上老虎了……”《(红楼梦》55回)。译文1:She(Xifeng)changedthesubjectthen,contin-uing,I’mridingonatiger’sback…”.(杨宪益译)译文2:XifengpausedforamomentandsmiledatPatienceconfidingly:“Butit’slikeridingatiger…”.(霍克斯译)“骑上老虎”是民间广泛流传的简短的谚语,表达灵活,却常常蕴含丰富的寓意和哲理。显然,这里“骑上老虎”不是描述现实发生的状况,所以必须通过概念整合理论将源语言中的文化情境投射到整合空间才能探明隐藏在源语中的深层含义。而上面的两种译文都是忠于语言形式,追求字面意义的一致。按照福柯尼耶的概念整合理论分析,“骑”激活其内在槽孔(Slots)的默认值(DefaultValues)形成潜在的输入空间,即“骑马”空间。另外一个输入空间是显性的“(骑)虎”空间。“(骑)马”空间中包含了马的普通属性,例如:温顺、迅捷、倔强、食草等,而“(骑)虎”空间包含了虎的普通属性,如:凶猛、飞奔、不驯服、食肉等。

马和虎都是动物,都受到人类行为的制约和影响,这一共性反映至类属空间,成为概念整合的前提基础。两个输入空间中的基本元素“马”和“虎”及其属性成分在认知活动中进行跨空间映射,这些属性被投射到整合空间,当然属性的投射是有选择的,选择性投射通常基于具体的社会文化情境。投射完成后,通过“组合”可以把来自于输入空间的元素(“马”和“虎”)糅合在一起:都是动物,都有难于驯服的一面。然后通过“完善”和“精化”进行整合:骑马有时都很难驯服,更别说是骑老虎了。完善过程需要掌握一定的背景知识,从而发现这些元素之间的相似之处:迅捷—飞奔;倔强—不驯服,然后通过“精化”实现真正意义的概念整合,获得“呈现结构(Emergentstructure)”,即:使(某人做什么)很为难,这也就是我们常说的“骑虎难下”。当然,具体背景不同,概念整合的认知结果就不同,翻译出的译语也就不同。如果这话的文化背景是凤姐有靠山,说话时信誓旦旦,底气很足,这时“骑上老虎”应理解为“攀上了权贵”;如果凤姐是利用他人权势压制他人,那么“骑上老虎”应理解为“狐假虎威”了。所以说,认知整合离不开背景空间的作用,充分考虑背景空间参照点和默认值因素的制约,使输入空间的成分在整合空间内正确整合并合理构建“呈现结构”。例二:无赖诗魔昏晓侵,绕篱钦石自沉音。毫端运秀临霜写,口角噙香对月吟。满纸自怜题素怨,片言谁解诉秋心?一从陶令平章后,千古高风说到今。诗歌是一种再现人类思想情感的文学艺术,抒情性是诗的本质属性。而意象又是诗歌的灵魂,并具有隐喻思维的特征。隐喻意象在诗歌创作中起着多种衔接作用,将诗歌语篇衔接成一个意义的整体[8]。概念整合理论可以全面的、立体的解读诗歌意象隐喻,将诗歌的意象隐喻和常规隐喻相互映射,叠加,结合而构成一个立体的隐喻的结构或者意义空间,从而表现诗歌的主题思想。所举之例是“大观园”中潇湘妃子(林黛玉)所作“咏菊”。

第4篇:即时通信基本概念范文

关键词:马尔克夫;概念;转移概率;概念抽取;规则

中图分类号:TP391.1 文献标识码:A

1 引言

概念在本体中处于重要位置。随着社会的发展,新的概念,尤其是多个单词组成的概念层出不穷,从领域文档、互联网中抽取出这些概念来丰富领域知识库是一项有意义的工作。人工获取概念是效率低,费时费力,而概念的自动抽取在信息处理等应用中扮演着重要角色。目前主要的抽取方法都是基于统计、规则和二者混合的方法,笔者于本文中提出Markov的概念抽取方法,该方法可以从英文文本中抽取出包含多个英文单词的概念。

2 相关工作

本节将对目前采用的概念自动抽取算法进行讨论,分析其优缺点,在此基础上阐述本文算法。

基于规则的方法是建立一系列的模板,和模板相匹配的概念即为领域概念,如N(其中A为形容词,N为名词,P表示介词)[1],符合这个形式则作为一个概念。还有一种改进的空间概念抽取算法,算法中通过一定的规则去获取两个义素之间的语义关系,通过两义素的相似度值来获取空间概念间的相似度,从而抽取出空间概念[2]。从金融领域资源中抽取出相关概念的方法,其中也用到规则模板的制定[3]。总之,该类方法中均根据一定的规则制定相应的模板,但是模板是人工建立,毕竟人们的知识有限,不可能制定出面向全部语法规则的模板,有必要建立一种适用某个领域概念抽取的完善的模板,但是这是一项非常困难的工作。

基于统计的方法有基于频率,基于统计,基于互信息(Mutual Information MI)或信息熵等技术,Damerau提出的是一种基于互信息的方法,要抽取的概念中包含了两个单词和,Damerau认为如果两个单词和的MI值大于某给定阈值,则该两单词可以被看作为一个概念。但是MI方法会把与看作是一个概念,这将影响到概念抽取的准确率。一种基于最大熵模型的本体概念获取方法,通过对领域文本进行挖掘得到名词性短语,再使用改进的TF-IDF公式从中抽取具有领域性的短语[4]。Dinh等人[5]在抽取生物医学概念时采用了纯统计向量空间模型,借助词袋概念以及单词在文本中的位置特征抽取相关概念。

统计和规则二者相结合的方法称之为混合法,该方法是通过制定规则,实现筛选,然后对筛选的数据进行统计,并从中抽取概念,对概念赋值并统计大小,根据值的大小,证明是否是领域概念。一种与领域无关,并且是半自动的概念抽取方法是Frantzi提出的[6],在这个方法中对C-value和NC-value分别进行抽取,其中C-value的抽取用到了语言学知识(其中包含词性标注,语法过滤等),也用到了统计学知识,如表达式(1):

这时C-value的表达式,其中,是概念频率,是包含的待抽取的概念集合;是集合中概念个数。因为C-value方法因为语法过滤器的选择会影响该算法的召回率和准确度。而将表达式(1)纳入概念抽取,就会形成C-value的扩展,也就是NC-value,如表达式(2):

是待抽取概念,是作为的上下位单词所出现的频率,是单词的权值,是集合的单词,是单词的直接上下位单词的集合。

张新等人提出了一种基于规则与统计的本体概念自动共聚方法,从领域文本中通过语义串切分、规则匹配、领域归属度分析和概念约简算法自动获取领域概念[7]。但是其中的词性组合规则不易把握,如何将规则定义的完善是该方法需要解决的问题。

3 基于Markov的概念抽取算法

该算法是针对多个单词组成的概念,如campus violence,French riots,911 terrorist attack等。这就好比是马尔可夫链,多个单词的概念抽取可看作是多态的,并设定一个多步转移率的阈值,如果超过该阈值,就把这个多态链称为一个概念,这种方法从模型上看计算简单,准确率也高,相应的抽取概念的效率自然也会提高。[8]

3.1 概念的Markov性

要把领域文档看作一个概念集合,而且是自动抽取概念的过程,就必须以信息学的角度进行分析。这里的概念集合设为,其中,是概念集合当中的元素,而是元素的个数,也就是单词的个数,那么多个单词的抽取,就是从集合中抽取多个元素的概念。

下面证明概念抽取过程的Markov性。

证明:假设多;领域文档中的一个变量,这个变量代表一个单词,则就有多种状态,可以把它看作是一个随机,此时,可以把集合C看作是一个多态集合。当在已知的情况下,的分布概率只与有关,而和无关。其中是与相邻的单词。由此可以证明是符合抽取概念多态链,即Markov链。

3.2 概念的抽取过程

在抽取单词的过程中,设在时间n时,Markov链的状态是,即,在下一个时间n+1内,抽取单词,则。此时从抽取单词到的转移概念就可以计算出来了,其表达式为,,或者用表示,1表示T,就是抽取第一个单词和第二个单词的时间间隔。只和,和T有关,可以看出是稳定值,可以证明单词抽取是齐次Markov链。

在上述的过程中可以说Markov链是从一个状态转化到另外一个状态,其表达式为(3)所示:

其中,表示从状态到状态的一步转移概率。

概念抽取的步骤总结如下:

这里要有一个前提,就是假设我们已经具有了一个领域文档,那么具体的抽取过程分为四步:

(1)用空格将文档中的所有标点符号替换下来。

(2)计算两次抽取单词的一步转移概率,并建立一个对应的矩阵,如转移矩阵P。

(3)如果转移概率大于给定阈值,则将看作是一个待定概念。

(4)检索待定概念的集合,将形如“we, are”等通用概念从C中清除。

这四个步骤是抽取两个单词的过程,如果想抽取大于两个单词所形成的概念的话,就需要把第三步中的概率重新计算,并与阈值进行比较,如果大于阈值,就可以进行第四步。

4 性能比较

本节将基于Markov的概念抽取算法与基于频率,互信息,C-value及NC-value四种算法进行比较分析。利用五种算法在相同的文档中对单词进行抽取形成概念,然后对每种算法的召回率和准确率进行比较。

具体方法是:取得637个文档,这些文档从http:///wiki/computer_science上获取,然后创建一个小型的文档,该文档具有421532个单词。从这个文档中利用五种算法进行单词的抽取。

在第一种算法中采用基于频率的算法,阈值为1302,其结果如表1中所示,第二种算法是互信息的算法,阈值采用9.227,其结果如表1第三行所示,第三种算法是C-value算法,结果如表1第四行所示,采用的过滤器是Noun+Noun,第四种与第三种相同,见表第五行。第五种算法就是Markov算法了,其阈值为0.436,结果见表1第六行。

由表1可看出,采用C-value和NC-value算法,由于其采用语法过滤器,结果导致将有些本来是所需概念被滤掉,因此具有较低的召回率。基于频率和互信息的召回率和准确率相差不大是因为MI均基于频率。在这些数据中召回率最高的是基于Markov的算法,其根本原因在于:前面四种算法都是基于概念,而Markov是因为转移概率,也就是说出现频率低的概念也会被作为待定概念被抽取。另外该算法准确率也较高,这是因为该算法将单词的排列顺序考虑在内。另外,该算法模型简单,构建效率较高。

5 结束语

因为随着社会的发展,一些领域,尤其发展速度较快的领域,新的概念层出不穷,这些概念中的多数概念是由多个单词构成,所以本文提出了一种基于Markov的概念抽取方法。该方法可以从英文文献中抽取出来含有多个单词的概念,并且具有领域无关性。整个抽取过程基于多个状态的Markov链,可以通过每个概念中所包含单词的多步转移概率来判断,如果转移概率达到一个所设定的阈值,则将概念从资料中抽取出来。该方法计算简单,易于实现,效率高,通过与其它算法比较具有较好的性能。

参考文献:

[1] John S. Justeson and Slava M. Katz. Techincal terminology: some linguistic properties and an algorithm for identification in text[J]. Natural Language Engineering,1995,1(1):9-27.

[2] Qing Yang, Kai-min Cai, Yan Li, Rui-qing Liu An Area Concept Extraction Algorithm Based on Association Rule[C].Proceedings of the 2010 International Conference of Information Science and Management Engineering ISME '10,2010,3:562-564.

[3] Mihaela Vela,Thierry Declerck Concept and relation extraction in the finance domain[C].Proceedings of the Eighth International Conference on Computational Semantics, Tilburg (Netherlands),2009:346-350.

[4] 韦小丽,等.基于最大熵模型的本体概念获取方法[J].计算机工程,2009(24):114-116.

[5] Dinh,D.and Tamine,L.Biomedical concept extraction based

on combining the content-based and word order similarities[J]. In SAC,2011:1159-1163.

[6] K.Frantzi,S.Ananiadou,and H.Mima.Automatic Recognition of Multi-Word Terms: the C-value/NC-value Method[J].International Journal of Digital Libraries,2000,3(2):117-132.

[7] 张新,党延忠.基于规则与统计的本体概念自动获取方法研究[J].情报学报, 2007,26(6):813-820.

[8] 周子力.基于WordNet的本体构建及其在安全领域应用关键技术研究[J].华东师范大学,2009.

作者简介:

第5篇:即时通信基本概念范文

关键词:数字化产品;数字产品;内涵

中图分类号:F49文献标识码:A

随着计算机及网络技术的迅速普及,电子商务走进人们的生产生活中。在电子商务时代,新的产品形式层出不穷。“数字化产品”和“数字产品”,这两个概念被广泛地使用。什么是数字化产品,什么是数字产品,它们是指同一产品还是不同产品?厘清这两个概念,能为数字化产品和数字产品的进一步研究打下基础,也能为实践中正确使用这两个概念提供依据。

一、概念的使用情况

在中国知网中国学术文献总库中搜索,截至2010年4月16日,使用了“数字产品”这一概念的文献共有17,338篇,方宗义教授于1979年在《国外气象卫星资料分析使用情况》中第一次使用这一概念;使用“数字化产品”这一概念的文献共有12,400篇,薛顺贵先生于1982年在《近年来国际摄影测量自动化的发展概况》中第一次使用此概念。方宗义教授所说的“数字产品”,是指气象卫星拍摄的图片等资料,经过计算机加工处理后,以数码形式呈现的气象信息。薛顺贵先生所说的“数字化产品”,是指摄影测绘自动化过程中,利用计算机对测绘资料进行编辑处理,形成的以计算机数据表达的测绘信息。两位先生分别用数字产品和数字化产品表达了同一个概念,即利用计算机加工处理的,以数字编码的信息产品。也就是说,数字产品和数字化产品两个概念在中国诞生的时候具有相同的内涵。

二、概念的内涵表达

随着研究的深入发展,许多学者和机构根据各自的理解定义数字化产品和数字产品。联合国贸易发展会议(2001)研究报告认为,数字化产品是既可以通过载体以物理方式运送,也可以通过Internet以电子方式运送的产品。宁振波(2003)认为,数字化产品是指采用计算机软、硬件技术,以网络为基础,以数据库为平台,在产品采办―研制―设计―制造―交付―培训―维护―报废的全寿命周期中,以三维CAD设计为核心,全面应用CAE/CAT/CAPP/CAM/CALS/PDM等技术所形成的用户需要的产品。王晓晶(2008)认为,数字化产品是指信息、计算机软件、视听娱乐产品等可数字化表示,并可用计算机网络转输的产品或劳务。

郭玉军、张函(2007)认为,数字产品指数字编码的计算机软件、文本、录像、镜像及声音和其他产品,无论它们是附着于固定介质还是电子传输。包含了计算机软件、电影、音乐、有声读物和游戏等,既可以基于诸如光盘、磁带或是书本等有形介质来进行贸易,也能通过国际互联网的电子传输进行贸易。

解梅娟(2009)认为,狭义的数字产品是指生产、销售和使用均表现为“比特”流的产品即直接在网上传送的产品,如网上软件、电子期刊、各种网上音频视频产品。广义的数字产品是指可以被数字化并可以通过网络来传播的产品。它所指的是任何能够被数字化的产品,并不要求实际上已经被数字化,如以磁盘形式销售的软件、书籍、电影、录音等。

芮廷先(2002)定义数字产品的范围广一些,认为凡是Internet上收发的东西都可成为数字产品,同时一些没有相应实物形式的产品或服务以知识和过程的形式存在也可成为数字产品,数字化产品可能是数字产品,也可能不是数字产品,如软件和CD既是数字化产品也是数字产品,而数字化武器或数字化家电是数字化产品但不是数字产品。

杜江萍、薛智韵(2005)认为,数字产品是电子商务中的核心产品概念。数字产品可以分为有形数字产品和无形数字产品。有形数字产品是指基于数字技术的电子产品,如数码相机、数字电视机、数码摄像机等。无形数字产品,又称数字化产品,是指可以经过数字化并能够通过如因特网这样的数字网络传输的产品。凡计算机能够数字化、处理和存储的信息都可以归类为数字产品。

袁红、陈伟哲(2007)认为,数字产品又称数字化产品,可以分为有形数字产品和无形数字产品。有形数字产品是指基于数字化技术的电子产品,如MP3播放器、数码相机、数字化电视机、数码摄像机等。无形数字产品指的是能够被数字化的一切事物,并能够通过如因特网这样的数字化网络传输的产品,比如网络游戏、计算机软件、音乐等。

以上资料显示,学者们对两个概论的认识,分歧较大,在概念的使用上比较混乱。在这些定义中描述了这样三种产品:一是内容基于数字格式、比特流,通过因特网运送的产品;二是可以经过数字化并能够通过如因特网等数字网络传输的产品,无论这种产品是否已经数字化;三是基于数字技术的电子产品。

对概念认识的模糊混乱表现在三个方面:一是对概念的内涵认识不一。同为数字产品,有的认为仅指第一种产品,有的认为既指第一种产品,也指第二种产品,还有的认为既包括第二种产品,也包括第三种产品。二是对概念使用混乱。同指“可以经过数字化并能够通过如因特网这样的数字网络传输的产品”,有的称其为“数字产品”,如王晓晶;有的称其为“数字化产品”,如曹庆华。三是对概念的关系认识不一。有的认为数字化产品即数字产品,如袁红;有的认为数字化产品不同于数字产品,如芮廷先;有的认为数字化产品是数字产品的一部分,如杜江萍;有的认为数字产品是数字化产品的一部分。

三、概念内涵辨析

电子商务时代,两个概念的使用越来越多,不及早厘清两个概念的内涵和相互关系,会让人们越来越迷糊,相关研究也不具备科学基础。概念是反映事物本质属性的思维产物。概念表达的是客观事物的一般的、本质的特征。概念的正确与否是指概念能否反映客观事物的本质特征。现有文献中使用的数字产品和数字化产品概念对应的三种客观事物。正确使用两个概念,需要在分析三种事物本质属性的基础上,判定哪个概念表达更为合适。

1、数字产品。这是一个由两个名词构成的偏正词组。“数字”是修饰“产品”的,反映产品的本质特征,即这个产品是数字的、数字形式的、Digital。数字是计算机存储、加工信息的方式。称一个产品是数字产品,意味着这个产品必然是利用计算机生产加工的。在现有技术条件下,利用计算机生产加工的、以数字方式存在的产品,既可以通过计算机网络传输,也可以贮存在光盘等存储介质中传输。

计算机以数字方式生产加工展现出来的产品,没有实物形式,是无形产品。从功能来看,它是以传递信息为目的的,是信息产品。也就是说,数字产品既是无形产品,又是信息产品。互联网上的各种产品,均符合以上特征,是数字产品。虽然不通过互联网传输,但以数字编码形式存在于光盘等存储介质中的软件也是数字产品。

存储于光盘等介质中的软件,属于数字产品的范畴。光盘具有实物形式,存在于光盘中的软件,从表象来看是有形的,是软硬件的结合体。学者们一致认为存储于光盘中的软件是数字产品,是因为从功能角度看,光盘中软件是主体,光盘仅作为软件的载体,满足客户需求的是软件,而非光盘;从价值角度看,光盘中的软件价值才是软件光盘价值的主体,空白光盘价值相对软件而言,可以忽略不计。

随着信息技术的发展,许多产品中都应用了软件,形成一种软硬件结合体。但大多数软硬件结合体,都不能称为数字产品,如数码相机。数码相机中影像信息的转换、存储和传输等部件,具有数字化存取模式,具有数字产品的部分特征,但不能因此称数码相机为数字产品。因为从本质来看,数码相机是用于摄影的光学器械,“数字”不是它的本质特征,只是它与一般相机的区别。硬件与软件结合构成的数码相机,其中的软件是数字形式存在的,硬件是以实物形式存在的,只有其中的软件才是数字产品。但数码相机中的软件,只有与硬件结合在一起,才能发挥作用,不能独立存在,不是主体。因为部件中有软件,就将其称为数字产品,是以偏概全,是不科学的。

与数字产品相对的是非数字产品,即不以数字形式存在,而以有形实物、模拟的音频视频等形式存在的产品,如书籍、服装等。以产品是否具有信息传递功能分类,非数字产品可分为信息产品和非信息产品。信息产品是指在信息化社会中产生的以传播信息为目的的服务性产品,如书籍、报纸、电视节目等;非信息产品则是指满足人们信息需求以外的其他需求的产品,如服装、交通工具、机器设备等。

2、数字化产品。“化”作为后缀,加在名词或形容词之后构成动词,表示转成某种性质或状态。数字化是将许多复杂多变的信息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,把它们转变为一系列二进制代码,引入计算机内部,进行统一处理。从词性上看,数字化是动词,对应的是Digitize。数字化产品是动宾词组,表示将产品转化为数字状态。数字化产品的过程就是利用计算机技术,以数据编码的形式建立产品模型的过程,它是一个虚拟生产的过程,它的结果是得到一个数字产品,即以数字形式存在于计算机系统中的无形产品。

在现代信息技术条件下,任何非数字产品均可数字化。非数字产品经过数字化后形成的数字产品,首先在形式上发生了变化,其次功能也可能发生变化。一般信息产品如书籍报刊等,数字化后形成的数字书籍、数字报刊等数字产品,其形式变化了但功能没有变化,在满足消费者的需求上没有发生根本变化。从本质上说,这种数字产品与原产品是同一种产品。

非信息产品,经过数字化后形成的数字产品在形式和功能上都发生了变化,不再与原产品是同一种产品。如飞机,经过数字化后形成的数字飞机,不再具备运输功能,而仅是飞机的一个数字模型。这个模型从根本上改变了飞机传统的设计与制造方式,大幅度地提高了飞机设计制造技术水平。这种数字产品,从本质上讲是实物产品设计制造过程中采用的一种技术,是一个与原产品形式功能完全不同的新产品。

四、结论

数字产品和数字化产品都是计算机技术高度发展的产物。数字产品是以计算机加工生产的,以数字形式存在的无形信息产品。数字化产品是利用计算机技术将产品转化为数字形态的生产过程。数字化产品与数字产品是过程与结果的关系,而不是包含与被包含关系。

在现代技术条件下,任何产品均可数字化,因此将可数字化并经过因特网传输的产品定义为数字产品,没有任何科学意义。即使如报刊书籍等信息产品,数字化后功能没有发生变化,产品本质没有变化,也不能将其称为数字产品,只能说其具有可数字化的特征。

(作者单位:黄冈职业技术学院)

主要参考文献:

[1]袁红,陈伟哲.数字产品成本结构的特殊性及其应用.情报杂志,2007.10.

[2]俞明南,鲍琳琳.数字产品的经济特征分析.情报研究,2008.7.

[3]万福才,王伟.数字产品动态定价方法.系统工程,2006.1O.

第6篇:即时通信基本概念范文

关键词 信息论 熵 公理化方法

中图分类号:G424 文献标识码:A DOI:10.16400/ki.kjdkx.2015.06.053

One Introduction Method of Entropy in Teaching Information Theory

CHANG Zuling

(School of Mathematics and Statistics, Zhengzhou University, Zhengzhou, He'nan 450001)

Abstract Entropy is the most elementary concept in information theory and students can understand the concepts and theories in information theory only if they accepted meaning of entropy. So introducing entropy is the most elementary and important step in the course in information theory. Through years of teaching information theory, I summarize one more intuitive and systematic method to introduce entropy which makes students can understand and accept entropy more easily.

Key words information theory; entropy; axiomatic approach

在信息论这门课程中,“熵”(Entropy)是一个非常重要的概念。“熵”首先出现于热力学第二定律中,是仙农在1948年他的开创性论文“通信中的数学原理”①中,把这个概念借用于信息论中来表示信息量的多少。通过熵,我们可以把信息进行量化,从而把使用丰富的数学工具来分析信息变成了可能,从而奠定了现代信息论的基础。②在信息论的教学中,如何引入熵这个基本概念,就是一个非常重要的问题。如果引入得不好,则学生对熵不理解,无法接受这个概念,从而影响进一步的信息论教学效果。

在多种信息论教材中,引入熵的方法多种多样,大概可以归结为三种,一种是直接给出熵的定义而不加推导引入;③一种是先考虑变量各个取值的自信息,然后再求期望推出熵的定义;④一种是先分析性质,再通过证明推出熵的定义。⑤在多年的信息论教学中,笔者综合了各种方法的优点,总结出一种新的引入熵的方法,这种方法更加直观和系统,可以让学生容易接受,教学效果良好,现与从事信息论教学的各位同仁们交流分享。

我们在这里详细介绍引入熵的各个步骤,力求清晰明了:

第一步:定义信源。

在引入熵之前我们定义信源。详细说明信源是产生信息的源头,其间可以通过举例来说明。为了研究方便,对信源建立数学模型。我们用随机变量表示信源并只考虑离散型随机变量。令表示离散型随机变量, ={,,…,}表示的取值字母表。的概率质量函数( )为:() = { = },,或者 = { = },。

第二步:定义信息。

然后我们提出信息的概念。因为随机变量的取值是依对应的概率相应出现的,所以在随机变量的值出现之前,我们一般不能确定它的确切取值,因此随机变量有不确定性。例如:在抛掷硬币时,我们不知道结果是正面或是反面;从袋子中取球时,我们不知道会取中那个;买时,我们不能确定会不会中奖,等等。当随机变量的值确定之后,不确定性消失,等价于从中获得一些信息。在这种意义下,我们把随机变量的信息与随机变量的不确定性等价起来,我们称随机变量的信息指的就是随机变量的不确定性。这里我们一定要让学生理解随机变量的不确定性即信息这一点。

第三步:提出信息的度量。

有了信息的概念,自然就会产生这样的问题:随机变量的信息(不确定性)该如何度量?我们该如何判断随机变量的信息(不确定性)的大小?显然,随机变量的不确定性由随机变量的概率分布决定。但用概率分布来表示不确定性非常麻烦,例如可能不同的概率分布会具有同样的信息。最重要的是概率分布不能量化,因此我们需要考虑信息的表示问题。

我们定义一个函数()来表示随机变量包含的信息(不确定性)。这个函数只与的概率质量函数有关,而与中的具体值是没有关系的,即() = (,,,),0≤≤1, = 1, = OO。

那么函数()应具有哪些性质呢?

第四步:()的性质

我们在这里给出三条()必须要满足的性质:

(1)(连续性)概率的些许改变应使随机变量的不确定性也只发生些许改变,所以()应关于, = 1,2,…,OO,连续。

(2)(单调性)当的可能取值服从均匀分布时,则的可取值越多,它的不确定性也应越大,即:

(,,…,)

(3)(可加性)我们来考虑如下实验:假设中元素服从均匀分布时,把其中元素分成一些不交集合。

,,,,OO= , = = OO

首先以对应于集合大小的相应概率选取一个集合,即()= ,然后再等概地从被选集合中选取一个元素。因为

我们有() = (O)() = = 。

这说明以我们上面定义的方式选取中元素的概率与直接以等概选取中元素的概率是一样的,所以这两种不同的方式所蕴含的信息也是一样多的。

例如,一个袋子中有个不同颜色的球,则直接从袋子中取球的概率是等概的。如果先把球分装到各个小袋中,再把这些小袋装入大袋。选取时先从大袋中取一个小袋,然后再从小袋中取一个球,这时取各个球的概率仍为等概,所以这两种方式所包含的信息是一样多的。又例如:100个学生,编号为00~99,随机从中选取一个编号,或先随机选取编号第一位后,再随机选取编号第二位。它们的不确定性是一样的。

第一种方式的不确定性(信息)为:(,,…,)

在第二种方式中,选取集合,,…,的不确定性为:(,,…,,)。选定一个集合后,再从集合中选取元素这个过程也有不确定性,这个过程的平均不确定性为:

()祝ù又醒∪氐牟蝗范ㄐ裕?

= (,,…,)

所以我们有

(,,…,,) = (,,…,) + (,,…,)

综上,我们所定义的用来衡量随机变量的不确定性(所蕴含的信息)的函数()应具备如下性质:

(1)(连续性)(,,…)对所有概率密度函数,,,,0≤≤1, = 1是连续的;

(2)(单调性)(,,…,)

(3)(可加性)对于正整数,…,, =

(,,…,) = (,,…,) + (,,…,)

下面我们将证明性质(1)―(3)唯一定义了一个函数()。

第五步:根据性质推导熵的形式。

在这里我们用定理的方式确定唯一的熵函数。

定理:一个函数()满足以上性质(1)―(3),当且仅当它有如下形式:

(,,…) = 或() = ()

其中>1作为对数的底,且令00 = 0。

这个定理的证明较长,在这里就不列出了。教学中证明过程也可以省略,只需要让学生知道上面三条性质唯一决定了熵的形式即可。在我们的教学中也是省略的,因为以前给出详细证明时,学生有时会产生信息论很难很复杂的想法,从而有退缩心理。

第六步:熵的定义。

至此我们就可以顺理成章地给出熵的定义了。

定义:一个离散型随机变量的熵()定义为:

() = () () = ( = OO,>1)

当 = 2时,() = () ()熵的单位为比特()。

给出定义,然后再给出一些解释,包括熵的单位,熵的由来,熵的意义等,这样就使得学生对熵有一个系统的了解,为以后的教学奠定较好的基础。

在这里我们给出的引入熵的方法其实是一种数学中常用的方法:公理化方法。为了推导出熵这个概念,我们先从熵函数应具备的基本性质入手,然后再寻找具有要求性质的函数,因为该函数唯一,所以这个函数就是我们唯一的选择。我们可以利用这点来保证熵的定义的合理性。

通过上面的步骤,我们逐步推导出熵的定义,并在推导过程中我们又对熵的性质做了分析,使得学生更容易接受熵的概念,并对熵有较全面的了解。经过实际的教学检验,这种引入熵的方法效果较好,学生对熵的理解比较深入,并会让学生对信息论产生兴趣。

注释

①②C. E. Shannon, “A Mathematical Theory of Communication”(通信中的数学原理)[J].The Bell System Technical Journal,vol. 379-423, 623-656, July, October, 1948.

③ T. M. Cover, J. A. Thomas, 信息论基础(第二版) [M].阮吉寿,张华,译.机械工业出版社,2008.

第7篇:即时通信基本概念范文

[关键词]概念模型 信息系统 用户 理解 沟通 实验室研究

[分类号]N945.12

概念模型通过一套正规化的符号语言描述现实世界,是信息系统开发中记录系统需求的重要工具,如E-R图、数据流程图、UML等。记录的系统需求成为项目中各方沟通的媒介:系统分析员与用户沟通以确认系统需求;系统开发人员间沟通开发细节。显然,两方面沟通均有效才能保证开发出符合用户需求的应用系统。而以往研究多关注系统开发人员间的沟通,忽视了与用户的沟通。

当前,用户参与需求分析愈加被重视,有效的用户参与被认为是系统成功和用户满意的有力保障。Davies等人的调查表明,与用户的沟通有效性超出其他技术和管理因素,成为概念模型使用中最重要的问题。然而还缺乏直接的研究和证据解释概念模型在与用户沟通中的作用机理。

鉴于此,本文将以概念模型与用户沟通过程中的认知特点为基础,分析和解释概念模型影响沟通效果的作用机理,并通过实验室研究方法获得数据支持。

1 文献回顾

1.1 概念模型的沟通有效性

基于概念模型的沟通效果本质是阅读者正确理解模型中信息的程度,可以定义为阅读者正确掌握的信息量与模型全部信息量的比率。但信息本身具有不同的类别,近年来研究中多依信息类别将理解效果划分为不同的维度,以深入分析模型对沟通有效性的影响。如Agarwal等根据信息组成分为简单信息(仅包含基于结构的或基于过程的信息)与复杂信息(包含两类型信息),研究发现开发人员使用面向过程的概念模型理解复杂信息显著优于面向对象的概念模型。而在简单信息理解方面无显著差异。

理解效果的维度,即信息类别的划分不存在统一的标准,主要依研究目的而定,如上述研究中的信息分类是为了寻求信息结构与模型结构的匹配。

1.2 概念模型理解效果研究

阅读者理解模型中信息的过程是概念模型与阅读者个人交互的过程,因此分别受到模型特点及个人特点两方面因素的影响,如图1所示:

对于模型因素,以往研究发现了一些好的品质,如信息完整性、清晰性等。满足好品质的模型能够提升理解效果,如Gemino等通过实证研究验证了本体论语义更清晰的模型更利于理解。

个人特点中的因素关注较多的如个人经验、知识。经验越丰富,知识储备越充足,个人理解效果必然越好。如Khatri等的实验室研究验证了开发人员所具有的模型技术知识以及应用领域知识对阅读效果的影响作用。

然而,这些研究能够回答的现实问题很有限。首先,用户具有高的应用领域知识水平及低专业技术知识和实践经验,现有研究对这样的复合因素组合的情况难以解释。此外,除了模型特点中的“好品质”,不同的模型仍然存在其他差异影响阅读者理解过程,但作用效果可能因人而异。如有研究发现相对于面向对象的建模方法,面向过程的模型更利于开发专家全面识别信息,而对开发新手不存在这样的差异。因此,本文将根据用户整体的认知特点分析其与概念模型特征的交互关系。

2 理论与假设

2.1 用户阅读的认知过程

概念模型主要的呈现形式是图形,为了更深入认识用户阅读概念模型时的认知特点,可以借鉴图形理解的相关理论:感知理论与认知理论。

感知理论解释了阅读者将所看到的图形信息放入短期记忆的感知过程,包括三步:辨识图形中各符号对象;根据模型中符号的空间布局对符号进行分组及确定层次关系;对符号初步组织并放入短期记忆。专业的训练和实践能够使开发人员具备组织图形信息的技巧;而用户未接受过培训,只是按照阅读文本时的习惯策略从左向右、自上而下地组织模型信息,因此放入短期记忆中的信息基本是按照模型的信息组织方式。

认知理论解释了信息放入短期记忆后的认知过程,包括两个活动:搜索长期记忆中的相关知识;对图形信息进行解释并与长期记忆整合。影响认知效果的根本因素是认知计算量。对用户来说,主要依靠搜索长期记忆中关于业务环境等的知识来解释图形所传达的含义。根据认知匹配理论,当放人短期记忆的信息结构与用户长期记忆中的知识组织方式一致时。搜索相关知识的效率将提高,整合新知识时也减少了结构关系的转换计算,使得总的计算量降低,因此认知正确性将提高。

综上所述,概念模型的信息组织方式与用户长期记忆中知识结构的匹配程度是影响认知过程正确性的重要因素。

本文将以面向对象与面向过程的概念模型为例,验证上述分析。两类模型对信息的组织方式显著不同:面向对象的模型将信息分类、抽象为对象,以对象为中心组织与对象相关的属性、行为、通讯等信息,如用例图中围绕各角色的行为活动(即用例);而面向过程的模型将信息抽象为信息流,通过信息处理流程中的前后衔接组织信息,如数据流程图中“处理模块”的输入和输出“信息流”。

认知心理学中众多研究结论显示出人们的自然思考方式首先是分类,这正是面向对象思想的基础。因此可以说,面向对象模型的信息组织方式与未接受过专业学习的用户脑中的知识组织更加匹配。由此判断,与面向过程的概念模型相比,采用面向对象的概念模型更利于用户理解。

假设1:描述同一系统信息时,用户使用面向对象模型的理解效果显著高于面向过程模型。

2.2 基于语义网络理论的理解效果

语义网络理论对人脑中的知识组织方式作了很好的解释:人的长期记忆中,知识是通过节点互联的网络来组织的。节点代表任何实体、抽象类、属性等概念;节点间的连接表示概念间的某种关系。一条信息可能包含一个、两个或多个节点,而多个节点之间的关系可能是直接关联,或是通过某些节点间接关联。

显然,当信息包含的节点数较少、节点间的连接较少时,认知过程的搜索和整合计算量都更小。因此,为了进一步分析用户认知特点与概念模型的交互作用,本文根据信息中所包含的节点数及连接关系的复杂程度,将理解效果分为简单理解与复杂理解。

有研究曾发现,不熟悉概念模型的阅读者在使用用例图和使用数据流程图识别单个信息点的完整性上没有差别。这是因为,理解简单信息时的认知计算量很少,面向对象模型信息组织的优势不显著;但随着信息复杂度增加,两类模型认知计算量的差异将显现出来。

假设2:描述同一系统的简单信息时,面向对象与面向过程概念模型的用户沟通效果无显著差异;

假设3:描述同一系统的复杂信息时,面向对象概念模型的用户沟通效果显著高于面向过程模型。

3 研究方法

3.1 实验对象及实验过程

本文采用实验室研究方法收取数据。实验在大学课堂道行,选修同一课程的管理学院各专业学生自愿参加,最终参加学生41人。实验中学生被随机分为两组,依次完成三项任务:阅读描述同一系统的系统需求说明,两组的阅读材料不同;回答关于系统理解效果的测试问题,包括简单信息及复杂信息;填写个人经历以及实验感受的问卷。

3.2 实验设计

3.2.1 实验情境 待开发的系统是一个校友录系统。大学生对这样的系统较为熟悉,符合学生作为系统用户的角色。实验人员在实验开始时将以系统开发者的角色进入,并说明实验参与者将作为该系统的用户,实验目的是使用户理解系统的构建内容。

3.2.2 需求说明 两组阅读的需求说明分另0由用例图(Use Case Diagram)与数据流程图(Data Flow Dia-gram)来描述,两者是当前使用最广泛的概念模型,分别代表面向对象与面向过程的概念模型。两组模型描述了相同的系统内容,所传达的信息量一致,只是表达形式不同。由于实验时间的限制,所描述的系统只具备简单的功能。

3.2.3 理解效果 用户的理解效果通过回答问题的正确率来反映。所有问题均为判断题,共14题:关于简单理解的问题共7题,只涉及需求中两个概念及直接连接关系;关于复杂理解的问题共7题,涉及三个以上概念及其关系。所有14道问题的正确率反映用户的整体理解。

3.2.4 实验后调查问卷 问卷主要通过五点量表测量实验中的假定条件以及控制变量。包括三个问题:阅读者对概念模型的学习程度、阅读者对校友录系统背景的熟悉程度(这两者用来保证学生作为用户角色的有效性)以及阅读者感知的模型阅读难度。感知的阅读难度也是影响模型使用的重要因素,因此在本研究中作为控制变量。

4 实验结果与讨论

4.1 实验数据剔除

实验收集到数据41份,首先剔除回答不完整的数据1份,然后对实验的前提假定进行检验。统计阅读者的模型知识表明所有参与者都没有学习过概念模型知识,同时95%的参与者较熟悉或非常熟悉校友录系统。为进一步保证实验的有效性,根据参与者对系统背景的熟悉情况剔除了解很少或完全不了解的参与者数据3份。最终获得有效数据37份,其中用例图组19份,数据流程图组18份。接下来将使用SPSS统计软件对数据进行分析、验证假设。

4.2 模型对用户理解的影响

采用多元方差分析方法验证两概念模型组阅读效果的差异,并将用户感知的模型阅读难度作为协变量以控制其对因变量的影响。两组用户的简单理解效果没有显著影响(显著性=0.617),支持了似设2;复杂理解效果方面,用例组(均值=0.722)显著高于数据流程图组(均值=0.579),显著性=0.007,支持了假设3;总体理解效果方面,用例图组(均值=0.726)也显著(显著性=0.043)高于数据流程图组(均值=0.643),支持了假设1。如表1所示:

4.3 用户不同层次的理解效果

通过对同一用户简单理解效果与复杂理解效果的配对均值检验来反映前文中关于理解划分的认知基础。用户对简单问题的理解效果显著高于对复杂问题的理解(显著性=0.045),如表2所示:

4.4 讨论

4.4.1 用例图组用户的总体理解效果显著高于数据流程图组(假设1) 基于前面的分析,该结论在理论上验证了影响用户理解效果的一个重要的概念模型因素――模型信息组织结构特征,该因素与用户知识组织结构交互影响用户理解效果,即使用与用户知识组织结构更相近的概念模型得到的用户理解效果更好。这为概念棋型的选择和评价提供了一个较可靠的一般性的依据。该结论为实践中而向对象的概念模型在用户沟通方面的意义提供了证据支持,为开发项目选择概念模型提供了直接的参考。

本文基于认知特点的分析认为用户与开发人员在理解概念模型时(无论是感知过程还是认知过程)具有显著差异,对比以往研究中面向过程的慨念模型更有利于开发人员理解的结论,本实验室研究的结论间接证明了用户与开发人员认知特点上的差异。

4.4.2 用户对不同复杂度信息的理解效果差异显著

用户对简单问题的理解效果显著高于复杂问题;且用例图/数据流程图在简单和复杂信息理解效果方面的表现显著不同(假设2,假设3)。这些结论验证了认知复杂度是用户理解效果的本质影响因素,进一步解释了具有不同信息组织特征的概念模型是通过影响用户认知计算量影响用户理解效果的。

同时,该结论具有更高的可靠性。可以对以往一些研究结论进行解释:即由于所设置的信息过于简单或没有选择对用户认知计算量有影响差别的概念模型,以往研究可能获得概念模型对用户沟通效果无影响作用的结论。这再次肯定了该领域研究中以用户认知特点为基础的重要意义。

5 结语

第8篇:即时通信基本概念范文

关键词: 自然语言理解; 语义相似度; 全文检索; 在线答疑系统

中图分类号:TP399 文献标志码:A 文章编号:1006-8228(2015)05-10-03

Abstract: The similarity calculation based on natural language understanding is still a research content of the computer language processing technology. Based on the knowledge representation of "HowNet", considering the both factors of depth and density, by using a more sophisticated multivariate semantic similarity algorithm, and with a full-text search matching technology, an online answer system in the limited field is designed and implemented. The experimental results show that, the system is reliable, the answer effect is more obvious, and the desired goal is achieved.

Key words: natural language understanding; semantic similarity; full text retrival; on-line answer system

0 引言

随着计算机网络技术的飞速发展,传统的教学手段已不能满足当前大信息量的教学内容需求,因此,创造一个在教师指导和引导下学生自主式学习的智能系统平台很有必要。智能的网络答疑系统可以利用自然语言处理技术对学生的疑问进行自动匹配处理,它的出现为网络教学提供了交互的情境,成为支持网络教学顺利进行的重要条件。智能网络答疑系统是传统课堂教学的重要补充,并逐渐在学生学习、认知、再学习这样一个闭环的学习过程中发挥着举足轻重的作用[1]。

1 设计思想及算法原理

基于计算机自然语言处理技术,充分利用校园网络资源,通过人机互动等丰富信息表现形式,实现一个智能的、高效的基于自然语言理解的专业课程自动答疑系统。系统设计的关键是如何实现快速、高效的智能搜索答案。该过程实际上类似于一个搜索引擎,其核心就是构建一个结构合理、具有完整丰富内容的知识库,并能够在自然语言理解的基础上,快速、准确的完成自动答疑工作。基于自然语言理解的在线答疑系统中两个关键技术分别是:中文分词技术和相似度计算。

1.1 中文分词技术

自然语言理解(Natural Language Understanding,简称NLU)研究如何让计算机理解和运用人类的自然语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过人机对话(man-machine dialogue)的方式,用自然语言进行回答。为了使计算机系统能够较好地理解用户提出的问题,首先需要对问题进行处理,这一过程最先用到的最为关键的技术就是分词技术【2,3】。由于中英文之间的语言组织、词法结构不同,使得中文分词一直以来成为制约中文自然语言处理的主要因素。而中文文本中,只是字、句和段之间可以通过明显的分界符来简单划界,词与词之间没有天然的分隔符,中文词汇大多是由两个或两个以上的汉字组成,并且语句是连续书写的。这就要求在对中文文本进行自动分析之前,先将整句切割成小的词汇单元,即中文分词(或中文切词),相比英文语句处理,中文分词难度更大。

从算法处理上看,目前主要有三种【4-6】:一是基于词典的分词方法,它使用机器词典作为分词依据,分词效率高,目前应用范围较广;二是基于统计的分词方法,它是利用统计方法,通过对大规模文本的统计,让计算机自动判断的方法,该方法使系统资源开销较大;三是基于人工智能的分词方法,如专家系统和神经网络分词方法等,这类方法目前尚处于实验室阶段,尚未投入实际应用。

1.2 相似度处理技术

相似度计算在自然语言处理、智能检索、文本聚类、文本分类、自动应答、词义排歧和机器翻译等领域都有广泛的应用[7]。其计算方法按照基于规则和统计分为两种情况:一是根据某种世界知识(如Ontology)来计算,主要是基于按照概念间结构层次关系组织的语义词典的方法,根据在这类语言学资源中概念之间的上下位关系和同位关系来计算词语的相似度[8];二是利用大规模的语料库进行统计,这种基于统计的方法主要将上下文信息的概率分布作为词汇语义相似度的参照依据[9]。

⑴ 常用语义词典

对于基于语义词典的相似度计算方法,由于存在计算简单、基础条件低、假设条件易于满足等优点,受到越来越多研究者的欢迎。常用语义词典主要有[10-12]:WordNet、FrameNet、MindNet、知网(HowNet)、同义词词林、中文概念词典(CCD),以及叙词表、领域概念网、概念图等概念网络结构。本文对于相似度的计算主要是基于知网(HowNet)结构。其概念结构如图1所示。

⑵ 相似度计算

与概念相似度密切相关的一个概念是语义距离(semantic distance)。在一棵树形图中,任何两个节点之间有且只有一条路径,在计算语义相似度的时候,这条路径的长度就可以作为这两个概念的语义距离的一种度量,通常认为它们是概念关系特征的不同表现形式,两者之间可以建立一种简单概念词相似度用来描述概念树中两个节点之间的语义接近程度,一般最常用的是刘群提出的以《知网》为基础的相似度计算方法[13]:

式⑴中,p1和p2表示两个概念节点,dis(p1,p2)是树状结构中两节点间的最短距离,α是一个调节参数,表示相似度为0.5时的路径长度。

文献[14,15]综合考虑深度与密度因素,提出了多因素义原相似度计算方法:

式⑵中,h为义原树深度,l为LCN层次,LCN为最小公共父节点。

文献[16]认为该方法存在两点不足:一是该式仅把相似度取为密度、深度因素的算术平均值,显然对于概念节点分布不均的情况不够合理;二是该式没有对密度、深度两者的影响程度进行分析,这样对他的使用范围受到了限制。基于此考虑,提出了改进的语义相似度计算方法:

式⑶中,l(p1,p2)为分别遍历概念网中节点p1,p2到达其最小公共父结点所历经的父结点(包括最小公共父结点)数的最大值。w(p1,p2)为p1,p2所在层概念数的最大值。算法关键部分引进了一个调节参数λ(p1,p2),并保证在该参数的作用下,当节点p1,p2所在层概念数较多,即w(p1,p2)增大时,密度因素对相似度的贡献值大;而当p1,p2离最小公共父结点较远,即l(p1,p2)增大时,深度因素对相似度的贡献值较大。同时算法约定,当p1,p2的父结点和最小公共父结点相同,且同层只有p1,p2两个节点时,调节参数为0.5。该方法即为本文在相似度计算方面采用的算法模型。

2 模型设计

下面我们参考文献[17],按照一般教师对于问题的处理方式,在上述概念语义相似度计算的基础上,从计算机建模层面上给出计算机自动答疑模型的建模过程。

Step1:计算条件

已知标准问题库A可以表示为关键词序列:A=(a1,a2,…,an);学生提问B可以表示为关键词序列:B=(b1,b2,…,bn)。

Step2:相似度计算

⑴ 知识点关键词信息提取

该问题的处理主要通过提取学生问题中每一个关键词,对照系统知识库,从底层开始遍历搜索,当找到对应的概念节点时,提取该节点的高度、密度等属性信息,并保存起来,搜索完成后即可参加相似度的计算。

⑵ 概念相似度求解

概念相似度的计算采用语义相似度技术,设标准问题库A可以表示为知识点的一个向量组A=(a1,a2,…,an),循环遍历每一个学生输入的问题关键词序列,通过概念语义相似度算法可得到任意两概念之间的相似度Sim(ai,bj),其中i=1,2,…,m,j=1,2,…,n。

Step3:匹配结果输出

前面已经完成了输入问题和标准问题库之间的循环相似度匹配计算,为了将需要的信息提取出来,模型还需要设置一个阀值δ。通过阀值δ这个关卡,将相似度结果大于δ的问题提取出来,并按照降序排列输出即可。论文答疑系统模型建模流程如图2所示。

3 系统实现与验证

系统设计环境为Visual Studio 2005,数据库服务器为SQL Server 2000。采用B/S网络模型进行构架设计,按照系统功能需求划分为用户表示层、应用逻辑层和数据访问层三个层面。系统测试界面如图3所示。

如图3所示,在答疑系统界面中输入问句:“计算机包含哪些硬件?”,系统自动分词后生成的关键词语汇单元为:“计算机;硬件”(其中“包含;哪些”等作为停用词已经被过滤掉了),然后系统自动在数据库中检索匹配,最终反馈了12条相关结果,图3为部分结果截图。这里说明一点,反馈结果的多少取决于阀值δ,测试中我们选取的阀值δ为0.8,一般我们取阀值δ在0.8左右即可。

为了进一步验证系统的查询能力,我们将刚才的问句调整为:“计算机包含?”,这时系统自动分词后生成的汇单元只有一个关键词“计算机”,最终匹配结果如图4所示。

这里读者或许会发现,系统反馈回来的结果与问题毫不相关。其实,这并不是系统出错,而是“知网”概念网络中“计算机”与“硬件、软件”两个概念关系比较密切,表现为在概念网络中的节点位置较为接近,匹配结果相似度值较高,因此才有了上述的结果。也就是说,也许在某些时候当查询某个概念时,相近的结果就会被检索出来(或者当不确定查找的问题时,只需输入相近的问题,也会查询到想要的答案),这就是基于自然语言理解的语义相似度计算模型优势所在。

4 结束语

由于汉语词汇表达的复杂性和词汇语义概念较强的主观性,以及具体应用领域的专业性等因素影响,目前基于自然语言理解的相似度计算仍是计算机语言处理技术需深入研究的内容。本文在“知网”知识表示的基础上,充分考虑“知网”深度和密度因素影响,基于全文检索匹配技术,设计并实现了一个限定领域内的在线答疑系统,大量的运行结果证明了该系统是可靠的,达到了系统设计的目的。但在准确性方面还存在不足,从第一个测试中可以看出,提问人员真正需要的是:“计算机的硬件组成”。其重点关注的是计算机、硬件,而答案给出了太多的“计算机特点,计算机发展”等其他一些与“计算机”有关的匹配答案,其原因是关键词权重的影响因素没有体现出来,离真正的自然语言理解还存在一定的距离,这是系统下一步有待改进的地方。

参考文献:

[1] 冯志伟.自然语言问答系统的发展与现状[J].外国语,2012.35(6):28-30

[2] 黄,符绍宏.自动分词技术及其在信息检索中的应用研究[J].现代图书情报技术,2001.3:26-29

[3] 沈斌.基于分词的中文文本相似度计算研究[D].天津财经大学,2006:12-17

[4] 张波.网络答疑系统的设计与实现[D].吉林大学,2006:30-31

[5] 张丽辉.计算机领域中文自动问答系统的研究[D].天津大学,2006:14-18

[6] 朱.中文自动分词系统的研究[D].华中师范大学,2004:12-13

[7] 周舫.汉语句子相似度计算方法及其应用的研究[D].河南大学,2005:24-25

[8] 于江生,俞士汶.中文概念词典的结构[J].中文信息学报,2002.16(4):13-21

[9] 胡俊峰,俞士汶.唐宋诗中词汇语义相似度的统计分析及应用[J].中文信息学报,2002.4:40-45

[10] Miller G A, Fellbaum C. Semantic network of English [M]//Levin B, pinker S. lexical & conceptual semantics. Amsterdam, Netherlands: E lsevier Science Publishers,1991.

[11] Baker C F. The Berkeley frameNet project [C]//Proceeding ofthe COLING -ACL.98.Montreal, Canada,1998:86-90

[12] 黄康,袁春风.基于领域概念网络的自动批改技术[J].计算机应用研究,2004.11:260-262

[13] 刘群,李素建.基于“知网”的词汇语义相似度计算[C].第三届汉语词汇语义学研讨会论文集,2002:59-76

[14] AGIRREE, RIGAU G. A Proposal for Word Sense Disambigua-tion Using Conceptual Distance[EB/OL],1995:112-118

[15] 蒋溢,丁优,熊安萍等.一种基于知网的词汇语义相似度改进计算方法[J].重庆邮电大学(自然科学版),2009.21(4):533-537

第9篇:即时通信基本概念范文

【关键词】物理概念 逻辑 非逻辑

【中图分类号】G632 【文献标识码】A 【文章编号】1006-9682(2009)04-0145-02

爱因斯坦指出,物理概念的形成有两条途径:一是有意识的方面,即通过逻辑上思维的自由创造;另一是无意识方面,即通过非逻辑的直觉和想象。可以说,一个物理概念的形成,有着与之对应的科学思想和科学方法的形成。

《普通高中物理课程标准》在“课程目标”的“过程与方法”方面强调,需要让学生经历科学探究的过程,动手实践,学习科学方法,体会科学思想,这充分体现了新课程对物理教学中科学思想和科学方法教育的重视。物理概念是进行科学思想和科学方法教育的重要载体,教师在教学中引导学生归纳总结物理概念形成的逻辑和非逻辑途径,是科学思想和科学方法教育取得成功的关键所在。本文试从物理教学中的例子谈谈物理概念形成的逻辑和非逻辑途径。

一、物理概念形成的逻辑途径

在有意识方面,概念不是从感觉和归纳中得到的,而是逻辑思维的自由创造。

1.从分析流行概念入手

分析流行概念的目的有二,一是分析它们的正确性和适用性。每个旧的概念都只能在一定的范围内和特定的条件下成立。分析这些概念在科学的发展进程中如何从经验中形成又高于经验的地位和作用,可以打破人们对旧概念产生的一种“权威性”的思想禁锢,敢于批判旧概念,提出新概念。二是分析它们存在的合理性和对应性。如果新的实验事实或深入的分析已经证明旧概念的存在不再是充分合理的,它们应该被抛弃。如果它们仍有一定的存在合理性,但与对应的事物联系不那么全面和完整,它们应该被修改。正是在这样的自觉逻辑活动的基础上旧的概念体系逐渐被新的概念体系所代替。[1]

物理学的时空观从一开始就已渗透在整个物理教学的过程中。学生在学习物理知识的同时也受到一种时空观的教育。在相对论时空观的教学中,一方面,教师引导学生在讨论经典物理学的理论和成就的同时,应使学生初步了解经典物理学时空观被突破的过程和爱因斯坦构建相对论时空观的方法;另一方面,教师应引导学生认识经典物理学时空观的适用范围和局限性,即只有在低速(和光速相比)条件下,经典物理学的时空观才是有效的。所以有了相对论的新时空观,经典物理学时空观没有必要彻底被抛弃。

2.对广泛事实进行考察

科学的基本概念不是通过概括同类事物得到的,而是在对广泛范围的各种庞大事物的考察中形成的。这样的考察具有较大自由度,这是导致新概念形成的途径。[1]

在机械运动的概念教学中,从观察一些现象入手,如天体在运行,车辆在前进,机器在工作,人在行走等。尽管这些现象的具体形象不同,但我们可以撇开它的具体形象,从他们的共性去考察,就会发现有共同的特征,即一个物体相对于另一个物体的位置随时间在改变。我们把从一系列具体现象中抽出来,又反映着这一系列现象本质的特征,叫做机械运动。[2]

3.注重建立概念之间的联系

注重建立概念的内部联系,是发展基本概念的又一条重要途径。[1]

加速度概念教学的形成是以速度的概念作为基础的。教师在教学中先引导学生回忆速度的定义为物体的位移变化量与运动时间的比值,速度是描述物置变化快慢的物理量。然后进行类比,引导学生回答用物体的速度变化量与运动时间的比值来描述物体速度变化的快慢,而加速度就是物体速度的变化量与发生这一变化所用时间的比值。把加速度概念和速度概念进行类比,建立加速度概念和速度概念之间的联系,加深了学生对加速度概念的理解。

4.运用数学工具加以表达

物理学的发展与数学密不可分,数学不只是演绎推理的工具,也是创造和表达基本概念的工具。著名物理学家汤姆逊说过:“如果不能用数学来表示,那么你的认识是不够的、不能令人满意的,可能只是初步的认识,在你的思想上,还没有上升到科学的阶段,不论你讲的是什么。”[1]

现代物理学从诞生之日起就与数学结下了不解之缘,绝大多数物理概念不仅具有质的规定性,而且具有量的可测性,数学为物理概念的量化和应用提供了保证。如力、速度、加速度、位移、质量、重力、温度、电阻率等等,都可以用简捷的数学公式来表达。

5.形成和发展基本概念体系

科学的基础是基本概念,正是在基本概念上才有了科学的体系。任何基本概念的形成和发展都会影响到概念体系的构成和演变。[1]

在司南版高中物理必修二“高速世界”的教学过程中,教师应使学生有着这样的认识:牛顿力学体系是在“绝对的时空观”这个基本概念的基础上建立的。爱因斯坦为了保持物理学定律在逻辑上的一致性和麦克斯韦电磁理论的有效性,对牛顿力学体系中的基本概念――时间做出了重要的修改,构建了新的时空观,在崭新的时空观的基础上创立了狭义相对论。除了时空观以外,引力也是牛顿理论体系中的一个重要的基本概念。爱因斯坦在这个基本概念上也创立了对引力的新认识,从而提出了广义相对论。

二、物理概念形成的非逻辑途径

在物理概念形成的过程中,心理因素特别是信念、直觉、形象思维、想象等有着重要的作用。

1.信念是理智品质的重要因素

在一切有意义的科学工作背后,每个科学家必定有一种关于世界合理性或可理解性的信念。正是这样的信念在激励和支撑着科学家,给他们一种超个人的力量,使他们关注着人类和社会的发展。[1]

在电磁感应的教学中,教师可以对电磁感应的发现作进一步的解释。在奥斯特发现电流的磁效应之后不久,物理学家们开始了磁生电的实验研究。但许多实验都失败了。在一次次的失败之后,许多物理学家都开始怀疑磁能否生电,并逐步退出了这方面的研究。然而,整整十年的探索,整整十年的失败,丝毫也没有动摇法拉第“磁能生电”的坚定信念。他想到的是“如果试验不成功,这只能表明我还考虑得不够周全。”“即使实验真的不能成功,那也应该把原因找出来。”法拉第凭着坚定的信念,终于发现了电磁感应现象。[3]

2.直觉是科学研究最可贵的因素

在爱因斯坦看来,科学研究方法中“真正最可贵的因素是直觉”。直觉指的是人在不自觉时突如其来出现的对某一个问题的理解或顿悟。有时人们把这种顿悟称作“灵感”、“启示”等。直觉是一种非逻辑的思维能力,是面对各种可能性做出正确选择的重要能力。[1]

众所周知的阿基米德定律就是凭直觉解决疑问的例证。阿基米德在面临“结构复杂的金冠是否用同等重量的白银掺假”问题时百思不得其解。正当阿基米德为揭示皇冠的秘密日夜苦思冥想时,却在浴盆里沐浴时顿悟出浮力定律。科学家正是凭着跳跃性的直觉思维使他们的疑问迎刃而解。

3.形象思维是自由创造的内部因素

科学家创造性思维的特征就在于先进入利用形象思维或表象思维的阶段,它导致了概念的形成。从这样的科学方法论出发,我们应该在物理教学上充分利用和发展形象思维的重要作用。[1]

如在原子物理中人们对原子模型的认识先有汤姆逊的“带有葡萄干的蛋糕模型”,后有卢瑟福的“太阳系的行星模型”。再如,诺贝尔物理学奖获得者威尔逊在青年时期曾于1927年到过英国的本内维斯峰天文台休闲数周,山上云雾飘渺的奇景给他留下了深刻的印象。后来当卡文迪许实验室主任汤姆逊提出需要一种能显示出电子路径的仪器时,在没有类似仪器参考的情况下,他马上想到了山上观察到的云雾。凭借着他对大自然瑰丽壮美的热爱和丰富的形象思维能力几经试制,终于成功地制造出威尔逊云室。

4.想象是科学研究中的实在因素

爱因斯坦有一句名言:“想象力比知识更重要,因为知识是有限的,而想象力概括着世界上的一切,推动着进步,并且是知识进化的源泉。严格地说,想象力是科学研究中的实在因素。”在科学研究中,不仅要对已经存在的自然现象进行解释和说明,更重要的是要从观察实验所得到的经验材料中去分析把握事物的内部特征和内部过程的相互作用和相互联系,在这里,科学的想象就是十分必要的。[1]

在学生学习电学的知识时,教师可以在教学中贯穿相关的史实来使学生更好地想像“电”。200年前,“电”以陌生的面目出现在人类面前,人们看不到电的运动形态。美国物理学家富兰克林在思考中想起哗哗流淌的小河――电是否像流水那样发生位移运动?于是,他把电想像成一种流体,这种充塞于一切物体的流体有时稳定,有时流动;稳定时物体不带电,流体过多时带正电、过少时带负电;流体有趋于稳定的倾向,这种倾向表现为吸引力,引力太强就发生电火。尽管这其中难免有些错误的想像,在当时还不可能形成科学的物理理论,但至少已为电荷、电流、带电体等概念以及物体的起电、中和等规律勾画出了粗略的框架,为现代电磁学理论的建立开辟了道路。[3]

5.科学美是对美的认识的更高层次

在物理学中体现的科学美是人们对于美的认识的一个更高层次。美的规律对于人类进行科学活动有着重要的认识论和方法论的意义。[1]

物理概念、规律表达上的简炼、准确,是物理学家对科学简洁美不断追求的体现;运动与静止、引力与斥力、反射与折射以及电、磁、光三者的相互关系,体现了物理理论的对称与统一;下抛与上抛、加速与减速、地面物体运动与天上星体运动的统一,体现了物理理论的自洽和完备;相对论在时间和空间上达到高度的对称美、简洁美和统一美,堪称20世纪物理学的美学珍品。在物理教学中不但要使学生获取系统的物理知识,提高科学能力,而且要让学生以享受美、追求美为动力,达到在科学美的“王国”中自由翱翔的境界。

6.内心自由是大自然难得赋予人类的礼物

内心的自由在于思想上内部不受权威和社会偏见的束缚,也不受违背哲理的常规和习惯的束缚。内心的自由是大自然难得赋予人们的一种礼物,也是值得个人去追求的一个目标。[1]

伽利略坚持真理、捍卫真理,坚持宣传“日心说”,即使被宗教法庭判处终身囚禁,也没有被强权所屈服,仍在家中写下了《两种新科学的对话》一书。布鲁诺也是为了坚持“日心说”,受到宗教法庭的迫害,他宁愿自己被烧死,也要将人类引进真理的殿堂,表现了为科学献身的大无畏精神。很多事例可以告诉学生,任何科学认识的产生和科学创造的出现都是在冲破前人的局限、摆脱对权威的迷信和改变传统思维定势下实现的。

三、结 语

高中学生尚缺乏物理学知识的系统学习,难以理解和体会物理概念形成中所蕴涵的科学思想和科学方法。因此,教师应通过自己对物理概念的理解和再创造,从物理概念的形成过程中去挖掘其中的科学思想和科学方法,并以学生能够接受的方式向他们展示,启发学生的思考和领悟。这对于从整体上提高学生的科学素养具有十分重要的作用。

参考文献

1 朱f雄.物理教育展望.华东师范大学出版社,2002(2):86~93