公务员期刊网 精选范文 统计学概念汇总范文

统计学概念汇总精选(九篇)

统计学概念汇总

第1篇:统计学概念汇总范文

关键词: 高职学生 英语自我概念 英语学习成绩 关系

一、引言

在英语教学过程中,我们会注意到一个相当普遍的现象:即使是同一位老师教,又有着几乎相同的学习环境的条件,也不可避免会有一部分学习者比其他学习者的学习效果好得多。那么究竟是什么原因导致这种差异的呢?近几十年来,越来越多的研究者试着从学习者自身的角度来考虑这个问题,比如:学习策略、学习风格、动机、个性等。其中,自我概念,作为二语习得领域里一个重要的情感因素,已经成为外语研究者的一个热点话题。近年来,在我国,关于英语自我概念的研究成果也层出不穷,如王初明(2003)关于英语发音自我概念的研究,朱秀全(2004)关于英语自我概念与英语课堂焦虑的关系的研究,马冬梅(2003)关于英语专业大学生的英语自我概念的研究,张志宏(2005)关于非英语专业大学生的英语自我概念与英语学习成败的归因的关系的研究,等等。然而,关于高职学生的英语自我概念与其英语学习成绩的关系的研究却很少,本研究主要就这一问题作了相关的调查研究。

二、研究方法

1.研究对象

笔者调查了江西蓝天学院经济管理系物流专业59名大一新生,其中男生28名,女生31名,他们中有19人来自城镇,40人来自农村,他们的年龄介于18岁到20岁之间,平均年龄19岁,学习英语的时间至少有6年。

2.测量工具

该调查采用了2个测量指标:英语自我概念问卷得分和英语考试成绩。

英语自我概念问卷,笔者引用了张志宏(2005)硕士学位论文中的问卷,为避免学生理解有误,特将其改编成中文版的问卷。该问卷主要目的是调查我国大学生对自身英语学习的能力与成绩的自我评价。问卷分为两部分,一部分是研究对象的背景信息,包括姓名、年龄、性别、生源(来自城镇或农村)、学习英语的年限、高考英语成绩;另一部分是英语自我概念量表,包括7个分量表,即英语整体自我概念,英语听力自我概念,英语口语自我概念,英语阅读自我概念,英语写作自我概念,英语词汇自我概念,英语语法自我概念,每个分量表包括6项,因此该英语自我概念量表共42项,是6个等级的里克特量表,从“完全不符合”到“完全符合”分值为1到6,问卷中42项任意排序,且有一半是否定措词。

英语考试成绩包括研究对象的高考英语成绩和他们在完成2006年1月全国英语应用能力考试B级试卷后所得听力部分成绩、阅读部分成绩和词汇结构部分成绩。由于大部分研究对象的写作部分都是空白,笔者无法得到该部分的有效成绩。另外,他们的英语口语水平普遍不太好,口语测试很难进行,因此笔者未能得到他们的口语成绩。再者,从B级试卷中,很难区分词汇和语法的得分,所以笔者只能获得词汇结构部分的得分。

3.调查过程

问卷调查和试卷都是在他们上晚自习时完成的,在做问卷之前,笔者仔细解释了问卷的说明,并强调他们自身真正的感受最为重要,问卷的答案没有对错之分。在进行统计分析之前,英语自我概念量表中所有否定措词的项目中的得分都要反过来,以便更高分反映的是更高的自我概念(如:“我不喜欢英语”或“我的英语口语很差”)。然后,每位研究对象的英语整体自我概念的总分、英语听力自我概念的总分、英语口语自我概念的总分、英语阅读自我概念的总分、英语写作自我概念的总分、英语词汇自我概念的总分、英语语法自我概念的总分,B级试卷中所得听力部分成绩、阅读部分成绩和词汇结构部分成绩分别输入电脑,并用SPSS13.0统计软件作了相关分析和独立样本t检验。

三、结果与讨论

1.高职学生的英语自我概念与其英语学习成绩的关系

为研究高职学生的英语自我概念与他们的英语学习成绩的关系,对以下11项进行了相关分析,即英语整体自我概念,听力自我概念,口语自我概念,阅读自我概念,写作自我概念,词汇自我概念,语法自我概念,听力成绩,阅读成绩,词汇结构成绩,高考英语成绩。结果如下表1:

注:GESC指英语整体自我概念;LSC指听力自我概念;SSC 指口语自我概念;RSC指阅读自我概念;WSC指写作自我概念;VSC指词汇自我概念;GRS指语法自我概念;listening指听力成绩;vocabulary指词汇结构成绩;reading指阅读成绩;matriculation指高考英语成绩

**p在.01水平上显著;*p在.05水平上显著

与以前的相关研究结果一致,高考英语成绩与英语整体自我概念具有显著相关性(r=.511,p<0.01)。从某种程度上来讲,可以得出这样一个结论:英语整体自我概念更高的高职学生,其高考英语成绩更高,反之亦然;英语整体自我概念更低的高职学生,其高考英语成绩更低,反之亦然。在中国教育背景下,高考英语成绩在很大程度上代表了学生的英语学习成绩。由此可以得出如下结论:具有积极的英语自我概念的高职学生,其英语学习成绩好,反之亦然;具有消极的英语自我概念的高职学生,其英语学习成绩差,反之亦然。这一研究发现与张志宏(2005)的研究结果相符合。此外,高考英语成绩与阅读自我概念之间的相关性较大(r=.462,p<0.01),对于这一点,笔者以为这是受中国高考英语试卷的结构影响所致,因为阅读在中国高考英语试卷中所占比分最大。

就听力成绩而言,听力成绩与听力自我概念的相关性最大,这意味着听力自我概念与听力成绩是相互影响、相互作用的。其次,听力成绩与口语自我概念的相关性也较大,这也即是说,听力口语这两种技能是相互影响的。

就词汇结构成绩而言,词汇结构成绩与英语整体自我概念的相关性最大(r=.406,p<0.01)。由于词汇结构题中既包括词汇知识又包括语法知识,这说明了中国的高职学生非常重视词汇知识和语法知识的学习。其次,词汇结构成绩与语法自我概念的相关性较大,这一点很显然,只有学生的语法知识掌握好了,才能得到较好的词汇结构成绩。

就阅读成绩而言,意外的研究结果是阅读成绩与阅读自我概念之间不存在显著的相关性,这或许是由于调查的样本太少的客观原因所致。然而,阅读成绩与口语自我概念之间却存在较大的相关性(r=.338,p<0.01)。这一点,可以作如下解释:阅读成绩好的高职学生能从英语阅读材料中获取更多的信息并存储在大脑中,因此,在进行口语练习时,他们总能从大脑中搜取相关的背景知识。

2.性别差异对高职学生的英语学习成绩的影响

为了研究高职学生的英语学习成绩是否存在显著的性别差异,对听力成绩、阅读成绩、词汇结构成绩和高考英语成绩做了独立样本t检验,具体结果如表2。

注:listening指听力成绩(总分15分);reading指阅读成绩(总分35分);vocabulary指词汇结构成绩(总分20分);matriculation指高考英语成绩(总分150分)

1指男生,2指女生

如表2所示,尽管高职学生的英语学习成绩的平均水平都不高,但在这四个变量中,女生的平均分都高于男生,然而,从统计学角度来看,只有阅读成绩(p=0.011<0.05)和高考英语成绩(p=0.013<0.05)存在显著的性别差异。这即是说,总体而言,高职学生中女生的英语阅读成绩与英语整体学习成绩比男生好。至于阅读成绩的研究结果,可能是受性格的影响,因为在我国英语考试试卷中,阅读部分都是由好几篇短文构成,一方面,男生没有耐心仔细阅读材料,而女生一般更有耐心,另一方面,男生比女生更粗心。就英语整体学习成绩的研究发现来看,与吴一安、刘润清(1993)的研究发现一致,这可能是由以下原因所致:第一,在语言学习方面,女生比男生更有天赋;第二,总体而言,女生比男生更勤奋,因此可能会花更多的课余时间学习英语。

3.生源对高职学生的英语学习成绩的影响

为了比较来自农村和来自城镇的高职学生的英语学习成绩,同样对听力成绩、阅读成绩、词汇结构成绩、高考英语成绩做了独立样本t检验。具体结果如下表3。

注:listening指听力成绩(总分15分);reading指阅读成绩(总分35分);vocabulary指词汇结构成绩(总分20分);matriculation指高考英语成绩(总分150分)

1指来自城镇的学生,2指来自农村的学生

如表3所示,在这四项成绩中,来自城镇的高职学生的平均分比来自农村的高职学生高,即在一定程度上说,来自城镇的高职学生的英语学习成绩比来自农村学生的好。但是,根据统计分析,这两类学生的英语学习成绩却不存在显著差异。这一研究结果表明,在学习英语时,来自农村的高职学生不必在来自城镇的高职学生面前感到自卑。同时也说明了一点,在大学校园里,所有学生都一样有着很好的学习英语的条件,比如,学校统一提供接收器,可以收听英文广播;学校每周都会组织英语角且有外教指导。

四、结论

第一,高职学生的英语整体自我概念与其英语整体学习成绩显著相关。即具有积极的英语自我概念的高职学生,其英语学习成绩好,反之亦然;具有消极的英语自我概念的高职学生,其英语学习成绩差,反之亦然。第二,高职学生的阅读成绩和高考英语成绩存在显著的性别差异。这即是说,总体而言,高职学生中女生的英语阅读成绩与英语整体学习成绩比男生的好。第三,高职学生的英语学习成绩不受其生源(来自农村或城镇)的影响。

参考文献:

[1]Brown,D.Principles of Language Learning and Teaching[M].Beijing:Foreign Language Teaching and Research Press,2002.

[2]Jane Arnold.Affect in Language Learning[M].Foreign Language Teaching and Research Press,2000.14-17.

[3]Li Qiang.Self-concept and Its Correlation with English Study[D].Dalian:Dalian University of Technology,2005.

[4]Ma Dongmei.English Self-Concept of Chinese College English Majors[D].Guangdong:Guangdong University of Foreign Studies,2003.

[5]Marsh,H.Content specificity of relations between academic achievement and academic self-concept[J].Journal of Educational Psychology,1992a,(84),35-42.

[6]Pan Wei.English Pronunciation Self-concept:Its Effects on Chinese-speaking EFL Learners[D].Guangdong:Guangdong University of Foreign Studies,2003.

[7]William & Burden.Psychology for Language Teachers[M].北京:外语教学与研究出版社,2000.

[8]Zhang Zhihong.English Self-concept of Chinese College Non-English Majors:Its Relations to Self-Attributions to Success and Failure in English Learning[D].Jilin:Jilin University,2005.

[9]Zhu Xiuquan.The Relationship between English Self-concept of Chinese English Learners and Their English Classroom Anxiety[D].Guangdong:Guangdong University of Foreign Studies,2004.

[10]王初明.自我概念与外语语音学习假设[J].外语教学与研究,2004,(1).

[11]王初明.英语语音自我概念与实际英语语音水平[J].外语界,2004,(5).

[12]朱秀全.英语整体自我概念和英语发音自我概念与英语课堂焦虑的关系[J].国际关系学院学报,2005,(4).

[13]江萍.“自我概念”在外语教学中的重要性[J].外语研究,1997,(3).

第2篇:统计学概念汇总范文

    目前,自然语言检索系统采用的是模式匹配技术。所谓模式指的是关键词或索引词汇。模式匹配技术处理速度快,简单易行,但也有缺点。自然语言检索系统对同义词、近义词、多义词和其他一些与其相关的词语没有进行规范和统一,词间缺乏有机的联系。当用户提问的检索概念具有多种表达形式时,采用单一的关键词或自然语言索引词匹配方式势必会影响检全率。自然语言检索系统的选词没有严格限制,词量过多过杂,这样会影响检准率,并且会过多地占用磁盘的存储空间,影响查询匹配的速度。要想解决这些问题,必须对自然语言查询做进一步的处理,也就是进行概念控制。

   

概念控制及其实现基础

    . 概念控制的目的

    概念并不是孤立存在的,一个概念总是与其他概念之间存在着各种各样的关系,如上下位关系、同义关系、反义关系等。关键词也会出现一词多义、一义多词以及同一事物多种表述的情形。根据概念之间的相互联系,在词的概念含义层次上建立联系,为检索用户提供相关的结果分析是概念控制的一个应用前景。例如,“体育”这一概念根据上下立类的关系可以细分为足球、排球、奥运会、亚运会等,单纯的字面匹配会漏检甚至误检很多与之相关的信息。通过概念控制就可以将一个上位类的概念扩展为多个子概念。体育新闻的检索就可以扩展为:体育新闻、球类(足球、篮球、排球)、田径运动、体育赛事(奥运会、亚运会、世界杯)等概念,同时对那些具有下位概念的词汇可以再次扩展,这样就大大地提高了检索效果。“计算机”和“电脑”是同一事物的不同表述,机械匹配的话就只能检索到有关“计算机”或“电脑”的信息,采用概念控制的相关方法可以将这些相同概念的词汇统一到检索匹配中,这样就扩大了检索面,提高了检全率。在自然语言检索系统中进行慨念控制,就是把信息检索从目前的基于关键词层面提高到基于知识(概念)层面,能够从概念意义层次上来认识和处理检索用户的请求,从而提高检全率和检准率。

    . 概念控制的主要方法

    目前虽然没有一个检索系统可以完全实现理想状态下的高层次的语义检索,但有些自然语言检索系统已经采用概念控制查询。主要的方法是利用知识体系建立概念间的关系进行查询扩展,深度匹配,优化检索效果。

    概念控制的内容包括:提问句概念语义块的抽取,从提问句中切分出概念词或词组等语义单位;基于知识体系对抽取出的语义单元进行概念扩展;概念的组配,将选择出的各检索单位基于知识体系的组织信息转换成体现概念关系的逻辑表达式。

    概念抽取不等同于分词处理,其中包括普通概念的识别和人名、地名、事件名等专有名词的识别,并进行概念提取。对于普通的概念字串采用逆向最长匹配算法(或正向最长匹配算法),并综合切割标记等分词手段切分就可以进行概念抽取。对于词典中未收录的概念词,可以采取基于句模、句子结构分析、词和词组构成规则、句内结构性标志字、标点符号等来进行切分。除切割标志外,已知的词也可作切割标记使用。

    自然语言检索系统的本质是查询满足特定主题概念的文本,因此被检索的内容不是和提问句的字面匹配。对提问进行分析后抽取出的主要是概念或概念的组合,需要进行概念匹配,这就需要对检索句中的词进行概念扩展,即考虑提问句中词的同近义词、上下位词和关联词。可以通过知识体系保存同近义关系、上下位关系和其他关联关系,当处理用户检索需求时,通过查询知识体系可对提问句中的词按概念进行扩展。如“我国今天的体育新闻”,可以通过知识体系对“体育”进行扩展,查询包括“篮球”、“赛车”、“奥运会”、“世界杯”等方面的内容,“今天”一词指检索者进行检索时的日期,因此需通过规则将“今天”映射为检索时的时间,将“我国”扩展为“我国”V“中国”V“中华人民共和国”(知识体系中可能只存在“中国”和“中华人民共和国”之间的同义关系,没有“我国”这一词条)。

    概念组配,按其内在逻辑关系,可分为限定组配和相交组配。限定组配将一个概念的内涵增加到另一个概念的内涵中,从而加深概念的内涵,缩小或限定了概念的外延。相交组配将具有共同的属概念、概念之间具有相交关系、外延部分重合的概念组合成一个新概念。在构成查询表达式时,基于知识体系的扩展词和原词间为“逻辑加”的关系。如“美丽”扩展为“美丽”V“漂亮”V……V“标志”。提问句中语义块间的关系通常为逻辑乘的关系。语义块间的概念组配通常存在如下逻辑关系:()主谓结构,描述的是一种陈述与被陈述的关系。()偏正结构,描述的是一种修饰与被修饰的关系。()动宾结构,描述的是一种作用和被作用的关系。()并列结构,描述的是一种成分间的并列关系。主谓结构、偏正结构和动宾结构间为“逻辑乘”关系,并列结构为“逻辑加”关系。但通过对检索提问句进行分析后发现,部分并列结构在用户的检索概念中为“逻辑乘”关系,于是采用通过句模分析和指示标志来确定语义块间的“逻辑乘”或“逻辑加”关系。提问句语义块之间的“逻辑加”关系通常存在显式指示标志,如“或”等。分析传统的主、谓、宾、定、状、补六大成分与句型的关系,可以辅助获取语义块的逻辑关系。检索提问句的语义概念和提问句的结构紧密相关。需要分析谓语的性质、句子的结构,如“把”字、“被”字句等。

    概念控制的项关键技术中,概念扩展和概念组配都离不开知识体系的支持,知识体系的好坏直接关系到检索效果的优劣。

    . 概念控制系统

    国内外已有一些检索系统在不同程度上实现了概念控制,代表系统有首信搜索引擎、孙悟空、UMLS等。下面以UMLS为例进行介绍。

   

   

UMLS(Unified Medical Language System,美国统一医学语言系统),是美国国立医学图书馆(NLM)于年开始研制的一项长期开发研究计划,旨在克服计算机生物医学信息检索中的两个显著障碍(相同的概念具有不同的表达方式;有用的信息分散在不同的数据库系统中),使用户很容易地跨越了在病案系统、文献摘要数据库、全文数据库以及专家系统之间的屏障。UMILS包括个部分:专家词典、超级叙词表、语义网络、情报源图谱。专家词典是一个包含众多生物医学词汇的英语词典,可以确定英语词汇的范围以及识别生物医学术语和文本词的词形变异,也为超级叙词表提供了确定范围的医学术语和词汇。超级叙词表是生物医学概念、术语、词汇及其涵义等级范畴的广泛集成。语义网络是为建立概念、术语间错综复杂的关系而没计的,它为超级叙词表中所有慨念提供了语义类型、语义关系和语义结构。情报源图谱是一个关于生物医学机读情报资源的数据库,其目的是利用超级叙词表和语义网络实现以下功能:确定情报源与特定提问的相关性,以便选取最合适的情报源;为用户提供特定情报源的范围、功能和检索条件等人工可读的信息;自动链接相关情报源;在一个或多个情报源中自动检索并自动组织检索的结果。

支持概念控制的知识体系

    实现概念控制离不开知识系统的支持,没有合理的知识系统,就无法实现概念扩展和概念组配,也就无法达到概念控制的目的。进行概念控制的核心是构建合适的知识体系。

 . 知识体系及其形式

    目前,有关知识体系的研究主要集中在对Ontology的探讨中。国内关于Ontology的中文译法也不统一,有“知识体系”、“本体”、“概念集”、“概念体系”、“本体论”等多种提法。Ontology是一个源于哲学的概念,原意指关于存在及其本质和规律的学说,后来被人工智能研究领域引入,特指对共享概念模型的明确的形式化规范说明。Ontology能够将词汇有关概念关系显式地表示出来,从而将术语的语义和概念关系显式化表示出来,因而在语义查询、概念控制方面发挥着重要作用。

    Ontology中的概念表示一般采用框架结构,使用槽来表示概念的属性以及概念之间的关系。借助概念之间的关系,Ontology在整体上形成了一个语义网。概念之间有种基本关系:part-of表达概念部分与整体的关系;kind-of表达概念间的继承关系,类似面向对象中的父类和子类之间的关系;instance-of表达概念间实例和概念之间的关系,类似面向对象中的对象和类之间的关系;attribute-of表达某个概念是另一个概念的属性,例如概念“价格”可以作为概念“桌子”的一个属性。在实际应用中,概念之间的关系将不会局限于上述种关系,可以根据特定领域的具体情况定义相应的关系。

    . 语义网络

    概念与概念之间有着横向或纵向的联系,形成了语义网。语义网络(Semantic Network)是美国语言学家奎廉(R.Quilian)于年提出的。年美国人工智能专家西蒙斯(R.F.Simmons)和斯乐康(J.Slocum)将语义网络用于自然语言理解系统中。语义网络是当今网络的扩展,这可扩展的网络给出了信息明确的定义,同时优化了人与汁算机的合作。

    如何构建语义网络更好地将信息定义明确化目前仍没有统一的准则,这涉及到语言学、认知心理学等学科方面的知识。但是构建语义网络的统一原则都是将概念之间的横向或纵向联系显式化,组织成一个有机的结构形式。

    Wordnet是由普林斯顿大学认知科学实验室开发的在线词汇参照系统。它将所有英语词汇分成类:名词、动词、形容词、副词和功能词。名词按照种关系被加以组织:部分关系、上下位关系以及物质与材料。同时有反义的名词被标注了反义关系,这样形成了一个互相高度连通的名词网络。动词的多义性比名词更高,在Wordnet中动词被组织成各种推演(蕴涵)关系,而组织动词的不同关系可以被总结成一个覆盖它们的基础词汇的推演,包括四种。

    . 概念词表

    知识体系中除了概念间相互关系形成语义网络,对于每个单独的概念还必须有概念词表。没有概念词表的语义网络只是一个单纯的概念关系网而不是与词汇相结合的知识体系。Hownet中的词表就是一个概念词表。Hownet是一个以汉语和英语的词语所代表的概念为描述对象,知网是一个利用一种知识词典描述语言来描述概念与概念之间的关系以及概念的属性与属性之间的关系的知识系统。Hownet包括词表和义原体系表。词表中记录了每一个词语的概念及其描述,每一个概念用一个记录来表示,如下所示:

    其中NO.为概念编号,W_C,G_C,E_C分别是汉语的词语、词性和例子,W_E,G_E,E_E分别是英语的词语、词性和例子,DEF是知网对于该概念的定义,是知网的核心。每个DEF被称为一个语义表达式,采用知识描述语言,将与词汇有关概念关系采用显示的表示出来。如从概念编号为的DEF可知“打”的概念之一是“锻炼”,属于体育范畴。

    . 构建知识体系的问题

    构建一个适用合理的知识体系对于改善检索效果至关重要。但目前已成形的知识体系都存在一些不足。

第3篇:统计学概念汇总范文

1分析动机

1.1教学内容分析

学习《数据库技术》课程前学习者已经学习了《计算机技术基础》、《C语言》和《数据结构》等先行课程,“概念结构设计”教学内容安排上是在数据库基本概念、关系数据库、SQL语言和关系数据理论之后,“概念结构设计”部分包括概念结构设计的概念、方法与步骤、数据抽象和视图的集成。本部分内容的重点是概念结构设计的方法。难点是根据具体系统内容的描述设计基本E-R图。

1.2学习者动机分析

“概念结构设计”较抽象,学习者需要从复杂的实际应用中找出数据库设计中的关键因素,学习者尚不知该内容在整个数据库设计中的重要作用,鉴于此内容的难度较大,易使学习者知难而退,对学习者学习的积极性产生负面影响。

2动机策略设计及实施

2.1课程导入

2.1.1教学内容

将49名学习者分为5个小组,利用课前时间每组分别分析淘宝、京东、当当网、1号店、天猫的网上购物流程,并分组进行调查汇报。提出问题:你分析系统中的商品有哪些属性?订单包括哪些内容?订单与客户和商品之间的联系及涉及的实体有哪些?订单有哪些状态?知识回顾:实体、属性和联系的概念,选课E-R模型实例。

2.1.2动机策略应用

注意策略:通过问题引入,让学习者主动思考,引起学习者有意注意。相关策略:通过知识回顾,帮助学习者建立已有的E-R模型与概念结构模型设计之间的联系,建立脚手架从而降低新知识学习难度。自信策略:选取学习者们熟知的购物网站为例,增强学习者信心。

2.2课堂教学

2.2.1教学内容

基础任务:定义购物网站生成订单的事件,通过E-R模型进行概念结构设计。汇总各小组提交的设计结果,总结学习者的概念结构模型设计,如图1所示。来源:黑龙江省哲学社会科学研究规划项目(16EDE07)和哈尔滨师范大学深化教育教学综合改革项目(X2015-2-003)的研究成果。提高任务:上述模型中当客户提交订单但未购买商品将减少商品的库存,如何解决这一问题呢?请学习者思考并提出问题解决办法。教师提示可将多对多的联系拆分为两个一对多的联系,根据订单的状态通过程序确定是否实际减少库存。按照之前分配的小组安排学习者讨论并提出新的设计方案,学习者讨论是教师到各组进行引导和巡视[2]。讨论:经过学习者讨论,分析新概念模型设计的合理性。小组汇报并由教师汇总修改后如图2所示。

2.2.2动机策略

注意策略:教师播放课前录制的网上购物过程的动画,引起学习者注意。自信策略:教师按照基础和提高两类任务进行分层布置,利于搭建脚手架、激发学习者自主思考,增强自信。

3评价

学习者对各自小组设计的E-R模型进行评价,小组间进行设计结果互评,教师对每个模型的设计过程、小组合作情况和设计结果进行总结性评价。满意和自信策略:学习者经过深入思考进行互评,体验设计被认可和逐步求精带来的喜悦。教师的点评认可其设计结果提高学习者信心。

4结论

通过该方法的学习,学习者在练习和期末考试中能够熟练准确的对复杂的需求通过E-R模型进行概念结构设计,因此,ARCS模型应用于《数据库技术》教学有助于激发学习者学习动机,提高学习效果。

作者:韩玲玲 单位:哈尔滨师范大学

参考文献

第4篇:统计学概念汇总范文

关键词关键词:微博;微型学习资源;概念图;微群

中图分类号:TP301 文献标识码:A 文章编号文章编号:16727800(2013)007000603

0 引言

微博自创始以来,鉴于其自身的众多优点而发展得如火如荼,人们正在探索微博的各种应用市场,其中在教育领域中的应用已引起了很多学者的关注。研究微博在教育中应用的学术论文在陆续发表,关于微博在教育应用中的主要问题也逐步明晰,其中微博教育应用中的碎片化信息的组织与管理问题是最为突出的问题之一。由于微博140个字的限制,学习内容的表达带有明显的碎片化特征,不能整体地呈现知识之间的系统联系,这不利于学习者对知识的系统建构。

1 利用微博微群功能实现微型学习资源的组织

1.1 概念图在知识组织和呈现方面的优势

概念图是一种组织和表征知识的工具,是一种用节点代表概念、用连线表示概念间关系的图示法。它通常是将某一主题下不同级别的概念或命题置于方框或圆圈中,再以各种连线将相关的概念和命题连接起来,形成关于该主题的概念或命题网络[1]。它最早是由美国康奈尔大学JosePh,D.Novak在20世纪60年代根据奥苏伯尔的同化理论提出的,自兴起以来被广泛应用于教育领域。概念图是个有层次的意义网络,与人类认知结构中表征、组织、贮存知识的方式是吻合的。诺瓦克根据奥苏贝尔的认知学习理论将认知结构的组织方式具体化为概念命题层次网络图模式,它首先帮助学生理解所学内容的关键概念,并在各个概念间建立起有意义的联系,然后用具体的知识或事实充实相应的概念[2]。概念图对于知识的组织和呈现符合人的认知结构,概念图中的每个概念都可以作为一个独立的知识单元,这些知识单元之间又有层级递进关系。

1.2 利用微群功能实现碎片化学习资源之间的联结

微群,就是微博群的简称,是在微博的基础上加入了“群”的概念。微群能够聚合有相同爱好或者相同标签的朋友们,将所有与之相应的话题全部聚拢在微群里面,让志趣相投的朋友们以微博的形式更加方便地进行参与和交流[3]。在微群中,可以创建、查看和管理话题,同时话题形式又建立了碎片化学习资源之间的联结。微群中有多种内容标签:发言、话题、微盘等,点击“发言”标签可以查看自己的所有发言,“话题”标签可以查看群内的所有话题,“微盘”可以查看微群里共享的资源,通过这些标签,群主可以有效地管理群内的资源。微群中还有一个群内话题模块,显示群内的所有话题名称及对应的话题数目,该模块使所有学习者能够方便地按话题查看和获取所需资源,相关的碎片化内容都通过相应话题的形式建立起了有效的联结,成为一个有机整体,使微博呈现的知识不再是“碎片化的”信息。

基于微博的微群和话题功能,借助概念图工具来设计和组织基于微博应用的微型学习资源,对于解决微博碎片化信息的组织与管理问题无疑是一个很好的途径。

2 《旅游英语词汇每日学》微型学习资源设计

成人学习者具有以下特点[4]:一方面,他们的学习有着明确的现实目标指向性;另一方面,在易受干扰的环境中所进行的片断化学习,也多以能快速解决问题的实用学习目标为主。旅游英语词汇是成年学习者日常生活中常常需要的,因此,《旅游英语词汇每日学》微型学习资源面向的对象主要是成人学习者,因此对于微型学习资源的设计要求是其实用性要比较强,能快速解决成人学习者的问题。

2.1 旅游英语词汇概念图

旅游相关词汇有很多,在此,以旅游英语词汇“trip”为例来组织学习内容,与“trip”相关的内容分为“vehicle”、“gourmet”、“attractions”、“accommodation”、“formalities”五个知识单元,每个知识单元又包括一些具体的内容(如“vehicle”包括“plane”、“train”等)。知识单元及其内容确定后,可以使用概念图工具画出《旅游英语词汇每日学》的学习内容概念图,如图1所示。

3.2 基于微博应用的微型学习资源的试用

基于微博应用的微型学习资源制作并后,作者邀请了5位同学加入微群,进行了试用体验。随后进行了个人访谈,主要收集大家关于基于概念图和微群话题功能设计与组织微博的碎片化学习资源对于解决微博碎片化信息的组织与管理问题有无帮助的看法,以及对这种设计方案的意见。在访谈过程中,受访者表达了自己的直观感受,表明了喜欢与否的态度,并提出了期望和建议。访谈结束后对受访者的回答进行了汇总分析,总体来说大家对该设计方案还是肯定的,认为概念图结合微群话题功能建立了微型学习资源之间的有效联结,有利于碎片化学习资源的组织与管理。但同时还存在一些问题,主要是部分受访者认

为以话题方式微博给人“限制感”。笔者认为随着微博平台功能的不断丰富和完善,可以进一步对基于微博的微型学习资源的组织与管理进行探讨。

4 结语

微博发展如火如荼,在教育领域具有广阔的应用前景。本文就微博在教育应用中的碎片化资源组织与管理问题进行了探究,尝试利用概念图工具和微博的微群功能设计与组织适合微博的微型学习资源,可以在一定程度上解决微博在教育应用中碎片化学习资源的组织问题。本文中没有对基于微博的微型学习资源在实际应用中的效果做实证研究,这需要在实践中不断地进行改进和完善。

参考文献参考文献:

[1] 王璐琦.概念图的制作及其教学价值[J].教育研究与评论:中学教育教学,2012 (12).

[2] 王大平,李建国.概念图的理论及其在教学中的应用[J].现代教育技术,2004(6).

[3] 互动百科.微群[EB/OL].http:///wiki/%E5%BE%AE%E7%BE%A4.

第5篇:统计学概念汇总范文

[关键词]隐喻理论;词汇教学;作用;启示

abstract:the paper discusses metaphor theory of cognitive linguistics as well as its significance for vacabulary teaching: in the development of vacabulary semantic category, in the understanding of vocabulary metaphor concept, in the development of vocabulary meaning. in the vacabulary teaching, the following enlightenments should be seriously taken into consideration: basic category vacabulary, vacabulary metaphor meaning and metaphor extending meaning, and vacabulary cultural connotation.

key words:metaphor theory; vacabulary teaching; significance; enlightenment

隐喻与人类的认知、思维密切相关,是一种普遍的语言现象。传统的隐喻理论普遍认为,隐喻是一种语言现象,一种修辞手段,主要用在文学作品中。 自1980年george lakoff &mark johnson发表了《我们赖以生存的隐喻》(metaphors we live by)一书以来,开辟了一条新的从认知角度来研究隐喻的途径。此书的出版标志着认知观的隐喻研究的全面开始。认知语言学认为, 隐喻是日常语言中随处可见的现象,它在本质上是认知的,不是修辞格,不是简单的语言的产物,它更确切地说是一种通过语言表现出来的思维方式。我们赖以进行的思考和行动的日常概念系统,在实质上是隐喻性的[1]。在大学英语教学中,教师会频繁地接触到教材中的隐喻现象, 它们体现在词汇、语法和篇章等各个层面。本文中笔者结合教学实践,从词汇学习层面,探讨大学英语教学中,词汇隐喻的认知机制及其对词汇教学的几点启示。

一、 隐喻理论

lakoff把隐喻看作是人们思维、行为和表达思想的一种系统的方式,即隐喻概念(metaphorical concept or conceptual metaphor)。在日常生活中,人们往往参照他们熟悉的、有形的、具体的概念来认识,思维,经历,对待无形的、难以定义的概念,形成了一个不同概念之间相互关联的认知方式。隐喻概念在一定的文化中又成为一个系统的、一致的整体,即隐喻概念体系,在人们认识客观世界中起着主要的和决定性的作用[2]。总的来说 ,他们的隐喻理论包括的主要观点如下: 1.隐喻具有普遍性; 2.隐喻在本质上是认知的; 3.隐喻具有系统性; 4.隐喻的内在结构是跨域映射; 5.隐喻的产生有经验基础。在隐喻的认知推理过程中,人们总是先从隐喻的源域(本体)中提取反映事物规律性的、高一级的概念结构,然后把它投射到用以把握目标域(喻体)相应的概念结构中去,从而形成二者映射关系。受话人依据此映射关系进行概念的空间投射和映射,由显性信息推导出隐含信息。这一过程即隐喻认知过程。

日常生活中常见的概念隐喻分为三类:结构隐喻(structural metaphor)、方位隐喻(orientational metaphor )和实体隐喻(ontological metaphor)。结构隐喻指以一种概念的结构来构造另一种概念,使两种概念相叠加,将谈论一种概念的各方面的词语用于谈论另一概念,于是产生了一词多义现象,如spend一词最早是用于谈论金钱,后来被用于谈论time、enegy、 efforts、 force、fuel 等等。方位隐喻指参照空间而组建的一系列隐喻概念。以空间为始源域, 通过将空间结构投射到非空间概念上,赋予该非空间概念一个空间方位。如more is up这一隐喻给予quantity这一抽象概念一个纵向方位,因此英语中有hope my income rises every year 之类的说法,汉语中有“鸡蛋价格又上去了”之类的表达。实体隐喻帮助我们将抽象的事件、活动、情感等视为有形的实体和物质。例如:the mind is an entity就是将mind这一抽象概念具体化。按人们对隐喻的熟知程度来划分, 隐喻又可分为常规隐喻和创新隐喻两大类。上文所提到的属常规隐喻, 创新隐喻包括文学隐喻和科学中的隐喻。

二、隐喻认知在词汇学习中的重要性

当前很多学外语的学生整天拿着一本词汇大全背记单词,片面追求扩大词汇量,而真正能看懂一般难度的外语读物和能用外语进行日常口头或书面交流的外语学习者则是少数。究其原因,一是因为词汇量太小,二是没有掌握基本的核心词汇在不同语境下的不同意义,没有掌握多义词的强大的表达力。认知语言学的范畴理论和隐喻理论在认识多义现象及其词语的语义扩展方式方面提供了很好的思路。根据认知语言学的理论,多义词的词义扩展不是任意的,毫无规律的,而是有理据、有规律可循的。弄清这种理据和规律无疑会帮助外语学习者理解和记忆多义词的各种用法,从而扩大其接受型和产出型词汇量。隐喻作为人类重要的认知工具,是外语学习者了解目的语民族认知方式及文化的一个重要手段。由于各民族认知方式及历史文化的差异,各语言的概念系统也不尽相同,因此,帮助学生明确认识话语中的隐喻现象是实现外语教学中概念流利的一种重要方法,而词汇教学正是实现外语教学中概念流利的一个重要途径[3]。 laufer 认为掌握词汇的隐喻扩展意义 (metaphorical extensions of meaning)是学习新词汇的一项重要内容[4]。 sweetser指出隐喻也是“一种常被忽视的联系一词多义的重要资源”[5]。 如果他们能了解一词多义现象背后所隐藏的本国语者的认知思维方式,认识多义词各个义项间的联系模式,外语学习者或许就能按这些方式从一个多义词的已知义项推导出或更好地理解其在具体的语境中的未知意义,从而有利于记忆和灵活使用该词。因此,词汇教学中应把隐喻概念作为一项重要内容,并作为扩大词汇量的一个重要手段。

三、隐喻的认知机制对词汇教学的几点启示

1. 隐喻认知对词汇语义范畴发展的作用

范畴与范畴化是认知语言学研究的主要对象之一,范畴指事物在认知中的归类; 范畴化指人类对世界万物进行分类并赋予语言符号的一种高级认知活动过程。在经验世界中,范畴具有不同等级。范畴化的过程是复杂、模糊的认知过程。隐喻思维的延伸在形成不同范畴之间的关系网中起了重要作用,大部分隐喻思维都是在基本范畴等级上发展的。我们知道基本范畴词比其他范畴词有更多的隐喻用法,如:bird、flower、dog、fox、wolf、lion等比 dove、 rose、animal的隐喻用法更多,这说明这些基本范畴词被用于隐喻频率最高,其语义变化最多,发展最快。而人们认识新的抽象概念时,总是与已认识的事物相联系,找到他们之间的相似和关联点,于是产生了两个认知域之间的映射,这种创造性的隐喻思维发展了语义范畴的抽象意义。以“床”为例,它的基本义又有河床、冰床、机床、苗床、花床、 矿床等等。在此基础上,又产生了温床。英语中也有a bed of roses、a bed of nails等,并在名词的基础上发展了其动词意义:把……栽于苗床,为客人安排床铺。这些都是人类共同隐喻思维的结果,语义的发展正说明了这一点。表示人体任何部位的词语都有隐喻的用法,如:face of a mountain, face of a building, face of a watch; mouth of a hole, mouth of a tunnel, mouth of a cave, mouth of a river。 如 eye这个词,最初是用来指人自身的一个重要部位,通过隐喻的认知功能发展为指其他动植物及其他物体的“眼睛 ”、“中心 ”: the eye of a typhoon 台风中心 the eye of a needle 针眼。不仅是表示人体器官的词,英语中许多词都通过隐喻以中心意义核心产生多层意义。不难看出日常语言中充满了隐喻。据统计,英语词义的70%都是隐喻或源于隐喻,词典中词条下罗列的词义都有一定的联系,最基本的是中心义项,其他义项则是由中心义项通过隐喻发展而产生的。

在词汇教学中, 根据认知范畴理论,教师在讲解多义词时,应重点讲解中心意义,让学生理解各义项之间的深层关系,培养他们根据上下文推测具体意义的能力。这样,学生在词汇学习过程中能够重点突出, 融会贯通, 最终达到灵活掌握和运用的目的。

2. 隐喻认知在词汇隐喻概念理解中的作用

认知语言学认为一个概念隐喻包含两个部分:一个始源域和一个目标域,隐喻的认知力量就在于将始源域的图式结构映射到目标域之上[6]。如:下列表达方式可以证明argument is war 是一个隐喻概念:your claims are indefensible./ he attacked every weak points in my argument./ his criticisms were right on targer./ i’demolished his argument./ i’ve never won an argument with him. 可以看出,争论是一场“舌战”,有进攻、防守、反进攻、输赢等,“争论是战争”这个隐喻概念是借助战争概念来理解的。在教学中,我们应该利用这种跨域映射的图式结构来帮助学生理解。如全新版大学英语第三册unit 7 life of a salesman的文章有:

he takes the first unsteady steps on a journey to portland’s streets, the [zz(z]battlefields[zz)] where he [zz(z]fights[zz)] alone fo his independence and dignity. he’s a door-to-door salesman. sixty-three years old. and his [zz(z]enemies-a[zz)] cripped body that [zz(z]betrays[zz)] him and a changing world that no longer needs him-are [zz(z]gaining[zz)] on him. with trembling hands he [zz(z]assembles[zz)] his [zz(z]weapons[zz)].

从下划线的词可以看出,作者利用了隐喻概念making a living is a battle. 这里上战场作战的图式结构可以很好地帮助学生形象地再现主人公生活之艰难。再如概念隐喻:life is a journey,人们对具体行为journey的经验基础上对抽象现象进行理解,如果只从字面意义来理解life,其语义是很单纯的,但用journey的隐喻结构来理解,意义是非常丰富的,而这丰富的意义是来自人们的亲身体验,这体验不能直接表达,只能通过隐喻才能言传,才能达到交流的目的。 隐喻语言一旦被其他字面语言代替便索然无味了。如果教师在教学中能够利用概念隐喻讲解词汇、课文,学生学起来既生动有趣,又会加深对词汇的理解,最终达到记忆与运用的目的。

3. 隐喻认知对词义发展的作用

在新词语或旧词新义的创造过程中,形象化的类比、想象、联想等多种隐喻思维方式起着很大作用。计算机技术中的很多术语都是利用隐喻扩展语义得来的,如:computer virus, network, informatio highway, address, e-mail, floppy disc, cyberspace等。计算机设备和运行过程也无一不是从隐喻而来:copy, store, retrieve, memory, download, databank, disk drive, read, write, output, input等等。新词产生的一种重要方法是借助于旧词构成新词,在其背后隐喻的思维方式也在起作用。如航天学的moonwalk, lunar rover, earthrise, soft landing(软着陆), linkup(靠泊), splashdown(溅落), black hole(黑洞)等等。 还有heart bridging operation[jp+3](心脏搭桥手术), airbus(空中客车), aerotrain(悬浮列车), future shock等。了解到隐喻思维再创造新词新义中的作用,有助于学生从认知的角度理解词汇构成, 加深印象强化记忆, 使词汇学习不再枯燥乏味而变得更有意义。也可鼓励学生利用隐喻思维大胆联想, 以基本词汇为基础扩大词汇量。

综上所述,从认知角度出发的隐喻理论对词汇教学是有深远影响的。在词汇教学实践中,教师可系统地向学生介绍隐喻理论,如隐喻的图式结构、隐喻相似的本质、隐喻的创造性等,使学生认识到隐喻不仅仅是一种修辞手段而是一种创造性的思维能力,帮助他们树立起一种隐喻观,从而改变过去那种机械记忆和死记硬背的词汇学习方法,从隐喻的角度去认识和理解词汇与词义的关系,达到灵活运用和掌握词汇的目的,最终促进听、说、读、写等各方面技能的发展。但是,隐喻作为认知现象又体现着文化的差异,不同的民族文化沉淀必然在隐喻上打下深深的烙印。如中国人将自己称为“龙的传人”,龙象征着吉祥和王权,而在西方文化中,龙是一种凶悍的守卫宝藏的巨兽,是贬义词。所以亚洲四小龙,英语不译为“four dragons”,而译为“four tigers”(四小虎); 汉语中说嫉妒别人,会说某人得了红眼病,而英语中表示嫉妒却用 green(绿),说“green-eyed”等等。所以在词汇教学中对词汇文化内涵的介绍,一方面可以引导学生恰当利用母语的正迁移,深入理解中西方文化内涵类似的词汇;另一方面,通过词汇文化内涵差异的对比使学生意识到中西方隐喻思维的差异,进而了解中西方文化的差异。但这也对教师提出了更高的要求,他们必须具备跨文化教学的意识和能力,注意词汇隐喻意义的跨文化比较和研究。

[参考文献]

[1] lakoff ,g. &m johnson. metaphors we live by[m]. chicago: university of chicago press, 1980: 4.

[2]赵艳芳.认知语言学概论[m].上海:上海外语教育出版社,2000:106.

[3] 董宏乐, 徐 健, 梁育全. 外语教学中的概念流利[j ]. 外语教学与研究, 2003,2:140-144.

[4] laufer b. what ’s in a word that makes it hard or easy:some intralexical factors that affect the learning of words [m]// in mccathy m &schmitt n eds. vocabulary:description, acquisition and pedagogy. cambridge:cup,1997:141.

第6篇:统计学概念汇总范文

关键词:现代汉语语言 二八法则 构拟 系统论 信息论 控制论

一、引言

20世纪40年代末,由于各学科发展突飞猛进,产生了许多边缘性的交叉性学科,这就推动了信息论、控制论和系统论“三论”的诞生。它是当代描述客观世界、掌握客观世界的新思想、新方法,在许多前沿学科都得到广泛运用。用“三论”研究语言有助于抓住语言结构的经纬,而语言和思维又有同构关系,语言是抽象思维的物质外壳,自身也是思维类型。所以本文从语言的认知角度切入,用基本认知过程的信息加工观点来考察人们对信息的选择性注意(信息论)。研究作为信息载体的语言,是不是在人脑中构成一个“语言过滤系统”并且这种语言的选择体系因人而异(系统论)。而在这个系统中,被选择的语言信息和被过滤、筛选的语言信息是否存在某种比例关系?我们也就此引入“二八法则”,假设汉语语言的“二八法则”存在于人脑中,由关键的20%控制次要的80%,恰好符合了“控制论”的观点。这样“三论”在汉语语言中就建立了一个新视角,使汉语的研究领域和范围更广阔。但就“三论”和“二八法则”等宽泛的概念,有些研究结论并不能完全使人信服,是否准确,是否具有心理现实性,都有待于心理语言学实验的证据,更需要不断找出具体语言现象,对其进一步证实或证伪。而在此过程中,可能会带动对一些相关概念的研究。

我们先来解释一下其中的首要概念和基础概念。

二、现代汉语语言的系统性

系统论是一门研究各类系统规律的学科。系统论认为,任何事物都是由其内部要素之间相互联系、相互作用,能表现出特定功能的一个有机整体。其中包含系统与内部各要素、要素与要素之间的联系,系统与周围环境的联系。系统论实质就是“内部结构,外部功能”方法的自觉运用。

现代汉语语言结构虽然复杂但并不是杂乱无章的,它是由内部要素组成的一个条理清晰的有机整体:词汇是核心,语音是负载体,语法是结构形式,这是三个子系统。语言系统的功能是交流思想,表达思想。其中,汉语的三个子系统也各自组成一个小系统。

表一 现代汉语结构系统

(一)汉语语法的系统性

语法是语言的内部结构和复杂的外部联系的固有形式,是语言中存在着的各层次的结构式。语法中存在着结构层次,结构的构成成分都有其本身结构所决定的功能。低层结构决定低层功能,低层功能形成高层结构,又决定高一层功能,层层上升,形成完整的结构。[1]例如在语法上,词从内部结构角度可分为单纯词、合成词;从外部功能角度可分为虚词和实词。

(二)汉语词汇的系统性

词汇是语言的细胞,数量庞大。词汇是成体系的,词汇系统中某一成员发生变化必然会引起其他成员的连锁变化,最后导致相关成员关系重新调整(黄景欣)。以往学界在词汇系统性标准上主要认同词汇体系包括形式系统、意义系统、功能系统、结构系统四个方面的系统,并倾向于以意义为主。[2]如戴昭铭老师的“系统语义观”,认为现代语言学应建立以“认知,语义”为纲的汉语词汇学,并以“义类”划分作为系统的框架。[3]

而在大方向上,词汇系统是与社会系统,思维系统,语音、语义、语法系统的有机关联中,实现新质要素的不断积累和旧质要素的不断衰变。[4]并随着社会发展变化,与外部环境进行信息的交换,形成有序状态。[5]

那我们的问题是,语言是抽象思维的物质外壳,自身也是思维类型。既然语言和思维有同构关系(周国光),语言在人脑中是不是也有个系统?这也是学界一直关注的问题:(1)“萨丕尔――沃尔夫假说”指出,“语言怎样描写世界,我们就怎样观察世界”。(2)乔姆斯基的“转化――生成语法”来研究语言深层的普遍规则,人都有先天言语获得装置,装置中包括语言的生成机制及心理的运行机制、词语及语义生成及概念合成机制、对客观世界的映射机制、句法生成机制、创造机制等等,涉及语言在输出前的生成过程。(3)早些年,杨敏提出了“语言心智体系假说”,认为语言本质上是一种心智行为,应该以“人”的角度来研究语言,研究这些语言外部表征的深层心理机制,研究人脑建构语言的内部体系,从而发掘语言的一些隐性特征。这些都使语言研究的视野更为广阔。

由于人心理机制的隐性特征,在研究上多采用“构拟方法”、“假说方法”进行推测;许多概念形成的途径也都采取“假设――检验”说,即概念形成的过程是“不断提出假设,检验假设”的过程。而且这种由果及因的推理方法,会引起人们进一步证实和证伪,从而在过程中会发现、解决一些新的问题。所以本文在缺乏足够的调查数据、客观的统计结果以及具有代表性的具体语言现象来证明一些宽泛概念的情况下,采用“构拟”的方法对人脑建构语言的“内部体系”进行假定性看法和说明。如果检验加以认证后结论成立,可以为相关科学提供一个新视角。

而且,语言内部机制不仅包括乔姆斯基所说的天赋能力,更包括后天的知识和经验。它是带有语义特征的语言符号在人脑中的自主运作,是先天的人脑物质如脑部神经系统为基础,由客观世界映射到人脑的语言物质基础之后,形成的一种内部体系。[6]由于每个人对客观世界的抽象思维方式、分类方式、概念系统的不同,所以语言内部系统也可能不尽相同。那么,就信息传输运送角度而言,是不是在每个人大脑中都有一个“信息过滤器”?而语言是信息的载体,是不是人脑中也应该有一个语言“生成――运行”的小系统作为一个预存的概念结构?

(这种概念系统决定了主体对认知对象的意义建构,是因人而异的。)

二八法则:在任何一组东西中,最重要的只占其中一小部分,约20%;其他80%虽然占多数,却是次要的。这20%起到80%的主导作用,控制那不太重要的80%;而那80%只起到20%作用,因而来服从重要部分,这就是“二八法则”。“二八法则”在经济学、管理学、心理学、物理学中都有应用,然而在汉语语言学中我们的研究却只是冰山一角。那语言中的“二八法则”又应该从哪个角度切入呢?答案又在什么地方?由于前文我们提到大脑有强烈的选择机制,假定“二八法则”存在于人脑中,我们尝试从语言认知角度去理解分析:人们在大脑中保留自己感兴趣或认为正确的20%,其余80%一并被过滤、筛选掉。这一假设当然需要数据支持,更有待于进一步验证真伪。

涉及20%控制80%,那我们引入“控制论”知识。把语言信息看成是其内部各组成成分地位不等的一个系统,并以此为角度研究汉语语言中的“控制论”。

四、现代汉语语言中的“控制论”

控制论是关于各系统的控制与调节的一般原理的学科。[14]在汉语语言系统中,有一小部分要素因为掌握了重要的系统信息,会对系统中其他要素有某种强烈的制约作用,进而控制整个系统。至于这一部分比例是否占系统总量的20%,还需要足够的数据支持。下面我们从语言系统内部(结构角度)和外部(认知角度)两个角度对“二八法则”进行猜测:

(一)语言系统内部的控制论

语言系统内的关键部分对整体是有定向控制的,包括纵向控制(聚合关系),如语法中抽象概括出的基本句式,词汇中的同素族、词语模的原型部分对后来生成部分的制约;横向控制(组合关系),即在某一步骤上,基本要素对加以铺陈,外延扩展部分的制约作用。

汉语语言中“二八法则”我们还可以从以下几角度进行猜测。

(1)在语言系统中,为什么语法(形式部分)变化慢,在系统中制约着词汇系统;而词汇(内容部分)变化快,在系统中服从、依附语法系统。是否语法在某一方面占语言系统中至关重要的20%,而词汇在某方面占语言系统中的80%?

(2)如果“二八法则”存在于语法系统中,那是否某具体语言单位的语法的外部功能占至关重要的20%,而内部结构占80%?因为语法规则是人们约定俗成的,是语言本身固有的,语法学中只是承认、解释和强化这种约定俗成。某些不符合语言结构规则但符合语言习惯的句子有很多,并不会影响交际,如“给个理由先”,但是违反语言习惯,就丧失了句子的交际功能,而语言习惯是由心理习惯制约的。[1]即心理习惯控制语言习惯,语言习惯控制句子外部交际功能,语言的外部功能控制语言的内部结构(语言的固有形式),从而使语言趋于形式化、公式化。那我们的问题是:是否语言系统的功能对语言结构系统也有制约作用?

(3)先前的符号对后续的符号的控制作用:对称性有利于制约:格式塔心理学中讲到,在一种符号系统中,后续的符号对先前的符号的依赖性越强,在记忆中越容易组织成同一块,或者记忆的单位。这种组织越完善,越有规律性,对记忆的促进作用越大。因为这种规律本身限制了选择可能性,所以加工比较容易。

例如,在汉语四字格成语中,前后两部分语法结构相同、相对应的词词性相同,语义对偶或对称的成语是对称成语;而意义整体性较强,不能拆分为两部分的成语是非对称成语。根据汉字猜测实验(推测汉语成语不同位置上汉字的信息量)的结果显示,语义结构对称的成语,猜对第三、四位上的汉字比非对称成语更容易。[15]说明对称成语的前行汉字对后续汉字的制约作用很强。

(4)如果“二八法则”存在于词汇系统中,那么是否现代汉语的常用词汇占词汇总量的20%,而从古到今,所有消亡的词占系统总数的80%?我们把那些过剩的80%的词语进行再分类,还可以分为“绝对过剩”,即所有人需求得到最大满足后有所剩余的部分;“相对过剩”,即个体认知能力的过剩。下面我们分别解释一下这两种语言认知角度下的控制论。

(二)语言认知角度下的控制论

(1)把“绝对过剩词”排除后,剩余的20%的常用词在竞争和选择中留下来的原因我们归结为以下几方面:

① 简单原则:保留下来的,是用最少假设进行猜测,或最多论断直接告诉人们概念和道理的“表述性话语”(言之成词的话语),而不是“行动性话语”(言之达意的话语)。[12]因为个体在认知周围世界时,总是试图少做认知努力来加工较多的信息。人们倾向于把事情归入已经熟悉的大类型,采取快速且省力的方式,形成初步印象。言之成词的“表述性话语”简化了人们认知过程,节省了人们时间和精力,使人们迅速了解复杂情况,应对复杂的周围世界。[13]而二者的比例关系则需要进行许多相关词语的使用频率的数据研究,以证真伪。

②符合人的思维规律:联想思维,包括相似、对比、因果、加法的思维。例如“词语模”现象、同素族、词群、词义沾染的现象,都是人类思维中举一反三、触类旁通的结果。

③符合大众的社会心理。如语言和环境的社会心理,社会方言、地域方言的共同部分出现在不同阶层、不同地域,以语言为载体的相同部分保留了下来。[16]

④语言中的“马太效应”:有些词语本身会随着其所代表的日常对应物经常见到而使其使用频率不断提高,熟悉度不断增加。熟悉度使知觉易化,从而不断加深强化这些词语在人脑中的印象,后不断在人脑中自动生成,能产性也极高;而冷僻词越来越没人用,最后消失了。这种现象本身也是其原因,二者互为因果。如“口头禅”现象。

⑤经济原则:即选择性法则,有些词语融入了新鲜元素,一词多义了,所以更有生命力,从而使用频率高,在竞争与选择下保留下来。是否这20%的词汇能达到利润的最大化和成本的最小化,以满足词语的最大效能。

(2)把“相对过剩词”排除后,剩余20%的高频词在人脑中保留下来的情况,我们可以以“术语”为例进行解释 :词汇中有一个特殊群体――术语。它对于学者来说是其认知能力内的20%,对大众来说却是80%。大众不会因为不使用它而使这些术语减少;而专家也不会因为经常使用而增加其数量(增加量太少,可忽略不计)。所以,语言能留下来,不仅应看其本身有多大价值,更主要看需求和供给的比值。需求供给=使用率。大小=高(词语模),小大=低(废一部分),小小=术语,大大=常用词。而词语模是否就是词汇中的20%,有待各方面统计。

(三)“三论”、“二八法则”的研究价值和实用价值

找到至关重要的20%,有利于:(1)在学习、记忆中,能动地抓重点,使学习效率最优化;(2)在对外汉语教学、中小学语文教育中,可以把使用频率高的词汇、语法急用先学,由浅入深学习;(3)找到句法、词汇某一原型,从中引出某一类组合、聚合;(4)可以将“二八法则”应用于计算机汉字识别模型的建立、中文信息处理系统的高速自动输入中,提高工作效率。

五、结语

汉语是开放性和包容性都很强的语言,用“三论”和“二八法则”等多维度的视角研究言语的内部机制,可能成为洞察人类心智的一个重要突破口,发掘语言的一些隐性特征,解释一些现象,许多问题也会迎刃而解。但是心理机制具有隐性特征;并且相关研究乏善可陈,方法论研究极少。又因为概念形成的过程是不断“提出假设――检验假设”的过程。所以需要大胆假设,然后由果及因进行推导和证明。而这些都依赖于心理语言学实验的证据和语料库语言学统计数据的支持。最终结果是否会满足我们的基本假设,有待于进一步验证。

参考文献

[1] 郑武玮.试用系统论观点探讨现代汉语语法[J].北京市政法管理干部学院学报,1994(2).

[2] 吴为民.汉语词汇系统性问题研究述评[J].西南石油大学学报(社会科学版),2011(1).

[3] 戴昭铭.试论以“知识,语义”为纲的汉语词汇学研究[A]//东方语言学[C].上海:上海教育出版社,2006.

[4] 匡鹏飞.汉语词汇研究的新创获[J].汉字文化,2002.

[5] 徐国庆.现代汉语词汇系统论[M].北京:北京大学出版社,1999.

[6] 杨敏.语言心智体系假说[J].外语与外语教学,2009.

[7] 张德芬.遇见未知的自己[Μ].北京:华夏出版社,2008.

[8] 彭聃龄.普通心理学(第三版)[Μ].北京:北京师范大学出版社,2003.

[9] 谭华玉.表象对成语记忆影响的实验研究[J].心理科学,2009.

[10] 任国防.“学习――再认”范式下汉字错误记忆的ERP效应[J].心理科学,2009.

[11] 徐联仓.信息多余性对掌握信号结构过程的影响[J].心理学报,1963.

[12] 王德春.社会心理语言学[Μ].上海:上海外语教育出版社,1995.

[13] 俞国良.社会心理学(第二版)[Μ].北京:北京师范大学出版社,2006.

[14] 朱.系统论、信息论、控制论在对外汉语教学中的应用[J].语言教学与研究,1986.

[15] 刘振前.汉语四字格成语语义结构的对称性与认知[J].世界汉语教学,2000(1).

第7篇:统计学概念汇总范文

关键词: 越南留学生 心理词典 表征结构 汉语词汇教学策略

1.引言

对外汉语词汇教学是近年来关注的热点之一,在了解留学生学习汉语的内在机制(如双语心理词典及通达机制)的基础上来进行教学,有助于更好地指导词汇教学,并提高教学效率。目前,来华学习汉语的留学生日益增多,越南留学生也占有相当的比例,越南语―汉语双语者心理词典的表征结构很值得研究。

心理词典是心理语言学和认知科学中的一个重要概念。大多数心理语言学家认为心理词典中存在着形、音、义三个方面,它们相互之间存在联系。对于心理词典的表征模型,目前还没有比较一致的观点,主要有以下几种理论模型。

概念中介模型即L1和L2在词汇水平没有直接的联系,但是两个词汇系统都和共同的概念表征相联结,即L2词汇DC(共享的概念)DL1(词汇)。词汇连接型即L1和L2在词汇水平上有直接的联系,第二语言词汇和概念的联结则要通过第一语言词汇,即L2DL1DC。研究者们认为双语者的词汇表征方式随着外语水平的提高而有所变化,呈发展趋势:低水平双语学习者心理词汇的表征以词汇连接为主;高水平双语者心理词汇以概念中介为主;中等水平的双语者则处于两者之间,构成一个连续体。

非对称模型假设在双语者的记忆中词汇和概念联系都是动态的,但是这些联系的程度随着L2的熟练程度而变化,体现了动态发展的特性。从L2到L1方向的词汇联系比L1到L2方向的词汇联系强,而L1的词汇和概念间的联系强于L2词汇和概念间的联系。在L2学习的早期阶段,L2单词主要通过与L1的词汇联系通达概念系统。当个体的L2变得更加熟练,直接的概念联系也被获得。然而,在概念联系获得后,词汇联系并没有消失,它们仍然保留作为可行的联系。这一模型综合了单词联想模型和概念中介模型的内容,强调两种语言间词汇联系的不对称性,以及两种语言中词汇与概念联系强度的不对称性。

2.实验

2.1启动实验范式。

跨语言的启动实验是目前最为双语研究者广泛采用的一种方法。双语间的启动和激活研究是第二语言学习者双语表征和提取过程的一个重要方面。在典型的启动实验中,首先给被试短暂呈现一个词语(启动词),然后呈现另一个词语(目标词),要求被试对目标词进行认知加工。例如:先呈现“护士”再呈现“医生”,比先呈现“面包”再呈现“医生”,被试判断的反应时要短。人们把这种效应称为启动效应。在跨语言的启动实验中,启动词和目标词分别用不同的语言呈现,但两者具有语义相关性,如“nurse”启动“医生”;还可用目标词的翻译词直接启动目标词,如“nurse”启动“护士”。

2.2实验设计与被试。

本实验采用跨语言的语义启动和翻译启动的研究方法,采用2(汉语水平)×2(语言方向)×4(启动类型)的三因素混合设计,汉语水平为被试间因素,分为两个水平(高级水平和中级水平);语言方向为被试内因素,分为两个水平(L1―L2和L2―L1);启动类型为被试内因素,分为四个水平(翻译关系、非翻译关系、语义相关、语义无关)。

这项实验的被试为30名越南留学生,他们的母语为越南语,中级水平和高级水平各15名,均来自同一所大学。他们都是经过一年的语言学习之后进入到本科专业学习的学生。中级水平的学生为在读的大一学生,在中国学习生活时间为1年半到2年;高级水平的留学生在中国生活的时间为4―5年。所有被试均为右利手,视力或矫正视力正常。

2.3实验材料与实验步骤。

实验材料分为实验项目和填充项目两种,实验项目为144对词对,包括两个语言方向(L1―L2,L2―L1),在每个版本中,我们将看到18对有语义联系的词对,18对完全没有语义联系的词对,18对翻译关系的词对,18对非翻译关系的词对。填充材料为 90对目标刺激是假词的词对,也包括L1―L2和L2―L1语言两个方向各45对词组。词对的语义联系由来自同一所大学的中国大学生在七点量表上评定的。

实验程序使用DMDX编写。实验以个别测试的方式在一间安静的房间进行。实验开始时,在计算机屏幕中央呈现注视点“+”500ms,接着呈现刺激材料300ms,然后呈现目标刺激700ms,要求被试尽可能又准又快地判断计算机屏幕上出现的是真字还是假字,如果“是”,按“j”键;如果“不是”,按“f”键。被试反应后间隔500ms,开始下一次实验。被试必须在目标刺激出现后2000ms内作出反应,否则记为错误反应。正式开始前有十次练习。

2.4实验结果。

实验数据用统计软件SPSS.13.0进行分析。实验数据剔除了平均数三个标准差之外的数据,这样的数据不超过总数据的5%。实验结果为12名高级水平和13名中级水平被试的数据。

表1 两组被试各种启动关系条件下的平均反应时(毫秒)和正确率(%)

各组被试在各种启动条件下的平均反应时间表见表1。将两组被试正确反应的反应时数据进行2(水平)×2(语言方向)×4(启动类型)方差分析显示,方向的主效应显著,F(1,23)=12.236,p=0.002,结合表2的反应时结果,我们发现被试在L2―L1方向的反应比L1―L2语言方向的加工要快;启动类型的主效应非常显著,F(3,69)=20.021,p=0.000,表明启动词和目标词的关系会对被试反应目标词产生显著的影响。被试汉语水平的主效应不显著,F(1,23)=0.232,p=0.634;语言方向和启动关系的交互作用显著,F(3,69)=8.203,p=0.000。语言方向和被试汉语水平之间的交互作用、启动类型和被试汉语水平之间的交互作用均不显著(ps>0.1)。语言方向、启动类型和被试汉语水平三者之间的交互作用不显著(p>0.1)。

表2 两组被试的跨语言翻译启动效应和语义启动效应(毫秒)

注:*表示p<0.05

为进一步检验实验结果,我们对被试在两个方向的各组启动条件下的反应时进行了事后比较(见表2)。对中级水平留学生两个方向各组关系的反应时进行配对的t检验,从被试分析看, L1―L2方向的翻译关系和非翻译关系之间的差异显著,t(12)=-3.178,p=0.008,L2―L1方向的翻译关系和非翻译关系之间的差异也显著,t(12) =-2.637, p=0.022;L1―L2方向语义相关和语义无关词对之间的差异也显著,t(12)=-3.370,p=0.006, 而L2―L1方向语义相关和语义无关词对之间的差异却不显著,t(12)=-1.217, p=0.247。总的来说,我们发现中级水平越南留学生在L1―L2和L2―L1方向都产生了显著的跨语言翻译启动效应,在L1―L2方向上也产生了显著的语义启动效应,但是在L2―L1方向上没有产生跨语言语义启动效应。该结果表明,中级水平的越南留学生第一语言和第二语言在词汇水平有联结。有跨语言的语义启动,说明第一语言和第二语言的概念是共享的。进一步比较翻译启动在两个不同方向上的效应量,以考察L1―L2和L2―L1两个方向之间联结的强弱。配对T检验发现L1―L2和L2―L1两个方向上翻译启动量之间的差异不显著,t(12)=0.07,p>0.1,说明中级水平留学生在两个方向的联结的强度相当。

对高级水平的被试做同样的分析,从被试分析看,实验处理的主效应显著,L1―L2方向的翻译关系和非翻译关系t(11)=-3.083, p=0.010;L2―L1方向的翻译关系和非翻译关系t(11)=-2.414,p=0.034,L1―L2方向语义相关和语义无关,t(11)=-3.635,p=0.004,L2―L1方向语义相关和语义无关,t(11)=-2.227,p=0.044。结果表明,高级越南留学生在L1―L2和L2―L1两个方向都产生了显著的跨语言翻译启动效应和语义启动效应。这表明,高级水平的越南留学生第一语言和第二语言在词汇水平和概念水平都有联结。

比较翻译启动和语义启动的效应量在两个语言方向上是否存在差异,结果发现,翻译启动量在两个语言方向上的差异不显著,t(11)=0.227,p>0.1;语义启动在两个语言方向上的差异不显著,t(11)=1.805,p=0.098。

综合以上实验结果,我们认为越南留学生双语词典表征模型符合修正层级模型,当启动刺激和目标刺激是翻译关系和语义关系时,产生了跨语言的启动效应,说明汉语和越南语共享一个概念系统。中级水平被试中,有L1―L2方向上的跨语言语义启动效应,但是相反方向的却没有,这说明第二语言词汇和概念之间是有联系的,但这种联系的强度较弱,不足以启动目标词。而高级水平被试在两个方向均有语义启动效应,说明随着汉语水平的提高,第二语言词汇和概念之间的联系已经建立起来,且已经接近于第一语言和概念之间的联系。通过对被试的调查,我们发现,本实验中高级水平的留学生在中国生活的时间都达到了四五年,他们能够熟练使用汉语进行口头交流与阅读,汉语词汇和概念之间的联结强度已经接近于越南语词汇和概念之间的联结。

3.越南留学生汉语词汇教学策略

从实验中我们得知,非熟练的越南语―汉语双语者词汇水平和概念的连接较弱,还依靠母语通达到语义,随着汉语水平的提高,才逐渐形成目的语思维的能力。

3.1重视越南语与汉语的对比研究。

在语言习得过程中,母语起着非常重要的作用。如何有效地促进“正迁移”,避免“负迁移”是外语教师长期研究的课题。通过实验我们也可以发现,初级水平的越南留学生是通过母语通达到语义的,因而在二语习得过程中不能一味地强调母语的消极作用,为有效地进行目的语阅读应建立足够的词汇量。在初级阶段的词汇教学中,要充分重视越南语和汉语的对比研究,加强对等词的研究。不同的两种语言之间,除了专有名词和单义的术语外,一般情况下都不存在简单的对应关系,而是一种复杂的交叉关系。因此在词汇教学过程中,我们首先应具有对比分析意识,对二语词汇进行适度甄别,适当地对词义从各个角度进行各个侧面的对比,以大量的事实向学生证明越汉词义不是一对一的关系;其次,应重视词汇的语境化输入以激发学习者的积极认知。

3.2建立汉语词汇网络系统,避免母语的中介作用。

通过实验,我们发现要想习得词汇,建立二语心理词汇网络,就要强化目的语与母语词汇与概念的连接,达到与母语相似的程度。教师应尽力帮助学生准确理解词义,多建立词汇的汉语联系,而不是越汉联系,以便更有效地习得汉语这种语言。马玉汴(2004)提出了放射状词汇教学法,强调建立词音、词形、词义等一环扣一环的心理词汇网络,从而提高学生的词汇量,进而牢固地掌握词义。

学习者如想真正“记住”词汇,必须对目的语进行大量的输入和激活。相关的研究表明精细加工和反复练习在词汇获得过程中的重要作用。精细加工指的是针对一个词条做最大数量的相关连接;该词汇项目应该放在不同的上下文中进行研究,而且学习者应该明确注意到与该词汇项目相关的所有特征,包括从该词的正确拼法和韵律到其句法和句意特征,与其他词汇之间的联系与区别,等等。当词库被视作一个所有词汇项目都可以在内产生相互连接的网络时,精细加工,或者说新信息与学习者已有的旧知识之间的相互连接,便能够得到最好的阐释。同时,通过反复练习会提高词汇项目的激活程度。激活程度会随着时间的推移而下降。假如一个词汇项目在其激活程度即将下降之前又被重新激活,那么这次的重新激活便显得更加有效,从而达到自动化的程度。当反复练习以逐渐增加的时间间隔发生时,人们也就获得了最理想的学习效果。

参考文献:

[1]郭桃梅,彭聃龄.初中和高中生英语语义通达机制的比较.心理发展与教育,2003,(2).

[2]李慧惠.蒙古族双语者双语表征的语义启动实验研究.内蒙古师范大学,2007.

[3]孟凌.日本留学生心理词典表征结构的实验研究.北京语言大学,2001.

[4]王d,汪安圣.认知心理学.北京:北京大学出版社,1992.

[5]马玉汴.放射状词汇教学法与留学生中文心理词典的建构.云南师范大学学报,2004.9,VOL2,(5).

[6]袁扬华,张明.心理词典研究对外语词汇教学的启示.安徽教育学院学报,2007.1,VOL25,(1).

第8篇:统计学概念汇总范文

网络信息检索已成为我们获取信息主要手段。根据CNNIC的统计数据[1]:目前中国用户上网的最主要目的中,信息获取以42.3%位居榜首;有98.7%的人表示通过互联网来获取信息,其中有71.9%的人是通过搜索引擎来查找相关网站的。然而网络信息检索面临两个亟待解决的关键问题:

(1)搜索的结果相关度低,冗余信息太多;

(2)搜索引擎无法对常识性问题给予回答,智能化水平低。

出现上述问题的原因在于目前检索技术主要依赖于编码技术,通过分类模式来描述给定的信息;通过基于字符串匹配的全文检索技术,来搜索用户提交的关键词。由于编码描述只能反映出部分语义,因此不能保证语义的匹配;检索过程是把用户的查询关键词与全文中的每一个词进行比较,而不考虑查询请求与文档语义上的匹配。针对上述两个关键问题,本文运用本体论的相关知识,提出基于本体构建的语义搜索引擎模型。该模型能够根据用户的查询关键字或者询问问题,进行基于知识的推理,从而提高检索结果的相关度,并且实现一定水平的语义检索。

2本体论

2.1本体的概念

本体这个术语来自于哲学,根据韦氏词典的解释,本体是形而上学的一个分支。目前本体在人工智能领域得到广泛研究和应用,但尚未形成统一的定义,最广为流传的定义有[2]:

定义1:本体是对共享概念模型的形式化明确说明。它有几个要点:

概念模型(conceptualization):指通过抽象客观世界中一些现象(Phenomenon)的相关概念而得到的模型,其表示的含义独立于具体的环境状态;

明确(explicit):指所使用的概念及使用这些概念的约束都有明确的定义;

形式化(formal):指Ontology是计算机可读的;

共享(share):指Ontology中体现的是共同认可的知识,反映的是相关领域中公认的概念集,它所针对的是团体而不是个体。

简单地说,本体给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的确定词汇外延的有关规则的定义;其目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定领域内通用的词汇,并给出这些词汇(术语)和词汇之间相互关系的明确定义。

定义2:本体论是关于词汇或概念的理论,这些诃汇和概念用于构建人工智能系统。该定义认为,本体实际上是一种表示性的词汇,这种词汇可以应用于特定领域。比如电子设备领域的本体,它包含一些描述基本概念的词汇——晶体管,运算放大器,电压等;也包含这些基本词汇间的关系——运算放大器是电子设备的一种,而晶体管是运算放大器的组件。一般来说,识别这种词汇和潜在的概念需要仔细分析领域内存在的各种对象和关系。这一定义描述的本体建设方法与面向对象方法有一定的共通之处。

定义3:本体论是用来定义某一领域的知识主体。该定义认为,本体是描述某个领域的知识,它不仅仅是简单的词汇表,而是整个上层知识库(包括用于描述这个知识库的词汇)。

综上所述,本体是某个领域内(可以是特定专业的,也可以是宽泛范畴的)不同主体(人、、机器等)之间进行交流(对话、互操作、共享等)的一种语义基础,即由本体提供定义明确的词汇表,描述概念和概念之间的关系,作为使用者之间达成的共识。

2.2本体的作用

本体的作用可归结为通讯(communication)、互操作(interoperability)和系统工程(systems engineering)。

(1)所谓通讯是指本体为人与人之间或组织与组织之间的通讯提供共同的词汇,即交流的基础。

(2)互操作说明本体建立了在不同的建模方法、范式、语言和软件工具之间进行翻译和映射的机制,以实现不同系统之间集成。

(3)系统工程:本体分析能够为系统工程提供以下方面的好处:

重用(reusability):本体是领域内的重要实体、属性、过程及其相互关系形式化描述的基础。这种形式化描述可成为软件系统中可重用和共享的组件(component)。

知识获取(knowledge acquisition):当构造基于知识的系统时,用已有的本体作为起点和基础来指导知识的获取,可以提高其速度和可靠性。

可靠性(reliability):由于本体的描述是形式化的,形式化的表达使得自动的一致性检查成为可能,从而提高了软件系统的可靠性。

规范描述(specification):本体分析有助于确定系统(如知识库)的需求和规范。

3基于本体语义搜索引擎

3.1基于本体搜索引擎的设计思想

本体提供了人机交流的机制,使得机器可以理解语义,从而为搜索引擎提高效率奠定了基础。

基于本体的搜索引擎的基本设计思想:

(1)在领域专家的帮助下,建立相关领域的本体(Ontology);

(2)收集信息源中的数据,并参照已建立的Ontology,把收集来的数据按规定的格式存储在元数据库(关系数据库、知识库等)中:

(3)对用户检索界面获取的查询请求,查询转换器按照Ontology把查洵请求转换成规定的格式,在Ontology的帮助下从元数据库中匹配出符合条件的数据集合;

(4)检索的结果经过定制处理后,返回给用户。

3.2知识库

实现基于本体的语义搜索引擎,建立知识库是必需的。知识库是语义搜索引擎进行推理和知识积累的基础和关键,而Ontology则是知识库的基础。一般来说,本体提供一组术语和概念来描述某个领域,知识库则使用这些术语来表达该领域的事实。例如医药本体可能包含“白血病”、“皮肤病”等术语的定义,但它不会包含具体某一病人的诊断结果,而这正是知识库所要表达的内容。比如张三患有皮肤病、李四患有皮肤病和白血病、王五患有白血病,其中的皮肤病、白血病就是本体。而各个病症的实例(张三、李四、王五)及其病症描述就是知识库的内容。

本体和知识库的关系有几个要点:

Ontology为知识库的建立提供一个基本的结构;

Ontology提供一套概念和术语来描述某一领域,并且获取该领域的本质的概念结构;

知识库就运用这些术语去表达现实或者虚拟世界中的正确知识。

因此,建设一个知识库的第一步就是对该领域进行有效的Ontology分析。

3.3构造本体

本体的构造是整个基于Ontology的信息检索系统的底层基石,决定着系统的性能、通用程度以及系统运行的质量。如何正确、有效、合乎逻辑的建立本体是这个系统建立的关键。

(1)本体的构造准则

对同一领域,同一事物,不同人往往会建立不同的本体。由于本体应该是规范化的描述,因此遵循统一的构造准则是必要的。目前最为常用的是Gruber提出的指导本体构造的5个准则,[3]即:

清晰(Clarity):本体必须有效的说明所定义术语的意思。定义应该是客观的,与背景独立的。当定义可以用逻辑公理表达时,它应该是形式化的。定义应该尽可能的完整。所有定义应该用自然语言加以说明。

一致(Coherence):本体应该是一致的,也就是说,它应该支持与其定义相一致的推理。它所定义的公理以及用自然语言进行说明的文档都应该具有一致性。

可扩展性(Extendibility):本体应该为可预料到的任务提供概念基础。它应该可以支持在已有的概念基础上定义新的术语,以满足特殊的需求,而无须修改已有的概念定义。

编码偏好程度最小(Minimal encoding bias):概念的描述不应该依赖于某一种特殊的符号层的表示方法。因为实际的系统可能采用不同的知识表示方法。

本体约定最小(Minimal ontological commitment):本体约定应该最小,只要能够满足特定的知识共享需求即可。这可以通过定义约束最弱的公理以及只定义通讯所需的词汇来保证。

(2)本体的表示

目前有两种本体表示方法应用比较广泛,一是传统的四元素表示方法、二是较新的六元组表示法。前者在世界范围内得到了比较高的认同,但是形式过于灵活,不易掌握。后者因为定义规范,可操作性强,得到了广大国内研究者的欢迎。

四元素表示方法

四元素表示方法的基本思想是;一个本体中的四个主要元素是:概念(concepts)、关系(relations)、实例(instances)和公理(axioms)。

概念表示某个领域中一类实体或事物的集合。通常概念可以分成两大类,一类是简单概念(primitive concepts),另一类是详细概念(defined concepts)。简单概念是那些只具备必要条件(即属性)的类成员(注:英文原文:Primitive concepts are those which only have necessary conditions(in terms of their properties)for membership of the class.)。详细概念是指对类成员的描述既充分又必要(注:英文原文:Defined concepts are those whose description is both necessary and sufficient for a thing to be a member of the class.)。例如:“正方形是四个角都是直角的四边形”就是一个简单概念。而“正方形是四个角都是直角的四个边等长的四边形”就是一个详细概念,因为四个边等长是正方形的充分且必要条件。

关系描述概念和概念属性的交互。

实例是概念表示的具体的事物,如对于大学这个概念,山东大学就是一个实例。严格的说,一个本体不应该包括任何实例,因为它被假设为一个具体领域的概念化。一个本体与相关的实例的组合就是我们如今所称呼的知识库(knowledge base)。

公理是用来限制类和实例的取值范围,公理中包括许多具体的规则和约束。

六元组表示法

这种方法的基本思想就是用一个六元组来表示一个本体。

An Ontology={C,AC,R,AR,H,X}

其中C表示概念的集合。AC表示多个属性集合组成的集合,其中每个属性集合对应于一个概念。R是一个关系集合。AR是由多个属性集合组成的集合,其中每个属性集合对应于R中的一个关系。H表示概念之间的层次结构关系,X表示公理集合。

为了深入描述本体的表示方法,以下列出了一个家庭本体描述实例。

Family_Ontology={Cfamily,ACfamily,R family,ARfamily,H family,X family}where

Cfamily={father,mother,children}

ACfamily={ACfamily(father),ACfamily(mother),ACfamily(children)}

ACfamily(father)={name,age,job,salary,……}

ACfamily(mother)={name,age,job,salary,……}

ACfamily(children)={name,age,sex,……}

R family={TakeCareOf(mother,mother,children),

Educate(father,mother,children),

Help(children,mother),……}

ARfamily={ARfamily(TakeCareOf),ARfamily(Educate),ARfamily(Help),……}

ARfamily(TakeCareOf)={feed,clothing,seeDoctor,……}

ARfamily(Educate)={teach,exercise,……}

……

(3)本体的构造的生命周期

了解了本体建设的准则和方法论之后,下一步就是要着手建立本体。而建立的过程可以用生命周期的概念来描述。Uschold & Gruninger提出了一个本体构造的方法学框架[4](图1),框架包括以下组成部分:

首先要明确本体使用的目的和范围,然后依次构造本体。构造本体过程可以分为三个阶段:

本体捕获就是确定关键的概念和关系,给出精确定义,并确定其它相关的术语;本体编码即选择合适的表示语言表达概念和术语;已有本体的集成是对已有本体的重用和修改。这个阶段也是一个循环往复的迭代过程。

最后是评估阶段,要根据需求描述、能力问题(competency question)等对本体以及软件环境、相关文档进行评价。

3.4基于本体的语义搜索引擎模型简介(OntoSSE,ontology-based Semantic Search Engine)

OntoSSE是基于本体的搜索引擎,它能够实现语义搜索、知识检索和一定的推理功能。本模型假设搜索引擎存在的环境是web网页,这些网页并未自动含有语义标记。

此系统也应具备搜索引擎的各种基本的功能,比如网页的遍历和获取、索引的建立、页面查找算法等,都可以参考目前流行的搜索引擎的结构和实现过程。

OntoSSE的重要之处是信息库和知识库的交流。知识库是实现智能搜索的核心,它如同人的大脑,其增长也需要一种自然的循环。知识库的丰富也决定着检索能力和Question-Answer能力的高低。信息库是知识库存在和发展的空间,知识库就是对信息库的判断、提取、分析和概括。智能搜索引擎就是通过知识库把用户的问题提高到知识层面,然后利用这个知识检索信息库。[5]二者的有机结合离不开语义分析和知识管理。因此,Ontology作为语义分析和知识共享和重用的重要基础,与知识库、信息库一起构成OntoSSE的三大支柱。

展示了基于本体的语义搜索引擎OntoSSE的系统结构及其工作流程。OntoSSE模型的工作原理和检索步骤可以概括如下:

(1)搜索引擎通过自动网页采集器(web spider)来抓取网页,参照特定词表将网页信息分类建立索引,加入索引库中。

OntoSSE的体系结构及其工作流

(2)由人工、自动或者半自动的方式,建立领域或者通用的本体。(3)参照本体,使用本体描述语言(DAML、RDF)对文档进行标注。(4)标注的文档(RDF Triple)相当于一个本体的实例,它被存放在知识库中。(5)用户以自然语言输入查询请求,这种请求可能是关键字,或者一个问题。(6)查询过滤器(分析器)对用户的查询请求进行语义分析,提取出相关属性的值。(7)检索结合RDF Triple中体现的类和关系信息以及由查询过滤器提交的属性值,进行逻辑推理,生成查询实例。(8)查询实例被传往信息数据库,在不同目录中查找,并将结果处理后返回给用户。例如,如果我们要检索“微软总裁是谁”,将这个问题输入模型以后,查询过滤器根据分词技术,进行语义理解,分析出该句子的语义实际表示了“有某个名为‘职务’的属性其值是‘微软总裁’”。而通过本体和知识库,系统通过推理,可以知道在名为“人”的类中有名为“职务”的属性,这样,在进行语义推理时,就生成一个人的类的实例,其中有属性“职务=微软总裁”,而通过知识库得知,这个实例的名字属性为“Bill Gate”。这时,我们就获得了“Bill Gate”的答案。最后,我们还可以从信息库和知识库中检索与比尔盖茨相关的各种潜在信息。

可见OntoSSE模型可实现本体对搜索引擎三个方面的改进:提高结果相关度、语义推理功能和知识检索。

第9篇:统计学概念汇总范文

关键词:双语者;语义表征;词汇表征;概念表征

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2015)19-0082-02

一、引言

随着经济和社会的发展,我国学习和掌握英语的人越来越多,国内对汉英双语者的研究也逐渐增多,但对于汉族人学习少数民族语言的研究却很少。本研究着力研究汉族学生学习哈萨克语的语义表征。语义表征可以是词语的表征、句子的表征和课文的表征,它是以记忆表征的形式出现的,由于语言具有不同的层次,相应地语义表征也具有不同的层次。心理语言学家认为词汇存在词的语音、字形、意义三方面的信息。词汇表征是指语言在词汇水平的单词信息特点,那么词汇表征就是指单词的词形信息和语音信息的存储形式;概念表征则是指词语的语义概念信息的存储方式。

二、相关理论和研究

在前人的基础上,语义表征的研究由语言的存储方式到语义的通达机制,由浅入深,层层深入。首先,进入到研究者眼中的问题是:两种语言材料所负载的信息是在双语者的一个语义系统中存储,还是在两个语义系统中存储,最终未形成统一的结论。其次,经过对以前的实验结果进行验证可知,得到双语者两种语言的概念表征是共享的,词汇表征是独立的。最后,研究者探讨第二语言的词汇的语义是如何提取的,与第一语言的词汇是如何联系的。因为随着双语语义表征研究的深入,逐渐形成了两种对立的理论模型,即共同存储模型和独立存储模型。共同存储理论认为双语者的语言信息是存储在同一语义系统内,即以一种共同的、超语言的、抽象的概念形式存储在大脑中,而不是依赖于获取这种信息的语言通道。Meyer和Ruddy发现,像水果―苹果这样语义相近的词,不管先前呈现的词与后来呈现的是否是同一种语言,先前呈现的词对后来呈现的词均有促进作用。独立存储理论则认为双语者通过两个语言通道获取信息,分别存储在大脑中两个相对应的语义表征系统内―语言1系统和语言2系统。该理论得到了Kirsner和Kolers(1963)等人的支持。前者对不同语言进行词汇判断任务,均出现了启动效应。

我国的学者也对双语的现象做了不少研究。热比古丽、闻素霞等人以维吾尔族大学生为被试运用跨语言启动范式条件下的真假词汇判断任务进行研究,试验结果为:被试的第三语言的语义概念表征是同第一语言的概念表征共同存储的。他们的实验结果与大多数的研究得到的结果一致,双语者词语的概念表征是共享的。张文君、白乙拉运用真假词判断任务和属性判断任务,对语篇、语句、词汇三个不同层次的语义表征设计的相应实验来考察蒙―英双语者的两种语言的存储方式。结果同样支持了概念的共同存储模型。

早期国内的研究者分别对汉―英双语者、英―汉双语者、维―汉双语者、汉―维双语者、蒙―汉双语者、蒙―日双语者、汉―俄双语者进行了研究,了解到大部分实验研究支持词汇表征是独立存储的,概念表征是共同存储的,即支持共同存储模型。

三、研究方法

1.被试。新疆大学语言系哈语专业大学生27名,所有被试均裸眼或矫正视力正常,母语为汉语,哈语获得年龄为18~20岁(从大学一年级开始学习哈语)。学习哈语时间为2年。将27名汉族大学生学号随机化处理,分成2组,第一组为同语言组,另一组为跨语言组。同语言组被试学习阶段和测验阶段均接受汉语任务,而跨语言组学习阶段接受汉语任务,跨语言阶段接受哈语任务。

2.实验材料。实验一的材料由40对汉哈真假字组成。其中20对汉哈真字,20对汉哈假字。40对汉哈真假字随机分为2组,一组为正式材料,另一组为填充材料。所有的字只出现一次,并且只属于正式材料或者填充材料中的一个。学习阶段同语言组和跨语言组材料不同,同语言组呈现10个真汉字,10个假汉字,跨语言组呈现20个与真汉字对应的哈语真字,20个哈语假字。测验阶段同语言组与跨语言组材料相同,20个真汉字与20个假汉字全部出现,其中有一半汉语材料学习过,一半未学习过。填充词在实验中不重复出现。填充材料的结果不计入统计数据中。实验二的实验材料由40对汉哈翻译对等词组成,其中20对生物词,20对非生物词,其余同实验一。

3.实验设计。实验一和实验二均是2(语言变量:同语言,跨语言)×2(学习状况:学习过,未学习过)混合设计。语言变量是被试间变量,学习状况是被试内变量。实验一和实验二均有两个阶段――学习阶段和测验阶段。测验阶段正式材料的反应时为因变量的指标。

4.实验仪器。实验在计算机上进行,实验程序采用Inquisit编制。

5.实验程序。在正实验前先让被试做一个练习,练习成绩不计入实验结果。在练习阶段指导让被试左手食指放在“P”键上,将右手食指放在“Q”键上,以便更快地适应按键,要求被试仔细阅读屏幕呈现的单词,尽可能快地做按键反应。计算机会自动记录他们的反应时间,用计算机给被试呈现单词。首先呈现实验指导语,再呈现一串“*”号,持续500ms。紧接着呈现汉语单字或哈语单词,实验一的任务判断是汉语/哈语词是否为真字,是按“P”键,否按“Q”键;学习阶段和测验阶段间隔1分钟。对于跨语言组的被试,他们不知道学习阶段和测验阶段的语言会发生变化,只是在测验阶段开始时提醒被试测验阶段语言会发生变化。所有的实验一般7分钟可以做完。实验二与实验一不同的是,要求被试判断呈现的词是否为生物词,“Q”键代表是,“P”键代表否。其余与实验一样。

四、结果和分析

实验结束后对4种设计下,统计被试测验阶段正式材料回答的反应时,第一步,筛选出回答正确率低于90%的被试,删除了此类被试的数据;紧接着继续筛选数据,将反应时在2.5个标准差以上的数据进行剔除。将数据录入SPSS18.0,进行二因素方差分析,实验结果见表1。

在实验一中,用SPSS18.O对数据进行二因素方差分析处理,实验结果:学习状况主效应显著,F(1,11)=17.87,p=0.0015,语言条件效应不显著F(1,11)=16.71,p=0.234,交互作用不显著F(1,1)=4.909,p=0.038。实验结果说明在同语言条件下,学习状况显著。p=0.017,说明在同语言的情况下出现了长时启动效应,在跨语言的情况下,未出现长时重复启动效应,即没有出现跨语言的长时重复启动效应。在实验二中,对反应时进行二因素的方差分析,结果发现,交互效应不显著F(1,1)=2.37,p=0.454,学习状况的主效应显著F(1,11)=13.15,p=0.017,语言条件不显著F(1,11)=17.12,p=0.056。继续简单效应检验,p=0.001结果再次证明学习效应显著。发现同语言单词的反应时与跨语言单词的反应时无显著差异,p=0.838。说明在同语言和跨语言的情况下,都出现了长时重复启动效应,即出现了跨语言的长时重复启动效应。

五、综合讨论

首先在实验一中,实验结果表明:(1)在同语言条件下,被试在测验阶段的反应时显著快于学习阶段。(2)在跨语言条件下,被试在测验阶段的反应时与学习阶段无明显差异。学习阶段的哈语单词并未对后来的汉语翻译对等词起到促进作用。实验一说明:非熟练汉―哈双语者哈萨克语与汉语的词汇表征是独立储存的。这与国内研究莫雷、李利、闻素霞的研究结果一致。其次在实验二中,实验结果表明:(1)在同语言条件下,被试在测验阶段的反应时显著快于学习阶段。(2)在跨语言条件下,该组被试在测验阶段的反应时显著快于学习阶段,即说明先前学习过的哈语单词对后来学习的汉语翻译对等词有促进作用,该实验验证了非熟练汉―哈双语者两种语言的概念表征是共存的,这与闻素霞、热比古丽的研究结果一致。

总之,非熟练汉―哈双语者的哈萨克语的记忆表征中,共同存储的是概念表征,独立存储的是词汇表征,实验结果与大多数研究结果一致:非熟练双语者两种语言的词汇表征是独立存储的、概念表征是共同存储的观点。

参考文献:

[1]吕纪增.双语表征研究视角综述[J].河南教育学院学报,2009,(6):88.