公务员期刊网 论文中心 正文

联结主义理论下的儿童语言结构习得

联结主义理论下的儿童语言结构习得

摘要:以神经生物机制为基础提出的联结主义理论自问世以来,极大推动了认知科学,心理学,语言学等研究领域的迅速发展。本文首先介绍了联结主义模型的基本结构及其特性。其次结合联结主义理论基本观点,从认知心理学角度对儿童语言结构习得的认知机制及发展模式进行了考察,旨在为儿童语言习得研究提供联结主义新视角与新思路。

关键词:联结主义理论;儿童语言习得;认知机制;发展模式

自20世纪50年代Chomsky的普遍语法理论诞生以来,语言研究领域发生了根本性变革,其学科内容从分析语言结构逐渐转向探讨语言机制。Chomsky认为人类语言具有普遍性,先天性及自治性三大基本属性。语言普遍性即为各族语言虽看起来千差万别,但本质上却拥有共通的语法机制。语言先天性则指,共通的语法操作系统深植于我们的基因当中,是人类与生俱来的本能。人脑正是通过这样一套内置的语法操作系统,对来自外界环境的语言刺激进行形式化加工,从而组织并获得语言。语言能力的自治性即认为,语言能力是独立于感知觉,记忆等认知功能之外,能够实现自给自足的高级认知模块。这种语言自治观是当时认知心理学领域中占主导地位的模块理论的具体表现。此外,乔氏语言观与同时代,在认知科学领域兴起的“符号主义观”不谋而合。二者都将人脑视为依照固有形式规则进行操作的符号加工系统。也就是说,只需找出人脑这部“图灵机”的形式规则,就可以运用计算机对其认知模式进行模拟,这也是早期人工智能的基本理念。但随着认知科学研究领域的飞速发展,学界对人脑结构与认知机制有了更为深入的认识,开始意识到任何心智功能均源于生物神经活动这一物质基础。与此同时,符号主义观与模块化理论对人脑信息加工与心智解读的局限性也逐渐显现。二者最大弊端在于,其根本观点与生理学上的神经活动规律相悖。大脑是由百上千亿个神经元构建而成的神经网络系统。若任何复杂的认知活动都是生物神经元之间交互联结衍生而来,那么符号主义的序列加工以及模块理论的自治加工观念,自然不符合神经系统的工作模式及逻辑规则。因此,基于生物神经机制的联结主义理论应运而生,并在信息加工,认知科学,心理学甚至是语言学领域掀起了联结主义新变革。本文将结合联结主义理论,从认知心理学角度探讨儿童语言习得背后的认知机制。主要聚焦于语言结构习得过程中频繁出现的“过度规则化”及“U型发展现象”,尝试借鉴联结主义模型解析儿童语言习得的基本发展模式。

一.联结主义理论模型及其特性

Rumelhart&McClelland(1981)提出的”交互激活”模型常被视为联结主义的初期理论。该模型旨在探讨语言加工过程,为语言认知研究中的联结主义视角奠定了基础。交互激活模型认为,语言加工不仅是由形式到意义的自下而上的串行处理过程,也包含自上而下的监督反馈加工。交互激活理论为言语听辨过程中的词优越效应,以及视觉词汇识别过程中的语境效应提供了合理解释。但交互激活理论仅强调了模块间的交互作用,而针对模块内容表征问题仍采用一个节点单位表征一个概念的“方位表征模式”,并未从本质上突破模块观的藩篱。这也是后来神经网络模型中所认为的“局部神经网络”(QuinlanP.T.,1991)。这种局部神经网络虽能够解决知识表征模式问题,但对于解释学习机制,认知灵活性则存在较大局限。Rumelhart和McClelland等联结主义先驱们也认识到这一点,于1986年在“交互激活”模型基础上提出了“平行分布加工(ParallelDis-tributedProcessing:简称为PDP)”模型,加强了联结主义理论的解释效力,稳固了联结主义理论在认知科学领域的根基。PDP模型是基于生物神经元的功能特性模拟出形式神经元,从而构建人脑神经系统的人工模型。如图1所示,平行分布于网络中的每个节点都代表一个神经元。信息的传导加工通过各节点间的加权联结与交互激活而实现。各节点按照一定的操作周期接收数据信息,基于节点间联结权重计算激活量之后,再根据节点内的激活阈限值决定是否触发。也就是说,节点能否被激活是由其初始激活量和节点间联结权重等网络激活规则共同决定。而在网络加工数据过程中若某节点间的联结多次被激活,会使其联结权重增加,激活阈限降低。这种基于大量数据输入的联结模式的改变是网络自我学习的本质。习得的知识概念也是通过网络中节点间的相互联结进行表征,即为分布表征模式。此外,基于生物神经元的输入-转换-输出三大功能结构,PDP模型中区分了输入单元-内隐单元-输出单元三个层次。输入单元负责获取来自外界的数据信息,输出单元负责对信息进行反应传导。内隐单元则不与外界刺激直接相连,基于规则对来自输入单元的信息进行整合转换,再将其映射至输出单元。同时Rumelhart&McClelland(1986)等指出,在网络学习的初期阶段,信息输入量并不足以激活内隐单元,因此信息加工是由输入单元直达输出单元的简单映射加工。随着数据输入的增加,网络从各单元激活阈限与联结权重的变化中提取特征发现规律,最后负责整合信息的内隐单元被激活。内隐单元的重要功能在于为网络学习提供指导信号,调节输入与输入间的关系。并在基于数据学习的过程中,不断反馈修正某些联结,实现网络的自我组织与自我适应。综上所述,与传统的符号主义,模块理论不同,以生物神经元的运作机制为基础的PDP模型具有神经学意义上的生态效度。PDP模型以模拟生物神经元的节点为基本单位,平行地处理输入信息,以网络中节点间的分布式联结表征信息。并在大量数据输入过程中实现提取特征,自我学习与自我组织,成功建构出符合人脑神经特性的人工智能模型。用网络节点的联结活动,联结强度,激活阈限等概念能够有效解释学习机制,认知灵活性等传统认知理论无法阐明的问题。因此,PDP模型一经提出,便受到学界瞩目。而作为高级认知功能的语言能力一直是认知科学领域的关注焦点与未解课题,联结主义理论也为语言研究提供了新视角。

二.儿童语言结构习得与联结主义理论

Rumelhart和McClelland等联结主义理论先驱在其著作中,反复提到语言习得机制问题,并强调联结主义理论在语言研究领域的可应用性。其中一个极具说服力的例证即为,PDP模型能够成功解释儿童语言习得过程中频繁出现的“过度规则化”及“U型发展现象”。一般情况下婴幼儿大约在迎来周岁生日之际,会发出表达实质意义的初语词汇。在接下来的语言发展中,儿童需要经历“独词句阶段”“双词句阶段”“多词句阶段”最终达到“复杂句阶段”。诸多儿童语言发展研究指出,大约从2岁左右开始,在许多婴幼儿的语言表达当中就能观察到带有形态规则的词汇表达。如:“dogs”,“boots”等名词复数表达,going,talking等动词屈折形态表达等(Pinker,1994)。Crystal(1986)基于对儿童语料分析,以名词复数形及动词进行时为代表,对名词-动词形态规则的习得过程进行了系统性考察。其研究结果表明,早在20个月左右婴幼儿的语言使用当中,就已出现带有名词复数及动词进行时等形态规则的表达,但形态规则的正确使用率并非是稳步提高,而是呈现出增长-回落-再增长-再回落的曲折发展特征。同时,Brown(1973)对儿童语言行为观察中也发现,儿童大约从30个月左右的开始已经能够基本准确地使用“s”,“ed”等具有语法功能的屈折语素。但从3岁左右开始,反而频繁出现“childs”,“goed”,“comed”等规则过度使用错误。类似的语法错误会持续几个月甚至几年,随着年龄增长逐渐减少最后消失。学者们将这种语法规则的泛化使用称为“过度规则化”现象,将形态结构的退行发展轨迹称为“U型发展现象”。此外,其他儿童语料分析研究还发现,以上两种现象并非只存在于儿童的词法规则习得当中,在语序规则以及语义概念结构的习得过程中也同样有所体现(Aitchison,1992;Plunkett,K&Marchman,V.,1993)。这些发现似乎表明,“过度规则化”及“U型发展现象”是普遍出现于儿童语言结构规则习得过程中的基本发展模式。以上观点已基本在学界内达成共识,但有关这一发展模式背后的认知机制仍存在广泛争议。以Chomsky为首的生成语法学派认为“过度规则化”现象正是语法规则系统具有普适性的典型体现。并以此强调语言习得归根结底即为,运用内置于人脑的语法系统,将抽象化的普遍语法进行类推的具体化过程。而Rumelhart&McClelland(1986)则对此提出了不同的解释,认为“U型发展现象”体现了语言发展过程的联结主义模式,并尝试用PDP模型成功模拟了儿童在动词过去时态习得过程中的“U型发展轨迹”。 如图2所示,Rumelhart&McClelland(1986)拟建的过去时态学习网络,由四个单元层次构成。第一层为接收动词词根的语音信息输入单元,第四层为完成过去时态变形后的语音输出单元。而第二层与第三层为表征过去时态变形规则,调节输入单元与输出单元联结关系的内隐单元。各单元层均由大量节点构成,按照某种函数关系进行权重联结。且节点间的联结权重会随着语料输入的不断累积自行发生改变。如上节所述,在语料输入量较少的初期学习阶段,负责表征规则整合信息的内隐单元尚未被激活。输入单元接收来自于外界的语料信息,基于权重函数映射至输出单元。因此,网络学习的初期阶段只是对数据的整体性粗略化加工,还尚未呈现任何规则化表征和分析性加工。随着语料输入的积累,输入单元与输出单元在不断映射联结的作用下,其节点间的联结权重逐渐变化,网络在此过程中发现并提取语料特征。当网络加工语料累积到一定数量后,内隐单元被激活,开始接收来自输入单元的信息并进行整合转换。网络从内隐单元的整合加工中自行获得规则(动词词干+“ed”表示过去发生的动作),并举一反三地推广到新信息的加工过程中。获得规则的网络在后续学习过程中,还可以通过统计分析两个内隐单元的联结权重,对输入语料中的规则与不规则动词进行区分,继而获得不规则动词的加工规律。最后在不断学习过程中对网络规则加以修正,逐步完善。此外,需要强调的是网络本身并没有预设任何规则,动词过去式的形态规则是基于对大量语料数据进行权重统计学习之后自行浮现而出的。这也是联结主义模型极为重要的“浮现特征”(Rumelhart&McClelland,1986;Bates,1984)。结合以上PDP模型再来探讨儿童语言结构习得过程的“U型发展现象”。儿童在学习语言规则的初级阶段,由于语料输入有限,负责表征规则整合信息的内隐单元尚未得到激活。也就是说这一阶段儿童还并未学习到语言规则,只是从整体上对外界输入的语料信息进行简单映射加工,因此错误现象较少,但加工效率较低。而随着语言经验的增加,语料输入量的上升,内隐单元得到激活,语言规则自然浮现。在内隐单元的规则指导下,类推学习现象开始出现,加工效率迅速提高,但同时也会出现“childs”“goed”之类的“过度规则化”现象。但基于神经生物特性建构而成的PDP模型,表现出了类似于人类智能的灵活性。PDP模型能够在对新信息进行类推学习的过程中,发现规则之外的特例现象,并通过网络联结对其进行特定表征,从而实现对原有的网络规则进行自我修正与自我适应。

三.结语

以神经系统的运作机制为基础的联结主义理论自问世以来便备受瞩目,为认知神经科学,心理学,语言学等研究领域提供了新思路。而儿童语言习得与认知发展一直是联结主义理论极为关注的研究问题之一。本文即从联结主义视角出发,尝试对儿童语言结构习得现象背后所隐藏的认知机制进行了探讨。如上所述,运用联结主义理论能够合理解释语言结构习得过程中普遍出现的“过度规则化”及“U型发展现象”。且这种联结主义模式不仅体现在语法规则的习得过程中,在语音,语义,语用等儿童语言发展的方方面面均有所体现。但目前基于联结主义理论对儿童的语音发展及语义概念习得的研究还比较少,还有待进一步探索。

作者:李敏 单位:大阪市立大学文学研究科博士毕业生