公务员期刊网 精选范文 以体验为话题的作文范文

以体验为话题的作文精选(九篇)

以体验为话题的作文

第1篇:以体验为话题的作文范文

“阅读教学是学生、教师、教科书编者、文本之间的多重对话,是思想碰撞和心灵交流的动态过程。”《普通高中语文课程标准(实验)》提出的基于解释学和建构主义的阅读“对话理论”,准确揭示了阅读活动中人与人之间、人与作品之间的精神联系:通过多重对话的开展,形成心灵交流,产生个性感悟,最终促进言语和精神的同构共生。

阅读者(学生)主观能动性的充分发挥,是阅读对话得以顺利开展的根本保证。围绕学生这一主体,一般情境下的阅读对话呈现三类状态:生本对话、师生对话和生生对话。

考场情境下的阅读活动,具有阅读对话的一般形态。生本对话,仍是阅读活动的中心环节。生本对话的有效建构,是决定考场阅读对话质量的主要因素。

文本的作者有自主表达自己思想、观点、态度和感情的权利,他对于自己的作品是有主体性的。对学生来说,在与作者文本对话的过程中,首先要把自己放在“倾听者”,而不是“评判者”的位置上,充分尊重文本作者的创作主体性,努力感受和理解作者所表之情、所达之意,进而扩大自己的情感视野,拓深自我的体验程度。

另一方面,作品的意义并非在文本诞生于作者手下时就已凝固,而是由读者逐步发掘出来的。阅读文本的过程,是一个双向交流的过程,即一个对话的过程。学生与文本对话的内容有很多,其中至少应包括搜集处理信息,把握基本语义,接受情感熏陶,获得思想启迪,享受审美乐趣等。

在平素的阅读教学中,学生应在教师引导下,“好读深思,心知其义”,面对文本能做到“使目非是无欲见也,使耳非是无欲闻也,使口非是无欲言也,使心非是无欲虑也”(《荀子·劝学篇》),进而将文本内涵、生活经验乃至人生意义等融为一体,产生独特而富有创造的感悟。

而在考场阅读文本时,只是一个人在战斗的考生,要最大限度地调动自身日积月累的知识积累、经验储备,灵活地、多角度地体悟文本中动态的、有灵性的东西,与作者、与作品中的人物进行心灵交汇、情感交流,体察他们的境遇,感受他们的思想。惟有如此,才是真正意义上的生本对话。

有异于平素的课堂教学,呈现为特殊形态的考场阅读对话更具有受制性的特点。它不仅不容许生生对话的存在,而且其师生对话也呈现特殊形态:参与对话的“师”,是测试中的命题者及测试后的阅卷者。

考场阅读对话模式得以有效开展的基础,是相关的教师参与者在充分尊重考生、尊重文本的基础上,人本地和科学地履行命题、阅卷等系列检测任务。

考场情境下的师生之间的阅读对话,对于考生而言,是单向的、非互动性的,因而注定是不平等、不自由的。命题者、阅卷者把握了对话的话语权,他们决定了对话的范畴,掌控着对话的方向。命题者所命制的试题及预设的试题答案,制约了考生的阅读取向与阅读策略。其后,阅卷者对试题的理解,尤其对试题答案的判读,如果稍一刻板机械,即制约着文本最大化价值的呈现。考生与文本之间的对话是否真实、顺利、有质量,除了自身与文本对话水准高低与策略当否的因素外,也取决于命题者、阅卷者与考生、与文本对话时能否具有尊重的态度。

作为命题者的教师应该明白,无论是在平素的课堂中,还是在应试的考场里,教师和学生都应当是一种互为主体的平等关系。从知的角度而言,教师与学生其实只有先知与后知的区别,并不存在施与受的关系;从情的角度而言,学生与教师一样,都拥有独立的人格,拥有丰富敏感的内心世界。真正的对话,是在民主与平等的前提下,师生双方精神敞开后的互动交流。对话双方只有在一种平等、和谐的氛围中,才能触发智慧的碰撞,激起思想的火花。

命题教师要在尊重考生的前提下,巧妙设问,以期激活学生与文本相关的生活经验。要深刻体察学生的心灵历程和精神状态,准确估计文本的哪一点、哪一线、哪一面最有可能介入学生的生命体验、精神活动,从而找到对话的最佳切入点,激发学生与之对话的热切愿望。

作为阅卷者的教师,也应充分尊重考生的独特体验。文本作为言语作品,它是“言”和“意”的统一体。阅读教学的本体价值就是促使学生言与意的积极感悟、内化、转换,进而运用个性的言语表达读者“独特的感受、体验和理解”。在文本阅读后,每个学生都有可能产生不同于他人的感悟和发现。阅卷教师应善于发现和接纳学生的这些个性化感悟,理解、认可、接纳他们从自己的经验出发,与文本实现有机的融合,从而提出的合乎情理的、具有独创性的对话结果(答案),使考场对话也能像课堂对话一样,成为点亮智慧火炬的愉快过程。

谈及命题者对文本的尊重之前,首先要强调,命题者命题(设计)的主体性也应该得到考生的善意接受与充分尊重。对阅读文本的选择和编辑,对话的设计者拥有以自己真实的、独立的感受和体验加以分析、理解和表达的权利。但是,他们对文本的加工、运用,是为阅读者(学生)了解文本作者所表达的思想感情服务的。在与文本进行前期对话,进而命题时,他们的主体性是有很大限度的。

命题者必须尊重文本,正视作者在自己的语境中真实地表达自己的思想和感情的权利。必须避免超越文本许可范围进行纯属于自己的天马行空般的自由发挥;必须杜绝脱离对文本作者的基本理解进行不着边际的思想批判和艺术挑剔;必须认可文本的文本空间与意义空间的存在,对于部分文本需要从基本理解、创新理解等层面解读出文本的不同层级的意义。然后,以作为先于表达和接受而存在的经验信息的“预设”为基础,围绕“角色”(诗歌作品中的抒情主人公,叙事作品中的人物和叙述人)分析,紧扣那些“省略”、“隐蔽”(生成“象外之象”)、“中断”、“冗余”的话语,关注凸显“陌生化”的语言形式及“隐喻化”的修辞手段,寻找对话的话题,设计对话的情境,并将这种对话的成果转化为试题的命制。

此一考量下命制完成的试题,应该具备这样的特征:既有助于文本基本意义的生成,又比较契合考生与文本对话的原始期待;既隐射了重要的文本空间、涵盖了文本的主要内容,又关照了考生与文本对话的对话策略;呈现适度、适时地开放文本的召唤结构,以利生成基于积极、正确前提的文本意义的多元建构。

考场情境下有效开展生本、师生等阅读对话的切入口,主要如下:

形成“期待视野”。“期待视野”,是德国接受美学的代表人物之一尧斯提出的重要美学概念。指的是接受主体在以往鉴赏中获得并积淀下来的对作品艺术特色和审美价值的认识理解,即阅读一个新的文本之前,已经具有的知识框架和理解结构。而能否形成期待视野,是阅读对话正常展开的前提。考生应立足各种形成因素,通过多种形成路径——回顾掌握的文体知识和写作规律,建立与熟悉作品之间的推及类比,打通作品的虚拟世界与生活的现实情境的内在联系,等等——努力形成考场阅读对话中的期待视野。

还原语境。语境和言语一道生成。作品一旦生成,语境因素也就自然消失。读者与文本对话的主要任务之一,就是通过言语表达,恢复言语与语境的关系。这就要以一种与语境生成相逆的心理程序,实现一个由言语到语境的过程。这一“还原语境”的过程,包括:充分利用上下文微观语境;探查写作的时间、场合、心态等中观语境;追寻作者所处的历史、社会、文化状况等宏观语境。由此可知,还原语境,就是还原生活;理解语境,就是知人论世。

补充空白。文本的空白,是作者按照事物运动及思维的规律,经过周密的构思,给读者留下的想象空间——隐蔽、残缺、中断、休止、无言、无声、无形的部分,即“笔所未到,意有所忽”之处。而补足阅读文本中有形和无形省略的意义,填充文学作品中的艺术空框,可以生成“象外之象”和“言外之意”。真正意义上的阅读活动,并不是读者盲目地崇拜文本,机械地接纳文本,小心翼翼地解读、猜读作者的本原意义,而是读者对文本意义的空白,运用自己的想象力、创造力去加以填补。在考场实践中,可以按照“发现空白——填补空白——评价空白”的程序,与文本“对话”(答题)。可从精彩突出部分入手,如文章的重点词语、关键句子、标题、文眼、警句、过渡段,所记述事件发展的高潮、人物言行的闪光点等,提出问题,带动整篇,通过“有形”部分而进入想象的艺术空间。

联想触发。指的是在阅读中读者调动自己的经验库存,由一件事感悟到其他的事。联想触发,是读者与作者沟通的桥梁,是新旧知识联系的纽带,是理论与实际的相互印证。

颠覆重建。就是读者以颠覆表达意义的方式,重建自己对于文本意义的理解。

追本溯源。指探讨作者创作文本时的原初用意和基本母题,藉以理解和把握文本的深层意义,或使所读文本的意义得到新的开掘和升华。

汇聚比照。任何一个文本都不是一种孤立的、真空的存在。汇聚文本,形成文本之间的关联,并加以比照,是读者介入文本,与文本对话,生成和创新意义的一个十分重要且饶有兴味的通道。

动态积储。指在考场阅读活动中,透过题目或注释等,自觉地与命题者联系,接受其阅读见解和经验。也包括读者自己与旧我之间的联系,因为与某一文本的对话并不是一次性完成的,往往有一个不断调节、不断补充的过程。

冷观现实,虽然新课程理念正在不断深化、内化,但不太尊重考生、尊重文本,对考场情境下生本、师生等阅读对话的正常进行产生干扰的试题,目前仍有少量存在。探究其因,主要有二:

首先,是命题者中存在着一定程度的形而上的命题思想,以静止的、割裂的观点来对待考场阅读,将意蕴深厚的文本看做可着意肢解的,用于知识、能力的考查材料,强行塞进脱离文本语境的考查内容,刻意设置有违对话程序的阅读障碍。阅读测试的本质,是利用一个相对客观公正的考查手段(试题),来审视阅读的过程与结果。其对话过程与评价结果之间,是本体与反映的关系。所以,考场阅读的设计,应该确立阅读与考查手段(试题)并重而内外有别的思想,使考查手段(试题)服务于阅读任务的完成,而不是迎合节外生枝的需求,努力体现阅读知识、能力考查的系统性。

其次,是命题者为了最大程度地追求试题的客观性,一方面忽视文本中文本空间的存在,在试题设计上使考生与文本对话过程简单化;另一方面漠视考生与文本对话过程中动态生成的文本意义,否定考生在与文本对话过程中产生的合理的、独特的情感体验,片面、僵化乃至偏颇地预设参考答案。

而从阅卷者的角度来回溯考场情境下的生本、师生阅读对话,也可以触发两点思考:

第2篇:以体验为话题的作文范文

[关键词]苏教版初中语文对话

[中图分类号]G633.3[文献标识码]A[文章编号]16746058(2016)010009

在课堂教学中,师生之间的有效互动是完成课堂教学任务的途径,而师生之间的有效对话是确保其顺利完成的条件之一。在初中语文课堂教学中,该如何实施有效的师生对话呢?笔者在此进行一些简略的解读。

一、在初中语文课堂教学中师生有效对话的重要性

在初中语文课堂教学中,对话一直寓于整个教学过程中,不管对于教师的专业水平发展,还是对于学生的学习和能力发展来说,都非常重要,能够有效地促进教师与学生共同发展,有利于教学任务的完成。师生对话主要是借助于语言载体来完成,它能调动学生在课堂教学中的主体意识,使他们感受学习过程中的自我价值。在新课程改革下,师生对话不能再沿用传统一问一答的方式,而应该发挥桥梁的作用,在师生之间传递着真诚,传递着爱心,传递着信任,传递着知识……师生彼此心灵相通,从而使学生踏入知识的殿堂。

二、师生有效对话应遵循的原则

1.启发性原则

启发性原则是对话教学过程中的一个重要原则。教师与学生对话时,要联系文本的内容,抓住其兴趣点或关键点,逐步引导学生对此发生兴趣,改变学生以往被动的“听话”为主动的“乐说”,在说的过程中去感受文本内容,感受作者的思想感情,使学生和作者情感产生共鸣等。

2.创新性原则

师生对话的目的不仅是要让学生感受文本,同时还要培养学生的创新能力,所以在对话时要把学生的创新潜能挖掘出来,循循善诱,引导学生把自己大脑中创新意识表达出来,这样既使课堂对话具有活力,同时又促进了学生创新能力的发展。

三、在初中语文课堂教学中如何实现师生有效对话

1.体验交流法

在初中语文教学中,教师和学生对文本的理解不一样。学生有自己看待问题的思想,会根据自己的生活经验来体验文本,并且不是所有的体验都是错误的,教师对于文本的理解也并不全部是正确的。所以教师务必把自己的体验和学生的体验有效地进行交流,这样才能有目的地和学生进行教学对话,完成教学的目标。

学生在课前预习文本时,通常会有自己的独特体验,如果教师能把自己对文本的解读和学生一起探讨,而不是一味地强加给学生,那么学生也愿意把自己的体验说出来和大家共同分享,这样一来,课堂教学的气氛活跃了,学生的阅读能力也提高了。例如在《济南的冬天》教学中,学生对于文本运用衬托手法写“济南冬天暖和舒适特点”的理解比较片面:认为在文中写小山的秀气、写水的“不结冰”“冒热气”“水藻真绿”等是起衬托作用。为了让学生能够全面地理解衬托在本文的作用,我用自己的体验慢慢地引导学生:“同学们,刚才你们找的内容也是正确的,现在我们看看文章的开头之处是否还有起衬托作用的句子呢?”在这样的体验交流下,学生自然就能找出答案:“没有风声”“响晴”也是为济南冬天的“暖和安适”作铺垫的。

2.质疑解惑法

第3篇:以体验为话题的作文范文

[论文摘要]新颁布的高中语文课程标准积极倡导自主、合作、探究的学习方式,是基于学生的身心发展程度及高中语文学习实践的特点,在关注学生个性差异的基础上培养学生的自主学习能力而提出的。语文写作教学实施自主学习策略需要以学生的生活体验和传统文化为基础,从命题、构思、互评阶段引导实施。

一、自主学习和语文自主学习的内涵

自主学习是指学生自己主宰自己的学习,是与他主学习相对立的一种学习方式。自主学习可分为三个方面:一是对自己的学习活动的事先计划和安排;二是对自己的实际学习活动的监察、评价、反馈;三是对自己的学习活动进行调节?修正和控制。

语文自主学习是指学生在明确宏观教学目标后,在教师的指导下,以学生已有的语文知识素养和认知经验为基础,根据自身的需要及预订目标对语文学习的内容、方式、方法进行自主选择、自我调控、自我修正直至完成学习目标的学习模式。语文教学中实施自主教学策略应创设良好的自主学习环境,改变传统以教师和课堂为中心的依赖式学习方式,调整学生的学习心态和学习策略,帮助学生树立主体意识,并能根据自己的特点和需要选择适合自己的学习方法与途径。

二、高中语文写作教学中实施自主学习的策略

自主学习理论指导下的高中语文教学,应结合语文写作教学的实际情况,将自主等同于放羊,或者换汤不换药都是我们在写作教学实践中应该坚决摒弃的。应该坚持以学生的学习为中心,发挥学生的主观能动性,教师的身份是组织者、帮助者、指导者和促进者,引导学生学会搜集和利用各种教学资源,在学习中学会学习,学会自主发展。

写作是运用语言文字进行书面表达和交流的重要方式,是认识世界、认识自我、进行创造性表述的过程。写作教学过程是教师引导学生运用语言文字表达情感与交流的实践性过程,应着重培养学生的观察能力、想像能力和表达能力,重视发展学生的创造性思维能力。鼓励学生自由地表达、有个性地表达、有创意地表达,尽可能减少对写作的束缚,为学生提供广阔的写作空间。为达到上述目的,笔者以写作的流程:命题、指导、批改阶段,结合师生的传统文化背景及现实生活体验构建自主学习策略。

1.命题

关注学生的个性差异、成长体验和心路历程是新课标对高中语文教学提出的要求,让学生通过自主写作充实精神世界与人生境界也是题中应有之意。因此,愿意写、有话可写是教师首先应该关注的情感态度目标,那么,如何才能让学生乐于表达与写作呢?自主学习理论启示我们,积极营造现实的情境,调动学生真切体验教学内容,并根据实际需要取材与把握要点。即是写作命题以生活体验为基础。

体验是指在生活中亲身经历、体验认知生活与事物,借助经验与直觉,感触外物带来的心灵震撼,以生活体验为基础写作建立在品味人生与生活、感受时代与关注社会的基础上。学生都有这样的经验,好的作品之所以打动人,就是因为文章的字字句句都负载着作者的真情实感,是作者用心用情用血在诉说,承载者作者丰富的内心世界与情感。因此写作教学中教师指导学生以生活体验为基础写作,需要教师积极引导,将话题引向学生的生活。

如话题作文:请结合生活体验以“飞翔”为话题。飞翔原指鸟儿扇动翅膀翱翔,本是动物世界的正常活动,但文章要求结合生活体验,这就启发我们需要由实到虚,积极拓展思维,飞翔常让我们联想到摆脱束缚、自由自在,还能让我们联想到超越、奋斗、开拓进取,如果换位思考还可以联想到飞翔的条件等等,可以说可写的内容很多很多。可是看似空灵广阔的话题,但是学生真正下手写时却常常无处动笔。那么在自主学习策略下,教师该如何将此话题联系到学生的生活中呢?

可以做这样的尝试:让学生以学号为序,站起来大声讲三句话,内容不限。这三句话可以是自己的梦想,可以是自己的苦恼,可以评价某人某事等等,但要求真实、健康、积极、简明。教师这么做是基于高中学生的心理特点:高中的学生学习任务重、思想压力大,每个人心中都有一个我们看不到的丰富的内心世界,若是能给他们机会,给他们倾诉的机会,他们肯定会敞开心扉。活动布置以后,给学生几分钟的思考时间,不要诉诸笔端,直接大声的说出来。活动结束后,要求学生以此次活动为素材,写作“飞翔”话题作文,要写出自己的感受。这样学生都有内容可以写,而且几乎是信心满怀地写作,因为人物、事件都已经在自己的头脑中。

由这个例子可以看出,教师做适当的引导后,学生们置身事中,都是自己不吐不快的事情,都是自己的亲身体验,写起来自然顺畅,有情可感,从源头上解决了“米”的问题。

2.构思

写作中学生常常是有话可写,可是难在“千言万语,无处下笔”,此时就需要教师适时地导情、导理、导法。导情是指教师需要创设生活情境或者问题情境,激活学生的体验,将体验变成表象记忆,使学生学会积极投入生活、丰富写作素材,解决“无话写”的问题;导理是指教师引导学生进行讨论、分析、归纳,将表象记忆内化升华为“心中之物”,教师教给学生方法,做好示范,揭示内在规律,解决“不会写”的问题;导法即指当学生的生活素材比较丰富,而且已经学会归纳抽象以后,教师应引导学生优化思维,陶冶情操,锤炼语言,解决“写不好”的问题。

3.评改

高中学生通过长期的学习,已经有了一定的写作基础,此阶段就是要夯实基础、促进发展,引导学生更深入地体验生活、思考生活、表现生活。作文评改有助于调动学生的写作积极性,激发学生的相互竞争与自我完善意识,达到以改评促写作的目的。

传统的作文评改是教师对作文进行的技能技巧、得失优劣的点评,对学生的促进作用有限。学生参与作文评改实际上是一个自主学习与自主构建的过程,学生在互批互改中,主动调动已有的知识体系,体验、揣摩、修改、评价他人的文章,对同伴给自己文章所作的评价也会辩证思索,进行深层次的修改并对自己已有的知识体系进行再次构建。顺利的完成这一过程,毫无疑问会提高作文的写作水平。

组织互评互改,教师颇费心血,尤其是起始阶段,教师需要范文引路、提示点拨、答疑解难、指导修正、表扬激励,经过一段时间的训练以后,学生才能真正领略互评互改的意义,并在互评互改中得到提高。

第4篇:以体验为话题的作文范文

关键词:中文微博 立场判别 情感加权算法 朴素贝叶斯

分号:G202

引用格式:刘勘, 田宁梦, 王宏宇, 等. 中文微博的立场判别研究[J/OL]. 知识管理论坛, 2017, 2(3): 175-185[引用日期]. http:///p/1/132/.

1 引言

近年来,社会媒体蓬勃发展,以Twitter、新浪微博为代表的微博平台凭借其及时便捷的互动方式、简单多样的操作方式、高效开放的传播方式逐渐成为全球热点信息的传播中心。越来越多的用户选择在微博上表达情感体验、点评时事热点,微博中包含了用户丰富的情感信息。因此,文本倾向性分析领域也涌现出立场判别这一研究热点,立场判别是指能够自动判别文本作者对于给定的目标话题(Target)是否持有支持(FAVOR)、反对(AGAINST)立场或是未表明任何立场(NONE)[1]。及时把握微博中热点话题的立场,有效提取用户的情感信息,已成为舆情分析、舆论监督以及企业改进产品体验等方面的有力手段。

2 相关工作

立场判别虽然是文本倾向性分析研究的一部分,但有别于传统的情感分析。传统的情感分析通过分析带有情感色彩或褒贬倾向的主观性文本,挖掘其中的观点,直接获取文本中所包含对象的评价信息[2]。然而立场判别强调文本对于给定的目标话题是否持有支持、反对立场或是未表明任何立场,文本自身可能不带有任何情感色彩和主观性评价,也可能间接通过表达对其他事件的观点来展现作者对给定目标话题的立场,因此给定的目标话题不一定会在文本中明确显现[3]。

目前国内外学者提出的立场判别研究方法主要是在以下两类文本倾向性分析方法的基础上展开的:?基于情感规则的分析。通过借助情感词典等资源提取文本中的情感因子,并考虑情感因子与特征对象的依存关系,对倾向值进行简单统计从而得到文本整体的情感倾向。但是这类方法往往不能捕捉到隐含的文本语义关系。这类方法的代表有:Y. Lu等人提出了一种基于统一原则的自动构建与上下文相关的情感词典的最优化方法[4];C. J. Hutto等人提出的VADER规则模型综合考虑英文文本的情绪知识、语法结构以及语义特征,对情感强度进行了细致区分[5];陈忆金等人提出的舆情意见句定量计算方法能够抽取舆情意见句的主题,并针对该主题对帖子进行情感倾向分析[6];刘全超等人针对微博内容特征以及转发、评论关系特征,构建情感分析用词典、网络用语词典以及表情符号库,设计了基于短语路径的微博话题情感倾向性判定算法[7];B. K. Y. Tsou等人通过计算词语的语义倾向,综合考虑极性元素分布、密度和语义强度来分析新闻文本的情感倾向[8]。?基于机器学习的方法。在特征提取的基础上采用机器学习模型构造分类器,从而将文本倾向性分析转化为分类问题,但是这类方法不能很好地考虑到句式以及上下文因素的影响。比如M. Wojatzki等人使用基于Stacking的组合分类方法,在提取n-gram、syntactic、lexicon、target-transfer、concept 等特征后,采用可训练的元学习方法来组合多种基分类器用以实现立场判别[9];P. Anand等人提出了一种针对在线实时讨论的立场判别模型,采用JRIP算法不断进行规则的归纳学习,根据规则提取相关特征后用朴素贝叶斯算法进行分类[10];S. M. Mohammad 等人根据人工建立的词语粒度情感词典和情感符号词典,提取文本的语义特征和情感特征来构造特征向量,采用SVM算法判别Twitter文本中某一特定评价对象的情感倾向[11];B. Velichkov等人利用GATE框架抽取特征信息,然后采用线性SVM模型对特征向量进行分类[12];W. Casey等人针对Twitter数据定义了评价信息词组,并为其定义了attitude、orentation、force、focus、polarity五大属性,提取文本中的属性特征作为SVM分类器的输入[13];A. Severyn等人采用卷积神经网络模型进行情感分析,将字级别的词向量作为原始特征,利用多个不同大小的卷积核对特征向量进行串接,获得了较高的准确率[14]。

面对立场判别问题,对中文微博进行立场判别的难度大于英文微博,主要原因有: ?分词是中文文本分析的关键步骤,分词结果的好坏将直接影响模型的准确度;?微博的表达方式较为随意,微博作者针对某一个话题常常会自动生成一些相关的网络用语和昵称,比如 “土鸡”“烧高香”“坑人”等;?微博文本语义关系更加隐晦,有研究表明,传统的依存句法分析方法并不适合提取微博文本的评价对象和评价词[15]。鉴于以上问题,本文在结合情感加权算法和朴素贝叶斯算法的基础上,提出了一种将三分类问题转化成多次二分类问题的SWNB(serial sentiment weighted and na?ve bayes model)模型,采用半监督学习方法,针对特定话题扩充了情感词库并建立了关联实体集,帮助提升评价对象提取的准确度;提出了能够同时对复杂句式、话题相关实体进行处理的情感加权规则,有效地区分出文本是否表达立场;将朴素贝叶斯算法着眼于文本中的情感词、否定词、关联词、程度副词等各类语义元素,从而对微博的立场进行细致判别。

3 特征概述

3.1 情感特征词

本文参考了台湾大学NTUSD简体中文情感词典(http://nlg.csie.ntu.edu.tw/)、中国知网HowNet中文情感词典(http:///)来构建情感词表,过滤掉情感倾向模棱两可的词语。由于目前已有的情感词典资源不具有针对性,有一些动词和情感词只有出现在与某一目标话题相关的语境中才会表现出一定的情感倾向,这些词也应该被视为情感项。例如,在话题“iPhone SE”的相关微博中常常出现“买” “入手”等动词,说明作者对其所描述的事物持肯定态度;在话题“春节放鞭炮”的相关微博中常常出现“有声有色”“年味十足”等形容词,说明作者喜爱放鞭炮这一习俗。因此本文人工a充了一些与各目标话题相关的具有正向或负向情感倾向的动词和形容词。

3.2 关联实体

微博作者通过评价与某一目标话题直接或间接相关的实体对象,来直接或间接地展现对该目标话题所持有的立场,本文定义这些实体对象为关联实体。有效识别文本中的关联实体,通过分析微博作者对这些实体持有的情感态度来判断作者对该目标话题持有的立场,将使立场判别工作具有针对性,从而提高判别精度。在构建关联实体库的过程中,本文定义了以下基本术语和数据结构:

(1)核心实体(Core Entity):代表与该目标话题(Target)直接相关的核心内容(人、事物、组织)等。某个目标话题对应的核心实体集可表示为 Target:{core entity 1, core entity 2, core entity 3, ...}。

(2)普通实体(Normal Entity):代表与该目标话题(Target)间接相关,但与该目标话题的核心实体之间存在比较/并列关系。如果两个实体之间是比较关系,那么通常对两个实体表现的是不同的情感倾向;如果两个实体之间是并列关系,那么通常对两个实体表现的是相似的情感倾向。某个Target对应的普通实体可按照以下结构表示:

实体名称(Normal Entity Name)

目标话题(Target)

相关联的核心实体(Corresponding core entity): 来自核心实体集

与核心实体的关系(Relationship with core entity): 比较关系/并列关系

情感倾向: 正向(positive)/负向(negative)

每个目标话题对应的关联实体库包含该目标话题的核心实体集以及按照比较/并列等关系划分的普通实体集。在构造关联实体库的过程中,本文使用NLPIR系统的关键词识别功能提取出各个目标话题的微博中的关键词,使用NLPIR系统(http:///)的词性标注功能提取出各个目标话题的微博中的名词,对这些词进行词频统计,辅以人工筛选得到各个目标话题对应的核心实体。然后以各个核心实体作为种子词,针对包含该核心实体的微博,按照宋锐等人提出的四类比较句模式[16]找出含有比较关系的微博,采用序列标注中常用的条件随机域模型(Condition Random Field)[17]提取出比较主体、比较客体及其词性、位置,若提取出的主体或客体中包含核心实体,则将另一方非核心实体按上述数据结构定义后加入到普通实体集中。对于未包含比较关系的微博,使用哈尔滨工业大学语言云平台(http:///)中的依存句法分析工具标注出微博中的并列关系成分,提取与该核心实体存在并列关系的实体,按上述数据结构定义后加入到普通实体集中。对于一些无法确定的实体,人工辅助对其进行筛选。以本文实验所使用的数据集为例,数据集中包含“春节放鞭炮” “iPhone SE” “俄罗斯在叙利亚的反恐行动” “开放二胎” “深圳禁摩限电”5个话题,为每个目标话题构建了相应的关联实体库,如表1所示:

表1 关联实体库

目标话题 核心实体数量 核心实体示例 普通实体数量 普通实体示例

春节放鞭炮 6 鞭炮,烟花,烟火,爆竹,礼花,花炮 40 禁令,道德,空气,污染,雾霾,噪音.......

iPhone SE 4 iPhone SE,5SE,苹果SE, Iphone 5SE 39 iPhone 5s,iPhone 5C,小米,华为,4s,6s,苹果6,iPhone 6,苹果,苹果系统......

俄罗斯在叙利亚的反恐行动 5 俄罗斯, 叙利亚政府军,普京, 叙利亚 44 土鸡,恐怖组织,美国,奥巴马,土库曼人,沙特,

东突,萨达姆......

开放二胎 3 开放二胎,全面二胎,二胎 10 计划生育,政府,婚假

婚晚育假期,晚婚晚育,

独生子女政策......

深圳禁摩限电 3 禁摩限电,限电,禁摩 9 电动车,摩托车,政府,

3.3 从句关联词

根据语法关系,通常复杂句可以分为转折、条件、假设、因果句等,它们都有其特定的从句关联词。诸如“虽然”“不论”“即使”这一类关联词,通常引导的分句与作者的真实感情相反,这一类关联词常被称为“让步关联词”;诸如“但是”“可是”这一类关联词,它们所引导的分句所表达的情感与作者的真实情感相同,这一类关联词常被称为“坚持关联词”[18]。

表2 关联词表

种 类 常用关联词

让步关联词 虽然、尽管、固然、不论、无论、不管、任凭、即便、即使、纵然、就算、哪怕、纵使、与其、宁可

坚持关联词 但是、可是、然而、然则、但、可、不过、不如、也

3.4 强度修饰词

情感词强度会受到副词和否定词修饰的影响[19]。若文本中有否定词修饰情感词,则文本表达的情感倾向会发生反转,因此本文收集了一些常用的否定词用于识别否定句。若文本中有程度副词修饰情感词,则文本表达的情感强弱程度存在差异,本文将程度副词划分为最|most、很|very、较|more、稍|-ish、欠|insufficiently、超|over六个等级,设定每个等级的程度副词对应的权重分别为2、1.25、1.2、0.8、0.5、1.5,以此来对不同强度的情感倾向进行细致区分。

4 立场判别模型

将立场判别看成分类问题,本文SWNB模型则将三种立场的分类转化成了多次二分类问题[20]。首先使用一种新的情感加权算法来将微博分为包含立场(非NONE)和未表明立场(NONE)两类;然后使用朴素贝叶斯算法对被第一层分类器划分为包含立场(非NONE)的微博进行二分类,将其立场分为支持(FAVOR)或反对(AGAINST)。SWNB模型的总体框架如图1所示。

4.1 情感加权算法

在对微博文本进行情感权值计算时,首先根据“。” “ !” “ ……”和“ ?”等标点符号将微博文本进行断句,微博文本转化为一系列句子的集合。然后依据本文提出的句式模型利用从句的关联词将复杂句转化为简单句,接着使用情感加权算法计算每个句子的情感权值,再通过判断微博中是否出现与该目标话题相关的关联实体以及该实体与目标话题的核心实体之间的关系,来调整前述步骤中得到的该句的情感权值。最后取所有句子情感值的平均值作为该条微博的情感权值。

图1 SWNB模型整体框架

在分类器训练阶段,本文使用一种基于grid search算法的边界探测方法[21]寻找出划分非NONE和NONE的情感权值的最佳上界阈值和最佳下界阈值(这两个阈值使训练数据的分类准确率最高)。在分类器应用阶段,当待分类文本的最终情感权值位于该上界阈值和下界阈值构成的区间内,待分类文本的立场将被分为NONE,否则待分类文本的立场为非NONE。情感加权算法的流程图如图2所示。

4.1.1 复杂句的处理策略

由于让步关联词引导的从句往往与作者的真实情感相反,坚持关联词引导的从句往往与作者的真实情感相同,因此对两者之一进行情感分析即可[22]。一般,复杂句式存在以下表现形式:

[让步关联词 + 否定词 + 情感词 +标点 +]坚持关联词 + 否定词 + 情感词

扫描微博中的每个句子Sn,先看是否出现坚持关联词,若未出现坚持关联词,则直接按照下文的情感规则计算情感值。若出现坚持关联词,扫描从句子开头至坚持关联词的这部分文本,若此部分含有让步关联词,将让步关联词引导的分句情感值设为0,此部分其他的分句按照下文的情感规则计算情感值;若此部分不含有让步关联词,则将从句子开头至坚持关联词之前的这部分文本情感值设为0。

图2 情感加权算法流程图

4.1.2 句子情感权值计算规则

在对复杂句进行简化之后,一个完整句子的情感值可直接通过计算各分句情感值之和得到,而分句情感值是基于分句中各个情感意群的情感值得到的。分句中每出现一个情感词,就认为出现了一个情感词意群。否定词和程度副词也会对意群表达的情感程度产生影响,因此计算句子情感权值时需要考虑上下文中出现的否定~和程度副词。

(1)抽取分句中的情感词意群,将情感词的相关信息按如下形式表示:

senWord = (句中位置, 情感倾向,情感权值)

其中正向情感词权值设为1,负向情感词权值设为-1。

(2)将上一个情感词意群的位置(lastWordPos)或者上一个标点符号的位置(lastPuncPos)作为起始点(选距离当前情感词意群最近的位置),在起始点和当前情感词意群之间扫描:

a.抽取程度副词,将程度副词的相关信息以如下形式表示:

degreeWord = (句中位置,权值)

b.抽取否定词:当否定词位置先于程度副词位置时,则将否定词权重赋值为-1,否则将否定词权重赋值为0.5。若该分句中出现多个否定词,则当否定词个数为奇数时否定词权重不变,当否定词个数为偶数时否定词权重取相反数。

(3)情感词意群的情感权值采用公式(1)进行计算:

公式(1)

分句的情感权值为分句中各情感词意群的情感倾向值之和。一个完整句子的情感值基于各分句的情感权值采用公式(2)加和得到。

公式(2)

4.1.3 关联实体的处理策略

扫描微博文本的每个句子,若该句子中包含目标话题的核心实体,则句子情感倾向值不变;若该句子中包含目标话题的普通实体且普通实体被定义为正向情感倾向,则句子情感倾向值不变;若该句子中包含目标话题的普通实体且普通实体被定义为负向情感倾向,则句子情感倾向值取相反数;若该句子中既无核心实体也无普通实体,则不更改句子的情感倾向值。

完成上述三个步骤后,一条微博文本的情感值为各句子情感值的平均值。

公式(3)

4.2 朴素贝叶斯算法

对被情感加权算法划分为非NONE的微博使用朴素贝叶斯算法进行立场判别(支持或反对)的二分类工作。对照情感词库、否定词表、程度副词表以及各个目标话题的关联实体库提取出每条微博文本中的情感词、关联实体、否定词、程度副词,将它们作为特征词,计算这些特征项和各类别的联合概率,从而估计给定微博文本的分类概率。本文采用朴素贝叶斯分类器中的伯努利模型[23]来判断微博X所属的类别c:

公式(4)

筛选出n个特征词,对每一条微博X用极大似然估计法[24]计算时,如果某个特征词在训练集从没出现过,会导致整体的概率计算结果为0,因此采用拉普拉斯平滑法对其概率值进行加一平滑。此外,多个概率值相乘的结果很小,能否在概率值很小的情况下保证较高的计算精度将对结果产生影响,因此需要对该值进行数据转换,使其呈现方式更好地接近所希望的假设,进行更准确的统计推断。本文在朴素贝叶斯算法的基础上,通过对取对数的方式可以将概率值

的乘法计算转换为加法计算,将不确定性分析转换成信息量的分析,从而提高计算精度,提高分类的正确率,计算方法如公式(5)所示:

公式(5)

5 实验与分析

5.1 实验数据

本文选用2016 NLPCC评测任务中立场判别任务所提供的部分语料作为实验数据集,包含3 000条已标注的训练语料和1 000条黄金测试语料(gold data)。两类语料均包含“iPhone SE”“春节放鞭炮”“俄罗斯在叙利亚的反恐行动”“开放二胎”“深圳禁摩限电”5个目标话题的微博数据,表3和表4分别统计了两个语料中各目标话题的数据分布情况。

表3 3 000条已标注的训练语料统计结果

目标话题 Favor Against None 总数

iPhone SE 245 209 146 600

春节放鞭炮 250 250 100 600

俄罗斯在叙利亚的反恐行动 250 250 100 600

开放二胎 260 200 140 600

深圳禁摩限电 160 32 138 600

表4 1 000条黄金测试语料(gold data)测试语料统计结果

目标话题 Favor Against None 总数

iPhone SE 85 94 21 200

春放鞭炮 88 94 18 200

俄罗斯在叙利亚的反恐行动 88 90 22 200

开放二胎 94 86 20 200

深圳禁摩限电 83 90 27 200

5.2 实验预处理

在清洗数据的过程中,通过添加正则的方式清除微博内容中的@标记、转发标记(通常以 //@ 开头)以及网页链接标记(通常以 http 开头)。由于一部分微博文本是与各个Target相关的新闻内容,通常【 】符号中包含了新闻的关键内容,能够表明微博的立场,因此针对这类文本,只提取了【 】符号中的内容来分析。在分词过程中,将第3节中提及的关联实体库、情感词表、从句关联词表、否定词表以及程度副词表整合后作为用户自定义词典添加到中国科学院的NLPIR分词系统中,以此来提升分词效果。在去停用词过程中,使用哈工大信息检索中心的停用词表来对微博中的停用词进行匹配查询后将其去除。

5.3 实验设计

作为对比,选取以下3种模型来对相同的数据集进行立场判别:

(1)朴素贝叶斯三分类模型(NB模型):使用第上文提出的朴素贝叶斯分类器的伯努利模型来将某一条微博的立场划分为FAVOR、AGAINST或NONE。

(2)SVM三分类模型:将每一条微博用一个特征向量表示,将其作为输入SVM算法的输入,识别三种立场[25]。表5列出了SVM模型的所有特征类型及含义。

表5 SVM模型的特征类型及含义

特征类型 含 义

Bigram Bigram语言特征

Sentiment score 情感权值

Negations 否定词个数

DegreeAdverb 程度副词个数

Associated Entities 关联实体个数

(3)Glove_SVM模型:文献[4]将无监督学习的GloVe算法训练出的单词词向量加和后得到微博文本的向量表示,将其作为逻辑回归模型的输入。

在评价模型的实验效果时,本文使用准确率、召回率、F值等指标对Favor和Against这两类立场分类结果进行评测。在实现中,涉及到SVM算法的分类工作采用台湾大学开发的LibSVM(https://csie.ntu.edu.tw/~cjlin/libsvm/)工具包来实现。

5.4 实验结果与分析

5.4.1 实验1

针对每个模型都做了两组实验,实验1将 3 000条已标注的训练语料中5个目标话题对应的数据按6:4的比例随机拆分成两部分,分别作为训练集和测试集,最终训练集共包含1 800条数据(其中每个目标话题包含360条数据),测试集共包含1 200条数据(其中每个目标话题包含240条数据)。

表6列出了实验1 中测试数据的整体F值以及各个目标话题对应的F值。图3中的折线图对测试数据在各模型的整体实验结果进行了可视化,柱状图对各个目标话题对应的实验结果进行了可视化。

表6 3 000条标注数据按照6:4比例划分后的实验结果

分类器 Overall iPhone SE 春节放鞭炮 开放二胎 俄罗斯在叙利亚的反恐 深圳禁摩限电

Favg Favg Favg Favg Favg Favg

NB 0.546 641 665 0.472 673 267 0.541 747 904 0.498 002 426 0.349 370 047 0.601 350 119

SVM 0.484 132 088 0.415 827 338 0.512 185 346 0.422 314 381 0.453 263 158 0.113 079 260

Glove_SVM 0.528 382 279 0.449 099 099 0.514 323 367 0.565 268 817 0.480 716 253 0.430 696 393

SWNB 0.572 687 486 0.505 083 450 0.654 954 425 0.566 974 999 0.558 544 967 0.561 043 048

图3 实验1结果

从实验结果可以发现,除了话题“俄罗斯在叙利亚的反恐行动”,SVM三分类模型的F值均低于NB模型和Glove_SVM模型,说明特征选择的好坏对于SVM模型的分类效果影响很大。一方面,将词的bigram作为文本特征,数据规模较大;另一方面,否定词个数、程度副词个数以及关联实体个数等特征并不能刻画三者之间的情感修饰关系。而GLOVE_SVM算法通过Glove算法训练出词向量,进而得到文本向量,通过深度学习考虑到了文本中不同粒度的潜在语义关系,能够更好地表示文本特征。朴素贝叶斯算法将某一条微博的立场直接划分为FAVOR、AGAINST或NONE,整体结果F值较高,说明朴素贝叶斯模型在识别FAVOR和AGAINST这两种立场时准确率较高。

相比于NB模型、SVM模型和Glove_SVM模型,本文的SWNB模型针对5个目标话题进行立场判别的结果更准确。SWNB模型在将微博立场划分为包含立场(非NONE)和未表明立场(NONE)两类时,考虑到了微博文本中是否出现与话题有关的实体,进而分析微博作者对这些实体持有的情感态度来判断作者对该目标话题持有的立场。在立场为NONE的微博中,微博作者往往只对相应话题的事实进行了客观分析,没有表达任何态度,例如微博“开放二胎,既是对年轻人勇气的考验,也是对爷爷奶奶们精力的考验。中国父母既要含辛茹苦养育自己的孩子,还要劳心劳力照顾孩子的孩子,不容易。”并没有透露作者对“开放二胎”这一政策的明确态度。改进后的朴素贝叶斯算法对被划分为包含立场(非NONE)的微博进行二分类时重点考虑了情感特征词,关联实体、否定词、程度副词的影响。

5.4.2 实验2

为进一步验证本文模型的有效性与合理性,实验2使用3 000条已标注的训练语料作为训练集,1 000条黄金测试语料(gold data)作为测试集来进行实验。表7列出了实验2中测试数据的整体F值以及各个目标话题对应的F值。图4中的折线图对测试数据的整体F值进行了可视化,柱状图对各个目标话题对应的F值进行了可视化。

表7 3 000条标注数据作为训练集、1 000条黄金测试语料(gold data)作为测试集的实验结果

分类器 Overall iPhone SE 春节放鞭炮 开放二胎 俄罗斯在叙利亚的反恐 深圳禁摩限电

Favg Favg Favg Favg Favg Favg

NB 0.379 693 425 0.276 192 633 0.485 239 039 0.141 843 972 0.394 790 078 0.428 917 051

SVM 0.289 700 706 0.255 267 664 0.307 207 412 0.211 006 494 0.369 406 393 0.137 407 407

Glove_SVM 0.420 293 605 0.537 173 203 0.516 744 884 0.074 766 355 0.476 173 021 0.355 987 055

SWNB 0.670 646 777 0.716 070 461 0.730 011 106 0.520 535 714 0.559 264 635 0.641 665 701

图4 实验2结果

本文的SWNB模型在对“iPhone SE”“春节放鞭炮”这两个目标话题的微博进行立场识别时,F值都可达到0.7;话题“开放二胎”的F值最低,为0.52;其他两个目标话题的F值居于0.52-0.7之间。对该结果进行分析发现,在立鍪侗鸫砦蟮奈⒉校话题“春节放鞭炮”“iPhone SE”“俄罗斯在叙利亚的反恐行动”的大部分微博被识别为与正确结果相反的立场,主要是这几类微博中常采用反语等方式表达立场,例如“装傻?俄罗斯货币跌幅60,石油经济奄奄一息,2015年GDP下降3.7,感情都是俄罗斯一盘大棋?”通过反问对俄罗斯在叙利亚的反恐行动的反对立场,因此在第二层分类器中只提取情感词、关联实体、否定词、程度副词作为特征词时不能很好地识别这类情况;话题“开放二胎”和“深圳禁摩限电”的大部分微博被分为NONE,主要是这两个话题的微博直接出现关联实体的频率较低,导致在一层分类器中计算情感权值产生误差。

6 结语

本文提出了有监督的SWNB分类模型来判别中文微博话题的立场。SWNB模型提出的对复杂句式、话题相关实体进行处理的新的情感加权规则,能够有效地区分出文本是否表达立场;改进的朴素贝叶斯算法能对被情感加权算法划分为包含立场(非NONE)的微博进行二分类,将其分为支持(FAVOR)或反对(AGAINST)立场。本文的SWNB模型结合了情感规则和机器学习模型的优势,充分考虑到中文复杂句式、话题相关实体、上下文语境以及文本语义对文本情感倾向的影响,实现简单,研判精度较高。

然而,SWNB模型对情感词典、关联实体集等资源的完整性以及分词结果的准确性依赖较大。此外,大量情感词存在歧义,在不同语境中表达的含义存在差别,本文模型目前无法对含有歧义的情感词进行严格区分,因此未来需要进一步完善情感词典等资源,并结合语义分析和深度学习技术,以期能更加准确地判别中文微博话题的立场。

参考文献:

[1] MOHAMMAD S M, SOBHANI P, KIRITCHENKO S. Stance and sentiment in Tweets[J]. ACM transactions on embedded computing systems, 2016, 1(1):1-21.

[2] MANKE S N, SHIVALE N. A review on: opinion mining and sentiment analysis based on natural language processing[J]. International journal of computer applications, 2015, 109(4): 29-32.

[3] B?HLER H, ASLA P F, MARSI E, et al. IDI@NTNU at SemEval-2016 task 6: detecting stance in Tweets using shallow features and GloVe Vectors for word representation[C]//International workshop on semantic evaluation. San Diego: Elsevier, 2016: 445-450.

[4] LU Y, CASTELLANOS M, DAVAL U, et al. Automatic construction of a context-aware sentiment lexicon: an optimization approach[C]//International conference on World Wide Web. Hyderabad: ACM, 2011: 347-356.

[5] HUTTO C J, GILBERT E. VADER: A parsimonious rule-based model for sentiment analysis of social media text[C]// Eighth international conference on weblogs and social media. Michigan: AAAI, 2014: 216-225.

[6] 陈忆金, 曹树金, 陈桂鸿. 网络舆情意见挖掘: 用户评论情感倾向分析研究[J]. 图书情报知识, 2013(6): 90-96.

[7] 刘全超, 黄河燕, 冯冲. 基于多特征微博话题情感倾向性判定算法研究[J]. 中文信息学报, 2014, 28(4): 123-131.

[8] TSOU B K Y, YUEN R W M, KWONG O Y, et al. Polarity classification of celebrity coverage in the Chinese press[C]// 2005 International Conference on Intelligence Analysis. Virginia: IEEE, 2005: 102-108.

[9] WOJATZKI M, ZESCH T. ltl.uni-due at SemEval-2016 Task 6: Stance detection in social media using stacked classifiers[C]// International workshop on semantic evaluation. San Diego: Elsevier, 2016: 428-433.

[10] ANAND P, WALKER M, ABBOTT R, et al. Cats rule and dogs drool!: Classifying stance in online debate[C]// The 2nd workshop on computational approaches to subjectivity and sentiment analysis. Oregon: ACL Anthology, 2011: 1-9.

[11] MOHAMMAD S M, KIRITCHENKO S, Zhu X. NRC-Canada: building the state-of-the-art in sentiment analysis of tweets[C]//International workshop on semantic evaluation. Atlanta: ACL Anthology, 2013: 321-327.

[12] VELICHKOV B, KAPUKARANOV B, GROZEV I, et al. SU-FMI: System description for SemEval-2014 Task 9 on sentiment analysis in Twitter[C] // International workshop on semantic evaluation. Dublin: ACL Anthology, 2014: 590-595.

[13] CASEY W, NAVENDU G, SHLOMO A. Using appraisal groups for sentiment analysis[C]// The 14th ACM international conference on Information and knowledge management. Bremen: ACM, 2005: 625-631.

[14] SEVERYN A, MOSCHITTI A. UNITN: Training dep convolutional neural network for Twitter sentiment classification[C]// The 9th international workshop on semantic evaluation. Denver: ACL Anthology, 2015: 464-469.

[15] LIU X, LI K, ZHOU M, et al. Collective semantic role labeling for tweets with clustering[C]// The twenty-second international joint conference on artificial intelligence. Barcelona: AAAI, 2011:1832-1837.

[16] 宋J, 林鸿飞, 常富洋. 中文比较句识别及比较关系抽取[J]. 中文信息学报, 2009, 23(2): 102-107.

[17] LAFFERTY J, MCCALLUM A, PEREIRA F. Conditional random fields: probabilistic models for segmenting and labeling sequence data[C] //Proceedings of ICML 2001. San Francisco, 2001: 282-289.

[18] 姚p云, 沈威. 关联词的搭配研究[J]. 计算机与现代化, 2007(4): 7-9.

[19] 刘翠娟, 刘箴, 柴艳杰, 等. 基于微博文本数据分析的社会群体情感可视计算方法研究[J]. 北京大学学报(自然科学版), 2016, 52(1): 178-186.

[20] 韩宏, 杨静宇, 娄震. 基于层次的分类器组合[J]. 南京理工大学学报(自然科学版), 2002, 26(1): 10-14.

[21] LAMESKI P, ZDRAVEVSKI E, MINGOV R, et al. Svm parameter tuning with grid search and its impact on reduction of model over-fitting[M]//In rough sets, fuzzy sets, data mining, and granular computing. Germany: Springer, 2015: 464-474.

[22] 李爱萍, 邸鹏, 段利国. 基于句子情感加权算法的篇章情感分析[J]. 小型微型计算机系统, 2015, 36(10): 2252-2256.

[23] LEWIS D D. Naive (Bayes) at forty: the independence assumption in information retrieval[C]//European Conference on Machine Learning. Berlin: Springer, 1998: 1204-1206.

[24] MYUNG I J. Tutorial on maximum likelihood estimation[J]. Journal of mathematical psychology, 2003, 47(1): 90-100.

[25] PANG B, LEE L, VAITHYANATHAN S. Thumbs up?: sentiment classification using machine learning techniques[C]// The ACL-02 conference on empirical methods in natural language processing. Philadelphia: ACL Anthology, 2002: 79-86.

作者贡献说明:

刘 勘:主要完成论文思路、算法模型提出和论文修改;

田宁梦:主要完成论文算法的提出、主要实验和初稿撰写;

王宏宇:主要完成论文算法的讨论、对比实验;

林荣蓉:主要完成论文对比实验;

王德民:主要完成论文数据搜集和预处理。

Stance Detection in Chinese Microblogs

Liu Kan Tian Ningmeng Wang Hongyu Lin Rongrong Wang Demin

Department of Information, School of Information and Safety Engineering,

Zhongnan University of Economics and Law, Wuhan 430073

第5篇:以体验为话题的作文范文

一、相关理论

(一)话题检测与跟踪技术TDT作为一种主题检索技术,其特点主要在于关注与特定事件主题相关的数据。传统的检索技术是从内容来检索、确定文档的分类,而TDT技术是基于事件,利用分析文档与事件主题联系来获取特定主题信息,它从来源数据流中自动发现主题并把与主题相关的内容联系在一起。TDT的研究任务主要包括五部分:对新闻广播等报道进行切分(报道切分),检测未知话题(话题检测),跟踪已知话题(话题跟踪),检测未知话题首次相关报道(首次报道检测)以及检测报道间相关性(报道关联性检测)[7]。

(二)中文分词及词性标注中文分词就是将汉字序列切分成有意义的词,以字为单位,句和段则通过标点等分隔符来划界。目前主流的中文分词算法分为四类:基于字符串匹配的分词,基于理解的分词,基于统计和基于语义的分词[8]。词性标注是根据句子上下文环境给句中的每个词标记一个正确的词性,主要是机器针对多标记词(即有多种词性的词)和未登录词(即在训练语料中未出现的词)标记词性。词性标注技术与分词技术一样,在自然语言处理、机器翻译、文本自动检索及分类、文字识别、语音识别等实际应用中占有重要地位[5]。目前比较典型的标注算法归纳起来有:基于规则的方法,基于统计的方法,规则与统计相结合的方法。本文选用的是规则与统计相结合的方法。

(三)向量空间模型向量空间模型(VectorSpaceModel,VSM)是一个应用于信息过滤、信息撷取、索引评估相关性的代数模型,文本分析对象通常是以词为单位的VSM数据[9]。运用这个模型把文本表示为向量,就可以将文本处理简化为向量空间中的向量运算。当文档转化为向量时,文档中每个词对应向量的每个特征项维度,所有文档中的词所对应的维度构成了整个空间,而特征权重则是每个词对应每一维的取值,于是,一个文档Dj转化为特征向量Dj可表示为:其中tij是特征项,wij是特征权重,M是文本tij中的特征项总数。另外,文本中作为特征项的词不能重复,即各特征项tij互异,且文本的内部结构不需要考虑,因此特征项tij无先后顺序。

(四)K-means文本聚类K-means算法以欧式距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大,得到紧凑且独立的簇是聚类的最终目标。K-means算法中距离的计算公式如下:第一步,从数据对象中任意选择K个对象(K值需要预先设定)作为初始聚类中心。第二步,计算剩下的对象与这些聚类中心的相似度(距离),并分别将它们分配给最相似的(聚类中心所代表的)类。第三步,重新计算每个新类的聚类中心(该聚类中所有对象的均值)。第四步,不断重复第二、三步,直到标准测度函数开始收敛为止,一般采用均方差作为标准测度函数。该算法在处理大数据集时是相对高效和可伸缩的,计算的复杂度为ON(kt),其中N是数据对象的数目,t是迭代的次数(一般K≤N,t≤N,同时算法对顺序不太敏感,因此较适合对VSM表示的文本集进行聚类。本文聚类效果的验证采用类平均相似度,公式为:其中AVGT()SIM表示类T的平均相似度;CT表示类T所包含的微博条数;ft(avg(sim))表示类T中单条微博文t的个体平均相似度,即t与类T中其余微博文的相似程度之和取平均值。将类中所有微博文的个体平均相似度之和取一次平均值,从而得到类的平均相似度。

二、研究设计

(一)识别流程本文基于TDT技术设计出中文微博热点话题识别流程,主要环节如图1所示。首先通过微博爬虫系统获取所需的数据,如微博内容、评论数、转发数、受众数等;接着从获取数据中提取话题识别的数据源,利用中文分词处理过滤数据;对预处理后的微博内容中的每个特征词,利用特征词权值计算方法TF-IDF(TermFrequency–InverseDocumentFrequency)计算特征权重并建立向量空间模型,再利用K-means文本聚类来归纳出多个话题;最后对多个话题的影响力进行计算并分析,通过效果验证识别出热点话题。

(二)热点判定———话题影响力设计本文基于微博特点和话题本身,提出热度的判定因素———话题影响力。微博热点话题影响力为该话题中单条相关微博内容的影响力总和,单条微博内容的影响力又分为直接影响力和间接影响力。由于用户发表的微博文直接呈现给关注该用户的受众,因此单条微博的直接影响力与该条微博用户的关注人数(受众数)相关[10]。本文此处只考虑微博评论数与第一层的转发数。定义话题影响力相关计算公式如下:其中Inf()T为话题T的影响力;n为该类中与话题相关的微博条数;Inf()t为单条相关微博内容t的影响力。一个话题的影响力为话题中所包含的所有相关微博内容影响力之和。其中InfD()t为单条相关微博内容t的直接影响力;InfI()t为单条相关微博内容t的间接影响力。单条微博的影响力为直接影响力与间接影响力之和。题T的影响力为:

三、实证分析

本文实验数据随机选取了2011年12月8日到2011年12月14日这7天内的微博数据,通过新浪微博API接口共爬取微博内容2103条。根据研究设计的热点话题挖掘流程,对该周内新浪微博热点话题挖掘进行实证研究。

(一)数据预处理首先对微博内容进行文本预处理,即进行去重、分词、无效信息过滤、降维等操作。实验中使用C#版本的中科院ICTCLAS中文分词系统对微博文本进行分词处理,同时标注词性,并过滤微博内容,保留名词及名词性词语,然后将所有的单字过滤,再去除所有的英文字符、数字和一系列数学符号等非中文词,只留下有意义的中文词语。图2为关于“2012年伦敦奥运会期间英国女王出租宫殿套间”话题文本示例。

(二)话题识别文本预处理后,针对每条微博内容,利用特征词权值计算方法TF-IDF计算各个单词权重,以构成一个向量空间模型用于聚类。实验中,K值在最大值范围内通过多次实验结果验证来选取。经过多次试验,最终将该周的微博内容聚为10类,并对各类进行类关键词提取,结果如表1所示。以上10类中,所提取的关键词具有较强实时性的有6个,关键词所包含信息较为日常的类有4个。此时若设置类平均相似度阈值为0.01,则恰好包含较强实时信息的6个类别。将类平均相似度高于阈值且包含较强实时信息的类定义为一个话题,则从微博内容中发现话题数目为6个,分别为类3、4、6、7、8、10。

(三)话题影响力排序大多关于热点发现的算法认为,在聚类后出现的热点词频率较高,则该话题即为热点话题。这种原理是基于热点词与话题的附属关系,但却忽略了当话题较分散的情况下聚类也能进行,同时在聚类结果中,可能有些话题只是局部较热的小话题,整体来讲算不上热度很高[11],因此可以设置一个阈值来区分话题冷热,话题热度(本文中以话题影响力来衡量)高于阈值则表示聚类出来的话题为“热点话题”,低于阈值则视为“非热点话题”。热点与非热点的概念是相对的,因此也可以根据话题影响力公式计算出每个话题的热度,然后按照热度分数排序,分数越高表示话题影响力越大,热度越高。实验中,挖掘热点话题的数据来源时间段Δh为2011年12月8日至2011年12月14日。由于实验中发现话题的总数较少,故本实验不以预先设定话题影响力阈值来划分“热点”与“非热点”,只将话题按影响力大小排序,即设定所发现话题均为热度不同的热点话题。根据话题影响力相关计算公式(4)~(8),计算得到实验中所提取的6个话题在当前时段的影响力评分及排名,如表2所示。考虑到微博转发会使微博的影响扩散,相对于评论其影响力更大,因此公式(8)中α取值为0.4,β取值为0.6.从以上分析结果可以看出,在实验识别出的2011年12月8日到2011年12月14日的6个话题中,影响力从大到小依次是江苏丰县校车事故、南京大屠杀纪念日、韩国海警被刺事件、电影《金陵十三钗》即将上映、广东陆丰乌坎村、双子座流星雨爆发。

(四)效果验证话题识别与跟踪的效果一般使用准确率和召回率两个参数来衡量,公式如下:A表示已提取出的与话题相关内容,B表示已提取出的与话题不相关内容,C表示未提取出的与话题相关内容。在全部文本数据中,与话题相关的数目为A+C,而被判定与话题相关的数目为A+B。召回率和精度是不可能两全其美。当召回率较高时,精度反而降低;反之精度高时,召回率就会有所降低。因此,本文用这两个度量值融合而成的一个度量值F来衡量这个效果。F值公式如下:实验以“召回率”、“准确率”验证热点话题发现效果,根据公式(9)、(10)、(11)计算出每个话题的召回率与准确率,如表3所示。从表3可以看出,6个热点话题召回率从高到低依次为:韩国海警被刺事件,江苏丰县校车事故,南京大屠杀周年纪念,双子座流星雨,陆丰乌坎村,电影《金陵十三钗》话题,各类话题召回率均较高。相反,各类话题准确率均较低,最高为双子座流星雨,仅为0.769,最低为广东陆丰,仅为0.641。聚类准确率低与微博内容零散、谈论话题范围极其广泛有关,即话题聚类时噪声数据太多,导致β值较大。实验表明微博热点话题发现的“召回率”较高而准确率较低,这与微博内容的不规范性、随意性等特点有关。从综合衡量召回率和准确率的F值来看,热点识别取得了良好的效果。尽管微博内容存在一定的不规范和随意性,但从实证分析中可以看到,聚类所选取出的6类热点话题F值均保持在0.75以上。

四、结论

第6篇:以体验为话题的作文范文

【关键词】:教学模式 特殊教育 语文

中图分类号:G4 文献标识码:A 文章编号:1003-8809(2010)05-0099-01

一、对话教学的基本理念

何为“对话教学”?对话教学是一种教学理念,是对传统教学观念的一种挑战。它的核心内涵就是教学从知识的传授走向知识的建构,学生学习不再是被动的接受,而是一种发生在对话之中的自主生成。“对话教学”倡导的是一种民主、平等的教学,一种交往、互动的教学,一种自主、生成的教学。

1.对话教学是民主、平等的教学

长期以来,“灌输──练习”是聋校语文教学的主要方式,现在仍然很有市场。作为聋校教师,因为有听力与汉语水平的优势,所以一直是聋校语文课堂的主宰,学生始终处于被动地位。“对话教学”不应仅限于言语之间的交谈,而更应是师生彼此心灵的接纳与相容。聋校语文教师要充分熟悉聋生语言发展的潜力,承认他们特有的自然手语,关注他们丰富多彩的内心世界和独特的情感表达方法,尊重他们对文本的个性化解读,期待着他们用聋人特有的学习方式进行个性化的学习。

2.对话教学是交往、互动的教学

“对话教学”是一种多维的互动教学,在教学过程中应突出师生对话、生生对话、生本对话。现代语文阅读学认为,阅读过程是文本艺术形象、作者情感意趣与读者熟悉感受相互作用的过程,因而语文教学应实现教师、学生与文本之间的多维互动,在互动过程中实现多种视角的对话、沟通、汇聚、融合,从而在一定程度上使各自的熟悉偏见得以纠正。

3.对话教学是自主生成的教学

“对话教学”是交往、互动、沟通、合作的教学,是有着重新建构意义以及生成意义的教学。学生对知识的感悟具有独立性,而个体独立与群体互动促成了教学的自主生成。他人的信息被自己所吸收,自己的知识被人唤起,这样就可能出现新思想、新观点、新解读,这样的课堂无疑充满创造色彩。

二、聋校语文实施对话教学的偏误

“对话教学”这一全新的理念引入聋校语文课堂,势必扭转聋校语文高能低效的现状,然而聋校传统教学思维根深蒂固,实施“对话教学”这一理念难免会碰到压力、困惑以及偏差。

1.怀疑聋生对话可能性

聋生对话可能性实际上就是对聋生主体能动性的承认。传统观念认为聋生因为听力缺失,沟通外界信息渠道受阻,造成他们生活体验不足、知识面狭窄、接受学习能力不甚乐观,在语文学习过程中很难发挥他们的主体能动性。 “对话教学”只能成为一种设想,一种不切实际的教学理念。其实不然,聋生虽然听力缺陷,但与其他儿童一样,也是在主体与客体交互作用中熟悉自己,熟悉自己与四周自然、社会环境之间关系的。只要聋校语文教师解放思想、转变观念,相信聋生,聋校语文课堂同样会出现对话、互动、质疑、探究,实施“对话教学”的可能性不需怀疑。

2.对话内容浅显

在实施“对话教学”过程中,要警惕“假对话”现象,一些看似热闹的聋校语文课堂,其实并未接触到“对话教学”的实质,课堂流于虚化,热衷表演化,追求形式化,这种教学方式其实是固有教学模式的沿袭,止于教学手段、方式等外部形态的改良。满堂问答取代原有知识的灌输,结论诱导替代学生的自主体验,表面热闹视同于学生自主活动。教师仅仅是将一些常识或者文本的内容转换成问题提出,学生的思维却未能有效激活,实际上未能达成教学目标。

三、实施有效的语文对话教学策略

如何在聋校语文课堂实施“对话教学”,进行有效的语文“对话教学”呢?笔者认为在操作层面上应从以下几个方面入手。

1.在理解中对话

文本内容是聋生进行有效课堂对话的凭借,聋校语文课堂教学中的对话应先从理解入手,理解文本是课堂对话的开始,虽属浅层次的对话,但意义深刻,因为只有聋生对文本的字词句段所表达的内容有一整体的初步感知,才能走进文本,融入文本,走进文本语言深处,体会句中之意,言外之音。

2.在问题中对话

现代教学论研究指出,从本质上讲,感知不是学习产生的根本原因,产生学习的根本原因是问题,没有问题也就难以诱导激发学生的求知欲,学生也就不会深入思考,因而很难展开有效深刻的教学对话,即使有对话也只能是表层的对话,形式的对话。当然对于课堂对话的问题,可以由教师提供,也可由学生提出,只要有利于课堂对话,教师就应该予以关注。

第7篇:以体验为话题的作文范文

以教读课文《故乡》为例,谈谈我的主要教学设想及教学效果。

一、给学生充分的时间阅读文本,并读出自己的感受和体验。

有感受和有体验的阅读才是有效果的阅读。长期以来,我们的阅读教学在总体上存在着重认知轻情感、重分析轻综合的倾向,实际反映了以学科知识为本位而非以人的发展为本位的课程观。学生自己读书的时间少,自己读出感受和体验的更少。上课伊始,学生还未开口读书,学生未及进入作品之中体验,教师就已经强加给了学生。我在教学《故乡》时,充分信任学生,给他们充分的时间自由读书,并要求在读完后能谈自己对作品、人物的认识。

我首先要求学生自己阅读文本,与文本对话:

就下列问题组织讨论和交流,学生阅读课文,开始思考并作批注。

(1)文中写了哪些人物?列一个人物表。在这些人物中,其中哪些人物着墨较多?分别为他们写一个小传。

(2)分析人物的性格特点,用一两句生动的话对人物作一评价。

(3)探讨本文的主题。文学作品的理解,不强求一致,对人物的理解是这样,对主题的理解也是这样。

有的放矢的阅读,提高了学生的审美能力,增强了他们的阅读兴趣。他们完全能够做到,并且做得很好。

二、有层次地引导学生探究文本,大胆实施“探究性阅读”。

作为小说名篇,既有内容的广度,又有思想的深度。怎样教学才能实现耗时少、效果好?方法多样。我的做法是,由浅入深、层层推进地引导学生探究文本,进行探究活动。让学生逐步感受到探究文本的意义、方法和阅读活动的乐趣,从而培养学生的语文实践能力,提高学生的语文综合修养。

我的具体做法是,组织课堂讨论,学生与学生对话,学生与老师对话。

教读《故乡》时,我放手让学生分组活动,展开生生对话。先确定本组发言人和记录人,就学生自己写的小传和对人物的评价及小说的主题在组内进行交流,组内同学补充发言。

接着,学生反馈讨论效果,交流汇报各组的发现。一人发言,其它同学作补充。

读这篇小说,评价其中的人物,也是在前一个单元学过了议论文之后,运用议论这一表达方式的一种实践。用一两句生动的话评价人物,还是一种对语言运用能力的训练。在学生交流过程中,有可能会出现许多闪耀着创新光芒的见解,我总是不失时机地予以鼓励。

对小说主题的认识,学生可以发表自己的看法,还可能另有自己的见解。我都给予真诚的鼓励。

欣赏小说,要学会分析人物,因为人物是小说三要素中的主要要素。分析人物时,不妨让学生自己写写人物小传,这是一个从整体感知到局部分解,再从局部分解到整体理解的过程,也是一个情感体验的过程。有了这个过程,才有助于进一步分析人物的性格,阅读小说才有可能成为个性化的阅读。

三、重视学生在阅读过程中的主体地位,让学生在对话中训练语文能力。

在阅读教学中,存在着多重对话关系,如学生与文本的对话,教师与学生的对话,学生与学生的对话,教师与作者的对话,学生、教师与编者的对话,这些都为学生的个体阅读提供了良好的环境和条件,但对话的中心是每一个学生个人。必须强调学生阅读的自主性和独立性,文本的意义是学生在阅读过程中自行发现、自行构建起来的,要让学生自己阅读、自己学会阅读。教学中,要求学生努力达到表达自己的阅读体验、提练整合小组的观点,说句意连贯、层次清晰、语言精美的话的目标。从一句到几句,再到一段,有理有据,切近题旨。

课外延伸,与相关资料对话:

(1)课下收集有关研究本文的资料,与自己的阅读体验进行参照,加深理解课文的效果。

(2)课文中的水生和宏儿以后会有怎样的命运?发挥想象,为他们写一个故事。

第8篇:以体验为话题的作文范文

语文教师,无论是课内作文还是课外作文,都要对学生有严格的要求。作为一名高中语文教师,我在作文教学中,特别重视课外作文对学生的写作影响。当然,在课堂内要求学生写作文也是必不可少的教学活动,学生可以在课上,在有限的时间内,锻炼自己的写作能力,熟悉高考作文的写作要求。而对于课外作文,教师不应该有太多的限制,要让学生充分发挥自己的个性和情感体验,给予他们足够的写作自由。课内作文和课外作文都有其优点,因此,将两者结合有着显著的教学效果。让学生在课外写作文目的就是让学生多观察和积累日常生活经验以及国内外热门话题,注重生活细节,挖掘生活中的写作素材。同时,教师还要引导学生把自己的心理所想表达出来,使文章赋有感情,让读者产生共鸣。由于时间和空间有限,学生在课内写作文无法像在课外那样发挥出应有的写作水平,教师要鼓励学生在课外多看、多想和多写,养成随笔的好习惯。因此,课内作文与课外作文相结合的作文教学模式应被广泛使用,综合发展学生的写作能力。

二、多向对话与单向传授相结合

要想使学生能够具备很好的写作文采,教师可以在写作教学中经常让学生参与对写作话题、情感表述等方面的讨论,培养学生写作的兴趣。在作文课上,不能只是教师一个人站在讲台上“填鸭式”般地教学,这样课堂气氛非常地沉闷,学生与老师之间也基本无交流,这种教学模式对学生的写作没有任何帮助。教师应在写作课堂上鼓励学生勇于发表自己的看法,积极与老师和学生交流。比如教师可以拿出某位学生写的作文,写这篇文章的同学可以首先说出自己这样写的理由,其他的同学对其进行评论、赏析。而教师在这个时候更多的是扮演一个参与者或者讨论者的角色,与学生平等对话,无论学生说得是否准确,教师都要提出肯定和赞赏,而不是一味的把教师的“威严”显示出来,让学生有话也不敢讲。与此同时,讨论的话题也要鲜明、有特点,要跳出写作要求的条条框框,让学生把生活体验带到讨论中,真正做到让学生成为学习的主人。在作文教学中融入教师与学生之间的多方面对话有利于提高课堂参与度,增进教师与学生之间的感情,同时让彼此之间相互学习,提高教学效率。

三、让学生大胆倾吐心中的体验

第9篇:以体验为话题的作文范文

兴趣作文。这个训练体系的目的就是运用激发学生兴趣的方法改变学生害怕作文的心理。如“广义发表”与“活动作文”。“广义发表”是将学生的作文用多种形式发表来激发学生作文兴趣的一种教学方法。“活动作文”以活动为载体,激发学生的兴趣,强化学生的体验,丰富学生的情感,尊重学生独特的见解,促进学生的个性表达。

记实作文。它要求学生“关注现实、热爱生活”,“留心观察周围事物”,从真实的现实生活中获得真实的体验。借鉴绘画中的写生方法,能真实、准确地表达自己所了解到的一切和自己的所思所感,形成如实地表现客观事物、进行真实表达的能力。它的指向是解决作文“说假话、空话、套话”的问题。

聊天作文。它以聊天为手段,指导习作为目的,通过聊天使学生自觉感悟、产生兴趣,从而轻松落笔,写好作文。聊天作文,构建了平等、民主的新型师生关系,为习作创设了宽松的学习环境。

情境作文。它是教育家李吉林创立的,有两个特点:一是创设情境,适应学生形象思维的特点;二是重视情境体验,激发学生的表达欲望。建立“从内容入手”“从观察入门”把学生的语言发展与思维、情感、美感、观察力、思想品德的发展联系起来的作文教学体系。

童话体作文。其本质是幻想,是以假定的方式来表现生活。学生一旦进人童话作文这个奇妙的世界里,就可尽情地张开幻想的翅膀,其效果远远大于为写作而写作的被动学习。

童话体作文教学形式有:听童话,写童话;看图画,编童话;看实物,编童话;联系生活实际编童话;结合课文编童话;按提纲编童话;提供开头编童话;根据在意义上毫不相干的两个物体或者两个词语编童话;听音响编童话;根据题目编童话。我们从这十种习作教学形式可以看出,童话体作文从儿童的心理出发,遵循儿童的认知规律,因其与儿童富有幻想的天性相契合,而成了深受小学生喜欢的一种作文形式。

网络作文。它是一种新颖、有趣的作文教学形式,是对教学手段的一种丰富,其特点是教学形式个别化程度高,教学过程不受时空限制的教学形式。

网络作文利用多媒体网络技术为传统的作文教学注入了新的内涵。它提高了学生习作的积极性,提升了学生的信息应用水平和综合能力,实现了“要我写”到“我要写”的转变。

“模仿――创造”作文。这一体系着重对记叙文、说明文等文体的写作能力培养进行探索,其基本程序是“模仿――改写――仿作――评析――借鉴――博采”。该训练模式在我国当代作文教学界有普遍影响,其优点是学生写作文体意识强,作文也容易入门,效果明显。

读写结合练笔。就是要用好课文这个习作的“例子”。丁有宽老师把作文训练分为五步:一年级侧重练好一句完整的话;二年级侧重练好九种句群;三年级侧重练好八种构段法;四年级侧重练好篇章;五年级侧重综合提高,进行自学自得、自作自改的训练。

个性化作文。它针对学生作文中普遍存在的缺乏个性、概念化、成人化、抄袭成风的种种弊端,提出的作文教学主张。

精选范文推荐