想象力测试精选(九篇)

时间：2023-09-04 11:37:39

想象力测试

第1篇：想象力测试范文

Abstract: A test is held aiming at the testees' available knowledge. The fact that testees are focused at the course oblidges the test designers to consider the factors that affect the testees' emotions in the test design.Two facets appear at the same time:one is to maximize the positive factors and the other is to minimize or restrain the negative factors.

关键词：受试者；测试；情绪

Key words: testee；test；emotion

中图分类号：B842.6;G42 文献标识码：A 文章编号：1006-4311（2012）21-0320-02

0 引言

要设计一份好的语言测试试卷应在保证效度（validity）的前提下实现信度（reliability）的最大化。信度是指测试的结果分数对受试者（testers）的表现而言的可靠性,反映了测试分数是否公正和客观地体现试题的做答以及试题是否给受试群（test population）提供公正而客观的答题机会。要实现信度的公正性和客观性，达到测试结果的可靠性，在命题过程中，命题人员除了应避免偏颇性（bias）试题以外，还需充分考虑到以下多种影响受试者情绪的因素合理地促使受试者最大能力水平的发挥。

1 影响受试者情绪的因素

1.1 真实性（authenticity）真实性指目的语（target language）运用特点和测试任务（test tasks）特点的一致性（Bachman，Palmer 1996），即受试者在测试中遇到的内容、任务与实际生活中能够接触到的目的语的内容、任务一致。这点在阅读理解、听力以及写作中表现明显，特别是听力对真实性的要求更高，因为听力与情景（context）的结合才能保证意义的明确。听力测试材料要有情景真实性，就是要求听力材料的内容必须现实生活中“听”的内容而不是刻录的“读”的内容。听力的材料和阅读的材料本质上有根本区别，听、说连为一体，自然化、口语化、简单化是基本特点。读的书面材料是经过加工的、正式的、高雅的表达方式。其次，真实性还要求情景对特定的受试群而言是否真正的情景（李筱菊，1996）。

1.2 互动性（interaction）互动性指受试者的个人特点在完成测试过程中的融入程度以及方式，个人特点包括语言能力（language ability）、话题知识（topic knowledge）和情感构思图式（affective schemata）（Bachman，Palmer，1996）。测试决不仅仅是命题者设计命题、受试者被动地做反应的简单的过程。语言测试的四项技能听、说、读、写都具有很强的互动性。听表面上是一方发出信息、另一方得到信息的行为，但是获取行为本身就是一种主动的、积极的过程。说的对象不论是演讲的观众还是日常交流的对象，说都是交流双方积极地、互动地进行信息传递的过程。读的互动性则是读者通过文字积极地、主动地获取作者思想，进行思想沟通。写的文字是让读者看、体会作者本身思想，显然具有读者和作者之间的互动性性质。命题人员在设计试题过程中，应充分体现这种互动。

1.3 情感构思图式（affective schema）情感构思图式指话题知识感情或情绪上的相关性使语言运用者自觉或不自觉地借助过去在相似的情景下的情绪经历来评估语言运用任务（language use tasks）的特点以及情景（Bachman，Palmer，1996）。情感构思图式可以直接影响受试者能力水平的发挥，命题人员在命题过程中应最大限度地选择中性试题，避免出现易引起民族情绪或者让受试着产生冒犯情绪（emotionally charged）的命题。

1.4 话题知识（topic knowledge）话题知识是受试者把测试和生活中的语言结合起来的信息库（information base），测试为话题知识的运用提供了一个平台。一份好的语言测试试题应该避免在某个特定领域专业性极强的内容。命题人员在命题过程中，应该避免出受试群普遍缺乏话题知识以及受试群无话可谈或不可置否的题目。测试应该是对大家所掌握的知识合理的考查，而不是对大家无知的、想象能力的考查，命题人员应牢记这一点。

第2篇：想象力测试范文

关键词：隐性流失；进入退出机制；沟通程序

1994年开展普通话水平测试以来，全国共培养了四千多名部级测试员，四万多名省级测试员，形成了一支庞大的测试员队伍。毫无疑问，开展普通话水平测试工作需要一支相对稳定的测试员队伍。然而由于管理体制和制度措施等诸多原因，测试员流失现象日益凸显。深入分析发现，流失有原因可探，有规律可循，需要我们根据情况采取措施，保持测试员队伍的相对稳定。

测试员的流失可以分为显性流失与隐性流失。显性流失，表现为一种数量上的减少。主要是指测试员长期不从事测试工作，脱离测试队伍；隐性流失，是指测试员虽未脱离测试队伍，但敬业精神和责任意识欠缺，主要表现为敷衍塞责，能力下滑，效率降低，不能尽职尽责地做好测试工作。隐性流失虽然不像主动流失表现为测试员数量上的显性缺失，但测试员“身在测试，心不在焉”的状态，潜在地影响了普通话水平测试工作的声誉，故我们将其视为一种质的缺失。显性流失和隐性流失都对测试的整体质量有着严重影响，故有专门研究的必要。

一、显性流失原因分析基于行文的方便，我们把显性流失分为主动流失与被动流失。

1、主动流失。主动流失，是指部分测试员自获得资格后，主动脱离测试队伍，从来不参加或极少参加普通话测试工作。这种流失既与其获得测试员资格的动机有关，也与测试工作特点及薪酬待遇有一定关系。

从动机上看，一些人员将获取测试员资格视为一个荣誉、一种资本，甚或作为身份地位的象征及评定职称的砝码，目的一旦达到后，不会也不愿参加测试工作；也有一些人员基于用人单位要求参加测试员资格培训，获取资格就等于完成了单位布置的任务，而不愿意从事测试工作。

除此以外，还有一些人员则是因为参加测试实践后，发现测试工作劳动强度大、待遇低，而且占用法定休息时间(多是周末测试)等种种原因，而逐渐主动脱离测试队伍。

2、被动流失。被动流失，是指部分测试员主观上不愿意脱离测试队伍，但因为各种客观原因逐渐被动淡出测试队伍。主要表现为：(1)新老交替。普通话测试工作开展至今已17年，早期获得测试员资格并积极投身于测试事业的人员，随着年龄逐渐增大，身体健康状况等原因，难以承受强度较大、反应迅速的的测试工作，而被动离开曾经热爱的普通话测试事业。(2)测试机会缺乏。目前各测试站多采用测试员主动报名与测试站选拔相结合的方式开展测试，少数测试员因获取信息滞后而失去测试机会；另外，各测试站逐渐形成自己的测试圈，每次测试多召集圈内人员，一些愿意参加测试的圈外人员，自然失去了测试机会，从而形成非主观意愿的流失。(3)测试任务量减少。经过17年的普通话水平测试，多数测试站的测试量已相对减少，测试周期、测试次数也随之减缩。例如，有的地市测试站一年仅组织一至两次测试，测试规模小，测试员参与的数量有限。

同时，随着2009年计算机辅助普通话水平测试(以下简称“机辅测试”)工作在全国范围的推广，人工测试量大大降低，测试员“供大于求”的局面不可避免。

二、隐性流失原因分析与显性流失相比，隐性流失相对隐蔽，不易觉察，往往需要深入考场、深入测试员、深入考生才能发现些许端倪。主要内容包括：(1)责任意识淡薄。具体表现为不遵循《测试员工作规程》，随意缩减测试时间或压缩测试内容；在测试过程中收发短信、接听电话等与测试无关的工作，甚至留下搭档单独测试；(2)测试能力不足。具体表现为听辨能力欠缺，测评标准把握不准，无法进行独立评判，评分以参考搭档分数为主；(3)自身定位不准。具体表现为不能正确定位与考生的关系，把自己看得高于考生，或将考生看作对立面，对待考生语言生硬态度粗暴。

测试工作是一件非常严肃的工作，上述现象的发生，值得我们认真反思。

1、测试员的思想素养、专业背景及语言环境与隐性流失。测试员良好的思想品德、职业修养以及过硬的能力素质，保障了测试工作顺利有效地开展。实践证明，多数测试员遵守测试职业道德，深刻领会测试标准，表现了较强的测试能力。但也有一些测试员职业操守不高、责任心不强，把测试事业简单视为混时间混薪酬的一项可有可无的任务，对测试事业、对考生、对自己都不负责任。

测试能力的不足与测试员的专业背景有一定关系，与测试员所处语言环境也有一定关联。长期在方言环境生活的测试员，在测试过程中很难顺利进入普通话的思维、表达和听辨状态，不可避免出现测试能力下降、测试标准把握不够的现象，从而影响测试的质量。

2、测试员队伍管理与隐性流失。我们知道，测试是一个兼职工作，不同年龄、背景、职业的人员，因测试工作而临时聚集在一起，再加上测试时间安排紧凑等原因，多采用松散的管理制度。然而，松散的管理存在显而易见的弊端：(1)缺少人文关怀，忽略测试员的需求。例如在人员配置、搭档调配上较少顾及测试员的感受和需求，造成测试过程缺乏愉悦，产生排斥甚或厌倦。出现测试评分不准或者敷衍塞责的隐性流失；(2)缺少归属感和职业共同体认同感。

3、测试工作特点与隐性流失。测试工作特点除造成显性流失外，对隐形流失的影响也不可低估：(1)兼职工作特性与隐性流失。尽管测试工作关系国家普通话水平测试整体形象，但在一些测试员眼中，这份兼职工作可有可无，敷衍塞责等隐性流失现象比比皆是。(2)时间安排与隐性流失。普通话水平测试工作一般利用节假日进行，这种特殊的时间要求可能与一些人员的休息(工作或学习)时间发生冲突。测试员平时要做好本职工作，周末还得牺牲休息时间从事测试。久之，职业(兼职)倦怠自不待言，隐性流失亦水到渠成。(3)劳动强度与隐性流失。普通话水平测试工作强度非常大，既是繁重的体力活：在一个既定时间单位内(3小时左右)连续测试18―20名考生，耗时长、密度高、机械化；又是紧张的脑力活：在考生音声稍纵即逝情形下，需要迅速捕捉考生的错误缺陷，进行快速判断、分析和计算等工作，眼耳手心并用，大脑神经时刻处于紧绷状态。体力和脑力的过度消耗，使听辨水平和测评能力难以保持一贯。

三、防治测试员流失的对策措施

(一)建立正常的测试员进入退出机制

1、明确进入机制，根据需求严格选拔测试员。“测试员资格制度是国家对测试工作实行的一种准入制度，是国家以部门规章确立的一种资格认证标准”。《普通话水平测试管理规定》对申请省级或部级测试员证书者，提出了严格要求。各培训测试机构，应严格遵守《普通话水平测试管理规定》，把好测试员资格人口关，通过精心考察，选拔思想素养高专业素质强，具有相应学历，“普通话水平达到一级”，“熟悉推广普通话工作方针政策和普通语言学理论，熟悉方言与普通话的一般对应规律，熟练掌握《汉语拼音方案》和常用国际音标，有较强的听辨音能力”的人员，参加普通话测试员资格培训班。省级或部级普通话培训测试中心则严把培训考核关，将考核质量与各推荐选拔单位挂钩，确保省级或部级测试员的质量。

2、健全退出机制。国家先后颁发了《普通话水平测试实施办法(试行)》《普通话水平测试管理规定》等规章制度，对实施测试员资格准人制度提供了有力保障，但是与之配套的退出机制不够完善。例如，《普通话水平测试实施办法(试行)》第十条规定，“测试员不能正确掌握测试标准或在工作中有行为时，省(自治区、直辖市)或部委直属单位的普通话水平测试委员会应在一定期限内(半年至一年)停止其测试工作，错误性质严重的应撤销其测试员资格”；《普通话水平测试管理规定》第二十四条规定“测试工作人员违反测试规定的，视情节予以批评教育、暂停测试工作、解除聘任或宣布测试员证书作废等处理，情节严重的提请所在单位给予行政处分”。上述规定仅限于对“不能正确掌握测试标准或违反测试规定”的测试员提出惩处措施，但对于从不参加或长期主动脱离测试工作者。却没有相关的处理办法。那些从不参加测试的人员“没有违反测试规定，仍然持有测试证书”，占据着测试员名额。

建立健全测试员资格退出机制，确立相关规定与执行措施，势在必行。完善的规定与强有力的执行措施，有助于预防测试员数量上的显性流失以及质量上的隐性流失，提高广大测试员的积极性和主动性，保证测试工作的质量和部级考试形象。

(二)建立科学的测试员培养机制，确保测试员队伍的整体质量

1、资格培训与后续培养相结合，全面提高测试员的思想素养和专业技能。测试员的培养是一个长期的过程，而测试员资格培训是其重要起点。但“经过短期强化培训获得测试员资格只是获得测评技能的开始”。

后续培养有助于弥补资格培训时间短、任务重，评分标准掌握不牢的缺憾，对于缺乏时间连续性的测试实践，有极大补充、巩固的功效。后续培养包括定期培训与考核，要求目标明确，时间有序，内容突出，方式灵活。通过职业道德教育、语言理论探究、语言文字政策宣讲、录音测评训练等内容的定期培训，继续提升测试员的思想道德素养、职业尊崇感及语言理论修养。引导测试员把握国家语言文字政策的动态发展；通过对普通话口语水平、测评能力以及测试工作量、工作态度、遵守工作纪律等情况进行定期考核，可有效防止测试员普通话水平下降、测评标准遗忘以及测评能力降低等隐性流失问题。

2、以活动促培养，增强测试队伍的凝聚力。定期开展各种活动，是测试员培养的有机组成部分。通过联谊、学术研究、专家讲座、业务交流等活动，给测试员创建合作交流的平台，提供密切情感联系、思想交流、经验探讨的机会，有助于测试员敞开心扉，解决测试中出现的疑难、困惑。活动还可以令职业背景各异日呈分散状态的测试员感受到测试集体的温暖和关爱，增强职业认同感和凝聚力，有效防止流失现象的发生，促进测试工作的完善。

(三)建立科学化人性化的监管机制，加大执行力度有效的监管体系，可以最大限度地防治隐性流失，保障测试工作的质量。2003年《普通话水平测试管理规定》和《普通话水平测试规程》的颁布实施，保障了测试工作的有效开展。但从目前的测试实践看，还需加大执行力度：

1、奖惩措施落到实处。各级测试机构做好测试员个人实绩的考评工作，定期考查测试员的业务能力和工作表现，从工作态度、测评数量和质量等方面对测试员进行正确评价，并予以相应的奖励与惩罚。提高优秀测试员选拔比重，予以重点培养扶植，保护优秀测试员的测评积极性。对于评分质量较差、工作态度简单粗暴的测试员，及时批评教育，并依据《普通话水平测试管理规定》进行相关处罚、淘汰。

2、测试任务分配人性化科学化。普通话水平测试分为人工测试和机辅测试两种。针对人工测试任务集中、单位时间劳动强度较大的特点，可以酌情减少单位时间测试量，减轻测试员的身心压力。对于因时间地点与测试安排冲突形成的流失问题，可通过分配相对灵活的机辅测试任务来解决。两种测试相互搭配，科学配置，降低测试员劳动强度，给测试员相对的选择自由，从而提高测试质量。

3、构建测后沟通程序。在实际测试中，测试任务一旦完成，工作即宣告结束，“来也匆匆，去也匆匆”，人际间缺乏沟通交流。长此以往，测试员及测试机构逐渐成为“机械化”“工具化”程序的一个组成部分，隐性流失自然发生。测后沟通程序的建立，有助于测试机构了解测试员的心理需求和疑难困惑，从而采取相应措施。测后沟通可以通过约谈、交流、填表、讨论、QQ等方式了解问题解决问题，充分发挥测试员的主观能动性，增强职业的认同感。

4、改革复审方式。国家规定，各测试机构聘请复审员”检查、监督测试质量，参与指导测试工作”。检查测试质量主要采取“抽查复听测试录音的方式”，测评监控的重点放在测试成绩的复核认定上。但录音复审仅限于评分质量的检查，对于测试过程却缺少监控。可在录音复审的基础上，进行现场随机抽查复审。通过现场复审了解测试各个环节、程序是否严谨到位，并且通过复审员与测试员的互动沟通，及时发现问题和解决问题，从而有效避免测试员态度不端、程序不严等隐性流失现象。

参考文献：

[1]国家语言文字工作委员会、国家教育委员会、广播电影电视部，关于开展普通话水平测试工作的决定[Z]1994.

[2]中华人民共和国教育部，普通话水平测试管理规定[Z]，2003.

[3]中华人民共和国教育部语言文字应用管理司，关于印发《普通话水平测试规程》的通知[Z]2003.

[4]孟晖，普通话水平测试员资格有效性问惠的思考[J)，语言文字应用，2010(11)：113-120.

[5]齐影，普通话水平测试员成长和培养的思考[J]，广西教育，2010(7)：12-14.

第3篇：想象力测试范文

关键词：高职学生；国家学生体质健康标准；健康状况

中图分类号：G715 文献标识码：A 文章编号：1672-5727（2013）09-0029-03

“健康的体魄是青少年为祖国和人民服务的基本前提，是中华民族旺盛生命力的体现。”这是中共中央国务院在新的历史条件下对青少年学生提出的希望和要求。高职学生处在身心健康和各项身体素质发展的关键时期，其年龄一般是18～22岁之间，处于青少年时期更要树立身体好、学习好、工作好的“三好”思想和德智体全面发展的理念，只有这样才能为国家做出更大的贡献，拥有更加幸福的生活。本文通过对苏北高职学生体质健康认知调查，了解高职学生体质健康认知状况，为更好地开展高职体育教学，引导学生积极参与体育锻炼，改善体质测试各环节提供依据。

研究对象与方法

（一）研究对象

以高职学生对《标准》认知现状为研究对象。以苏北（徐州、连云港、宿迁、盐城、淮安）五个城市的高职院校为调查对象，共调研了13所高职院校。

（二）研究方法

文献资料法根据研究需要，笔者查阅了大量的相关资料，并对收集的资料进行初步鉴别、整理和分类，为本文的研究提供了充实的理论依据。

问卷调查法该研究共发放问卷993份，回收921份，其中去除无效问卷23份，有效问卷898份，总有效率90.4%。本地学生问卷通过现场发放现场回收方式，外地学生问卷通过邮寄给各院校的负责老师进行发放和回收。

数理统计法通过问卷调查所获得的数据，采用Microsoft Excel进行存储、分类和整理，并对统计结果进行相关分析。

研究结果与分析

（一）高职学生对健康方面的认识

《标准》在实施过程中始终坚持以“有利于国民对健康概念的重新认识；有利于明确地帮助和督促学生实现健康目标；有利于引导学生选择简便易行、实效性强的项目进行锻炼；有利于科学、综合地评价学生个体的体质健康状况；有利于促进学校全面实现体育与健康的课程目标”为原则。调查表明，有91.7%的学生认为，健康就是身体、精神及社会生活中的完美状态；此外，有1.2%的学生认为健康就是身体强壮、有力气；3.5%认为是身体没有疾病；3.6%认为身体素质好、体育成绩好，这些都是单一的、片面的健康观。在对影响健康的主要因素调查中发现，能全部选择正确的仅占7.6%，在各具体因素中，认识最好的是行为和生活方式因素，占54.7%，其次是生物遗传因素、医疗卫生因素和环境因素，各占46.8%、37.2%和31.2%。这些数据应引起我们的重视。

（二）学生对《标准》测试目的和意义的认识

《标准》测试是为了贯彻落实“健康第一”的指导思想，充分发挥学校体育在素质教育中的作用，促进学生积极参加体育锻炼，上好体育课，改善学生体质和健康水平，并作为学生毕业的基本条件之一。通过《标准》测试，可以使学生更清楚地了解其体质与健康状况，根据每个学生的测试结果，有针对性地选择锻炼方式，从而达到全面健康的目的。

在《标准》测试主要目的的调查中发现，认为“评定体质健康状况，促进健康”，约占78.3%（如图1所示）；有77.8%的学生基本了解测试的意义（如图2所示）。从图2中，可以看出苏北高职学生的体质健康观念是进步的，他们已经意识到体育锻炼有利于促进自身健康的发展，认识到了健康的重要性，这也与高等院校体育教学加强大学生健康意识教育密不可分。

（三）学生对《标准》测试项目的认识

在本研究中，我们调查了学生对测试项目的认识和理解，《标准》实施的重要意义就是贯彻落实《体育法》和“健康第一”的指导思想。其根本目的是促进学生全面协调发展，提高身体素质和运动能力，激励学生主动上好体育课，积极参加体育锻炼，养成正确的行为习惯和健康的生活方式，从而形成终身追求健康的意识，全面实现体育与健康课程目标。为了实现这一目标，学生健身的意识和锻炼的过程则更为重要。健康来自适当运动，有了持之以恒和循序渐进的健身过程，那么健康的评价结果自然就可获得。在《标准》测试项目中，面向大学生的选测和必测项目共计14项，通过调查可知：作为单一项目和技术类项目的跳绳、篮球运球、足球运球、排球垫球通常不作为选测内容，也就是各院校进行测试的选测和必测项目计10项（学生的认识情况见表1）。

由表1可知，由于部分选测项目学生没有参与，所以，学生对必测项目有较好的认识，可凭自己的感觉选择；在这10项中认识最好的是身高标准体重，正确率占87.6%，即认为身高标准体重是反映身体生长发育水平和营养状况，这与现在社会上人们对形体的关注度关系较大；其次是握力，从各学校选测项目来看，选择握力的院校占总数的69.2%，关注较多，因此，学生对握力的认识较好；肺活量体重指数作为学生肺通气功能的测试项目，83.9%的学生对肺活量体重指数认识正确，作为必测项目认识较好。整体而言，身体健康方面的测试项目要好于身体素质方面的测试项目，最差的当属50米跑，正确率仅为42.1%，这可能与苏北高职院校选择的选测项目有关，仅有15.4%的院校选择测试50米，其余均选择了测试立定跳远，致使学生对50米跑的认识较差。由此也可得知，学生思想上不重视和不能够正确认识《标准》的内容及项目，同时也说明在《标准》实施过程中，宣传和动员工作效果不甚理想。

（四）学生对《标准》测试态度的认识

态度来源于人们对事物的欲望、愿望、需求与信念等行为的反应倾向，是个人复杂的心理状态，是一种感受。态度在个人心理生活中占有重要地位，它不仅是构成人的性格特征的重要方面，而且是人的理想、信念、世界观等个性倾向性的表现，与认识、情感有着必然的联系。学生对待体育锻炼的态度和对自身健康的认识也影响着《标准》测试。通过对苏北高职院校的调查发现，有87.9%的学生对自身体质健康状况是非常关心和比较关心的（如图3所示），但在对《标准》测试重视程度上，非常重视和比较重视的仅占67.1%（如下页图4所示），这说明《标准》测试经过多年的实施，对大学生的体育锻炼已经起到了促进作用，但是还有三分之一左右的大学生没有引起重视，说明此项工作还需进一步加强。

《标准》测试数据能否如实反映体质健康状况，通过对苏北高职院校学生的调查发现（如图5所示）：基本能和基本不能所占比例最大，说明学生对测试数据还是有异义的，也说明了测试数据准确性的问题和选测项目的设置问题，这对《标准》实施的长远发展是不利的。

在对学生参加《标准》测试的取向性调查上，有55.7%的学生认为参加体质健康测试是为了了解自身健康状况（如图6所示），也有部分学生是为了“测试”而测试，虽说部分学生主动锻炼的积极性不高，但把《标准》测试合格、良好和优秀作为学生获得毕业证和评定奖学金的必要条件，则有助于促进学生积极参加体育锻炼，也有助于学生从根本上改变参加《标准》测试的目的，这对于学校体育工作的开展和《标准》实施工作的推行是非常有利的。

（五）学生对《标准》测试舞弊的认识

学生测试结果的评价可分为两个部分，首先是对学生测试的各个单项进行分别评分，得出得分和评价指标，然后为每个学生给出一个总分和等级，依据表1-7各个评价指标对应的权重，各单项得分累加，用总分进行等级评价，共分为四个等级，满分为100分。（1）总分90分及以上为优秀；（2）总分75分～89分为良好；（3）总分60分～74分为及格；（4）总分59分及以下不及格。

《标准》实施办法中第三条规定，学生《标准》测试成绩达到良好及以上者，方可参加三好学生、奖学金评选；成绩达到优秀者，方可获体育奖学分。《标准》成绩不及格者，在本学年度准予补测一次，补测仍不及格，则学年《标准》成绩为不及格。普通高校学生毕业时《标准》测试成绩达不到50分者按肄业处理。通过对苏北高职院校学生问卷调查统计发现，在测试过程中，无舞弊现象的占52.7%，少部分有舞弊现象的占31.6%，舞弊现象较严重的占4.5%，不确定的占11.2%。这是因为学院还未完善规章制度、对《标准》的宣传工作没有做到位、学生为了得到高分或是害怕自己不及格和担心毕业问题，所以很容易导致舞弊现象的发生。同时在测试过程中，教师少而学生多，作弊或舞弊的学生又相对隐蔽，测试人员很难及时发现作弊或舞弊现象。另外，部分测试人员的态度和处罚过轻也或多或少地助长了《标准》测试舞弊的不正之风。如果任由这种不良现象蔓延，不仅会干扰正常的测试工作，影响测试结果的准确性和可靠性，而且违背国家实施《标准》的初衷，损害了《标准》的严肃性与科学性。

结论与建议

（一）结论

绝大多数高职学生对健康概念的认识是正确的，但是对影响健康的主要因素认识不全面。多数高职学生对《标准》测试目的有比较清晰的认识，对《标准》测试的意义基本了解，但重视程度不够，只停留在基本认识的层次上。学生对《标准》测试项目仅仅局限于需要测试项目的了解，对不进行测试的项目了解不够，自觉参加体育锻炼的行为上与认识还有差距。学生对《标准》测试态度较好，已经意识到体育锻炼对于促进自身的健康有益，对学生学习体育健康知识和养成良好的锻炼习惯具有促进作用。多数学校都存在舞弊现象，严重性不一致，但大部分学校舞弊现象不严重。

（二）建议

1.加大体育锻炼对健康促进作用的宣传力度，培养学生树立“健康第一”的观念，培养学生参加体育锻炼的习惯、兴趣、爱好，指导学生自觉参加体育锻炼，为学生步入社会后的终身体育锻炼奠定基础。

2.加强对体育课程和《标准》测试的宣传引导，强调体质健康在工作和学习中的重要性，把体质健康知识的学习内容作为大学体育与健康教学内容的补充，使学生更加全面地了解《标准》实施的目的和意义，从根本上减少和杜绝作弊行为，使学生从思想的重视转变为行动的坚持，最终形成终身体育的思想。

参考文献：

[1]宴瑞琴，吕金江.云南省大学生对体质测试的认知现状分析[J].体育世界（学术版），2010（2）：8-9.

[2]赵英俊.实施《国家学生体质健康标准》的研究与实践[J].宁波工程学院学报，2010（3）：51-55.

[3]尹林.对实施《国家学生体质健康标准》问题的几点思考[J].成都电子机械高等专科学校学报，2009（3）：94-98.

[4]王雨霏.西安市高职院校学生体质健康现状及对策研究[D].陕西：陕西师范大学，2009.

第4篇：想象力测试范文

一般认为智力由观察力、记忆力、思维力、想象力等基本因素组成，因此外企的智力测试也着重考察这些方面，有时是注重其中某一方面，有时则对几个方面进行综合考察。

（1）侧重考察思维力的测试

如某公司的面试题目：如果你让工人为你工作7天，给工人的回报是一根金条。金条平分成相连的7段，你必须在每天结束时给他们一段金条，如果只许你两次把金条弄断，你如何给你的工人付费？像这类题目如果思路不正确的话，往往会陷入怪圈，百思不得其解。当然题目本身也确实是有一定的难度，要具备相当的智力水平才能回答。尽管很多人知道答案（两次弄断应分成三份，把金条分成1/7、2/7和4/7三份。这样，第1天可以给他1/7；第2天给他2/7，让他找回1/7；第3天再给他1/7，加上原先的2/7就是3/7；第4天给他那块4/7，让他找回那两块1/7和2/7的金条；第5天，再给他1/7；第6天和第2天一样；第7天给他找回的那个1/7）后都有恍然大悟的感觉，但事实就是如此，尽管看起来简单，而在不知道答案之前就是想不到正确的答案。

（2）侧重考察观察力的测试

这类测试往往包含在一些图形认知测验中，相对来说比较简单，只要仔细观察，认真分析，正确回答尚不困难。如下图中公共汽车将驶向哪个车站？答案其实很简单，只要你平时认真进行过观察，回答出来简直易如反掌。

（3）侧重考察记忆力的测试

记忆力对人来说非常重要，虽然人们平时不觉得，但在生活中几乎随时都离不开记忆力的应用，如常用电话号码、公交路线、经常要去地方的地址，基本上都储存在我们的大脑中，也似乎永远不会忘记。在工作中，客户给你的电话你可能来不及或不方便写下，而只能记在大脑中，但往往很快就忘记了。记忆力测试一般来说也没有对错之分，只有一个评价表，得分高，记忆力好；得分低，记忆力差等。

如有的公司让求职者接受这样的测试以考察其记忆力水平：随机拿16样物品；将16个物品放在一个4*4的方格中，给一分钟的时间记住物品摆放的位置；将这16个物品拿走，然后由受测者用最短的时间恢复物品摆放的次序。最后统计求职者摆放物品的正确数量从而推知其记忆力的强弱。

（4）侧重考察想象力的测试

第5篇：想象力测试范文

研究的进展不大，学科的成熟度不高，与我国广泛开展的教育评价活动很不适应．我国各省市都有考试院（中心），也成立了许多评估、评价机构，广泛展开了对教育测评估评价活动。而与此相应的教育测验、教育统计、教育测量、教育评估、教育评价理论很不成熟．尤其值得重视的是教育评价与教育研究和发展，以及对教育评价实践的指导．鉴于此，本文对与教育评价相关概念进行简述和辨析．

一.关于教育评价相关概念简述

教育测验：即为考试，它是对人的知识、技能和能力以及某些心理特征的测量。考试是教育评价的一种手段。考试是个系统，它由主考、

被考（考生）、试卷（试题的集合及其评分标准）、考分四要素组成。考试的过程就是主考组织编制试题，通过试题作用于被考，将正确答案、评分标准与被考的反应（答案）相比较，然后给出考分的过程。考试从宏观上可分为社会考试和教育考试两大类。教育考试又可分为校内考试和校外考试两类。按考试分数的解释与使用，可分为常模参照性考试和标准参照性考试。按考试对象分，有学业的成就考试、学术能力倾向测验（其目的在于测量考生学习的潜在能力、发展倾向，如音乐能力倾向测量）、人格测验（如测量态度、兴趣、情绪、性格等）．按测验人数分，有个别测验、团体测量．接测验方式分，有纸笔测验（用笔时试卷作答）和非纸笔测验（如口试、实验操作、表演等）。其它可分为难度测验、速度测验、总结性测验、诊断性测验以及大规模测验（其成绩的使用有权威性，要求严格，标准化程度高）、教师自编测验（即教师自编用于课堂教学的测验）等．[1]

教育统计（学）：运用数理统计学的原理和方法研究教育现象中的数量关系的一门应用学科。它通过数据的分析和处理，准确地掌握教育

情况，为制定教育方针、政策提供科学依据，为开展教育科学研究，探索教育规律，制定教育方案，检查教育效率提供科学方法，也为教育管理和教育评价提供有效的工具．它分为两大类：一是描述统计学，研究简缩数据和描述这些数据，二是推断统计学，用数据进行统计检验，统计分析和非参数统计法作出决策。前者只是分析某一样本的特点，而后者则是通过抽取母体的一个样本，并以此样本为根据来分析母体的特点．它是在教育问题的研究中，描述样本，分析样本，分析样本与总体的关系，从而进行教育科学推论的一种原理和方法．其研究方法一般有：大量观察法、统计分组法、综合指标计算法、统计资料检验法、统计资料图示等。[2]

教育测量（学）：研究如何测量学生的学业成绩、学习能力、兴趣爱好、思想品德以及教育效益等问题的一门教育学科。它运用各种测量

手段和数理统计方法等数学工具，根据教育目标或教学计划的要求，研究如何测量和评价教育效果，如何编制测量计划，各种类型试题的优缺点，衡量一个学业成绩测验好坏的数量指标，如何进行测验结果的统计分析，测验分数的解释和评价等．其主要内容包括：测量原理、项目分析、效度、信度、标准化测验、测验的设计和编制、测验的常模、测验的实施和评分、测验结果的解释等。[3]

教育评估：是一种有系统地去寻找并搜集资料，对评估对象作预测性、估计性的评判，以便协助教育决策者从若干种可行的策略中择一而

行的过程．在我国教育评估与教育评价不作严格区别，在实践中具体运用时，不同的范围和场合有不同的习惯用法．如高等教育中多用评估，在督导部门也称督导评估，而在普通教育领域多用教育评价不过两个概念是有一定区别的．评估有估价的含义，较为模糊粗略，而评价相对而言是较为精确的价值判断，评估多用于群体或单位的状态及效果的估价，而评价则既有对群体和单位的价值判断，也有对个人的判断．教育评估的一个重要目的就是为教育决策提供重要依据，国家教育管理部门要根据教育评估的结果，及时调整教育的决策。教育评估的结果对国家、对学校都是一份咨询材料，而不是行动纲领．[4]

教育评价（学）：以教育为对象，研究各类教育目标与相应的教育现象之间的关系，并给予一定的价值判断的学科．它的研究范围可划分

为：宏观教育评价（研究教育思想评价和教育制度评价）和微观教育评价（研究学校教育系统内部各类教育思想和教育活动的评价，如学校办学思想、学校领导管理质量、教师教育和教学质量、学生德智体全面发展质量的评价等）。它的基本范畴是：教育评价的对象，教育评价的范围，教育评价的模式，教育质的规定性评价，教育量的规定性的评价，教育质和量变化的度的评价，教育评价的指标体系，教育评价的类型．其研究的基本原则有：客观性原则、理论联系实际原则、发展性原则和联系性原则．其种类包括目标评价、过程评价、条件评价、贡献评价等．[5]

教育评价（学）：教育评论学是研究教育评论现象和教育评论活动规律的科学．或者说它是研究教育评论的历史、现状，教育评论现象的

本质联系，教育评论工作的性质、任务和作用，以及教育评论工作的原则、方法的科学．教育评论学是与教育理论、教育史并列的一门教育学科．要建立教育评论学的学科体系，必须解决两大难题，即建立教育评论学的范畴体系和概念体系，并给予科学的揭示和阐述，使这些概念和范畴形成一个有机整体．同时，还要运用这些概念、范畴及其所固有的内在联系，采取科学的方法论证教育评论活动中最普通、最一般的科学原理；从而揭示出整个教育评论活动及其形成和发展的基本规律。教育评论学的研究对象和任务，从根本上规定了教育评论学的学科性质和范畴．首先，教育评论活动是一种教育科研活动，它的直接结果是鉴别、评判教育文化的优劣，进而对教育界产生社会舆论导向作用；而教育文化本身及其所产生的依附于受教育者身心的精神产品，都属于馐缎翁冻耄杉逃缆奂沂粲谘芯恳馐缎翁徒沂窘逃缆刍疃谋局使媛桑⑼暾慕逃缆垩аЭ铺逑怠K裕逃缆垩б彩粲诨±砺垩Э啤T俅危逃缆垩У难芯慷韵缶龆私逃缆垩婕罢鼋逃煊颍诤址岣弧R部纱硬煌咏牵攵圆煌冻虢⒍嗖棵拧⒍嗖愦蔚姆种аЭ疲ㄈ纾航逃砺燮缆垩А⒔逃菲缆垩А⒔逃姓缆垩А⒔逃移缆垩У龋越逃缆垩в质且幻抛酆闲缘难Э芠6]

二、关于教育评价相关概念与教育评价的关系

教育评价与教育测验的关系：教育测验是对人的知识、技能和能力以及其他某些心理特征的检测，是教育评价的一种手段，确切地说它是

教育评价获得评价信息的工具之一．教育评价获取信息的测验法就是来自于教育测验．

教育评价与教育统计的关系：教育统计是运用数理统计的原理和方法研究教育现象中的数量关系，通过数据的分析和处理确切地掌握教育

情况，也是教育评价的一种手段和工具。教育评价中获取信息的统计法就来自于教育统计。

教育评价与教育测量的关系：教育测量通过对学生知识的掌握、智能的发展、思想品德的变化、体质的状况以及教育活动的各个方面的测

定，为教育评价提供依据，是教育评价信息的主要来源．如果没有教育测量提供的资料，教育评价将成为无源之水，失去了作价值判断的依据，其科学性、准确性便无从谈起。另外，教育测量的结果只有通过教育评价才能获得实际意义，成为改进教育工作有参考价值的信息．[7]

教育评价与教育评估的关系：教育评价与教育评估是非常相近的两个概念，在许多场合是通用的。评价是精确的价值判断；而评估是估计

的、预测性的价值判断。在我国从政府的文件到学者的文章论著，以及教育实践都把评估与评价混用。我个人倾向于把教育评估的对象限定在以宏观、中观的复杂教育系统的战略性、预测性估价方面，对于微观的较简单的教育系统的过去和现存实态则作为教育评价的对象。

教育评价与教育评论的关系：教育评论是对教育文化的反思和展望，它的对象是以教育文化中的精神文化和制度文化为主的，以真善美作

为评论标准的观念活动。严格讲它与教育评价虽只一字之差，但它与教育评价分属于教育科学的不同领域，有着重大区别。比如，教育评价是一种管理活动，而教育评论则为观念活动；教育评价由评价机构按严密的程序实施，而教育评论则由教育评论家个人采用灵活多样的方式方法评述；教育评价有明确的指标体系并要求量化，而教育评论无需指标体系更不用量化，教育评价的对象是具体的可控的，而教育评论的对象是抽象的，不可控的；教育评价的结果多用于改进工作，而教育评论的结果则多用于改变观念；等等。这不是说教育评价与教育评论一点关系都没有，它们的关系表现在教育评价的结果可以成为教育评论的论据影响教育评论，而教育评论的结果可以作为教育思想观念影响教育评价所依据的教育价值观。

三、从价值论角度看与教育评价相关概念的区别

唯物主义的价值论认为，价值判断和事实判断是人们把握客观世界和两种不同方式。两者反映的对象、意义和参加的心理成份都有着质的

区别。事实判断是以客体的本质和规律为对象的，它探讨客体“是怎样的“、”是什么“，探讨事物的现象、本质和规律等实体属性，即以理性认识这种抽象思维形式反映客体的本质及其规律。而价值判断是以客体与主体需要的关系为对象，它探讨客体的价值属性，即客体的社会意义------对社会需要意味着什么，它以多种意识形式-----认识（价值与事实判断）、情感（对价值的态度体验）、意志（对价值的自觉保证）等诸种形式的综合来反映客体与主体需要的关系。

第6篇：想象力测试范文

正确并适当地运用考试，对促进学生的学习有重要的意义，因为考试对学生的学习成绩是一个较为客观的检验。通过考试，学生可以正确地认识到自己在学习中的优缺点，以及存在的问题，从而使学习不断完善和提高，这对于高三的学生来说尤为重要。而考试的命题是考试中的中心环节，考试的指导思想及考试能否发挥其应有的作用，主要体现在命题上。因此，必须认真严肃地对待考试命题，在高三教学实际操作过程中，在考试命题这方面，有些教师未能引起重视，常常会步入英语命题的一些误区。

误区之一：适度性失控区分度差

在命题过程中，有些教师对试题的难易程度掌握不准，而出现适度性失控现象。因为试题的难易程度直接影响考试的效度，过难或过分容易的试题，考试结果都会呈正态分布，它无法区分考生的实际差别，也就是说在命题过程中没有掌握好试卷的区分度。一份试卷测试下来，学生都考140分以上或都在90 分以下，这就失去了考试的价值，达不到测试的目的。因此，在命题时应注意不能为了测试学生的基础而命制一份太容易的试卷。同样，也不要为了测试学生的能力而在试题中脱离了教学大纲和考试大纲，出现许多难题、怪题、偏题，例如：

There is______ than China，one can do as he pleases here.

A.no more free country B.not more free country

C.no free country D.no cuntry more free

总之，一份好的试卷应具备一定的梯度。近几年来，高考NMET的英语试卷是按4：4：2的原则来命题的，即基础题和中档题各占十分之四，而难题仅占十分之二。在高三英语综合测试命题过程中也应遵循这一原则，注意区分度。

误区之二：缺乏较高的信度和效度

在高三外语命题过程中，虽说有些教师也注意到了试卷的信度和效度，但由于考虑不周，会出现这样那样的问题，而使得试卷的信度和效度降低。坚持试题之间彼此独立的原则，也是提高试卷信度和效度的一个方面，即题与题之间不能有暗示答案或线索在本份试卷中就能找到的现象，每一道题都必须靠学生积极地去追忆、思考。而不靠已有的答案去推理或选择。一份综合试卷内容重复越多，考试的信度和效度就越低。有些教师在设计试题时，只注意到选择一些符合考试要求的题目，而忽略了题与题之间的独立性。

例如：想考查学生“旅馆”的单词拼写，但在选择阅读理解文章时.却选用了关于旅馆服务这一方面的文章。在文章中更无疑问会出现该词；再如，在选择填空中想考查学生关于miss当“错过”讲的用法，而在阅读理解或字形填空中同时出现了该词接动名词的句子.这样考试的信度和效度就大大降低了。

另外，有些教师在选题时，本想更多地考查学生所学的知识点或进一步考查学生的应变能力，而将原选择题的选项改掉，但由于考虑不全，而使得该题出现多个正确答案。例如，下面一些试题就属这类现象：

（1）That is the result，for which they _____.

A.have answered B.have been prepared

C.have asked for D.have never made up

（2） ____ a two-week vocation during the year.

A.He only has B.He has Only

C.Only has he D.Only he has

（3）Everyone bought ____ lunch to the public.

A.their B.them C.its D.his or her

当然，要想一份试卷有较高的信度和效度，得从多方面去考虑，才能完善。

误区之三，重点不突出

在高三外语命题前，教师首先得明确该份试卷测试的目的和重点，是单元测试还是综合测试还是专项训练。在命题时应既能突出重点又要注意扩大覆盖面，注意点与面的结合。如果是单元测试，重点就应放在本单元所复习的内容上，把这些内容渗透到本单元的测试试题中来，这样也可以把即将复习到的内容适量体现出来。但有些教师未能把握好这一点，在单元测试选择题中仅仅出现了少数几条，而出了一份像综合测试那样的试卷。考试的目的主次颠倒。如果是综合性试卷，重点就应放在对学生语言的运用和知识点考查相结合这方面，在设计试题时，就得覆盖面大，综合能力强，不能一份综合选择试题中出现了二条虚拟语气或二条介词冠词这种现象。即使是专项训练练习，也应注意这一点。

误区之四：导向性错误

从近几年来的高考NMET试题中，我们不难看出，高考试卷对学生的要求更加提高，更加全面，它不但要求学生掌握英语的基础知识，而且更加突出对学生语言使用方面的考查，这就是高考对高三外语复习的导向性。在高三外语命题过程中，教师也应该注意整份试卷的导向性。如果试题脱离了教学大纲和考试大纲，出现了难、偏、怪题，就很难测出学生的真实成绩，并导致学生在复习中的盲目性，学生认为基础知识不重要，不重视基本技能的训练，一味地去寻找一些难、偏、怪题，而走向了一个极端，最终会以失败而告终。如果考试只考要求记忆的纯词汇、句型、语法等试题，就会使学生养成死记硬背的习惯，阻碍了学生智力的发展，也不符合高考选拔人才的要求。

误区之五：缺乏信息反馈

考试是对教学效果和学习情况的双向考查，通过考卷可以得到大量的回授信息。在信息的反馈中，教师会看到学生在哪些方面欠缺，是知识点掌握不牢，还是应试、应变能力差，还是出现了非智力因素而导致的失分现象等等。对于学生的这些信息反馈，教师应引导重视。有的教师只满足于讲授和对答案，而不注重错题的再现，这本身就不符合认知规律。教师在命题时应注重错题的再现，当然要注意改头换面。例如，在考试后发现由于句子结构不同而导致的结构选择题是学生感到较为困难的题，我们就可以在下次的试卷中分别设制下面一些题目：

（1）Don't let the child who is ____ go to school. [D]

A.so young as to B.not old enough to

C.too young to D.not old enough

（2） Could you tell me the way you are thought of ____. [A]

A.to do it B.doing it C.do it D.has to do it

（3）He was often listened ____ in the next room. [D]

A.sing B.sung C.to sing D.to to sing

（4）The man will use what he has ____ a camera for his

wife. [A]

A.to get B.got C.buy D.had bought

（5）He did what he could ____ her.[B]

A.calm B.to calm C.calming D.calmed

误区之六：缺乏考试的全面性

第7篇：想象力测试范文

【关键词】集中联想无意识知觉误导信息想象

对错误记忆现象的研究主要集中在对单词和对事件的错误记忆研究，但近期，众多研究者将研究的关注于一个新的错误记忆的研究领域――想象膨胀。与DRM范式相比，想象膨胀有更高的生态学效度。

一、对单词的错误记忆研究范式

（一）联想研究范式

集中联想范式也称DRM范式，该范式的经典实验过程包括学习阶段和测验阶段，学习阶段让被试学习某些具有关联性的词，这些词称为学习词，它们与一个关联词（也称关键诱饵）相关联。关键诱饵在学习阶段不出现，在测验阶段让被试进行自由回忆，结果被试表现出对关键诱饵的错误回忆或错误再认。此项研究将学习―自由回忆扩展为学习―回忆―再认，并最终形成DRM研究范式。在DRM范式中存在的一个基本观点是：人类的记忆是有关联的，如果两个事件有语义相关，那么加工一个事件的同时就会激活另一个事件。

Hintzman（1988）向被试呈现一个包含熟悉名词的多种类别的词表，每个类别中含有1个、3个或5个范例，在学习中随机呈现。在随后的再认测验中发现，被试对于学过范例的再认要高于对未学过的相关范例的错误再认，但正确和错误再认均随着学习过程中同一类别范例数量的增加而增加。Seamon等（2000）在其研究中将同一类别中的各个范例按照从高频到低频排列，同时考察了对图片和单词的错误记忆，结果发现被试对高频范例的错误再认要高于低频范例。这些研究结果表明，无论是文字还是图片形式的学习当，被试在学习过程中看到一个类别的多个范例后，都可以错误地再认出未呈现过的类别范例。

（二）无意识知觉研究范式

Jacoby和 Whitehouse （1989）使用特定的实验程序观察到了在无意识知觉影响下发生的错误再认现象。在实验中先向被试呈现由一系列单词组成的学习词表，并告之随后将进行再认测验让其判断每个测验词是否先前在词表中呈现过。在词表再认测验阶段，每个测验词呈现之前先以短暂的时间闪现一个背景词，并在视觉上对它进行掩蔽以防止被试看到，还区分了两种呈现时间条件：有意知觉和无意识知觉条件。结果发现，背景词对测验词的影响依赖于背景词的呈现时间长短，当背景词的呈现时间较短时，一个没学过的测验词在匹配背景下比在不匹配背景下更有可能被给出“旧的”反应；而当背景词呈现时间较长时，则出现相反的效应。

二、对事件的错误记忆研究范式

（一）误导信息干扰范式

Loftus向我们提供了在实验室中对另一种类型的错误记忆（即人们对事件的错误记忆）进行研究的新方法，这种方法后来被称为误导信息干扰范式。该范式的一般程序为：先让被试观看关于某事件的录像或幻灯片，然后向其提供含有误导信息的关于该事件的其他描述或问题，在一段时间间隔后：要求被试根据记忆回答一些问题，最后对被试回答的准确性和自信水平进行分析。

（二） Kassin - Kiechel研究范式

Kassin 和 Kiechel （1996）提出了KK范式，主要研究人们对于自己行为的记忆是否会受到外在信息的干扰。该研究中有三个重要的方面：社会依从对于人们是否承认其做过某事而言是一个重要的因素，被试对细节的虚构表明他们的记忆被改变了，在错误记忆的形成中，社会压力具有一定作用（这是在前几种范式中过没有考察过的机制）。

三、想象膨胀的研究范式

Garry，Manning，Loftus 和 Sherman 最早提出了想象膨胀这一概念。想象膨胀是源自于生活的一种错误记忆现象，它是指个体通过对童年生活事件的想象，会增加这些事件确实发生过的信心。想象膨胀范式为错误记忆的研究提供了一种新的思路与方法，随后许多研究者都运用此范式对自传体记忆、近期记忆以及简单行为记忆进行了广泛的研究。

想象膨胀的研究范式是典型的实验前后设计，其经典范式有三个阶段：第一阶段提供给被试一份列有多项童年事件的生活事件清单，要求被试判断在特定的年龄阶段每件事发生过的可能性（采用等级量表来评分）。至少间隔两周后，被试进行第二阶段实验――想象清单中的某些事件。第三阶段：要求被试再次填写生活事件清单，判断事件发生的可能性，但并不特别指明是否要完全按照第一次填写。实验主要根据想象事件发生过的可能性评分值的前后变化，来分析想象膨胀。

目前关于想象膨胀比较有代表性的理论有两种，源检测框架理论和熟悉感归因理论，二者对想象膨胀产生机制的解释有明显不同的侧重点：前者注重细节记忆特征的错误归因，后者侧重整体熟悉感的错误归因。

研究者多次复制想象膨胀，并引发了相当多的附加研究，包括对想象膨胀影响因素和特征的探讨。通过采用想象膨胀范式的多种变式和控制各种不同的实验变量考察了多种影响因素，发现被试的个体差异、想象次数和程度以及想象事件的熟悉程度和难易程度等都会对想象膨胀产生重要的影响。

自从 Garry（1996）等提出的想象膨胀范式以来，许多的研究者都运用此范式对自传体记忆、近期记忆以及简单行为记忆进行了广泛的研究。国外对想象膨胀的研究主要集中在以下几个方面：第一，采用自传体记忆来复制与验证想象膨胀效应；第二，对简单行为的想象膨胀研究；第三，想象膨胀的影响因素；第四，想象膨胀的特征及其内在机制。

想象膨胀是错误记忆的一个新的研究领域，关于想象膨胀效应的研究目前还刚刚起步，还有许多探讨的问题，特别是想象膨胀的影响因素，存在的内部机制，理论的完善等等方面，均存在疑问，均值得我们探讨。想象膨胀是基于日常生活的记忆研究，摆脱了实验室研究脱离实际的尴尬，真正步入人们的真实生活，极大地推动了日益高涨的日常生活错误记忆研究。由于研究取向、方法以及研究材料都比较贴近现实生活，因而所解释的记忆现象和记忆规律不仅能更好地帮助我们深入了解记忆，而且在商业、法律、教育等诸多领域也有很高的应用价值。

【参考资料】

［1］杜建政，杨治良. 当前记忆错觉研究的三个主要方面. 心理学动态，1998（3）：19-22.

［2］杨治良，郭力平，王沛，陈宁. 记忆心理学[M]. 上海：华东师范大学出版社，1999：591.

［3］郭秀艳，周楚，周梅花. 错误记忆影响因素的实验研究. 应用心理学，2004，10（1）：3-8.

［4］周楚，杨治良. 错误记忆研究范式评介. 心理科学，2004，27（4）：909-912.

［5］李林，郭晓蓉，杨靖. 错误记忆中的新领域――想象膨胀. 心理科学，2005，28（1）：138-142.

［6］杨淑云. 想象膨胀中熟悉度与感知积累作用的实验研究.硕士论文. 河南大学，2006.

［7］钱帛. 想象膨胀影响因素的实证研究.硕士论文. 上海：上海师范大学，2008.

［8］Sharman S.J.，Garry M.，Beuke C.J. Imagination or exposure causes imagination inflation. The American Journal of Psychology，2004，117（2）：157-168.

第8篇：想象力测试范文

LED作为第四代照明光源越来越被广泛看好，它与传统的白炽灯、荧光灯相比，LED照明具有光学性能佳，启动速度快、节能环保、使用寿命长、可靠耐用等优点；同时LED照明产品也有其自身的特点，其包含结构、电子、检测、安规等要求。从芯片加工到器件封装，再到组装老化测试包装，显现出LED照明产品工艺流程复杂，作业工序多的特点，这对一线生产线的生产制程控制能力、质量保证能力提出了更高的要求。

二、选择研究对象进行分析

我们以T5一体化LED日光灯管为研究对象，从现场调查入手分析如何通过某些改进来提升生产作业效率。调查中发现T5一体化LED日光灯管共由8个作业工序+2个检查工序完成。

（一）对生产线作业平衡进行调查。对SMT段（刷锡膏----贴片----过回流焊---检测）

作业工时测定和现场观察，分析得出SMT段各工序作业时间接近，现场作业排配合理，生产平衡率在90%以上。

（二）继续调查，在组装后段的点亮测试工序中，检测T5一体化LED日光管的点亮

功能的测试繁琐，在作业时需要在点亮确认一端功能正常后，再翻转检测日光管的另一端功能是否正常。作业中手动拿取带电端子有作业不安全的隐患，作业时每天需要重复操作翻转的动作容易致人疲劳，且翻转的动作没有防错的功能，有遗漏检测的风险，有品质隐患。我们从点亮测试工序进行分析，用Most工具对动作进行解剖，翻转动作需要时间9.7S（按82BSI算），翻转后第二次点亮发生的动作时间3.6S（按82BSI算），共消耗时间11.3S。11.3S从工业工程的角度看是动作的浪费，因为动作不直接产生结果。再者，翻转灯管存在遗漏的，没有防错功能，长期使用手臂长距离动作容易疲劳。对灯管翻转和二次点亮检测的动作若通过改善可以简化动作则可节约11.3S，若两次点亮检测合并为一次点亮检测可以减少4.68S（按82BSI算）时间，还可以防止漏检。对以上构想方案进行检讨，考虑取消翻转动作和二合一点亮测试需要将灯管的检测夹固定在工作台面上。考虑到二合一检测时要测试出T5一体化LED日光灯管的两端供电端子都能正常通电，根据日光管的结构性能，则需要将一个端子设置为带电端子，另一端为不带电端子且不带电端子需要连接一指示灯，以便在日光管一端供电点亮检测时，另一端不带电端子的指示灯会亮，则说明功能正常；若出现指示灯不亮现象，则说明日光管功能不正常。依构想方案，对点亮测试工序进行改善，改善具体方案如下表图所示。

对以上表格数据进行分析，改善前的T5一体化LED日光灯管的点亮测试需要5个步骤完成，需要动作工时24.84S（按82BSI算）。改善后的T5一体化LED日光灯管的点亮测试只需要3个步骤完成，需要动作工时16.92S（按82BSI算）。相比较，改善后的作业工时节约2个步骤，工时7.92秒。改善前需要翻转日光管，改善后则取消了翻转动作；改善前需要做2次点亮测试，改善后则将两次测试合并为一次测试，两点改善可以防止漏检的现象发生，简化了动作，降低了作业强度，改善效果明显，构想方案合理可行，解决了点亮测试作业繁琐，可能导致漏检的品质问题。

三、结束语

第9篇：想象力测试范文

关键词：压力测试；供应链风险；极端事件；风险度量

作者简介：姚卫新(1967－　)，男，江苏宜兴人，东华大学管理学院教授，主要从事供应链管理、电子商务等领域的研究；游佳敏(1985－　)，女，上海人，东华大学管理学院管理科学与工程专业硕士研究生，主要从事商业经济管理理论研究。

中图分类号：F274　文献标识码：A　文章编号：1006－1096(2010)05－0086－05　收稿日期：2010－05－20

一、引言

近年来，由于种种不确定因素引发的极端事件冲击导致了许多供应链巨幅震荡甚至中断的现象，引起供应链管理者的广泛关注。如2000年爱立信手机欧洲生产线停产事件(Eglin，2003；Norrman，2004)、2001年911恐怖袭击、2003年“SQL Slammer”病毒全球爆发(Reshlna，2003a、2003b)、伊拉克战争(石油价格大幅上涨)以及上世纪90年代末Compaq公司PC库存大量积压现象(Chopra et al，2004)。这些极端事件通常而言波及范围广、影响程度大，往往会给供应链造成不可逆转的损害，甚至导致供应链的彻底断裂。现实不仅要求供应链上各个实体能有效地协同运作，而且要求各节点具有一定的包括各类极端事件在内的风险承受能力。因此，如何加强事前管理，测算可能的供应链风险，特别是小概率极端事件对供应链的冲击力度及其后暴露出来的风险水平是一个崭新的课题。

在金融风险管理领域，压力测试作为一种金融风险的量化技术，主要用于对极端情景(发生概率小但后果十分严重的事件)进行风险分析，反映在发生极端事件时的损失程度。根据国际货币基金组织(Jones，2004)的定义，压力测试是指一系列用来评估一些异常但又可信的宏观经济冲击对金融体系脆弱性影响的技术总称，其做法是将金融机构或资产组合置于某一特定的极端情境下，如经济增长骤减、失业率激增、房地产价格暴跌等异常市场变化，然后测试该金融机构或资产组合在这些关键市场变量突变的压力下的表现状况，看是否能经受得起这种市场的突变，以此作为金融稳健性指标中风险度量工具――VaR的重要补充，有助于金融监管者更好地监管金融机构的各类风险。

鉴于各种极端情形对供应链造成的巨大冲击以及压力测试在金融领域的广泛应用，笔者通过探讨供应链风险传递机制，尝试将金融行业的压力测试技术引入到供应链风险管理中，结合供应链体系特征和企业风险管理战略目标，提出供应链风险压力测试的概念，阐述相关的基本理论，其后以一具体的供应链风险为对象描述压力测试的实施过程。本文的研究基于压力测试视角关注供应链极端风险，是对供应链风险评价内容的补充，为其提供了新的思路和方法，拓展和完善了供应链风险管理体系。

二、面向供应链极端风险的压力测试

下文将通过探讨风险传递机制，明晰各类冲击情形对供应链(或供应链节点企业)产生影响的作用路径，将金融风险管理工具运用到供应链风险管理中，提出基于假定极端情景的供应链风险度量方法――压力测试。解释并明确压力测试方法在整个供应链风险管理过程中的位置。

(一)供应链风险传递机制

要测算供应链(或供应链节点企业)在发生小概率极端事件下的风险水平及由此可能对薄弱环节造成的潜在损失，分析这些损失对供应链稳定性的影响，进而为决策者采取必要应对措施提供依据，必须首先明确供应链中风险的传递机制(见图1)。

图1展示了供应链风险在体系中的传递方式。图的最左边的是引发各类供应链风险的冲击源，可分为两类：综合冲击和特定冲击。综合冲击是能够影响整个供应链环境或供应链体系的一类冲击源，而特定冲击仅仅针对供应链中某个节点企业。

图中第二栏“感知节点”揭示的是一旦某些冲击情形真的发生，最先感知冲击影响的供应链节点(如供应商、制造商、分销商、零售商、消费者以及其他在该条链上的企业或个人)或不在该供应链上的其他实体(如市场、金融机构、政府、媒体及不位于该条供应链上的其他企业等)。

第三栏显示风险的传播机制，最初冲击所导致的损失可经由这一机制被成倍放大。通常情况下，供应链风险传播渠道可大致分为经由价格因素、交易量及生产运作活动三种路径传播。价格路径包括上下游企业间采购价格和销售价格的连锁变化，交易量传播渠道表示由交易量骤减而导致供应链效益下降，生产运作活动路径则是因企业生产能力受限而引发供应链延迟或中断现象。

图的最右端表示的是供应链(或供应链节点企业)上的薄弱环节由最左端的冲击而暴露出的风险水平和影响程度，图中列举了(但不限于)几类常见的供应链风险，其所对应的风险评价指标的变化以及对供应链上其他节点企业的反馈效应正是供应链管理者最为关注的内容之一。

关于图1中所示传递路径，有两点需要说明：(1)传递机制中的最先感知点和传播渠道均不局限于图上列出的几点，可根据所处的供应链环境进行增删和调整，以更好地解释不同供应链间的个体差异。(2)各种风险传播渠道间往往存在交互效应，可相互影响。例如，由重要生产线故障引发的冲击经运作活动渠道传播导致的生产能力下降，会最终影响交易量，从而又以交易量渠道进行传递。

综上所述。图1所示的供应链风险传递机制揭示了3个问题：(1)原始冲击源如何引发供应链风险的；(2)引发的是哪类供应链风险；(3)冲击源引发的风险间是否存在连锁反应，它们之间又是如何运作的。以上3个问题分别解释了供应链风险传递渠道和路径、风险识别以及风险间的交互效应。然而，供应链风险管理目标不仅要求能够识别可能的风险，理解这些风险的产生机理和作用渠道，更要求能以定量的方法测度最初冲击源带来的影响程度，从而使风险变得更加明晰。由此可见，定量化地度量图1左端冲击源对右端供应链风险评价指标的影响效应具有重要意义，尤其是对于一些尚未出现的极端冲击，如果能以事前防范的风险意识分析其一旦发生时对供应链稳定性的影响、衡量可能遭受的潜在损失以及吸收这些损失所需耗用的资源、进而对风险抵御能力做出评估和判断，可为决策者采取必要的应对措施提供依据。因此，一个可识别薄弱环节，并有效评价极端事件对供应链冲击影响的风险管理工具，具有巨大理论与实践价值。

(二)供应链风险压力测试基本概念

风险量化技术的发展与金融市场的需求密切相关(Per-reault，2002；Voss，2000)。压力测试作为金融风险的量化技

术之一，反映极端不利的小概率事件发生时金融业所可能遭受的潜在损失。它最早是由国际货币基金组织(IMF)作为基本信贷风险模型的补充而被正式提出并开始使用，因其能模拟潜在极端事件发生时对系统稳定性的影响，近年来在国际金融组织和各国政策当局间获得了迅速的应用推广。根据极端事件度量和管理的共通性，下文将金融行业的压力测试方法引入到供应链风险管理中，结合供应链体系特征和企业风险管理战略目标，提出供应链风险压力测试的概念，为供应链“极端事件”的评价和管理提供一新方法。

1、供应链风险压力测试的定义

目前，在金融业中关于压力测试并没有一个统一明确的定义，不同机构从不同视角对压力测试给出了不同的定义。从金融稳定性管理视角出发，对比较权威的定义列举如下(见表1)。

综合以上定义可以看出，压力测试是一种以定量分析为主的风险分析方法，其做法是将测试对象置于某一特定的小概率极端情境下，然后测试该对象在这些关键市场变量突变的压力下的表现状况，通过测算可能发生的损失，分析这些损失带来的负面影响，进而对测试对象的脆弱性做出评估和判断，有助于管理者及时发现问题并采取必要措施。

压力测试的实质在于通过各种压力情景的设定，利用确定的价值评估模型，测算出在确定的压力情景下某一特定实体所面临的潜在损失。将其扩展到供应链中，并给出供应链风险压力测试的定义：供应链风险压力测试是指供应链节点企业或供应链体系在面临假定极端事件冲击时，用来筏量可能发生的潜在损失的一种风险评价技术。通过测算这些潜在损失，有助于供应链管理者识别供应链(或供应链节点企业)在承受各类风险(包括系统性风险和非系统性风险)时所暴露的薄弱环节和风险水平，针对性地采取必要措施，加强事前防范，以提高供应链弹性和抵御风险的能力。

2、供应链风险压力测试的理论核心

供应链风险压力测试的重点在于分析测试对象(供应链节点、节点间关系，或供应链系统)面临模拟极端冲击时，对于潜在损失的最大承受能力，亦即极端风险量化过程，也可视为一种针对供应链体系的临界分析技术。其核心思想如图2所示。

图中菱形框表示某次压力测试的对象，它可以是某个具体的供应链节点、明确的节点问关系，或整个供应链系统。图中椭圆则代表在某次压力测试过程中，用于度量测试对象之于某类特定极端冲击的风险评估模型。根据图2的描述，供应链风险压力测试的核心思想可理解为通过模拟极端冲击，即各种压力情景的设定，利用确定的供应链风险评估模型，测算出在确定压力情景下假设的极端冲击对特定测试对象带来的影响效应，也即其所面临的潜在损失。压力测试显示出最差情形下测试对象所能承受的压力底线。

从本质上说，供应链风险压力测试是通过可能引起薄弱环节暴露的小概率压力情景来量化风险传递机制中(见图1)所描述的相关供应链风险渠道的大小。因此，一次确定的供应链风险压力测试过程可被认为是一个“What-if”的实验。在回答“如果……，那么……”的过程中，帮助企业识别供应链体系内承受各类风险时所暴露出的结构性弱点和整体风险水平，在风险尚未真正发生时，采取有效措施，主动预防重大意外事件的发生，或将意外事件发生所带来的损失降低到最小。因此，与传统供应链风险管理方法不同，压力测试作为一种“向前看”的风险管理手段，强调未雨绸缪，而非仅仅依靠事后管理亡羊补牢，这一风险管理理念是压力测试方法最为关键的内容。

(三)压力测试与供应链风险管理过程

供应链风险管理过程的研究起始于Lindroth(2001)提出的三维供应链风险初步分析框架，该框架包括供应链单元分析、供应链风险类型和供应链风险控制。供应链风险管理过程包括供应链风险识别、供应链风险评估和供应链风险管理和控制这三个方面。就目前研究情况来看，现有文献的研究多侧重于风险识别方面，而对于供应链风险的评估和控制则缺乏系统性研究，在很少有的涉及供应链风险评估的文献中。又多为定性评价，定量分析极少，远没有形成体系。

供应链风险压力测试是对小概率极端事件下供应链各环节可能遭受的冲击进行定量评估，从这个意义上来说。是对风险管理过程中风险评价内容的补充，为众多供应链风险评价技术中的一个，因此，压力测试也构成供应链风险管理体系的组成部分。但同时，压力测试方法本身又自成体系。有着较成熟的理论基础与实践经验，其核心思想及基本方法可扩展至其他领域。图3表明了压力测试方法与整个供应链风险管理过程的关系。

三、应用示例

供应链常常面临着不可完全预测的中断，既有自然原因也有人为因素。自然灾害、经济中断、恐怖袭击、运转故障等都可能导致中断风险的发生(Kleindorfer，2005)。然而随着全球经济一体化进程加快、国际市场竞争日益激烈，管理方式的多元化和日趋复杂的供应链网络结构更加剧了系统的动态性、复杂性和不稳定性，供应链中断的可能性以及与之相关的潜在损失变得越来越大。又由于供应链环环相扣，任何一个环节的中断均可能影响其正常运作，引发系统风险。历次中断事件及导致的灾难性后果要求供应链管理者加强事前防范，精确测算各种异常中断情形下供应链(或供应链节点)折射出的收益、损失或生产能力的变化，有效评估其抵御风险的能力，尽早准备各类中断事件应急预案，延迟危机发生的可能性，并降低由中断风险带来的损失。

针对上述情况，下文以某一节点企业为例，结合压力测试核心思想(见图2)，探讨供应链中断风险压力测试实施过程(见图4)。具体实施步骤包括：资料收集、明确测试目的和对象、风险识别、测试方法确定与数据范围选择、压力情景构建、压力测试执行以及测试结果的披露与解读。

供应链中断风险压力测试实施过程中所需相关信息一般源于四大资料库：中断压力事件库、供应链网络节点资料库、企业内部信息资料库和压力测试数据库。测试过程的第一步是信息搜集。从中断事件库中获取以往历次中断风险的历史信息，包括中断事件的类型、成因、影响时间、传播路径、最初冲击力度和最终损失等。历史事件提供了可借鉴的依据，有助于测试人员了解各类中断风险的共通性，更精准地把握测试方向。供应链网络节点资料库提供节点企业所处的供应链网络环境信息，如主要供应商、制造商、客户、分销中心和运输渠道等的基本数据。企业内部信息资料库包含了产品生产流程、物料清单文件(BOM)以及包括原材料、在制品、产成品在内的所有库存信息。此外，压力测试数据库则存储企业既往压力测试的历史资料。以上这些信息源为压力测试后续步骤的开展提供了必要的输入，数据的准确性和完整性将直接影响到测试结果的质量。

资料收集后，第二步须明确测试的目的和对象。一般来说，供应链节点企业开展中断风险压力测试是为衡量该节点在面临各种异常中断情境下的风险暴露水平，并以此评价其抵御中断风险的能力。而对于某一次具体压力测试而言，测

试目标通常还应细化，需将测试焦点置于某一特定的供应链运作环节中。依据中断发生环节，有三种关注点：与上游供应商相关的中断、企业内部中断、与下游客户相关的中断(见表2)，并由此产生三类与之对应的压力测试对象：供应(中断)风险、需求(中断)风险、生产(中断)风险。由于供应链结构的复杂性，测试对象不仅要求明确风险类型，还需指明该风险发生的环节，从而使测试结果更为精确。

风险识别的作用在于寻找能够引起供应链风险评价指标变化的风险因子，也可理解为是将供应链风险传递路径(见图1)中传播渠道实例化的过程。对于中断风险，风险因子可大致分为两类：基本生产变量和市场经济变量。前者体现中断发生后节点企业所处的供应链上下游产、供、求的变动，后者反映供应链外部环境的变化。风险因子的选择与节点企业在供应链体系中的位置有关，一般而言，处于供应链中部的企业只需考虑基本生产变量变动的影响，而位于供应链两端的企业还另需思考市场经济变量的作用。

根据单一风险因子冲击还是多风险因子冲击，存在两种压力测试方法：敏感性分析和情景分析。敏感性分析是对单一冲击(风险因子)的影响分析，情景分析则是对多个风险因素同时发生变化即多种冲击的影响分析。相对而言，敏感性分析更加简单易操作，而情景分析需要考虑各种冲击的相关性等问题，但模拟效果更好。在实际操作中，可根据具体冲击情形，灵活选择，以在客观性和可操作性之间寻求平衡。通常较可行的做法是在极端事件发生后，导致供应链某一环节中断的影响如能以一确定的风险因子的变化来表示，建议采用敏感性分析，反之，如中断造成的影响较难确定或需以多个风险因子的共同作用来描述，则建议采用情景分析的方法。在测试数据选取方面，根据假定的中断风险发生环节，对应第二步中确定的压力测试对象，分别将供应商、客户(或市场)或生产部门作为数据范围，获取相关风险因子变化情况的历史数据。

压力测试的下一个步骤是情景构建，这一步骤包含两部分内容：情景类型选择和压力情景设定。上一段提到的情景分析方法可进一步分为历史情景分析、假定情景分析和蒙特卡罗模拟(Blaschke，2001)。如在上一环节中确定将采用情景分析的压力测试方法，这一步骤中需选择适合企业供应链环境的情景类型。历史情景依赖于过去经历过的重大中断事件，而假定情景是假设可能但还没有发生的供应链重大中断，蒙特卡罗模拟则是借助计算机模拟获取可能发生的中断情景。如何根据选定的情景类型，考虑节点企业所处供应链环境，结合管理者风险偏好，确定并量化有关冲击变量、变量问关系、冲击大小，冲击路径等中断情景设定方面的内容，也构成了本步骤工作的一部分。

压力测试的执行主要通过建立模型解决2个问题：(1)如何评估选定中断情景对该节点企业的影响，并将情景映射到主要风险因子的变化上；(2)如何将风险变量反映为供应链风险评价指标的变化，或收益、损失或生产能力的变动。以有效评估其风险弹性。

最后是测试结果的公布与解读。不同竞争策略下节点企业对于测试结果会有不同的理解，或将其作为唯一的标准以评估企业抵御中断风险的能力，或仅仅将其视作评价中断风险承受力的工具之一，同时考虑包括专家意见在内的众多定性因素。对测试结果的不同解读，折射出管理者的风险理念，并最终反映为应对措施制定上的差异。

需要特别指出的是完整的压力测试过程还应包括回测和重估。回测为测试人员提供了有关模型准确性的反馈信息，可用来寻找模型可能的改进方向。重估是在上一次压力测试完成后，间隔一定周期对相同测试对象进行再一次压力测试，新一轮的压力测试可以确认新的风险，及时反映供应链环境变化，从而使测试结果更具现实意义。

就技术本身来看，压力测试只是风险管理者在对供应链运行状况悲观预期下(例如某一环节发生中断)对节点企业进行的体检，并不意味着测试对象真的出现了问题。事实上，假定的压力情景并不一定发生，不能因为测试结果而给企业贴上“不合格”的标签。作为风险管理方法之一，压力测试强调事前防范、未雨绸缪。它展现给管理者极端情形下供应链(或供应链节点)所面临的图景，从而发挥其警示作用。

四、结论及未来研究方向

笔者针对各种极端情形给供应链造成的巨大冲击以及压力测试技术在金融领域的广泛应用，通过探讨供应链风险传递机制，提出了将金融行业的压力测试方法与供应链风险评估相结合的思路，给出了供应链风险压力测试的概念，并对相关内容作了界定和说明，最后以一供应链节点企业为例，描述了中断风险压力测试的实施过程。

供应链风险压力测试是对供应链风险评价内容的补充，既从深度上加深了供应链风险定量评估这方面的内容，又从广度上拓展了压力测试理论的应用范围，为供应链“极端事件”评价和度量提供方法和依据，完善了供应链风险管理体系。

想象力测试精选(九篇)

相关热门标签

相关文章阅读

精选范文推荐

相关期刊推荐

香料香精化妆品

乡音

交响

湘潮

湘潮