2014心理咨询师《心理测量学》冲刺笔记13
第六章测验的实施、记分及其误差
第一节测验的实施及其误差的控制
一、的程序及其要素(简答)
1.标准化指导语:测验标准化的第一步是指导语标准化,即在测验实施过程中应使用统一的指导语。指导语通常包括两部分:一部分对被试的指导语,另一部分对主试的指导语。
2.标准时限:时限也是测验标准化的一项内容。大多数典型行为测验是不受时间限制的,例如人格测验中被试的反应速度就不很重要。但在最高作为测验中,速度是需要考虑的重要因素之一。在速度测验中,尤其要注意时间限制,不得随意延长或缩短。测验的时间安排,也是影响测验结果的一个重要因素。
3.测验的环境条件:有许多研究表明,测验环境会对测验的结果造成影响。尤其需要强调的是,心理测验进行之时,务必不能有外界干扰。为此,测验室的房门上应挂一个牌子,示意测验正在进行,旁人不许进入。因此,对于测验的环境条件:(1)遵从测验手册的要求;(2)下任何以外的测验环境因素;(3)测验结果时也必须考虑这一因素。
二、主试误差及控制方法
1.测验前的准备工作
(1)预告测验:应当事先通知被试(2)准备测验材料(3)熟悉测验指导语(4)熟悉测验的具体程序:于个别测验来说,测验的实施必须由受过专业训练的人来完成。
2.测验中主试的职责
(1)应按照指导语的要求实施测验,不带任何暗示,当被试询问指导语意义时,尽量按照中性方式作进一步的澄清。(2)测验前不讲太多无关的话(3)对于被试的反应,主试不应作出点头、皱眉、摇头等暗示性反应;(4)对特殊问题要有心理准备
3.建立协调关系:在心理测验实施中,协调关系是指主试和被试之间一种友好的、合作的、能促使被试最大限度地做好测验的一种关系。例如再智力测验中,这种关系会促使被试尽最大努力发挥自己的能力;在人格测验中,它会促使被试真实坦白地回答有关个人一般行为特点的问题。
三、被试误差及控制方法(大答题)
即使一个测验经过精心编制,题目取样具有代表性,又有标准化的实施和积分程序,这种误差是最难控制的。
1.被试技巧与练习效应:被试对测验的经验或应试技巧会影响测验成绩,对测验的程序和技能熟悉程度不同,所得分数便不能直接比较。任何一个涉及认知功能的成绩,在第二次应用或重复测量时,都会有练习效应而使测验成绩提高。要控制应试技巧和练习效应的影响,可尽量设法使每个被试对测验材料的步骤和所需技巧有相同的熟悉程度。
2.被试的动机与焦虑因素
(1)被试参加测验的动机不同,会影响其回答问题的态度、注意力、持久性以及反应速度等,从而影响测验的成绩;在成就、智力和能力倾向等变量时,只有被试动机强力才可能尽力回答,取得好成绩。动机效应在测量态度、兴趣及人格等典型行为表现时也有影响。某些被试若欲给人以好印象,就会考虑主试的期望或社会赞许行为,而不按自己的真实情况回答,从而使测验分数降低。相反,为了某重动机若欲给人以坏影响,则会使测验分数升高。
(2)○b测验焦虑是指被试在应试前和测试中出现的一种不愉快的、表现为焦虑、担心、恐惧和紧张的情绪体验。适度的焦虑会使人兴奋型提高,注意力增强,提高反应速度,提高智力测验、成就测验和能力倾向测验的成绩。测验焦虑会受到下列因素影响:
○1能力高的人,测验焦虑一般较低,而对自己能力没有把握的人,测验焦虑较高;○2抱负水平过高,求胜心切,测验焦虑较高;○3具有某种人格特点,如缺乏自信、患得患失、情绪不稳定的人易产生测验焦虑;○4测验成绩与被试的关系重大,或被试受到的压力过大,容易使其产生测验焦虑;○5经常接受测验的人焦虑较低,而对测验程序不熟悉,尤其是测验中采取了新的题目形式或实施程式会增加测验焦虑。
通过教学或辅导可以降低测验焦虑,而熟悉测验程序也是降低焦虑的有效方法。
3.反应定势:亦称反应风格,是指独立于测验内容的反应倾向,即由于每个人回答问题的习惯不同,而使能力相同的被试得到不同的测验分数。几种常见的反应定势是:
(1)求快与求精确的反应定势;(2)喜好正面叙述的反应定势;大量研究发现,被试在无法确定“是非题”的正确答案时,选择“是”的人往往多于选“否”的人,或者说选“是”的人多于实际上应该选“是”的人。(3)喜好特殊位置的反应定势;(4)喜好较长选项的反应定势(5)猜测的反应定势。
第二节测验的记分及其误差的校正
对于测验编制者而言:记分标准化应该包括选择和设计合式的标准化记分程序,考虑分数的分配、权数的分配、猜测的处理以及分数是由原始分数表示还是转化成其他形式。对测验使用者而言:记分标准化则是要求完全按照测验手册的规定和标准答案给予被试分数,有时还可以完全依据套板或计算机记分。
1.记分的基本步骤和要求:(1)记录被试反应。⑵参考标准答案。主试应当熟悉掌握记分键,特别是非客观题的记分要求,不得随意记分。⑶计算最后得分并转换原始分数。把所有分数汇总,计算出原始分数的总分。
转换原始分数的意义和方法:在心理测量中,一般原始分数本身很少有意义,只有将原始分数进行适当的转换处理或与参照标准加以对照,即把原始分数转换为导出分数,测验分数才有意义。测验编制者提供的常模表就是原始分数的转换表,它为测验使用者提供了一种方便易行的由原始分数向导出分数转化的方法。
第七章测验分数的解释
对测验分数的解释主要包括两个方面的问题:一是如何使分数具有意义,即我们必须合理的制度测验量表以实现测验结果的数量化。又能为不同的测验导出可比较的量表;二是如果将有意义的信息传达给当事人,即把测验分数与常规比较,依照出个人在测验量表上的相对等级,从而对个人测验作业进行解释。
第一节参照常模的分数解释
一、常模的团体和常模样本
1.常模团体的性质
由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
对编制者而言:常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。这种工作包括:确定一般总体、确定目标总体、确定样本。
对测验使用者:要考虑的问题是,现有的常模团体哪一个最合适。
2.常模团体的条件
(1)群体的构成必须明确界定:在制定常模时,必须清楚地说明所要测量的群体的性质与特征。依据不同的变量确定群体,便可得到不同的常规。
(2)常模团体必须是所测群体的代表性样本。
(3)样本的大小要适当。总体数目小,只有几十个人,需要100%的样本;如果总体数目达,相应的样本也大,一般最低不小于30或100个;全国性常模,一般应有2000-3000人为宜。
(4)标准化样组是一定时空的产物:我们在一定时间和空间中抽取的标准化样组,它只能反映当时当地的情况。在选择合适常模时,注意选择较为新近的常模。
3.取样的方法(1)简单随机抽样:按照随即表顺序选择被试构成样本,或者将抽样范围内的每个人或者每个抽样单位编号,再随即选择,可以避免由于标记、姓名、性别或其它社会赞许性偏见而造成抽样误差。(2)系统抽样:有时在总体数目为N的情况下,若要选择K分之一的被试作为样本,则可以在抽样范围内选择每个第K个人来构成样本。(3)分组抽样(4)分层抽样:在确定常模时,最常用的是分层抽样方法。①分层比例抽样②分层非比例抽样
4.常模分数和常模(1)常模分数:就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。(2)常模分数构成的分布,就是通常所说的常模,它是解释心理测验分数的基础。测验手册上所列的常模通常为一般常模,不一定适合使用者的具体情况;特殊常模是为非典型团体建立的,一般比为小团体建立的常模范围更窄。
二、常模的类型及解释
1.发展常模:人的许多心理特质如智力、技能等,是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较。根据这种平均表现所制成的量表就是发展常模,亦称年龄量表。
(1)发展顺序量表:因为它告诉人民多大的儿童具备什么能力或行为就表明其发育正常,相应能力或行为早于某年龄出现,说明发育超前,否则即为发育滞后。最早的一个范例是格塞尔发展程序表,其中按月份显示儿童在运动水平、适应性、语言、社会性四个方面的大致发展水平。
(2)智力年龄:比内-西蒙量表中首先使用智力年龄的概念。
这种分数叫做智力年龄,简称智龄。
智龄是年龄量表上度量智力的单位。求智龄分方法很简单,只要将儿童在测验上的分数与各年龄组的一般儿童比较,便可给予一个年龄分数。因此在计算中先算出年龄,既全部题目都通过的那组题目所代表的年龄。再所有更高年龄水平上通过的题目,用月份计算,加在基础年龄上,儿童的智龄是基础年龄与在较高年龄水平的题目上获得的附加月份之和。
另外一种使用年龄量表的方法是不把题目分到各年龄组。首先根据被试在整个测验中正确反应的题数或反应时间而得一原始分数,而将标准化样本中每个年龄组的平均原始分数作为年龄常模。通过将原始分数与年龄常模对比,便可求得每个人的智龄。例如某个儿童的原始分数等于8岁组的平均数,则其智力年龄就是8岁。
一个人的智龄并不一定和他的实龄相符,聪明的儿童,其智龄高于实龄;愚笨的儿童,其智龄低于实龄;只有普通儿童,其智龄与实际年龄相近似。
(3)年级当量:实际上就是年级量表,测验结果说明被试属哪一年级的水平,在教育成就测验中最常用。
2.百分位常模及解释
百分位常模包括百分等级和百分点、四分位数和十分位数。
(1)百分等级:是应用最广的表示测验分数的方法。一个测验分数的百分等级是指在常模样本中低于这个分数的人的百分比。其计算分为:未分组资料的百分等级计算;分组资料的百分等级求法。
(2)百分点:也称百分位数,与百分等级的计算方法正好相反,百分等级是计算低于某测验分数的人数百分比,而百分点则是计算处于某一百分比例的人对应的测验分数是多少。百分点的计算可根据直线内插法进行。在实际应用中,我们一般既可以由原始分数计算百分等级,又可以由百分等级确定原始分数。通过这样的双向方式编制的原始分数与百分等级对照表,就是百分位常模。
3.标准分常模及解释
标准分常模:标准分数是将原始分数与平均分数的距离以标准差为单位表示出来的量表。它的基本单位是标准差。
(1)线性转换的标准分数:z分数为最典型的线性转换的标准分数。
(2)与线性导出分数一样,常态化标准分数也可以被转化成任何方便的形式。当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T分数。
①T分数:T=50+10z`T分数这一概念最早由麦克尔于1939年提出,含有纪念推孟和桑代克二氏。
②标准九分:是另一较知名的标准分数系统,其量表是个9级的分数量表,它是以5为平均数,以2为标准差的一个分数量表。
③常态化的标准分数还有标准十分(平均数5,标准差1.5)标准二十分(平均数10,标准差3)
4.智商及其意义
(1)比率智商:比内-西蒙量表传入美国后,斯坦福大学推孟教授于1916年对其修订而成斯坦福-比内量表。它在心理年龄的基础上,以智商表示测验结果,即以后所说的比率智商。
比率智商提出后,普遍被心理学界和医学界所接受。但由于个体智力增长是一个由快到慢再到停止的过程,即心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试;另外,由于不同年龄组儿童的比率智商分布的情况是不一样的,因而相同的比率智商分数在不同年龄就具有不同意义。基于这种考虑,心理学家韦克斯乐提出了离差智商的概念。
(2)离差智商:是一种以年龄组为样本计算而得的标准分数,为使其与传统的比率智商基本一致,韦克斯勒将离差智商的平均数定为100,标准差定为15.所以离差智商建立在统计学的基础之上,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的指标。由于离差智商的提出,过去曾使用比率智商的许多测验在后来也使用了离差智商,如在1960年修订的斯一比测验中,就使用的是平均数为100,标准差为16的标准分数量表。必须指出,从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。
5.百分位与标准分数的共同之处:将被试的分数在团体内做横向比较,而发展量表却是与不同发展水平的人做纵向比较。
三、常模分数的表示方法:转换表和剖析图。(TK或XZ)
第二节参照效标的分数解释
在效标参照测验中,一种标准是对测验所包括的材料熟练或掌握的程度,将分数与此种标准比较可以搞清一个人知道什么和能做什么。因为涉及的主要是测验的内容,所以可以把这种分数叫做内容参照分数。另一个比较标准是外在效标,即用预期的效标成绩来解释测验分数,因为涉及的是最后来的结果,所以把这种分数叫做结果参照分数。
一、效标参照测验及其应用
参照效标测验是格拉赛提出的。
效标参照测验优点:(1)不象常模参照测验那样,使能力强者骄傲自满,能力差者长期遭受挫折,效标参照测验巧妙地避开了对得分、名次的过分纠缠,使各人都有自己的奋斗目标和希望。
(2)常模参照测验无法反映出被试的真正能力和水平,甚至对被试到底能做什么,不能做什么也不清楚。效标参照测验既能发现个人特有的长处,也会找到问题的症结所在,而常模参照测验就做不到。
(3)从常模参照测验的得分不能得到被试在外在效标上的表现,效标参照测验则可直接作出解释,有时测验结果的本身可能就是效标。
(4)效标参照测验与教师在教学过程中的自编测验关系更为密切,因而效标参照测验的理论概念更易为教师接受和应用。
二、内容参照分数及解释
1.内容参照分数:又叫范围参照,主要是依据被试对某个确定的材料内容或技能的掌握程度和熟悉程度来表示和解释测验结果。
2.内容参照的表示方法:内容参照的表示方法:掌握分数和正确百分数。(1)掌握分数:订出一个判别被试是否通过或掌握的最低分数,即最低掌握水平,此分数以上,表明被试已达到掌握或熟练水平;此分数以下,表明没有达到这个水平,需要进一步的学习或采取其他补救措施。(2)正确百分数(更为常见):是报告内容参照分数的又一个指标,表明被试者在测验中答对题目的百分比,因而掌握分数的二分法记分来表示掌握或熟练程度更为合适。
正确百分数=答对题目数/总题目数х100
三、结果参照分数及解释
1.果参照分数:实际上是一个效标分数,即用效标行为的水准来表示测验的结果,而且也是对被试未来作为的预测。
2.结果参照分数表示法
(1)期望结果的概率:通过一种简单的图表,显示出获得特定测验分数的人得到每一种效标分数的百分比,即将测验成绩以产生各种不同结果的概率来描述。
(2)预期的效标分数:将具有不同测验分数的人所可能获得的预期效标分数用图表显示出来。