编者按:第七章 汉语作为第二语言的测试
语言测试的历史可以追溯到19世纪末、20世纪初,大体经历了4个主要的发展阶段。
第一个阶段为传统时期或前科学时期(20世纪50年代初开始)。这一阶段语言测试基本上不是在语言学理论指导下开发的,测试结果主要靠考试实施者的直觉来评判,缺乏科学性。
第二阶段为心里测量——结构主义时期或科学时期(20世纪50年代末、60年代初到70年代),以结构主义语言学为理论基础,同时心理学的行为主义理论以及心理测量学的原则和方法对语言测试起了重要指导作用。这一时期测试方法主要为分立式测试,特别重视测试的信度。
第三个阶段为心理语言学和社会语言学时期或后现代时期(20世纪70年代至80年代)理论基础由结构主义语言学转向社会语言学。测试更多地关注如何从功能性、社会性和语言应用的角度考察被试者,测试方法从分立式走向了综合式。这一时期测试效度得到了重视。
第四个阶段为交际法语言测试时期(20世纪80年代初至今)语言学界很多人士认为测试要以语言水平为中心,而语言水平表现为交际能力。这一时期相继出现了建立在交际理论基础上的《功能意念大纲》和《交际大纲》。这些文件对语言测试开发有指导作用。但时至今日,还未看到真正建立在此基础上的公认的、可靠的、有效的大规模标准化语言测试。
从语言测试发展历史来看,语言测试与语言理论特别是语言教学理论密切相关,不同时期,人们的语言关不同、语言教学观不同,测试的目的、原则、内容、方法和手段也不同,任何一种语言测验都是特定的语言观和语言教学观的具体操作。
第一节 语言测试的基本类型
一 几种不同用途的测试
语言测试从功能或用途角度考虑,可分为成绩测试、水平测试、能力倾向测试、诊断性测试和安置性测验等。
(一)成绩测试:教什么测什么,学什么测什么,甚至是怎样教就怎样侧,也叫回顾性测验。成绩测验必须以教学单位所规定的学习者需要掌握的教材内容、教程内容或教学大纲内容为依据,测试内容不应炒过教材、教程或大纲的范围。成绩测试最应关心的是测验内容对教学内容的代表性程度如何,即所谓内容效度如何。
(二)水平测试:通常指人们对目的语用的熟练程度或熟巧程度,考察学习者综合运用语言的能力。水平测试不以特定的教学大纲、教学课程或教学方法为依据,最讲求的是测验的构想效度。
(三)能力倾向测验:也叫学能测验、性向测验、潜能测验以及禀赋测验等。为了了解考生学习目的语的潜力即所谓能力倾向如何,根据测验结果来预测学习者在未来学习目的语是否会成功。常用来选拔报考某种外语专业的学生。现有测试内容主要集中在以下方面:1、语音解码编码能力、语法解码编码能力、综合归纳能力、语言记忆能力以及语言表达能力。
(四)诊断性测试:为了了解学习者对教学内容那些已经掌握,哪些尚未掌握,诊断既可以是学生学习方面,也可以是教师教学方面的不足。总之,是及时发现教学过程中出现的各种问题,为教师提供改进教学的反馈信息。
(五)安置性测试:也叫分班测试或叫分级测试。作用是评估学习者现有的语言水平高低,从而确定其适合于学习什么样的课程或何种程度的班级上课。测试内容最好是以本教学单位的教学大纲或可能开设的课程为依据。
二 主观性测验和客观性测验
根据评分方法不同,测试可以分为主观性和客观性测试。
主观性/客观性测试优点/缺点:(P291、292)
三 分立式测试和综合式测试
分立式测试:建立在结构主义语言学理论基础上的一种测试,它把语言分成语音、语法、词汇等不同的语言要素或语言点来侧。分立性测试中的一个项目只测试是否对一个具体的语言知识或语言要素已掌握,针对性强,测试点容易明确。
综合式测试:用于全面考察被试运用语言的能力,考察能否把所掌握的语言知识要素综合起来并加以运用。
四 标准化测试和非标准化测试
标准化测验特指采用客观性试题的、标有信度、效度、难度、区分度等各种测量学指标的、建立了常模的、在统一的环境和条件下施测的、由专业机构或专业人士开发或参与、指导开发的测试。主要包括四个环节:1、试题编制的标准化2、测验实施的标准化3、阅卷评分的标准化4、分数转化与解释的标准化
20世纪80年代以来的表现评价或真实性评价等非标准化评测手段已经部分取代了传统的标准化测试手段。
第二节 语言测试开发(P297)
一 设计阶段
(一)对测验目的的描述
(二)对目的语的使用范围和需要用目的语完成的任务的确定和描述
(三)对测试对象的描述
(四)定义测验所要测量的结构
(五)对测验的质量监控计划
信度:指考试结果的一致性和稳定性程度,它是考试效度的必要前提。标准化信度要求在0.9以上。
效度:是考试质量的最重要方面,指测试是否测到了它所想要测的东西,包括校标关联效度、内容效度、表面效度和构想效度。
后效:主要指语言测试对教学产生的影响。
(六)开发资源的分配计划
二 操作化阶段
(一)确定好整个测验试卷的构成
(二)制定出测验作业任务细则即题目细则
三 施测阶段
(一)预测
(二)实测
第三节 语言测试题目的编写和题目分析方法(P311)
第四节 语言测试的质量评估:信度和效度
信度:指测量结果的可靠性、一致性和稳定性程度。也就是说在不同的时间或不同的测试条件下,使用同一测试,对同一组被试实施多次检测所得结果的一致性或稳定性程度。
效度:指测量的有效性或准确性。一个测验能在多大程度上测出它要测量的东西,或者说该测验能在多大程度上达到预期的测验目的,这就是效度问题。
效度的类别:(P338)
影响效度的因素:(P343)