第二讲:语言测验基本概念
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
短时记忆能力、口头表达能力
• 按照参照系统划分 常模参照测验(norm-referenced test):所谓常模(norm)
是指标准化样本中测验的分数分布
标准参照测验(criterion-referenced test):能力、标 准、内容范围
• 按照测验方式划分
笔试/口试 纸笔测验/基于计算机的测验 (P&P) (CBT) 主观测验/客观测验 (就评分方法而言) 分立式测验(discrete-point) / 综合式测验 (integrative) 速度测验(speed test)/难度测验(power test) 高风险测验(high-stake test )/ 低风险测验 (low-stake test )
各类测验的特点
A成绩测验 B能力倾向测验 C水平测验 D诊断测验 E分班测验
测验特点 及 类型 依据 所测能力 信息指向 标准化程 度 最高 可以较高 可以较高 不高 规模
语言理论 教学内 容 认知理论 教学内容
一般语言 水平 不一定 学习潜能 现有水平
现在—将来 过去 将来 将来
最大 可以很大 可以很大 不大
第二讲:语言测验的基本概念
语言测验的作用和目的 语言测验的种类 语言测验的质量标准
语言测验的作用和目的
• 作用:科学地测量出学习者的语言能力 • 目的: 选拔 诊断 评估 预测 研究
测验的种类
• 按用途(目的)划分 能力测验(或水平测验)proficiency test、
成绩测验(或学业测验)achievement test、 分班测验placement test、 诊断测验diagnostic test、 能力倾向测验aptitude test :语音编码能力、综合归纳能力、
教学内容
现有水平
过去—将来
低
小
常模参照和标准参照的区别
┏━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┓ ┃ ┃ 常 模 参 照 ┃ 标 准 参 照 ┃ ┣━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫ ┃测验的性质 ┃ 一般语言能力或水平 ┃ 特定的语言点 ┃ ┠──────╂────────────╂────────────┨ ┃分数解释的 ┃ 相对的:某被试和其他 ┃ 绝对的:被试的成绩和 ┃ ┃性 质 ┃ 被试比较 ┃ 预先制定的内容比较 ┃ ┠──────╂────────────╂────────────┨ ┃分数的分布 ┃ 以平均分为中心的正态 ┃ 不考虑分布 ┃ ┃ ┃ 分布 ┃ ┃ ┠──────╂────────────╂────────────┨ ┃测验的目的 ┃ 区分所有被试的能力 ┃ 看被试掌握了多少教学 ┃ ┃ ┃ ┃ 内容 ┃ ┠──────╂────────────╂────────────┨ ┃测验的内容 ┃ 被试不知道或很少知道 ┃ 被试完全知道 ┃ ┗━━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━━┛
标准正态分布
语言测验的质量标准(一)
• 信度
可靠性,指测验分数的稳定性和一致性程度。
• 效度
有效性,指测验在多大程度上测到了想测的东西。 内容效度(content validity) 效标关联效度(criterion-related validity ) 共时效度(concurrent validity) 预测效度(predictive validity) 构想效度(construct validity) 表面效度(face validity) 信度和效度都是测验的质量核心,测验的可靠性是测验有效的 必要非充分条件。
ቤተ መጻሕፍቲ ባይዱ 语言测验的质量标准(二)
• 难易度(facility value) • 区分度 (discrimination index)
标准化 (standardized test): 标准化测验的特点有三个: 第一,有固定的、标准的内容,其内容不因测验有不同 版本而改变; 第二,施测和评分按标准程序进行,每次测验的考务和 评分程序都一样,不能随意改变; 第三,都经过试验,在进行了大量的经验性研究之后才 正式使用 。 是测验的一种属性,而非质量标准。
思考题
• 语言测验的作用和目的是什么? • 根据用途划分,语言测验可以分成哪几个类 别? • 客观性考试和主观性考试的根本区别是什么? • 分立式测验和综合式测验各有什么特点? • 标准化测验的特点是什么? • 测验的质量可以从哪几方面来衡量?
• 按照参照系统划分 常模参照测验(norm-referenced test):所谓常模(norm)
是指标准化样本中测验的分数分布
标准参照测验(criterion-referenced test):能力、标 准、内容范围
• 按照测验方式划分
笔试/口试 纸笔测验/基于计算机的测验 (P&P) (CBT) 主观测验/客观测验 (就评分方法而言) 分立式测验(discrete-point) / 综合式测验 (integrative) 速度测验(speed test)/难度测验(power test) 高风险测验(high-stake test )/ 低风险测验 (low-stake test )
各类测验的特点
A成绩测验 B能力倾向测验 C水平测验 D诊断测验 E分班测验
测验特点 及 类型 依据 所测能力 信息指向 标准化程 度 最高 可以较高 可以较高 不高 规模
语言理论 教学内 容 认知理论 教学内容
一般语言 水平 不一定 学习潜能 现有水平
现在—将来 过去 将来 将来
最大 可以很大 可以很大 不大
第二讲:语言测验的基本概念
语言测验的作用和目的 语言测验的种类 语言测验的质量标准
语言测验的作用和目的
• 作用:科学地测量出学习者的语言能力 • 目的: 选拔 诊断 评估 预测 研究
测验的种类
• 按用途(目的)划分 能力测验(或水平测验)proficiency test、
成绩测验(或学业测验)achievement test、 分班测验placement test、 诊断测验diagnostic test、 能力倾向测验aptitude test :语音编码能力、综合归纳能力、
教学内容
现有水平
过去—将来
低
小
常模参照和标准参照的区别
┏━━━━━━┳━━━━━━━━━━━━┳━━━━━━━━━━━━┓ ┃ ┃ 常 模 参 照 ┃ 标 准 参 照 ┃ ┣━━━━━━╋━━━━━━━━━━━━╋━━━━━━━━━━━━┫ ┃测验的性质 ┃ 一般语言能力或水平 ┃ 特定的语言点 ┃ ┠──────╂────────────╂────────────┨ ┃分数解释的 ┃ 相对的:某被试和其他 ┃ 绝对的:被试的成绩和 ┃ ┃性 质 ┃ 被试比较 ┃ 预先制定的内容比较 ┃ ┠──────╂────────────╂────────────┨ ┃分数的分布 ┃ 以平均分为中心的正态 ┃ 不考虑分布 ┃ ┃ ┃ 分布 ┃ ┃ ┠──────╂────────────╂────────────┨ ┃测验的目的 ┃ 区分所有被试的能力 ┃ 看被试掌握了多少教学 ┃ ┃ ┃ ┃ 内容 ┃ ┠──────╂────────────╂────────────┨ ┃测验的内容 ┃ 被试不知道或很少知道 ┃ 被试完全知道 ┃ ┗━━━━━━┻━━━━━━━━━━━━┻━━━━━━━━━━━━┛
标准正态分布
语言测验的质量标准(一)
• 信度
可靠性,指测验分数的稳定性和一致性程度。
• 效度
有效性,指测验在多大程度上测到了想测的东西。 内容效度(content validity) 效标关联效度(criterion-related validity ) 共时效度(concurrent validity) 预测效度(predictive validity) 构想效度(construct validity) 表面效度(face validity) 信度和效度都是测验的质量核心,测验的可靠性是测验有效的 必要非充分条件。
ቤተ መጻሕፍቲ ባይዱ 语言测验的质量标准(二)
• 难易度(facility value) • 区分度 (discrimination index)
标准化 (standardized test): 标准化测验的特点有三个: 第一,有固定的、标准的内容,其内容不因测验有不同 版本而改变; 第二,施测和评分按标准程序进行,每次测验的考务和 评分程序都一样,不能随意改变; 第三,都经过试验,在进行了大量的经验性研究之后才 正式使用 。 是测验的一种属性,而非质量标准。
思考题
• 语言测验的作用和目的是什么? • 根据用途划分,语言测验可以分成哪几个类 别? • 客观性考试和主观性考试的根本区别是什么? • 分立式测验和综合式测验各有什么特点? • 标准化测验的特点是什么? • 测验的质量可以从哪几方面来衡量?