《教育统计与评价》复习授课内容1_2

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《教育统计与评价》复习授课内容1_2
《教育统计与评价》授课内容姜凤华教授
第⼀讲教育统计与评价概述
⼀、教育统计学的定义、内容与作⽤
(⼀)教育统计学的定义:教育统计学是应⽤统计学的⼀个分⽀,是统计学与教育学的⼀门交叉科学。

它是运⽤统计学的原理和⽅法,研究和把握教育现象数量⽅⾯的⼀门⽅法论科学。

1.教育统计学的学科属性:是应⽤统计学的⼀个分⽀,是统计学与教育学的⼀门交叉科学。

2.教育统计学的本⾝性质:是运⽤统计学的原理和⽅法,研究和把握教育现象的数量⽅⾯。

3.教育统计学的主要特点:在于它所研究的是教育现象的数量⽅⾯,⽽对教育现象的本质及其规律性,从量的⽅量作出具体的说明,从⽽使对教育现象的研究分析基于可靠
的数量基础上,或者对制定教育决策提供可靠的数量依据。

4.教育统计学的主要任务:是研究如何搜集、整理和分析关于教育现象数据资料,并进⾏科学的推断,从⽽揭⽰教育现象所蕴含的客观规律。

(⼆)教育统计学的内容
主要分为描述统计与推断统计两部分内容。

1.描述统计:对调查获得的数据资料进⾏整理、概括或计算出能够反映教育现象的综合指标。

借助于这些综合指标,进⾏⽐较并作出结论。

2.推断统计:根据样本提供的数据资料特征并以⼀定的置信度推断或预测总体的有关情况。

在教育研究以及教育实际⼯作中,往往所要调查的总体很⼤,不能或难以进⾏全
⾯调查,这时往往运⽤推断统计的⽅法,由局部(样本)推论总体,由已知推论未知。

(三)教育统计学的作⽤
1.教育统计学是教育科学研究中定量分析的重要⼯具
唯物辩证法告诉我们,任何客观事物都有其质与量的两个⽅⾯,教育现象作为客观存
在的⼀种事物也不例外,因此,教育教学必须对事物进⾏全⾯的分析,不要有质的研
究分析,也要有量的研究分析。

2.教育统计学是教育评价技术中的重要⽅法
在众多的教育评价技术中,定量评价是很重要的⼀个⽅⾯,⽽教育统计⽅法⼜是定量评价中分析资料的重要⽅法。

3.教育统计学有助于增强教育决策的科学性。

教育统计学中收集资料、分析资料的科学⽅法以及科学的推断,都可以为教育决策提供依据,提供资料,从⽽增强教育决策的
科学性,提⾼管理的科学⽔平。

4.教育统计学有助于培养科学的思维⽅式
在新的时期,思维应具有科学性。

在教育统计学内容中,⽆论是描述统计或是推断统计,都可以培养⼈们的统计思维,学会科学的推论与思考问题的⽅法,形成实事求是地对待⼀切事物的辩证唯物主义态度。

⼆、教育评价的定义及作⽤
(⼀)教育评价定义的理解
1.教育评价包含评价依据、评价技术和评价作⽤三部分
2.教育评价是⼀个系统的综合性的活动过程。

3.教育评价强调定量分析判断与定性分析判断的结合
4.教育评价贯穿于⼀切教育活动之中
(三)教育评价的作⽤(见教材第4页⾄第5页)
1.导向作⽤ 2.管理作⽤ 3.激励作⽤ 4.诊断作⽤ 5.鉴定作⽤
这些作⽤在教育过程中的具体体现如图⽰:
三、教育评价的类型及⼯作程序
(⼀)教育评价的类型
1.依评价的⽅法分(见教材第6页——第8页的四对⼈对)
①⾃我评价与他⼈评价(谁来评)
②横向评价与纵向评价(与谁⽐)
③绝对评价与相对评价(评价标准)
④定性评价和定量评价(⾓度)
2.依评价功能分(见教材第9页—第10页)
①安置性评价:为作出某种安排,⼀般在教育教学活动前进⾏。

②诊断性评价:为发现问题,⼀般在教育教学活动前或中进⾏。

③形成性评价:为提供过程中的信息,⼀般在教育教学在活动中进⾏。

④终结性评价:为作出某种鉴定,⼀般教育教学在活动终进⾏。

(⼆)教育评价的⼯作程序(见教材第11页)
四、教育统计与教育评价的关系
教育统计与教育评价既有联系,也有区别。

1.联系:教育统计是教育评价技术中的重要⽅法,⽽教育评价是教育统计的深化,它是在统计基础上进⼀步对事物作出价值判断。

2.区别:教育统计教育评价
①主要⽬的:数据分析价值判断
②技术特点:数量化定量与定性结合
③活动特点单⼀性活动综合性活动
第⼆讲教育评价指标体系概述
⼀、指标体系的概念
1.狭义的概念:指标——被评价的因素。

指标体系——被评价的全部因素的集合。

2.⼴义的概念:指标——包括因素、数量、标准和⽂字描述。

⼆、设计教育评价指标的⽬的:规定评价哪些因素,将评价所依据的⽬标具体化、⾏为化,即
把评价变为分项评价。

管理激励诊断
鉴定
导向
三、指标体系在评价中的作⽤
1.对评价对象的⾏为起质的导向作⽤。

2.有助于评价反馈功能的发挥。

3.有助于提⾼评价的客观性和精确性。

4.有助于增强评价结果的可⽐性。

总的来说,指标体系即是评价⼯作的基础,也是评价⼯作的核⼼,它对评价起着统揽全局的作⽤。

四、指标体系的设计系列(P20—24)
1.⽅向性(思想) 2.⼀致性(思想) 3.系统性(技术) 4.独⽴性(技术) 5.可测性(操作) 6.可接受性(操作)
第三讲教育评价指标体系的设计⽅法⼀、指标设计的⽅法 1.⽬标分解法
①特点:对评价的⽬标逐级分解为亚指标、主指标等②适⽤:⼀般⽤于⾮学业⽅⾯的评价。

例如:p25 表2-1:(主指标)
2.布鲁姆的“分类学”法
①特点:对教育⽬标分解为认知领域、情感领域和动作技能领域。

认知领域⼜分为记忆、理解、应⽤、分解、应⽤、分解、综合、评价六个⽅⾯。

②适⽤:重点是认知领域的分类,它主要⽤于学业⽅⾯的评价,如学科考试的命题可灵活运⽤认知领域的分类,例如P332表12-2,P50 表3-1以及P28表2-3。

3.问卷调查法 4.多元统计法
⼆、指标数量确定的⽅法(介绍四种,重点在第2、3两种) 1.经验法(定性)
2.对照能权法(定量与定性结合)步骤:①对每两个指标进⾏对照⽐较上式分(满分值为1)②分别计算各个指标的得分和③将每个指标的得分和除以全部指标的总得分即为每个指标的数量。

(见P33表2-5) 3.咨询法(定性和定量结合)
步骤:①让每个被咨询者对指标排序,重要⾄次要的序数从⼤到⼩排列(如表2-7)②把众多被咨询者排序结果放在⼀个表(如表2-8)③计算每个指标的总序数④将每个指标的总序数除以全部指标的总序数即为每个指标的数量。

(见p35表2-8) 4.主成份分析法(定量)三、指标评价标准的制定
1.标准的含义:①临界点②⼀种规定③中介物在教育评价中,出现较多的是作为⼀种规定。

2.“规定”的形式:定性标准和定量标准。

2.制定标准的原则:⽅向性、时效性、客观性、可⾏性、激励性(见P38)
第五讲描述性统计分析评价⽅法——综合指标
实际上,从这⼀讲开始的教学内容都是介绍教育评价技术中的重要⽅法——教育统计分析⽅法,也即是分析资料的⽅法。

其中包括描述性统计分析⽅法和推断性统计分析⽅法两⼤部分。

⼀、描述性统计分析评价⽅法的主要特点,对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。

所谓综合指标指的是从教学⽅⾯综合说为事物特征的指标。

常⽤的综合指标有绝对数、相对数、平等数和标准差。

重点介绍后⾯两种。

⼆、综合指标的计算及解释(⼀)绝对数(规模)(⼆)相对数(程度)(三)平均数(⽔平)
通常可⽤符号x 表⽰平均数
1.算术平均数(未经分类汇总的测量数据资料)计算⽅法见p57的(4.1)公式。

2.加权平均数(已经分类汇总的资料)
①组距数列平均数(对测量数据分组统计⼈数)例如P58表4-7的资料。

计算⽅法如P58的(4.2)公式。

及83各教师平均年龄的计算。

* 为了减少计算的⿇烦,在此介绍计算器统计功能的使⽤: A 、操作步骤
计算器的统计功能的计算只能得到如下六个统计结果:n (数据个数)、
∑x (数据和)、∑2
x
(数据平⽅和)、x (平均数)、σ(总体标准差)和S (样本标准差)。

操作步骤如下: 1)显⽰统计状态:2ndF STA
T(或SD)
2)输⼊数据:每输定⼀个数据按DA TA
3)取出统计结果:这时六个统计结果均处于待取状态,可根据需要取出其中的结果。

B 、注意事项
1)若需继续进⾏第⼆组数据的统计运算时,需取消统计状态,再按上述步骤操作。

按2ndF STAT
即可取消统计的状态。

2)若不需要计算n 、
∑x 、∑2
x 、x 、σ和S 时(即进⾏其他⼀般运算时)
,也应取消
统计状态)。

3)加权平均数输⼊数据时每输⼊⼀类⽽按DATA ,例如对P58表4-1的输⼊如下:52.5×5
DATA,47.5×13 DATA ,……,22.5×3 DATA 。

②总平均数(已知各个平均数)例如P61表4-4的资料。

计算⽅法见P61的(4.5)公式及对表4.4的计算。

同样可⽤计算器操作。

③等级平均数(对个体或不同等级再按等级归类汇总)
计算⽅法见P58的(4.3)公式及对表4-2的计算,同样也可以⽤计算器操作。

编号可以倒数编如表4-3的优、良、中、及、不及按5、4、3、2、1的顺序编号,计算的等级平均数是3.95,但最终的价值判断是⼀样的,即都是处于良好的⽔平。

等级平均数适⽤于类别数据的计算,如品德、兴趣、情感等⾮学业成绩⽅⾯的分析评价,常常需要⽤到等级平均数,它既可以⽤于对集体的演⽰,也可以⽤于个体的评价。

④评分平均数(对各个⽅⾯或不同⽐重并评分)
例如p60表4-3的资料,计算⽅法见p60的(4.4)公式及对表4-3的计算,同样也可以⽤计算器操作。

根据评份平均数的特点可知,⽂艺⼀种全⾯性的分析评价,因此,常常⽤于评⽐,选拔等。

⽽且可按如下程序进⾏:①设计指标②确定指标权重③制定评选标准④评分⑤计算评分平均数⑥确定⼈选。

(3)平均发展速度
指的事物某⼀时期内的平均发展情况.
计算⽅法见p61的(4.6)公式,由于根据公式现在需要开⾼次⽅,不容易做到,所以把(4.6)公式转换为对数的形式计算,即(4.7)公式,但仍然⽐较⿇烦.因此,可以利⽤计算器⾮统计功能中的开⾼次⽅,使
y x 或直接取得结果,但必须取消统计状态.
平均发⽣速度是⼀个相对数,例如p62算得083.1=发x 表⽰平均每年在校⽣都是上⼀年的1.083倍。

平均发展速度的作⽤有两点:①分析评价事物在⼀定时期内的平均发展情况。

②可以⽤于预测未来的情况,预测公式为:()
N
x
a ,可⽤计算器中的⾼次⽅使y
x 取得结果。

(四)标准差(差异)通常⽤符号σ式S 表⽰。

标准差的计算⽅法
①未经分类汇总的资料:见P63(4.7)公式以及对甲、⼄两组成绩的计算。

可⽤计算器中的统计功能,按照算术平均数的⽅法输⼊数据,即可同时得σ和x 的结果。

②已经分类汇总的资料:见p63的(4.8)公式以及83名教师年龄的标准差计算。

同样可⽤计算器中的统计功能,按照加权平均数的⽅法输⼊数据,即可得σ和x 的结果。

对于前⾯所举的加权平均数的例⼦,计算器操作时均可同时算得标准差和平均数。

(五)标准差的解释:
③标准差的值愈⼤,则说明差异愈⼤,否则说明差异较⼩。

但究竟标准差⼤好还是⼩好?这不能⼀概⽽论需要具体问题具体分析。

第六讲描述性统计分析评价⽅法——平均数与标准差的综合应⽤⼀、全⾯评价⽐较总体(⼀)数据的主要特征
1.集中趋抛:指⼤多数数据⽐较趋近的⽔平。

通常把集中趋势的量数称为集中量数,平
均数是最常⽤的⼀种集中量数。

2.离中趋势:指数据之间变异程度或离散程度。

通常把描述离中趋势的量数称为差异量
数,标准差是最常⽤的⼀种差异量数。

(⼆)传统的评价⽐较总体⽅法
只是考察数据的集中趋势,也即是说只以平均数对总体进⾏评价⽐较,仅就平均数的⾼低⽽下结论,这是⽚⾯的。

因为平均数只反映了集中趋势⽔平特征,由于许多偶然性的因素影响,数据还具有变异性的特征。

但传统的评价⽅法并未顾及这⼀点。

(三)全⾯评价⽐较总体的⽅法作为全⾯评价⽐较总体的⽅法,必须抓住数据的两个主要特征进⾏综合分析,现要分析集中趋势,也要分析离中趋势。

也即是说,必须综合应⽤平均数和标准差对总体予以评价⽐较。

例如p63甲、⼄两组成绩的⽐较;⼜如思考与练习的第6题。

⼆、正确评价学⽣的学习成绩(⼀)标准分数:σ
x
x Z -=
例如: x x σ z
同⼀学⽣
-1.010
75
7408.0136566政

同⼀科
同⼀学⽣??
-1
65
85
25.0209075期末
中段
(⼆)标准分数的解释
1.Z>0时,该成绩⾼于集体平均⽔平。

2.Z<0时,该成绩低于集体平均⽔平。

3.Z=0时,该成绩就处于集体平均⽔平。

4.Z 值愈⼤,该成绩愈好。

(三)标准分数的作⽤:把各种不同类型的分数统⼀在⾼于或低于集体平均分多少的标准上衡量。

(四)标准分数的具休应⽤
1.正确评价同⼀学⽣科⽬的成绩,如前⾯例⼦。

2.正确评价同⼀学⽣同⼀科⽬不同阶段的成绩。

如前⾯例⼦。

3.正确评价不同学⽣多科总成绩。

例如p129表8-10。

⾼考标准化考试报告的分数是已经对z 进⾏了线性变换,即y=500+100Z ,这并不会改变原来z 的排序,线性变换避免了负数的出现,且有利于选拔。

第七讲推断性统计分析评价⽅法——平均数差异分析
⼀、推断性统计分析评价⽅法的主要特点
对数据资料进⾏统计检验,然后依据统计检验的结果并以⼀定的置信度对教育客观事物给予评价。

所谓统计标准,就是标准事物之间的差异或者联系是否显著问题。

⽐如
8280==B A x x 造成差异的原因??
)
(:)(:显著⾮本质
条件不显著本质偶然
⼆、两上总体的情形
1.独⽴总体:两个总体的对象不同,对它们的差异评价,也可称为横向评价。

例如某班男、⼥
学⽣某科成绩的⽐较。

实验班与控制班的实验⽐较,⽼师与学⽣对某个问题的态度⽐较等均为独⽴总体。

2.相关主体:两个总体的对象相同,对它们的差异评价,也可称为纵向评价。

例如,某班学⽣
某,某科中段成绩与期末成绩的⽐较、实验班实验前与实验后的情况⽐较、⽼师们对两个⽅案的态度⽐较等均为相关总体。

三、平均数差异分析
(⼀)独⽴总体平均数差异检验规则若α)(112)1()1(21212
222
112
1df t n n n n S n S n x x t ≤
+-+-+--=
(其中221-+=n n df )
则认为两个平均数差异不显著,原则认为差异显著。

*注意:①α)(df t 可查t 分布表(附表⼆)得到,其中α称为显著性⽔平,指的是显著时犯错误的可能性,⼀般取05.0≤α。

(5%也即犯错可能是⼩概率,认为是⾼度不可能发⽣的,α愈⼩,认为犯错误的可能性愈⼩,即认为显著的程度愈⾼。

②查表时,如何确定
α取值?可按照的001.0,01.0,002,05.0=α顺序进⾏。

先从
05.0=α开始查,若不显著则停⽌查表,若结果显著,则可以继续按顺序往下查表;尽可能取显著的α取值,⽽且取显著⽔平最⼩的α取值。

除⾮05.0=α就是不显著的,则只能取这
⼀结果。

(⼆)相关总体平均数差异检验规则
若()1)(2
121-=≤=
--n df df t n
S x t x x x x 其中α
则认为差异不显著,否则认为差异显著。

例如p67针对表4-5的资料并得455.3=t ,⽽且选取01.0=α的查表值,这说明
01.0,02.0,05.0=α时都是显著的,⽽01.0=α则不显著,所以根据前⾯说的原则选取01.0=α查表值,即是说实现前后成绩显著这⼀结论犯错误的可能性有1%,⼀般认为是⾼度
不可能发⽣的。

以上关于平均数的差异分析,⽆论是独⽴总体还是相关总体的检验都应⽤了t 分布表,这种应⽤t 分布表进⾏统计检验的⽅法,通常称为t 检验。

第⼋讲推断性统计分析评价⽅法——⽐例差异分析
在教育实际中,常常需要对⽐例的差异进⾏分析⽐较,事实上,这是对类别的收据分析,⼀般在⾮学业⽅⾯的资料都表现为类别数据。

⼀、独⽴总体差异检验规则
若2
12
221
112
11)
1()
1(α-≤-+
--=
Z n p p n p p p p Z
则认为两个⽐例差异不显著,否则认为差异显著。

2
1α-Z 可查正态分布(附表⼀)得到。

29
.3,001.058
.2,01.033.2,02.096.1,05.09995.02
001
.01995.02
.0199.02
02.01975.02
05.01============----Z Z Z Z Z Z Z Z 时当时当时当时当αααα
⼆、相关总体差异检验规则
若 2
1α-≤+-=
Z c
b c b Z
则认为两个⽐例差异不显著,否则认为差异显著。

公式中的b 、c 是看法不⼀致的两类⼈数。

例如100⼈对两个⽅案的表态有下⾯四种情况:
①a=55 ②b=5 ③c=15 ④d=25
应⽤正态分布表进⾏统计检验的⽅法,通常称为u 检验。

第九讲推断性统计分析评价⽅法——相关分析
相关分析的⽅法可以对两事物之间的关系从数量全⾯给予推断评价。

这种分析的⽅法主要通过计算相关系数来实现,此外还应⽤了2
x 检验的⽅法。

⼀、相关系数
相关系数是反映两事物之间的联系⽅向和程度的⼀个量数。

通常⽤γ表⽰,它的取值范围限于11±≤≤-γ。

1.γ的正、负号可以反映相关的⽅向,当γ>0时表⽰正相关;当γ<0时表⽰负相关。

2.γ的⼤⼩可以反映相关的程度,但需要进⾏显著性检验。

γ=0表⽰毫⽆关系。

3.γ=+0.8与γ=-0.8表⽰相关程度是相等的,⽽相关⽅向是不同的。

4.γ值仅说明两事物是否存在联系,但并不能说明它们是否存在因果关系,两者不可混为⼀谈。

⼆、相关分析的具体⽅法
根据不同的数据资料,有不同的相关分析⽅法。

(⼀)积差相关法(两事物均为测量数据)
1.积差相关系数的计算:见0>P (4.14)公式。

2.积差相关分数的显著性检验规则若
)2()(-=≤n df af 其中αγγ
则认为两事物关系不显著,否则认为关系显著
αγ)(df 可查附表三得到。

(⼆)等级相关法(两事物均为顺序数据)
1.等级相关系数的计算:见p71的(1.15)公式。

2.等级相关系数的显著性检验规则若
αγγ)(u s ≤
则认为两事物关系不显著,否则认为关系显著。

αγ)(n 可查表四得到。

(三)点双列相关法(⼀事物为测量数据,另⼀事物为⼆分型的类别数据) 1.点双列相关系数的计算:见p72的(4.16)公式。

2.点双列相关系数的显著性检验规则若)2()(-=≤n df df pb
其中α
则认为两事物关系不显著,否则认为关系显著。

αγ)(df 可查附表三得到。

(四)2
x 检验(两事物均为类别数据)
1.2×2的2x 检验规则(均为⼆分型的类别数据)
若)1()()
)()()(()
2(2
2
2
=≤++++--=
df df x d b c a d c b a n bc ad n x
其中α
则认为两事物关系不显著,否则关系显著
2.2
x fd 的γ检验规则(、k γ为两事物的分类数)
若)1)(1(..
..)(2
2
--=-=
∑∑
k r df n n n n j n n y
n x
j i i 其中
则认为两事物关系不显著,否则关系显著。

*注意计算2
x 值时,应先对应每⼀个y n 计算相对应的n j n n i ??,然后代⼊公式计算如下表的计算,这是对法律常识成绩与所属阶层的相关分析。

59
.12488.459.12488
.465
.1)65.12(65.27)
65.2726(06
.12)
06.1213(05
.0)6(22
05.0)6(2
2
2
2
2
2
=<===-+
+-+
-=
x
x
x x x
分布表得查
∴认为法律常识成绩与所属阶层之间没有显著关系。

由2
x 检验所针对的类别数据以及所举的例⼦可知,它特别适⽤于⾮学业⽅⾯的相关分析。

在此,对七、⼋、九讲的统计检验⾮简要归纳:1.统计的检验的步骤
①计算值②查表值
③⽐较:④结论:
不显著显著
⾮本质本质偶然条件
2.统计检验步骤与审题
①差异或


第⼗讲考试质量的评价
对于考试质量的评价,主要通过对效度、信度、区分度和难度四个指标的分析来实现。

⼀、效度
(⼀)效度的含义、考试的有效性。

(⼆)效度分析
1.内容效度
①内容效度含义:考试内容与预定要考内容⼀致性程度。

②内容效度的分析⽅法:利⽤双向细⽬标进⾏分析。

注意编制双向细⽬表的步
骤和要求。

2.效标关联效度
①效标关联效度含义:考试结果与效标的⼀致性程度。

注意效标的含义及效标的选择。

②效标关联程度的分析⽅法:主要是通过考察考试结果与效标之间的相关程度,即计算两者之间的相关系数并进⾏显著性检验。

⼆、信度
(⼀)信度含义:考试的可靠性。

(⼆)信度分析
1.再测信度
①再测信度含义:⽤同⼀份试卷对同⼀组学⽣不同时进⾏前后两次考试,
然后分析两次考试结果的⼀致性。

②再测信度的分析⽅法:主要通过考察两次考试结果的相关程度,即计
算两次考试成绩的相关系数并且进⾏显著性检验。

③再测信度的不⾜之处:前后两次考试的时间间隔不易把握。

2.分半信度
①分半信度的含义:有意识的把试卷编制成等效的两个部分,然后分析
这两部分考试结果的⼀致性程度。

这相当于⼀份试卷对同⼀组学⽣同
时进⾏两次考试,避免了再测信度两次时间间隔的问题。

②分半信度的计算⽅法:先计算两部分结果的相关系数,再代⼊分半信
度)
(
xx
r计算公式,即p53的(3.1)公式。

γ
γ
γ
+
=
1
2
xx
③分半信度的解释:客观题的
xx
γ应达到0.9以上,主观题的
xx
γ应达到
0.8以上。

三、难度
1.难度含义:试题的难易程度。

(⼆)难度分析
1.难度系数的计算
①主观题:见p337的(12.2)公式
②客观题:见p338的(12.3)公式
2.难度系数的解释
①P>0.7时较易
②P<0.3时较难
③7.0
3.0≤
≤P时较适中。

3.全卷的平均难度及难度分配
⼀般来说,全卷的平均难度应在0.45-0.55之间。

全卷的题⽬难度分配⼀般为易:中:难=3:5:2。

当然结合考试⽬的灵活处理。

四、区分度
1.区分度含义:试题的鉴别能⼒。

2.区分度分析
1.相关法:计算学⽣试题得分与试卷总分的相关系数并且进⾏显著性检验。

2.两端分组法
①两端分组法区分度(D)的计算公式;见p337的(12.1)公式。

D=
L
H
P
P-
其中
L
H
P
P和分别为学⽣⾼分组和低分组中的难度。

注意⾼分组和低分组各取27%的学
⽣。

②两端分组法区分度D的解释
1)当D40
.0
≥时区分度属好
2)当40
.0
30
.0<
≤D时区分度⽐较好
3)30
.0
20
.0<
≤D时区分度还可以
4)时区分度属差
当20
.0
<
D
五、考试质量分析报告的主要指标值:见p338
第四讲教育评价中收集资料的⽅法
在教育评价中,最常⽤的收集资料的⽅法有观察法、问卷法、访问法、测量法
⼀、观察法
观察法的主要特点是到现场观察,特别适⽤于⾏为表现⽅⾯的评价。

(⼀)观察种类:最主要的⼀种分类是分成参与观察和⾮参与观察,主要区别在于是否直接
参加被观察的活动过程。

参与观察直接参加对⽅的活动,收集的资料较为直接具体,但较为容易
影响对⽅的活动进程。

⽽⾮参与观察是从旁观察对⽅的活动,不那么容易影响对⽅的活动过程,
但收集的资料不够直接具体。

从收集资料的⽬的看,在有的条件的话还是尽可能采⽤参与观察,
但要遵循某些规则。

(⼆)观察记录
常⽤的观察记录有快速记录,卡⽚记录,表格记录、观察⽇记和录⾳录像。

但最主要的是卡
⽚记录和表格记录,见p42-43。

⼆、问答法
问卷法的主要特点是填答问题表格,主要适⽤于内隐的⼼理活动⽅⾯的评价,⽐如思想性、认识性⽐较强的问题。

(⼀)问卷种类
主要有限制式、开放式、半限制式三种问卷。

1.各种问题的特点
①限制式问卷:找出问题后安排答案,让对⽅从中选择。

限制式问卷⼜分为单选、
多选和排序三种。

②开放式问卷:找出问题后不安排答案,让对⽅⾃由回答。

③半限制式;找出问题后既安排答案,也有⾃由回答。

2.选⽤问卷种类⼀般原则
①能⽐较简明扼要表达答案意思的可⽤限制式问卷。

②所⽐较简明扼要表达答案意思,但把握不到安排的答案能否包含所有的想法,可
⽤来限制式问卷。

③对于复杂的⼀些探讨性的问题。

可采⽤开放式问卷
(⼆)设计问卷的原则
p45-46列举五点,应特别注意节(2)(4)两点
三、访问法
访问法的主要特点是直接交谈,特别适⽤于深⼊了解情况以及不具备填答问卷能⼒的对象。

(⼀)访问法的步骤:见p47。

(⼆)访问法注意的问题:p47。

四、测量量法
测量法的主要特点是具体测试。

(⼀)测重量表
1.类别量表:表⽰事物的分类。

2.顺序量表:表⽰事物的顺序。

3.等距量表:既可表⽰事物的分类、顺序,也有相等的计量单位和相对零点。

4.⽐率量表:既可表⽰事物分类、顺序,也有相等的计量单位和绝对零点。

⼀般来说,类别量表测量得到的数据库的类别数据;顺序量表测量得到的数据称为顺
序数据,等距量表和⽐率量表测量得到的数据均称为测量数据。

(⼆)测量误差
任何测量都不可能绝对精确的,尤其是教育测量,由于教育现象的复杂性和测量间接性,误差是存在的。

⼀般有三种误差影响测量的效果:①系统误差②抽样误差③随机误差。

测量时应尽量控制或者降低误差,但随机误差是最不容易控制的⼀种,所以说随机误差是影响测量效果最主要的⼀种误差。

对于随机误差,从可以通过p55(3.4)公式予以估计。

(三)测量结果的解释
鉴于测量误差是不可避免的,尤其是随机误差,所以对测量结果应给予正确的解释,可见p55第五段。

思考与练习题
第⼀讲
1.什么是教育统计?如何理解?授课内容第⼀讲⼀(⼀)。

2.什么教育评价?如何理解授课内容第⼀讲⼆(⼀)
3.有⼈认为,学习教育统计是从事专职统计⼯作者的事情,⽽对于其他⼈似乎没必要学
习。

你是否同意这种看法,理由是什么?可从教育统计的定义、内容、作⽤以及与。

相关文档
最新文档