自考教育统计与测量温习必看知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
自考教育统计与测量温习必看知识点
统计:对事物某方面特性的量的取值从整体上加以把握与熟悉。
教育统计:对教育领域各类现象量的取值从整体上的把握与熟悉,它是为教育工作的良好运行、科学治理、革新进展效劳的。
统计学内容:描述统计是通过列表归类、刻画图象、计算刻画数据散布特点与变量相依关系的统计量数,如平均数、标准差和相关系数等,把数据的散布特点、隐含信息,归纳明确地揭露出来,从而更好地明白得对待和利用数据。
推断统计是教育统计的核心内容。
如何利用实际取得的样本数据资料,依据数理统计提供的理论和方式,来对整体的数量特点与关系作出推论判定,即进行统计估量和统计假设查验。
测量:按必然规那么给对象在某种性质的量尺上的指定值。
教育测量:给所考查研究的教育对象,按必然规那么在某种性质量尺上的指定值。
比率量尺:是一种有绝对零点的等单位的线性持续体系,其上的数字量化水平最高,全面具有可比可加可除性。
标准化考试(考试):测量工具、施测与评分程序、说明分数的参照体系都以科学地实现标准化。
即代表性行为样本的客观而标准化的考试。
标准化考试:教育条件下的心理特质是学业成绩的标准化测量。
量表:标准化考试中的测量工具(考试卷或心理测试项目的集合)与说明分数的常模(或标准),都有物化的形态,合在一路称为量表。
教育测量的特点是间接性和要抽样进行。
明白得教育测量抓住:测量的结果确实是给所测对象在必然性质的量尺上的指定值。
要达到目的就要依照必然规那么来进行一系列工作。
工作如何进行和能在什么性质量尺上指定值,归根到底取决于所测对象本身的性质。
数据:用数量或数字形式表现的事实资料。
数据种类:来源分计数数据、测量评估数据、人工编码数据。
反映的变量的性质分称名变量、顺序变量、等距变量、比率变量数据。
数据特点:离散性、变异性、规律性。
计数数据:以计算个数或次数取得的,多表现为整数。
测量评估数据:借助测量工具或评估方式对事物的某种属性指派给数字后所得的数据。
人工编码数据:以人们按必然规那么给不同类别的事物指派适当的数字号码后形成的数据。
称名变量:说明某一事物与其他事物在名称、类别或属性上的不同,不说明事物之间不同的大小、顺序的前后及质的有劣。
计算次数或个数,不能进行运算。
顺序变量:就事物的某一属性的多少或大小顺顺序将各事物加以排列的变量,具有品级性和顺序性的特点。
数据之间有顺序和品级关系,不具有相等的单位,也不具有绝对的数量大小和零点,进行顺序递推运算。
等距变量:说明相对大小,相等的单位,零点相对,不能用乘除法反映数据之间的倍比关系。
比率变量:具有量的大小、相等的单位、绝对零点、进行运算,用乘除法处置数据,做比率描述。
不同性质的测量量尺:名义量尺(指定数字有类别标志意义,无性质好坏、分量多寡涵义,量化水平最低);顺序量尺(数字量化水平最高,有好坏大小前后之别,单位不等,有可比性无可加性);等距量尺(数量化水平更高,数字是单位相等但零点可任意指定的线形持续体系上的值,有可比可加性无可除性);比率量尺(是一种有绝对零点的等单位的线性持续体系,其上的数字量化水平最高,具有可比可加可除性)。
次数散布:一批数据中各个不同数值所显现次数多少的情形,或是这批数据在数轴上各个区间内所显现的次数多少的情形。
编制次数散布表的步骤:求全距:数据中最大值与最小值之间的差距。
定组数:确信把整批数据划分为多少个等距的区组,数据个数200个之内,组数取8-18组。
定组距:全距与组数的比值取整数确实是组距,取奇数或5的倍数。
写出组限:每一个组的起止点界限,如10-15(九、5 14、5)。
求组中组:组中值等于(组实上限加组实下限)除以2,选奇数。
归类划记:设计表格记录上述有关结果对数据归纳划记。
记录次数。
次数散布图—次数直方图:由假设干宽度相等、高度不一的直方条紧密排列在同一基线上组成的图形。
次数多边图:利用闭合的的折线组成多边形以反映次数转变情形的图示方式。
累计次数曲线图绘制步骤。
一、纵轴为累计次数的量尺,横轴代表考试的分数量尺。
二、关于“以下”散布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是累计的次数。
3、用持续滑腻的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“S”形曲线。
线形图绘制
:一、横轴代表自变量,纵轴代表因变量。
二、依照有关统计事项的具体数据,在由纵横两轴所决定的平面上画记圆点,用稍粗的线段把相邻的点依次连接。
3、在同一个图形中,可画假设干条线(不超过3条)不同的线形图,便于比较分析。
用不同的折线,在图形的适当位置上标明图例。
次数多边图制作:一、画纵轴和横轴。
二者长度之比5:3,纵轴为次数的量尺,横轴代表考试的分数量尺,并在横轴上最低组与最高组外各增加一个次数为0的组。
二、在两轴所夹的直角坐标平面上,别离以每一个组的组中值为横坐标,相应低次数为纵坐标,画出两个点。
3、用线段把相邻的点依次连接起来,连同横轴,组成一个闭合的多边形。
统计分析图——散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。
适应描述二元变量的观测数据。
线形图:以起伏的折线表示某种事物的进展转变及演变趋势的统计图。
适于描述事物在时刻序列上的转变趋势,鄙视一种事物随另一事物进展转变的趋势模式,比较不同人物集体在同一心理或教育现象上的转变特点几彼此联系。
条形图:用宽度相同的长条表示各个统计事项之间数量关系的图形。
用于描述离散性的统计事项。
圆形图:以单位圆内各扇形面积占整个圆形面积的百分比表示各统计事项在其整体中所占相应比例的图示方式。
用于描述具有百分比结构数据。
集中量数:观测数据不仅具有离散性的特点,而且在多数情形下具有向某点集中的的趋势,反映次数散布集中趋势的量数。
作用—提供整个散布中多数数据的集结点位置,集中反映一批数据在整体上的数量大小,是一批数据的典型代表值。
种类—算术平均数、中位数、众数。
算术平均数:一批数据总和除以数据总次数所的的商。
特点(反映灵敏、确信周密、简明易懂、归纳直观、计算简便、代数运算、应用普遍)。
性质—数据组全数观测值与其平均数的离差之和为0。
每一观测值都加上一个相同常数c计算变换后数据的平均数等于原有数据的平均数加上那个常数。
每一观测值都乘上一个相同常数c所得新数据的平均数,其值等于原数据的平均数乘以那个常数。
对每一个观测值做线性变换,即乘上相同的常数,再加上另一常数d,计算变换数据的平均数,其值等于原数据的平均数做相同线性转变后的结果。
中位数:Mdn 位于数据散布正中间位置上的数。
特点—依照全数数据的个数确信位置,意义简明,对排成顺序的数据来讲,计算容易。
中数计算基于中间位置相邻的部份数据,不受极端数据的阻碍。
顺序变量的观测结果适合采用中数作为散布的集中量数。
不足—观测数据已分组归类或当原始数据散布中靠近中数周围有重复数据显现时,难以用观观点或简单的方式确信中数。
中数一样不适合于作代数运算。
由于中数不受其数据散布中两头数据的阻碍,中数缺乏灵敏性。
适用—数据散布中有个别异样值或极端值显现,用中数作代表值客观合理。
在次数散布的某端或两头的数据只有次数没有确切数量时,用中数作为次数散布的集中量数。
在态度考试价值观考试或民意考试问卷考试中,向被调查对象提出一些事项,要求被调查对象对这些事项排序,在这些资料的信息数据整理分析中,用中数指标归纳各个事项的整体排序结果。
众数—一个次数散布中显现次数最多的那个数Mo。
中数、众数、平均数体会公式:Mo=3Mdn-2X。
不同量数:反映一组数据离散程度的量。
不同量数作为一组数据离散程度的归纳化特点量数,判定一组数据与其中心位置的平均不同程度;比较两组数据的离散程度;数据的中心位置通常常利用平均数或中数两个集中量数来刻画,不同量数与集中量数是彼此联系的。
不同量数大,说明数据偏离集中量数所在位置的程度也较大。
不同量数小,说明集中量数的代表性较好。
平均差、标准差、方差。
离中趋势:数据具有偏离中心位置的趋势,他反映一组数据本身的离散程度和变异性程度。
平均差:各数据与其平均数的离差绝对值的平均值AD。
从平均的角度反映了各个数据偏离中心位置的整体不同程度,直观易明白得,科学性较强。
有效性好,应用普遍。
方差:一组数据的离差平方数的算术平均数S2。
标准差:一组数据方差的算术平方根用S表示。
标准差运算性质。
一、全组数据每一个观测值都加上一个相同的常数C后,计算取得的标准差不变。
二、假设每一个观测值都乘以一个相同的常数C后,所取得的标准差等于原标准差乘以那个常数的绝对值。
3、每一个观测值都乘以同一个非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差乘以那个常数C。
不同系数:把不同量数与集中量数两相较较后所形成的相对不同
量数。
CV=S/X×100。
反映相对离散程度的系数,即相对不同量数,失去单位。
地位量数:反映次数散布中各数据所处地位的量。
百分品级(百分位):PR反映某个观测分数以下数据个数占总个数的比例的百分数,在0到100之间取值。
百分位数:位于特定百分中的相对地位的组内常模。
未归类数据确信各数百分比步骤:
一、把观测数据从大到小依次排列。
二、按不同的数据逐个统计次数,并列表记录。
3、从低端开始向高端方向,计算各个观测点数据以下的累计次数(不包括本得分点次数)4、计算各观测数据的“以下累计相对次数”,即比例数,计算方式是把“以下累计次数”cf除以数据总个数n。
五、确信各观测点数据的百分品级PR,方式是把各数据的“以下累计次数”乘以100即可。
难度:被试完成项目作答任务时所碰着的困难程度。
难度指数:定量刻画一个考试项目的被试作答困难程度的量数。
信度:考试在测量它所测特质时取得的分数的一致性。
考试效度:考试事实上测到它打算要测的东西的程度。
内容效度:考试项目组成应测行为领域代表性样本的程度。
效标关联效度:考试预测个体在类似或某种特点情景下行为表现的有效度。
结构效度:考试测得心理学理论所概念的某一心理结构或特质的程度。
效标污染:效标测量质的评定受到了考试分数值的信息的阻碍。
随机现象(不确信现象):相同条件下其结果也必然相同的现象。
随机变量:记录各类随机实验结果的变量(学生考试分数)。
正态散布:是持续性随机变量中常见的一种概率散布形态。
正态散布:正态散布是由平均数和标准差唯一决定的,且平均数为0,标准差为1。
从形态上看,是一条单峰、对称呈种形的曲线。
其对称轴为过X=u的纵线。
曲线在X=u点取的最大值。
从X=u点开始,曲线向正负两个方向递减延伸,不断向X轴逼近,但永不与X轴相交,因此曲线在正负两个方向上都以X轴为渐进线。
一样的正态散布能够转化为标准正态散布。
T散布:单峰、对称呈种形的散布,对称轴过散布的平均数,曲线在正负两个方向上以横轴为渐进线,与正态相较T散布中间低而尖,两头高而平缓,特点是一族散布每一个T散布的形态受自由度的制约.对应一个自由度就有一个T散布,随自由度的增大,曲线的中间高而平缓,两头低而陡,曲线接近正态散布,自由度接近无穷大时,变成正态散布. X2散布的一样形态,与正态散布及T散布的异同点:X2散布一般是正态散布,X值永久可不能有负值。
Ζ散布,即正态散布与T散布均为对称散布,平均数所在的点是对称轴所通过的中心点。
X2散布是非对称散布,但与T散布曲线的形态随着自由度df改变而有所改变一样,X2散布曲线的形态也随着自由度的改变而有所改变,但当自由度df趋向无穷大时,X2散布曲线就会变成一条正态散布曲线。
整体:客观世界中具有某种一路特点的元素的全数。
样本:从整体中抽取的部份个体组成的群体。
整体和样本区别:是不是具有同一特点的个体都已包括在所研究的群体内,是的话该群体为整体,不然为样本。
二者在同一研究中是绝对的。
在不同研究中二者的区分又是相对的。
样本是整体的一部份,具有承接整体各类特点的固有特点,对整体具有代表性。
阻碍样本对整体代表性的因素:整体本身的离散性;抽取样本容量的大小;抽样方式,随机抽样是一种优良的统计抽样方式。
简单随机抽样原那么:机缘均等,彼此独立。
分层抽样:整体较大,所抽样本容量比较小,整体内部结构复杂利用。
原那么是整体中各部份元素之间的不同要大于各部份元素之内的不同。
实质是将整体中各部份按其容量在整体规模中的比分派到样本结构中去,然后抽样。
优势是大体维持整体的散布形态。
等距抽样:适用于整体专门大样本较小整体无中间层次结构的抽样。
抽样散布:从一个整体中随机抽取假设干个等容量的样本,计算每一个样本的某个特点量数,由这些特点量数形成的散布,称为那个特点量数的抽样散布。
平均数的抽样散布:(1)原整体正态、整体方差已知。
平均数抽样散布的平均数等于原整体平均数,标准差等于原整体标准差的n(根号)分之一.SEx=σ/n.(2)原整体正态,整体方差未知.t=X-μ/ SEx.(3)原整体正态,样本较大.参数:在整体数据基础上求取的各类特点量数。
统计量:应用样本数据计算的各类特点量数。
查验统计量:依照查验目的和抽样散布设计,专门用于统计假设查验的统计量。
计算积差相关系数的条件:rXY,适合于对两个持续变量之间的相关情形进行定量分析。
一、样本容量要大(n大于30)。
二、两列持续变量(比率变量或等距变量)。
3、两整体散布呈正态。
4、两变量之间存在线形关系。
品级相关适应。
rR,依照两列顺序变量数据中各对品级数据的差计算相关系数的方式。
一、两列观测数据都是变量数据,或其中一列数据是顺序变量数据,另一列数据是持续变量数据。
二、两各持续变量的观测数据,其中有一列或两列数据的取得,只要依托非测量方式进行粗略评估取得。
点双
列相关适应。
Rpb。
适用于双变量数据中。
有一列数据是持续变量数据,如体重、身高和许多考试与考试分数。
另一列数据是二分类的称名变量数据,如性别、态度、学习经历、考试结果等数据。
分数:通过测量取得的、描述测量对象身心特性水平的数字。
原始分数:在测量工具上直接取得的测值(数字)。
教育与心理考试分数--相对评分分数:通过被试间彼此比较而确信意义的分数。
绝对评分分数:通过拿被试测值跟应有标准作比较来确信其意义的分数。
常模:必然人群在考试所测特性上的普遍水平或水平散布状况。
进展常模(年龄常模、年级常模)和组内常模(百分品级常模、标准分数常模)。
常模成立:科学抽样,从清楚明确地概念的特定人群整体中,抽取到容量足够大,具有代表性的被试样组(标准化样组或常模组)。
用拟成立常模的考试,采用标准化施册测手续与方式对标准化样组中的所有被试,实施考试,以便适当准确地搜集所有被试在该考试上的实际测值。
对搜集道德全数资料进行统计分析处置,把握被试样组在测验上的普遍水平或水平散布状况。
标准分数常模及单位。
标准分数是以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离。
标准分数常模:用被试所测的考试分数转换成的标准分数来揭露其在常模集体中的相对地位的组内常模。
因为不论在一组分数散布的尾端仍是中部,两原始考试分数之差假设相等,转换出的标准分数的差也相等。
即标准分数是等单位的量度,不存在尾端单位大而中部单位小的问题。
标准分数是一个比值。
分子是原始考试分数的离均差,它是会随测验分数取值不同而转变的;但分母却是一个固定值,是所属分数组的标准差,不随考试分数是在尾端或中部而转变,如此,就位置不同考试分数的离均差来求比值时,被比的基数都是相同的。
标准分数:以它所属分数组的标准差为单位的,对它所属分数组的平均数的距离。
考试常模及作用。
必然人群在考试所测特性上的普遍水平或水平散布状况。
作用是说明考试分数意义的参照体系,通过将被试考试分数与常模比较来确信受测者的水平。
一、科学抽样,从清楚而明确低概念的“特定人群”整体中,抽取到容量足够大,并确具代表性的被试样组。
二、用拟成立常模的考试,采用标准化实测手续与方式对标准化样组中的所有被试,实测该考试,以便准确搜集到所有这些被试在该考试上的实际测值。
3、对搜集到的全数资料进行统计处置,真正把握被试样组在该考试上的一般水平或水平散布状况。
组内常模。
说明被试原始分数的参照体系,以常模组的考试分数散布状态作为参照体系,说明被试特质水平在常模组内的相对位置。
分为百分品级常模和标准分数常模。
Z值作线形变换的必要及方式。
一组考试分数转换成Z值后会显现负值与多位小数,能够明确考试分数在全组分数中的相对位置,但对一样人来讲,表现成负值并带有多位小数的Z值,不行明白得,引发误解,因此不方便适用。
方式是对所有要作变换的值,都乘以同一个确信值然后再都加上另一个确信的值。
项目区分度P=0、50被试能区分。
标准化常模参照考试目的是要尽可能把握住被试的个别不同,因此希望考试后所有被试的分数尽可能拉开距离,好中差被试都能取得相应的彼此有足够不同的分数。
考试项目的适当难度应该是P值尽可能接近0、50。
考试项目的难度取值接近0、50,项目难度的散布全距就狭小,理想状态确实是点状散布。
因此对一样常模参照考试,适当难度确实是P=0、50,考试所含项目的适当难度散布,确实是围绕P=0、50,那个点尽可能作窄全距散布,被试才能最好被区分。
项目区分度及确信:项目区分度确实是项目区别被试水平高低的能力的量度。
确信项目区分度是确信项目区分度的标准是考试总分,要考察总分高的被试在该项目上是不是也得高分,总分低的被试在该项目上是不是也得低分即求取各个项目上被试的题分与考试总分的相关。
考试信度及阻碍信度的因素:考试信度确实是考试在测量它所测特质时取得的分数的一致性,它是对考试操纵误差能力的量度,是反映考试性能的一个重要的质量指标。
因素有:一、考试项目抽样不妥或语言表达引发误解。
二、施测环境阻碍。
3、施测时指导语、完成时限、主被式关系的阻碍。
4、评分进程的偏向于误差。
效度种类,内容效度:考试项目组成应测行为领域代表性样本的程度。
效标关联效度:考试预测个体在类似或某种特点情景下行为表现的有效度。
结构效度:考试测得心理学理论所概念的某一心理结构或特质的程度。
学业成绩考试分类及用途:安置性考试-学期教学或单元教学开始,确信学生实有水平针对性作好教学安排。
学生
是不是具有成功学习这一课程或单元必需的大体知识和技术;关于学习的内容,已经了解和把握那些内容,提示教师处置教材;不同窗生的学习能力爱好适应特点是什么,提供教学模式教学安排。
形成性考试
-教学进行进程顶用于检查学生把握知识和进步情形。
覆盖单元中有限的学习内容,用于改良学习和教学。
为师生两边提供有关学习成败的持续反馈信息。
对成功的学习起强化作用;暴露学习中不足以便更正与完善。
诊断性考试-探测与确信学习困难缘故。
区别-注重于与诊断相关的目标,对每一特定的目标需要包括大量题目,每一个题目之间只有很小的不同。
考试题目依据于对成功学习特殊技术的详细分析和常见的学习错误的分析研究。
题目难度较低,重在确信学生所犯学习错误的类型和学习困难本源所在。
限于课堂教学中有限部份内容,按假设干部份的考试分数与考试记录来分析。
终结性考试-课程终止或教学大周期终止,确信教学目标达到程度和学生对预期学习结果把握程度的考试。
目的-对学生的学习作出全数的检查总结,平定分数或品级;评判教师教学的有效性;预测学生以后学习情形。
特点-包括普遍的教学内容,是一门课程或一个学期教学内容的有效抽样。
具有更高的归纳水平,不仅检查大体术语概念原理方式的把握,还要从教学内容教学目标上检查运用知识分析解决问题的综合能力。
题目内容有普遍性和代表性。
题目的难度散布全距相对大一些。
常模参照考试—参照着常模利用相对位置描述考试成绩水平的一种考试。
辨别与评判学生的能力进展水平,有利于个别不同的诊断与研究。
用于教育工作中的选拔与分馏的决策。
标准参照考试—跟一组规定明确的知识能力标准或教学目标内容对照时,对学习者的考试成绩做出说明的考试。
用途—说明学习者把握所规定的教学内容的程度,以便做出把握和未把握,合格和不合格的分类决策。
通过标准参照考试给学习者一个成绩,提供出学习者学习经历和已达水平的证明资料。
评判课堂教学与课程编制的有效性。
口头考试:利用特定语言回答下列问题的能力;综合有关信息提出问题的能力;论述观点为自己的观点作说明与辩护的能力;口头表达时思维及归纳能力;知识明白得的广度与深度;态度气质情感的特殊表现。
方式-高声朗诵;教师提问;题目签中随即抽选回答;按预设问题发言;小组讨论随意发言;一样会谈;依照图片或设置的情景讲故事;角色扮演。
纸笔考试:提高考试效率,大集体考试;完整记录学生在题目上做答的反映;便于实测和平分进程的标准化标准化,提高学业成绩考试的信度和效度;便于对考试题目信息做分析。
缺点—不能对学生的回答或观点做及时的询问,测量的教学目标,局限于认知领域,关于动作技术情感目标难以测量,对进展性目标中的心智技术重视不够。
操作考试:实践性为主原那么、全面性原那么、客观化原那么。
编制命题双向细目表的步骤:关于考试和考查目标的双向列联表,是关于一门课程教学内容和把握层次两个维度下的考试。
编制命题细目表通常以教学大纲或考试大纲为依据,要紧步骤是一、确信考试内容要目并把它排列在表中最左侧一栏上。
按教材章节名称罗列;依照教学内容知识块罗列。
二、界定该科目考查的把握目标层次从低到高排在表中顶端第一行有关格子上。
3、确信各项考试内容要目下的分数比重。
4、把每一项考试内容的分数比重一一分派到假设干必要的考查目标即把握层次上去,形成网格的分数分派方案。
心理考试:通过对一组标准刺激所引发的行为样组的客观分析,对人们的心理特点及个别不同进行估测、描述和诊断的方式。
瑞文标准推理测量的特点:张厚粲教授主持,依照英国心理学瑞文1938年设计的“标准图形渐进考试”修订的一种非文字智力考试。
适用的年龄范围宽,考试对象不受文化、种族与语言的限制,还能够用于生理缺点者。
考试可个别进行,也可集体实施。
适用方便,省时省力,结果说明直观简单,考试具有较高的信度与效度。
显著性水平:在统计假设查验中,公认的小概率实践的概率值被称为统计假设查验的显著性水平。
α值常取两个水平. α值小,假设查验的显著性水平高。
小概率事件:概率取值小于或小于的随机事件。
假设查验的步骤:一、依照题目的设问提出查验假设。
二、选定显著性水平a。
3、依照查验目的和已知条件找到相应的抽样散布。
4、写出查验统计量计算公式并按已知数据条件计算查验统计量值。
五、依照显著性水平在抽样散布中确信临界值和危机域。
六、将求得的查验统计量值域临界值作比较,依照其是不是进入危机域作出是不是拒绝虚无假设的统计结论。
单侧查验:为了推断某个整体参数是不是大于或小于某个定值,或是为了推断某两个整体参数之间有无大于或小于的关系的查验。
在抽样散布的一个尾侧设有临界值。
危机域只有一块。
双侧查验:为了判定某个参数是不是等于某个定值,或是为。