教育统计学考试复习资料图文稿
教育统计学总复习2ppt
19.教育统计学方法的目的是
。
江苏057 20.在需要对两个或三个次数分布进行比较时,用 图更合适。 江苏057 21.教育统计学中实用的随机抽样方法包括 、 、 、整群抽样与阶段抽样.江苏054 22.依据数据量化的水平的高低可把数据由低到高 分为 和比率数据四类.江苏054 23.随机现象在大数量观察结果中所表现出来的规 律性,被称作 . 江苏044
(全097) 8.测量结果具有可比性而无可加性的量尺是( ) A.名义量尺 B.顺序量尺 C.等距量尺 D.比率量尺 (全084)
9.下列变量中属于比率变量的是( )。 A.学生的语文考试成绩 B.学生在数学竞赛上的名次 C.某山海拔2749.08米 D.学生在60米跑项目上所用的时间 (全074) 10.身高的测量结果属于( )。 A.称名变量 B.顺序变量 C.等距变量 D.比率变量 (全077)
二、判断题 1.教育统计学包括描述统计和推断统计两个部分 2.统计学的主要内容包括描述统计、推断统计和 实验设计。 (浙097) 3.教育统计学包括数理统计学和应用统计学两大 分支。 (浙084) 4.推断统计是描述统计的基础。 (浙087) 5.根据不同的研究目的,同一个群体(例如某个 教学班)既可以是一个总体,也可以是一个样本。 (浙094) 6.当我们要调查浙江省3-7岁儿童的认知能力时 所要研究的总体就是浙江省3-7岁儿童的全体,而
11.简单随机抽样必须符合的原则是( ) A.机会不均等,相互不独立 B.机会不均等,相互独立 C.机会均等,相互不独立 D.机会均等,相互独立 (全097) 12.当一个总体比较大且内部结构复杂,而所抽样本 比较小时,应采用( )。 A.简单随机抽样 B.分层抽样 C.分阶段抽样 D.等距抽样 (全087)
统计学总复习
3、抽样调查的应用范围
抽样调查的应用范围
1、抽样方法能够解决全面调查无法或难以解 决的问题。
2、抽样方法可以补充和订正全面调查的结果。
3、抽样方法可以应用于生产过程中产品质量 的检查和控制。
4、抽样方法可以用于对总体的某种假设进行 检验。
社会经济统计学所研究的数量方面具有 以下的特点:社会性;总体性;变异性。
二、统计的职能
1、信息职能 2、咨询职能 3、监督职能
三、统计总体和总体单位
1、统计总体就是根据一定的目的和要求所确定的 研究事物的全体。
2、总体单位是指构成总体的个体单位,它是总体 的基本单位。
3、总体和单位的关系
没有总体单位,总体也就不存在;没有总体,也 就无法确定总体单位。
统计总体和总体单位不是固定不变的,随着研究 目的的转变,它们是可以转换的。
四、单位标志和标志表现
1、单位标志是总体各单位所共同具有的属性和特征。
品质标志表明单位属性方面的特征。例如:姓名、性 别等都是品质标志。
数量标志表明单位数量方面的特征。例如:工龄、工 资水平等都是数量标志。
2、标志表现是标志特征在各单位上的具体表现。
5
25
8
40
3
15
20
100
第四章 综合指标
一、总量指标的分类 二、相对指标的分类 三、平均指标的分类 四、变异指标的涵义及其作用 五、平均指标和变异指标的计算
一、总量指标的分类(1)
1、总量指标按其反映的内容不同,分为 总体单位总量和总体标志总量。
总体单位总量:指总体内所有单位的总数, 又称单位总量。
标
E、 某人职业是“教师”,这里的“教师”是标志
《教育统计学》复习
《教育统计学》复习统计与测量复习一、教育统计学的性质、作用及主要内容1、性质(定义):研究如何收集、整理、分析由教育调查和教育实验所获得的数据资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。
2、作用:进行教育科学研究的一个定量化工具;是教育科学研究中不可缺少的思想、观念、方法和技术。
3、主要内容:描述统计、推论统计、实验设计二、总体、个体和样本总体:具有某种特征的一类事物的全体。
个体:构成总体的每个基本单元。
样本:从总体当中抽取的,并对总体具有代表性的一部分。
样本的大小称为样本容量n三、误差1、随机误差:由与实验目的无关的偶然因素造成的,且难以控制。
2、系统误差:由于实验目的无关的所引起的有规律性的误差。
3、抽样误差:由抽样而产生的误差。
属于随机误差。
四、统计量与参数统计量:描述样本情况的统计指标。
参数:由样本的统计量去估计、推测相应总体的特征量。
五、数据的特点1、离散性:每一个数据是相互独立、互不关联的。
2、变异性(波动性):总会在一定范围内波动,时大时小,无法预测。
3、规律性:波动变化的数值都会趋于稳定在某一个数值上。
六、编制次数分布表的步骤1、求全距R R = Xmax – Xmin2、确定组数和组距①组数:a、经验法100以内5~10组,100~200以内10~18组b、公式法②组距:a、经验法 2、3、5、10、20b、公式法 i = R / K3、列出分组区间和组限① 列分组区间②组限(精确上下限)4、整理次数5、绘制次数分布表组别|组距(i)|组中值(Xc)|次数(f)|比例|上累加次数比例|累积百分比七、算数平均数、中数、众数的优缺点1、算数平均数优点:反应灵敏、严密确定、简明易懂、计算简便,适合代数运算,受抽样变动的影响较小是总体平均数的最好估计值。
缺点:易受两级端数值的影响;一组数据中某个数值的大小不够确切时就无法计算。
2、中数优点:严密确定、简明易懂、计算简便,少受两级端数值的影响,受抽样变动的影响较小。
教育统计学复习资料(岭师)
教育统计学复习资料简答题预测一、假设检验这种反证方法与数学上反证方法的区别(1)数学反证法最终推翻假设的依据一定是出现了百分之百的谬误,因此推翻假设的决策无论是决策逻辑还是从决策内容看都是百分之百正确的。
而假设检验的反证法最终推翻零假设的依据是一个小概率事件,从决策逻辑角度看是百分之百正确的,但其决策的内容却是有可能出错的。
(2)数学中使用反证法,其最终结果一定是推翻原假设,而假设检验这种反证法的最终结果却有可能无充分理由推翻零假设。
二、为什么不能用t 检验对多个平均数的差异进行比较?答:这是因为在假设检验中作统计量冒有犯错误的风险。
在对两个总体平均数做检验时,我们犯拒真错误的概率为α,结论正确的概率为α-1。
而在对多个总体平均数作检验时,采用两两比较的方法,比较的次数会随总体的增多而迅速增多,假设共要比N 次,那么连续n 次结论都正确的概率就是()Nα-1,结论出错的概率为()Nα--11,这个值会随着N 的增大而迅速增大,这就不符合我们希望在一次检验中犯拒真错误的概率为α的要求了。
所以,在对多个平均数作显著性检验时,不能用t 检验对多个平均数的差异进行比较。
三、非参数检验的特点:1.非参数检验一般不需要严格的前提条件;2.非参数检验特别适用于顺序资料(等级变量);3.非参数检验和适合于小样本,且方法简单;4.非参数检验最大的不足是未能充分利用资料的全部信息;5.非参数检验目前还不能处理“交互作用”。
四、回归分析与相关分析的关系回归分析和相关分析均为研究及度量两个或两个以上变量之间关系的方法。
从广义上说,相关分析包括回归分析,但严格的讲,二者有区别。
当旨在分析变量之间关系的密切程度时,一般使用相关系数,这个过程叫相关分析。
倘若研究的目的是确定变量之间数量关系的可能形式,找出表达它们之间依存关系的合适的数学模型,并用这个数学模型来表示这种关系形式,则叫做回归分析。
五、回归分析与相关分析的综合运用的具体步骤1.将成对资料绘制散点图,从散点图中点子的分布形状判断X和Y是否有线性关系;2.建立回归模型;3.回归方程显著性检验;4.计算回归估计标准误差;5.根据建立的回归模型进行预测,估计真值预测区间。
现代心理与教育统计学复习资料.docx
第一章1、数据类型厂称名数据?计数数据Y A离散型数据'顺序数据-厂等距数据-X测量数据彳,连续型数据J等比数据/2、变量:是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
二个随机变量可以有许多个观测值。
3、需要研究的同质对象的全体,称为总体_每一个具体研究对象,称为一个个—从总体中抽出的用以推测总体的部分对象的集合称为样本。
—样本中包含的个体数,称为样本的容量n。
般把容量n ≥30的样本称为大样本;而n V 30的样本称为小样本。
4、统计量和参数统计指标统计量参数平均数Mμ标准差Sσ相关系数r P回归系数bβ5、统计误差误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误_________________第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率( f / N )或百分比f100 % )来表示次数,就可以制成相对次数分布表N(三)累加次数分布表(四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
教育统计学总复习3 ppt
这个比值叫做F比值,用公式表示为:
2 S1 F 2 S2
计算F比值时总把大的方差估计值作为分子,小 的作为分母,所以F比值≥1。 ②两个独立样本的方差齐性检验 2 提出假设 H 0: 12 2 H1: 12 22 S12 检验统计量
F S
2 2
df1
n1 1
df2 n2 1
临界值 统计决断
F0.05 (df1 , df2 )
F0.01 (df1 , df2 )
例4:实验组 64,58,65,56,58,45,55, 63, 66, 69 对照组 60,59,57,41,38,52,46,51, 49 试检验两个总体方差是否齐性 解:用Excel可计算得S1=6.999,S2=7.714
(二)参数估计 1、总体平均数的估计 ⑴点估计 X ⑵区间估计 对于给定的置信度1-α,其置信区间为
X ,X n n
①若σ已知 如1-α=95%
λ=1.96其置信区间为
X 1.96 , X 1.96 n n
2
Δ比率的抽样分布 ▲比率的抽样分布近似正态分布 ▲ p P ▲ p 1 p pq
SP n n
②单组(总体比率的假设检验) 总体比率的假设检验是检验样本比率与某个总 体的比率之间差异是否显著。 p P PO ?
Z P0 1 P0 n p P0
③双组(总体比率差异的显著性检验) 总体比率差异的显著性检验是根据两个样本的 比率来检验两个相应总体的比率是否存在显著性 差异。 p p P P ?
单因素方差分析 SSt SSb SSW
随机区组设计的方差分析 SSt SSb SSl SSe
统计学复习公式和知识点整理ppt课件
Chapter 5 统计推断
计算题公式
样本平均数的分布
样本成数的分布
E(X )
重复 抽样
(X)
n
E(P) p
P p1 p
n
不重复 抽样
E(X )
(X)
2 N n
n N 1
E(P) p
P
p 1 p N n
n N 1
Chapter 6 分析时间序列
知识点回顾
发展水平
Chapter 6 分析时间序列
•时 间 数 列6.2.1 发展水•序平与时平均平发均展水数平
•时 期
y y1 y2 yn 1
•每天资料
n
n
yi
•连 •续
•时
•点 •间
•持续天内 •指标不变
•间隔 •相等
y
y1 f1 y2 f2 yn fn f1 f2 fn
y
1 2
y0
指数体系
三因素分析
a1b1c1 a1b0c0 a1b1c0 a1b1c1 a0b0c0 a0b0c0 a1b0c0 a1b1c0
平均指标指数分析
x1 f1 x1 f1 x0 f1
f1 x0 f0
f1 x0 f1
f1 x0 f0
f0
f1 f0
帕氏指数
k
p
p1q1 p0q1
kq
p1q1 p1q0
算术平均数指数
k
p
k
p p0q0 p0q0
kq
kq p0q0 p0q0
调和平均数指数
kp
p1q1 p1q1
kq
p1q1 p1q1
kp
kq
Chapter 7 统计指数分析
教育统计学复习资料
一、公式(1)算数平均数(2)算数平均数(频数分布计算法)(3)中位数(频数分布计算法)●Lmd表示中位数所在组的下限●n表示总频数●n1表示小于中位数所在组下限的频数总和(4)众数(公式求理论众数的近似值)●fa表示大于众数所在组上限那个相邻组的频数●fb表示小于众数所在组下限那个相邻组的频数(5)加权平均数(6)加权平均数(7)几何平均数(8)调和平均数(9)四分位距(10)平均差(11)平均差(频数分布计算法)(12)方差(13)标准差(14)方差和标准差(频数分布计算法)(15)相对差异量(16)抽样分布1.从总体中随机抽出的容量为n的一切可能样本的平均数2.容量为n的平均数在抽样分布上的标准差等于总体标准差除以n的平方根(17)样本平均数的分布1.当总体标准差已知时,一切可能样本平均数与总体平均数的离差统计量呈标准正态分布。
其估计2.总体标准差未知时的估计。
需用样本标准差估计3.当总体方未知时,需要用估计量S来代替,于是平均数标准误也被SX所代替,这时一切可能样本平均数与总体平均数的离差统计量呈t分布。
●t分布是常用的一种随机变量分布,也称为学生氏分布。
●t分布受自由度(df=n-1,指总体参数估计量中变量值独立自由变化的个数)影响,与总体标准差无关。
(18)总体平均数的估计1.正态分布表,置信区间为2.t值表,置信区间为3.平均数的抽样分布呈正态,总体平均数的置信区间为:(19)总体标准差(σ)未知条件下总体平均数的区间估计1.平均数的抽样分布为t分布,平均数的置信区间为:2.平均数的抽样分布接近于正态分布,用正态分布代替t分布近似处理:(20)平均数显著性检验的几种情形1.总体标准差σ已知的总体平均数的显著性检验平均数的抽样分布服从正态分布,以Z为检验统计量,其计算公式为:2.总体标准差σ未知---小样本情况平均数的抽样分布服从t分布,但由于样本容量较大,平均数的抽样分布接近于正态分布,因此可以用Z代替t近似处理,计算公式为:(21)相关样本平均数之差的标准误(22)独立样本平均数之差的标准误(23)相关样本平均数差异的显著性检验1.在小样本的情况2.在大样本的情况(24)独立样本平均数差异的显著性检验1.独立大样本平均数差异的显著性检验Array2.独立小样本平均数差异的显著性检验1.F分布2.对两总体方差是否齐性进行检验,应选F做检验统计量,其计算公式为二、定义1.方差和标准差的优缺点和应用优点(1)反应灵敏、随任何一个数据的变化而变化;(2)严密确定,一组数据的方差和标准差有确定的数值;(3)适合代数运算;不仅体现在求方差和标准差的过程,而且可以将多个方差和标准差总和成一个方差和标准差;(4)用样本数据推断总体差异量时,方差和标准差是最好的估计量;(5)在避免两极端数值的影响方面,大大优于全距;(6)优于平均差,避免绝对值。
统计学复习资料
统计学复习资料(总54页) -CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除此为整本书的复习资料,若应对期末考试,则不再考试范围内的请自动忽略。
第一章:总论统计含义:统计数据、统计活动、统计学统计学:关于如何搜集、整理和分析统计数据的科学。
古典统计学时期国势学派——德国政治算术学派——英国统计学发展历程近代统计学时期社会统计学派——德国数理统计学派——比利时现代统计学时期:推断统计统计学研究对象:现象的数量方面—统计数据定性数据定类数据计量尺度定序数据定量数据定距数据统计数据定比数据表现形式:绝对数、相对数、平均数来源:观测数据、实验数据加工程度:原始数据、次级数据时空状态:时序数据、截面数据总体:统计研究的客观对象全体,也称母体。
特征:大量性、同质性、差异性个体数量:有限/无限总体存在形态:具体/形象总体总体分类:个体计数:可计数/不可计数总体人为判定个体:自然/人为总体个体:组成总体的个别事物,也称总体单位。
总体与个体关系:1.总体随个体数量可变大变小;2.研究目的不同,总体中个体可改变;3.研究范围不同,总体和个体角色可变换。
样本:从总体中抽取一部分个体所组成的集合,也称字样。
其不具唯一性,除非其实总体本身。
样本数:总体中最多可抽取的不同样本数量。
样本与总体关系:1.总体是研究对象,样本是观测对象,样本是总体的代表和缩影;2.样本用来推断总体:观测样本的目的是对总体数量特征作出判断。
3.总体和样本角色可改变标志:描述或体现个体特征的名称,标志在每个不同个体的结果为标志变形表示方式品质标志:表明个体属性特征数量标志:表明个体数量特征表现结果是否相同不变标志:每个个体上表现完全相同分类可变标志:每个个体上表现不同表现个体直接程度直接标志(第一标志):直接表明个体属性或数量特征间接标志(第二标志):两个或两个以上标志计算后(通常对比)变量:狭义:可变的数量标志;变量是可变数量标志的抽象化;变量的具体数值—变量值(标志值)。
教育统计与测验自学复习资料
教育统计与测验自学复习资料教育统计与测验是教育学领域的重要分支,它涉及到数据收集、分析和解释等内容。
本文档为自学复资料,旨在帮助学生巩固和提高对教育统计与测验的理解和应用能力。
教育统计教育统计是通过数据收集和分析来对教育领域进行研究和评估的方法。
在教育统计中,常用的统计方法包括描述统计和推断统计。
描述统计用于对教育数据进行整理和总结,包括计算平均值、中位数、众数等统计指标。
推断统计则基于样本数据对总体进行推断,包括假设检验和置信区间等方法。
在教育统计中,学生需要了解数据的收集方法和质量评估。
数据的收集可以通过问卷调查、实验研究、观察等方式进行。
质量评估则包括了解数据的可靠性、有效性和相关性等方面。
教育测验教育测验是评估学生研究成果和能力的工具。
常见的教育测验包括考试、问卷和观察等形式。
在教育测验中,需要了解测验的设计原则和评估方法。
测验的设计要考虑到测量的目标和内容。
例如,要评估学生的知识掌握程度,可以使用选择题和填空题;要评估学生的能力和应用能力,可以使用案例分析和论文写作等形式。
在测验评估中,常用的方法包括信度和效度评估。
信度评估用于衡量测验结果的稳定性和一致性,效度评估则用于判断测验是否能够准确地衡量所需的能力和知识。
自学复资料本文档提供了教育统计与测验的自学复资料,包括以下内容:1. 教育统计基础知识:介绍了教育统计的概念、方法和应用领域。
2. 数据收集与分析:解释了常用的数据收集方法和统计分析方法,并提供了实例和练。
3. 教育测验设计与评估:介绍了测验的设计原则和评估方法,包括信度和效度评估的讲解和实践。
4. 示例和练:提供一些实际案例和练题,以帮助学生巩固和应用所学的知识。
通过自学复资料的研究,学生可以加深对教育统计与测验的理解和掌握,并提高应用能力,为未来的教育研究和评估工作打下基础。
请注意,本文档提供的资料仅供自学复习使用,请遵守学校和教师的要求,合理安排学习时间和内容,充分理解和掌握相关知识。
统计学期末总复习
s x t / . 2,n1 n
单一总体比例的区间估计
1.假设: 总体服从二项分布;
可以用正态分布近似估计,即n p 5 且 n (1 - p) 5;
2.引理:
( p p0 ) /
3.置信区间:
p0 (1 p0 ) ~ N (0,1) n
p0 Z/ 2.
200以下 200~300 300~400 400~500 500~600 600~700 700以上
合计
家庭户数
2 8 10 12 8 6 4 50
计算该城市平均每户家庭的旅游开支、方差。
8.为研究少年儿童的成长发育情况,某研究所的一位 调查人员在A城市抽取100名7岁—12 岁的少年儿童 作为样本,其平均身高为148CM,标准差为5CM;另 一位调查人员则在B城市抽取了100名7岁—12岁的少 年儿童作为样本,其平均身高为152CM,标准差为 9CM。
请问,哪个城市少年儿童的平均身高更具代表性?
9.一条成品生产线平均每天的产量为3700件,标准差为50件。 如果某一天的产量低于或高于平均产量,并落入正负两个标 准差的范围之外,就认为该生产线“失去控制”。下面是一 周各天的产量,该生产线哪几天失去了控制?
时间 周一 周二 周三
产量 3850 3670 3690 (件)
12.在简单重复随机抽样时,当允许误差缩小一半,则n 要( ) A.缩小4倍 B. 增大4倍 C. 增大2倍 D. 缩小2倍
13.在其它条件不变的情况下( ) A.总体方差越大,所需的样本容量越少 B.总体方差越大,所需的样本容量越多 C. 允许的误差越小,所需的样本容量越少 D. 允许的误差越大,所需的样本容量越多
单一总体均值的区间估计(方差已知或大样本)
现代心理与教育统计学复习资料
第一章1、数据类型称名数据计数数据离散型数据顺序数据等距数据测量数据连续型数据等比数据2、变量:是可以取不同值的量。
统计观察的指标都是具有变异的指标。
当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。
用来表示随机现象的变量,称为随机变量。
一般用大写的X或Y表示随机变量。
随机变量所取得的值,称为观测值。
一个随机变量可以有许多个观测值。
3、需要研究的同质对象的全体,称为总体。
每一个具体研究对象,称为一个个体。
从总体中抽出的用以推测总体的部分对象的集合称为样本。
样本中包含的个体数,称为样本的容量n。
一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。
4、统计量和参数5误差是测得值与真值之间的差值。
测得值=真值+误差统计误差归纳起来可分为两类:测量误差与抽样误差。
由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。
由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差第二章一、数据的整理在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。
对于个别极端数据是否该剔除,应遵循三个标准差法则。
二、次数分布表(一)简单次(频)数分布表(二)相对次数分布表将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。
所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。
三、次数分布图使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。
简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线(一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。
教育统计与测量自考复习资料
教育统计与测量自考复习资料(总5页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。
教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。
教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物2、测量:按一定规则给对象在某种性质的量尺上指定值。
教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值3、心理量表:心理测验工具与常模的结合4、数据:用数量或数字形式表示的资料事实称为数据。
计数数据:是以计算个数或次数获得的,多表现为整数。
测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所获数据。
人工编码数据以人们按一定规则给不同类别的事物指派适当的数字号码后所形成的数据5、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。
顺序变量:是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。
等距变量:除能表明量的相对大小外,还具有相等的单位。
比率变量:除了具有量的大小、相等单位外,还有绝对零点。
比率变量数据可以进行加、减、乘、除运算6、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。
简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。
相对次数:各组的次数f与总次数N 之间的比值7、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线8、散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教育统计学考试复习资料集团文件版本号:(M928-T898-M248-WU2669-I2896-DQ586-M1988)第一章:1、何谓心理与教育统计学学习它有何意义教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。
具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
意义:(1)统计学为科学研究提供了一种科学方法。
(2)教育统计学是教育科学研究定量分析的重要重要工具。
(3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。
2、教育科学研究数据的特点(1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。
总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。
3、思考题:选用统计方法有哪几个步骤?①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。
②要分析实验数据的类型。
不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。
③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。
4、教育统计学的分类(1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。
(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。
5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。
具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。
6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。
具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。
(2)总体参数的估计方法。
(3)各种非参数的统计方法等。
7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系?教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。
描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。
同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。
当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。
8、教育统计与心理统计的异同相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。
不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。
②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。
9、数据的类型(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。
计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。
测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。
(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。
称名数据只说明某一事物与其它事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小。
顺序数据是指既无相等单位,也无绝对零点的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。
等距数据是具有相等单位,但无绝对零点的数据。
比率数据既表明量的大小,也有相等单位,同时还具有绝对零点的数据。
(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据。
离散数据一般取整数,在两个单位之间不能再划分细小单位。
连续数据的单位可以划得很细微,细微的程度能达到只可想象而不能看见的程度。
10、思考题:统计量与参数之间有何区别和联系?区别:①参数是从整个总体中计算得到的量数,通常是通过相应样本特征值来预测得到;统计量是从一个样本中计算出来的一些量数,它可以描述一组数据的情况。
②参数代表总体的特性,它是一个常数;统计量代表样本的特性,它是一个变量,随着样本的变化而变化。
③参数与统计量之间最明显的区别是参数常用希腊字母表示,而统计量常用英文字母表示。
联系:从数值计算上讲,当总体大小已知并与实验观测的总次数相同时,统计量与参数是同一统计指标;当总体为无限时,统计量与总体参数不同,但统计量可在某种程度上作为总体参数的估计值。
通过样本统计量,对总体参数做出预测和估计。
第二章:1、统计分组应注意的事项(1)统计分组前的准备。
将数据进行分组前,先要对观测数据做进一步的核对和校验。
校核数据的目的是为了尽可能地消去记录误差,以便后续的统计分析建立在一个坚实的基础上。
(2)统计分组时应注意的问题。
①分组要以被研究对象的本质特性为基础;②分类标志要明确,要能包括所有的数据。
2、分组次数分布表的意义与缺点意义:编制分组次数分布表,可将一堆杂乱无序的数据排列成序。
从表中可以发现各个数据的出现次数是多少,其分布的状态如何。
缺点:分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。
根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。
3、思考题:直方图、条形图、圆形图、线性图、散点图等这些常用的统计图,根据它们表现的作用和内容,把它们可分为哪几类?根据它们表现的作用和内容,把它们可分为五类。
第一种是表现分布的图,比如直方图。
第二种是表现内容的图,如条形图和圆形图。
第三种是表现变化的图,这种图形的代表是线性图。
第四种是表现比较的图,这几种图形都能采用。
第五种是表现相关的图,如散点图。
4、条形图和直方图的区别。
(1)描述的数据类型不同。
(2)表示数据多少的方式不同。
(3)坐标轴上的标尺分点意义不同。
(4)图形直观形状不同。
第三章:1、算术平均数的优缺点算术平均数具备一个良好的集中量数所应具备的一些条件:①反应灵敏;②严密确定;③简明易懂;④计算简单;⑤适合代数运算;⑥较少受抽样变动的影响。
除此之外,算术平均数还有以下一些特殊的优点:①只知一组观察值的总和及总频数就可以求出算术平均数;②用加权法可以求出几个平均数的总平均数;③用样本数据推断总体集中量数时,算术平均数最接近总体集中量数的真值,它是总体平均数的最好估计值;④在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。
缺点:①易受极端数据的影响;②若出现模糊不清的数据时,无法计算平均数。
2、算术平均数的意义、适用条件及应用原则意义:算术平均数是应用最普遍的集中量数,它是“真值”渐近、最佳的估计值。
适用的条件:一组数据是比较准确,可靠又同质,而且需要每一个数据都加入计算,同时还要作进一步代数运算时,这时就需要用算术平均数表示其集中趋势。
原则:①同质性原则;②平均数与个体数值相结合的原则;③平均数与标准差、方差相结合的原则。
3、中数适用的情况(1)当一组观测结果中出现两极端数目时;(2)当次数分布的两端数据或个别数据不清楚时;(3)当需要快速估计一组数据的代表值时。
4、众数适用的情况(1)当需要快速而粗略地寻求一组数据的代表值时;(2)当一组数据出现不同质的情况时;(3)当次数分布中有两极端的数目时;4)当粗略估计次数分布的形态时。
第四章:1、思考题:为什么要引入差异量数来描述一组数据的特征在教育研究中,要全面描述数据的特征,不但要了解数据的典型情况,而且还要了解特殊情况。
这些特殊性常表现为数据的变异性。
因此,只有集中量数不可能真实地反映它们的分布情况。
为了全面反映数据的总体情况,除了使用集中量数外,还需要引入差异量数。
2、思考题:为什么说标准差是重要而完善的差异量(1)标准差具有简单明了,反映灵敏,严密确定,容易计算,适合代数运算,受抽样变动的影响较少等优点。
(2)标准差在避免两极端数值影响方面大大超过全距、百分位差和四分位差;在避免绝对值方面,优于平均差;在考虑单位方面,优于方差。
3、差异系数的应用(1)同一团体不同观测值离散程度的比较(即不同单位资料差异程度的比较);(2)对于水平相差较大,但进行的是一种观测的各种团体,进行观测值离散程度的比较(即单位相同而平均数相差较大的两组资料差异程度的比较)。
应用差异系数比较相对差异大小时,应注意以下几点:①测量的数据要保证具有等距尺度;②观测工具应具备绝对零;③差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法。
第五章:1、思考题:如何理解相关系数?相关系数是两列变量间相关程度的数字表现形式。
对于这一概念,我们可以从以下几个方面来理解:(1)相关系数的取值在-1.00和+1.00之间;(2)相关系数的绝对值表示两个变量之间的相关强度,绝对值越接近1表示相关越强,越接近0表示相关越弱;(3)相关系数的正负号表示相关的方向,相关系数为正的表示正相关,相关系数为负的表示负相关;(4)相关系数可以比较大小,但不能进行加减乘除运算。
2、如何选择合适的相关系数?选择计算相关系数的方法主要取决于要处理的数据的性质类别以及某一相关系数需要满足的假设条件。
具体来说,为了选择一个合适的相关系数进行相关分析,要分以下几个步骤考虑:(1)考虑每种测量所产生的数据属于什么类别,测查被试的哪种心理属性,是分类,还是排序,还是评定等级是否给出确定的分数(2)要对第一种测量数据和第二种测量数据的类别做出判断。