《教育统计学》学习笔记

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《教育统计学》读书笔记(1)

第一章绪论

第一节

1)描述统计:对已获得的数据进行整理、概括并显现其分布特征。

1、集中量表现集中趋势,常用量:算术平均数、中位数、众数

2、差异量来反应数据间的离散程度,常用量:全距、标准差

3、用偏态量和峰态量来反映分布形态

2)推断统计:根据已知的情况,在一定概率意义下估计、推断未知的情况。

1、总体参数检验(总体平均数、总体标准差、总体相关系数等)

2、假设检验(总体平均数之差、总体方差之差、总体相关系数之差),总体分布是否服从某种分布的假设检验

可以用样本来推测总体的情况,比如用某个班级所有学生的成绩来估计整个学校的学习成绩,用某个学校的成绩来估计整个市的成绩等。

第三节统计学中的基本概念

1、总体和样本

2、统计量和参数

统计量:样本上的数字特征,例如平均数μ、标准差σ、相关系数ρ等

参数:总体的数字特征,例如平均数X、标准差S、相关系数等

第二章数据的初步整理

1、统计表

简单频数、累积频数和累积百分比分布表

(累积百分比分布表可以用来说明、解释和评价某一测验的原始分数之优劣)

2、统计图

1)间断变量统计图

1、直条图:比较性质相相似的间断性资料

2、饼图等:间断性资料构成比的图形

2)连续变量统计图(可用图形来初步判断数据是否符合正态分布)

1、线形图

2、直方图等

第三章 集中量

第一节 算数平均数(应用最多)

i

X

X n

=

2、算数平均数优点:反应灵敏、简单易懂、受抽样变动影响小,在计算其他统计量时都需要用到他

3、缺点:容易受两端极值影响,若数据中存在某个数值模糊时就无法计算。

4、适用条件:一组数据中每个数据都比较精确、可靠,无两端极值的影响,还要通过它计算其他统计量。 一)中位数

Md ,各有一半数大于或小于这个数。

2、优点:受两端极值影响小

3、缺点:抽样偏差较大,并不是每个数都参与运算,反应不灵敏,不适合代数运算

4、适用条件:一组数据中有特大或特小两极端数值时,一组数据中有个别数据不确切、不清楚时,资料属于等级性质时。 二)众数·

0M :一组数据中频数出现最多的那个数(粗略众数),(理论众数)与频数分布曲

线最高点相对应的横坐标上的一点。

2、优点:简明易懂,较少受两端极值的影响

3、缺点:不准确、不稳定,随频数的变化而变化(以及组距和组数变化),不适合袋鼠运算,受抽样变动大

4、适用条件:快速而有粗略地找出一组数据的代表值,需要利用算术平均数、中位数、众数三种关系来粗略地判断频数分布的形态时(是否符合正态分布),利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。

·几者之间的关系

算术平均数、中位数、众数的大小与频数分布的形态有关。 正偏态:0X Md M >> 负偏态:0X Md M <<

三)加权平均数、几何平均数、调和平均数(应用较少)

1、加权平均数:权衡各小组平均数在总体平均数中所起的作用

2、几何平均数:用于工作速率的集中量,例如求学龄儿童人数的增加率,教师工资增加率、阅读能力进步率等。1...n g n X X X =

3、调和平均数:一组数据倒数的算数平均数的倒数。主要用来求学习速度,例如阅读速度、解题速度、识字速度等。

第四章 差异量:表示一组数据变异程度或离散程度的量 第一节 全距、四分位距、百分位距(绝对差异量)

1、全距:R =-最大值最小值

易受两端极值影响,不考虑中间数值的差异,反应不灵敏。

2、四分位距:较少受两端极值的影响,但是忽略了左右共50%的数据的差异,并且不适合代数运算。(但一组数据用中位数表示集中量时,需要用四分位距表示差异量。使用范围及条件一致)

3、百分位距:

第二节 平均差(绝对差异量)

X Md

MD n

-=

∑(Md 也可为是算术平均数)

平均差简单易懂,每个数据都参与运算,考虑到全部的离差,反应灵敏,但是由于计算要用到绝对值,不适合代数运算,所以统计分析较少使用。 第三节 方差和标准差(绝对差异量)(使用最多)

描述一组数据的离散程度,并且当一组数据的集中量用算术平均数表示时,差异量需要用标准差表示。 第四节 相对差异量

100%X

CV X

σ=

⨯,差异系数越大,离散程度越大;反之,离散程度越小。

(5%~35%之间为正常范围)

一般用在学生的身高、体重、作业所用时间等,学科测验分数不能用差异系数来进行比较。

第五节 偏态量和峰态量:考察频数分布是否成正态分布(描述数据分布特征)

1、偏态量:当N>200时,计算出来的数据才比较可靠。

0000,==,0,,X Md M X Md M X Md M =>>><<<,分布呈对称形0,分布右偏或者正偏分布左偏或者负偏

图一 偏态量图形及解释说明

2、峰态量:=0,0,0,><分布呈对称形

高狭峰

低阔峰

图二 峰态量图形及解释

第五章 概率及概率分布

1、二项分布的应用:除了可以求成功事件恰好出现的概率以外,还可以在教育中用来判断实验结果的机遇性与真实性的界限。例如在做题时,判断学生需要做对多少题以上我们才有95%的把握说学生掌握了相关知识。(可用以分析学生掌握知识点的情况)

用偏态系数来分析某班级的成绩应用举例: (1)当偏态系数>0即正偏态时,说明班上低分人数较多。

(2)当偏态系数<0时即负偏态时,说明班上高分人数较多。

用偏峰态系数来分析某班级的成绩应用举例:

(3)当峰态系数>0时,说明班级班上学生成绩分布比较集中。

(4)当峰态系数<0时,说明班上学生成绩比较分散。

相关文档
最新文档