心理与教育统计学03
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Mo
Mo
该公式假定众数组的频数在众数组内均匀分布
31
数值型分组数据的众数 (算例)
【 例 3.3】 根据表中 数据,计 算 50 名 工 人日加工 零件数的 众数
表3-3 某车间50名工人日加工零件数分组表
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
i 1
9
X
N
加权均值(算例)
【例3.8】根据表中的数据,计算50 名工人日加工零件数的均值
表3-8 按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 某车间50名工人日加工零件均值计算表 组中值(Xi) 107.5 112.5 117.5 122.5 127.5 132.5 137.5 — 频数(Fi) 3 5 8 14 10 6 4 50 XiFi 322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 6160.0
22
四、中位数的特点与应用
优点:简单、容易理解,稳健。 缺点:不稳定、受抽样影响大;计算时不用 所有数据;计算时要对数据先排序;总数 乘以众数不等于数据的总和;不能作进一 步代数运算。 应用:一般用在下列情形:当数据有极端值; 两端数据或个别数据不清楚;需要快速估 计一组数据的代表值。
23
第三节 众数(mode)
第三章 集中量
第一节 算术平均数 第二节 中位数和百分位数 第三节 众数
第四节 其他度量
1
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰度 (形状)
2
小贴士
数据的特征和测度
集中趋势
众 数 中位数 均 值
离散程度
四分位数
分布的形状
偏 态
百分位差 方差和标准差 平均差
峰 度
3
小贴士
集中趋势
1.一组数据向其中心值靠拢的倾向和程度 2.测度集中趋势就是寻找数据一般水平的代表值或中 心值 3.不同类型的数据用不同的集中趋势测度值
14 8 M0 5 123(个) 120 (14 8) (14 10)
32
三、众数的特点与应用
优点:简单、容易理解。 缺点:不稳定、受分组影响;计算时不用所 有数据;总数乘以众数不等于数据的总和; 不能作进一步代数运算。 应用:一般用在下列情形:需要快速确定一 组数据的代表值;数据不同质;当数据有 极端值;
24
一、众数的概念要点
1. 集中趋势的测度值之一
2. 出现次数最多的变量值,用 M0 表示 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 有理论众数与粗略众数
25
众数的不唯一性 无众数
原始数据: 10 5 9 12 6 8
一个众数
原始数据: 6 5 9 8 5 5
多于一个众数
原始数据: 25 28 28 36 42 42
X 1 F1 X 2 F2 X N FN X F1 F2 FN
X F
i 1 K i
K
i
F
i 1
i
8
简单均值 (算例) 原始数据:
10
i
5
9
13
6
8
X1 X 2 X 3 X 4 X 5 X 6 X N 6 10 5 9 13 6 8 6 8.5
26
二、众数的计算方法
1.用观察法直接寻找粗略众数 例如,一组原始数据2、4、3、6、4、5、4
27
称名数据的众数 (算例) 【例 3.1】 根据下表数据,计算众
数
表3-1 某城市居民关注广告类型的频数分布 广告类型 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 合计 人数(人) 112 51 9 16 10 2 200 比例 0.560 0.255 0.045 0.080 0.050 0.010 1 频率(%) 56.0 25.5 4.5 8.0 5.0 1.0 100
13
第二节 中位数
一、中位数的概念:
中位数是位于依一定大小顺序排列的一组数据中央 位置的数值,大于及小于这一数值各有一半数据 分布着。
14
小贴士
1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值,记为 Md
50%
3. 不受极端值的影响
Md
50%
4. 主要用于顺序数据,也可用数值型数据,但不能 用于称名数据 5. 各变量值与中位数的离差绝对值之和最小,即
:
300/2=150 从累计频数看,中位数 的在“一般”这一组别 中。因此 Md=一般
17
合计
300
—
原始数据的中位数
(5个数据的算例) 原始数据:
排
位
序:
置:
24 22 21 26 20 20 21 22 24 26 1 2 3 4 5
N 1 5 1 位置 3 2 2
中位数 22
X
i 1
n
i
Md min
15
二、中位数的计算方法
1、原始数据的计算方法
X N 1 2 Md 1 X N X N 2 1 2 2
当N为奇数时 当N 为偶数时
16
顺序数据的中位数 (算例)
【例3.4】根据中数据,计算甲城市
家庭对住房满意状况评价的中位数。
表3-4 甲城市家庭对住房状况评价的频数分布
回答类别 非常不满意 不满意 一般 满意 非常满意
甲城市 户数 (户) 24 108 93 45 30 累计频数 24 132 225 270 300
解:中位数的位置为
lgMg=0.3846/5=0.07692;
Mg=1.19377
39
Mg N 1
XN XN X 2 X3 N 1 X1 X 2 X N 1 X1
【例3.10】 有一个学生第一周记住20个英文单词, 第二周记住23个,第三周记住26个,第四周记住 30个,第五周记住34个,问该生学习记忆英文单 词的平均进步率是多少?
29
2.用公式求理论众数的近似值:
(1)皮尔逊的经验法: 频数分布呈正态或接近正态时才能使用。
30
(2)金氏插补法
众数的值与相邻两组频数的分布有关
相邻两组的频数相等时,众数组的组 中值即为众数 相邻两组的频数不相等时,众数采 用下列近似公式计算
Mo
f f 1 M0 i L ( f f 1 ) ( f f 1 )
数
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别 非常不满意 不满意 一般 满意 非常满意
合计
甲城市 户数 (户) 百分比 (%)
24 108 93 45 30
300
8 36 31 15 10
100.0
解:这里的数据为顺 序数据。变量为“回 答类别”。甲城市中 对住房表示不满意的 户 数 最 多 , 为 108 户 ,因此众数为“不满 意”这一类别,即 Mo=不满意
7
二、均值的计算方法
1、原始数据计算法 设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为
X1 X 2 X N 1 N X Xi N N i 1
2、设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为
4. 每一个数乘以一个常数 C,所得均值等于原均值乘
以常数 C
1 n CX i C X n i 1
12
三、均值的应用及其优缺点
优点:反应灵敏;计算简单、严密确定;适合进一 步代数运算;受抽样变动的影响较小。 缺点:易受极端数据的影响;出现模糊不清得数据 时,无法计算。 应用:数据同质性原则; 一组数据中每个数据都比 较准确、可靠;无极端值的影响;而且还要通过 它计算其他统计量。
N Sm 1 Md i L 2 fm
该公式假定中位数组的频数在该组内均匀分布
20
频数分布表的中位数 (算例)
【 例 3.5 】根据表
3-5 中 的 数 据,计算 50 名工人 日加工零 件数的中 位数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组 105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
35
2.
3.
§3.4 其他度量
一、加权平均数 加权平均数是不同数据(或平均数)的平均 数。 计算公式有两种形式:
36
二、几何平均数
1. 2. 3. 4. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 主要用于计算平均发展速度 计算公式为
M g N X1 X 2 X N N X i
5
算术平均数的特性: 第一,观察值的总和等于算术平均数的N倍 第二,各观察值与算术平均数之差的总和等于零。 第三,若一组观察值是由两部分(或几部分)组成, 这组观察值的算术平均数可以由组成部分的算术 平均数而求得。
6
小贴士
算术平均数: 1.集中趋势的测度值之一 2.最常用的测度值 3.一组数据的均衡点所在 4.易受极端值的影响 5. 用于数值型数据,不能用于称名数据和顺序数据
33
小贴士
均值 中位数 众数
均值 = 中位数 = 众数
众数 中位数 均值
左\负偏分布
正态分布
右\正偏分布
34
小贴士
1. 众数 – 不受极端值影响 – 具有不惟一性 – 数据分布偏斜程度较大时应用 中位数 – 不受极端值影响 – 数据分布偏斜程度较大时应用 平均数 – 易受极端值影响 – 数学性质优良 – 数据对称分布或接近对称分布时应用
10
均 值 (数学性质) 1. 各变量值与均值的离差之和等于零
(X
i 1
n
i
X) 0
2. 各变量值与均值的离差平方和最小
(X
i 1
n
i
X ) min
2
11
均 值 (数学性质) 3. 每一个数加一个常数 C,所得均值等于原均值加上 常数 C n
1 ( Xi C) X C n i 1
50 16 Md 5 123.21(个) 120 2 14
21
三、百分位数的概念及其计算方法
1.百分位数的概念 百分位数是位于依一定顺序排列的一组数据 中某一百分位置的数值。 在教育测量中,常通过计算某个原始分数所 属的百分位数来说明、解释、评价它在团 体中的位置。 2.百分位数的计算方法
38
表3-9 阅读遍数 1 2 3 4 5 6 合计
计算步骤和过程
理解程度 (%) 40 (X1) 52 (X2) 65 (X3) 75 (X4) 86 (X5) 97 (X6) N=6 1.300 1.250 1.154 1.147 1.128 5.979 0.1139 0.0969 0.0621 0.0594 0.0523 0.3846 增加比率 比例(Xi/Xi-1) 对数lg(Xi/Xi-1)
解 :这里的变量为“广告
类型”,这是个定类变量, 不同类型的广告就是变量值 。我们看到,在所调查的 200 人当中,关注商品广告 的人数最多,为 112 人,占 总被调查人数的 56%,因此 众数为“商品广告”这一类 别,即
Mo=商品广告
28
顺序数据的众数 (算例)
【例3.2】根据下表数据,计算众
18
原始数据的中位数 (6个数据的算例) 原始数据:
排 位 序: 置:
10 5 9 12 6 8 5 6 8 9 10 12 1 2 3 4 5 6 位置 N+1 6+1 3.5 2 2 8+9 中位数 8.5 2
19
2.频数分布表计算法
根据位置公式确定中位数所在的组 采用下列近似公式计算:
i 1 N
37
几何平均数的应用 ————学习进步率 【例 3.9】在一项有关阅读能力的实验中,得到这样的 结果。阅读的遍数与每遍理解的程度依次是:第一 遍为 40 %,第二遍为 52 %,第三遍为 65 %,第四 遍为 75 %,第五遍为Leabharlann Baidu86 %,第六遍为 97 %。在该 实验研究中被试阅读能力的平均进步率是多少?阅 读能力的平均增加比率又是多少。
4.低层次数据的集中趋势测度值适用于高层次的测量 数据,反过来,高层次数据的集中趋势测度值并 不适用于低层次的测量数据
5.选用哪一个测度值来反映数据的集中趋势,要根据 所掌握的数据的类型来确定
4
第一节 算术平均数
一、算术平均数的概念
算术平均数是所有观察值的总和除以总 频数所得之商,简称为平均数或均数。