第三章集中量数和差异量数
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
思考题
某一团体成员的年龄分布如下表所示。试问 表示它们集中趋势的恰当指标是什么?为 什么?并计算出你所选定的指标。 • 年龄分布表 • 25岁以下 25-34岁 35-44岁 45-54岁 55-64岁 64岁以上
• f 45 40 30 55 28 15
第二节 差异量数
一、 标准差 二 、 四分差 三 差异系数
数描述时,其离散程度宜用标准差描述。
2、计算其它统计量时,如相关系数等, 要用到标准差。 3、在推断统计中,尤其是进行方差分析 时,常用方差(标准差的平方)表示数据 的离散程度。
(二)、标准差的计算方法 1、基本公式法 例1 某校四年级举行数学竞赛,一班、二班分别派九 名选手参加,如下表。试比较两个班的成绩。
求出年平均增长率。
平均增长率=1.09-1=0.09 故所求的年平均增长率为9%。
2、只用首末项求几何平均数 设a0,a1,…,aN是N个年度中各年度某种数量值,
其中a0是初期量, aN是末期量。X1,X2,…,XN为
各年度发展速度,即
aN a1 a2 X 1 , X 2 ,..., X N a0 a1 aN 1
2 8 32125 502
=31.72
例 已知某校四年中各年度的学生人数分别为上一年
的1.12倍,1.09倍,1.08倍和1.06倍,求每年的平均增长率。
解:先求出平均发展速度
Mg 4 1.121.091.081.06 1.09
然后用公式:平均增长率=平均发展速度-1,
82
77 72 67
15
8 5 3
1230
616 360 201
60-64
55-59 ∑
62
57
4
2 50
248
114 3915
解:将表中数据代入公式,得
fXc 3915 X 78.3 N 50
说明:利用次数分布求得的算术平均数是 一个近似值。因为我们先假设组内的数据是均
匀分布的,利用各组中值分别代表各组数据,
解:(1)N/2=50/2=25; (2)由下向上累积次数,7579组对应的累积次数为22,8084组对应的累积次数为37,故 中位数在80-84组; (3)Lb=79.5; (4)Fb=2+4+3+5+8=22; (5)i=5,f=15; 6)将上述值代入(3.4),得 Mdn=79.5+(25-22)/15*5=80.5
(3.2)
例 某年级四个班的学生人数分别为50人,52
人,48人,51人,期末数学考试各班的平均成绩
分别为90分,85分,88分,92分,求年级的平均
成绩。
解:由公式(3.2)得
Xw
XW 90 * 50 85 * 52 88 * 48 92 * 51 50 52 48 51 W
55-59
50-54 45-49 40-44 ∑
57
52 47 42
42
58 30 5 144
4.20
-0.80 -5.80 -10.80
17.65
0.64 33.62 116.61
X
fXc
N
式中Xc为组中值;f为各组次数,即权数;N 为总次数=∑f。
例 某班50人外语期末考试成绩的次数 分布如下,求全班学生的平均成绩。
表 某班50人外语成绩次数分布表
组别 90-94 85-89
组中值Xc 92 87
次数f 3 10
fXc 276 870
80-84
75-79 70-74 65-69
3、在教育上,主要应用几何平均数求平
均发展速度或对某项目标进行预测估计。
(二)、几何平均数的计算方法 1、直接公式法 例 求2,8,32,125,502的几何平均数。 解:由于这组数属于近似等比数列,故应 用公式(3.5),得
几何平均数M g
n
X 1 X 2 X n
X 1 X n 为n个数据 5
第三章 集中量数 和差异量数
• 1、对某校学生的思想品德用五级记分法记分, 其人数统计可以用( )表示: • a、直条图 b、直方图 c、多边图 d、线形图 2、从总体中抽取出作为观察对象的一部分个 体,称为: ( ) a、样本 b、总体 c、有限总体 d、无限总体 3、在制作有纵横轴的统计图时,一般来说, 纵轴与横轴比为: ( ) a、1:1 b、3:5 c、5:3 d、6:3
MG N a N 5 700 1.03 a0 594
故年平均增长率为(10.3-1)*100%=3%
例 某校办工厂在1984年创产值10万元,该厂
计划以年平均增长率为5%的速度递增,试估计到
2004年该厂可创产值多少万元。
解:由 平均增长率=平均发展速度-1
得:aN=a0(1+平均增长率)N =10×(1+0.05)20=26.53(万元)
其中:Xc为各级组中值; X 为算术平均数;N 为总次数;f为各组次数。
例3 某年级144名学生语文成绩如下表,求其 标准差。
表3-3 144名学生语文成绩表
组别
65-69 60-64
Xc
67 62
f
3 6
Xc14.20 9.20
X
(Xc)^2 X 201.68 84.67
f(XcX)^2 605.04 507.99
从以上计算可知,两班平均数都是73分,说
明两班的平均水平相同。但它们的标准差不同,
说明两班成绩的差异程度很不相同。一班的差异
程度较小,平均分数73的代表性就较大;二班的 差异程度较大,平均分数73的代表性就小些。 2、原始数据法 为了减少计算量,可将公式3.1进行转换, 使公式中参与运算的变量皆为原始数据。公式 为
这显然与实际不符,把这一误差叫分组误差。
(四)加权算术平均数的计算方法
它是指一组数据中每个数据与其权数乘积的总和 除以权数总和所得之商,用符号 X w 表示。
计算公式如下: X 1W1 X 2W2 X nWn X iWi XW W1 W2 Wn Wi 式中:X i (i 1,2,, n)为各数据的值; Wi (i 1,2,, n)为各数据相应的权数 。
X
N
2
2
X N
2
(3.2)
式中 X 2为原始数据的平方之和 ;
X 为原始数据总和的平方 ;N
解:∑X=657,∑X2=49747 N=9,代入公式(4.2)
表示次数。
例2 用原始数据法计算表1的标准差
X
N
2
X N
2
组别 90-94 85-89 80-84 75-79 70-74 65-69 组中 值Xc 92 87 82 77 72 67 次数f 3 10 15 8 5 3 fXc 276 870 1230 616 360 201
60-64
55-59 ∑
62
57
4
2 50
248
114 3915
四、 几何平均数
概念: 是一组同质数据值的总和除以数据总个数所得的 商。亦称均数,均值,用 X(读X杠)表示。
计算公式为: X 1 X 2 X n X n
X
n
i
(3.1)
n为数据个数。
• (二)计算方法: 1、原始数据计算法: 定义公式一般适用于原始数据较少 的情况下,其计算方法可用于原始数据 计算公式中。
=88.74
三、中位数
(一)、中位数的概念及适用条件
概念: 中位数是位于一组有序数据中间位置的量 数。也称中数,用Mdn表示。它是将一组有序数 据的个数分为相等两部分的那个数据。
适用条件:
1、当一组数据有极端值出现时。
2、当一组有序数据两端有个别数据模糊不清
或分组资料有不确定组限时。
3、当需要快速估计一组数据的代表值时。
计算公式为:
M dn Lb
n Fb 2 M L i n dn b Fb f 2
i
式中:Lb 表示中位数所在组的精 确下限;Fb为中位数所在组以下的 累积次数;
f :L 表示中位数所在组的精 式中 确下限;Fb为中位数所 b
n为总次数 ;i 为组距;f 为中位数所在组的次数 。 n为总次数;i 为组距;f 为中位数所在组的次数 。
• 一、集中量的一般意义:
• 定义:集中量就是表示一组数据典型水平或集 中趋势的量。它反映频数分布中大量数据向某 一个量集中的情况。常用的集中量有算术平均 数、几何平均数、调和平均数、加权平均数、 中位数、众数等。
二、集中量的优良代表量之一--算术平均 数(Arithmetic Mean)
(一)、算术平均数的概念
(一)、几何平均数的概念及应用时机
概念:
它是N个数值连乘积的NLeabharlann Baidu方根,用符号MG 表示
几何平均数M g n X 1 X 2 X n X 1 X n 为n个数据
(3.5)
应用时机:
1、求一组等比或近似等比数据的平均数
时。
2、一组数据中,有少数偏大或偏小的数
据,数据分布呈现偏态,求平均数时。
计算步骤: (1)求N/2; (2)确定中位数所在组,由下向上累积 次数,直到大于或等于N/2一组为止,该组 就是中位数所在组; (3)求出中位数所在组的精确下限; (4)求出中位数所在组以下的累积次数 Fb; (5)确定组距及中位数所在组的次数f; (6)将以上各值代入公式中。
表 某班50人外语成绩次数分布表 求表的中位数。
2
得
49747 657 9 9
14.09
(二)分组资料标准差的计算方法
这里的分组资料指编制成次数分布的资料,此 时以组中值作为各组的代表值。计算公式为
f Xc X
N
2
(3.3)
2
或
fXc
N
2
fXc N
中位数。 例如求80,93,90,81,85,88,92,84的 中位数时,先排序:80,81,84,85,88,90, 92,93,再求(N+1)/2=4.5,这说明中位数的位
置在第四个和第五个数的中间,即(85+88)
/2=86.5。
(二)分组数据中位数的计算方法 对分组数据常将N/2位置对应的数据看 成中位数。
576
22
484
12
144
7
49
2
4
-8
64
-33
1089
-53
2089
解:先求四年一班的平均数和标准差。算得
X 73
X
i
X
2
1786
X
X
2
n
14.09
再求四年一班的平均数和标准差。得
X 73
X X
i
2
5948
X
X
2
n
25.71
一、 标准差
(一)、标准差的概念及适用条件 概念: 标准差是一组数据中每个数据与其算术 平均数之差的平方的算术平均数的算术平 方根。用符号σ 表示。
X
i
X n
2
(3.1)
X 其中Xi为原始数据;N为数据个数; 的算术平均数。
为一组数据
适用条件: 1、一组数据的一般水平适合用算术平均
例如, 某班选八名同学参加年级数学竞赛,成绩分别为82,
90,95,88,90,94,80,93。求其平均成绩。 解:把N=8,X1=82,…,X8=93代入公式(3.1), 得
X 82 90 95 88 90 94 80 93 X 89 N 8
2、频数分布表计算法:对于已列成次数分布 表的分组数据,其算术平均数的计算公式为
表1 一班成绩统计表 X
X-
92
90
17
83
10 100
80
7 49
75
2 4
70
-3 9
62
-11 121
55
-18 324
50
-23 529
X
19
(X- X )^2
361 289
表2 二班成绩统计表 X 100 97 95 85 80 75 62 40 20
X- X
(X- X )^2
27
729
24
MG
N
X 1 X 2 ... X N N
aN a0
(3.6)
例 某重点高中1994-1999年招收新生人数如下 表,求年平均增长率。
表3-2 某高中招生人数统计表
年份 人数
1994 594
1995 600
1996 612
1997 630
1998 650
1999 700
解:由于a0=594,aN=700,N=5, 所以年平均 发展速度为
(二)、中位数的计算方法 1、未分组数据中位数的计算方法 一组数据未分组,先排序,中位数 取决于数据的个数是奇数还是偶数。
当数据的个数为奇数时,则以第(N+1)/2个 位置上的数据作为中位数。
当数据的个数为偶数时,则取居中间的两个
数据的平均数为中位数。即取第(N+1)/2处作为
中位数的位置,其位置左右两数据的平均值即为