第二章 定量资料的基本统计方法1

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
100.00 -
频数
30 25
20 15 10
5 0
96.599.5 103 106 109 112 115 118 121 124 身高(cm)
图2.1 某年某市城区120名5岁女孩身高频数分布
频数分布的特征
集中趋势(central tendency) 一组数据向某一个位置聚集或集中的倾向
离散趋势(dispersion tendency) 一组数据的分散性
集中趋势的统计描述 定量资料的频数表 离散程度的统计描述
定量资料的频数表
在什么情况下需编频数表?
离散型计量资料的频数表
以变量取值为标志分组,并列出各组的 频数
例 2.1
表2.1 某年某地区434名少数民族已婚妇女 现有子女数的频数分布
现有子女数(个) (1) 0 1 2 3 4 5 6 7 合计
计算方法:
➢ 直接法:G n X1X 2...X n 或
G lg1 (lg X1 lg X 2 lg X n ) lg1 ( lg X )
➢ 加权法(weighting method):
n
n
G lg1 ( f1 lg X1 f 2 lg X 2 ... f k lg X k ) lg1 ( f lg X )
频数( f ) (2) 177 31 67 60 48 27 16 8 434
频率(%) (3)
40.78 7.14 15.44 13.82 11.06 6.22 3.69 1.84

累计频数 (4) 177 208 275 335 383 410 426 434 —
累计频率(%) (5)
40.78 47.93 63.36 77.19 88.25 94.47 98.16 100.00 —
频数( f ) (2)
频率(%) (3)
累计频数 (4)
1
0.83
1
7
5.83
8
10
8.33
18
18
15.00
36
25
20.83
61
21
17.50
82
15
12.50
97
15
12.50
112
7
5.83
119
1
0.83
120
120
100.00
-
累计频率(%) (4) 0.83 6.67 15.00 30.00 50.83 68.33 80.83 93.33 99.17
现有2.1,2.2,2.3等3个观察值,求其均数
X1 LL X
2.1 2.2 2.3 2.2 3
X
n
均数(mean)
适用条件:对称分布,特别是正态或近似正态分布 的定量资料。
符号:X 表示样本均数,希腊字母表示总体均数。
计算方法:
➢ 直接法:
X X1 X 2 X n X
n
频数表法计算Px
频数分布的类型
对称分布:对称分布
偏态分布: ➢ 正偏态分布 ➢ 负偏态分布
频数表的用途
揭示资料的分布类型,以便于选用相应的统计 分析方法;
便于进一步计算指标和统计处理; 便于发现某些特大或特小的可疑值。
集中趋势的统计描述
描述一组同质观察值的平均水平或中心位置的指 标有均数、几何均数、中位数、众数、调和均数
连续性变量的频数表的编制
求全距(range):找出观察值中的最大值 与最小值,其差值即为全距(或极差),用 R表示
定组段和组距(class interval) 列出频数表
定组段和组距
根据全距的大小和样本含量的多少确定“组段” 数
各组段的起点和终点分别称为下限和上限,某组 段的组中值为该组段的(下限+上限)/2。
n
➢ 加权法(weighting method):
X f1 X1 f 2 X 2 f k X k fX
f1 f2 fk
f
例2.3
X 112.9 99.5 116.5 1181.3 107.39 (cm)
11
11
120名5岁女孩身高均数
X 1 96.5 1123.5 13218 110.15 (cm)
f1 f 2 ... f k
f
例 2.4
G lg1 ( lg 2.3 lg 2.1 L lg 8.1) lg1 ( 4.9357 ) 4.14
8
8
例2.5
几何均数注意事项
1.几何均数常用于等比级资料或对数正态分布资料。 2.观察值中若有0或负值,则不宜直接使用几何均数。 3. 观察值一般同时不能有正值和负值。
第二章 定量资料的基本统计方法
张菊英
复习
总体与样本、抽样误差 小概率事件
复习
资料的两种类型
➢ 数值变量资料 ➢分类资料 问题:
数值变量
关注测定值的大小Hale Waihona Puke Baidu
统计分析
➢统计描述:是用统计图(表)、统计指标来描述资 料的分布规律及其数量特征。
➢统计推断:用样本信息推断总体特征。
定量资料的统计描述
2. 均数适用于描述单峰对称分布,特别是正态分布或近似正态分 布资料的集中趋势。
3. 均数在描述正态分布特征方面具有重要意义。
几何均数(geometric mean)
适用条件:某些呈正偏态分布,但数据经过对数 变换后呈正态分布的资料,也可用于观察值之间 呈倍数或近似倍数变化(等比关系)的资料。
符号:用G表示
中位数(median)
适用条件:偏态分布资料以及频数分布 的一端或两端无确切数据资料
符号:P50 或M
计算方法:
➢直接法:
➢n为奇数时:
M X ( n21)
➢n为偶数时:
M
[
X
(
n 2
)
X
(
n 2
1)
]
/
2
➢频数表法(weighting method):
i Px L f x (n x% f L )
相邻两组段的下限之差称组距,常用全距的1/10 取整做组距
第一组段应包括全部观察值中的最小值,最末组 段应包括全部观察值中的最大值并且同时写出其 下限与上限。
组段(cm) (1)
95~ 98~ 101~ 104~ 107~ 110~ 113~ 116~ 119~ 122~125
合计
表2.2 某年某市120名5岁女孩身高频数分布
1 1
120
均数的特性
1. 各观察值与均数之差(离均差)的总和等于零,即 ( X X ) 0 。 2. 各观察值的离均差平方和最小,即 ( X X )2 ( X a)2 ( a ≠ X )。
均数是一组观察值最理想的代表值。
均数的应用
1. 均数反映一组同质观察值的平均水平,并可作为样本的代表值 与其他样本进行比较。
相关文档
最新文档