计量资料统计描述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
适用条件: 原始观察值呈偏态分布,但经过对数变换 后呈正态分布或近似正态分布的资料,如 血清抗体滴度、细菌计数等。 应用时注意事项: • 几何均数常用于等比资料或对数正态分布资料
• 观察值中若有0或负值, 则不能直接使用几何 均数
• 观察值一般同时不能有正值和负值
35
3. 中位数 (median,M)
横轴--- 观察变量 (组中值) 纵轴— 频数或频率
20
频数表和频数图的主要用途
1. 揭示频数分布的特征 集中 或 离散 2. 揭示频数分布的类型 对称分布: 偏态分布:
3. 便于发现特大或特小的可疑值
4. 便于进一步计算统计指标和进行统计分析
21
二、 集中趋势的描述
例3 现有12名5岁女孩的身高值分别为112.9, 99.5,100.7,101.0,112.1,118.7,107.9, 108.1,99.1,104.8,116.5,试问平均身高是多 少?
中位数是将一组观察值按大小顺序排列后, 位次居中的观察值 适用条件: • 可用于各种分布的资料 正态分布资料: 均数=中位数 对数正态分布资料: G=M • 也适用于两端无确切值或分布不明确的资料
百分位数 (percentile)
是一种位置指标,用Px来表示
36
• 百分位数 (percentile,P)
f - 频数, X- 组中值= (本组下限+下组下限)/2 加权法(weight method)
23
某市120名5岁女还身高频数分布 组段 频数 频率 累积频数 (cm) (f) (%) 951 0.83 987 5.83 10110 8.33 10418 15.00 10725 20.83 11021 17.50 11315 12.50 11615 12.50 1197 5.83 122-125 1 0.83 合计 120 100.0 -
LM : 中位数所在组段下限 i : 中位数所在组段的组距 fM : 中位数所在组段的频数 ΣfL: 中位数所在组段前一组的累积频数
32
表4 1503名中年知识分子SCL-90得分 累积频数 累积频率 SCL-90总分 频数 80100120140160180200220240260280-300
9598101104107110113116119122-125 合计 1 7 10 18 25 21 15 15 7 1 120 0.83 5.83 8.33 15.00 20.83 17.50 12.50 12.50 5.83 0.83 100.0 1 8 18 36 61 82 97 112 119 120 -
177 208 275 335 383 410 426 434
40.78 47.93 63.36 77.19 88.25 94.47 98.16 100.0
4
180 160 140 120 100 80 60 40 20 0
频 数
0
1
2
3
4
5
6
7
现有子女数
5
2. 连续型资料的频数表和频数分布
例2 某年某市抽样调查了120名5岁女孩身高(cm),资料 如 下. 试通过频数表和频数分布图进行描述. 105.5 110.4 109.1 108.6 100.2 100.7 108.8 119.7 109.6 108.8 108.7 104.1 118.6 105.7 108.1 100.6 102.1 116.3 114.7 113.9 110.7 105.7 119.1 109.1 110.5 118.2 109.4 108.8 114.5 105.1 110.6 116.5 102.8 109.0 106.2 108.8 104.2 110.9 107.9 108.1 99.1 104.8 116.5 117.0 112.3 116.5 113.2 107.9 104.8 109.6 118.2 103.9 116.0 110.1 99.6 109.3 107.5 103.8 95.3 104.4 102.7 101.0 112.1 118.7 110.4 115.0 120.5 115.5 112.7 103.5 114.4 112.8 118.5 113.3 107.9 114.6 121.4 110.7 110.7 116.6 106.9 105.5 107.4 118.4 115.3 112.9 112.9 110.0 99.5 112.7 106.7 119.1 111.3 105.2 117.0 114.9 120.0 103.4 109.3 108.8 108.1 116.4 108.3 111.0 113.0 101.4 115.2 124.0 98.7 106.0 114.7 111.9 107.3 111.0 106.8 120.2 105.8 103.1 105.0 115.0 6
编制频数表 步骤: 1. 求全距 (range, R) (极差): 全部观察值中的最大值与最小值之差. R=124.0-95.3= 28.7cm 2. 划分组段 (区间) 确定组数: 8~10组 确定组距: 等距分组时, 组距 = 全距/ 组数 确定各组段的上下限: 3. 统计各组段频数
7
某市120名5岁女孩身高频数分布 组段 频数 频率 累积频数 (cm) (f) (%)
448 520 226 130 79 44 30 9 10 3 4
448 968 1194 1324 1403 1447 1477 1486 1496 1499 1503
29.81 64.40 79.44 88.09 93.35 96.27 98.27 98.87 99.53 99.73 100.00
25
20
Frequency
15
10
5
Mean = 110.11 Std. Dev. = 5.80324 N = 120 0 95.00 100.00 105.00 110.00 115.00 120.00 125.00
var00001
19
频数分布图
连续型计量资料的频数分布应该绘制直方图
直方的面积表示频数的多少, 直方面积占总面积的比例表示频率大小
M X n1 / 2
M Xn / 2 Xn / 2 1 / 2
中位数(median,M)
31
例7 为研究中年知识分子的心理健康状况,某学院对 1503名知识分子进行了SCL-90测定,结果如下表,试 求平均水平.
i M LM n 50% fL fM
例 某年某市抽样调查了120名5岁女孩身高(cm), 欲 了解平均身高是多少?资料分布有什么特点?
105.5 110.4 109.1 108.6 100.2 100.7 108.8 119.7 109.6 108.8 108.7 104.1 118.6 105.7 108.1 100.6 102.1 116.3 114.7 113.9 110.7 105.7 119.1 109.1 110.5 118.2 109.4 108.8 114.5 105.1 110.6 116.5 102.8 109.0 106.2 108.8 104.2 110.9 107.9 108.1 99.1 104.8 116.5 117.0 112.3 116.5 113.2 107.9 104.8 109.6 118.2 103.9 116.0 110.1 99.6 109.3 107.5 103.8 95.3 104.4 102.7 101.0 112.1 118.7 110.4 115.0 120.5 115.5 112.7 103.5 114.4 112.8 118.5 113.3 107.9 114.6 121.4 110.7 110.7 116.6 106.9 105.5 107.4 118.4 115.3 112.9 112.9 110.0 99.5 112.7 106.7 119.1 111.3 105.2 117.0 114.9 120.0 103.4 109.3 108.8 108.1 116.4 108.3 111.0 113.0 101.4 115.2 124.0 98.7 106.0 114.7 111.9 107.3 111.0 106.8 120.2 105.8 103.1 105.0 115.0
累积频率
0.83 6.67 15.00 30.00 50.83 68.33 80.83 93.33 99.17 100.0 8
9
10
11
12
13
14
15
16
17
25
20
Frequency
15
10
5
Mean = 110.11 Std. Dev. = 5.80324 18 N = 120 0
X 1 X 2 ... Xn X X n n
算术均数 (arithmetic mean)简称均数(mean)
22
前例2 某年某市抽样调查了120名5岁女孩身高 (cm),资料 如下. 试计算平均数
f 1 X 1 f 2 X 2 ... fkXk fX fX X f 1 f 2 ... fk f n
3
1. 离散型计量资料的频数表
某年某地区434名少数民族已婚妇女现有子女数的频数分布 现有子女数 频数 (个 ) (f) 频率 (%) 累积频数 累积频率 (%)
0百度文库1 2 3 4 5 6 7
合计
177 31 67 60 48 27 16 8
434
40.78 7.14 15.44 13.82 11.06 6.22 3.69 1.84
合计 75 flgX 2.4084 8.1279 25.2861 30.1020 21.6744 10.5360 9.6328 107.7676
29
f lg X G lg n
1
=27.35
平均抗体滴度为 1:27.35
30
例 6 某研究者测得7名中年知识分子SCL-90得分, 分别为:87,90,91,92,95,96,108. 试求平 均水平.
1
第十章 数值变量资料的统计分析
计量资料:
连续型计量资料: 变量取值为一定范围的任意值,不 能一一列举的, 比如身高(cm)、体重(kg) 等 离散型计量资料: 变量取值可以一一 列举的,如脉搏数(次/分)
2
第一节
数值变量资料的统计描述
一、数值变量资料的频数分布
例1 某研究者调查了某地区434名15-64岁少数 民族已婚妇女现有子女数,结果发现有子女数 0-7人不等,欲了解有不同子女数的分布情况, 需要制作频数分布表。 频数 (frequency): 不同组别内的观察值个数 离散型计量资料? 连续型计量资料?
28
例5 某医院预防保健科用流脑疫苗为75名儿童进 行免疫接种后,抗体滴度测定结果如下表,求平 均滴度。 表2.3 75名儿童的抗体滴度 抗体滴度 频数(f) 滴度倒数 lgX 4 4 0.6021 1: 4 9 8 0.9031 1: 8 21 16 1.2041 1:16 20 32 1.5051 1:32 12 64 1.8062 1:64 5 128 2.1072 1:128 4 256 2.4082 1:256
33
描述集中趋势的指标: 1. 算术均数 (均数, mean)
小样本—直接计算 大样本– 加权法 特点: • 各观察值与均数之差(离均差)的总和等于零 • 各观察值离均差平方和最小
适用条件:
适用于描述单峰对称分布,特别是正态分布 或近似正态分布的资料
34
2. 几何均数 (geometric mean, G)
累积频率
-
24
25
26
27
例4 某地5例微丝蚴血症患者治疗7年后,用间接荧 光抗体试验测其抗体滴度,其倒数分别为 10,20,40,40,160,求平均滴度.
G X 1 X 2 X 3... Xn
n
n-例数
lg X G lg n
1
几何均数 (geometric mean, G)
将观察值从小到大排列后处于第X百分位置 上的数值,Px 例2.11 根据表2.1资料求某地区434名少数民族已婚妇 女现有子女数的第80百分位数。
i n X % fL PX LX fX
相关文档
最新文档