定量变量的统计描述解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

❖定量资料的统计描述方法
频率分布表与频率分布图
计量资料的统计描述
统计指标
平均水平:均数、几何均数、中位数
变异程度:极差、四分位间距、方差、
统计表:三线表
标准差、变异系数
统计图:直方图、直条图、饼图等
6
三、频率分布表和频率分布图
可以很直观地揭示变量的分布类型和分布特征,例如P120表2-2。
表2 某年某地120名18~35岁健康男性血清铁含量(umol/L)频率分布
观察 收缩压 血压水 血压 观察 收缩压 血压水 血压
对象 (mmHg) 平
正常 对象 (mmHg) 平
正常
与否
与否
1 165
高血压 否
11 120 正常血压 是
2 150
高血压 否 12 80
低血压 否
3 150
高血压 否
13 165 高血压 否
4 165
高血压 否 14 70
低血压 否
5 130
8
❖ 1 算术均数(arithmetic mean):简称均数(mean)。适用于描述正态分
布或者近似正态分布资料的平均水平。常用的方法有直接法和加权法。
符号:μ表示总体均数,X 表示样本均数
❖ (1) 直接法:
计算公式:
X X1 X 2 L X n X
n
n
❖ (2) 频率表法:
三组均数和中位数都为4.8×1012/L,但是三组的变异程度不同。
13
❖ 1 极差(range):反映观察值变异范围的大小。
R1=5.2-4.4=0.8 (×1012/L), R2=5.4-4.2=1.2(×1012/L), R3=5.2-4.4=0.8 (×1012/L)
可用于各种分布的资料;只能说明两端值的差别,不能反映组内所有 数据的变异;容易受到特大值特小值的影响。
❖ (1)直接法:
n为奇数: M X ( n1) 2
n为偶数:M

1 2
(
X
(
n 2
)

X ( n1) ) 2
11
❖ (2)频率表法:观察值例数较多时,归纳成频数表,计算出累计频数和累计 频率。
例9-13:
表9-15 102名链球菌咽喉炎的潜伏期(小时)
潜伏期(小时) 人数f(2) 累计频数 计频率(%)
X f1X1 f2 X2 L fk Xn fX
f1 f2 L fk
f
9
❖ 2 几何均数(geometic mean):适用于描述各观察值之间呈倍数变化,或
者偏态分布资料经对数变换后分布呈正态的资料的平均水平。分直接和加权法
符号:用G表示
❖ (1) 直接法:
计算公式: G n X1X2 L X3
对数形式:
G

lg1

lg
X1

lg
X
2 n
L
lg Xn


lg1(

lg X )
n
❖ (2) 频率表法:用于样本有较多相同观察值的资料或者频数表资料。
公式:
G

lg1

f1
lg
X1

f2
lg
X2 n
L

fn
lg
Xn


lg1(
f lg X )
n
10
❖ 3 中位数(median):将观察值从小到大排序,位次居中的那个观察值。 适用于:偏态分布或者分布状态不明的资料;观察值中有个别过小或者过大值 的资料;一端或两端无确定数据的资料。分直接法和频数表法。
14
来自百度文库
❖2 四分位间距(quartile interval) 用Q表示,通过计算百分位数P75 和P25之差得到。将第25百分位数用QL表示,第75百分位数用QU表示, 则四分位间距: Q= QU -QL
15
❖3 方差(variance):克服了极差的弱点,全面考虑了每个观察值的离
79.17
22~
12
10.00
107
89.17
24~
8
6.67
115
95.83
26~
4
3.33
119
99.17
28~30
1
0.83
120
100.00
合计
120
100.00


7
四、平均水平指标(重点)
❖ 定义:用于描述一组同质观察值的集中趋势(集中位置)或平均水 平。常用的指标有均数、几何均数和中位数。
12~
3
3
2.94
24~
16
19
18.63
36~
34
53
51.96
48~
21
74
72.55
60~
15
89
87.25
72~
7
96
94.12
84~
4
100
98.04
96~108
2
102
100.00
M L i ( n
fM 2
fL)
M 36 12 (102 19) 47.29(小时) 34 2

有序变量:满意度



离散型变量:只能取整数值。
定量变量
如患病人数、新生儿数。
连续型变量:可以取实数轴上的任何数值。
如身高(cm)、体重(kg)。
3
二、讨论内容
20名高血压患者服用降压药1小时后 测量其血压值,分别采用三种形式 记录,结果如下表:
表1 20名高血压患者服用降压药1小时后的血压值
组段
频数
频率(%)
累计频数
累计频率(%)
(1)
(2)
(3)
(4)
(5)
6~
1
0.83
1
0.83
8~
3
2.50
4
3.33
10~
6
5.00
10
8.33
12~
8
6.67
18
15.00
14~
12
10.00
30
25.00
16~
20
16.67
50
41.67
18~
27
22.50
77
64.17
20~
18
15.00
95
正常血压 是
15 140 高血压 否
6 160
高血压 否
16 170 高血压 否
7 120
正常血压 是
17 160 高血压 否
8 120
正常血压 是
18 140 高血压 否
9 140
高血压 否
19 130 正常血压 是
10 130
正常血压 是
20 124 正常血压 是

1. 以上三种记录各属何种类型的变量及统计资料 2. 变量类型可以转换吗?就上例进行说明。
12
五、 变异程度指标(重点)
❖ 集中位置只反映了分布的一个特征,所以需要了解各观察值之间的变异程 度(离散程度)如何,才能反映资料的分布规律。
例9-14:三组健康成年男性红细胞数(×1012/L)如下: 1组 4.4 4.6 4.8 5.0 5.2 2组 4.2 4.5 4.8 5.1 5.4 3组 4.4 4.5 4.8 4.9 5.2
定量资料的统计描述
刘宇丹: 2839167668
2013年10月8日
1
一、目的要求:
1. 掌握变量的类型; 2. 掌握平均数和变异指标的含义和计算方法; 3. 重点:使用SPSS计算平均数和变异指标,并
能看懂SPSS计算的平均数和变异指标的结果。
2
二分类变量:性别
定性变量
分类变量 多分类变量:职业
相关文档
最新文档