【课件-医学统计方法】_02定量资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小结
集中趋势指标:不同分布情况下,描述指标的选择 离散趋势指标:各个指标的应用和特点
如何从集中趋势和离散趋势两个角度对数据进行合理的描述
8 6 4 2 0
110 112 114 116 118 120 122 124 126 128 130 132 134 136 g
Frequency
统计图表
v频数表/图的用途
Ø 揭示资料分布类型:频数图较频数表更直观 Ø 描述频数分布的重要特征:集中趋势与离散趋势 Ø 便于发现特大与特小的可疑值 Ø 便于进一步计算统计指标和做统计处理
统计图表
表2.1 110名7岁男童身高频数分布
统计图表
•连续变量
频
以直方顶点的纵坐标(等距分组)或直方的面积大小
数
(不等距分组)表示频数的多少
分
布
图
•离散变量
以各直条的长短表示频数的多少
统计图表
v连续变量频数分布图
等距分组:横轴表示观察变量,纵轴表示每个横轴组段的频数。
22 20 18 16 14 12 10
v离散程度的描述
Ø方差
n 方差:相当于平均每个数据的离均差的平方;可用于 不同样本含量数据离散度的比较。
n 自由度(degree of freedom):当 X 选定时n个X中能自 由变动的X的个数
统计指标
v离散程度的描述
Ø标准差
n 标准差(standard deviation)
S (X X )2
[n( x%)]为乘积取整部分
统计指标
v离散程度的描述
Ø 四分位间距
n 上下四分位数(QU、QL):第25百分位数和第75百分位 数
n 四分位间距P75-P25: § 上下四分位数之间的距离,包括了一半的数据,越大
表明离散程度越高 § 描述了50%数据的分布宽度 § 比极差稳定
n 四分位数范围P25~P75(inter-quartile range) § 描述了50%数据分布的宽度 § 反映分布的位置特征
统计指标
v集中趋势描述
Ø算术均数:简称均数
n 总体均数μ,样本均数 n 当数据对称分布时,位于分布的中心,是频数分布最集
中的位置
直接法: X X
n
加权法:
X
fXi f
统计指标
v集中趋势描述
Ø几何均数G
n 适用于经对数转换后呈对称分布的数据,如医学上的 滴度资料
G n X1 X 2....X n
统计指标
v离散程度的描述
Ø方差
n 方差variance :适用于对称分布的资料
§ 总体方差 2
2 ( X X )2
n
§ 样本方差 S 2
S 2 ( X X )2
n 1
n 离均差平方和:描述每个数据X相对于 X 分布的集中
程度;与样本含量n有关,样本含量不同时不宜直接
比较)
统计指标
统计图表
•频数表的制作
确定组数:不宜过多或过少,一般10组
确定组距:可等可不等; 一般等组距=极差/组数; 本例组距=(134.5-110.2)/10=2.43
确定各组上下限(每个组段的起点和终点): 第一组包含最小值 组段不能重叠 每一组段都为半开半闭区间 最后一组应为闭区间 离散型资料的组段通常为一个取值
115 116.7 121.7 128.1 132.5 116.9 127.2 122.1 119.4 125.1 122.5
112.8 121.7 122.7 119.7
122 131.1 118.3 114.4 128.2 124.4 129.1
120.2 116.8 116.3 126.1 123.5 120.4 127.8 120.5 124.1 112.3 122.6
110.2 121.6
124 131.3 116.3 115.2
123 120 127.2 121.3 134.5
120.9 120.2
119 123.8 126.1
118 117.4 122.8
120 127 118.3
120.1 122
124.5 116.7 119.2 122.4 123.2 116.8 122.7 113.5 132.8
统计指标
v离散程度的描述
Ø四分位间距
n 百分位数(percentile):位置指标
§ 第x百分位数Px:将所有数据从小到大排列后,处于第 x百分位置的数值。中位数记为 P50。
Px
1 2
(
X
[
n(
x
%)]
X ) [n( x%)]1
Px X[n(x%)]1
n(x%) [n(x%)]
n(x%) [n(x%)]
n 1
(X X )2 X 2 ( X )2
n
统计指标
v离散程度的描述 Ø变异系数 n 变异系数coefficiedt of variatlion (CV) CV=标准差/均数×100%
• 描述了数据的变异相对其平均水平的大小 • 描述的是相对离散度 • 无单位量纲
§ 比较度量衡单位不同资料的变异度 § 比较均数相差悬殊资料的变异度
119.2 120.3 118.8 124.9 122.8 118.4 116.9 122.1 120.1 127.1 127.6
124.7 122.3 121.8
130 128.6
121 126.4 120.4 124.8 122.5 125.2
125 118.2 124.5 123.5
122 119.1 114.2 124.8 122.7 116.3 121.5
计量资料的统计描述
目录
1
概述
2
统计图表
3
统计指标
4
小结
5
STATA命令
概述
•统计图表
述计
频数表;频数/频率图
量
资
料
的
统 计
•统计指标
描
集中趋势;离散趋势
统计图表
v频数表
§ 某市1995年110名7岁男童身高资料
121.4 125.5 121.7 121.8 122.2 126.4 120.3 119.9 125.8 118.3 118.8
G
lg(
f lg f
X
)
统计指标
v集中趋势描述
Ø中位数
n 将一组观察值从小到大排列位置居中的数
n 适用于
Baidu Nhomakorabea
任何分布的定量数据
不完全资料(开口资料):没有确切最大值或最小值的资料
当n为偶数时
M
1 2
(
X
n 2
X n1 )
2
当n为奇数时 M X n1
2
统计指标
v离散程度的描述
Ø极差
n 极差(range):最大值-最小值 优点:简单明了 缺点:不能反映其它数据的变异 样本量较大时极差也较大 不宜比较