统计_2015_2(统计描述)概论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/11/22
人数
人数
25 20 15 10 5 0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
25 20
15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
表1
标题
顶 线
纵标目1 纵标目2 合计
(单位) (单位)
标目线
横标目1
横标目2
合计线
合计
底 线
备注:
统计图
意义:将统计数据形象化
制作原则:
正确选用统计图:根据资料性质和分析目的 标题:说明图的内容,在图的正下方(When\Where\Who) 坐标轴:横轴:对象或对象分组特征
纵轴:指标 比例一般为5:7;或7:5 图例:对不同颜色或线条进行说明,不影响图形的展示
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2020/11/22
集中趋势的描述 –均数
• 直接计算法
X X1 X 2 X n X
n
n
• 频数表法
X f1X1 f2 X 2 f3 X3 fk Xk fX
f1 f2 f3 fk
f
2020/11/22
S (X X )2 n 1
S
X
2
( X
n
)2
n 1
S
fX
2
( fX f
)2
Байду номын сангаас f 1
2020/11/22
离散趋势描述-变异系数
• 不同均数资料的变异度比较 • 不同度量单位资料的变异度比较
S CV 100%
X
2020/11/22
分类变量的描述_相对数
• 强度相对数:率
某时期内发生某现象的观察单位数 同期可能发生某现象的观察单位总数
统计图_直条图
直条图:用相同宽度的直条长短表示相互独 立的某统计指标值的大小。便于进行同类 指标的对比。
直条尺度必须从0开始 各直条宽度相等,间隔与直条等宽或为一半
简单条图
复式条图
%
45
Stunting 40
year 2001 year 2005
35
30
25
20
15
10
5
0 Type I
Type II
(n 2
fL)
PX
LX
iX fX
(nX % fL )
2020/11/22
离散趋势描述-极差\四分位距
• 极差R: 最大值与最小值之差
• 四分位距
= Q-R P75
P25
2020/11/22
离散趋势描述-方差\标准差
• 总体方差与总体标准差
2 ( X )2
N
(X )2 N
• 样本标准差
2020/11/22
2020/11/22
R
编制步骤
• 求极差 极差(range)也称全距 • 确定组段数和组距 • 根据组距写出组段 • 分组划记并统计频数
2020/11/22
2020/11/22
2020/11/22
频数表和频数分布图的用途
• 描述频数分布的类型 • 描述频数分布的特征 • 便于发现一些特大或特小的可疑值 • 便于进一步做统计分析和处理
统计表
意义:用简明的表格形式,有条理地罗列数据和统计量, 方便阅读、比较和计算。
制表原则:重点突出、简明扼要 基本要求: 标题:说明表的内容,在表格的正上方,需注明表中所列资料
的收集时间、地点、人群(When \Where\Who) 标目:
-横标目:每行数据的意义,对象,在表的左侧 -纵标目:每列数据的意义,指标 线条:顶线、底线、标目线、合计线(四条横线), 组合表中允许在纵标目下出现短横线 数字:准确可靠。小数位数对齐,保留位数一致。 无数字用“-”表示,缺失数字用“…”表示 备注:在表格的下方,对表中的标注数字进行说明
统计描述
1.统计图、表(直观) 2.特征指标
2020/11/22
计量资料的统计描述
• 集中趋势描述
均数:对称分布,特别是正态分布资料 几何均数:等比级数资料,对数正态分布资料 中位数:不适合用几何均数描述的偏态分布资料
末端有不确定数据的正态分布资料
• 离散趋势描述
极差:不稳定 四分位数间距:用于偏态分布资料 方差与标准差:用于正态分布资料,描述平均变异\绝对变异 变异系数:用于正态分布资料变异度对比\相对变异
Type III
Type IV
统计图_圆图
圆图和百分条图:描述分类变量的各类别所 占的构成比。 圆图:以圆形总面积作为100%,将其分割 成若干个扇面表示事物内部各构成部分所 占的比例。 百分比条图:以矩形总长度作为100%,将 其分割成不同长度的段表示各构成的比例
17% 14%
18%
31% 20%
• 结构相对数 :构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
• 相对比
甲指标/乙指标
2020/11/22
计算相对数的注意事项
• 结构相对数不能代替强度相对数(以 比代率)
• 计算相对数应有足够数量 • 正确计算合并率 • 注意资料的可比性 • 相对数的抽样误差
2020/11/22
脑血管病 恶性肿瘤 呼吸系统 心脏疾病 其它疾病
图4-10 2000年某省农村男性居民主要疾病死因构成 比
脱落
嵌入脱落
0%
20%
40%
60%
80%
构成比
成功 良好 较好 失败
图4-9 两种脱落牙再植效果的比较
100%
圆图
统计图_线图
线图:用线段的升降来表示数值的变化,适合于 描述某统计量随另一连续性数值变量变化而变 化的趋势 横轴表示时间或其他连续性变量, 纵轴表示统计指标
集中趋势的描述 –几何均数
• 公式
G n X1 X 2 X n
G lg1 (
lg X )
n
G lg1 (
f lg X )
f
2020/11/22
集中趋势的描述 –中位数
• n为奇数: • n为偶数:
M X ( n1) 2
1
M
2
X
(
n 2
)
X ( n 1) 2
M
P50
L50
i50 f50
统计图_直方图
以直方面积描述各组频 数的多少,面积的总和 相当于各组频数之和, 适合表示数值变量的频 数分布。
-横轴为数值变量值 -纵轴为频数
频数
25
20
15
10
5
0 90- 110- 130- 150- 170- 190- 210- 230- 250- 270血清总胆固醇(mg/dL) 图4-1 81名健康男子血清总胆固醇含量的频数分布图
普通线图:纵横轴都是算术尺度, 纵轴一般以0作起点
半对数线图:纵轴为对数尺度, 适宜作指标变化速度的比较
人数
人数
25 20 15 10 5 0
13.5 19.5 25.5 31.5 37.5 43.5. 血清转氨酶(mmol/L)
图2-2 115名正常成年女子血清转氨酶的频数分布
25 20
15 10
5 0
2.5 12.5 22.5 32.5 42.5 52.5 血 清 肌 红 蛋 白(μg / m L)
表1
标题
顶 线
纵标目1 纵标目2 合计
(单位) (单位)
标目线
横标目1
横标目2
合计线
合计
底 线
备注:
统计图
意义:将统计数据形象化
制作原则:
正确选用统计图:根据资料性质和分析目的 标题:说明图的内容,在图的正下方(When\Where\Who) 坐标轴:横轴:对象或对象分组特征
纵轴:指标 比例一般为5:7;或7:5 图例:对不同颜色或线条进行说明,不影响图形的展示
图 2-3 101 名 正 常 人 血 清 肌 红 蛋 白 的 频 数 分 布
2020/11/22
集中趋势的描述 –均数
• 直接计算法
X X1 X 2 X n X
n
n
• 频数表法
X f1X1 f2 X 2 f3 X3 fk Xk fX
f1 f2 f3 fk
f
2020/11/22
S (X X )2 n 1
S
X
2
( X
n
)2
n 1
S
fX
2
( fX f
)2
Байду номын сангаас f 1
2020/11/22
离散趋势描述-变异系数
• 不同均数资料的变异度比较 • 不同度量单位资料的变异度比较
S CV 100%
X
2020/11/22
分类变量的描述_相对数
• 强度相对数:率
某时期内发生某现象的观察单位数 同期可能发生某现象的观察单位总数
统计图_直条图
直条图:用相同宽度的直条长短表示相互独 立的某统计指标值的大小。便于进行同类 指标的对比。
直条尺度必须从0开始 各直条宽度相等,间隔与直条等宽或为一半
简单条图
复式条图
%
45
Stunting 40
year 2001 year 2005
35
30
25
20
15
10
5
0 Type I
Type II
(n 2
fL)
PX
LX
iX fX
(nX % fL )
2020/11/22
离散趋势描述-极差\四分位距
• 极差R: 最大值与最小值之差
• 四分位距
= Q-R P75
P25
2020/11/22
离散趋势描述-方差\标准差
• 总体方差与总体标准差
2 ( X )2
N
(X )2 N
• 样本标准差
2020/11/22
2020/11/22
R
编制步骤
• 求极差 极差(range)也称全距 • 确定组段数和组距 • 根据组距写出组段 • 分组划记并统计频数
2020/11/22
2020/11/22
2020/11/22
频数表和频数分布图的用途
• 描述频数分布的类型 • 描述频数分布的特征 • 便于发现一些特大或特小的可疑值 • 便于进一步做统计分析和处理
统计表
意义:用简明的表格形式,有条理地罗列数据和统计量, 方便阅读、比较和计算。
制表原则:重点突出、简明扼要 基本要求: 标题:说明表的内容,在表格的正上方,需注明表中所列资料
的收集时间、地点、人群(When \Where\Who) 标目:
-横标目:每行数据的意义,对象,在表的左侧 -纵标目:每列数据的意义,指标 线条:顶线、底线、标目线、合计线(四条横线), 组合表中允许在纵标目下出现短横线 数字:准确可靠。小数位数对齐,保留位数一致。 无数字用“-”表示,缺失数字用“…”表示 备注:在表格的下方,对表中的标注数字进行说明
统计描述
1.统计图、表(直观) 2.特征指标
2020/11/22
计量资料的统计描述
• 集中趋势描述
均数:对称分布,特别是正态分布资料 几何均数:等比级数资料,对数正态分布资料 中位数:不适合用几何均数描述的偏态分布资料
末端有不确定数据的正态分布资料
• 离散趋势描述
极差:不稳定 四分位数间距:用于偏态分布资料 方差与标准差:用于正态分布资料,描述平均变异\绝对变异 变异系数:用于正态分布资料变异度对比\相对变异
Type III
Type IV
统计图_圆图
圆图和百分条图:描述分类变量的各类别所 占的构成比。 圆图:以圆形总面积作为100%,将其分割 成若干个扇面表示事物内部各构成部分所 占的比例。 百分比条图:以矩形总长度作为100%,将 其分割成不同长度的段表示各构成的比例
17% 14%
18%
31% 20%
• 结构相对数 :构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
• 相对比
甲指标/乙指标
2020/11/22
计算相对数的注意事项
• 结构相对数不能代替强度相对数(以 比代率)
• 计算相对数应有足够数量 • 正确计算合并率 • 注意资料的可比性 • 相对数的抽样误差
2020/11/22
脑血管病 恶性肿瘤 呼吸系统 心脏疾病 其它疾病
图4-10 2000年某省农村男性居民主要疾病死因构成 比
脱落
嵌入脱落
0%
20%
40%
60%
80%
构成比
成功 良好 较好 失败
图4-9 两种脱落牙再植效果的比较
100%
圆图
统计图_线图
线图:用线段的升降来表示数值的变化,适合于 描述某统计量随另一连续性数值变量变化而变 化的趋势 横轴表示时间或其他连续性变量, 纵轴表示统计指标
集中趋势的描述 –几何均数
• 公式
G n X1 X 2 X n
G lg1 (
lg X )
n
G lg1 (
f lg X )
f
2020/11/22
集中趋势的描述 –中位数
• n为奇数: • n为偶数:
M X ( n1) 2
1
M
2
X
(
n 2
)
X ( n 1) 2
M
P50
L50
i50 f50
统计图_直方图
以直方面积描述各组频 数的多少,面积的总和 相当于各组频数之和, 适合表示数值变量的频 数分布。
-横轴为数值变量值 -纵轴为频数
频数
25
20
15
10
5
0 90- 110- 130- 150- 170- 190- 210- 230- 250- 270血清总胆固醇(mg/dL) 图4-1 81名健康男子血清总胆固醇含量的频数分布图
普通线图:纵横轴都是算术尺度, 纵轴一般以0作起点
半对数线图:纵轴为对数尺度, 适宜作指标变化速度的比较