计量资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 纵坐标:为频数f,必须从0开始(f为每一组段内的人数)
❖直条
▪ 直条的宽度:组距 ▪ 直条的高度:每一组段的频数
❖累计
2020/6/19
15
2.绘制频数分布直方图
2020/6/19
16
2.绘制频数分布直方图
2020/6/19
17
3、频数分布的特征
从频数表可以看到频数分布的两个重要的特征 ❖ 集中趋势(central tendency)
第十一章 资料的描述性分析
第十一章 资料的描述性分析
❖第一节 计量资料的统计描述方法 ❖第二节 计数资料的统计描述方法
❖ 统计图表
2020/6/19
2
第一节 计量资料的统计描述方法
❖ 常用的描述定量资料分布规律的统计方法 有两类:
▪ 统计图表:频数分布表/图 ▪ 选用适当的统计指标:
• 集中趋势指标:均数、中位数 • 离散趋势指标:极差、标准差
▪ 直接法: ▪ 频数表法:
❖应用: 正态分布或近似正态分布资料
2020/6/19
25
1.算术均数
计算方法
❖ 直接法:即将所有观察值x1,x2,x3,…,xn直接相加 再除以观察值的个数,写成公式
x x1 x2 x3 ... xn xi
▪ 血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居 多,是为集中趋势。
❖ 离散趋势(tendency of dispersion)
▪ 从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频 数分布逐渐减少,是为离散趋势。
❖ 集中趋势和离散趋势是频数分布的两个重要侧面,从这两 方面就可全面的分析所研究的事物。
2020/6/19
18
4.频数分布的类型
频数分布又可分为对称分布和偏态分布 ❖对称分布:集中位置在正中,左右两侧频数分布
大体对称
❖偏态分布:集中位置偏向一侧,频数分布不对称
▪ 正偏态分布:集中位置偏向年龄小的一侧 ▪ 负偏态分布:集中位置偏向年龄大的一侧
❖ 不同类型的分布,应采用相应的统计分析方 法。
2020/6/19
3
第一节 数值变量资料的频数分布
❖频数分布表( frequency distribution table ): 将变量值化分为若干个组段,清点并记录各组段 变量值的个数,称为频数表(frequency table ) 。
2020/6/19
4
第一节 数值变量资料的频数分布
最小 值
限,不包含上限。 例8.1 第一组段为3.60~ 即[3.60,3.80);以此类推。 ▪ 最后一组段,须包括最大值,且要列出这一组段的下限和
上限,即5.40~5.60, [5.40,5.60]
2020/6/19
8
1. 频数表的编制步骤 列出各组段
第一组段
Байду номын сангаас
2020/6/19
最后一组段
9
1. 频数表的编制步骤
2020/6/19
19
4.频数分布的类型
正态分布
正态分布 ( normal distribution )
中间高、两边低、左右对称 属于对称分布的一种 许多医学资料都属于这种分布, 例如人体正常的生理生化指标
2020/6/19
20
4.频数分布的类型
2020/6/19
a.尖峭峰 b.正态峰 c.平阔峰
每组的频数 样本含量
2020/6/19
12
1. 频数表的编制步骤
(3)列表划记
计算出每个组段的 累计频率 =本组段的频率+ 上一组段的累计频 率
2020/6/19
13
1. 频数表的编制步骤
2020/6/19
14
2.绘制频数分布直方图
绘制频数分布直方图 ❖坐标轴
▪ 横坐标:变量值即研究指标,无需从0开始,以单位尺度 划分。
21
4.频数分布的类型
正偏态分布
(positive skewed)
正偏态分布:峰偏左,尾部向右侧延伸 如:以儿童为主的传染病发病人数的分布 右偏态
负偏态分布
(negative skewed)
2020/6/19
负偏态分布:峰偏右,尾部向左侧延伸 如:以老年人为主的慢性病发病人数的分布 左偏态
22
5.频数表的用途
以上统称为平均数(average)常用于描述一组 变量值的集中位置,代表其平均水平或是集中 位置的特征值。
2020/6/19
24
1.算术均数
(arithmetic mean)
又简称为均数(mean) ❖定义:是反映一组观察值在数量上的平均水平。
▪ 总体均数用希腊字母 表示,样本均数用 x 表示
❖计算方法:
最 大 值
2020/6/19
5
第一节 数值变量资料的频数分布
1. 频数表的编制步骤
❖(1)求数据的极差: 极差(range)是全部数
据中的最大值与最小值之差,它描述了数据的变 异幅度。
公式:R=XMax-XMin 例8.1: XMax =5.59
XMin =3.60
R=5.59-3.60=1.99
(2)划分组段 ❖ 确定各组段的上下限:
▪ 每个组段的起点称为该组的下限(low limit), 终点称为上 限(upper limit), 上限=下限+组距;
▪ 第一组段必须包括最小值,因此其下限取包含最小值、较 为整齐的数值;
例8.1 第一组段下限为 3.60,上限为3.60+0.20=3.80 ▪ 各组段不能重叠,每一组段均为半开半闭区间,即包括下
2020/6/19
6
1. 频数表的编制步骤
(2)划分组段 ❖ 确定组数:
n>100,10~15组;n<100,8~10组 ❖ 确定组距:
▪ 组距可以相等也可以不相等,一般采用等距分组, ▪ 组距=极差/组数 例8.1 1.99/10≈2,故组距=2mmol/L
2020/6/19
7
1. 频数表的编制步骤
❖ 频数表可揭示资料的分布特征和分布类型 ❖ 便于进一步计算统计指标和统计分析处理(第二节) ❖ 便于发现某些特大或特小可疑值,便于资料的校对。
2020/6/19
23
一、集中趋势指标
❖算术均数(arithmetic mean) ❖几何均数(geometric mean) ❖中位数和百分位数(median percentile)
(3)列表划记 ❖
将原始数据一一对 应入每个组段,通 过划“正” 字,来 统计每个组段内的 数据
2020/6/19
10
1. 频数表的编制步骤 (3)列表划记
统计每个组段内的 频数(例数) 频数的合计数等于 样本含量
2020/6/19
11
1. 频数表的编制步骤 (3)列表划记
计算出每个组段的 频率
❖直条
▪ 直条的宽度:组距 ▪ 直条的高度:每一组段的频数
❖累计
2020/6/19
15
2.绘制频数分布直方图
2020/6/19
16
2.绘制频数分布直方图
2020/6/19
17
3、频数分布的特征
从频数表可以看到频数分布的两个重要的特征 ❖ 集中趋势(central tendency)
第十一章 资料的描述性分析
第十一章 资料的描述性分析
❖第一节 计量资料的统计描述方法 ❖第二节 计数资料的统计描述方法
❖ 统计图表
2020/6/19
2
第一节 计量资料的统计描述方法
❖ 常用的描述定量资料分布规律的统计方法 有两类:
▪ 统计图表:频数分布表/图 ▪ 选用适当的统计指标:
• 集中趋势指标:均数、中位数 • 离散趋势指标:极差、标准差
▪ 直接法: ▪ 频数表法:
❖应用: 正态分布或近似正态分布资料
2020/6/19
25
1.算术均数
计算方法
❖ 直接法:即将所有观察值x1,x2,x3,…,xn直接相加 再除以观察值的个数,写成公式
x x1 x2 x3 ... xn xi
▪ 血糖值向中央部分(中等水平)集中,以中等水平的血糖值者居 多,是为集中趋势。
❖ 离散趋势(tendency of dispersion)
▪ 从中央部分到两侧(血糖值从中等水平到较低或较高水平)的频 数分布逐渐减少,是为离散趋势。
❖ 集中趋势和离散趋势是频数分布的两个重要侧面,从这两 方面就可全面的分析所研究的事物。
2020/6/19
18
4.频数分布的类型
频数分布又可分为对称分布和偏态分布 ❖对称分布:集中位置在正中,左右两侧频数分布
大体对称
❖偏态分布:集中位置偏向一侧,频数分布不对称
▪ 正偏态分布:集中位置偏向年龄小的一侧 ▪ 负偏态分布:集中位置偏向年龄大的一侧
❖ 不同类型的分布,应采用相应的统计分析方 法。
2020/6/19
3
第一节 数值变量资料的频数分布
❖频数分布表( frequency distribution table ): 将变量值化分为若干个组段,清点并记录各组段 变量值的个数,称为频数表(frequency table ) 。
2020/6/19
4
第一节 数值变量资料的频数分布
最小 值
限,不包含上限。 例8.1 第一组段为3.60~ 即[3.60,3.80);以此类推。 ▪ 最后一组段,须包括最大值,且要列出这一组段的下限和
上限,即5.40~5.60, [5.40,5.60]
2020/6/19
8
1. 频数表的编制步骤 列出各组段
第一组段
Байду номын сангаас
2020/6/19
最后一组段
9
1. 频数表的编制步骤
2020/6/19
19
4.频数分布的类型
正态分布
正态分布 ( normal distribution )
中间高、两边低、左右对称 属于对称分布的一种 许多医学资料都属于这种分布, 例如人体正常的生理生化指标
2020/6/19
20
4.频数分布的类型
2020/6/19
a.尖峭峰 b.正态峰 c.平阔峰
每组的频数 样本含量
2020/6/19
12
1. 频数表的编制步骤
(3)列表划记
计算出每个组段的 累计频率 =本组段的频率+ 上一组段的累计频 率
2020/6/19
13
1. 频数表的编制步骤
2020/6/19
14
2.绘制频数分布直方图
绘制频数分布直方图 ❖坐标轴
▪ 横坐标:变量值即研究指标,无需从0开始,以单位尺度 划分。
21
4.频数分布的类型
正偏态分布
(positive skewed)
正偏态分布:峰偏左,尾部向右侧延伸 如:以儿童为主的传染病发病人数的分布 右偏态
负偏态分布
(negative skewed)
2020/6/19
负偏态分布:峰偏右,尾部向左侧延伸 如:以老年人为主的慢性病发病人数的分布 左偏态
22
5.频数表的用途
以上统称为平均数(average)常用于描述一组 变量值的集中位置,代表其平均水平或是集中 位置的特征值。
2020/6/19
24
1.算术均数
(arithmetic mean)
又简称为均数(mean) ❖定义:是反映一组观察值在数量上的平均水平。
▪ 总体均数用希腊字母 表示,样本均数用 x 表示
❖计算方法:
最 大 值
2020/6/19
5
第一节 数值变量资料的频数分布
1. 频数表的编制步骤
❖(1)求数据的极差: 极差(range)是全部数
据中的最大值与最小值之差,它描述了数据的变 异幅度。
公式:R=XMax-XMin 例8.1: XMax =5.59
XMin =3.60
R=5.59-3.60=1.99
(2)划分组段 ❖ 确定各组段的上下限:
▪ 每个组段的起点称为该组的下限(low limit), 终点称为上 限(upper limit), 上限=下限+组距;
▪ 第一组段必须包括最小值,因此其下限取包含最小值、较 为整齐的数值;
例8.1 第一组段下限为 3.60,上限为3.60+0.20=3.80 ▪ 各组段不能重叠,每一组段均为半开半闭区间,即包括下
2020/6/19
6
1. 频数表的编制步骤
(2)划分组段 ❖ 确定组数:
n>100,10~15组;n<100,8~10组 ❖ 确定组距:
▪ 组距可以相等也可以不相等,一般采用等距分组, ▪ 组距=极差/组数 例8.1 1.99/10≈2,故组距=2mmol/L
2020/6/19
7
1. 频数表的编制步骤
❖ 频数表可揭示资料的分布特征和分布类型 ❖ 便于进一步计算统计指标和统计分析处理(第二节) ❖ 便于发现某些特大或特小可疑值,便于资料的校对。
2020/6/19
23
一、集中趋势指标
❖算术均数(arithmetic mean) ❖几何均数(geometric mean) ❖中位数和百分位数(median percentile)
(3)列表划记 ❖
将原始数据一一对 应入每个组段,通 过划“正” 字,来 统计每个组段内的 数据
2020/6/19
10
1. 频数表的编制步骤 (3)列表划记
统计每个组段内的 频数(例数) 频数的合计数等于 样本含量
2020/6/19
11
1. 频数表的编制步骤 (3)列表划记
计算出每个组段的 频率