计量资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本均数用 x 表示,总体均数用μ表示
1、适用范围 对称分布,尤其是正态分布的资料
2020/10/12
LOGO
第二节 集中趋势的描述
二、几何均数(geometric mean, 简记为G)
1、适用资料: (1)等比级数资料 (血清抗体滴度资料) (2)对数正态分布资料 (微量元素资料)
2020/10/12
LOGO
第三讲
计量资料的统计分析
不同的资料类型,要用不
资料的类型 同的统计方法和指标
定量资料 定性资料 等级资料 举例:
身高体重
2020/10/12
治疗人数:100 有效人数: 85
化验结果: —:15人 +:35人 ++:46人 +++:25人
LOGO
第三讲 计量资料的统计分析 统计分析:
统计描述:集中趋势和离散趋势(均数与标准差) 统计推断:参数估计和假设检验(t检验)
2020/10/12
LOGO
2、中位数和百分位数的适用范围:
(1)偏态分布资料
(2)分布不明资料
(3)分布末端无确定值资料(开口 资料)
理论上,中位数和百分位数可用于 任何分布的计量资料, 但实际应用中常 用于偏态分布,特别是开口资料。
2020/10/12
LOGO
某市238名健康人发汞含量
开口资料
x1 x2 x3 x4 x5 x6 x7 x8 3 5 7 8 9 10 13 27
M
n为偶数时,
M=
x n x n1
2
2
2
2020/10/12
LOGO
集中趋势指标的选择判断步骤:
资料
2020/10/12
是
抗体滴度
G
否
是
偏态、开口
M
否
X
LOGO
第三节 计量资料的离散趋势指标
例:
甲组 26, 28, 30, 32, 34. x甲=30
缺点:与例数多少有关
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
1、计算公式:
原始数据的分布为偏态分布,但经 对数变换后的分布呈正态分布
LOGO
三、中位数(M)和百分位数(Px) 1、定义
中位数: 将一组观察值从小到大按顺序排列,位 次居中的观察值就是中位数。
在全部观察值中,大于和小于中位数的 观察值的个数相等。
2020/10/12
LOGO
第二节 集中趋势的描述
百分位数:将一组观察值从小到大按顺序排 列, 一个百分位数将全部观察值分为两部分, 理论上有x%的观察值比它小,有(100-x) %的观察值比它大。P50分位数也就是中位数。
这里先学习计量资料的统计分析
2020/10/12
LOGO
2020/10/12
LOGO
第一节 频数分布表和频数分布图
一、频数分布表
2020/10/12
LOGO
第一节 频数分布表和频数分布图
频数分布的特征 1、集中趋势:数据向某一数值集中的倾向 2、离散趋势:数据的数值大小不等的倾向
2020/10/12
1、计算公式: 四分位数间距Q=QU-QL P25:下四分位数,简记QL P75:上四分位数,简记QU
2、意义:中间一半观察值的极差,意义与R相似。 3、特点:(1) 比R稳定,但仍未考虑每一个观察
值的变异;
(2) 常用于描述偏态资料的离散度。
2020/10/12
LOGO
s σ 三、方差(总体方差简记 ,2 样本方差简记 2 ) (variance) 一组观察值的离均差平方和,取其均数, 即方差。 ∑(X-X)=0 (离均差和) ∑(X-X)2≠0 (离均差平方和)
LOGO
第一节 频数分布表和频数分布图 二、频数分布图
以观察变量(组段)为横轴,频数或频率为 纵轴绘制统计图。可直观地反映频数分布的 特征。
2020/10/12
LOGO
频数分布的类型
正态分布、对称分布 偏态分布
正偏态
2020/10/12
负偏态
LOGO
第一节 频数分布表和频数分布图
1、对称分布:集中位置(高峰)居中,左右两 侧频数分布大体对称,其中的正态分布是重要 的分布形式。 2、偏态分布:集中位置(高峰)不居中,偏向某 一侧。
一、极差(range)(全距)R
1、计算公式:R=最大值-最小值
2、意义:R愈大,离散度愈大
R愈小,离散度愈小
3、优点:计算简单,意义明了
4、缺点:(1)不能反映每一个观察值的变异
(2)样本例数越大,R可能越大
2020/10/12பைடு நூலகம்
(3)R抽样误差大,不稳定
LOGO
二、四分位数间距(quartile range)(简记QR)
(1)正偏态:集中位置(高峰)偏向数值较小的一侧。 (2)负偏态:集中位置(高峰)偏向数值较大的一侧。
2020/10/12
LOGO
第二节 集中趋势的描述 计量资料的统计描述指标
描述计量资料分布特征的指标
集中趋势指标
离散趋势指标
平均数
2020/10/12
R、Q、S、CV
LOGO
第二节 集中趋势的描述
乙组 24, 27, 30, 33, 36. x乙=30
丙组 26, 29, 30, 31, 34. x丙=30
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
反映离散程度的常用指标: 1、极差 2、四分位数间距 3、方差 4、标准差 5、变异系数
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
平均数(average)是描述一组定量资料集中趋 势的统计指标,常用于说明该组数据的平均 水平。
常用平均数的种类: 1、算术均数(arithmetic mean)(简称均数) 2、几何均数(geometric mean,G) 3、中位数(median)
2020/10/12
LOGO
一、算术均数(均数)
发汞值(μg/g) 〈0.3 0.3- 0.7- 1.1-
人数 3 17 66 60
1.5—
48
1.9—
18
2.3—
16
2.7—
6
3.1—
1
3.5—
1
≥3.9
2
2020/10/12
合计
238
偏态分布资料
LOGO
两组肝炎婴儿的血清总胆红素测定结果
总胆红素 (μmol/L) <17
17~ 80~ 160~ 240~ 320~ 400~ 合计
2020/10/12
人数
一般组 重症组
4
0
10
0
15
3
1
9
0
2
0
4
0
4
30 22
LOGO
3、计算方法:
(1)直接法:适用于观察数少资料
(中位数)
x n为奇数时, M=
n 1
2
x1 x2 x3 x4 x5 x6 x7 3, 4, 6, 7, 9, 10,26
2020/10/12
M
LOGO
第二节 集中趋势的描述
1、适用范围 对称分布,尤其是正态分布的资料
2020/10/12
LOGO
第二节 集中趋势的描述
二、几何均数(geometric mean, 简记为G)
1、适用资料: (1)等比级数资料 (血清抗体滴度资料) (2)对数正态分布资料 (微量元素资料)
2020/10/12
LOGO
第三讲
计量资料的统计分析
不同的资料类型,要用不
资料的类型 同的统计方法和指标
定量资料 定性资料 等级资料 举例:
身高体重
2020/10/12
治疗人数:100 有效人数: 85
化验结果: —:15人 +:35人 ++:46人 +++:25人
LOGO
第三讲 计量资料的统计分析 统计分析:
统计描述:集中趋势和离散趋势(均数与标准差) 统计推断:参数估计和假设检验(t检验)
2020/10/12
LOGO
2、中位数和百分位数的适用范围:
(1)偏态分布资料
(2)分布不明资料
(3)分布末端无确定值资料(开口 资料)
理论上,中位数和百分位数可用于 任何分布的计量资料, 但实际应用中常 用于偏态分布,特别是开口资料。
2020/10/12
LOGO
某市238名健康人发汞含量
开口资料
x1 x2 x3 x4 x5 x6 x7 x8 3 5 7 8 9 10 13 27
M
n为偶数时,
M=
x n x n1
2
2
2
2020/10/12
LOGO
集中趋势指标的选择判断步骤:
资料
2020/10/12
是
抗体滴度
G
否
是
偏态、开口
M
否
X
LOGO
第三节 计量资料的离散趋势指标
例:
甲组 26, 28, 30, 32, 34. x甲=30
缺点:与例数多少有关
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
1、计算公式:
原始数据的分布为偏态分布,但经 对数变换后的分布呈正态分布
LOGO
三、中位数(M)和百分位数(Px) 1、定义
中位数: 将一组观察值从小到大按顺序排列,位 次居中的观察值就是中位数。
在全部观察值中,大于和小于中位数的 观察值的个数相等。
2020/10/12
LOGO
第二节 集中趋势的描述
百分位数:将一组观察值从小到大按顺序排 列, 一个百分位数将全部观察值分为两部分, 理论上有x%的观察值比它小,有(100-x) %的观察值比它大。P50分位数也就是中位数。
这里先学习计量资料的统计分析
2020/10/12
LOGO
2020/10/12
LOGO
第一节 频数分布表和频数分布图
一、频数分布表
2020/10/12
LOGO
第一节 频数分布表和频数分布图
频数分布的特征 1、集中趋势:数据向某一数值集中的倾向 2、离散趋势:数据的数值大小不等的倾向
2020/10/12
1、计算公式: 四分位数间距Q=QU-QL P25:下四分位数,简记QL P75:上四分位数,简记QU
2、意义:中间一半观察值的极差,意义与R相似。 3、特点:(1) 比R稳定,但仍未考虑每一个观察
值的变异;
(2) 常用于描述偏态资料的离散度。
2020/10/12
LOGO
s σ 三、方差(总体方差简记 ,2 样本方差简记 2 ) (variance) 一组观察值的离均差平方和,取其均数, 即方差。 ∑(X-X)=0 (离均差和) ∑(X-X)2≠0 (离均差平方和)
LOGO
第一节 频数分布表和频数分布图 二、频数分布图
以观察变量(组段)为横轴,频数或频率为 纵轴绘制统计图。可直观地反映频数分布的 特征。
2020/10/12
LOGO
频数分布的类型
正态分布、对称分布 偏态分布
正偏态
2020/10/12
负偏态
LOGO
第一节 频数分布表和频数分布图
1、对称分布:集中位置(高峰)居中,左右两 侧频数分布大体对称,其中的正态分布是重要 的分布形式。 2、偏态分布:集中位置(高峰)不居中,偏向某 一侧。
一、极差(range)(全距)R
1、计算公式:R=最大值-最小值
2、意义:R愈大,离散度愈大
R愈小,离散度愈小
3、优点:计算简单,意义明了
4、缺点:(1)不能反映每一个观察值的变异
(2)样本例数越大,R可能越大
2020/10/12பைடு நூலகம்
(3)R抽样误差大,不稳定
LOGO
二、四分位数间距(quartile range)(简记QR)
(1)正偏态:集中位置(高峰)偏向数值较小的一侧。 (2)负偏态:集中位置(高峰)偏向数值较大的一侧。
2020/10/12
LOGO
第二节 集中趋势的描述 计量资料的统计描述指标
描述计量资料分布特征的指标
集中趋势指标
离散趋势指标
平均数
2020/10/12
R、Q、S、CV
LOGO
第二节 集中趋势的描述
乙组 24, 27, 30, 33, 36. x乙=30
丙组 26, 29, 30, 31, 34. x丙=30
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
反映离散程度的常用指标: 1、极差 2、四分位数间距 3、方差 4、标准差 5、变异系数
2020/10/12
LOGO
第三节 计量资料的离散趋势指标
平均数(average)是描述一组定量资料集中趋 势的统计指标,常用于说明该组数据的平均 水平。
常用平均数的种类: 1、算术均数(arithmetic mean)(简称均数) 2、几何均数(geometric mean,G) 3、中位数(median)
2020/10/12
LOGO
一、算术均数(均数)
发汞值(μg/g) 〈0.3 0.3- 0.7- 1.1-
人数 3 17 66 60
1.5—
48
1.9—
18
2.3—
16
2.7—
6
3.1—
1
3.5—
1
≥3.9
2
2020/10/12
合计
238
偏态分布资料
LOGO
两组肝炎婴儿的血清总胆红素测定结果
总胆红素 (μmol/L) <17
17~ 80~ 160~ 240~ 320~ 400~ 合计
2020/10/12
人数
一般组 重症组
4
0
10
0
15
3
1
9
0
2
0
4
0
4
30 22
LOGO
3、计算方法:
(1)直接法:适用于观察数少资料
(中位数)
x n为奇数时, M=
n 1
2
x1 x2 x3 x4 x5 x6 x7 3, 4, 6, 7, 9, 10,26
2020/10/12
M
LOGO
第二节 集中趋势的描述