2计量资料的统计描述
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
4.变异系数 变异系数(coefficient of variation CV) 变异系数
S (1)公式 公式: (1)公式: CV= ×100% X
(2)应用条件 应用条件: (2)应用条件: 均数相差较大时, 均数相差较大时,比较各组资料的变异程度。 度量衡单位不同时,比较各组资料的变异程度。 度量衡单位不同时,比较各组资料的变异程度。
7
(2)分组资料 )
im M = L + (n ⋅ 50% − fl ) fm
L:M 所在组的下限
im:M 所在组的组距
fl :M所在组前一组累积频数
fm :M 所在组的频数
计算M或Px时关键是找出 或Px所在组段 找出M或 所在组段,可由频数 找出 表计算累计频数或累计频率 累计频数或累计频率。 累计频数或累计频率 或累计频率略大于50%的组 累计频数略大于 n/2或累计频率略大于 或累计频率略大于 的组 段即为M所在组段 所在组段。 段即为 所在组段。 累计频数略大于n·x%或累计频率略大于 的组 或累计频率略大于x%的组 累计频数略大于 或累计频率略大于 段即为P 所在组段。 段即为 x所在组段。
fl :前一组累积频数
9
(三)离散程度的描述
1.全距(极差)(range R) 1.全距(极差)( )(range R) 全距
按间距计算
2.四分位数间距(quartile Q ) 2.四分位数间距 四分位数间距( 3.方差与标准差 (standard deviation S) 4.变异系数 (coefficient of variation CV) CV)
15
(四)参考值范围(reference value ranges)
绝大多数正常人的各种生理、生化、免疫及 组织代谢产物的含量等各种数据的波动范围
目的:临床实践 目的:
预防医学实践
制定参考值范围的方法 1.正态分布法 正态分布法 2.百分位数法 百分位数法
16
正态分布的特征
(1)正态分布在 (1)正态分布在
23
(2)常用键功能 常用键功能
贮存常数 Kin 1-6个常数贮存器,能贮存6个常数。 个常数贮存器,能贮存 个常数 个常数。 个常数贮存器 456789 Kin 6 贮存到 号箱 贮存到6号箱 Kout 贮存常数显示,在SD、LR模式下 贮存常数显示, 、 模式下 Kout 可显示 2 3 4 5 6下的黑体字内容。 可显示1 下的黑体字内容。 下的黑体字内容 Shift 第二功能键——换档键 换档键 第二功能键 所有黑色第一功能; 所有黑色第一功能;所有褐色第二功能 贮存到1号箱 如:123456 Kin 1 贮存到 号箱
实验二、 实验二、计量资料的统计描述
一、实习目的
1.掌握频数表的编制 1.掌握频数表的编制 2.掌握计量资料的描述指标的使用条件及计算方法 2.掌握计量资料的描述指标的使用条件及计算方法 3.熟悉正态分布的特征和估计医学参考值的方法 3.熟悉正态分布的特征和估计医学参考值的方法 4.了解计算器的常用模式,掌握其使用方法。 4.了解计算器的常用模式,掌握其使用方法。 了解计算器的常用模式
正态分布 集中趋势 离散程度 参考值范围 算术均数 标准差 正态分布法
对数正态分布 几何均数Fra bibliotek偏态分布 中位数 四分位间距
对数正态分布法
百分位数法
95%双侧界值 % 95%单侧上限 % 95%单侧下限 %
x ±1.96s
x +1.65s x −1.65s
P2.5~P97.5 P95 P5
20
计算器(CASIO fx-3600Pv)的应用 计算器 的应用
2.分类变量资料(计数资料) 分类变量资料(计数资料) 分类变量资料
观察指标是用定性的方法得到的。通常按事物的性质 观察指标是用定性的方法得到的。通常按事物的性质 定性的方法得到的 和类别分组,清点各组个数所得到的数值。 和类别分组,清点各组个数所得到的数值。如某人群的性 别男、女的人数。 别男、女的人数。 有序分类变量资料( 等级资料) 有序分类变量资料( ordinal categories 等级资料) 各类别之间有程度上的差别,且排列有序。 各类别之间有程度上的差别,且排列有序。 检验结果( ),疗效 有效,好转 无效) 检验结果(-,±,+,++),疗效(痊愈 有效 好转 无效) ),疗效(痊愈,有效 好转,无效
24
(2)常用键功能 常用键功能
开平方 Log 对数 Xy 乘任意次方 +/- 正负号 1/x 倒数 ENG指数成三倍增加 指数成三倍增加 RAN#随机数字发生 X2 平方 10x 反对数 x1/y 开任意次方
ix 2)公式: px = L + )公式: (n × x% − fl ) fx
单 侧
表 3.2 常用参考值范围所对应的百分位数 Px 双 侧 下 限 P10 P5 P2.5 P0.5 上 限 P90 P95 P97.5 P99.5
19
参考值范围( ) 参考值范围(%) 下 限 80 90 95 99 P20 P10 P5 P1 上 限 P80 P90 P95 P99
4
1.算术均数(mean)简称均数 算术均数( 算术均数 )
总体均数:µ 样本均数: X
适用条件:对称分布,特别是正态分布的资料。 适用条件:对称分布,特别是正态分布的资料。
Σxi 计算公式: 计算公式: (1)未分组资料 X = n
(2)分组资料(大样本)
直接法 加权法
f1x1 + f2 x2 + ... + fn xn Σf i xi = X= n n
1
二、理论复习
医学统计工作的主要内容 (一)统计资料的类型 (二)集中趋势的描述 (三)离散程度的描述 (四)参考值范围的制定 计算器的常用模式及使用方法
2
(一)统计资料的类型 1.数值变量资料(计量资料) 数值变量资料(计量资料) 数值变量资料
观察指标是用定量方法测定其数值大小所得的资料, 观察指标是用定量方法测定其数值大小所得的资料, 定量方法测定其数值大小所得的资料 通常有度量衡单位。如身高(cm)、体重 通常有度量衡单位。如身高 、体重(kg)等。 等
5
2.几何均数(geometric mean) 几何均数( 几何均数
G = n X1 X2...Xn
适用条件:对数正态分布及等比关系资料 适用条件: 抗体滴度、血清凝集效价、 抗体滴度、血清凝集效价、物质浓度等 计算方法 常改用对数形式计算
n f −1 Σ i lg xi G = lg ( ) n
2 2
n-1 随机变量能“自由”取值的个数 随机变量能“自由”
13
标准差的意义 在均数相近和度量单位相同的条件下, 在均数相近和度量单位相同的条件下, 标准差是描述变量值变异程度的指标。 标准差是描述变量值变异程度的指标。
标准差大 标准差小
变异程度大 变异程度小
均数的代表性差 均数的代表性好
标准差的用途 1.表示变异程度的大小 1.表示变异程度的大小 2.计算标准误、 2.计算标准误、变异系数 计算标准误 3.估计参考值范围 3.估计参考值范围
21
⑴ 计算模式选择
MODE MODE MODE MODE MODE MODE 4 5 6 7 8 9 DEG RAD GAR FIX SCI NORM 角度计算 孤度计算 梯度计算 指定小数有效位数 科学运算 解除7、 二模式 解除 、8二模式 恢复初始状态。 恢复初始状态。
22
(2)常用键功能 常用键功能
3
(二)集中趋势的描述
平均数( 平均数(average)的概念 ) 描述一组同质数值变量的集中位置或平均水平 作用: 描述集中趋势 作用:(1)描述集中趋势 (2)作为一组资料的代表值用于分析和组间比较 作为一组资料的代表值用于分析和组间比较
算术均数( 算术均数(mean) ) 几何均数 (geometric mean) 中位数 (median)
µσ
u=
x − µ 变换
再根据正态分布曲线下面积分布规律用正态分布法可 制定参考值范围
17
1.正态分布法 正态分布法 1)条件:服从正态分布 )条件: 或经变量转换后服从正态分布的资料, 或经变量转换后服从正态分布的资料,n>50。 。 2)公式:x ± u )公式:
αs
95%参考值范围 %
表 3.3
清除数据 AC C 清除全部运算过程,自动关闭后开。 清除全部运算过程,自动关闭后开。 清除显示屏上数据,不清除内存。 清除显示屏上数据,不清除内存。
KAC SHIFT AC 清除贮存及SD、LR模式下输入数据。 模式下输入数据。 清除贮存及 、 模式下输入数据 需在MODE 9 NORM状态下 独立贮存 需在 状态下 M+ 贮存累加 M贮存累减 MR 贮存数的显示 Shift MR 清除内存
1.计算器的常用模式、常用键的功用 计算器的常用模式、 计算器的常用模式
电源: 自动关机, 电源:开关 AC/ON 6min自动关机, 自动关机
⑴ 计算模式选择
MODE • RUN 一般计算 MODE EXP LRN 编程序状态 BIN 二进制 MODE 0 BASE-N 进制模式 OCT 六进制 MODE 1 ∫dx DEC 十进制 微积分 MODE 2 LR 进行相关回归运算 MODE 3 SD 进行统计运算
G = lg
−1
∑lg x ) (
i
6
3.中位数(median)M 中位数( )
将一组观察值从小到大排列,居中心位置的数值。 偏态分布资料
如传染病的潜伏期、住院天数等
适用条件 分布类型不明、特大特小 一端或两端无确定数据
计算公式:
(1)未分组资料 ) n:奇数 n:偶数
M = X n+1
2
1 M = (X n + X n ) ( +1) 2 2 2
x=µ
处有一个高峰 决定, µ 和形状参数 σ决定,
(2)正态分布由位置参数 (2)正态分布由位置参数
越大,曲线越“矮胖” σ 越大,曲线越“矮胖”; 越小,曲线越“瘦高” σ 越小,曲线越“瘦高”。
(3)任何正态分布 ( (3)任何正态分布 N( , 2 经过 )
σ 后成为标准正态分布 N(0,1)表示。 ( , )表示。
按平均差 距计算
10
Back
1.全距(极差 ) R = Xmax- Xmin 全距( R大→变异程度大,R小→变异程度小 变异程度大,R 应用条件:任何资料 应用条件: 优点:简单明了 优点:简单明了 缺点:只考虑了最大、最小值 缺点:只考虑了最大、最小值 抽样误差大,不稳定
11
2.四分位数间距(Q) 即P75 与P25之差 四分位数间距( 应用条件: 应用条件:偏态分布资料或 分布一端或两端无确切数值的资料 P25:1/4的观察值小于它,称下四分位数。 P25~QL 1/4的观察值小于它 称下四分位数。 的观察值小于它, P75:1/4的观察值大于它,称上四分位数。 P75~QU 的观察值大于它,称上四分位数。 其间包含了中间的50%变量值。 所以, 所以,Q=QU-QL , 其间包含了中间的50%变量值。 Q值大→变异程度大,Q小→变异程度小。 值大→变异程度大, 变异程度小。 稳定性比极差好仍未考虑全部观察值的变异度。 稳定性比极差好仍未考虑全部观察值的变异度。
12
3.标准差 3.标准差(standard deviation) 标准差 总体标准差 样本标准差
Σ( X − µ)2 σ= n
Σ( X − X ) S= n −1
2
2
小样本 X:变量值 变量值
(ΣX ) ΣX − n S= n −1
2
大样本 X:组中值 组中值
(ΣfX ) ΣfX − n S= n −1
8
百分位数( 百分位数(percentile) )
是一种位置标志,以
P 表示。X即百分位 x
L:下限
用于描述样本或总体的变量值序列在某百分位置的水平
ix Px = L + (n× x% − fl ) fx
f :频数
x
P x
M =P 50
ix: 组距
n : 例数
im M = L+ (n ⋅ 50% − fl ) fm
参考值范围(%) 参考值范围( )
为标准正态分布的u界值 uα 为标准正态分布的 界值 双侧界限 x ±1.96s 单侧上界
x +1.65s
下界
x −1.65s
常用 U 值表
单 侧 双 侧
80 90 95 99
0.84 1.28 1.65 2.33
1.28 1.64 1.96 2.58
18
2.百分位数法 百分位数法 1)条件:任何分布或分布不明的资料,n>150 )条件:任何分布或分布不明的资料,
4.变异系数 变异系数(coefficient of variation CV) 变异系数
S (1)公式 公式: (1)公式: CV= ×100% X
(2)应用条件 应用条件: (2)应用条件: 均数相差较大时, 均数相差较大时,比较各组资料的变异程度。 度量衡单位不同时,比较各组资料的变异程度。 度量衡单位不同时,比较各组资料的变异程度。
7
(2)分组资料 )
im M = L + (n ⋅ 50% − fl ) fm
L:M 所在组的下限
im:M 所在组的组距
fl :M所在组前一组累积频数
fm :M 所在组的频数
计算M或Px时关键是找出 或Px所在组段 找出M或 所在组段,可由频数 找出 表计算累计频数或累计频率 累计频数或累计频率。 累计频数或累计频率 或累计频率略大于50%的组 累计频数略大于 n/2或累计频率略大于 或累计频率略大于 的组 段即为M所在组段 所在组段。 段即为 所在组段。 累计频数略大于n·x%或累计频率略大于 的组 或累计频率略大于x%的组 累计频数略大于 或累计频率略大于 段即为P 所在组段。 段即为 x所在组段。
fl :前一组累积频数
9
(三)离散程度的描述
1.全距(极差)(range R) 1.全距(极差)( )(range R) 全距
按间距计算
2.四分位数间距(quartile Q ) 2.四分位数间距 四分位数间距( 3.方差与标准差 (standard deviation S) 4.变异系数 (coefficient of variation CV) CV)
15
(四)参考值范围(reference value ranges)
绝大多数正常人的各种生理、生化、免疫及 组织代谢产物的含量等各种数据的波动范围
目的:临床实践 目的:
预防医学实践
制定参考值范围的方法 1.正态分布法 正态分布法 2.百分位数法 百分位数法
16
正态分布的特征
(1)正态分布在 (1)正态分布在
23
(2)常用键功能 常用键功能
贮存常数 Kin 1-6个常数贮存器,能贮存6个常数。 个常数贮存器,能贮存 个常数 个常数。 个常数贮存器 456789 Kin 6 贮存到 号箱 贮存到6号箱 Kout 贮存常数显示,在SD、LR模式下 贮存常数显示, 、 模式下 Kout 可显示 2 3 4 5 6下的黑体字内容。 可显示1 下的黑体字内容。 下的黑体字内容 Shift 第二功能键——换档键 换档键 第二功能键 所有黑色第一功能; 所有黑色第一功能;所有褐色第二功能 贮存到1号箱 如:123456 Kin 1 贮存到 号箱
实验二、 实验二、计量资料的统计描述
一、实习目的
1.掌握频数表的编制 1.掌握频数表的编制 2.掌握计量资料的描述指标的使用条件及计算方法 2.掌握计量资料的描述指标的使用条件及计算方法 3.熟悉正态分布的特征和估计医学参考值的方法 3.熟悉正态分布的特征和估计医学参考值的方法 4.了解计算器的常用模式,掌握其使用方法。 4.了解计算器的常用模式,掌握其使用方法。 了解计算器的常用模式
正态分布 集中趋势 离散程度 参考值范围 算术均数 标准差 正态分布法
对数正态分布 几何均数Fra bibliotek偏态分布 中位数 四分位间距
对数正态分布法
百分位数法
95%双侧界值 % 95%单侧上限 % 95%单侧下限 %
x ±1.96s
x +1.65s x −1.65s
P2.5~P97.5 P95 P5
20
计算器(CASIO fx-3600Pv)的应用 计算器 的应用
2.分类变量资料(计数资料) 分类变量资料(计数资料) 分类变量资料
观察指标是用定性的方法得到的。通常按事物的性质 观察指标是用定性的方法得到的。通常按事物的性质 定性的方法得到的 和类别分组,清点各组个数所得到的数值。 和类别分组,清点各组个数所得到的数值。如某人群的性 别男、女的人数。 别男、女的人数。 有序分类变量资料( 等级资料) 有序分类变量资料( ordinal categories 等级资料) 各类别之间有程度上的差别,且排列有序。 各类别之间有程度上的差别,且排列有序。 检验结果( ),疗效 有效,好转 无效) 检验结果(-,±,+,++),疗效(痊愈 有效 好转 无效) ),疗效(痊愈,有效 好转,无效
24
(2)常用键功能 常用键功能
开平方 Log 对数 Xy 乘任意次方 +/- 正负号 1/x 倒数 ENG指数成三倍增加 指数成三倍增加 RAN#随机数字发生 X2 平方 10x 反对数 x1/y 开任意次方
ix 2)公式: px = L + )公式: (n × x% − fl ) fx
单 侧
表 3.2 常用参考值范围所对应的百分位数 Px 双 侧 下 限 P10 P5 P2.5 P0.5 上 限 P90 P95 P97.5 P99.5
19
参考值范围( ) 参考值范围(%) 下 限 80 90 95 99 P20 P10 P5 P1 上 限 P80 P90 P95 P99
4
1.算术均数(mean)简称均数 算术均数( 算术均数 )
总体均数:µ 样本均数: X
适用条件:对称分布,特别是正态分布的资料。 适用条件:对称分布,特别是正态分布的资料。
Σxi 计算公式: 计算公式: (1)未分组资料 X = n
(2)分组资料(大样本)
直接法 加权法
f1x1 + f2 x2 + ... + fn xn Σf i xi = X= n n
1
二、理论复习
医学统计工作的主要内容 (一)统计资料的类型 (二)集中趋势的描述 (三)离散程度的描述 (四)参考值范围的制定 计算器的常用模式及使用方法
2
(一)统计资料的类型 1.数值变量资料(计量资料) 数值变量资料(计量资料) 数值变量资料
观察指标是用定量方法测定其数值大小所得的资料, 观察指标是用定量方法测定其数值大小所得的资料, 定量方法测定其数值大小所得的资料 通常有度量衡单位。如身高(cm)、体重 通常有度量衡单位。如身高 、体重(kg)等。 等
5
2.几何均数(geometric mean) 几何均数( 几何均数
G = n X1 X2...Xn
适用条件:对数正态分布及等比关系资料 适用条件: 抗体滴度、血清凝集效价、 抗体滴度、血清凝集效价、物质浓度等 计算方法 常改用对数形式计算
n f −1 Σ i lg xi G = lg ( ) n
2 2
n-1 随机变量能“自由”取值的个数 随机变量能“自由”
13
标准差的意义 在均数相近和度量单位相同的条件下, 在均数相近和度量单位相同的条件下, 标准差是描述变量值变异程度的指标。 标准差是描述变量值变异程度的指标。
标准差大 标准差小
变异程度大 变异程度小
均数的代表性差 均数的代表性好
标准差的用途 1.表示变异程度的大小 1.表示变异程度的大小 2.计算标准误、 2.计算标准误、变异系数 计算标准误 3.估计参考值范围 3.估计参考值范围
21
⑴ 计算模式选择
MODE MODE MODE MODE MODE MODE 4 5 6 7 8 9 DEG RAD GAR FIX SCI NORM 角度计算 孤度计算 梯度计算 指定小数有效位数 科学运算 解除7、 二模式 解除 、8二模式 恢复初始状态。 恢复初始状态。
22
(2)常用键功能 常用键功能
3
(二)集中趋势的描述
平均数( 平均数(average)的概念 ) 描述一组同质数值变量的集中位置或平均水平 作用: 描述集中趋势 作用:(1)描述集中趋势 (2)作为一组资料的代表值用于分析和组间比较 作为一组资料的代表值用于分析和组间比较
算术均数( 算术均数(mean) ) 几何均数 (geometric mean) 中位数 (median)
µσ
u=
x − µ 变换
再根据正态分布曲线下面积分布规律用正态分布法可 制定参考值范围
17
1.正态分布法 正态分布法 1)条件:服从正态分布 )条件: 或经变量转换后服从正态分布的资料, 或经变量转换后服从正态分布的资料,n>50。 。 2)公式:x ± u )公式:
αs
95%参考值范围 %
表 3.3
清除数据 AC C 清除全部运算过程,自动关闭后开。 清除全部运算过程,自动关闭后开。 清除显示屏上数据,不清除内存。 清除显示屏上数据,不清除内存。
KAC SHIFT AC 清除贮存及SD、LR模式下输入数据。 模式下输入数据。 清除贮存及 、 模式下输入数据 需在MODE 9 NORM状态下 独立贮存 需在 状态下 M+ 贮存累加 M贮存累减 MR 贮存数的显示 Shift MR 清除内存
1.计算器的常用模式、常用键的功用 计算器的常用模式、 计算器的常用模式
电源: 自动关机, 电源:开关 AC/ON 6min自动关机, 自动关机
⑴ 计算模式选择
MODE • RUN 一般计算 MODE EXP LRN 编程序状态 BIN 二进制 MODE 0 BASE-N 进制模式 OCT 六进制 MODE 1 ∫dx DEC 十进制 微积分 MODE 2 LR 进行相关回归运算 MODE 3 SD 进行统计运算
G = lg
−1
∑lg x ) (
i
6
3.中位数(median)M 中位数( )
将一组观察值从小到大排列,居中心位置的数值。 偏态分布资料
如传染病的潜伏期、住院天数等
适用条件 分布类型不明、特大特小 一端或两端无确定数据
计算公式:
(1)未分组资料 ) n:奇数 n:偶数
M = X n+1
2
1 M = (X n + X n ) ( +1) 2 2 2
x=µ
处有一个高峰 决定, µ 和形状参数 σ决定,
(2)正态分布由位置参数 (2)正态分布由位置参数
越大,曲线越“矮胖” σ 越大,曲线越“矮胖”; 越小,曲线越“瘦高” σ 越小,曲线越“瘦高”。
(3)任何正态分布 ( (3)任何正态分布 N( , 2 经过 )
σ 后成为标准正态分布 N(0,1)表示。 ( , )表示。
按平均差 距计算
10
Back
1.全距(极差 ) R = Xmax- Xmin 全距( R大→变异程度大,R小→变异程度小 变异程度大,R 应用条件:任何资料 应用条件: 优点:简单明了 优点:简单明了 缺点:只考虑了最大、最小值 缺点:只考虑了最大、最小值 抽样误差大,不稳定
11
2.四分位数间距(Q) 即P75 与P25之差 四分位数间距( 应用条件: 应用条件:偏态分布资料或 分布一端或两端无确切数值的资料 P25:1/4的观察值小于它,称下四分位数。 P25~QL 1/4的观察值小于它 称下四分位数。 的观察值小于它, P75:1/4的观察值大于它,称上四分位数。 P75~QU 的观察值大于它,称上四分位数。 其间包含了中间的50%变量值。 所以, 所以,Q=QU-QL , 其间包含了中间的50%变量值。 Q值大→变异程度大,Q小→变异程度小。 值大→变异程度大, 变异程度小。 稳定性比极差好仍未考虑全部观察值的变异度。 稳定性比极差好仍未考虑全部观察值的变异度。
12
3.标准差 3.标准差(standard deviation) 标准差 总体标准差 样本标准差
Σ( X − µ)2 σ= n
Σ( X − X ) S= n −1
2
2
小样本 X:变量值 变量值
(ΣX ) ΣX − n S= n −1
2
大样本 X:组中值 组中值
(ΣfX ) ΣfX − n S= n −1
8
百分位数( 百分位数(percentile) )
是一种位置标志,以
P 表示。X即百分位 x
L:下限
用于描述样本或总体的变量值序列在某百分位置的水平
ix Px = L + (n× x% − fl ) fx
f :频数
x
P x
M =P 50
ix: 组距
n : 例数
im M = L+ (n ⋅ 50% − fl ) fm
参考值范围(%) 参考值范围( )
为标准正态分布的u界值 uα 为标准正态分布的 界值 双侧界限 x ±1.96s 单侧上界
x +1.65s
下界
x −1.65s
常用 U 值表
单 侧 双 侧
80 90 95 99
0.84 1.28 1.65 2.33
1.28 1.64 1.96 2.58
18
2.百分位数法 百分位数法 1)条件:任何分布或分布不明的资料,n>150 )条件:任何分布或分布不明的资料,