计量资料的统计分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Average Number
平均数指标
平均数( 平均数(average) ) 是描述一群同质变量值集 是描述一群同质变量值集
中位置的特征值,用以说明同类现象或事物数量的 中位置的特征值, 的特征值 中等水平(集中趋势)。 中等水平(集中趋势)。
算术均数、 常用的有算术均数 中位数、众数、 常用的有算术均数、中位数、众数、几何均数等
计数 计量
计数 等级
等级 计数
计量
计量
实例( 实例(二)
城市脑力劳动者调查资料部分指标摘录
风 族 重 数 高 班 劳 强 紧 程 心 体 指 身 制 动 度 张 度 率 嗜 肉 肥 史 收 压 舒 压 中 家 史 缩 张 10) ( ) ( ) 3) ( ) 1 2 ( 4 () () () 5 6 7 () () 8 9 ( ) 10 1 12.24 1.62 1 1 3 70 146 90 有 16.47 1.63 15.19 1.64 15.59 1.63 12.60 1.64 ┆ ┆ 3 1 1 3 ┆ 1 2 1 1 ┆ 3 2 3 3 ┆ 72 72 84 68 ┆ 0 0 1 1 ┆ 110 100 114 116 ┆ 70 70 70 68 ┆ 无 无 无 无 ┆
计数资料(或无序分类变量) 计数资料(或无序分类变量)
定义: 1 . 定义 : 将观察单位按某种属性或类别分组计 数,得到各组观察单位数称为计数资料。 得到各组观察单位数称为计数资料。 2 . 特点 : 计数排列是无序分组 , 同组各观察单 特点: 计数排列是无序分组, 位之间没有量的差别, 但各组间有质的不同, 位之间没有量的差别 , 但各组间有质的不同 , 不同 质的观察单位不能归入一组。 质的观察单位不能归入一组。 变量值是定性的, 变量值是定性的,表现为互不相容的属性或类别 二项分类和多项分类
均数、中位数、 均数、中位数、众数三者关系
正态分布时: 均数=中位数= 均数=中位数=众数
Biblioteka Baidu
正偏态分布时:均数 中位数 众数 均数>中位数 均数 中位数>众数 负偏态分布时:均数 中位数 众数 均数<中位数 均数 中位数<众数
在计算和应用平均数指标时的注意事项
1.同质事物或现象才能求平均数 2.要根据数据分布类型正确选用平均数 要与下一节的离散趋势分析相结合, 3.要与下一节的离散趋势分析相结合 ,以弥补反 映不出差异和易受极端值影响的缺陷。 映不出差异和易受极端值影响的缺陷。
∑log x G = log n
−1
式中logx表示对观察值 求对数,log-1 为相 式中 表示对观察值x求对数, 表示对观察值 求对数 应对数的反对数。 应对数的反对数。
几何均数就是变量对数值的算术均数的反对数。 几何均数就是变量对数值的算术均数的反对数 。
实例
1.定义:测定每个观察单位的某项指标量的大小, 1.定义:测定每个观察单位的某项指标量的大小, 定义 所得的资料称为计量资料。其变量值是定量的, 所得的资料称为计量资料。其变量值是定量的,表 现为数值大小,一般带有度量衡或其它单位。 现为数值大小,一般带有度量衡或其它单位。 特点:每个观察单位的观察值之间有量的区别。 2.特点 :每个观察单位的观察值之间有量的区别 。
资料的转化
根据分析的需要,变量可以转化, 根据分析的需要,变量可以转化,但只能由高 级向低级转化。连续型→有序→分类→ 级向低级转化。连续型→有序→分类→二值 血红蛋白( 血红蛋白(g/dl) 等级 计数 <6 重度贫血 异常 6~ 中度贫血 异常 9~ 轻度贫血 异常 12~ 12~16 血红蛋白正常 正常 >16 血红蛋白增高 异常 但必须明确,凡能计量的, 但必须明确,凡能计量的,应尽可能采用计量资 因为计量资料可以得到较多的信息。 料;因为计量资料可以得到较多的信息。
17.3 + 18.0 + ... + 25.5 x= = 21.35(kg ) 10
均数的应用与特点 均数的应用与特点
适用条件:算术均数适合于对称分布的资料, 适用条件:算术均数适合于对称分布的资料, 如分布均匀的小样本数据或近似正态分布的大 样本数据; 样本数据; 特点:算术均数容易受极端值的影响. 特点:算术均数容易受极端值的影响.
x( n+1)/ 2 M = d ( xn/ 2 + x1+n/ 2 ) 2
n为 数 奇 n为 数 偶
中位数的计算
12个数据如下 个数据如下: 实例 12个数据如下:
顺序号 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (12) (11) (12) 数据值 7.4 8.6 8.6 10.8 11.6 11.6 11.6 12.1 12.3 14.3 15.0 15.6
符号及计算: 符号及计算:
R = xmax − xmin
极差( 极差(Range) )
变异指标
Variation Number
变异指标( 变异指标(variation number)又称离散 )又称离散 指标( 指标( Dispersion number),用以描述一组 ) 计量资料各观察值之间参差不齐的程度。 计量资料各观察值之间参差不齐的程度。 变异指标越大,观察值之间差异愈大, 变异指标越大,观察值之间差异愈大,说 明平均数的代表性就越差;反之亦然。 明平均数的代表性就越差;反之亦然。
几何均数的应用与特点
适用条件:几何均数常用以描述观察值为等比 适用条件:几何均数常用以描述观察值为等比 级数资料(呈倍数关系的等比资料) 级数资料(呈倍数关系的等比资料)或对数正态分 布资料的集中趋势。 资料的集中趋势。 呈等比级数的资料,如血清滴度、抗体效价等; ◆ 呈等比级数的资料,如血清滴度、抗体效价等;
中位数的应用与特点
适用条件:适合各种类型的资料。 适用条件:适合各种类型的资料。尤其适合于 不确定数值; 大样本偏态分布的资料; 资料有不确定数值 的资料 ①大样本偏态分布的资料; ②资料有不确定数值; ③资料分布不明等。 资料分布不明等 分布不明 特点:由于中位数总处在居中的位置上, 特点:由于中位数总处在居中的位置上,将频数等 分为二,它不受特大或特小值的影响, 分为二,它不受特大或特小值的影响,仅仅利用了中 间的1~2个数据。
等级资料(或有序等级变量) 等级资料(或有序等级变量)
1.定义: 1.定义:将观察单位按某种属性的不同程度而顺序 定义 分组,所得各组的观察单位数称为等级资料, 分组,所得各组的观察单位数称为等级资料,通常有两个 以上等级。这类资料具有计数资料的特点,但所分各组之 以上等级。这类资料具有计数资料的特点, 间又有等级顺序,如由轻到重、由小到大排列。 间又有等级顺序,如由轻到重、由小到大排列。 2.特点:等级是有序分组。同计数资料的区别是: 2.特点:等级是有序分组。同计数资料的区别是:属 特点 分组 分组有程度或等级的差别,各组按一定顺序排列; 性的分组有程度或等级的差别,各组按一定顺序排列;与 计量资料的区别是:每个观察单位未确切定量, 计量资料的区别是:每个观察单位未确切定量,所以又称 为半定量资料。 为半定量资料。
计量资料的统计描述
Descriptive Statistics
统计资料的分类
1、计量资料(或定量变量) 、计量资料(或定量变量) 2、计数资料(或无序分类变量) 、计数资料(或无序分类变量) 3、等级资料(或有序等级变量) 、等级资料(或有序等级变量)
计量资料(或定量变量) 计量资料(或定量变量)
常用医学统计方法
Medical Statistics
教 学 内 容
9.7 3学时 学时 9.7 2学时 学时 计量资料的统计分析(理论课) 计量资料的统计分析(理论课) 计量资料的软件实现(操作演示) 计量资料的软件实现(操作演示)
9.9 3学时 学时 9.9 2学时 学时
计数资料的统计分析(理论课) 计数资料的统计分析(理论课) 计数资料的软件实现(操作演示) 计数资料的软件实现(操作演示)
实例( 实例(一)
管 患 部 指 胆 癌 者 分 标
号 性 年 ( ) 位分 程 分 编 别 龄 岁 部 化 度 期 肝 移 PCNA 指 转 数 生 时 (月 存 间 ) ( )( ) ( ) ( ) ( ) ( ) ( ) 1 2 3 4 5 6 7 () 8 () 9 1 2 3 4 5 … 男 女 女 女 男 … 61 58 63 71 59 … 上 中 上 下 上 … 分 低 化 分 高 化 分 高 化 分 中 化 高 化 分 … Ⅰ Ⅱ Ⅳ Ⅱ Ⅲ … 性 阳 性 阴 性 阴 性 阳 阴 性 … 52 89 93 78 85 … 14 20 19 5 35 …
计量
计量 计数 等级
等级
计量
计数
计量
计量
计数
体重指数=体重/ 注:体重指数=体重/身高3 (Kg/m3); 嗜肥肉史 中等2 劳动强度 轻1,中等2,重3 不紧张1 一般2 紧张3 紧张程度 不紧张1,一般2,紧张3 日班制1 两班制2 三班制3 班制 日班制1,两班制2,三班制3
有 1, 无 0
平均数指标
几何均数(geometric mean) 几何均数
符号为G。 符号为 。
几何均数的计算
几何均数的定义公式为: n个变量值 的连乘 个变量值x的连乘 几何均数的定义公式为 : 个变量值 积的n次方根。 积的 次方根。 次方根
G = n x x2 Lxn 1
当 n>3时 , 上式计算不便 , 而常采用以 > 时 上式计算不便, 下计算公式: 下计算公式:
三组同性别、 三组同性别、同年龄儿童体重 甲组 乙组 丙组
丙组 3 乙组 2 甲组 1
26 24 26
28 27 29
30 30 30
32 33 31
34 36 24
0 20 24 28 32 36 40
极差( 极差(Range) )
意义:是一批数据中最大值与最小值之差, 意义:是一批数据中最大值与最小值之差,反映 了数据散布范围。 了数据散布范围。
人的血清滴度为: 16, 5人的血清滴度为 : 1 :2 , 1:4, 1 :8 , 1: 16 ,
1:32,求平均滴度。 32,求平均滴度。
log 2 + log 4 + log 8 + log 16 + log 32 G = log =8 5
−1
同一资料,几何均数 均数 同一资料,几何均数<均数
算术均数(arithmetic mean),简称均 算术均数 ,简称均 数( mean )
符号为 ( x 相应的总体均数记为μ)。
算术均数的计算
x1 + x2 + x3 +L+ xn ∑x x= = n n
实例: 某市10名7岁男童体重(kg)分别为: 实例: 某市10名 岁男童体重(kg)分别为: 10 17.3,18.0,19.4,20.6,21.2,21.8, 17.3,18.0,19.4,20.6,21.2,21.8, 22.5,23.2,24.0,25.5,求其平均体重。 22.5,23.2,24.0,25.5,求其平均体重。
特点:同一资料,几何均数< 特点:同一资料,几何均数<均数
众数( 众数(mode) )
众数是指在一群观察值中, 出现频率最高( 众数是指在一群观察值中 , 出现频率最高 ( 即次 数最多)的数据, 数最多 ) 的数据 , 在频数表上表现为频数最多组的组 中值,数理上指曲线上的最高点。用符号Mo表示。 中值,数理上指曲线上的最高点。用符号 表示。 适用条件: 适用条件 :众数主要应用在对小样本的探索性数据进 行分析。 行分析。 特点:它不受变量数列极端数值的影响,但众值的计 特点: 它不受变量数列极端数值的影响, 算只有在总体单位数足够多, 算只有在总体单位数足够多,而且又具有明显的集中趋 势时,才有意义。 势时,才有意义。
中位数( 中位数(median) )
将一组变量值按大小顺序排列,位次居中的 将一组变量值按大小顺序排列,位次居中的 变量值即为中位数。中位数将变量值一分为二, 变量值即为中位数。中位数将变量值一分为二, 一半比它小,一半比它大。符号为M、Md。计算 一半比它小,一半比它大。符号为 。 公式为: 公式为:
平均数指标
平均数( 平均数(average) ) 是描述一群同质变量值集 是描述一群同质变量值集
中位置的特征值,用以说明同类现象或事物数量的 中位置的特征值, 的特征值 中等水平(集中趋势)。 中等水平(集中趋势)。
算术均数、 常用的有算术均数 中位数、众数、 常用的有算术均数、中位数、众数、几何均数等
计数 计量
计数 等级
等级 计数
计量
计量
实例( 实例(二)
城市脑力劳动者调查资料部分指标摘录
风 族 重 数 高 班 劳 强 紧 程 心 体 指 身 制 动 度 张 度 率 嗜 肉 肥 史 收 压 舒 压 中 家 史 缩 张 10) ( ) ( ) 3) ( ) 1 2 ( 4 () () () 5 6 7 () () 8 9 ( ) 10 1 12.24 1.62 1 1 3 70 146 90 有 16.47 1.63 15.19 1.64 15.59 1.63 12.60 1.64 ┆ ┆ 3 1 1 3 ┆ 1 2 1 1 ┆ 3 2 3 3 ┆ 72 72 84 68 ┆ 0 0 1 1 ┆ 110 100 114 116 ┆ 70 70 70 68 ┆ 无 无 无 无 ┆
计数资料(或无序分类变量) 计数资料(或无序分类变量)
定义: 1 . 定义 : 将观察单位按某种属性或类别分组计 数,得到各组观察单位数称为计数资料。 得到各组观察单位数称为计数资料。 2 . 特点 : 计数排列是无序分组 , 同组各观察单 特点: 计数排列是无序分组, 位之间没有量的差别, 但各组间有质的不同, 位之间没有量的差别 , 但各组间有质的不同 , 不同 质的观察单位不能归入一组。 质的观察单位不能归入一组。 变量值是定性的, 变量值是定性的,表现为互不相容的属性或类别 二项分类和多项分类
均数、中位数、 均数、中位数、众数三者关系
正态分布时: 均数=中位数= 均数=中位数=众数
Biblioteka Baidu
正偏态分布时:均数 中位数 众数 均数>中位数 均数 中位数>众数 负偏态分布时:均数 中位数 众数 均数<中位数 均数 中位数<众数
在计算和应用平均数指标时的注意事项
1.同质事物或现象才能求平均数 2.要根据数据分布类型正确选用平均数 要与下一节的离散趋势分析相结合, 3.要与下一节的离散趋势分析相结合 ,以弥补反 映不出差异和易受极端值影响的缺陷。 映不出差异和易受极端值影响的缺陷。
∑log x G = log n
−1
式中logx表示对观察值 求对数,log-1 为相 式中 表示对观察值x求对数, 表示对观察值 求对数 应对数的反对数。 应对数的反对数。
几何均数就是变量对数值的算术均数的反对数。 几何均数就是变量对数值的算术均数的反对数 。
实例
1.定义:测定每个观察单位的某项指标量的大小, 1.定义:测定每个观察单位的某项指标量的大小, 定义 所得的资料称为计量资料。其变量值是定量的, 所得的资料称为计量资料。其变量值是定量的,表 现为数值大小,一般带有度量衡或其它单位。 现为数值大小,一般带有度量衡或其它单位。 特点:每个观察单位的观察值之间有量的区别。 2.特点 :每个观察单位的观察值之间有量的区别 。
资料的转化
根据分析的需要,变量可以转化, 根据分析的需要,变量可以转化,但只能由高 级向低级转化。连续型→有序→分类→ 级向低级转化。连续型→有序→分类→二值 血红蛋白( 血红蛋白(g/dl) 等级 计数 <6 重度贫血 异常 6~ 中度贫血 异常 9~ 轻度贫血 异常 12~ 12~16 血红蛋白正常 正常 >16 血红蛋白增高 异常 但必须明确,凡能计量的, 但必须明确,凡能计量的,应尽可能采用计量资 因为计量资料可以得到较多的信息。 料;因为计量资料可以得到较多的信息。
17.3 + 18.0 + ... + 25.5 x= = 21.35(kg ) 10
均数的应用与特点 均数的应用与特点
适用条件:算术均数适合于对称分布的资料, 适用条件:算术均数适合于对称分布的资料, 如分布均匀的小样本数据或近似正态分布的大 样本数据; 样本数据; 特点:算术均数容易受极端值的影响. 特点:算术均数容易受极端值的影响.
x( n+1)/ 2 M = d ( xn/ 2 + x1+n/ 2 ) 2
n为 数 奇 n为 数 偶
中位数的计算
12个数据如下 个数据如下: 实例 12个数据如下:
顺序号 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (12) (11) (12) 数据值 7.4 8.6 8.6 10.8 11.6 11.6 11.6 12.1 12.3 14.3 15.0 15.6
符号及计算: 符号及计算:
R = xmax − xmin
极差( 极差(Range) )
变异指标
Variation Number
变异指标( 变异指标(variation number)又称离散 )又称离散 指标( 指标( Dispersion number),用以描述一组 ) 计量资料各观察值之间参差不齐的程度。 计量资料各观察值之间参差不齐的程度。 变异指标越大,观察值之间差异愈大, 变异指标越大,观察值之间差异愈大,说 明平均数的代表性就越差;反之亦然。 明平均数的代表性就越差;反之亦然。
几何均数的应用与特点
适用条件:几何均数常用以描述观察值为等比 适用条件:几何均数常用以描述观察值为等比 级数资料(呈倍数关系的等比资料) 级数资料(呈倍数关系的等比资料)或对数正态分 布资料的集中趋势。 资料的集中趋势。 呈等比级数的资料,如血清滴度、抗体效价等; ◆ 呈等比级数的资料,如血清滴度、抗体效价等;
中位数的应用与特点
适用条件:适合各种类型的资料。 适用条件:适合各种类型的资料。尤其适合于 不确定数值; 大样本偏态分布的资料; 资料有不确定数值 的资料 ①大样本偏态分布的资料; ②资料有不确定数值; ③资料分布不明等。 资料分布不明等 分布不明 特点:由于中位数总处在居中的位置上, 特点:由于中位数总处在居中的位置上,将频数等 分为二,它不受特大或特小值的影响, 分为二,它不受特大或特小值的影响,仅仅利用了中 间的1~2个数据。
等级资料(或有序等级变量) 等级资料(或有序等级变量)
1.定义: 1.定义:将观察单位按某种属性的不同程度而顺序 定义 分组,所得各组的观察单位数称为等级资料, 分组,所得各组的观察单位数称为等级资料,通常有两个 以上等级。这类资料具有计数资料的特点,但所分各组之 以上等级。这类资料具有计数资料的特点, 间又有等级顺序,如由轻到重、由小到大排列。 间又有等级顺序,如由轻到重、由小到大排列。 2.特点:等级是有序分组。同计数资料的区别是: 2.特点:等级是有序分组。同计数资料的区别是:属 特点 分组 分组有程度或等级的差别,各组按一定顺序排列; 性的分组有程度或等级的差别,各组按一定顺序排列;与 计量资料的区别是:每个观察单位未确切定量, 计量资料的区别是:每个观察单位未确切定量,所以又称 为半定量资料。 为半定量资料。
计量资料的统计描述
Descriptive Statistics
统计资料的分类
1、计量资料(或定量变量) 、计量资料(或定量变量) 2、计数资料(或无序分类变量) 、计数资料(或无序分类变量) 3、等级资料(或有序等级变量) 、等级资料(或有序等级变量)
计量资料(或定量变量) 计量资料(或定量变量)
常用医学统计方法
Medical Statistics
教 学 内 容
9.7 3学时 学时 9.7 2学时 学时 计量资料的统计分析(理论课) 计量资料的统计分析(理论课) 计量资料的软件实现(操作演示) 计量资料的软件实现(操作演示)
9.9 3学时 学时 9.9 2学时 学时
计数资料的统计分析(理论课) 计数资料的统计分析(理论课) 计数资料的软件实现(操作演示) 计数资料的软件实现(操作演示)
实例( 实例(一)
管 患 部 指 胆 癌 者 分 标
号 性 年 ( ) 位分 程 分 编 别 龄 岁 部 化 度 期 肝 移 PCNA 指 转 数 生 时 (月 存 间 ) ( )( ) ( ) ( ) ( ) ( ) ( ) 1 2 3 4 5 6 7 () 8 () 9 1 2 3 4 5 … 男 女 女 女 男 … 61 58 63 71 59 … 上 中 上 下 上 … 分 低 化 分 高 化 分 高 化 分 中 化 高 化 分 … Ⅰ Ⅱ Ⅳ Ⅱ Ⅲ … 性 阳 性 阴 性 阴 性 阳 阴 性 … 52 89 93 78 85 … 14 20 19 5 35 …
计量
计量 计数 等级
等级
计量
计数
计量
计量
计数
体重指数=体重/ 注:体重指数=体重/身高3 (Kg/m3); 嗜肥肉史 中等2 劳动强度 轻1,中等2,重3 不紧张1 一般2 紧张3 紧张程度 不紧张1,一般2,紧张3 日班制1 两班制2 三班制3 班制 日班制1,两班制2,三班制3
有 1, 无 0
平均数指标
几何均数(geometric mean) 几何均数
符号为G。 符号为 。
几何均数的计算
几何均数的定义公式为: n个变量值 的连乘 个变量值x的连乘 几何均数的定义公式为 : 个变量值 积的n次方根。 积的 次方根。 次方根
G = n x x2 Lxn 1
当 n>3时 , 上式计算不便 , 而常采用以 > 时 上式计算不便, 下计算公式: 下计算公式:
三组同性别、 三组同性别、同年龄儿童体重 甲组 乙组 丙组
丙组 3 乙组 2 甲组 1
26 24 26
28 27 29
30 30 30
32 33 31
34 36 24
0 20 24 28 32 36 40
极差( 极差(Range) )
意义:是一批数据中最大值与最小值之差, 意义:是一批数据中最大值与最小值之差,反映 了数据散布范围。 了数据散布范围。
人的血清滴度为: 16, 5人的血清滴度为 : 1 :2 , 1:4, 1 :8 , 1: 16 ,
1:32,求平均滴度。 32,求平均滴度。
log 2 + log 4 + log 8 + log 16 + log 32 G = log =8 5
−1
同一资料,几何均数 均数 同一资料,几何均数<均数
算术均数(arithmetic mean),简称均 算术均数 ,简称均 数( mean )
符号为 ( x 相应的总体均数记为μ)。
算术均数的计算
x1 + x2 + x3 +L+ xn ∑x x= = n n
实例: 某市10名7岁男童体重(kg)分别为: 实例: 某市10名 岁男童体重(kg)分别为: 10 17.3,18.0,19.4,20.6,21.2,21.8, 17.3,18.0,19.4,20.6,21.2,21.8, 22.5,23.2,24.0,25.5,求其平均体重。 22.5,23.2,24.0,25.5,求其平均体重。
特点:同一资料,几何均数< 特点:同一资料,几何均数<均数
众数( 众数(mode) )
众数是指在一群观察值中, 出现频率最高( 众数是指在一群观察值中 , 出现频率最高 ( 即次 数最多)的数据, 数最多 ) 的数据 , 在频数表上表现为频数最多组的组 中值,数理上指曲线上的最高点。用符号Mo表示。 中值,数理上指曲线上的最高点。用符号 表示。 适用条件: 适用条件 :众数主要应用在对小样本的探索性数据进 行分析。 行分析。 特点:它不受变量数列极端数值的影响,但众值的计 特点: 它不受变量数列极端数值的影响, 算只有在总体单位数足够多, 算只有在总体单位数足够多,而且又具有明显的集中趋 势时,才有意义。 势时,才有意义。
中位数( 中位数(median) )
将一组变量值按大小顺序排列,位次居中的 将一组变量值按大小顺序排列,位次居中的 变量值即为中位数。中位数将变量值一分为二, 变量值即为中位数。中位数将变量值一分为二, 一半比它小,一半比它大。符号为M、Md。计算 一半比它小,一半比它大。符号为 。 公式为: 公式为: