项目32数值资料的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
记为G)表示其平均水平
频数分布的两大特征:集中趋势和离散程 度。
集中趋势又称为平均数,反映了观察值的 集中位置或平均水平。常用的指标有算术 均数、几何均数、中位数。
离散程度指标又称为变异程度指标,反映 了观察值之间参差不齐的程度。常用的指 标有极差、离均差平方和、方差、标准差、 变异系数。
最后一组段要包括最大观察值,即该组 段的上限应略大于或等于最大观察值。
80 80.1
104.8106
5、列表归组 (表2.1) 列出组段
清点各组段内的观察值个数即得各组段 频数
观前不顾后
表2.1 某市150名3岁女孩身高频数分布
组段
80~ 82~ 84~ 86~ 88~ 90~ 92~ 94~ 96~ 98~ 100~ 102~ 104~ 106~
丙组:2,4,6,7,8,10,12
离均差 平方和
28
90
70
如上述三组观察值,甲组离均差平方和 为28,乙组为90,丙组为70,说明乙组 最为离散,丙组次之,甲组相对集中。 但离均差平方和的大小,除与观察之间 离散程度有关外,还与观察值得个数有 关。因此,将离均差平方和除以观察值 的个数所得之商(即方差),作为离散 程度指标更为合理。
三、离散程度指标-离均差平方 和
离均差平方和是每个观察值与均数之差 的平方和,它的大小也反映了观察值之 间的离散程度。
(x-x)2
-3 -2 -1 0 1 2
3
甲组:4,5,6,7,8,9,10
-5 -4 -2 0 2
4
5
乙组:2,3,5,7,9,11,12
-5 -3 -1 0 1
3
5
方差
4.67 15
11.67
三、离散程度指标-标 准 差
方差的单位是观察值单位的平方,如尿氟观 察值单位为mmol/l,其方差的单位为 (mmol/l )2 ,身高观察值单位为cm,其方 差的单位为(cm)2。这样的单位使用不便, 也难于理解。为使观察值、集中趋势指标和 离散趋势指标具有同样的计量单位,可将方 差开方。样本方差的算术平方根为标准差, 以符号s表示,它是一个最常用的离散程度指 标。
数值资料的统计描述
贾茜
分析资料
统计描述 统计推断
方法
统计描述
频数分布表 频数分布图 统计指标
频数分布表
一、概述 频数就是观察值得个数。 频数分布就是观察值在其所取值的范围
内分布的情况。 在其观察值个数较多时,频数分布情况
可用频数分布表和频数分布图来表示。
二、步骤
1、计算全距 全距是观察值中最大值与最小值之差。 全距=104.8—80.1=24.7(厘米)
频数
频数分布图
横轴:连续的变量(已分好的组段) 纵轴:频数
频数 30 20
10
80
106 身高(cm)
频数分布类型
1、正态分布 整个图形以高峰所在处的垂线为中心 左右两侧逐渐下降并对称
2、正偏态分布 整个图形不对称,高峰偏左 即观察值较小的这一端,集中了较多的频数。
2、确定组段数 一般取10~15个组段为宜。 组段数过多,编制过程和计算较繁,组
段数过少,计算误差较大
3、确定组距 组距=全距/组段数 24.7/12=2.06≈2
4、确定组段 各组段的起点为下限,终点为上限。
第一组段要包括最小的观察值,即该组 段的下限应略小于或等于最小观察值
属于这类分布的资料并不少见, 正常人体红某些非必需元素含量的频数分布; 一些传染病潜伏期的频数分布 粉尘粒子大小的频数分布等 家庭收入
3、负偏态分布 整个图形不对称,高峰偏右, 即观察值较大的这一端,集中了较多的
频数。 属于这类分布的资料较为少见 多数学生视力较好,少数学生视力较差。
公式
直接法:先将变量值由小到大顺序排列。
n为奇数时
某病患者7人的潜伏期(天)分别为5,6, 6,7,9,10,20,求中位数
n为偶数时
某病患者7人的潜伏期(天)分别为5,6, 6,7,9,10,20,21,求中位数。
几何均数
对于数值变量值呈倍数关系或呈对数正 态分布(正偏态分布),如抗体效价及抗体 滴度,某些传染病的潜伏期,细菌计数 等,宜用几何均数(geometric mean,简
算术均数 (arithmetic mean) 简称均数,适 用于对称分布或近似对称分布的资料。 尤其是正态分布资料。
二、计算公式
1.直接法 计算公式为:
X X1 X 2 X n X
n
n
例
现有11名5岁女孩的身高值(cm)为112.9、 99.5、100.7、101.0、112.1、118.7、 107.9、108.1、99.1、104.8、116.5, 求其均数。
例:
甲组:4,5,6,7,8,9,10 乙组:2,3,5,7,9,11,12 丙组:2,4,6,7,8,10,12 找出三组的算术均数或中位数? 三组的离散程度是否一致?
三、离散程度指标-极差(R)
极差又称为全距,是观察值中最大值与最 小值之差。
极差越大,变异越大 极差
甲组:4,5,6,7,8,9,10 6 乙组:2,3,5,7,9,11,12 10 丙组:2,4,6,7,8,10,12 10
三、离散程度指标-方差
总体方差是离均差平方和的平均值。
它的大小只与观察值离散程度有关,而 与观察值个数的多少无关。
总体方差用符号σ 2表示,样本方差以符 号s2表示,样本方差是总体方差的估计值。
s
2
(x - x)2 n -1
n-1为自由度
甲组:4,5,6,7,8,9,10 乙组:2,3,5,7,9,11,12 丙组:2,4,6,7,8,10,12
集中趋势指标
贾茜
一、概述
频数分布的两大特征:集中趋势和离散 程度;
对两大特征进行描述:计算集中趋势和 离散程度的指标
二、集中趋势指标
集中趋势指标又称平均数,它反映观察 值的集中位置或平均水平。
常用的集中趋势指标:算数均数(均 数),几何均数、中位数。
算数均数(均数)
一、应用条件
加权法
中位数
将一组变量值从小到大按Fra Baidu bibliotek序排列,位次居中
的变量值称为中位数(median,简记为M)。在
全部变量值中,大于和小于中位数的变量值的 个数相等。
用中位数表示平均水平主要适用于:①变量值 中出现个别特小或特大的数值;②资料的分布 呈明显偏态,即大部分的变量值偏向一侧;③ 变量值分布一端或两端无确定数值,只有小于 或大于某个数值;④资料的分布类型不清。
频数分布的两大特征:集中趋势和离散程 度。
集中趋势又称为平均数,反映了观察值的 集中位置或平均水平。常用的指标有算术 均数、几何均数、中位数。
离散程度指标又称为变异程度指标,反映 了观察值之间参差不齐的程度。常用的指 标有极差、离均差平方和、方差、标准差、 变异系数。
最后一组段要包括最大观察值,即该组 段的上限应略大于或等于最大观察值。
80 80.1
104.8106
5、列表归组 (表2.1) 列出组段
清点各组段内的观察值个数即得各组段 频数
观前不顾后
表2.1 某市150名3岁女孩身高频数分布
组段
80~ 82~ 84~ 86~ 88~ 90~ 92~ 94~ 96~ 98~ 100~ 102~ 104~ 106~
丙组:2,4,6,7,8,10,12
离均差 平方和
28
90
70
如上述三组观察值,甲组离均差平方和 为28,乙组为90,丙组为70,说明乙组 最为离散,丙组次之,甲组相对集中。 但离均差平方和的大小,除与观察之间 离散程度有关外,还与观察值得个数有 关。因此,将离均差平方和除以观察值 的个数所得之商(即方差),作为离散 程度指标更为合理。
三、离散程度指标-离均差平方 和
离均差平方和是每个观察值与均数之差 的平方和,它的大小也反映了观察值之 间的离散程度。
(x-x)2
-3 -2 -1 0 1 2
3
甲组:4,5,6,7,8,9,10
-5 -4 -2 0 2
4
5
乙组:2,3,5,7,9,11,12
-5 -3 -1 0 1
3
5
方差
4.67 15
11.67
三、离散程度指标-标 准 差
方差的单位是观察值单位的平方,如尿氟观 察值单位为mmol/l,其方差的单位为 (mmol/l )2 ,身高观察值单位为cm,其方 差的单位为(cm)2。这样的单位使用不便, 也难于理解。为使观察值、集中趋势指标和 离散趋势指标具有同样的计量单位,可将方 差开方。样本方差的算术平方根为标准差, 以符号s表示,它是一个最常用的离散程度指 标。
数值资料的统计描述
贾茜
分析资料
统计描述 统计推断
方法
统计描述
频数分布表 频数分布图 统计指标
频数分布表
一、概述 频数就是观察值得个数。 频数分布就是观察值在其所取值的范围
内分布的情况。 在其观察值个数较多时,频数分布情况
可用频数分布表和频数分布图来表示。
二、步骤
1、计算全距 全距是观察值中最大值与最小值之差。 全距=104.8—80.1=24.7(厘米)
频数
频数分布图
横轴:连续的变量(已分好的组段) 纵轴:频数
频数 30 20
10
80
106 身高(cm)
频数分布类型
1、正态分布 整个图形以高峰所在处的垂线为中心 左右两侧逐渐下降并对称
2、正偏态分布 整个图形不对称,高峰偏左 即观察值较小的这一端,集中了较多的频数。
2、确定组段数 一般取10~15个组段为宜。 组段数过多,编制过程和计算较繁,组
段数过少,计算误差较大
3、确定组距 组距=全距/组段数 24.7/12=2.06≈2
4、确定组段 各组段的起点为下限,终点为上限。
第一组段要包括最小的观察值,即该组 段的下限应略小于或等于最小观察值
属于这类分布的资料并不少见, 正常人体红某些非必需元素含量的频数分布; 一些传染病潜伏期的频数分布 粉尘粒子大小的频数分布等 家庭收入
3、负偏态分布 整个图形不对称,高峰偏右, 即观察值较大的这一端,集中了较多的
频数。 属于这类分布的资料较为少见 多数学生视力较好,少数学生视力较差。
公式
直接法:先将变量值由小到大顺序排列。
n为奇数时
某病患者7人的潜伏期(天)分别为5,6, 6,7,9,10,20,求中位数
n为偶数时
某病患者7人的潜伏期(天)分别为5,6, 6,7,9,10,20,21,求中位数。
几何均数
对于数值变量值呈倍数关系或呈对数正 态分布(正偏态分布),如抗体效价及抗体 滴度,某些传染病的潜伏期,细菌计数 等,宜用几何均数(geometric mean,简
算术均数 (arithmetic mean) 简称均数,适 用于对称分布或近似对称分布的资料。 尤其是正态分布资料。
二、计算公式
1.直接法 计算公式为:
X X1 X 2 X n X
n
n
例
现有11名5岁女孩的身高值(cm)为112.9、 99.5、100.7、101.0、112.1、118.7、 107.9、108.1、99.1、104.8、116.5, 求其均数。
例:
甲组:4,5,6,7,8,9,10 乙组:2,3,5,7,9,11,12 丙组:2,4,6,7,8,10,12 找出三组的算术均数或中位数? 三组的离散程度是否一致?
三、离散程度指标-极差(R)
极差又称为全距,是观察值中最大值与最 小值之差。
极差越大,变异越大 极差
甲组:4,5,6,7,8,9,10 6 乙组:2,3,5,7,9,11,12 10 丙组:2,4,6,7,8,10,12 10
三、离散程度指标-方差
总体方差是离均差平方和的平均值。
它的大小只与观察值离散程度有关,而 与观察值个数的多少无关。
总体方差用符号σ 2表示,样本方差以符 号s2表示,样本方差是总体方差的估计值。
s
2
(x - x)2 n -1
n-1为自由度
甲组:4,5,6,7,8,9,10 乙组:2,3,5,7,9,11,12 丙组:2,4,6,7,8,10,12
集中趋势指标
贾茜
一、概述
频数分布的两大特征:集中趋势和离散 程度;
对两大特征进行描述:计算集中趋势和 离散程度的指标
二、集中趋势指标
集中趋势指标又称平均数,它反映观察 值的集中位置或平均水平。
常用的集中趋势指标:算数均数(均 数),几何均数、中位数。
算数均数(均数)
一、应用条件
加权法
中位数
将一组变量值从小到大按Fra Baidu bibliotek序排列,位次居中
的变量值称为中位数(median,简记为M)。在
全部变量值中,大于和小于中位数的变量值的 个数相等。
用中位数表示平均水平主要适用于:①变量值 中出现个别特小或特大的数值;②资料的分布 呈明显偏态,即大部分的变量值偏向一侧;③ 变量值分布一端或两端无确定数值,只有小于 或大于某个数值;④资料的分布类型不清。