数值变量的统计描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
列出组段:第一组段的下限略小于最小值,最后一个组段上限 必须包含最大值
统计出各组的频数并整理成频数分布表
根据这些数据编制成的频数表能显示出这组数据分布的特征
组段 (1)
0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
表4.1的第(1)、(2)栏。
(二).连续性变量的频数表的编制
例4.2 在某市2005年进行的小学生体质评价研究 中,测定了120名9岁男孩的肺活量(L),资料 如下,根据该资料制作频数表。
1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 … 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735
统计描述
为什么要对资料进行统计描述?
医学研究得到的原始数据(raw data)往往是庞大的、混乱的 个体变异的存在,医学研究中某指标在各个体上的观察结 果不是恒定不变的,但也不是杂乱无章的;从总体的角度上 个体值的出现是有一定规律的,即呈一定的分布 统计描述的结果为进一步的统计推断提供参考
➢本章内容
正偏分布positive skewness是指分布的长尾在峰的右 侧
所谓负偏分布negative skewness是指分布的长尾在峰 的左侧
Negative skewness:老年人生存质量自评分
400
300
人 数
200
100
0 0 10 20 30 40 50 60 70 80 90 100
在观察值个数(即样本含量n)较多时,为了解一组同 质观察值的分布规律和便于指标的计算,可编制频数分布 表。
(一)离散型定量变量的频数表
其取值是不连续的变量被称为离散型变量。
其取值是0,1,2等不连续的量。 已婚育龄妇女的现有子女数; 引体向上完成次数…。
离散型变量的频数表编制较为简单,每一组段往 往是一个取值。
观察分布范围及有无可疑值
确定分布的类型:对称或不对称分布
对称分布
频数分布图表现为图形以某一数值对称或近似 对称分布
直方图形中间直条最高,两边对称地逐渐减少 ,统计学称之为正态分布或近似正态分布
不对称分布
分布不对称者称为偏态分布skewness distribution
偏态分布又分为正偏分布和负偏分布
如何得到上述理想的结果?
原始资料
分组划计
频数分布图
频数分布表 各项统计指标
1.频数表
求极差R:R=max-min 确定组数:组数的确定应以能够显示数据的分布特征和规律为
目的。对于100余例的数据通常分为8-15组。或根据以下经验 公式:
确定组距:组距i是一个组的下限与下一个组段下限之差,可根 据全部数据的最大值和最小值及所分的组数来确定,即i=Int [( max - min)÷ 组数 ]
用途与频数表类似,但更直观、形象。
图4.1 2005年某市120名9岁男孩肺活量频数分布
肺活量的分布形态
9岁男孩肺活量介于0.98~2.41L间 以“1.63~”组段的频数最多 从“1.63~”组段向两端逐渐减少 表现出以“1.63~”组段为中心基本对称的特
点
频数表与频数图的作用
频数表与频数图可以提供不同分组的观察人数、 频率与频率密度
累计频率(%) (5)
4.17 8.33 14.17 25.83 41.67 65.83 78.33 88.33 93.33 96.67 100.00
2、频数分布图
以观测变量为横轴,频数(或频率)为纵轴所 作的直方图,称为频数分布图。横轴依次以等距 标出各组段的起点,在各组段上方分别绘制宽度 等于组距、高度等于相应频数的长方形。
你能看出资料有什么规律?
理想的描述结果
组段 (1)
0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
频数 (2)
5 5 7 14 19 29 15 12 6 4 4 120
频率(% )
(3) 4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
表4-2 2005年某市120名9岁男孩肺活量(L)频数分布
频数 (2)
5 5 7 14 19 29 15 12 6 4 4 120
频率(%) (3)
4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
累计频数 (4)
5 10 17 31 50 79 94 106 112 116 120
数值变量的统计描述
第四章 定量资料的统计描述
福建医大流行病与卫生统计学系 何保昌
统计Байду номын сангаас述
统计描述就是用适当的表格、图形、数量 化的指标,表达数据的数量特征,揭示其 分布的规律性
统计描述分为:形象化描述(统计图表) ——建立对资料的初步印象;数值化的描 述(统计指标)——给出分布规律及具体 数值
第一节 频数分布表和频数分布图 第二节 集中趋势的统计描述 第三节 离散趋势的统计描述 第四节 正态分布及其应用
第一节 频数分布表和频 数分布图
一、频数分布表 二、频数分布图
一、频数分布表
对一个随机事件进行重复观察,其中某变量值出现的 次数被称作频数(frequency)。 把变量值及相对应的频数列成表格即频数分布表,简称频 数表(frequency table)。
统计出各组的频数并整理成频数分布表
根据这些数据编制成的频数表能显示出这组数据分布的特征
组段 (1)
0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
表4.1的第(1)、(2)栏。
(二).连续性变量的频数表的编制
例4.2 在某市2005年进行的小学生体质评价研究 中,测定了120名9岁男孩的肺活量(L),资料 如下,根据该资料制作频数表。
1.706 1.326 1.632 1.876 2.161 1.684 1.533 1.175 1.867 1.676 2.091 1.847 1.213 1.277 0.989 2.235 1.665 1.289 1.724 1.548 1.608 1.890 1.733 1.796 1.203 1.736 1.450 1.633 1.555 1.352 … 1.291 1.796 1.647 1.415 1.873 0.996 1.936 1.526 1.424 1.589 1.670 1.056 1.969 1.481 2.406 2.123 1.988 1.512 1.030 1.886 1.930 1.725 1.374 1.654 1.663 1.438 1.645 1.214 1.184 1.735
统计描述
为什么要对资料进行统计描述?
医学研究得到的原始数据(raw data)往往是庞大的、混乱的 个体变异的存在,医学研究中某指标在各个体上的观察结 果不是恒定不变的,但也不是杂乱无章的;从总体的角度上 个体值的出现是有一定规律的,即呈一定的分布 统计描述的结果为进一步的统计推断提供参考
➢本章内容
正偏分布positive skewness是指分布的长尾在峰的右 侧
所谓负偏分布negative skewness是指分布的长尾在峰 的左侧
Negative skewness:老年人生存质量自评分
400
300
人 数
200
100
0 0 10 20 30 40 50 60 70 80 90 100
在观察值个数(即样本含量n)较多时,为了解一组同 质观察值的分布规律和便于指标的计算,可编制频数分布 表。
(一)离散型定量变量的频数表
其取值是不连续的变量被称为离散型变量。
其取值是0,1,2等不连续的量。 已婚育龄妇女的现有子女数; 引体向上完成次数…。
离散型变量的频数表编制较为简单,每一组段往 往是一个取值。
观察分布范围及有无可疑值
确定分布的类型:对称或不对称分布
对称分布
频数分布图表现为图形以某一数值对称或近似 对称分布
直方图形中间直条最高,两边对称地逐渐减少 ,统计学称之为正态分布或近似正态分布
不对称分布
分布不对称者称为偏态分布skewness distribution
偏态分布又分为正偏分布和负偏分布
如何得到上述理想的结果?
原始资料
分组划计
频数分布图
频数分布表 各项统计指标
1.频数表
求极差R:R=max-min 确定组数:组数的确定应以能够显示数据的分布特征和规律为
目的。对于100余例的数据通常分为8-15组。或根据以下经验 公式:
确定组距:组距i是一个组的下限与下一个组段下限之差,可根 据全部数据的最大值和最小值及所分的组数来确定,即i=Int [( max - min)÷ 组数 ]
用途与频数表类似,但更直观、形象。
图4.1 2005年某市120名9岁男孩肺活量频数分布
肺活量的分布形态
9岁男孩肺活量介于0.98~2.41L间 以“1.63~”组段的频数最多 从“1.63~”组段向两端逐渐减少 表现出以“1.63~”组段为中心基本对称的特
点
频数表与频数图的作用
频数表与频数图可以提供不同分组的观察人数、 频率与频率密度
累计频率(%) (5)
4.17 8.33 14.17 25.83 41.67 65.83 78.33 88.33 93.33 96.67 100.00
2、频数分布图
以观测变量为横轴,频数(或频率)为纵轴所 作的直方图,称为频数分布图。横轴依次以等距 标出各组段的起点,在各组段上方分别绘制宽度 等于组距、高度等于相应频数的长方形。
你能看出资料有什么规律?
理想的描述结果
组段 (1)
0.98~ 1.11~ 1.24~ 1.37~ 1.50~ 1.63~ 1.76~ 1.89~ 2.02~ 2.15~ 2.28~2.41 合计
频数 (2)
5 5 7 14 19 29 15 12 6 4 4 120
频率(% )
(3) 4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
表4-2 2005年某市120名9岁男孩肺活量(L)频数分布
频数 (2)
5 5 7 14 19 29 15 12 6 4 4 120
频率(%) (3)
4.17 4.17 5.83 11.67 15.83 24.17 12.50 10.00 5.00 3.33 3.33 100.00
累计频数 (4)
5 10 17 31 50 79 94 106 112 116 120
数值变量的统计描述
第四章 定量资料的统计描述
福建医大流行病与卫生统计学系 何保昌
统计Байду номын сангаас述
统计描述就是用适当的表格、图形、数量 化的指标,表达数据的数量特征,揭示其 分布的规律性
统计描述分为:形象化描述(统计图表) ——建立对资料的初步印象;数值化的描 述(统计指标)——给出分布规律及具体 数值
第一节 频数分布表和频数分布图 第二节 集中趋势的统计描述 第三节 离散趋势的统计描述 第四节 正态分布及其应用
第一节 频数分布表和频 数分布图
一、频数分布表 二、频数分布图
一、频数分布表
对一个随机事件进行重复观察,其中某变量值出现的 次数被称作频数(frequency)。 把变量值及相对应的频数列成表格即频数分布表,简称频 数表(frequency table)。