定量变量统计描述99页PPT
合集下载
定量的统计描述分析课件
正态QQ图:图中的点代表数据,直线代表理想的正态数据,如果各个点都 落在了直线的周围并且在平均值的部分点的分布比较均匀,这就说明是符 合正态分布的,显然这组年龄数据不符合正态分布
总结
频数分析(Frequencies ):频数分布表、条图和直方图以及 集中趋势和离散趋势的各种统计量。 描述统计(Descriptives ):描述近似正态分布定量变量的集 中趋势和离散趋势的各种统计量,对变量做标准化转换(Z 转换)。 探索分析(Explore ):未知分布类型数据的统计描述,对 数据的分布形态进行检验,功能强大。
End Thanks
中位数
各种分布类型的资料,特别是偏峰分布资料; 分布一端或两端无确切数值的资料; 分布类型不明
百分位数 各种分布类型的资料
离散趋势
指标
应用条件
极差
对资料类型没有要求
四分位数 间距
方差与标 准差
变异系数
各种分布类型的资料,特别是偏峰分布资料
对称分布,特别是正态或近似正态分布 观察指标单位不同时变异程度的比较; 均数相差较大时变异程度的比较
重点掌握 1.频数分布图和频数分布表的制作 2.定量资料统计指标的计算
离散Байду номын сангаас定量资料
下面我们打开SPSS软件自带的数据demo.sav,找到reside, 这是一组同居人数的资料,我们将结合这组数据学习离散型 定量资料频数分布表和频数分布图的绘制。
变量视图
输出结果
输出结果
连续型定量资料
输出结果
探索分析(Explore )
探索分析(Explore )主要可以分为两个部分 1.未知分布类型数据的统计描述 2.对数据的分布形态进行检验
探索分析(Explore )
总结
频数分析(Frequencies ):频数分布表、条图和直方图以及 集中趋势和离散趋势的各种统计量。 描述统计(Descriptives ):描述近似正态分布定量变量的集 中趋势和离散趋势的各种统计量,对变量做标准化转换(Z 转换)。 探索分析(Explore ):未知分布类型数据的统计描述,对 数据的分布形态进行检验,功能强大。
End Thanks
中位数
各种分布类型的资料,特别是偏峰分布资料; 分布一端或两端无确切数值的资料; 分布类型不明
百分位数 各种分布类型的资料
离散趋势
指标
应用条件
极差
对资料类型没有要求
四分位数 间距
方差与标 准差
变异系数
各种分布类型的资料,特别是偏峰分布资料
对称分布,特别是正态或近似正态分布 观察指标单位不同时变异程度的比较; 均数相差较大时变异程度的比较
重点掌握 1.频数分布图和频数分布表的制作 2.定量资料统计指标的计算
离散Байду номын сангаас定量资料
下面我们打开SPSS软件自带的数据demo.sav,找到reside, 这是一组同居人数的资料,我们将结合这组数据学习离散型 定量资料频数分布表和频数分布图的绘制。
变量视图
输出结果
输出结果
连续型定量资料
输出结果
探索分析(Explore )
探索分析(Explore )主要可以分为两个部分 1.未知分布类型数据的统计描述 2.对数据的分布形态进行检验
探索分析(Explore )
定量变量的统计描述-PPT
(statistical table, statistic chart)
4
统计学
卫生统计学
随机性现象
概率论 数理统计
变量
定量变量 定性变量
研 究
统计描述
内 容
统计推断 5
统计描述:从资料中获取信息最基本的方法
把握资料基本的特征 为统计分析打下基础
6
表2-2 120名18-35岁健康男性居民血清铁含量(umol/L)
19
离散型变量的频数分布 表每一个组段就是一个
固定的取值
20
离散型变量的频数分布图
直条图
横坐标为产前检查次数;纵坐标为 频率,即产前检
查K次的妇女在被统计妇女中所占的比例%。图中等宽矩
形长条的高度与相应检查次数的频率呈正比。
21
频率:各组的频数除以总例数 n 所得的比值。频 率描述了各组频数在全体中所占的比重,各组 频率之和等于100%。
14
3.写组段:即将全距分为若干段的过程。
原则:(1)第一组段要包括Xmin,最末组段包括 Xmax ;
(2)每组段均用下限值加 “~ ”表示,最终组段同 时注明上下限。 注意:各组段不能重叠,每一组段均为半开半闭区 间。
4. 列表划记:根据预定的组段和组距,用 划记的方法整理原始资料。
15
表2-3 120名18-35岁健康男性居民血清铁含量的频数分布表
21.6 5
9.97 22.73 14.94 20.18 21.62 23.07 23.9 17.45 19.08 20.52 24.14 23.77 18.89 18.26 23.29 17.67 15.38 18.61 20.13 21 14.56 19.89 19.82 17.48 11.34 13.81 10.25 15.94 15.83 18.54 20.87 17.51 13.12 11.75 17.4 21.36 23.11 12.67 23.02 24.36 25.61 19.53 16.79 17.19 19.32 19.59 19.12 15.31 16.32 20.75 22.11 13.17 17.55 19.26
4
统计学
卫生统计学
随机性现象
概率论 数理统计
变量
定量变量 定性变量
研 究
统计描述
内 容
统计推断 5
统计描述:从资料中获取信息最基本的方法
把握资料基本的特征 为统计分析打下基础
6
表2-2 120名18-35岁健康男性居民血清铁含量(umol/L)
19
离散型变量的频数分布 表每一个组段就是一个
固定的取值
20
离散型变量的频数分布图
直条图
横坐标为产前检查次数;纵坐标为 频率,即产前检
查K次的妇女在被统计妇女中所占的比例%。图中等宽矩
形长条的高度与相应检查次数的频率呈正比。
21
频率:各组的频数除以总例数 n 所得的比值。频 率描述了各组频数在全体中所占的比重,各组 频率之和等于100%。
14
3.写组段:即将全距分为若干段的过程。
原则:(1)第一组段要包括Xmin,最末组段包括 Xmax ;
(2)每组段均用下限值加 “~ ”表示,最终组段同 时注明上下限。 注意:各组段不能重叠,每一组段均为半开半闭区 间。
4. 列表划记:根据预定的组段和组距,用 划记的方法整理原始资料。
15
表2-3 120名18-35岁健康男性居民血清铁含量的频数分布表
21.6 5
9.97 22.73 14.94 20.18 21.62 23.07 23.9 17.45 19.08 20.52 24.14 23.77 18.89 18.26 23.29 17.67 15.38 18.61 20.13 21 14.56 19.89 19.82 17.48 11.34 13.81 10.25 15.94 15.83 18.54 20.87 17.51 13.12 11.75 17.4 21.36 23.11 12.67 23.02 24.36 25.61 19.53 16.79 17.19 19.32 19.59 19.12 15.31 16.32 20.75 22.11 13.17 17.55 19.26
最新定量资料统计描述PPT课件
表 100 名 受 试 者 平 均 抗 体 滴 度 计 算 表
抗体滴 频数
度
f
(1)
(2)
1:4
6
1:8
10
1:16 16
1:32 34
1:64 20
1:128 8
1:256 5
1:512 1
合 计 100
滴度倒 数X (3) 4 8 16 32 64 128 256 512 ---
lgX
(4) 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 2.7093
数表法两种。
(1)直 接 法 当 观 察 例 数 n 不 大 时 ,此 法 常 用 。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n为奇数时
M = X [(n+ 1)/2]
当 n为偶数时
M
=
X
n 2
X
n 2
1
2
例 某 病 患 者 8 人 的 潜 伏 期( 天 )分 别 为 2,3, 3,4,7,8, 10, 18, 求 它 们 的 中 位 数 。
本 例 n=8 为 偶 数 ,将 8 人 潜 伏 期 从 小 到 大 排 列 ,用 公 式 算 得
M
=
X
n 2
X
n 2
1
2 = [X4 + X5]/2=( 4+7) /2=5.5(天 )
(2)频数表法 当观察例数n较多时,可先编制频数表, 再通过频数表计算中位数。
公式为:
M = Lm + i/fm( n×50% - ΣfL )
186
72--84
1
187
M = 12 + 12/70( 187×50% - 35 )= 22.0(小时)
抗体滴 频数
度
f
(1)
(2)
1:4
6
1:8
10
1:16 16
1:32 34
1:64 20
1:128 8
1:256 5
1:512 1
合 计 100
滴度倒 数X (3) 4 8 16 32 64 128 256 512 ---
lgX
(4) 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072 2.4082 2.7093
数表法两种。
(1)直 接 法 当 观 察 例 数 n 不 大 时 ,此 法 常 用 。
先将观察值按大小顺序排列,选用下列公式
求 M。
当 n为奇数时
M = X [(n+ 1)/2]
当 n为偶数时
M
=
X
n 2
X
n 2
1
2
例 某 病 患 者 8 人 的 潜 伏 期( 天 )分 别 为 2,3, 3,4,7,8, 10, 18, 求 它 们 的 中 位 数 。
本 例 n=8 为 偶 数 ,将 8 人 潜 伏 期 从 小 到 大 排 列 ,用 公 式 算 得
M
=
X
n 2
X
n 2
1
2 = [X4 + X5]/2=( 4+7) /2=5.5(天 )
(2)频数表法 当观察例数n较多时,可先编制频数表, 再通过频数表计算中位数。
公式为:
M = Lm + i/fm( n×50% - ΣfL )
186
72--84
1
187
M = 12 + 12/70( 187×50% - 35 )= 22.0(小时)
定量数据的统计描述PPT课件
(用数据库捕获技术建立一个新问题)
❖ Open an existing data source
(打开一个已经存在的数据源)
❖ Open another type of file (打开其它类型的文件)
.
43
(二)SPSS for Windows 的菜单命令
❖ File 文件操作 ❖ Edit 数据编辑 ❖ View 观察 (视图) ❖ Data 建立数据与数据整
筛选出来
.
6
❖ 表中是8名学生4门课程的考试成绩数据(单位:分)。 试找出统计学成绩等于75分的学生,英语成绩最高的前 三名学生,四门课程成绩都大于70分的学生。
注意:满足多项条件时,数据清单上面至少留 出三行作为条件区域
.
7
用Excel进行数据筛选的操作步骤
➢ 第一步:选择【数据】菜单,并选择 【筛选】命令。如 果要筛选出满足给定的条件的数据,可使用 【自动筛选】 命令。这时会在第一行出现下拉箭头,用鼠标点击箭头。
理 ❖ Transform 变量变换
❖ Analyze 统计分析 ❖ Graphs 作图 ❖ Utilities 实用程序 ❖ Window 视窗控制 ❖ Help 在线帮助(辅助说明)
.
44
数据编辑窗 (Data Editor)
(1)数据编辑窗主要功能:
建立新数据文件, 编辑和显示已有数据文件。 注意:一次只能打开一个数据编辑窗口。
➢ 定量数据的排序
▪ 递增排序:设一组数据为X1,X2,…,XN,递增排 序后可表示为:X(1)<X(2)<…<X(N)
▪ 递减排序可表示为:X(1)>X(2)>…>X(N)
.
13
❖ Open an existing data source
(打开一个已经存在的数据源)
❖ Open another type of file (打开其它类型的文件)
.
43
(二)SPSS for Windows 的菜单命令
❖ File 文件操作 ❖ Edit 数据编辑 ❖ View 观察 (视图) ❖ Data 建立数据与数据整
筛选出来
.
6
❖ 表中是8名学生4门课程的考试成绩数据(单位:分)。 试找出统计学成绩等于75分的学生,英语成绩最高的前 三名学生,四门课程成绩都大于70分的学生。
注意:满足多项条件时,数据清单上面至少留 出三行作为条件区域
.
7
用Excel进行数据筛选的操作步骤
➢ 第一步:选择【数据】菜单,并选择 【筛选】命令。如 果要筛选出满足给定的条件的数据,可使用 【自动筛选】 命令。这时会在第一行出现下拉箭头,用鼠标点击箭头。
理 ❖ Transform 变量变换
❖ Analyze 统计分析 ❖ Graphs 作图 ❖ Utilities 实用程序 ❖ Window 视窗控制 ❖ Help 在线帮助(辅助说明)
.
44
数据编辑窗 (Data Editor)
(1)数据编辑窗主要功能:
建立新数据文件, 编辑和显示已有数据文件。 注意:一次只能打开一个数据编辑窗口。
➢ 定量数据的排序
▪ 递增排序:设一组数据为X1,X2,…,XN,递增排 序后可表示为:X(1)<X(2)<…<X(N)
▪ 递减排序可表示为:X(1)>X(2)>…>X(N)
.
13
定量资料统计描述课件
数值型数据的分布形态描述
偏态与峰态
描述数据分布的不对称性 和尖锐程度。
正态分布
一种常见的连续概率分布 ,特点是钟形曲线,平均 数、中位数和众数相等。
分布函数
描述数据落在某个区间的 概率。
05
分类数据的统计描述
频数分布表与频数分布图
频数分布表
将分类数据按照某一分类标准进行分组,并统计每一组的频 数。
数据。
实验法
通过实验设计和实验操作获取 数据,适用于需要获取数据,适 用于自然状态下的数据收集。
文献法
通过查阅文献资料获取数据, 适用于历史数据和无法直接获
取的数据。
数据整理的步骤
数据清洗
去除无效、异常和缺失数据, 确保数据质量。
数据转换
将数据转换为统一格式,便于 后续处理和分析。
列联表
将两个分类变量交叉分组,并对每个 单元格中的观察单位数进行统计,形 成列联表,可以用来分析两个分类变 量之间的关系。
06
定量资料统计描述的应用实
例
实例一:人口普查数据统计描述
总结词
人口普查数据是典型的定量资料,统计描述方法在人口普查数据中应用广泛,用于描述人口数量、性别比例、年 龄结构等基本情况。
统计描述的基本原则
课程安排
第二章:定量资料的收集与整理 定量资料的收集方法
定量资料的整理原则
课程安排
第三章:数值变量统计描述 数值变量的集中趋势描述
数值变量的离散趋势描述
课程安排
第四章:分类变量统计描述 分类变量的频数分布描述 分类变量的相对数描述
课程安排
第五章:统计图表在描述中的应用 常用统计图形的选择与绘制
中心位置。
离散趋势指标
(推荐课件)定量资料的统计描述PPT学习幻灯片
13
120例链球菌感染咽炎患者潜伏期分布图(正偏峰分布)
14
病例数
40
30
20
10
0 18. 0
30. 0
42. 0
54. 0
66. 0
78. 0
潜伏期(小时)
90. 0
102.0
114.0
一些慢性病患者的年龄分布,其集中位置偏向年龄 大的一侧,频数尾部向左侧延伸,称为负偏态(峰) 分布,如图
确定组段数:组段数的多少一般根据观察单位的多少 来确定,过多或过少均不能更好地反映资料的分布特 征,以能够反映频数分布的特点为宜,一般分为8~15 组,观察单位少时可相对少些,观察单位较多时组段 数可酌情多些。本例初步确定为10个组。
确定组距:相邻组段下限值之差称为组距,一般分组 时取组距相等。组距=极差/组数,常取整数作组距, 取整只是为了方便资料的整理汇总。本例组距 =30.1/10= 3.11≈3。
定量资料的统计描述
1
主要内容
1、频数分布表的编制和用途 频数分布的特征和类型
2、集中趋势指标
均数、几何均数、中位数
3、离散趋势指标
极差、四分位数间距、方差、标准差、变异系数
百分位数
2
(一)、频数分布表的编制
3
某地儿研所测得该地150名12岁健康男童体重 (kg)原始数据如下,试编制频数表。
个组段的上限不能等于最大值。
7
本例最小值为20.1,故取20为第一组的下限。 第二组下限即20+3=23,余类推。 最后一个组段为50~53,包括最大值51.2。
3.列表划记,统计各组段频数。
4.计算频率与累计频率
8
150名 12岁 男 童 体 重 ( kg)频 数 分 布 表
120例链球菌感染咽炎患者潜伏期分布图(正偏峰分布)
14
病例数
40
30
20
10
0 18. 0
30. 0
42. 0
54. 0
66. 0
78. 0
潜伏期(小时)
90. 0
102.0
114.0
一些慢性病患者的年龄分布,其集中位置偏向年龄 大的一侧,频数尾部向左侧延伸,称为负偏态(峰) 分布,如图
确定组段数:组段数的多少一般根据观察单位的多少 来确定,过多或过少均不能更好地反映资料的分布特 征,以能够反映频数分布的特点为宜,一般分为8~15 组,观察单位少时可相对少些,观察单位较多时组段 数可酌情多些。本例初步确定为10个组。
确定组距:相邻组段下限值之差称为组距,一般分组 时取组距相等。组距=极差/组数,常取整数作组距, 取整只是为了方便资料的整理汇总。本例组距 =30.1/10= 3.11≈3。
定量资料的统计描述
1
主要内容
1、频数分布表的编制和用途 频数分布的特征和类型
2、集中趋势指标
均数、几何均数、中位数
3、离散趋势指标
极差、四分位数间距、方差、标准差、变异系数
百分位数
2
(一)、频数分布表的编制
3
某地儿研所测得该地150名12岁健康男童体重 (kg)原始数据如下,试编制频数表。
个组段的上限不能等于最大值。
7
本例最小值为20.1,故取20为第一组的下限。 第二组下限即20+3=23,余类推。 最后一个组段为50~53,包括最大值51.2。
3.列表划记,统计各组段频数。
4.计算频率与累计频率
8
150名 12岁 男 童 体 重 ( kg)频 数 分 布 表
相关主题