【优选推荐】统计学第9章分类数据分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1. 品质相关
? 对品质数据 (分类和顺序数据 )之间相关程 度的测度
2. 列联表变量的相关属于品质相关
3. 列联表相关测量的统计量主要有
? ? 相关系数
? 列联相关系数 ? V 相关系数
9 - 20
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
? 相关系数
(correlation coefficient)
独立性检验
(例题分析)
Hale Waihona Puke Baidu9 - 18
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9.4 列联表中的相关测量
9.4.1 ? 相关系数
9.4.2 列联相关系数 9.4.3 V 相关系数
9 - 19
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表中的相关测量
9 - 11
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
拟合优度检验
(例题分析)
解:要回答观察频数与期望频数是否一致,检验 如下假设:
H0:观察频数与期望频数一致 H :观察频数与期望频数不一致
1
9 - 12
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9 -2
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
学习目标
1. 理解分类数据与c 2 统计量
2. 掌握拟合优度检验及其应用 3. 掌握独立性检验及其应用 4. 掌握测度列联表中的相关性
9 -3
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9.1 分类数据与列联表
9.1.1 分类数据 9.1.2 c 2统计量
9 -4
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
分类数据
9 -5
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
分类数据
1. 分类变量的结果表现为类别
? 例如:性别 (男, 女)
2. 各类别用符号或数字代码来测度
3. 使用分类或顺序尺度
? 你吸烟吗?
? 1.是;2.否
? 你赞成还是反对这一改革方案?
? 1.赞成;2.反对
4. 对分类数据的描述和分析通常使用列联表
5. 可使用?c?检验
9 -6
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
c ? 统计量
9 -7
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
9.2 拟合优度检验
9 - 10
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
拟合优度检验
(例题分析)
【例】 1912年4月15日,豪华巨轮泰坦尼
克号与冰山相撞沉没。当时船上共有共 2208人,其中男性 1738人,女性 470人。 海难发生后,幸存者为 718人,其中男性 374人,女性 344人,以的显著性水平检验 存活状况与性别是否有关。 (? ?0.05)
1. 测度2?2列联表中数据相关程度
2. 对于2?2 列联表,? 系数的值在0~1之间 3. ? 相关系数计算公式为
? ? c2
n
式中:c 2 ?
r ?
c ?
(fij
?
eij)2
i?1j?1 e
ij
n为实际频数的总个数即,样本容量
9 - 21
作者:贾俊平,中国人民大学统计学院
统计学 9.3 列联分析:独立性检验
STATISTICS (第五版)
9.3.1 列联表
9.3.2 独立性检验
9 - 14
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表
(contingency table)
1. 由两个以上的变量交叉分类的频数分布表
2. 行变量的类别用 r 表示, ri 表示第 i 个类别 3. 列变量的类别用 c 表示, cj 表示第 j 个类别 4. 每种组合的观察频数用 f 表示
ij
5. 表中列出了行变量和列变量的所有可能的组 合,所以称为列联表
6. 一个 r 行 c 列的列联表称为 r ? c 列联表
9 - 15
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
列联表的结构
(r ? c 列联表的一般表示)
列(c ) j
行(r )
j =1
i
i =1
f
解:H0:地区和原料等级之间是独立的(不存在依赖关系) H :地区和原料等级之间不独立 (存在依赖关系)
1
c? 0.05(4)=9.488故拒绝H0,接受H1 ,即地区和原 料等级之间存在依赖关系,原料的质量受地区的影响
9 - 17
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
11
i=2
f
21
:
:
列(c ) j
j=2
f
12
f
22
:
合计
c
c
1
2
f 表示第 i 行第 j 列的观察频数
ij
9 - 16
合计 …
…
r
1
…
r
2
:
:
…
n
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
独立性检验
(例题分析)
【例】一种原料来自三个不同的地区,原料质量被分成三个不 同等级。从这批原料中随机抽取500件进行检验,结果如表9-3 所示,要求检验各个地区和原料质量之间是否存在依赖关系? (? ?0.05)
统计学 第 9 章 分类数据分析
STATISTICS (第五版)
9 -1
作者:中国人民大学统计学院 贾俊平
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
第 9 章 分类数据分析
9.1 分类数据与c 2统计量 9.2 拟合优度 检验 9.3 列联分析:独立性检验 9.4 列联分析中应注意的问题
拟合优度检验
(例题分析)
自由度的计算为 df=R-1,R为分类变量类型的
个数。在本例中,分类变量是性别,有男 女两个类别 ,故 R=2 ,于是自由度 df=2-
1=1,经查分布表, c ?(0.1)(1)=2.706,故
拒绝H0,说明存活状况与性别显著相关
9 - 13
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
c ? 统计量
1. 用于检验分类变量拟合优度 2. 计算公式为
? c 2 ?
( f ? f )2
o
e
f
e
9 -8
作者:贾俊平,中国人民大学统计学院
统计学
STATISTICS (第五版)
c ? 统计量
分布与自由度的关系
9 -9
作者:贾俊平,中国人民大学统计学院