独立性检验PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3
4
学习目标
1.会列2×2列联表,会画等高条形图 2.会从2×2列联表,等高条形图中直观 的判断出两个分类变量之间是否有关? 3.了解独立性检验的基本思想和步骤
5
• 某医疗机构为了了解患呼吸道疾病与
吸烟是否有关,进行了一次抽样调查,共调
查了515个成年人,其中吸烟者220人,不吸 烟者295 人,调查结果是:吸烟的220 人中 37人患呼吸道疾病, 183人未患呼吸道 疾病;不吸烟的295人中21人患病, 274人 未患病。
③计算 22;
2
n(ad bc)2
(a b)(c d )(a c)(b d )
` ④查临界值表;
(n a b c d为样本量)
⑤下结论。
13
1、列2× 2联表
吸烟 不吸烟
总计
吸烟与患呼吸道疾病关系列联表
患病
不患病
总计
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d
11
思考交流:
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
12
统计学对此类问题提供了这样的方法:
①数据整理;(列2× 2联表)
②做出相反的假设;(“患病与吸烟没有关系”)
此课件可编辑版,如对课件有异 议或侵权的请及时联系删除! 课件可编辑版,请放心使用!
.
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、
宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量的之间是否有关系
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
20
5、下结论
已知在 H0成立的情况下,
P( 2 11.8634) 0.001以下
故有99.9%的把握认为H0不成立,即有99.9% 的把握认为“患呼吸道疾病与吸烟有关系”。
21
网络链接——检验结果
22
DNA亲子鉴定的原理和程序
DNA是从几滴血,腮细胞或培养的组织纤内提取而 来.用畴素将DNA样本切成小段,放进喱胶内,用电泳槽推动 DNA小块使之分离--最细的在最远,最大的最近. 之後, 分 离开的基因放在尼龙薄膜上,使用特别的DNA探针去寻找基 因, 相同的基因会凝聚于一,然後,利用特别的染料,在X光 的环境下,便显示由DNA探针凝聚于一的黑色条码.小孩这 种肉眼可见的条码很特别 ----一半与母亲的吻合,一半与 父亲的吻合.这过程重覆几次,每一种探针用于寻找DNA的 不同部位并影成独特的条码,用几组不同的探针,可得到超 过99,9%的父系或然率或分辨率.
●
根据这些数据能否断定:患呼吸道疾病与 吸烟有关?
6
列联表
为了调查吸烟是否对呼吸道有影响,某医疗研究所随 机地调查了515人,得到如下结果(单位:人)
吸烟与患呼吸道疾病列联表
患病 不患病 总计
吸烟
37
183
220
不吸烟
21
274
295
总计
58
457
515
在不吸烟者中患病的比重是 7.12%
在吸烟者中患病的比重是
14
2、做出相反的假设
结论的可靠 程度如何?
通过数据和图表分析,得到结论是: 吸烟与患呼吸道病有关
H0: 吸烟 和患呼吸道疾病没有关系
15
3、计算 2
吸烟与患呼吸道疾病关系列联表
Байду номын сангаас
患病
不患病
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
a
吸烟的人中患病的比例: a b
不吸烟的人中患病的比例: c
2
a
nad bc2 bc d a cb
d
通过公式计算
其中n a b c d
2 51537 274 211832 11.8634
58 457 220 295 19
4、查表
1)如果P( 2>10.828)= 0.001表示有99.9%的把握认为”X与Y”有关 系2);如果P( 2>7.879)= 0.005表示有99.5%的把握认为”X与Y”有关系; 3)如果P( 2>6.635)= 0.01表示有99%的把握认为”X与Y”有关系; 4)如果P( 2>5.024)= 0.025表示有97.5%的把握认为”X与Y”有关系; 5)如果P( 2>3.841)= 0.05表示有95%的把握认为”X与Y”有关系; 6)如果P( 2>2.706)= 0.10表示有90%的把握认为”X与Y”有关系; 7)如果P( 2≤2.706),就认为没有充分的证据显示”X与Y”有关系;
变量 分类变量——独独立立性性检检验相验关指数R2、残差分析)
本节研究的是两个分类变量的独立性检验问题。
2
日常生活中我们关心这样一些问题: 1. 吸烟与患呼吸道疾病有无关系? 2. 饮食与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题用什么知识来解决呢?
统计学中检验两个变量是否有关系的一 种统计方法———独立性检验
c d
16
若H0成立
a≈c, a+b c+d
ac+d≈ca + b,
ad bc 0
| ad bc | 越小,说明吸烟与患呼 吸道疾病关系越弱;
| ad bc | 越大,说明吸烟与患呼 吸道疾病关系越强;
17
统计学家为了消除样本量对上式的影响,引入
了卡方统计量 2
2
a
nad bc2 bc d a cb
d
其中n a b c d
作为检验在多大程度上可以认为“两个变量
有关系”的标准 。
18
吸烟与患呼吸道疾病列联表
患病 不患病 总计
吸烟 37 183 220
不吸烟 21 274 295
总计
58 457 515
16.82%
7
1)通过图形直观判断
300
250 200 150 100
50 0
不患患肺病癌 患患病肺癌
吸烟 不吸烟
三维柱 状图
不吸烟 吸烟
8
2) 通过图形直观判断
350 300 250 200 150 100
50 0 不吸烟
吸烟
二维条 形图
患肺病癌 不患患肺病癌
9
3)通过图形直观判断
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
不吸烟
吸烟
患病 比例
患患病肺癌 不不患患病肺癌
不患病 比例
10
初步结论:
问题1:吸烟与不吸烟,患病的可能性的大小是 否有差异?
吸烟者和不吸烟者患呼吸道疾病的可能性存在差 异,吸烟者患呼吸道疾病的可能性大
问题2:差异大到什么程度才能作出“吸烟与患病有 关”的判断?
问题3:能否用数量刻画出“有关”的程度?
4
学习目标
1.会列2×2列联表,会画等高条形图 2.会从2×2列联表,等高条形图中直观 的判断出两个分类变量之间是否有关? 3.了解独立性检验的基本思想和步骤
5
• 某医疗机构为了了解患呼吸道疾病与
吸烟是否有关,进行了一次抽样调查,共调
查了515个成年人,其中吸烟者220人,不吸 烟者295 人,调查结果是:吸烟的220 人中 37人患呼吸道疾病, 183人未患呼吸道 疾病;不吸烟的295人中21人患病, 274人 未患病。
③计算 22;
2
n(ad bc)2
(a b)(c d )(a c)(b d )
` ④查临界值表;
(n a b c d为样本量)
⑤下结论。
13
1、列2× 2联表
吸烟 不吸烟
总计
吸烟与患呼吸道疾病关系列联表
患病
不患病
总计
a
b
a+b
c
d
c+d
a+c
b+d
a+b+c+d
11
思考交流:
反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
12
统计学对此类问题提供了这样的方法:
①数据整理;(列2× 2联表)
②做出相反的假设;(“患病与吸烟没有关系”)
此课件可编辑版,如对课件有异 议或侵权的请及时联系删除! 课件可编辑版,请放心使用!
.
两种变量:
定量变量:体重、身高、温度、考试成绩等等。
变量 分类变量:性别、是否吸烟、是否患肺癌、
宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量的之间是否有关系
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
20
5、下结论
已知在 H0成立的情况下,
P( 2 11.8634) 0.001以下
故有99.9%的把握认为H0不成立,即有99.9% 的把握认为“患呼吸道疾病与吸烟有关系”。
21
网络链接——检验结果
22
DNA亲子鉴定的原理和程序
DNA是从几滴血,腮细胞或培养的组织纤内提取而 来.用畴素将DNA样本切成小段,放进喱胶内,用电泳槽推动 DNA小块使之分离--最细的在最远,最大的最近. 之後, 分 离开的基因放在尼龙薄膜上,使用特别的DNA探针去寻找基 因, 相同的基因会凝聚于一,然後,利用特别的染料,在X光 的环境下,便显示由DNA探针凝聚于一的黑色条码.小孩这 种肉眼可见的条码很特别 ----一半与母亲的吻合,一半与 父亲的吻合.这过程重覆几次,每一种探针用于寻找DNA的 不同部位并影成独特的条码,用几组不同的探针,可得到超 过99,9%的父系或然率或分辨率.
●
根据这些数据能否断定:患呼吸道疾病与 吸烟有关?
6
列联表
为了调查吸烟是否对呼吸道有影响,某医疗研究所随 机地调查了515人,得到如下结果(单位:人)
吸烟与患呼吸道疾病列联表
患病 不患病 总计
吸烟
37
183
220
不吸烟
21
274
295
总计
58
457
515
在不吸烟者中患病的比重是 7.12%
在吸烟者中患病的比重是
14
2、做出相反的假设
结论的可靠 程度如何?
通过数据和图表分析,得到结论是: 吸烟与患呼吸道病有关
H0: 吸烟 和患呼吸道疾病没有关系
15
3、计算 2
吸烟与患呼吸道疾病关系列联表
Байду номын сангаас
患病
不患病
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
a
吸烟的人中患病的比例: a b
不吸烟的人中患病的比例: c
2
a
nad bc2 bc d a cb
d
通过公式计算
其中n a b c d
2 51537 274 211832 11.8634
58 457 220 295 19
4、查表
1)如果P( 2>10.828)= 0.001表示有99.9%的把握认为”X与Y”有关 系2);如果P( 2>7.879)= 0.005表示有99.5%的把握认为”X与Y”有关系; 3)如果P( 2>6.635)= 0.01表示有99%的把握认为”X与Y”有关系; 4)如果P( 2>5.024)= 0.025表示有97.5%的把握认为”X与Y”有关系; 5)如果P( 2>3.841)= 0.05表示有95%的把握认为”X与Y”有关系; 6)如果P( 2>2.706)= 0.10表示有90%的把握认为”X与Y”有关系; 7)如果P( 2≤2.706),就认为没有充分的证据显示”X与Y”有关系;
变量 分类变量——独独立立性性检检验相验关指数R2、残差分析)
本节研究的是两个分类变量的独立性检验问题。
2
日常生活中我们关心这样一些问题: 1. 吸烟与患呼吸道疾病有无关系? 2. 饮食与心脏病之间有无关系? 3. 性别与喜欢数学课之间有无关系? 以上问题用什么知识来解决呢?
统计学中检验两个变量是否有关系的一 种统计方法———独立性检验
c d
16
若H0成立
a≈c, a+b c+d
ac+d≈ca + b,
ad bc 0
| ad bc | 越小,说明吸烟与患呼 吸道疾病关系越弱;
| ad bc | 越大,说明吸烟与患呼 吸道疾病关系越强;
17
统计学家为了消除样本量对上式的影响,引入
了卡方统计量 2
2
a
nad bc2 bc d a cb
d
其中n a b c d
作为检验在多大程度上可以认为“两个变量
有关系”的标准 。
18
吸烟与患呼吸道疾病列联表
患病 不患病 总计
吸烟 37 183 220
不吸烟 21 274 295
总计
58 457 515
16.82%
7
1)通过图形直观判断
300
250 200 150 100
50 0
不患患肺病癌 患患病肺癌
吸烟 不吸烟
三维柱 状图
不吸烟 吸烟
8
2) 通过图形直观判断
350 300 250 200 150 100
50 0 不吸烟
吸烟
二维条 形图
患肺病癌 不患患肺病癌
9
3)通过图形直观判断
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
不吸烟
吸烟
患病 比例
患患病肺癌 不不患患病肺癌
不患病 比例
10
初步结论:
问题1:吸烟与不吸烟,患病的可能性的大小是 否有差异?
吸烟者和不吸烟者患呼吸道疾病的可能性存在差 异,吸烟者患呼吸道疾病的可能性大
问题2:差异大到什么程度才能作出“吸烟与患病有 关”的判断?
问题3:能否用数量刻画出“有关”的程度?