3-2独立性检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

不患肺癌
a c a+c
患肺癌
b d b+d
总计
a+b c+d a+b+c+d
那么吸烟者中不患肺癌的比例应该与不吸烟者中相应 的比例差不多即
a c 即 a(c d) c(a b) ab cd
ad bc 0
因此 ad bc 越小说明吸烟与患肺癌之间关系越弱;
因此 ad bc 越大说明吸烟与患肺癌之间关系越强。
烟要用和统患计肺观癌点有来关考,察那这么个事问实题是。否真的如此呢?这不需患病 比例
患病 比例
1. 分类变量和列联表 (1)分类变量
变量的不同“值”表示个体所属的_不__同__类__别__,像这样的变
量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的_频__数__表__,称为列联表. ②2×2列联表
【例4】 下表是某地区的一种传染病与饮用水的调查表:
wk.baidu.com
干净水 不干净水
总计
得病 52 94 146
不得病 466 218 684
总计 518 312 830
(1)这种传染病是否与饮用水的卫生程度有关, 请说明理 由; (2)若饮用干净水得病5人,不得病50人,饮用不干净水 得病9人,不得病22人.按此样本数据分析这种疾病是否 与饮用水有关,并比较两种样本在反映总体时的差异.
总计
男生
98
82
180
女生
2
50
52
总计
100
132
232
k=23120×0×9183×2×501-802××58222≈42.117>10.828.
所以有 0.1%的把握认为多动症与性别有关系.
【例3】为了探究学生选报文、理科是否与对外语的 兴趣有关,某同学调查了361名高二在校学生,调 查结果如下:理科对外语有兴趣的有138人,无兴 趣的有98人,文科对外语有兴趣的有73人,无兴 趣的有52人.试分别用列联表、独立性检验的方 法分析学生选报文、理科与对外语的兴趣是否有 关?
超过α的前提下不能推断“X与Y有关系”,或者在样本
数据中_没__有__发__现__足__够__证__据__支持结论“X与Y有关系”
3、独立性检验临界值表
P(K2
≥k0)
0.50
0.40
0.25
0.15
0.10
0.05 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
不患肺癌
患肺癌
总计
不吸烟
7775
42
7817
吸烟
2099
49
2148
总计
9874
91
9965
在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患 肺癌的可能性大。
通过图形直观判断
我们通过分析数据和图形,得到的直观印象是吸
(1)假设该结论不成立,即假设结论“两个分类变量 没有关系”成立.
(2)在假设条件下,计算构造的随机变量K2,如果由 观测数据计算得到的K2很大,则在一定程度上说明假 设不合理.
(3)根据随机变量K2的含义,可以通过(2)式评价假 设不合理的程度,由实际计算出的k>6.635,说明假设 不合理的程度约为99%,即“两个分类有关系”这一结 论成立的可信程度约为99%.
4、临界值
P(K 2 k) 0.50 0.40 0.5 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.445 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
(1)如果k>10.828,就有99.9%的把握认为“X与Y有关系” (2)如果k>7.879,就有99.5%的把握认为“X与Y有关系”; (3)如果k>6.635,就有99%的把握认为“X与Y有关系”; (4)如果k>5.024,就有97.5%的把握认为“X与Y有关系”; (5)如果k>3.841,就有95%的把握认为“X与Y有关系”; (6)如果k>2.706,就有90%的把握认为“X与Y有关系”; (7)如果k<=2.706,就认为没有充分的证据显示
具体 步骤
①有②③犯根利如关错据用果系误”_实公的_k_犯际式≥概_k_错问计率0__误题算,概的随就率需机推的要变断上,量“界确KX2的定α与.然_容Y观_有后_许测_关查_推值_系表_断k_”确_“,定两这_个临_种_分界_推_类值_断_变k_0_量 _____________不超过α,否则就认为在犯错误的概率不
“X与Y有关系”.
例1:在一次天气恶劣的飞行航程中,调查了男女乘客
在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31
人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数
据判定:在天气恶劣的飞行航程中,男乘客是否比女乘客更
容易晕机?
【解】 根据题意,列出 2×2 列联表如下:
晕 机 不晕机 总 计
2、反证法原理与独立性检验原理的比较 反证法原理:在假设H0下,如果推出一个矛盾,就证明了H0 不成立.
独立性检验原理:在假设H0下,如果出现一个与H0相矛盾的 小概率事件,就推断H0不成立,且该推断犯错误的概率不超过 这个小概率.
独立性检验的基本思想:(类似于数学上的反证法,对 “两个分类变量有关系”这一结论成立可信程度的判断):
误区警示 因未理解P(K2≥k0)的含义而致错
【示例】 某小学对232名小学生调查中发现:180名男生中有 98名有多动症,另外82名没有多动症,52名女生中有2名 有多动症,另外50名没有多动症,用独立性检验方法判断 多动症与性别是否有关系?
[错解] 由题目数据列出如下列联表: 多动症 无多动症
男乘客
24
31
55
女乘客
8
26
34
总计
32
57
89
【例2】 某校对学生课外活动进行调查,结果整理成下表: 试用你所学过的知识进行分析,能否在犯错误的概率不 超过0.005的前提下,认为“喜欢体育还是文娱与性别有 关系”?
男生 女生 总计
体育 21 6 27
文娱 23 29 52
总计 44 35 79
合作探究
1、在2×2列联表中,如果两个分类变量没有关系,则应满 足什么条件?为什么? 2、反证法原理与独立性检验原理的比较 3、独立性检验的基本方法 4、临界值表的作用
应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;
|ad-bc|越大,关系越强.
假设H
:吸烟与患肺癌没有关系
0
不吸烟 吸烟 总计
x1 x2 总计
y1 a
c a+c
y2 b
d b+d
总计 a+b c+d a+b+c+d
2.独立性检验
定义
利用随机变量K2来判断“两个分类变量有关系”的方法 称为独立性检验
公式
nad-bc2
K2=__a_+__b__c_+__d___a_+__c__b_+__d__ 其中n=_a_+__b_+__c_+__d_
3.2 独立性检验的基本思想 及其初步应用
【课标要求】
1.了解独立性检验的基本思想、方法及其简单应用; 2.理解判断两个分类变量是否有关系的常用方法、独立性检
验中K2的含义及其实施步骤. 【核心扫描】
1.能够根据题目所给数据列出列联表及求K2.(重点) 2.独立性检验的基本思想和方法.(难点)
为了研究吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
相关文档
最新文档