独立性检验 PPT课件
合集下载
独立性检验-高二数学课件(人教B版2019选择性必修第二册)
(1)事件 (2)事件
A B
发生的概率可估计为P( A) 发生的概率可估计为P(B)
a a
c n b
(3)事件 AB 发生的概率可估计为
P(
n AB)
a
n
如果 A 与 B 独立,那么上述 P( AB)与 P( A )P( B )的估计值
相差不会太大,注意到总数为 n,因此利用后者可以估计出,理论上
非优秀 45 30
总计 55 50
总计
30
75
105
题型二:独立性检验解决实际问题
例5:有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分
以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机 抽取1人为优秀的概率为 2 .
7
(2)根据列联表的数据,若按照95%的可靠性要求,能否认为“成绩与班
既是 A 又是 B 的数据有n P( A )P( B )个,注意到实际的数据为 a
(即n P( AB ))个,因此
[nP( AB) nP( A)P(B)]2 [na n(a c)(a b)]2
nP( A)P(B)
na c(a b)
不会太大.
类似地,考虑 A 与 B ,A 与 B ,A 与 B ,可知
3
33
合计 3x x 4x 11.20 x 14.65 33.60 3x 43.96
题型二:独立性检验解决实际问题
例4:某年调查某桑场采桑人员和不采桑人员的桑毛虫皮炎发病情 况,结果如表所示,利用列联表的独立性检验估计“患桑毛虫皮 炎病与采桑”是否有关?认为两者有关系犯错误的概率是多少?
采桑 不采桑 合计
由于12.981>6.635,所以在犯错误的概率不超过1%的前提下,
832独立性检验课件(共19张PPT)
效果是否比甲种疗法好.
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,经计算得到
×
(
×
−
×
)
=
≈ . > . = . .
× × ×
根据小概率值=0.05的 独立性检验,我们推断 H0不成立,即可以认为两种疗法
癌有关系”.
讲
课
人
:
邢
启
强
16
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
7775
42
0.9946,
0.0054
7817
7817
吸烟者中不患肺癌和患肺癌的评率分别为
2099
49
0.9772,
0.0228
2148
2148
0.0228
由
4.2
0.0054
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4
2
复习巩固
两个分类变量之间关联关系的定性分析的方法:
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大
小进行比较来分析分类变量之间是否有关联关系.
如可以通过列联表中
与
值的大小粗略地判断分类变量x和Y之间有无
+
+
关系.一般其值相差越大,分类变量有关系的可能性越大.
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互
8.3列联表与独立性检验
8.3.2 独立性检验
复习巩固
2×2列联表的概念
按研究问题的需要,将数据分类统计,并做成表格加以保存,这种形
解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,经计算得到
×
(
×
−
×
)
=
≈ . > . = . .
× × ×
根据小概率值=0.05的 独立性检验,我们推断 H0不成立,即可以认为两种疗法
癌有关系”.
讲
课
人
:
邢
启
强
16
根据表中的数据计算不吸烟者中不患肺癌和患肺癌的频率分别为
7775
42
0.9946,
0.0054
7817
7817
吸烟者中不患肺癌和患肺癌的评率分别为
2099
49
0.9772,
0.0228
2148
2148
0.0228
由
4.2
0.0054
可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌频率的4
2
复习巩固
两个分类变量之间关联关系的定性分析的方法:
(1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大
小进行比较来分析分类变量之间是否有关联关系.
如可以通过列联表中
与
值的大小粗略地判断分类变量x和Y之间有无
+
+
关系.一般其值相差越大,分类变量有关系的可能性越大.
(2)图形分析法:与表格相比,图形更能直观地反映出两个分类变量间是否互
8.3列联表与独立性检验
8.3.2 独立性检验
复习巩固
2×2列联表的概念
按研究问题的需要,将数据分类统计,并做成表格加以保存,这种形
8.3.2 独立性检验-高二数学课件(人教A版2019选择性必修第三册)
作“卡方独立性检验”,简称独立性检验.
概念讲解
下表给出了 2 独立性检验中几个常用的小概率值和相应的临界值.
α
xα
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879 10.828
例如,对于小概率值 = 0.05,我们有如下的具体检验规则:
(1)当 2 ≥ 0.05 = 3.841时,我们推断0 不成立,即认为和不独立,该推断犯错
样的方法对治疗情况进行检查,得到了如下数据: 抽到接受甲种疗法的患儿67
名,其中未治愈15名,治愈52名; 抽到接受乙种疗法的患儿69名,其中未治愈
6名,治愈63名. 试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果
是否比甲种疗法好.
例题剖析
解:零假设为0 :疗法与疗效独立,即两种疗法效果没有差异.
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,
将数据分类统计,并做成表格加以保存. 我们将形如下表这种形式的数据统
计表称为2×2列联表. 2×2列联表给出了(Y=0)
乙(Y=1)
合计
A(X=0)
a
b
a+b
B(X=1)
c
a+c
d
b+d
c+d
合计
a+b+c+d
2
这说明,对调两种疗法的位置,不会影响χ2取值的计算结果,同理对调
两种疗效的位置也不会影响结果.
例题剖析
例3.为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调
查了9965人,得到成对样本观测数据的分类统计结果,如表所示.依据小概率值 =
8.3.2独立性检验 课件—高二下数学人教A版(2019)选择性必修第三册
P( x )
2
临界值xα
的方法称为χ2独立性检验,
读作“卡方独立性检验”,
简称独立性检验.
概率值α越小,临界值xα越大.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立
性检验,读作“卡方独立性检验”,简称独立性检验.
犯错误的
概率
例2: 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,
甲校
乙校
合计
你认为“两校学生的数
学成绩优秀率存在差异”
这一结论是否有可能是
错误的?
因此,需要找到一种更为合理的推断方法,希望能对出现错误
判断的概率有一定的控制或估算。
本节课给到一个方法:独立性检验
独立性检验是一种“概率反证法”。依据是小概率原理(在一次实
验中几乎不可能发生)
找到了,假设不成立,嫌
疑人有罪。
例4 :为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机
抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,
如下表所示. 依据小概率值α=0.001的独立性检验,分析吸烟是否会增加
患肺癌的风险.
解:零假设为H0: 吸烟与患肺癌之间
无关联,由表中数据可得
9965(7775 49 42 2099)
数学成绩
不优秀
优秀
合计
甲校
乙校
合计
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优
秀率无差异根据表中的数据,计算得到
2
88
(33
7
10
38)
2
0.837 2.706 x0.1
概率论与数理统计课件 L5.8独立性检验
pij P{X Ai ,Y Bj}, i 1,..., r, j 1,..., q
pi P{X Ai}, i 1,..., r
p j P{Y Bj}, j 1,..., q
则有
q
r
pi pij , p j pij , i 1,...,r, j 1,...,q
j 1
i1
估计。当H0成立时,似然函数为
rq
rq
L( pi, p j )
p Ni j ij
( pi p j )Ni j
i1 j1
i1 j1
r i 1
p Ni i
q j 1
p N j
j
6
利用前面的方法 我们可以进行列联表的独立性检验
首先 可以证明 参数pi·与pj的最大似然估计为
pˆi
Ni n
pˆ j
N j n
i1
r
j1
q
r
q
其次 由于 pi p j 1 故 rq 个参数 pi·与 p·j 中仅有 rq2 个
i1
j 1
独立参数 于是相应的统计量
02
n
r i1
q j1
Nij
NiN n
NiN j
j
2
渐近服从2(rq(rq2)1)(即2((r1)(q1)))分布
(520)
拒绝域相应为
N2.
… …
… … …
r
Nr1 Nr2 … Nrq
r
N j Nij N.1 N.2 … N.q i 1
Nr. n
5
二、独立性检验问题
考虑二元总体(X Y)的非参数假设检验问题
H0 X与Y独立 上述假设检验问题可转化为多参数假设检验问题
独立性检验(课件)高二数学(人教A版2019选修第三册)
|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.
2.3独立性检验PPT优秀课件
吸烟 不吸烟
总计
患病 a c
a+c
不患病 b d
b+d
总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
2abc n a d d a bc c 2bd
其 n 中 a b c d
第四步:查对临界值表,作出判断。
P(≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
解:H0: 吸烟和患病之间没有关系
患病 不患病
吸烟
49
2099
不吸烟
42
7775
总计
91
9874
总计 2148 7817 9965
通过公式计算
299 767 5 4 7 9 4 5 2 20 2 959 .6 63
782 11 7 9 48 8 9 71 4
已知在 H 0 成立的情况下,
――[阿萨·赫尔帕斯爵士] 115.旅行的精神在于其自由,完全能够随心所欲地去思考.去感觉.去行动的自由。――[威廉·海兹利特]
P(21.0 82) 80.001
即在 H 0 成立的情况下, 2大于10.828概率非常 小,近似为0.001 现在的 =2 56.632的观测值远大于10.828, 出现这样的观测值的概率不超过0.001。
故有99.9%的把握认为H0不成立,即有99.9% 的把握认为“患病与吸烟有关系”。
97.有三个人是我的朋友爱我的人.恨我的人.以及对我冷漠的人。 爱我的人教我温柔;恨我的人教我谨慎;对我冷漠的人教我自立。――[J·E·丁格] 98.过去的事已经一去不复返。聪明的人是考虑现在和未来,根本无暇去想过去的事。――[英国哲学家培根] 99.真正的发现之旅不只是为了寻找全新的景色,也为了拥有全新的眼光。――[马塞尔·普劳斯特] 100.这个世界总是充满美好的事物,然而能看到这些美好事物的人,事实上是少之又少。――[罗丹] 101.称赞不但对人的感情,而且对人的理智也发生巨大的作用,在这种令人愉快的影响之下,我觉得更加聪明了,各种想法,以异常的速度接连涌入我的脑际。――[托尔斯泰] 102.人生过程的景观一直在变化,向前跨进,就看到与初始不同的景观,再上前去,又是另一番新的气候――。[叔本华] 103.为何我们如此汲汲于名利,如果一个人和他的同伴保持不一样的速度,或许他耳中听到的是不同的旋律,让他随他所听到的旋律走,无论快慢或远近。――[梭罗] 104.我们最容易不吝惜的是时间,而我们应该最担心的也是时间;因为没有时间的话,我们在世界上什么也不能做。――[威廉·彭] 105.人类的悲剧,就是想延长自己的寿命。我们往往只憧憬地平线那端的神奇【违禁词,被屏蔽】,而忘了去欣赏今天窗外正在盛开的玫瑰花。――[戴尔·卡内基] 106.休息并非无所事事,夏日炎炎时躺在树底下的草地,听着潺潺的水声,看着飘过的白云,亦非浪费时间。――[约翰·罗伯克] 107.没有人会只因年龄而衰老,我们是因放弃我们的理想而衰老。年龄会使皮肤老化,而放弃热情却会使灵魂老化。――[撒母耳·厄尔曼] 108.快乐和智能的区别在于:自认最快乐的人实际上就是最快乐的,但自认为最明智的人一般而言却是最愚蠢的。――[卡雷贝·C·科尔顿] 109.每个人皆有连自己都不清楚的潜在能力。无论是谁,在千钧一发之际,往往能轻易解决从前认为极不可能解决的事。――[戴尔·卡内基] 110.每天安静地坐十五分钟·倾听你的气息,感觉它,感觉你自己,并且试着什么都不想。――[艾瑞克·佛洛姆] 111.你知道何谓沮丧---就是你用一辈子工夫,在公司或任何领域里往上攀爬,却在抵达最高处的同时,发现自己爬错了墙头。--[坎伯] 112.「伟大」这个名词未必非出现在规模很大的事情不可;生活中微小之处,照样可以伟大。――[布鲁克斯] 113.人生的目的有二:先是获得你想要的;然后是享受你所获得的。只有最明智的人类做到第二点。――[罗根·皮沙尔·史密斯] 114.要经常听.时常想.时时学习,才是真正的生活方式。对任何事既不抱希望,也不肯学习的人,没有生存的资格。
江苏省无锡市第一中学高二数学选修2-3第3章第1节《独立性检验》课件(共35张PPT)
P(χ2≥x0)
0.050
0.010
x0
3.841
6.635
χ2=(a+b)(cn+(da)d-(bac+)c2)(b+d).
0.001 10.828
【解】 (1)记 B 表示事件“旧养殖法的箱产量低于 50 kg”,C 表示事件“新养殖法的箱产量不低于 50 kg”. 由题意知 P(A)=P(BC)=P(B)P(C). 旧养殖法的箱产量低于 50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 故 P(B)的估计值为 0.62. 新养殖法的箱产量不低于 50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故 P(C)的估计值为 0.66. 因此,事件 A 的概率估计值为 0.62×0.66=0.409 2.
由某个样本得到的推断有可能正确的,也有可能错误. 利用 2 进行独立性检验,可以对推断的正确性的概率
作出估计,n 越大,这个估计越准确.
例 1:为研究不同的给药方式(口服与注射)和药的效果(有 效和无效)是否相关,选取 193 个人进行了相应的抽样调查, 调查结果如下:口服有效的有 58 人,口服无效的有 40 人,注 射有效的有 64 人,注射无效的的有 31 人.能否做出药的效果 与给药方式有关的结论?
吸烟 不吸烟 总计
患肺癌 a c
a+c
不患肺癌 b d
b+d
总计 a+b c+d a+b+c+d
若设n a b c d 则P(A) a b P(B) a c
则P(AB) a b a c
n
n
nn
假设H0:吸烟和患肺癌之间没有关系
独立性检验PPT课件
用“假设检验”解决此问题
Page 3
请看下面的表格
表(一)
表(二)
Page 4
(一)反证法思想
结论如下:
︱ad – bc ︱越小,说明吸 烟与患肺癌之间的关系越 弱。
︱ad – bc ︱越大,说明吸 烟与患肺癌之间的关系越 强。
Page 5
(二)统一的评判标准
一般认为,小概率事件在一次 试验中不会发生,据此原则, 如果在某种假设下小概率事件 在一次试验中发生了,则认为 此假设不成立。(即H0不成立)
谢 谢 !ຫໍສະໝຸດ Page 6表(三) K2检验的临界值表
Page 7
(三) 假设检验的基本步骤:
(1)假设H0:两个分类变量没有关系; (2)求K2的观测值k; (3)⒈给定显著性水平α ,查表(三)定出临界值k0,与k进行 比较;⒉未给定显著性水平α,根据实际问题的需要确定容 许推断“两个分类变量有关系”犯错误概率的上界α,然后查 表(三)确定临界值k0 与k进行比较;
(4)若k≥k0,则拒绝H0,认为两个分类变量有关系; 若k<k0, 则接受H0,认为两个分类变量没有关系。
Page 8
小结: 反证法原理与假设检验原理
反证法原理
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
Page 9
假设检验原理
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
1.2 独立性检验的基本 思想及其初步应用
樊永丽
樊永丽
-
1
有一个颠扑不破的真理,那就是当我 们不能确定什么是真的时候,我们就
应该去探求什么是最可能的。 ----------笛卡尔
Page 3
请看下面的表格
表(一)
表(二)
Page 4
(一)反证法思想
结论如下:
︱ad – bc ︱越小,说明吸 烟与患肺癌之间的关系越 弱。
︱ad – bc ︱越大,说明吸 烟与患肺癌之间的关系越 强。
Page 5
(二)统一的评判标准
一般认为,小概率事件在一次 试验中不会发生,据此原则, 如果在某种假设下小概率事件 在一次试验中发生了,则认为 此假设不成立。(即H0不成立)
谢 谢 !ຫໍສະໝຸດ Page 6表(三) K2检验的临界值表
Page 7
(三) 假设检验的基本步骤:
(1)假设H0:两个分类变量没有关系; (2)求K2的观测值k; (3)⒈给定显著性水平α ,查表(三)定出临界值k0,与k进行 比较;⒉未给定显著性水平α,根据实际问题的需要确定容 许推断“两个分类变量有关系”犯错误概率的上界α,然后查 表(三)确定临界值k0 与k进行比较;
(4)若k≥k0,则拒绝H0,认为两个分类变量有关系; 若k<k0, 则接受H0,认为两个分类变量没有关系。
Page 8
小结: 反证法原理与假设检验原理
反证法原理
在一个已知假 设下,如果推 出一个矛盾, 就证明了这个 假设不成立。
Page 9
假设检验原理
在一个已知假设 下,如果推出一 个小概率事件发 生,则推断这个 假设不成立的可 能性很大。
1.2 独立性检验的基本 思想及其初步应用
樊永丽
樊永丽
-
1
有一个颠扑不破的真理,那就是当我 们不能确定什么是真的时候,我们就
应该去探求什么是最可能的。 ----------笛卡尔
8.3.2 独立性检验(PPT)超好用的优秀公开课获奖课件高二数学同步精品课堂(新教材人教A版选择性
独立性检验的步骤 第一步,确定分类变量,获取样本频数,得到列联表. 第二步,根据实际问题的需要确定容许推断“两个分类变量有关 系”犯错误概率的上界 α,然后查表确定临界值 xα. 第三步,利用公式 χ2=a+bcn+add-ab+cc2b+d计算随机变量 χ2.
第四步,作出判断.如果 χ2≥xα,就推断“X 与 Y 有关系”,这种推 断犯错误的概率不超过 α,否则就认为在犯错误的概率不超过 α 的前 提下不能推断“X 与 Y 有关系”,或者在样本数据中没有发现足够 证据支持结论“X 与 Y 有关系”.
喜欢甜品 不喜欢甜品 合计
南方学生 60
20
80
北方学生 10
合计
70
10
20
30
100
根据表中数据,问是否在犯错误的概率不超过 0.05 的前提下认为 “南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
解:将 2×2 列联表中的数据代入公式计算,得 χ2=a+bcn+add-ab+cc2b+d =100×70×603×0×108-0×202×0 102=12010≈4.762. 因为 4.762>3.841,所以在犯错误的概率不超过 0.05 的前提下认为 “南方学生和北方学生在选用甜品的饮食习惯方面有差异”.
班级与成绩统计表 优秀 不优秀 合计
甲班 11 34 45
A 解析:随机变量
乙班 8
37 45
χ2=90×19×117×1×374-5×344×582≈0.600. 合计 19
71
90
独立性检验的基本思想
【例 1】某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学 生中进行了抽样调查,调查结果如下表所示:
第八章 成对数据的统计分析
独立性检验高二数学市公开课一等奖省赛课获奖PPT课件
课前探究学习
课堂讲练第9互页动
题型一 2×2列联表
【例1】 某学校对高三学生作一项调查后发觉:在平时模拟 考试中,性格内向426名学生中有332名在考前心情紧 张,性格外向594名学生中在考前心情担心有213 人.请作出考前心情担心与性格列联表. [思绪探索] 在2×2列联表中,共有两类变量,每一类变
课前探究学习
课堂讲练第1互9页动
[规范解答] 对于上述四个科目,分别构造四个随机变量 χ21,χ22,χ23,χ42由表中数据可以得到 语文:χ21=244× 2011×744×3×132-042×7×40302≈7.294>6.635,(3 分) 数学:χ22=244× 2011×784×3×202-012×3×43232≈30.008>10.828, (6 分) 英语:χ23=244× 2011×764×3×192-002×5×44242≈24.155>10.828, (9 分)
因此有 99%的把握认为聋与哑有关.
课前探究学习
课堂讲练第1互4页动
规律方法 (1)判断两个研究对象是否有关的方法 可以利用独立性检验来考查两个研究对象是否有关,并 且能较精确地给出这种判断的可靠程度.具体做法是: 根据观测数据计算由公式给出的检验统计量 χ2 的值,其 值越大,说明“X 与 Y 有关”成立的可能性越大. (2)本题是利用 χ2=a+bcn+add-ab+cc2b+d求出 χ2 的 值,再利用 χ2 与临界值的大小关系来判断假设是否成立, 解题时应注意准确代数与计算,不可错用公式,要准确 进行比较与判断.
于研究两类变量之间是否相互独立.它适合用于分析两
类变
量之间关系,是对两类变量进行独立性检验基础.
(2)使用统计量作2×2列联表独立性检验时,要求表中四
独立性检验-PPT课件
a b c d
|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强.
为了使不同样本容量的数据有统一的评判标准,基于 上述分析,我们构造一个随机变量
2 2
n ( a d b c ) ( 1) K ( a cb ) ( da ) ( bc ) ( d )
如是否吸烟、宗教信仰、是否患肺癌、国籍等等. 在日常生活中,主要考虑分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等.
为调查吸烟是否对患肺癌有影响,某肿 瘤研究所随机地调查了9965人,得到如下 结果:其中吸烟者2148人,不吸烟者7817 人,吸烟的2148人中49人患肺癌, 2099不患肺癌;不吸烟的7817人中42人 患肺癌, 7775人不患肺癌。 根据这些数据能否断定:患肺癌与吸烟有 关吗?
二维条形图
3)通过图形直观判断两个分类变量是否相关: 等高条形图
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 不吸烟 吸烟
患肺癌 比例
患肺癌 不患肺癌
不患肺癌 比例
上面我们通过分析数据和图形,得到的直观印象是吸 烟和患肺癌有关,那么事实是否真的如此呢?这需要 用统计观点来考察这个问题. 现在想要知道能够以多大的把握认为“吸烟与患肺癌 有关”,为此先假设: H0:吸烟与患肺癌没有关系
2×2列联 为了研究这个问题,我们将上述问题用下表表示: 表
不患肺癌
不吸烟 吸烟 总计 7775 2099 9874
患肺癌
42 49 91
总计
7817 2148 9965
在不吸烟者中患肺癌的比重是 0.54% 在吸烟者中患肺癌的比重是 2.28%
8.3.2独立性检验 课件
否据此推断两校学生的数学成绩优秀率有差异?
解:零假设为H0:分类变量X和Y相互独立,即两校学生的数学成绩优秀
率无差异.根据8.3.1 例1表中数据可得:
×
(
×
−
×
)
=
≈ . < . = .
× × ×
根据小概率值α=0.1的2独立性检验,没有充分证据推断H0不成立,因
由已知,25名女性志愿者被检测出阳性恰有1人,故女性中阳性的频率0.04,
所以全部女性志愿者阳性共有200 x 0.04 = 8人。
由(1)知400名志愿者中,阳性的频率为0.03,所以阳性的人数共有400 x 0.03=12人
病是否独立”,即假设H0等价于P(AB)=P(A)P(B),为了研究的一般化,
用字母表示上表中的数据如下:
患病
不患病
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
新知导入
设n=a+b+c+d,则P(A)=(a+b)/n,P(B)=(a+c)/n,
P(AB)=[(a+b)/n][(a+c)/n],由此可知,在H0成立的条件下,
8.3.2 独立性检验
人教A版(2019)
选择性必修第三册
新知导入
为了了解呼吸道疾病与吸烟是否有关,某医疗机构进行了一次抽样调查,共调查了
515个成年人,其中吸烟者220人,不吸烟者295人,调查结果显示:吸烟的220
人中37人患病, 183人不患病;不吸烟的295人中21人患病, 274人不患病。
解:零假设为H0:分类变量X和Y相互独立,即两校学生的数学成绩优秀
率无差异.根据8.3.1 例1表中数据可得:
×
(
×
−
×
)
=
≈ . < . = .
× × ×
根据小概率值α=0.1的2独立性检验,没有充分证据推断H0不成立,因
由已知,25名女性志愿者被检测出阳性恰有1人,故女性中阳性的频率0.04,
所以全部女性志愿者阳性共有200 x 0.04 = 8人。
由(1)知400名志愿者中,阳性的频率为0.03,所以阳性的人数共有400 x 0.03=12人
病是否独立”,即假设H0等价于P(AB)=P(A)P(B),为了研究的一般化,
用字母表示上表中的数据如下:
患病
不患病
总计
吸烟
a
b
a+b
不吸烟
c
d
c+d
总计
a+c
b+d
a+b+c+d
新知导入
设n=a+b+c+d,则P(A)=(a+b)/n,P(B)=(a+c)/n,
P(AB)=[(a+b)/n][(a+c)/n],由此可知,在H0成立的条件下,
8.3.2 独立性检验
人教A版(2019)
选择性必修第三册
新知导入
为了了解呼吸道疾病与吸烟是否有关,某医疗机构进行了一次抽样调查,共调查了
515个成年人,其中吸烟者220人,不吸烟者295人,调查结果显示:吸烟的220
人中37人患病, 183人不患病;不吸烟的295人中21人患病, 274人不患病。
独立性检验(上课)PPT课件
课堂讲练互动
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
探究学习
课堂讲练互动
探究
列联表
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
探究学习
课堂讲练互动
回顾:
独立性检验的步骤:
1、写出列联表; 2、作出假设; 3、求出 K2 的值. 4、下结论(利用临界值的大小来判断假设是否成立).
探究学习
课堂讲练互动
题型 独立性的检验 【变式】 为研究学生的数学成绩与对学习数学的兴趣是否有关,
对某年级学生作调查得到如下数据:
成绩优秀 成绩较差 总计
探究学习
课堂讲练互动
【示例】 某小学对232名小学生调查中发现:180名男 生中有98名有多动症,另外82名没有多动症,52名 女生中有2名有多动症,另外50名没有多动症,用 独立性检验方法判断多动症与性别是否有关系? 解: 由题可列出如下列联表:
多动症 无多动症 总计
男生 98
82 180
女生 2
解:列出2×2列联表: 有兴趣 无兴趣 总计
理 文 总计 138 73 211 98 52 150 236 125 361
探究学习
课堂讲练互动
解 列出2×2列联表
理 文 总计 有兴趣 138 73 211
无兴趣 98 52 150
代入公式得 K2 的观测值
总计 236 125 361
k=36123×6×13182×5×522-117×3×159082≈1.871×10-4.
《§118 独立性检验》教学讲解课件
(教学讲解课件)
结构性特征值的作用
①频率:……
② 3δ原则:参《选修2-3》P:79~80
已知某组数据Y1,Y2,Y3,……的平均值为μ,标准差为σ 则在正常状态下,可以认为:
①数值Yi分布在区间(μ-σ, μ+σ)内的概率为0.6826 ②数值Yi分布在区间(μ-2σ, μ+2σ)内的概率为0.9544 ③数值Yi分布在区间(μ-3σ, μ+3σ)内的概率为0.9974
3.独立性检验的基本思想:
与反证法很类似 S1:先假设两个变量之间独立(没有关系): S2:然后根据小概率事件原理
检验“假设”是否具有“矛盾”
4.回归分析与独立性检验的区别:
①回归分析重在分析两变量是否具有因果关系 ②独立性检验重在分析两变量是否相互影响
一、有关概念: 二、独立性检验的简介: 三、检验独立性的方法:
<一>.频率法: <二>.等高条形图法: <三>.卡方检验:
1.卡方检验简述: 2.操作步骤及三个细节: 3.书写格式:
概率与统计简述
样本
抽样
估计 推断
总体
回归分析 分布列及期望 相关分析
(独立性检验)
概率 计数
回归分析重在分析两变量是否具有因果关系 相关分析重在分析两变量是否相互影响 (独立性检验)
法1:散点图法:
3.拟合效果的判定:
法2:残差法:
①残差图法: ②残差平方和法:
法3:相关指数R2法:
误差 e (Error)
残差 =真实值-预报值 yi yˆi 点(个体)误差 偏差 =真实值-均值 yi y
回归差 =预报值-均值 yˆi y
随机(整体)误差