独立性检验上课完整讲义

合集下载

人教版数学选择性必修三8.3.2独立性检验课件

人教版数学选择性必修三8.3.2独立性检验课件
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
每周平均体育运动时间
不超过4小时
每周平均体育运动时间
超过4小时
合计
男生
女生
合计
45
30
75
165
60
225
210
90
300
零假设为H0:该校学生的每周平均体育运动时间与性别无关.
结合列联表可算得
300× 45×60−30×165 2
(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.
(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成
每周平均体育运动时间与性别的列联表,并判断是否认为“该校学生的每周
平均体育运动时间与性别有关”.
附:
α
0.100
0.050
0.010
0.005

2.706
3.841
≈1.871×10-4.
∵1.871×10-4<2.706=x0.1,
根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,
即选报文、理科与对外语的兴趣无关.
总结提升
独立性检验的关注点
在2×2列联表中,如果两个分类变量没有关系,
则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;
合计
数学优秀
267
93
360
数学非优秀
99
781
880
合计
366
将表中数据代入公式,得
874
1240
32

【全版】数学:《独立性检验()》课件(苏教版选修)推荐PPT

【全版】数学:《独立性检验()》课件(苏教版选修)推荐PPT

99.9%把握认 为A与B有关
2 6.635
1%把握认 2 为 A与B无关
99%把握认 为A与B有关
2 2.706 10%把握认为
A与B无关
90%把握认 为A与B有关
2 2.706
没有充分的依据显示A与B有关, 但也不能显示A与B无关
反证法原理与假设检验原理
解:设H0:两种中草药的治疗效果没有差异。
第三步:引入一个随机变量:卡方统计量
2abc n a d d a bc c 2bd
其 n 中 a b c d
第四步:查对临界值表,作出判断。
P(Ⅹ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P( 2 x0 ) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如:
2 10.828
0.1%把握认 为A与B无关
12 7 2 19 895 因当H0成立时,χ2的概率大于15%,故不能否定假设H0,即不
能作出药的效果与给药方式有关的结论。
P(Ⅹ2≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828

8.3.2独立性检验课件(人教版)

8.3.2独立性检验课件(人教版)

结果.
学习目标
新课讲授
课堂总结
(2)如何基于②中的四个等式及列联表中的数据,构造适当的统计量,对
成对分类变量X和Y是否相互独立作出推断?
在零假设H0成立的条件下,根据频率稳定于概率的原理,由②中的第一
个等式,用概率P(X=0)和P(Y=0)对应的频率的乘积
(a b)(a c)
n2
估计概率P(X=0,Y=0), 而把 (a b)(a c)
=
≈ 4.881
67 × 69 × 21 × 115
2
不影响
合计
治愈
未治愈

52
15
67
67

63
6
69
136
合计
115
21
136
136 × (52 × 6 − 15 × 63)2
=
≈ 4.881
69 × 67 × 21 × 115
2
疗法
136 × (52 × 6 − 15 × 63)2
=
归纳总结
应用独立性检验解决实际问题大致应包括以下几个主要环节:
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算 2 的值,并与临界值x 比
较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析
X和Y间的影响规律.
0.005
0.001

2.706
3.841
6.635
7.879
10.828
例如:对于小概率值α=0.05,我们有如下的具体检测规则:
(1)当χ2≥x0.05=3.841时,

独立性检验PPT课件

独立性检验PPT课件

第三步:引入一个随机变量:卡方统计量 K 2ab c n a d d a b c c 2bd
第四步:查对临界值表(教材P13),作出判断。
利用独立性检验来考察两个分类变量是否有关系,
能较精确地给出这种判断的可靠程度. 具体作法是:
(1)根据实际问题需要的可信程度确定临界值k0; (2)由观测数据计算得到随机变量K2的观测值k; (3)如果k>6.635,就以 1-P(K2≥6.635)×100%的 把握认为“X与Y有关系”;否则就说样本观测数据没 有提供“X与Y有关系”的充分证据.
变 量 分 类 变 量 — — 独独立立性性检检验相 验关 指 数 R2、 残 差 分 析 )
本节研究的是两个分类变量的独立性检验问题。
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调 查了515个成年人,其中吸烟者220人,不 吸烟者295人,调查结果是:吸烟的220人 中37人患病, 183人不患病;不吸烟的 295人中21人患病, 274人不患病。
根据这些数据能否断定:患病与 吸烟有关吗?
为了研究这个问题,我们将上述列问2题×用2列下表联表表示:
患病 不患病 总计
吸烟
37
不吸烟
21
183
220
274
295
总计
58
457
515
两个分类变量之间是否有关系?
1.从列联表分别计算患病在两类中的频率。
在不吸烟者中患病的比重是 7.12% 在吸烟者中患病的比重是 16.82% 上述结论能说明吸烟与患病有关吗?
(2)利用图形判断性别与是否喜爱看《新 还珠格格》有关?
有一个颠扑不破的真理,那就是当 我们不能确定什么是真的时,我们就 应该去探求什么是最可能的。

高中数学选修课件第一章:独立性检验

高中数学选修课件第一章:独立性检验

注意事项与误区提示
在进行独立性检验前,需要确保样本 的随机性和代表性,以避免因样本偏 差导致结果失真。
需要注意的是,独立性检验只能判断 两个变量之间是否存在统计上的独立 性,并不能说明它们之间是否存在因 果关系或其他形式的关联。
在解读结果时,需要注意概率值(p 值)或临界值表的具体含义和适用条 件,避免误用或滥用。
高中数学选修课件第一 章:独立性检验
汇报人:XX 20XX-01-30
contents
目录
• 独立性检验基本概念 • 独立性检验基本思想解读 • 独立性检验方法介绍及应用场景分析 • 独立性检验结果解读与注意事项 • 独立性检验在统计学中地位和作用 • 高中数学选修课程中其他相关知识点回
顾与拓展
01
在实际应用中,还需要结合其他统计 方法和专业知识进行综合分析和判断 。
05
独立性检验在统计学中地位和作用
独立性检验在统计学中地位
独立性检验是统计学 中一种重要的假设检 验方法。
在数据分析、市场调 研、医学研究等领域 具有广泛应用。
它用于判断两个或多 个分类变量之间是否 相互独立。
独立性检验对后续统计分析影响
高中数学选修课程中其他相关知识点梳理
排列组合与二项式定理
回顾排列组合的基本概念、计算公式及应用,掌握二项式定理的展开式及通项公式的应 用。
概率与统计的综合应用
梳理概率与统计在高中数学选修课程中的综合应用,如概率与统计在解决实际问题中的 结合,以及概率与统计在其他数学知识点中的交叉应用等。
数学建模与数学探究
独立性检验的基本思想
通过抽样调查获取数据,根据样本数据来判断两个分类变量 是否独立。
独立性检验的方法
通常采用列联表的形式整理数据,然后计算相关统计量的值 (如χ²值),并根据统计量的值及给定的显著性水平作出判 断。

9.2独立性检验讲义-2021-2022学年高二下学期数学苏教版(2019)选择性必修第二册

9.2独立性检验讲义-2021-2022学年高二下学期数学苏教版(2019)选择性必修第二册

编号033 §9.2 独立性检验目标要求1、通过实例,理解2×2列联表的统计意义.2、通过实例,了解2×2列联表独立性检验及其应用.学科素养目标本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.重点难点重点:理解2×2列联表的统计意义;难点:了解2×2列联表独立性检验及其应用.教学过程基础知识点1.独立性检验用__________研究问题的方法称为独立性检验.2.列联表与χ2计算公式(1)列联表一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.列联表如下:Ⅱ类1类2合计类A a b a+bⅠ类B c d c+d合计a+c b+d a+b+c+d(2)χ2的计算公式:χ2=_______________________,其中n=________________.【课前小题演练】题1.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:看书运动合计男82028女161228合计243256≈4.667,所以我们有________的把握判定休闲方式与根据表中数据,得到χ2=28×28×24×32性别有关系.(参考数据:P(χ2≥3.841)≈0.05,P(χ2≥6.635)≈0.01)()A.99% B.95% C.1% D.5%题2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A.平均数与方差B.回归分析C.独立性检验D.概率题3.分类变量X和Y的列表如下,则下列说法判断正确的是( )y1y2合计x1a b a+bx2c d c+d合计a+c b+d a+b+c+dA.ad-bc越小,说明X和Y关系越弱B.ad-bc越大,说明X和Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强题4.下面是一个2×2列联表:y1y2合计x1a2173x222527合计b46100则表中a,b的值分别为________.题5.若由一个2×2列联表中的数据计算得χ2=8.013,那么是否有99.5%的把握认为两个随机事件之间有关系:________.(填“是”或“否”)题6.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:[0,50](50,150](150,475][0,35]3218 4(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面2×2列联表:[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(χ2≥xα)0.050.010.001xα 3.841 6.63510.828【当堂巩固训练】题7.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果题8.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1不及格及格合计男61420女102232合计163652好差合计男41620女122032合计163652偏高正常合计男81220女82432合计163652丰富不丰富合计男14620女23032合计163652A.成绩B.视力C.智商D.阅读量题9.有两个分类变量X,Y,其列联表如下所示,Y1Y2X1a20-aX215-a30+a其中a,15-a均为大于5X,Y有关,则a的值为( ) A.8 B.9 C.8或9 D.6或8题10.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )A.H0:男性喜欢参加体育活动B.H0:女性不喜欢参加体育活动C.H0:喜欢参加体育活动与性别有关D.H0:喜欢参加体育活动与性别无关题11.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )题12.一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的12 ,男生喜欢该手机应用的人数占男生人数的16 ,女生喜欢该手机应用的人数占女生人数的23 .若有95%的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )P (χ2≥x α)0.05 0.01 x α3.8416.635A .12B .6C .10D .18题13.(多选题...)下列说法正确的是( )A .事件A 与B 独立,即两个事件互不影响 B .事件A 与B 关系越密切,则χ2就越大C .χ2的大小是判定事件A 与B 是否相关的唯一根据 D .若判定两事件A 与B 相关,则A 发生B 一定发生题14.(多选题...)某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用2×2列联表,由计算得χ2≈7.218,参照下表:P (χ2≥x 0)0.10 0.05 0.025 0.010 0.005 0.001 x 02.7063.8415.0246.6357.87910.828得到不正确的结论是( )A.有99%的把握认为“学生性别与中学生追星无关”B.有99%的把握认为“学生性别与中学生追星有关”C.在犯错误的概率约0.5%的前提下,认为“学生性别与中学生追星无关”D.在犯错误的概率约0.5%的前提下,认为“学生性别与中学生追星有关”题15.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,是否有99.9%的把握说,打鼾与患心脏病是有关的:________.(填“是”或“否”)题16.如果根据性别与是否爱好运动的列联表得到χ2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错误的可能性不超过________.题17.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下能否认为40岁以上的人患胃病与否和生活规律有关系?为什么?题18.“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;(2)能否在犯错误的概率不超过0.1的前提下认为猜对歌曲名称与年龄有关系?说明你的理由.(下面的临界值表供参考)α0.1 0.05 0.01 0.005xα 2.706 3.841 6.635 7.879【综合突破拔高】题19.独立性检验中,假设H 0:运动员受伤与不做热身运动没有关系.在上述假设成立的情况下,计算得χ2的观测值x ≈7.236.下列结论正确的是( ) 附:P (χ2≥x 0)0.10 0.05 0.010 0.005 x 02.7063.8416.6357.879A .在犯错误的概率约为B .在犯错误的概率约为0.01的前提下,认为运动员受伤与不做热身运动无关C .在犯错误的概率约为0.005的前提下,认为运动员受伤与不做热身运动有关D .在犯错误的概率约为0.005的前提下,认为运动员受伤与不做热身运动无关题20.为了调查各国参赛人员对运动会主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12 ;②在犯错误的概率约为1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.男性运动员女性运动员对主办方表示满意 200 220 对主办方表示不满意5030A .0B .1C .2D .3题21.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计 爱好 40 20 60 不爱好 20 30 50 合计6050110附表:P ()χ2≥x 00.050 0.010 0.001 x 03.8416.63510.828由χ2=n 2(a +b )(c +d )(a +c )(b +d ) 算得χ2≈7.8.参照附表,得到的正确结论是( )A .有99%的把握认为“爱好该项运动与性别有关”B.有99%的把握认为“爱好该项运动与性别无关”C.在犯错误的概率约为0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率约为0.1%的前提下,认为“爱好该项运动与性别无关”题22.(多选题...)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论中一定正确的是( )A.样本中男性比女性更关注地铁1号线全线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁1号线的开通关注度更高题23.下列是关于出生男婴与女婴调查的列联表,那么A=________,B=________,C=________,D=________,E=________.晚上白天合计男婴45 A B女婴E35 C合计98 D180题24.某学校为了制订治理学校门口,上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:同意限定区域停车不同意限定区域停车合计男20 5 25女10 15 25合计30 20 50题25.为了解学案的使用是否对学生的学习成绩有影响,随机抽取100名学生进行调查,得到χ2的观测值x≈7.4,则可以得出结论:在犯错误的概率约为________的前提下,认为学生的学习成绩与使用学案有关.参考数据:P(χ2≥x0) 0.10 0.05 0.025 0.010 0.005 0.001x0 2.706 3.841 5.024 6.635 7.879 10.828题26.某研究性学习小组调查研究学生玩手机对学习的影响,部分统计数据如表玩手机不玩手机合计学习成绩优秀 4 8 12学习成绩不优秀16 2 18合计20 10 30则有________%的把握认为玩手机对学习有影响.附:P(χ2≥x0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001x0 2.072 2.706 3.841 5.024 6.635 7.879 10.828χ2=n()ad-bc2()a+b()c+d()a+c()b+d,n=a+b+c+d.题27.某中学研究性学习小组为了考察高中学生的作文水平与爱看课外书的关系,在本校高三年级随机调查了50名学生.调查结果表明,在爱看课外书的24人中有18人作文水平好,另6人作文水平一般;在不爱看课外书的26人中有7人作文水平好,另19人作文水平一般.(1)试根据以上数据完成以下2×2列联表,并运用独立性检验思想,指出有多大把握认为中学生的作文水平与爱看课外书有关系?高中学生的作文水平与爱看课外书的2×2列联表爱看课外书不爱看课外书合计作文水平好作文水平一般合计(2)将其中某4名爱看课外书且作文水平一般的学生也分别编号为1,2,3,4,从这两组学生中各任选1人进行学习交流,求被选取的两名学生的编号之和为2的倍数或3的倍数的概率.参考公χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参考数据:χ2≥x00.10 0.05 0.025 0.010 0.005 0.001P()x0 2.706 3.841 5.024 6.635 7.879 10.828题28.某企业对现有设备进行了改造,为了了解设备改造后的效果,现从设备改造前后生产的大量产品中20,60内,则该产品视为合格品,各抽取了100件产品作为样本,检测其质量指标值,若质量指标值在[)否则视为不合格品.图1是设备改造前的样本的频率分布直方图,表1是设备改造后的样本的频数分布表.表1:设备改造后样本的频数分布表质量指标值频数[10,20) 2[20,30) 18[30,40) 48[40,50) 14[50,60) 16[60,70) 2(1)完成2×2列联表,设备改造前设备改造后合计合格品不合格品合计(2)根据图1(3)企业将不合格品全部销毁后,根据客户需求对合格品进行等级细分,质量指标值落在[)30,40 内的定为一等品,每件售价180元;质量指标值落在[)20,30 或[)40,50 内的定为二等品,每件售价150元;其他的合格品定为三等品,每件售价120元.根据频数分布表1的数据,用该组样本中一等品、二等品、三等品各自在合格品中的频率代替从所有合格产品中抽到一件相应等级产品的概率.现有一名顾客随机购买两件产品,设其支付的费用为X (单位:元),求X 的分布列和数学期望. 附:P ()χ2≥x 00.150 0.100 0.050 0.025 0.010 x 02.0722.7063.8415.0246.635参考公式:χ2=n ()ad -bc ()a +b ()c +d ()a +c ()b +d ,n =a +b +c +d .编号033 §9.2 独立性检验目标要求1、通过实例,理解2×2列联表的统计意义.2、通过实例,了解2×2列联表独立性检验及其应用.学科素养目标本章内容是在学生已经学习过必修课程中的统计知识和概率知识的基础上,通过对典型案例的研究,了解和使用一些常用统计分析方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用,从而形成运用统计的观点认识客观事物的习惯.在本章教学中,应突出对学生应用意识的培养,不能只限于要求学生会解书本上的习题,还要关注学生应用与解决实际问题的能力.应引导、鼓励学生从现实生活中发现问题,并能自觉地运用所学的统计方法加以理解,应尽量给学生提供一定的实践活动机会,可结合数学建模活动,选择一个案例,要求学生亲自实践.重点难点重点:理解2×2列联表的统计意义;难点:了解2×2列联表独立性检验及其应用.教学过程基础知识点1.独立性检验用χ2统计量研究问题的方法称为独立性检验.2.列联表与χ2计算公式(1)列联表一般地,对于两个分类变量Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.列联表如下:Ⅱ类1类2合计Ⅰ类A a b a+b类B c d c+d合计a+c b+d a+b+c+d(2)χ2的计算公式:χ2=__(a+b)(c+d)(a+c)(b+d)__ ,其中n=a+b+c+d.【课前小题演练】题1.在对人们休闲方式的一次调查中,根据数据建立如下的2×2列联表:看书运动合计男82028女161228合计243256根据表中数据,得到χ2=228×28×24×32≈4.667,所以我们有________的把握判定休闲方式与性别有关系.(参考数据:P(χ2≥3.841)≈0.05,P(χ2≥6.635)≈0.01)()A.99% B.95% C.1% D.5%【解析】选B.结合题意和独立性检验的结论,由χ2≈4.667>3.841,P(χ2≥3.841)≈0.05,得这种判断出错的可能性为0.05,即5%.故我们有95%的把握判定休闲方式与性别有关系.题2.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A.平均数与方差B.回归分析C.独立性检验D.概率【解析】选C.判断两个分类变量是否有关的最有效方法是进行独立性检验.题3.分类变量X和Y的列表如下,则下列说法判断正确的是( )y1y2合计x1a b a+bx2c d c+d合计a+c b+d a+b+c+dA.ad-bcB.ad-bc越大,说明X和Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】选C.列联表可以较为准确地判断两个变量之间的相关关系程度,由χ2=(a+b+c+d)(ad-bc)2,(a+b)(a+c)(b+d)(c+d)当(ad-bc)2越大,χ2越大,表明X与Y的关系越强.(ad-bc)2越接近0,说明两个分类变量X和Y无关的可能性越大.题4.下面是一个2×2列联表:y1y2合计x1a2173x222527合计b46100则表中a,b的值分别为________.【解析】a=73-21=52,b=100-46=54.答案:52,54题5.若由一个2×2列联表中的数据计算得χ2=8.013,那么是否有99.5%的把握认为两个随机事件之间有关系:________.(填“是”或“否”)【解析】因为χ2=8.013>7.879=x0.005,查阅χ2表知有99.5%的把握认为两个随机事件之间有关系.答案:是题6.为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:[0,50](50,150](150,475][0,35]3218 4(35,75]6812(75,115]3710(1)2(2)根据所给数据,完成下面2×2列联表:[0,150](150,475][0,75](75,115](3)根据(2)SO2浓度有关?附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(χ2≥xα)0.050.010.001xα 3.841 6.63510.828【解析】(1)2150的天数为32+18+6+8=64,因此,该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.(2)根据抽查数据,可得2×2列联表:[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)的列联表得χ2=80×20×74×26≈7.484.由于7.484>6.635,故有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.【当堂巩固训练】题7.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是( )A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果【解析】选B.从等高条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.题8.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1不及格及格合计男61420女102232合计163652好差合计男41620女122032合计163652偏高正常合计男81220女82432合计 1636 52表4丰富 不丰富 合计 男 14 6 20 女 2 30 32 合计163652A .成绩B .视力C .智商D .阅读量 【解析】选D .因为χ21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20, χ22=52×(4×20-16×12)216×36×32×20 =52×112216×36×32×20,χ23=52×(8×24-12×8)216×36×32×20 =52×96216×36×32×20,χ24=52×(14×30-6×2)216×36×32×20 =52×408216×36×32×20,则有χ24 >χ22 >χ23 >χ21 ,所以阅读量与性别有关联的可能性最大.题9.有两个分类变量X ,Y ,其列联表如下所示,Y 1 Y 2 X 1 a 20-a X 215-a30+a其中a ,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为( ) A .8 B .9 C .8或9 D .6或8 【解析】选C .根据公式,得χ2=65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2 >3.841,根据a >5且15-a >5,a ∈Z ,求得当a =8或9时满足题意.题10.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( ) A .H 0:男性喜欢参加体育活动 B .H 0:女性不喜欢参加体育活动 C .H 0:喜欢参加体育活动与性别有关D .H 0:喜欢参加体育活动与性别无关【解析】选D .独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时的χ2应该很小,如果χ2很大,则可以否定假设,如果χ2很小,则不能够肯定或者否定假设.题11.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )【解析】选D .由等高条形图易知,D 选项两个分类变量关系最强.题12.一款短视频手机应用最近在某校学生中流行起来,某校团委对“学生性别和喜欢该手机应用是否有关”做了一次调查,其中被调查的女生人数是男生人数的12 ,男生喜欢该手机应用的人数占男生人数的16 ,女生喜欢该手机应用的人数占女生人数的23 .若有95%的把握认为是否喜欢该手机应用和性别有关,则被调查的男生人数至少为( )P (χ2≥x α)0.05 0.01 x α3.8416.635A .12B .6C .10D .【解析】选A .设被调查的男生人数为x ,则女生人数为x2,可得列联表如下:喜欢 不喜欢 合计 男生 x 65x 6x女生 x 3 x 6x 2合计x 2x3x 2由公式算得χ2=3x 8 ,因为有95%的把握认为是否喜欢该手机应用和性别有关,所以x 8 ≥3.841,则x ≥83×3.841≈10.24.而x ,x 2 ,x 3 ,x6 都是整数,所以x 的最小值为12,即男生至少有12人.题13.(多选题...)下列说法正确的是( )A .事件A 与B 独立,即两个事件互不影响 B .事件A 与B 关系越密切,则χ2就越大C .χ2的大小是判定事件A 与B 是否相关的唯一根据 D .若判定两事件A 与B 相关,则A 发生B 一定发生【解析】选AB .由事件的独立性知,A 选项正确;由独立性检验的意义知,B 选项正确;χ2的大小是判定事件A 与B 是否相关的一种方法,不是唯一依据,C 选项不正确;若事件A 与B 相关,则A 发生B 可能发生,也可能不发生,D 选项不正确.题14.(多选题...)某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用2×2列联表,由计算得χ2≈7.218,参照下表:P (χ2≥x 0)0.10 0.05 0.025 0.010 0.005 0.001 x 02.7063.8415.0246.6357.87910.828A .有99%的把握认为“学生性别与中学生追星无关”B .有99%的把握认为“学生性别与中学生追星有关”C .在犯错误的概率约0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率约0.5%的前提下,认为“学生性别与中学生追星有关”【解析】选ACD .χ2≈7.218>6.635,可得有99%的把握认为“学生性别与中学生追星有关”.题15.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,是否有99.9%的把握说,打鼾与患心脏病是有关的:________.(填“是”或“否”) 【解析】因为χ2=7.63<10.828=x 0.001,因此,没有99.9%的把握说,打鼾与患心脏病是有关的. 答案:否题16.如果根据性别与是否爱好运动的列联表得到χ2≈3.852>3.841,则判断性别与是否爱好运动有关,那么这种判断犯错误的可能性不超过________.【解析】因为P (χ2≥3.841)≈0.05.所以判断性别与是否爱好运动有关,出错的可能性不超过5%. 答案:5%题17.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下能否认为40岁以上的人患胃病与否和生活规律有关系?为什么?【解析】(1)由已知可列2×2列联表:患胃病 未患胃病 合计 生活规律 20 200 220 生活不规律 60 260 320 合计80460540(2)根据列联表中的数据,由计算公式得χ2=540×(20×260-200×60)2220×320×80×460≈9.638>6.635=x 0.01,因此在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.题18.“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;(2)能否在犯错误的概率不超过0.1的前提下认为猜对歌曲名称与年龄有关系?说明你的理由.(下面的临界值表供参考)α 0.1 0.05 0.01 0.005 x α2.7063.8416.6357.879【解析】(1) 正确 错误 合计 20~30岁10304030~40岁 10 70 80 合计20100120(2)120×(10×70-10×30)220×100×40×80=3>2.706=x 0.1,所以在犯错误的概率不超过0.1的前提下认为猜对歌曲名称与年龄有关系.【综合突破拔高】题19.独立性检验中,假设H 0:运动员受伤与不做热身运动没有关系.在上述假设成立的情况下,计算得χ2的观测值x ≈7.236.下列结论正确的是( ) 附:P (χ2≥x 0)0.10 0.05 0.010 0.005 x 02.7063.8416.6357.879A .在犯错误的概率约为B .在犯错误的概率约为0.01的前提下,认为运动员受伤与不做热身运动无关C .在犯错误的概率约为0.005的前提下,认为运动员受伤与不做热身运动有关D .在犯错误的概率约为0.005的前提下,认为运动员受伤与不做热身运动无关【解析】选A .因为P ()χ2≥6.635 ≈0.01,因此,在犯错误的概率约为0.01的前提下,认为运动员受伤与不做热身运动有关.题20.为了调查各国参赛人员对运动会主办方的满意程度,研究人员随机抽取了500名参赛运动员进行调查,所得数据如表所示,现有如下说法:①在参与调查的500名运动员中任取1人,抽到对主办方表示满意的男性运动员的概率为12 ;②在犯错误的概率约为1%的前提下可以认为“是否对主办方表示满意与运动员的性别有关”;③没有99.9%的把握认为“是否对主办方表示满意与运动员的性别有关”.男性运动员女性运动员对主办方表示满意 200 220 对主办方表示不满意5030A .0B .1C .2D .3【解析】选B .任取1名参赛人员,抽到对主办方表示满意的男性运动员的概率为200500 =25 ,故①错误;χ2=500×()200×30-50×2202420×80×250×250 ≈5.952<6.635,故②错误,③正确.题21.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 合计 爱好 40 20 60 不爱好 20 30 50 合计6050110附表:P()χ2≥x00.050 0.010 0.001x0 3.841 6.635 10.828由χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)算得χ2≈7.8.参照附表,得到的正确结论是( )A.有99%的把握认为“爱好该项运动与性别有关”B.有99%的把握认为“爱好该项运动与性别无关”C.在犯错误的概率约为0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率约为0.1%的前提下,认为“爱好该项运动与性别无关”【解析】选A.由题意,得χ2≈7.8>6.635,所以在犯错误的概率约为1%的前提下,认为“爱好该项运动与性别有关”,即有99%的把握认为“爱好该项运动与性别有关”.题22.(多选题...)2018年12月1日,贵阳市地铁1号线全线开通,在一定程度上缓解了市内交通的拥堵状况.为了了解市民对地铁1号线开通的关注情况,某调查机构在地铁开通后的某两天抽取了部分乘坐地铁的市民作为样本,分析其年龄和性别结构,并制作出如下等高条形图:根据图中(35岁以上含35岁)的信息,下列结论中一定正确的是( )A.样本中男性比女性更关注地铁1号线全线开通B.样本中多数女性是35岁以上C.样本中35岁以下的男性人数比35岁以上的女性人数多D.样本中35岁以上的人对地铁1号线的开通关注度更高【解析】选ABD.设等高条形图对应2×2列联表如下:35岁以上35岁以下合计男性a c a+c女性b d b+d合计a+b c+d a+b+c+d根据第135岁以下女性多,即c>d.。

《§118 独立性检验》教学讲解课件

《§118 独立性检验》教学讲解课件

(教学讲解课件)
结构性特征值的作用
①频率:……
② 3δ原则:参《选修2-3》P:79~80
已知某组数据Y1,Y2,Y3,……的平均值为μ,标准差为σ 则在正常状态下,可以认为:
①数值Yi分布在区间(μ-σ, μ+σ)内的概率为0.6826 ②数值Yi分布在区间(μ-2σ, μ+2σ)内的概率为0.9544 ③数值Yi分布在区间(μ-3σ, μ+3σ)内的概率为0.9974
3.独立性检验的基本思想:
与反证法很类似 S1:先假设两个变量之间独立(没有关系): S2:然后根据小概率事件原理
检验“假设”是否具有“矛盾”
4.回归分析与独立性检验的区别:
①回归分析重在分析两变量是否具有因果关系 ②独立性检验重在分析两变量是否相互影响
一、有关概念: 二、独立性检验的简介: 三、检验独立性的方法:
<一>.频率法: <二>.等高条形图法: <三>.卡方检验:
1.卡方检验简述: 2.操作步骤及三个细节: 3.书写格式:
概率与统计简述
样本
抽样
估计 推断
总体
回归分析 分布列及期望 相关分析
(独立性检验)
概率 计数
回归分析重在分析两变量是否具有因果关系 相关分析重在分析两变量是否相互影响 (独立性检验)
法1:散点图法:
3.拟合效果的判定:
法2:残差法:
①残差图法: ②残差平方和法:
法3:相关指数R2法:
误差 e (Error)
残差 =真实值-预报值 yi yˆi 点(个体)误差 偏差 =真实值-均值 yi y
回归差 =预报值-均值 yˆi y
随机(整体)误差

独立性检验(上课)PPT课件

独立性检验(上课)PPT课件

课堂讲练互动
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r、
变量
相关指数R2、残差分析)
分类变量—— 独立性检验
本节研究的是两个分类变量的独立性检验问题。
探究学习
课堂讲练互动
探究
列联表
为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机 地调查了9965人,得到如下结果(单位:人)
探究学习
课堂讲练互动
回顾:
独立性检验的步骤:
1、写出列联表; 2、作出假设; 3、求出 K2 的值. 4、下结论(利用临界值的大小来判断假设是否成立).
探究学习
课堂讲练互动
题型 独立性的检验 【变式】 为研究学生的数学成绩与对学习数学的兴趣是否有关,
对某年级学生作调查得到如下数据:
成绩优秀 成绩较差 总计
探究学习
课堂讲练互动
【示例】 某小学对232名小学生调查中发现:180名男 生中有98名有多动症,另外82名没有多动症,52名 女生中有2名有多动症,另外50名没有多动症,用 独立性检验方法判断多动症与性别是否有关系? 解: 由题可列出如下列联表:
多动症 无多动症 总计
男生 98
82 180
女生 2
解:列出2×2列联表: 有兴趣 无兴趣 总计
理 文 总计 138 73 211 98 52 150 236 125 361
探究学习
课堂讲练互动
解 列出2×2列联表
理 文 总计 有兴趣 138 73 211
无兴趣 98 52 150
代入公式得 K2 的观测值
总计 236 125 361
k=36123×6×13182×5×522-117×3×159082≈1.871×10-4.

课件5:3.1 独立性检验

课件5:3.1 独立性检验
(3)根据(2)的结论,能否提出更好的调查方法来估计该地 区的老年人中,需要志愿者提供帮助的老年人的比例?说明 理由.
附:
P(χ2≥x0) x0
χ2=n(nn111+nn222+-n+n11n2n+221)2.
0.050 0.010 0.001 3.841 6.635 10.828
【思路点拨】 第(2)问是独立性检验问题求出 χ2 即
思想方法技巧
独立性检验思想的应用
典例 为调查某地区老年人是否需要志愿者提供帮助,用
简单随机抽样方法从该地区调查了 500 位老年人,结果如下:
性别 是否需要志愿者
需要 不需要
男女
40 30 160 270
(1)估计该地区老年人中,需要志愿者提供帮助的老年人 的比例;
(2)在犯错误的概率不超过 0.01 的前提下,能否认为该地 区的老年人是否需要志愿者提供帮助与性别有关?
可.第(3)问是随机抽样问题.
【规范解答】 (1)调查的 500 位老年人中有 70 位需要 志愿者提供帮助,因此该地区老年人中,需要帮助的老年人 的比例的估算值为57000=0.14=14%.
(2)χ2=5002×0(400××320700×-703×04×31060)2≈9.967. 由于 9.967>6.635,所以在犯错误的概率不超过 0.01 的 前提下,认为该地区的老年人是否需要志愿者提供帮助与性 别有关.
【自主解答】 由表中所给数据可知,n11=18,n12=16, n21=17,n22=29,n1+=34,n2+=46,n+1=35,n+2=45,n =80,所以根据 χ2 的计算公式可得
χ2=80×3(148××4269×-351×64×517)2≈2.030<3.841. 所以我们没有充分的证据判定性格与血型有关系,可以 认为性格与血型无关.

独立性检验课件全面版

独立性检验课件全面版

42 7817 49 2148
总计 9874 91 9965
那 么 吸 烟 是 否 对 患 肺有癌影 响?
解:假设H0 :吸烟与患肺癌没有关系 K 2的 观 测 值 为 k 9965(7775 49 42 2099)2 56.632
7817 2148 9874 91 根 据 临 界 值 表 可 知 P (K 2 10.828) 0.001 56.631远 大 于 10.828, 所 以 有 理 由 判 断 H 0不 成 立 , 所以吸烟与患癌症有关系。
(1)列出2×2列联表
在不吸烟者中患病的比重是
从列联表分别计算患病在两类中的频率。
有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。
“有关”的可信程度是多少?即有“多少把握认为有关”呢?——两个分类变量的独立性检验
A、若K的观测值为k=6.
在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是(
.
(填“越强”或“越弱”)
【解析】独立性检验时,假设结论“两个分类变量没有关系”成立. 在该假设下|ad-bc|应该很小,故|ad-bc|越小,则两个分类变量之间的关 系越弱.
【答案】越弱
在吸烟与患肺病这两个分类变量的计算中,下列说法正确
c 的是( )
A、若K的观测值为k=6.635,我们有99%的把握认为吸烟与 患肺病有关系,那么在100个吸烟的人中必有99个患肺病 B、从独立性检验可知有99%的把握认为吸烟与患肺病有关 系时,我们说某人吸烟,那么他有99%的可能患肺病 C、若从统计量中求出有95%的把握认为吸烟与患肺病有关 系,是指有5%的可能性使得推理出现错误 D、以上三种说法都不对
独立性检验
第一步:H0: 吸烟和患病之间没有关系
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

★利用随机变量K 2来判断"两个分类变量有关系"的方法称为独立检验.
★为了使不同样本容量的数据有统一的评判标准, 构造一个随机变量
K2
n(ad bc)2
(其中n a b c d )
(a b)(c d )(a c)(b d )
★独立检验的基本思想 : 类似于反证法,要判断"两个分类变量有关系", 先假设该结论不成立,即H0 : 两个分类变量没有关系成立.在该假设下 所构造的随机变量K 2应该很小,如果由观测数据计算得到的K 2的观测 值k很大,则断言H0不成立,即认为"两个分类变量有关系";如果观测值 k很小,则说明样本数据中没有发现足够证据拒绝H0.
独立性检验
高中数学人教A版选修2-3
冷世平
1
分类变量
对于性别变量,其取值为男和女两种。这种变量的不同“值” 表示个体所属的不同类别,像这样的变量称为分类变量。在现实生 活中,分类变量是大量存在的,例如:是否吸烟、宗教信仰、国籍 等。
注意:这里的“变量”和“值”都应作为“广义”的变量和值 来理解。例如:对于性别变量,其取值有“男”和“女”两种,这 里的“变量”指的是“性别”,这里的“值”指的是“男”或 “女”。因此,这里说的“变量”和“值”不一定是取具体的数 值.
在H0成立的情况下, P(K 2 6.635) 0.01,即H0成立的情况下, K 2超过6.635 的概率非常小,近似为0.01,这是一个小概率事件. K 2的观测值k 56.632, 远大于6.635,有理由断定H 0不成立,即认为"吸烟与患肺癌有关系", 但这 种判断会犯错误的概率不会超过0.01
"吸烟与患肺癌相互独立",即假设H0等价于P( AB) P( A)P(B)
不患肺癌
患肺癌
总计
不吸烟
a
b
ab
吸烟
c
d
cd
总计
ac
bd abcd
a恰好为事件AB发生的概数;a b和a c恰好分别为事件A和B发生的频数.
因为频率近似于概率, 所以在H 0成立的条件下, 应该有
a n
两个浅色条的高分别代表不吸烟和吸 等
烟样本中不患肺癌的频率;两个深色 条的高分别表示不吸烟和吸烟样本中 患肺癌的频率,比较图中两个深色条 的高可以发现,在吸烟样本中患肺癌 的频更容易引发肺癌。
我们先假设H0 : 吸烟与患肺癌没有关系. 用A表示不吸烟,用B表示不患肺癌,则"吸烟与患肺癌没有关系"等价于
为了研究吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查 了9965人,得到如下结果:
不吸烟 吸烟 总计
不患肺癌 7775 2099 9874
患肺癌 42 49 91
总计
列出两个分类
7817
变量的频数表,
2148
称为列联表。
9965
那么吸烟是否对患肺癌有影响?
由吸烟和患肺癌列联表可以粗略估计出:在不吸烟的样本中, 有0.54%患肺癌;在吸烟的样本中,有2.2%患肺癌。因此,直观上 可以得到结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异。 在吸烟样本中患肺癌的频率要高一些,因此,我们可以直观的认为 吸烟更容易引发肺癌。那么这个结论是否可靠呢?
概率的上界 ,然后查表确定临界值k0;
②利用公式计算随机变量K 2的观测值k;
③如果k k0,就推断" X 与Y有关系",这种推断犯错误的概率不超过, 否则就认为在犯错误概率不超过的前提下不能推断" X 与Y有关系",
或者在样本数据中没有发现足够证据支持结论" X 与Y有关系".
★观察下列各图,其中两个分类变量x, y之间的关系最强的是( D )
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P(K 2 6.635) 0.01的含义是有99%的把握(在犯错误的概率不超过0.01的 前提下),认为两变量相关;
P(K 2 10.828) 0.001的含义是有99.9%的把握(在犯错误的概率不超过0.001 的前提下),认为两变量相关.
k 9965(7775 49 42 2099)2 56.632
7817 2148 9874 91
这个值到底能告诉我们什么呢?
独立性检验临界值表
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
想一想 : 在K 2运算时,在判断变量相关时,若K 2的观测值k 56.632, 则P(K 2 6.635) 0.01和P(K 2 10.828) 0.001,哪种说法是正确的?
两种说法均正确
P(K2≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001

a
n
b

a
n
c
,其中
n a b c d为样本容量,即(a b c d )a (a b)(a c) ad bc
ad bc 越小,说明吸烟与患肺癌的关系越弱; ad bc 越大,说明吸烟与 患肺癌的关系越强.
若H0成立,即"吸烟与患肺癌没有关系",则K 2应该很小.K 2的观测值为
★反证法原理和独立性检验原理比较 :
反证法原理 : 在假设H0下,如果推出一个矛盾,就证明了H0不成立;
独立性检验原理
:
在在假设H
0下,
如果出现一个与H
相矛盾的小概
0
率事件, 就推断H 0不成立, 且该推断犯错的概率不超过这个小概率.
★独立性检验步骤 : ①根据实际问题的需要, 确定容许推断"两个分类变量有关系"犯错误
在四幅图中,D中两个格形条的高相差最明显,说明两个分类变量 之间的关系最强.
★下列关于回归分析与独立性检验的说法正确的是( C ) A.回归分析和独立性检验没有什么区别; B.回归分析是对两个变量准确关系的分析, 而独立性检验是分析两 个变量之间的不确定关系; C.回归分析研究两个变量之间的相关关系, 独立性检验是对两个变 量是否具有某种关系的一种检验; D.独立性检验可以100%确定两个变量之间是否具有某种关系.
相关文档
最新文档