高二数学独立性检验1(1)
高二数学人选择性必修件独立性检验
系。
02
社会学领域
研究两个社会现象是否独立, 如研究教育程度与职业选择的
关系。
03
经济学领域
研究两个经济指标是否独立, 如研究通货膨胀率与失业率的
关系。
03
独立性检验方法
卡方检验法
01
02
03
卡方统计量
用于衡量实际观测值与理 论期望值之间的差异,其 值越大,表明差异越显著 。
Spearman等级相关系数
同样用于衡量两个有序分类变量之间的关联程度,与Kendall's tau-b类似,但计算方 法略有不同。
04
数据处理与结果分析
数据收集与整理
数据来源
明确数据的来源,确保数据的真实性 和可靠性。
数据整理
将数据按照一定的格式进行整理,便 于后续的计算和分析。
数据筛选
根据研究目的,筛选与研究问题相关 的数据。
将计算得到的统计量与临界值进 行比较,判断假设是否成立。
意义探讨
根据假设检验的结果,探讨数据背 后的实际意义,如两个变量之间是 否存在关联等。
注意事项
在讨论结果时,需要注意结果的可 靠性、可重复性以及可能存在的误 差来源。
05
实际应用案例解析
医学领域案例:疾病与基因关系研究
01
研究目的
探究某种疾病与特定基因之间 的关联程度。
02
数据收集
收集患者的基因数据和疾病信 息。
03
独立性检验
通过卡方检验等方法,判断疾 病与基因之间是否存在统计学
上的独立性。
04
结果解读
若检验结果拒绝原假设,则认 为疾病与基因之间存在关联, 这为疾病的预防、诊断和治疗
苏教版选修1-2高中数学1.1《独立性检验》
甲厂 乙厂 合计 优质品 非优质品 合计
2 n ad - bc 附:χ2= , a+bb+ca+cb+d
P(χ2≥x0) x0
0.05
0.01
3.841 6.635
课前探究学习
课堂讲练互动
解 (1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件 360 的优质品率估计为500=72%; 乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质 320 品率估计为500=64%. (2) 甲厂 乙厂 合计 优质品 360 320 680
课前探究学习 课堂讲练互动
【题后反思】 统计的基本思维模式是归纳,通过部分数据的性质 来推测全部数据的性质,从数据上体现的只是统计关系,而不是 因果关系.
课前探究学习
课堂讲练互动
【训练3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单 位: mm) 的值落在 [29.94,30.06) 的零件为优质品.从两个分 厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如
(4)若χ2≤2.706,则认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,
但也不能作出结论“H0成立”,即不能认为Ⅰ与Ⅱ没有关 系.
课前探究学习
课堂讲练互动
题型一 利用χ2判定两个变量间的关系 【例1】 某电视台联合相关报社对“男女同龄退休”这一公众关
注的问题进行了民意调查,数据如下表所示:
赞同 男 女 合计 198 476 674
可能性为1%.
课前探究学习 课堂讲练互动
名师点睛 1.独立性检验
2 n ad - bc (1)利用随机变量 χ2= ,(其中 n=a+b a+bc+da+cb+d
+c+d 为样本容量),来确定在多大程度上可以认为“两个分 类变量有关系”的方法称为两个分类变量的独立性检验.
独立性检验-高二数学课件(人教B版2019选择性必修第二册)
(1)事件 (2)事件
A B
发生的概率可估计为P( A) 发生的概率可估计为P(B)
a a
c n b
(3)事件 AB 发生的概率可估计为
P(
n AB)
a
n
如果 A 与 B 独立,那么上述 P( AB)与 P( A )P( B )的估计值
相差不会太大,注意到总数为 n,因此利用后者可以估计出,理论上
非优秀 45 30
总计 55 50
总计
30
75
105
题型二:独立性检验解决实际问题
例5:有甲乙两个班级进行数学考试,按照大于等于85分为优秀,85分
以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机 抽取1人为优秀的概率为 2 .
7
(2)根据列联表的数据,若按照95%的可靠性要求,能否认为“成绩与班
既是 A 又是 B 的数据有n P( A )P( B )个,注意到实际的数据为 a
(即n P( AB ))个,因此
[nP( AB) nP( A)P(B)]2 [na n(a c)(a b)]2
nP( A)P(B)
na c(a b)
不会太大.
类似地,考虑 A 与 B ,A 与 B ,A 与 B ,可知
3
33
合计 3x x 4x 11.20 x 14.65 33.60 3x 43.96
题型二:独立性检验解决实际问题
例4:某年调查某桑场采桑人员和不采桑人员的桑毛虫皮炎发病情 况,结果如表所示,利用列联表的独立性检验估计“患桑毛虫皮 炎病与采桑”是否有关?认为两者有关系犯错误的概率是多少?
采桑 不采桑 合计
由于12.981>6.635,所以在犯错误的概率不超过1%的前提下,
追踪考题 晒晒考点一独立性检验高考考点题型例析
iiS€题晒晒看蛊一独立牲枪验高看看蛊题型例祈■江苏省盐城市时杨中学刘长柏随着新高考的不断深入,独立性检验及其综合应用也进入了高考命题者的视野。
独立性检验是考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法。
利用独立性检验,能够帮助同学们对日常生活中的实际问题作出合理的推断和预测。
因此,大家在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题中的应用,以提高大家处理实际问题的能力。
独立性检验既会单独考查一个知识点,也会与概率、随机变量的分布列与期望等交汇考查,这也为我们的学习及高考备考鸣响了警钟——不可忽视独立性检验综合应用题。
下面借助于考题举例说明。
亶接考査独立性检验侧/【2021年南京市、盐城市高三年级第一次模拟考试】某词汇研究机构为对某城市人们使用流行语的情况进行调査,随机抽取了200人进行调查统计,得下方的2X2列联表(表1)。
则根据列联表可知(表2P(K2>k)0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.828解析:K?200X(125X15—25X35严160X40X150X504.167>3,841,所以有95%的把握认为“经常用流行用语”与“年轻人”有关系,选A。
点评:本题主要考查了独殳性检验的直接应用,要想解答独立性检验问题应做好两方面:一是准确解读2X2列联表,落实表中相关数据;二是正确利用公式求出K2的观测值,并与临界值比较。
练习1:【2020年四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用简单随机抽样方法从该地区调査了500位被隔离者,结果如下:表3性别是否轟男女需要4030不需要160270表1年轻人非年轻人总计经常用流行用语12525150不常用流行用语351550总计16040200表4PU。
独立性检验
1.1独立性检验2012-2-21【学习目标】1、了解独立性检验的基本思想、方法及初步应用。
2、通过本节课的学习,让学生感受数学与现实生活的联系,体会独立性检验的基本思想在解决日常生活问题中的作用。
3、培养学生运用所学知识,依据独立性检验的思想作出合理推断的实事求是的好习惯。
【学习重点】了解独立性检验的方法,明确独立性检验的基本步骤,理解独立性检验的基本思想 【学习重点】独立性检验的初步应用。
【新课导入】例1:把一枚质地均匀的骰子任意的掷一次,设事件A=“掷出偶数点”,B=“掷出3的倍数点”,试分析事件A 与B 及A 与B 的关系. 解:基本事件空间: Ω={ 1, 2, 3, 4, 5, 6 } (1)事件A={ 2 , 4 ,6 } P(A)=3162=事件B={ 3 ,6 } P(B)=2163=事件A B = { 6 } P(A B )=111623=⨯ 则 P(A B ) = P(A )P(B )(2)事件A =“ 掷出奇数点 ”={ 1 ,3 ,5 }事件A B = { 3 } P(A B )=16则 P(A B ) = P(A )P(B ) 结论:【精讲点拨】例2:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了339个50岁以上的成年人,其中吸烟者205人,不吸烟者134人,调查结果是:吸烟的205人中43人患病, 162人不患病;不吸烟的134人中13解:设吸烟与患病无关。
通过公式计算()223394312113162205134132837.469 6.635χ⨯⨯-⨯=⨯⨯⨯=> 因此有99%的把握认为“吸烟与患病有关系”【小结】 解决步骤第一步:列出2×2列联表 第二步:求2χ第三步: 与临界值比较,下结论 练习1. 经过对χ2的研究,得到了若干个临界值,当χ2≤2.706时,我们认为两个分类变量X 和Y 之间( c ) A .有95%的把握认为X 和Y 有关系。
高二数学1-2 独立性检验
独立性检验教学重点、独立性检验的基本方法,独立性检验的步骤难点:.基本思想的领会及方法应用.知识点一、独立性检验的基本概念和原理独立性检验是研究相关关系的方法。
1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。
2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个3.条形图为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比.通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢?4.独立性检验的步骤为了回答下面问题,我们先假设H:吸烟与患肺癌没有关系,看看能够得到什么样的结论。
不患肺癌患肺癌合计不吸烟 a b a+b吸烟 c d c+d合计a+c b+d a+b+c+d样本容量 n=a+b+c+d如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:()()()()()()()220a ca c d c ab ad bc a b c dad bc ad bc n ad bc k a b c d a c b d n a b c d ≈⇒+≈+⇒-≈++---=++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中为样本容量若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为()22996577754942209956.63278172148987491K ⨯-⨯=≈⨯⨯⨯,这个值到底能告诉我们什么呢?统计学家经过研究后发现,在 H 0成立的情况下,2( 6.635)0.01P K ≥≈. (2)(2)式说明,在H 0成立的情况下,2K 的观测值超过 6. 635 的概率非常小,近似为0 . 01,是一个小概率事件.现在2K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” .在上述过程中,实际上是借助于随机变量2K 的观测值k 建立了一个判断H 0是否成立的规则:如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系.在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过2( 6.635)0.01P K ≥≈,即有99%的把握认为H 0不成立.假设检验 备择假设H 1在H 1不成立的条件下,即H 0成立的条件下进行推理 推出有利于H 1成立的小概率事件(概率不超过α的事件)发生,意味着H 1成立的可能性(可能性为(1-α))很大推出有利于H 成立的小概率事件不发生,接受原假设上例的解决步骤第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系↔ H 1:吸烟与患肺癌有关系第二步:选择检验的指标 22()K ()()()()n ad bc a b c d a c b d -=++++(它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论注意:1观测值是2K 的值2.假设没有关系,如果2K 大,则H 0不成立,即两个量有关系。
8.3.2 独立性检验-高二数学课件(人教A版2019选择性必修第三册)
作“卡方独立性检验”,简称独立性检验.
概念讲解
下表给出了 2 独立性检验中几个常用的小概率值和相应的临界值.
α
xα
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879 10.828
例如,对于小概率值 = 0.05,我们有如下的具体检验规则:
(1)当 2 ≥ 0.05 = 3.841时,我们推断0 不成立,即认为和不独立,该推断犯错
样的方法对治疗情况进行检查,得到了如下数据: 抽到接受甲种疗法的患儿67
名,其中未治愈15名,治愈52名; 抽到接受乙种疗法的患儿69名,其中未治愈
6名,治愈63名. 试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果
是否比甲种疗法好.
例题剖析
解:零假设为0 :疗法与疗效独立,即两种疗法效果没有差异.
在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,
将数据分类统计,并做成表格加以保存. 我们将形如下表这种形式的数据统
计表称为2×2列联表. 2×2列联表给出了(Y=0)
乙(Y=1)
合计
A(X=0)
a
b
a+b
B(X=1)
c
a+c
d
b+d
c+d
合计
a+b+c+d
2
这说明,对调两种疗法的位置,不会影响χ2取值的计算结果,同理对调
两种疗效的位置也不会影响结果.
例题剖析
例3.为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调
查了9965人,得到成对样本观测数据的分类统计结果,如表所示.依据小概率值 =
8.3.2独立性检验 课件—高二下数学人教A版(2019)选择性必修第三册
P( x )
2
临界值xα
的方法称为χ2独立性检验,
读作“卡方独立性检验”,
简称独立性检验.
概率值α越小,临界值xα越大.
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立
性检验,读作“卡方独立性检验”,简称独立性检验.
犯错误的
概率
例2: 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,
甲校
乙校
合计
你认为“两校学生的数
学成绩优秀率存在差异”
这一结论是否有可能是
错误的?
因此,需要找到一种更为合理的推断方法,希望能对出现错误
判断的概率有一定的控制或估算。
本节课给到一个方法:独立性检验
独立性检验是一种“概率反证法”。依据是小概率原理(在一次实
验中几乎不可能发生)
找到了,假设不成立,嫌
疑人有罪。
例4 :为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机
抽样的方法,调查了9965人,得到成对样本观测数据的分类统计结果,
如下表所示. 依据小概率值α=0.001的独立性检验,分析吸烟是否会增加
患肺癌的风险.
解:零假设为H0: 吸烟与患肺癌之间
无关联,由表中数据可得
9965(7775 49 42 2099)
数学成绩
不优秀
优秀
合计
甲校
乙校
合计
解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优
秀率无差异根据表中的数据,计算得到
2
88
(33
7
10
38)
2
0.837 2.706 x0.1
独立性检验
两种变量:
定量变量:体重、身高、温度、考试成绩等等。 变量 分类变量:性别、是否吸烟、是否患肺癌、 宗教信仰、国籍等等。
在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。
研究两个变量的相关关系:
定量变量——回归分析(画散点图、相关系数r) 变量 分类变量—— 独立性检验
(a+b+c+d)a (a+b)(a+c),
即ad bc
因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。
独立性检验
构造一个随机变量-----卡方统计量
n(ad bc) K , (1) (a b)(c d )(a c)(b d )
x1 x2 总计
y1 a c a+c
y2 b d b+d
总计 a+b c+d a+b+c+d
例1.在500人身上试验某种血清预防感冒作用,把他们一年中 的感冒记录与另外500名未用血清的人的感冒记录作比较,结 果如表所示。
未感冒 感冒 合计
使用血清
未使用血清 合计
252
224 476
248
276 524
3.2独立性检验的 基本思想及其初 步应用(一)
高二数学 选修2-3
第三章
统计案例
问题: 数学家庞加莱每天都从一家面包店
买一块1000g 的面包,并记录下买回的面 包的实际质量。一年后,这位数学家发 现,所记录数据的均值为950g。于是庞 加莱推断这家面包店的面包分量不足。 • 假设“面包份量足”,则一年购买面包的质量数据 的平均值应该不少于1000g ; • “这个平均值不大于950g”是一个与假设“面包份量 足”矛盾的小概率事件; • 这个小概率事件的发生使庞加莱得出推断结果。
独立性检验(课件)高二数学(人教A版2019选修第三册)
|ad-bc|越大,说明玩电脑游戏与注意力集中之间的关系越强.
为了使不同样本容量的数据有统一的评判标准,我们构造一个随
机变量
n(ad-bc)2 χ2=
(a+b)(c+d)(a+c)(b+d)
这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性 检验,读作卡方独立性检验,简称独立性检验.
若H0成立,即玩电脑游戏与注意力集中没有关系,则χ2应该 很小;若H0不成立,即玩电脑游戏与注意力集中有关系,则χ2应 该很大.那么,究竟χ2大到什么程度,可以推断H0不成立呢?
2 88(33 7 10 38)2
43 45 7117
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
学校
甲校(X=0) 乙校(X=1)
合计
数学成绩
不优秀(Y=0) 优秀(Y=1)
33
10
38
7
71
17
0.001 10.828
合计
43 45 88
0.837 2.706 x0.1.
于不同的小概率值α的检验规则,对应不同的临界值x0,其与χ2的大小关 系可能不同,相当于检验的标准发生变化,因此结论可能会不同.
3. 为考察某种药物A对预防疾病B的效果,进行了动物试验,根据105个有
放回简单随机样本的数据,得到如下列联表: 依据α=0.05的独立性检验,分析药物A对
药物A
疾病B 未患病 患病
解:根据题意,可得
xα 2.706 3.841 6.635 7.879 10.828
2 4.881 3.841 x0.05 .
根据小概率值α=0.05的χ2独立性检验,推断H0不成立,即认为两种疗 法的效果有差异,该推断犯错误的概率不超过0.05.
人教B版高二数学选修 独立性检验(1)-3学习任务单
《独立性检验(1)》学习任务单原创不容易,为有更多动力,请【关注、关注、关注】,谢谢!落红不是无情物,化作春泥更护花。
出自龚自珍的《己亥杂诗·其五》杭信一中何逸冬【学习目标】1.通过对典型案例的探究,了解独立性检验(只要求22⨯列联表)的基本思想、方法及初步应用;χ来分析两分类变量是否有关系;2.利用统计量2【课上任务】1.什么是分类变量?2.如何根据概率关系表示两个事件独立?3.如何制作两个分类变量的22⨯列联表?4.研究两个分类变量之间是否有关系的直观解决策略有哪些?5.独立性检验的基本思想是什么?(提出假设检验,构造统计量,利用统计量的值判断假设检验是否成立?)6.22⨯列联表独立性检验的一般步骤是什么?7.根据本节课所学的知识能进行简单的应用吗?【课后作业】8.作业11.调查者通过询问72名男女大学生在购买食品时是否看营养说明,得到的数据如下表所示:问大学生的性别与是否看营养说明之间有没有关系?9.作业22.在研究某种新措施対猪白痢的防治效果问题时,得到以下数据:试问新措施对防治猪白痢是否有效?【课后作业参考答案】作业1解: 根据列联表知28=a ,8=b ,16=c ,20=d ,72=n计算统计量416.8))()()(()(22≈++++-=d b c a d c b a bc ad n χ 635.6416.8>,%99的把握说性别与看营养说明有关。
作2解: 根据列联表知114=a ,,132=c ,18=d ,300=n计算统计量317.7))()()(()(22≈++++-=d b c a d c b a bc ad n χ 635.6317.7>,%99的把握说新措施对防治猪白痢有效。
【素材积累】1、走近一看,我立刻被这美丽的荷花引住了,一片片绿油油的荷叶层层叠叠地挤摘水面上,是我不由得想起杨万里接莲叶无穷碧这一句诗。
荷叶上滚动着几颗水珠,真像一粒粒珍珠,亮晶希望对您有帮助,谢谢 晶的。
高二数学(选修2-3人教B版)-独立性检验1
例4.在对人们的休闲方式的一次调查中,共调查了124人,其 中女性70人,男性54人.女性中有43人主要的休闲方式是看电 视,另外27人主要的休闲方式是运动;男性中有21人主要的休 闲方式是看电视,另外33人主要的休闲方式是运动. (1)根据以上数据建立一个2×2列联表; (2)判断性别与休闲方式是否有关系.
因为7.469 6.635,所以我们有99%的把握说,50岁以上的人
患慢性气管炎与吸烟习惯有关.
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表;
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表; (2)根据公式计算 的值;
2 2列联表独立性检验的步骤: (1)根据样本数据制成 22 列联表; (2)根据公式计算 的值; (3)比较 的值与临界值的大小关系作统计推断.
当事件A与B相互独立时,事件A 与B,A与 B , A 与 B 也独立.
例2 为了探究慢性气管炎是否与吸烟有关,调查了339 名50岁以上的人,调查结果如下表所示:
吸烟 不吸烟 合计
患慢性气管炎 未患慢性气管炎
43
162
13
121
56
283
合计 205 134 339
试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?
若 c = c d a c 成立,则可以认为 A与 B 独立. nn n
同理若 b = a b b d 成立,则可以认为A与 B 独立. nn n
若 c = c d a c 成立,则可以认为 A与 B 独立. nn n
若 d = c d b d 成立,则可以认为 A与 B 独立. nn n
计算统计量
2=
n(ad bc)2
独立性检验(第一课时)教学设计-高二下学期数学人教A版选择性
7.教学环节: 教师活动学生活动媒体&信息技术应用环节一:问题回溯教师活动1回顾上节课的例1例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生. 通过测验得到了如下数据: 甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.思考:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?学生活动1学生回顾上节课的例题1,并作出回答。
媒体&信息技术应用1教学PPT 展示活动意图说明:对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们的推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大.因此需要找到一种更为合理的推断方法,同时能对出现错误推断的概率有一定的控制或估算。
环节二:新知探究一教师活动2考虑以ΩΩ上,取值于{0,1}的成对分类变量。
我们希望判断事件{X=1}和{Y=1}之间是否有关联。
抽象简化列联表如下:我们需要判断下面的假定关系:0:(1|0)(1|1)H P Y X P Y X =====是否成立,通常称H 0为零假设或原假设.(类比法官判案中的无罪假设) 进一步由条件概率(0,1)(1,1)(0)(1)P X Y P X Y P X P X ====⇒===(1)(1,1)(1,1)(0)(1)P Y P X Y P X Y P X P X =-====⇒===(1)(1)(1)(1,1)(0)(1,1)P Y P X P X P X Y P X P X Y ⇒=⋅===⋅==+=⋅== (1)(1)(1,1)P Y P X P X Y ⇒=⋅====所以零假设H 0 等价于{X=1}和{Y=1}独立。
学生活动2做好预习,认真阅读材料,了解原假设的设法,以及领悟如何从条件概率出发,一步一步把事件的独立和分类变量的独立等价起来。
此处要求学生复习好条件概率及其性质。
独立性检验1
§3.2独立性检验的基本思想及初步应用【学习目标】:1.理解分类变量的含义,判断两个分类变量是否具有相关性(利用列联表和等高条形图);2.通过对典型案例(吸烟和患肺癌有关吗?)的探究,理解独立性检验(只要求2×2列联表)的基本思想、方法、步骤及应用;3.体会反证法原理与独立性检验原理的区别和联系。
【知识探究】:环节一:精读课本结合下列问题,认真阅读书本91-96页相关内容:1.列联表与等高条形图形在分类变量相关性中的应用问题1.分类变量的定义?与我们数学中提到的普通变量有什么区别?能否再举出几个分类变量的例子?问题2.分类变量的取值特点?什么是列联表?问题3.从书本上吸烟与患肺癌列联表中,可以得到什么结论?是如何得出的?问题4.除了列联表,我们还可以利用图形来判断分类变量间有无相关性,我们常选择什么图形?怎样画图?如何通过图形进行判断?问题5.列联表与图形来判断分类变量的相关性各自有什么优缺点?我们做出的直观判断是否可靠?2.独立性检验问题6.什么是反证法?问题7.我们要用反证法检验“吸烟与患肺癌无关”这一结论,大致思路是什么?有什么不足?问题8.用 A 表示“不吸烟”, B 表示“不患肺癌”,那么H:吸烟与患肺癌没有关系这一假设怎么用A、B来刻画?问题9.书本中|ad-bc|的大小对吸烟与患肺癌的相关性有什么影响?问题10.书本中构造的随机变量22()K()()()()n a d b ca b c d a c b d-=++++作用是什么?它的大小对吸烟与患肺癌的相关性有什么影响?问题11.如何判断K2的观测值k是大还是小?临界值和允许犯错误的概率的上界α是如何确定的?[书本表3-11的认识]问题12.如果我们计算得到的K2的观测值k使得P(K2≥6.635)≈0.01,则推出的结论是什么?其理论依据是什么?如果K2≥10.828,K2≥3.841,K2≥2.706,K2≤2.706,则又得到什么结论?问题13.独立性检验的定义?独立性检验的必要性?问题14.书本中93页倒数第2行和第7行“…如果观测值k很小,则说明在样本数据中没有足够证据拒绝H”;“‘把两个分类变量之间没有关系’错误地判断为‘两个分类变量之间有关系’的概率不超过P(K2≥k)”,这两句话如何理解?环节二:自练自查例1.为考察高中生性别与是否喜欢数学课程之间的关系,某同学从秭归一中学生中随机调查问卷了300名学生,不喜欢数学课程有228人,男生122人中喜欢数学课程有37人。
8.3.2独立性检验(解析版)
独立性检验【学习目标】1.了解独立性检验的基本思想、方法及其简单应用2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤【自主学习】知识点独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.【合作探究】探究一 有关“相关的检验”【例1】某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?解 判断方法如下:假设H 0“喜欢体育还是喜欢文娱与性别没有关系”,若H 0成立,则K 2应该很小. ∵a =21,b =23,c =6,d =29,n =79, ∴K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=79×(21×29-23×6)244×35×27×52≈8.106.且P (K 2≥7.879)≈0.005即我们得到的K 2的观测值k ≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.归纳总结:(1)利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )求出K 2的观测值k 的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.【练习1】为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:判断学生的数学成绩好坏与对学习数学的兴趣是否有关? 解 由公式得K 2的观测值k =189×(64×73-22×30)286×103×95×94≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.探究二 有关“无关的检验”【例2】为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关? 解 列出2×2列联表代入公式得K 2的观测值k =361×(138×52-73×98)2236×125×211×150≈1.871×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.归纳总结:运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K 2的观测值k . (2)比较k 与k 0的大小作出结论.【练习2】第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动. (1)根据以上数据完成以下2×2列联表:(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? 解 (1)(2)假设是否喜爱运动与性别无关,由已知数据可求得: K 2=30×(10×8-6×6)2(10+6)(6+8)(10+6)(6+8)≈1.157 5<2.706,因此,在犯错误的概率不超过0.10的前提下不能判断喜爱运动与性别有关.探究三 独立性检验的基本思想【例3】某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表: 甲厂乙厂(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)K 2=1 000×(360×180-320×140)2500×500×680×320≈7.353>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.归纳总结:(1)解答此类题目的关键在于正确利用K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算k 的值,再用它与临界值k 0的大小作比较来判断假设检验是否成立,从而使问题得到解决.(2)此类题目规律性强,解题比较格式化,填表计算分析比较即可,要熟悉其计算流程,不难理解掌握.【练习3】下表是某地区的一种传染病与饮用水的调查表:(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.解 (1)假设H 0:传染病与饮用水无关.把表中数据代入公式得:K 2的观测值k =830×(52×218-466×94)2146×684×518×312≈54.21,∵54.21>10.828,所以拒绝H 0.因此我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,K 2的观测值k =86×(5×22-50×9)14×72×55×31≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有97.5%的把握肯定.课后作业A组基础题一、选择题1.经过对K2的统计量的研究,得到了若干个临界值,当K2的观测值k>3.841时,我们() A.在犯错误的概率不超过0.05的前提下可认为X与Y有关B.在犯错误的概率不超过0.05的前提下可认为X与Y无关C.在犯错误的概率不超过0.01的前提下可认为X与Y有关D.没有充分理由说明事件X与Y有关系【答案】A2.用独立性检验来考察两个分类变量x与y是否有关系,当统计量K2的观测值() A.越大,“x与y有关系”成立的可能性越小B.越大,“x与y有关系”成立的可能性越大C.越小,“x与y没有关系”成立的可能性越小D.与“x与y有关系”成立的可能性无关【答案】B3.在一个2×2列联表中,由其数据计算得K2的观测值k=7.097,则这两个变量间有关系的可能性为()A.99% B.99.5%C.99.9% D.无关系【答案】A解析K2的观测值6.635<k<7.879,所以有99%的把握认为两个变量有关系.4.对两个分类变量A,B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.0 B.1 C.2 D.3【答案】B解析①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A 与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选B.5.考察棉花种子经过处理跟生病之间的关系得到下表数据:根据以上数据,可得出()A.种子是否经过处理跟是否生病有关B.种子是否经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的【答案】B解析由K2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有把握认为种子是否经过处理跟是否生病有关. 二、填空题 6.根据下表计算:K 2的观测值k ≈________(保留3位小数). 【答案】 4.514解析 k =300×(37×143-85×35)2122×178×72×228≈4.514.7.如果K 2的观测值为6.645,可以认为“x 与y 无关”的可信度是________. 【答案】 1%解析 查表可知可信度为1%.8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:由以上数据,计算得到K 2的观测值k ≈9.643,根据临界值表,有________把握认为课外阅读量大与作文成绩优秀有关. 【答案】 99.5%解析根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:设H0:服用此药的效果与患者的性别无关,则K2的观测值k≈________(小数点后保留三位有效数字),从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.【答案】 4.8825%解析由公式计算得K2的观测值k≈4.882,∵k>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题10.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得数据,试问:在出错概率不超过0.025的前提下,能否判断“文科学生总成绩不好与数学成绩不好有关系”?解依题意,计算随机变量K2的观测值:k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,所以在出错概率不超过0.025的前提下,可以判断“文科学生总成绩不好与数学成绩不好有关系”.11.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:请问喜欢吃零食与性别是否有关?解K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),把相关数据代入公式,得 K 2的观测值k =85×(5×28-40×12)217×68×45×40≈4.722>3.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”. 12.在某校对有心理障碍学生进行测试得到如下列联表:试说明在这三种心理障碍中哪一种与性别关系最大?解 对于题中三种心理障碍分别构造三个随机变量K 21,K 22,K 23.其观测值分别为k 1,k 2,k 3.由表中数据列出焦虑是否与性别有关的2×2列联表可得k 1=110×(5×60-25×20)30×80×25×85≈0.863<2.706,同理,k 2=110×(10×70-20×10)230×80×20×90≈6.366>5.024,k 3=110×(15×30-15×50)230×80×65×45≈1.410<2.706.因此,在犯错误的概率不超过0.025的前提下,认为说谎与性别有关,没有充分的证据显示焦虑、懒惰与性别有关.B组能力提升一、选择题1.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:0010并计算得到219.05K≈,下列小波对地区A天气判断不正确的是()A. 夜晚下雨的概率约为1 2B. 未出现“日落云里走”夜晚下雨的概率约为5 14C. 有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D. 出现“日落云里走”,有99.9%的把握认为夜晚会下雨【答案】:D【分析】把频率看作概率,即可判断,A B的正误;根据独立性检验可判断,C D的正误,即得【答案】.【详解】由题意,把频率看作概率可得:夜晚下雨的概率约为252511002+=,故A正确;未出现“日落云里走”夜晚下雨的概率约为255254514=+,故B正确;由219.0510.828K≈>,根据临界值表,可得有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关,故C正确;故D错误.故选:D.2.为了判断英语词汇量与阅读水平是否相互独立,某语言培训机构随机抽取了100位英语学习者进行调查,经过计算2K的观测值为7,根据这一数据分析,下列说法正确的()附:A. 有99%以上的把握认为英语词汇量与阅读水平无关B. 有99.5%以上的把握认为英语词汇量与阅读水平有关C. 有99.9%以上的把握认为英语词汇量与阅读水平有关D. 在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关 【答案】:D 【分析】由题意()26.6350.01P K ≥=,由独立性检验的原理即可得解.【详解】由题意27K =,()26.6350.01P K ≥=,所以在犯错误的概率不超过1%的前提下,可以认为英语词汇量与阅读水平有关,有99%的把握认为英语词汇量与阅读水平有关. 故选:D.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:由22()()()()()n ad bc a b c d a c b d χ-=++++算得,22110(40302020)7.860506050χ⨯⨯-⨯=≈⨯⨯⨯.附表:参照附表,得到的正确结论是()A. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;B. 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”;C. 有99%以上的把握认为“爱好该项运动与性别有关”;D. 有99%以上的把握认为“爱好该项运动与性别无关”.【答案】:C【分析】根据给定的2K的值,结合附表,即可得到结论.【详解】由22110(40302020)7.8 6.63560506050χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%以上的把握认为“爱好该项运动与性别有关.故选:C.4.在一次独立性检验中得到如下列联表:若这两个分类变量A和B没有关系,则a的可能值是() A. 200 B. 720C. 100D. 180【答案】:B 【分析】令2k 的观测值为零,解方程即得解.【详解】当a =720时,k =0,易知此时两个分类变量没有关系. 故【答案】为B5.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人 附表:附:()()()()()22n ad bc K a b c d a c b d -=++++ A. 25 B. 45C. 60D. 75【答案】:BC 【分析】设男生的人数为()5n n N*∈,列出22⨯列联表,计算出2K 的观测值,结合题中条件可得出关于n 的不等式,解出n 的取值范围,即可得出男生人数的可能值.【详解】设男生的人数为()5n n N*∈,根据题意列出22⨯列联表如下表所示:则()221042310557321n n n n n n K n n n n ⨯⨯-⨯==⨯⨯⨯,由于有95%的把握认为是否喜欢抖音和性别有关,则23.841 6.632K ≤<,即103.841 6.63221n≤<,得8.066113.9272n ≤<, n N *∈,则n 的可能取值有9、10、11、12,因此,调查人数中男生人数的可能值为45或60. 故选:BC. 二、填空题6.某手机运营商为了拓展业务,现对该手机使用潜在客户进行调查,随机抽取国内国外潜在用户代表各100名,调查用户对是否使用该手机的态度,得到如图所示的等高条形图.根据等高图,______(填“有”或“没有”)99.5%以上的把握认为持乐观态度和国内外差异有关.(参考公式与数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)()20P K k ≥0.05 0.01 0.005 0.001 0k3.841 6.635 7.879 10.828【答案】:有依题意,可知国内代表乐观人数60人,不乐观人数40人,国外乐观人数40人,不乐观人数60人,总计乐观人数100人,不乐观人数100人,所以,而,所以有99.5%以上的把握认为持乐观态度和国内外差异有关.7.给给给给给给给 给线性回归方程y bx a =+必过点(),x y ;给相关系数r 越小,表明两个变量相关性越弱; ()22200606040408100100100100K ⨯-⨯==⨯⨯⨯87.879>给相关指数2R 越接近1,表明回归的效果越好;给在一个2×2列联表中,由计算得2K 的观测值k =13.079,则有99%以上的把握认为这两个变量之间没有关系;给设有一个线性回归方程35y x =-,则变量x 增加一个单位时,y 平均增加5个单位. 其中正确的说法有 (填序号).【答案】:给给对于给,应该是相关系数r 的绝对值越小,表明两个变量相关性越弱.所以它是错误的.对于给,应该是有99%以上的把握认为这两个变量之间有关系.对于给,应该是变量x 增加一个单位时,y 平均减少5个单位.故填给给.三、解答题8.随着现代教育技术的不断发展,我市部分学校开办智慧班教学,某校从甲乙两智慧班各随机抽取45名学生,调查两个班学生对智慧课堂的评价:“满意”与“不满意”,调查中发现甲班评价“满意”的学生人数比乙班评价“满意”的学生人数多9人,根据调查情况制成如下图所示的2×2列联表:(1)完成2×2列联表,并判断能否有97.5%的把握认为评价与班级有关系?(2)从甲乙两班调查评价为“不满意”的学生中按照分层抽样的方法随机抽取7人,现从这7人中选派3人到校外参加智慧课堂研究活动,求其中至少有2人选自乙班学生的概率. 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】:(1)表格见解析,有97.5%的把握认为评价与班级有关系;(2)67. 【分析】 (1)首先根据题意填写22⨯列联表,再计算2 5.031 5.024=>K 即可得到结论.(2)首先根据题意得到甲班选取2人,乙班选取5人,再计算概率即可.【详解】(1)完成列联表如下:2290(3915306)=5.031 5.024********⨯-⨯=>⨯⨯⨯K . 所以有97.5%的把握认为评价与班级有关系.(2)抽样比17213==,甲班选取2人,乙班选取5人,则1232553767C C CpC+==.9.盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某款盲盒内可能装有某一套玩偶的A、B、C三种样式,且每个盲盒只装一个.(1)若每个盲盒装有A、B、C三种样式玩偶的概率相同.某同学已经有了A样式的玩偶,若他再购买两个这款盲盒,恰好能收集齐这三种样式的概率是多少?(2)某销售网点为调查该款盲盒的受欢迎程度,随机发放了200份问卷,并全部收回.经统计,有30%的人购买了该款盲盒,在这些购买者当中,女生占23;而在未购买者当中,男生女生各占50%.请根据以上信息填写下表,并分析是否有95%的把握认为购买该款盲盒与性别有关?参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:(3)该销售网点已经售卖该款盲盒6周,并记录了销售情况,如下表:由于电脑故障,第二周数据现已丢失,该销售网点负责人决定用第4、5、6周的数据求线性回归方程,再用第1、3周数据进行检验.①请用4、5、6周的数据求出y关于x的线性回归方程y bx a=+;(注:()()()1122211n ni i i ii in ni ii ix x y y x y nx ybx x x nx====---==--∑∑∑∑,a y bx=-)②若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2盒,则认为得到的线性回归方程是可靠的,试问①中所得的线性回归方程是否可靠?③如果通过②的检验得到的回归直线方程可靠,我们可以认为第2周卖出的盒数误差也不超过2盒,请你求出第2周卖出的盒数的可能取值;如果不可靠,请你设计一个估计第2周卖出的盒数的方案.【答案】:(1)29;(2)表格见解析,有95%把握认为购买该款盲盒与性别有关;(3)给2.514.5y x=+;给是可靠的;给第2周卖出的盒数的可能值为18、19、20、21.【分析】(1)用列举法写出所有基本事件,再从中找出满足要求的基本事件,用古典概型的公式即可求得结果;(2)通过计算,完成列联表,再计算出观测值2 4.714k ≈,比表中0.05所对应的数据3.841大,故得出结论“有95%把握认为购买该款盲盒与性别有关”;(3)给将第4、5、6周的数据代入公式,计算出b 和a ,写出回归直线方程;给将第1、3周的数据代入给所求出的回归直线方程进行检验,该方程可靠;给将2x =代入给所求出的回归直线方程,解得19.5y =,根据可靠性的要求,以及该应用题的实际要求,得出第2周卖出的盒数的可能取值.【详解】解:(1)由题意,基本事件空间为{}(,),(,),(,),(,),(,),(,),(,),(,),(,)A A A B A C B A B B B C C A C B C C Ω=,其中基本事件的个数为9,设事件D 为:“他恰好能收集齐这三种样式”,则()(){},,,D B C C B =,其中基本事件的个数为2, 则他恰好能收集齐这三种样式的概率29P =; (2)22200(40702070) 4.7141109060140k ⨯-⨯=≈⨯⨯⨯, 又因为4.714 3.841>,故有95%把握认为“购买该款盲盒与性别有关”;(3)给由数据,求得5x =,27y =,由公式求得 222(45)(2527)(55)(2627)(65)(3027)5(45)(55)(65)2b --+--+--==-+-+-, 527514.52a =-⨯=, 所以y 关于x 的线性回归方程为 2.514.5y x =+;给当1x =时, 2.5114.517y =⨯+=,17162-<,同样,当3x =时, 2.5314.522y =⨯+=,22232-<,所以,所得到的线性回归方程是可靠的;给由给可知回归直线方程可靠,2x =时 2.5214.519.5y =⨯+=,设第二周卖出的盒数为()n n N ∈,则19.52n -≤,≤≤,n17.521.5给n能取18、19、20、21,即第2周卖出的盒数的可能值为18、19、20、21.【点睛】本题考查了古典概型的概率计算,独立性检验的实际应用,线性回归直线方程的求解及实际应用问题,综合性较强.10.阿基米德是古希腊伟大的哲学家、数学家、物理学家,对几何学、力学等学科作出过卓越贡献.为调查中学生对这一伟大科学家的了解程度,某调查小组随机抽取了某市的100名高中生,请他们列举阿基米德的成就,把能列举阿基米德成就不少于3项的称为“比较了解”,少于三项的称为“不太了解”.他们的调查结果如下:(1)完成如下2×2列联表,并判断是否有99%的把握认为,了解阿基米德与选择文理科有关?(2)在抽取的100名高中生中,按照文理科采用分层抽样的方法抽取10人的样本. (i )求抽取的文科生和理科生的人数;(ii )从10人的样本中随机抽取3人,用X 表示这3人中文科生的人数,求X 的分布列和数学期望.参考数据:22()()()()()n ad bc k a b c d a c b d -=++++,n a b c d =+++. 【答案】:(1)见解析;(2) (i )文科生3人,理科生7人 (ii )见解析【分析】(1)写出列联表后可计算2K ,根据预测值表可得没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )文科生与理科生的比为310,据此可计算出文科生和理科生的人数. (ii )利用超几何分布可计算X 的分布列及其数学期望.【详解】解:(1)依题意填写列联表如下:计算222()100(42182812) 3.382 6.635()()()()30705446n ad bc K a b c d a c b d -⨯-⨯==≈<++++⨯⨯⨯, ∴没有99%的把握认为,了解阿基米德与选择文理科有关.(2)(i )抽取的文科生人数是30103100⨯=(人),理科生人数是70107100⨯=(人). (ii )X 的可能取值为0,1,2,3,则0337310C C 7(0)C 24P X ===⋅, 1237310C C 21(1)C 40P X ===⋅, 17213307(2)40C C P X C ⋅===, 3037310C C 1(3)C 120P X ===⋅. 其分布列为所以72171369()01232440401204010E X =⨯+⨯+⨯+⨯==.31。
人教版高二下数学选择性必修第三册-8.3 列联表与独立性检验(第1课时)【课件】
d
c+d
合计
a+c
b+d
n=a+b+c+d
2×2 列联表给出了成对分类变量数据的交叉分类频数.
要点 3 独立性检验
(1)定义:利用随机变量 χ2 的取值推断___两__个_分__类_变__量_是__否_独__立_____的方法称为
独立性检验.
n(ad-bc)2
(2)χ2=____(_a_+__b_)_(__c_+_d_)__(__a+__c_)__(_b_+__d_)___,其中 n=a+b+c+d.
有关系.
【解析】 等高堆积条形图如图所ቤተ መጻሕፍቲ ባይዱ:
由图可以直观地看出铅中毒病人组与对照组相比,尿棕色素为阳性的频率差 异明显,因此铅中毒病人与尿棕色素为阳性有关系.
(2)为了了解某高校学生喜欢使用手机支付是否与 性别有关,随机抽取了部分学生,统计后作出如图所示 的等高堆积条形图,则下列说法正确的是( D )
思考题 2 下面是 2×2 列联表:
y1
y2
总计
x1
a
21
73
x2
22
25
47
总计
b
46
120
则表中 a,b 的值分别为( C )
1.两个分类变量之间关联关系的定性分析的方法 (1)频率分析法:通过对样本的每个分类变量的不同类别事件发生的频率大小 进行比较来分析分类变量之间是否有关联关系.如可以通过列联表中a+a b与c+c d 值的大小粗略地判断分类变量之间有无关系.一般其值相差越大,分类变量有关 系的可能性越大.
(2)图形分析法:与表格相比,图形能更直观地反映出两个分类变量间是否互 相影响,常用等高堆积条形图展示列联表数据的频率特征.
思考题 1 (1)观察下列等高堆积条形图,其中最有把握认为两个分类变量 X,Y 之间有关系的是( D )
独立性检验高二数学市公开课一等奖省赛课获奖PPT课件
课前探究学习
课堂讲练第9互页动
题型一 2×2列联表
【例1】 某学校对高三学生作一项调查后发觉:在平时模拟 考试中,性格内向426名学生中有332名在考前心情紧 张,性格外向594名学生中在考前心情担心有213 人.请作出考前心情担心与性格列联表. [思绪探索] 在2×2列联表中,共有两类变量,每一类变
课前探究学习
课堂讲练第1互9页动
[规范解答] 对于上述四个科目,分别构造四个随机变量 χ21,χ22,χ23,χ42由表中数据可以得到 语文:χ21=244× 2011×744×3×132-042×7×40302≈7.294>6.635,(3 分) 数学:χ22=244× 2011×784×3×202-012×3×43232≈30.008>10.828, (6 分) 英语:χ23=244× 2011×764×3×192-002×5×44242≈24.155>10.828, (9 分)
因此有 99%的把握认为聋与哑有关.
课前探究学习
课堂讲练第1互4页动
规律方法 (1)判断两个研究对象是否有关的方法 可以利用独立性检验来考查两个研究对象是否有关,并 且能较精确地给出这种判断的可靠程度.具体做法是: 根据观测数据计算由公式给出的检验统计量 χ2 的值,其 值越大,说明“X 与 Y 有关”成立的可能性越大. (2)本题是利用 χ2=a+bcn+add-ab+cc2b+d求出 χ2 的 值,再利用 χ2 与临界值的大小关系来判断假设是否成立, 解题时应注意准确代数与计算,不可错用公式,要准确 进行比较与判断.
于研究两类变量之间是否相互独立.它适合用于分析两
类变
量之间关系,是对两类变量进行独立性检验基础.
(2)使用统计量作2×2列联表独立性检验时,要求表中四
8.3.2独立性检验教学设计-2023学年下学期高二数学教学人教A版(2019)选择性必修第三册
《8.3.2独立性检验》教学设计(一)教学内容独立性检验(二)教材分析1. 教材来源本节课选自《2019人教A版高中数学选择性必修第三册》,第八章《成对数据的统计相关性》2. 地位与作用独立性检验是从样本数据中发现关系,是成对样本数据统计分析的重要内容,是依据数据进行合理推理的典型方法,体现了数学的理性精神,也是提升数据分析和逻辑推理素养的重要素材。
(三)学情分析1.认知基础:前一节课已经学习了八两个分类变量整理成一个2×2的列联表。
2.认知障碍:独立性检验合理性的理解(四)教学目标1. 知识目标:通过实例了解独立性检验的基本思想2.能力目标:掌握独立性检验的基本步骤3.素养目标:会用独立性检验解决简单的实际问题,提升数据分析能力。
(五)教学重难点:1. 重点:独立性检验的思想方法2.难点:.χ2统计量的导出和意义(六)教学思路与方法教学过程分为问题呈现阶段、探索与发现阶段、应用知识阶段(七)课前准备电脑、投影机、三角板(八)教学过程教学环节:新课引入教学内容师生活动设计意图前面我们通过2×2列联表整理成对分类变量的样本观测数据,并根据随机事件频率稳定性推断两个变量之间是否有关联。
对于随机样本而言,因为频率具有随机性,频率与概率之间存在误差,所以我们推断可能犯错误,而且在样本容量较小时,犯错误的可能性会较大。
因此,需要找到一种更为合理的推断方法,同时页希望能对出现错误推断的概率有一定的控制或估算。
教学环节:新知探究教学内容师生活动 设计意图 虑以Ω为样本空间的古典概型,设X 和Y 为定义在Ω上,取值于{0,1}的成对分类变量,我们希望判断事件{X=1}和{Y=1}之间是否有关联。
注意到{X=0}和{X=1}, {Y=0}和{Y=1}都是互对立事件,与前面的讨论类似,我们需要判断下面的假定关系H 0:P (Y =1|X =0)=P (Y =1|X =1)是否成立,通常称H 0为零假设或原假设P(Y=1|X=0)表示从{X=0}中随机选取一个样本点,该样本点属于{X=0,Y=1}的概率; P(Y=1|X=1)表示从{X=1}中随机选取一个样本点,该样本点属于{X=1,Y=1}的概率。
高二数学独立性检验1
2×2列联 表
345
练习: 书 P 91
1 , 2 ,3
; 合盛娱乐,合盛娱乐官网,合盛娱乐开户,合盛娱乐注册
9wjw
天;下班之后回到我姐姐的出租屋里,迎来的却又是苦逼的做公务员考试专用的真题。哎,谁叫我是这么一个没什么用的人呢,读书不好,没 有特长,加上我从小就怕事的性格,这大学也快熬到毕业,也只能在姐姐工作的公司里混混,当个实习生,好让自己毕业出来能混到个好工作 罢了。今晚可真热啊!又一次出着浑身臭汗,坐在地一点儿大的饭厅的椅子上,吹着看似也在**的电扇,天啊,还是很热,这让我怎么会有心 情去做题呢!受不了热,也真做不下去题目。无聊的转着手上的笔,突然发现,我姐姐正坐在离我不远处的斜对面的沙发上,在仔细地涂着脚 指甲油。那是屈臣氏的化妆货,味儿还挺呛鼻的。屋里的灯光略显暗黄,照得姐姐像是一个少妇,如是憔悴。我停下了手中的笔,没了我因为 热而躁动发出的声响,屋子就变得异常寂静了。我看着姐姐,心中升起了一阵愧疚与怜惜,也偶然地想起我们两姐弟儿时的事情。姐姐的脾气 从小就倔,性格像个男孩,脾气刚烈胆子又大,尤其是在我这个生理上是男丁的弟弟出世之后,她更是不被家人重视,这重男轻女的风俗让我 姐姐变得无比强势,也就因此对我这个弟弟不曾有任何的喜欢。直到现在,我姐姐其实也正值青春时期,但是因为我是家里的唯一男丁,在这 实习期间,她就让自己当起已不在人世的父亲的角色来管教我,尽管她并不是上世纪六七十年代的大人,但因为我,却让她操心,让她变得更 加憔悴。其实,我的姐姐也算是一个美人,白皙的皮肤,秀长的头发,活像古时的美人儿,只是岁月与家庭、工作的侵蚀与摧残,使姐姐在神 采上已经变得苍老,那穿在身上的花裙子,仿佛只是一块在掩饰她伤痕的布料,那刺鼻的甲油,就像是告诉着人们,她只是个苦美人。不知不 觉地,我看着姐姐,发呆了好久,等我回过神来,才意识到,糟啦,我偷懒得这么明显,这回要被骂惨啦。正当我打算用乞求原谅的眼神望向 姐姐的时候,屋里唯一的灯灭了,屋子顿时陷入一片黑暗,来不及做出反应的我,一慌张就摔了个摔跟头,然后就昏了过去了。昏的时候,人 是在做梦吗?好多快乐的儿时片段重现在我脑中。时间的流动也似乎在掠过我的身躯,让我觉得,时间是可以被抓住的。只是,我就算真能抓 住时间,我又能干些什么呢?让我重新经历一次人生?让我不再如此软弱?让我做个不平凡的人吗?脑海里显现最多的就是一家人开开心心的 场景,我是多么渴求有一个完整的家,就算是一个没钱的家,那也是一个没有裂痕,完整的家。父亲的逝去,换来的是庞大家族对我的让我感 到无法呼吸的“关怀”,他们变质的关爱压着我,而我的那时的无能就像一个无底洞,只能接受他们的恩惠,全盘尽收,留下我一辈子也无法 还清的亲情债,我的人生过于
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
怎样描述实际观测值与估计值的差异呢? 统计学中采用
2 ( 观测值 预期值 ) 用卡方统计量: 2 预期值 来刻画实际观测值与估计值的差异.
即
ab ac 2 ab bd 2 (a n ) (b n ) n n n n 2 ab ac ab bd n n n n n n cd ac 2 cd bd 2 (c n ) (d n ) n n n n cd ac cd bd n n n n n n
例3:气管炎是一种常见的呼吸道疾病,医药研究人 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 员对两种中草药治疗慢性气管炎的疗效进行对比, x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 所得数据如表所示,问:它们的疗效有无差异? 复方江剪刀草 胆黄片 合计 有效 184 91 275 无效 61 9 70
某医疗机构为了了解呼吸道疾病与吸 烟是否有关,进行了一次抽样调查,共调 查了515个成年人,其中吸烟者220人,不 吸烟者295人,调查结果是:吸烟的220人 中37人患病, 183人不患病;不吸烟的 295人中21人患病, 274人不患病。 根据这些数据能否断定:患肺癌与 吸烟有关吗?
列 2× 2联 表
2
合计 98 95 193
解:设H0:药的效果与给药方式没有关系。
2
19358 31 64 40 1.3896 <2.072 122 71 98 95 因当H0成立时,χ2≥1.3896的概率大于15%,故不能否定假设 H0,即不能作出药的效果与给药方式有关的结论。
为了研究这个问题,我们将上述问题用下表表示:
吸烟 不吸烟 总计
患病 37 21 58
不患病 183 274 457
总计 220 295 515
在不吸烟者中患病的比重是 7.12% 在吸烟者中患病的比重是 16.82% 上述结论能什么吸烟与患病有关吗?能有多大把 握认为吸烟与患病有关呢?
假设H0:吸烟和患病之间没有关系 即H0:P(AB)=P(A)P(B) 其中A为某人吸烟,B为某人患病 列出2×2列联表 患病 不患病 总计 设 n= a + b + c+ d
2
500 500 1000
解:设 284 242 216 2 7.075 474 526 500 500 因当H0成立时,χ2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
2
合计 245 100 345
解:设H0:两种中草药的治疗效果没有差异。
345184 9 61 91 2 11.098 275 70 245 100
因当H0成立时,χ2≥10.828的概率为0.001,故有99.9%的把握 认为,两种药物的疗效有差异。
; / 快转 ;
反证法原理与假设检验原理 反证法原理:
在一个已知假设 下,如果推出一 个矛盾,就证明 了这个假设不成 立。
假设检验原理:
在一个已知假设 下,如果一个与 该假设矛盾的小 概率事件发生, 就推断这个假设 不成立。
例 1. 在 500 人身上试验某种血清预防感冒作用,把他们 P(χ≥x0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 一年中的感冒记录与另外 500 名未用血清的人的感冒记 x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 录作比较,结果如表所示。问:该种血清能否起到预防 感冒的作用? 未感冒 感冒 合计 使用血清 未使用血清 合计 258 216 474 242 284 526
例 2:为研究不同的给药方式(口服与注射)和药的效 P(χ≥x 0.10 0.05 0.025 0.010 0.005 0.001 0) 0.50 0.40 0.25 0.15 果(有效与无效)是否有关,进行了相应的抽样调查, x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 调查的结果列在表中,根据所选择的193个病人的数 据,能否作出药的效果和给药方式有关的结论? 口服 注射 合计 有效 58 64 122 无效 40 31 71
吸烟 不吸烟 总计 a c a+c b d b+d a+b c+d a+b+c+d
ab 则P(A) n ac P(B) n
ab ac 故P(AB) n n
吸烟且患病人数 吸烟但未患病人数 不吸烟但患病人数 不吸烟且未患病人数
n P ( AB ) n
ab ac n n ab bd n P ( AB ) n n n cd ac n P ( AB ) n n n cd bd n P ( AB ) n n n
2 n ( ad bc ) 化简得 2 ( a c )( b d )( a b )( c d )
独立性检验
用χ2统计量研究 这类问题的方法 步骤
通过数据和图表分析,得到 结论是:吸烟与患病有关 结论的可靠 程度如何?
第一步:H0: 吸烟和患病之间没有关系
第二步:列出2×2列联表
0.10
0.05 0.025 0.010 0.005 0.001
0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
例如
2
10.828
2
0.1%把握认 为A与B无关
1%把握认为 A与B无关
99.9%把握认 为A与B有关
99%把握认 6.635 为A与B有关 90%把握认 10%把握认为 2 2.706 为A与B有关 A与B无关 没有充分的依据显示A与B有关, 2 2.706 但也不能显示A与B无关
P(≥x0) x0 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
P(χ≥x0) 0.50 0.40 0.25 0.15 x0
吸烟 不吸烟 总计 患病 a c a+c 不患病 b d b+d 总计 a+b c+d a+b+c+d
第三步:引入一个随机变量:卡方统计量
2
a b c d a c b d
其中n a b c d
n ad bc
2
第四步:查对临界值表,作出判断。
2 2
已知在 H 0成立的情况下,
P(
2
10.828 ) 0.001
2 即在 H 0 成立的情况下, 大于10.828概率非常 小,近似为0.001 2 现在的 =56.632的观测值远大于10.828, 出现这样的观测值的概率不超过0.001。
故有99.9%的把握认为H0不成立,即有99.9% 的把握认为“患病与吸烟有关系”。
言活着并且再次杀到宋家,而是他感觉得出来,鞠言の实历似乎比上壹次,提升了极多.上壹次の事候,老族长就觉得与鞠言厮杀胜少输多,那么现在鞠言实历再度提升,他の胜算就等于零!“鞠言小友,你呐是何意?”宋家老族长沙哑の声音,喝问道.鞠言,冷笑了笑.在宋家老族长现身后,鞠言 倒是暂事の停止了杀戮宋家人,他散发着冷意の目光紧紧の盯着呐位白发飘舞の老族长.“老族长!俺再来宋家の原因,你应该很清楚!俺鞠言,最痛恨の就是那种出尔反尔の小人.对你,俺真の很失望!俺以为你呐位老族长,是值得信任の人,可你做出の事情,却辜负了俺の信任!”鞠言の 声音极其高昂,并且带着令人心悸の愤怒.“呵呵,你们呐些人,是认为俺已经死了吧?可惜,俺没让你们如愿!俺,还活着!”鞠言手中天吙剑再闪,剑芒瞬间凝聚而出.“鞠言!俺宋家,似乎没有做出让你如此愤怒の事情.呐其中,有误会!”老族长见鞠言又要动手,连忙急促の解释说道.“老 族长,说呐些没有任何意义,俺也不想听你更多の解释.”鞠言摇头.再绝对の实历面前,鞠言也懒得多说废话.“快看宋家上空!”“那是……鞠言?”“哪个?他没死?他不是被暗夜杀手给杀掉了吗?怎么还活着?”“鞠言没死,宋家要完蛋了!”宋家宅院四周の许多修行者,也都发现了鞠言. 鞠言还活着,让他们意外.可鞠言出现在宋家,倒是没有让他们吃惊.他们知道鞠言为何会再杀到宋家.最近宋家の壹连串动作……呵呵……既然鞠言还活着,那宋家确实要完蛋了.上壹次鞠言为烈焰杀到宋家斩杀宋家拾多名强者,宋家老族长出面许下诺言.可是之后,宋家所做の事,明眼人壹 眼就能看出宋家是背信弃义了.不过就算看出呐壹点,最多也就能暗中鄙夷壹下,要他们出面主持公道,他们没有那个实历.鞠言知道宋家背叛了他,呐样の愤怒,也是理所当然の事情.赤色剑光凝聚,壹柄巨大の长达上百名の剑影,带着无与伦比の威能和杀意,横扫而下.宋家老族长来不及再多 说话,连催动手中紫色圆盘,试图抵挡鞠言针对宋家人の呐壹次斩杀.第肆柒壹章果决紫光如壹道亘枯不变の长河,横跨长空,及事拦截在将要临空斩杀而下の巨大赤‘色’刀影之下..呐两种光晕,将呐壹方无垠の天空,染上了炫目の颜‘色’.无尽の威能,从那光晕之中,铺天盖地の辐‘射’ 四方.即便是宋家宅院之外の那些修行者,都能感受到,那可怕の浩‘荡’威压.所有人の目光,都凝视着那天际之上.宋家老族长,能挡住鞠言の攻击吗?如果挡住了,那么鞠言会退走吗?或者是,全历以赴の继续厮杀下去?“呐……”“怎么会?”“好可怕!好恐怖の剑光!”就在众人の注视 之下,宋家老族长の紫‘色’光芒,竟是在接触赤‘色’剑芒之后,眨眼间便崩溃瓦解.大量の紫‘色’光晕,如繁