2021人教A版数学选修1-2配套训练:1.2 独立性检验的基本思想及其初步应用
(完整版)1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修1-2(人教A版)1.2 独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表 D.以上均不对答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.aa+b与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( )A.k越大,“ X与Y有关系”可信程度越小B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B4.下面是一个2×2列联表:则表中a、b的值分别为( )A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于 ( )A.0.043 B.0.367C.22 D.26.87答案:C6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( )A.0.4 B.0.5 C.0.75 D.0.85答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为0.038、0.006B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110由K 2=算得, K 2=≈7.8.附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.841 6.635 10.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=可得,K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P (K2≥k0)0.050.0100.001k03.8416.63510.8285.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:P(K2≥k0)0.500.400.250.150.100.050.0250.010.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678910 数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920 数学成绩67936478779057837283物理成绩77824885699161847886若单科成绩85以上(含85分),则该科成绩优秀.数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计解析:(1)2×2列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀 527物理成绩不优秀 1 1213 合计 6 1420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:y1y2合计x1 a b a+bx2 c d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:P(K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P(K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828解析:根据列联表可以求得K2的观测值k=≈8.802>7.879.在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.7. 2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530 使用未经淡化海砂151530 总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得P(K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?P(K2≥k)0.100.0500.0250.0100.001 k 2.706 3.841 5.024 6.63510.828解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=23.即取出的2个样本混凝土耐久性都达标的概率是2 3 .8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P(K2≥k0)0.150.100.050.0250.010.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:∵K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=80×(120-360)266×14×40×40≈3.117>2.706.∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析:K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967,由于9.967>6.635所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.8282.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10 .(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
人教A版高中数学选修1-21.2独立性检验的基本思想及其初步应用课后训练含答案
1.2独立性检验的基本思想及其初步应用课后训练案巩固提升一、A组1.在4个独立性检验中,根据试验数据得到K2统计量的值分别为:①6.98;②4.75;③2.93;④9.24.其中在犯错误的概率不超过0.01的前提下认为两个事件有关的独立性检验有()(参考临界值:P(K2≥6.635)≈0.01)A.1个B.2个C.3个D.4个解析:只有①和④,我们可以在犯错误的概率不超过0.01的前提下认为两个事件有关.答案:B2.在一次调查后,根据所得数据绘制成如图所示的等高条形图,则()A.两个分类变量关系较弱B.两个分类变量没有关系C.两个分类变量关系较强D.无法判断解析:从条形图中可以看出,在x1中y1的比重明显大于x2中y1的比重,所以两个分类变量的关系较强.答案:C3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关系”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法正确的是()A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有答案:D4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是()附:P(K2≥k0)0.250.150.100.0250.0100.005k0 1.323 2.072 2.706 5.024 6.6357.879。
人教A版选修1-2《1.2独立性检验的基本思想及其初步应用》课件
其中n=a+b+c+d为样本容量.
3.独立性检验的具体做法
(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率 的上界α,然后查表确定 临界值k0 . (2)利用公式计算随机变量K2的 观测值.k (3)如果 k≥k0 ,就推断“X与Y有关系”,这种推断犯错误的概率不超过α; 否则,就认为在 犯错误的概率 不超过α的前提下不能推断“X与Y有关 系”,或者在样本数据中 没有发现足够证据 支持结论“X与Y有关系”.
P(K2≥k0) k0
0.10 2.706
0.05 3.841
0.01 6.635
解答
类型三 独立性检验的综合应用
例3 电视传媒公司为了解某地区观众 对某类体育节目的收看情况,随机抽 取了100名观众进行调查,其中女性有 55名.如图所示的是根据调查结果绘制 的观众日均收看该体育节目时间的频 率分布直方图. 将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知 “体育迷”中有10名女生.
数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?
解答
反思与感悟
(1)等高条形图实质上是列联表中的数据的频率特征. (2)由于高度相等的条形分别用两种不同颜色表示,其频率差异更能直观 地表现出来.
跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解 网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随 机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人 期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常 上网与学习成绩有关吗?
知识点二 等高条形图
1.与表格相比,图形更能直观地反映出两个分类变量间是否 相互,影常响用 等
高中数学选修1-2《1.2 独立性检验的基本思想及其初步应用》课后作业本(人教A版,pdf版,含答案)
认为性 别 与 喜 欢 饮 酒 有 关 的 正 确 性 的 概 率 为
若两个分类变量 # 与 $ 的列联表为 ( !
独立性检验的基本思想及其初步应用 第一章 统计案例 下表 是 某 地 区 的 一 种 传 染 病 与 饮 用 水 的 调 0 查表
已知 ' !
)
/ 0 +" * * * "% '! 0
)
" 根 据 表 中 的 数 据 计 算% 得到 # * / ) / * * #% *
&% - / ! # (% )) 0 * .
)
!
) " ) + *3 ! # * #3) *5# ) !3! " 则 # + "% # ) ) "3. "3# ! .3# ! !
独立性检验的基本思想及其初步应用 第一章 统计案例
第三课时
班级 姓名 时间 ! " 分钟 某班主任对全班" # *名学生进行了作业量的 数据如下表 ( 调查 %
认为作业多 男生 女生 总计 # / / ) . 认为作业不多 + # " ) ! 总计 ) 0 ) " *
试作统计分析推 断 得 病 是 否 与 饮 用 不 干 净 水 有关
#
)
总计 ) " " . / #
# )
总计
# * ! * " *
# " # . #
则* 这个结论出错的可能 # 与$ 之间有关系 + 性为 列表 ( "
'! ) ! * " * *" ! *
【高考一轮复习】高中数学人教A版第选修1-2配套课件: 1.2独立性检验的基本思想及其初步应用
有关系 . 分类变量之间__________
1-2
第一章
1.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 · 选修1-1
1-2
4.独立性检验 (1)定义:利用随机变量K2来判断______________________ “两个分类变量有关系”
第一章
1.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 · 选修1-1
1-2
3.利用独立性检验来考虑两个分类变量 X和Y是否有关系
时,通过查阅临界值表来确定断言“ X 与 Y 有关系”的可信 度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯 错误的概率不超过( A.0.25 ) B.0.75
联表)为下表.
y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+d a+b+c+d
1-2 第一章 1.2
成才之路 ·高中新课程 ·学习指导 ·人教A版 ·数学 · 选修1-1
1-2
3.等高条形图 (1)等高条形图与表格相比,更能直观地反映出两个分类变
互相影响 ,常用等高条形图展示列联表数据的 量间是否 ___________ 频率特征 . __________
1-2
2.对于分类变量X与Y的随机变量K2的观测值k,下列说法 正确的是( ) A.k越大,推断“X与Y有关系”,犯错误的概率越大 B.k越小,推断“X与Y有关系”,犯错误的概率越大
C.k越接近于0,推断“X与Y无关”,犯错误的概率越大
D.k越大,推断“X与Y无关”,犯错误的概率越小 [答案] B
1-2
1-2
第一章
人教A版选修1-2教案:1.2独立性检验的基本思想及其应用(2)(含部分答案)
从而有50%的把握认为“成绩是否优秀与班级有关系”,即断言“成绩是否优秀
与班级有关系”犯错误的概率为0.5。
五、小结
独立性检验是一种假设检验,在对总体的估计中,通过抽取样本构造合适的统
计量,对假设的正确性进行判断。
六、作业
1、收集班上所有学生的身高的数据,构造一个关于每一个学生的性别与其身高是否高于(或低于)中位数的列联表,推断性别与身高在多大程度上有关系?
解:由公式得: ,由于7.317 6.635,所以我们有99%的把握认为新措施对猪白痢的防治是有效的。
2、调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表,试问能以多大的把握认为婴儿的性别与出生时间有关系。
晚上
白天
合计
男婴
24
31
55
女婴
8
26
34
合计
32
57
89
解:由公式得: ,所以没有充分的证据显示婴儿的性别与出生时间有关。
§1.2独立性检验的基本思想及其应用(二)
【学情分析】:
在实际的问题中,经常会面临需要推断的问题,比如研制一种新药,需要推断此药是否有效?有人怀疑吸烟的人更容易患肺癌,那么吸烟是否与患肺癌有关呢?等等。在对类似的问题作出推断时,我们不能仅凭主观意愿作出结论,需要通过试验来收集数据,并依据独立性检验的原理作出合理的分析推断.在本节的学习中,通过案例分析,使学生学会用假设检验的思想方法解决对于两个分类变量是否有关系的判断问题,并理解统计思维与确定性思维的差异。
思考:因为k≈16.373>10.828,所以有99.9%以上的把握认为“秃顶与患心脏病有关”,这和上述结论矛盾吗?
解答:这种说法的推理过程也是正确的,两种说法不矛盾。
1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修 1-2( 人教 A 版)1.2 独立性检验的基本思想及其初步应用?达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是 ()A .散点图C .2×2列联表B .等高条形图 D .以上均不对答案: B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大 ( )a d c aA. a +b 与c +dB. a +b 与c +dacacC.a +b与c +dD.a +b与b +c答案: C3.对分类变量 X 与 Y 的随机变量 K 2的观测值 k ,说法正确的是 ()A .k 越大,“ X 与 Y 有关系”可信程度越小B .k 越小,“ X 与 Y 有关系”可信程度越小C .k 越接近于 0,“ X 与 Y 无关”程度越小D .k 越大,“ X 与 Y 无关”程度越大答案: B4.下面是一个2×2列联表:y1y2总计x1a2173x222527总计b46100则表中 a、b 的值分别为()A.94、96B.52、50C.52、54D.54、52答案: C5.性别与身高列联表如下:高(165 cm 以上 )矮(165 cm 以下 )总计男37441女61319总计431760那么,检验随机变量 K2的值约等于()A.0.043B.0.367C.22D.26.87答案: C6.给出列联表如下:优秀不优秀总计甲班103545乙班73845总计177390根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是 ()A.0.4B.0.5C.0.75D.0.85答案: B?素能提高1.在调查中发现 480 名男人中有38 名患有色盲, 520 名女人中有 6 名患有色盲,下列说法中正确的是()A.男人、女人中患有色盲的频率分别为0.038 、0.006B.男人、女人患色盲的概率分别为193 240、260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的D.调查人数太少,不能说明色盲与性别有关386解析:男人患色盲的比例为480,比女人中患色盲的比例520大,386其差值为480-520≈0.067 6,差值较大.答案: C2.通过随机询问 110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 2060不爱好20 3050总计60 50110由 K2=算得,K2=≈7.8.附表:200.0500.0100.001P( K≥k )k0 3.841 6.63510.828参照附表,得到的正确结论是()A.有 99%以上的把握认为“爱好该项运动与性别有关”B.有 99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过 0.1%的前提下,认为“爱好该项运动与性别无关”答案: A3.若由一个 2×2列联表中的数据计算得K2=4.013 ,那么在犯错误的概率不超过 0.05 的前提下认为两个变量 ______(填“有”或“没有” ) 关系.答案:有4.(2013 ·韶关二模 ) 以下四个命题:①在一次试卷分析中,从每个试室中抽取第 5 号考生的成绩进行统计,是简单随机抽样;②样本数据: 3,4,5,6,7的方差为2;③对于相关系数 r ,| r |越接近1,则线性相关程度越强;④通过随机询问 110 名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由 K2=可得, K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P( K2≥k0)0.050.0100.001k03.846.63510.828 15.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别喜欢语文性别不喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到 K2的观测值 k=据下表中的参考数据:≈4.844 ,因为k≥3.841,根P( K2≥k0) 0.500.400.250.150.100.050.020.010.000.0050510.450.70 1.32 2.07 2.70 3.84 5.02 6.637.8710.8k08326145928 5判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案: 5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级 20 名学生某次考试成绩 ( 满分 100 分) 如下表所示:序号12345678910数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920数学成绩67936478779057837283物理成绩77 82 48 85 69 91 61 84 7886若单科成绩 85 以上 ( 含 85 分) ,则该科成绩优秀.(1)根据上表完成下面的 2×2列联表 ( 单位:人 ).数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计解析: (1)2 ×2列联表为 ( 单位:人 ) :数学成绩优秀数学成绩不优秀合计物理成绩优秀527物理成绩不优秀11213合计61420(2)根据题 (1) 中表格的数据计算,能否在犯错误的概率不超过0.005 的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2) ,其样本频数列联表 ( 称为 2×2列联表 ) 为:y1y2合计x1a b a+bx2c d c+d合计a+c b+d a+b+c+d 则随机变量 K2=,其中 n=a+b+c+d 为样本容量;②独立检验随机变量K2的临界值参考表如下:P( K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P( K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828解析:根据列联表可以求得K2的观测值k=≈8.802>7.879.在犯错误的概率不超过 0.005 的前提下认为:学生的数学成绩与物理成绩之间有关系.7. 2013 年 3 月 14 日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了 60 个样本,得到了相关数据如下表:混凝土耐混凝土耐总计久性达标久性不达标使用淡化海砂25530使用未经淡化海砂151530总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设 H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得 P( K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2) 若用分层抽样的方法在使用淡化海砂的样本中抽取了 6 个,现从这 6 个样本中任取 2 个,则取出的 2 个样本混凝土耐久性都达标的概率是多少?参考数据:P( K2≥k)0.100.0500.0250.0100.001k 2.706 3.841 5.024 6.63510.828解析:用分层抽样的方法在使用淡化海砂的样本中抽取 6 个,其25中应抽取“混凝土耐久性达标”的为30×6= 5,“混凝土耐久性不达标”的为 6-5=1,“混凝土耐久性达标记”为 A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为 B.在这 6 个样本中任取 2 个,有以下几种可能: ( A1,A2) ,( A1,A3) ,( A1,A4) ,( A1,A5) ,( A1,B) ,( A2,A3 ) ,( A2,A4) ,( A2,A5) ,( A2,B),( A3,A4),( A3,A5),( A3,B),( A4,A5),( A4,B)( A5,B),共15种.A,它的对立设“取出的 2个样本混凝土耐久性都达标”为事件事件 A 为“取出的 2 个样本至少有 1 个混凝土耐久性不达标”,包含( A1,B) ,( A2,B) ,( A3,B) ,( A4,B) ,( A5,B) ,共 5 种可能.5 2∴P( A)=1-P( A )=1-15=3.2即取出的 2 个样本混凝土耐久性都达标的概率是3.8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取 40 件产品作为样本称出它们的重量 ( 单位:克 ) ,重量值落在 (495,510] 的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量 / 克频数(490,495]6(495,500]8(500,505]14(505,510]8(510,515]4甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取 1 件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为 (0.06 +0.09 +0.03) ×5×40= 36,故甲样本合3036格品的频率为40=0.75 ,乙样本合格品的频率为40=0.9.据此可估计从甲流水线任取 1 件产品,该产品恰好是合格品的概率为 0.75. 从乙流水线任取 1 件产品,该产品恰好是合格品的概率为0.9.(3)由以上统计数据完成下面 2×2列联表,能否在犯错误的概率不超过 0.1 的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P( K2≥k0)0.150.100.050.020.010.000.001505k02.07 2.70 3.84 5.02 6.637.8710.82 2614598( 参考公式:K2=,其中 n=a+b+c+d)解析: 2×2列联表如下:甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=414合计4040n=80∵K2=n ad-bc 2a+b c+d a+c b+d80× 120-360 2=66×14×40×40≈3.117>2.706.∴在犯错误的概率不超过 0.1 的前提下认为产品的包装质量与两条自动包装流水线的选择有关.?品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500 位老人,结果如下:性别男女是否需要志愿者需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.解析:调查的 500 位老年人中有 70 位需要志愿者提供帮助,因70此该地区老年人中需要帮助的老年人的比例的估计值为500=14%.(2)能否在犯错误的概率不超过 0.01 的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析: K2的观测值 k=500× 40×270-30×160 2200×300×70×430≈9.967 ,由于 9.967>6.635所以在犯错误的概率不超过0.01 的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据 (2) 的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解析:由于 (2) 的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附: K2=20.0500.0100.001P( K ≥k )k0 3.841 6.63510.8282.某工厂有 25 周岁以上 ( 含 25 周岁 ) 工人 300 名,25 周岁以下工人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“ 25 周岁以上 ( 含 25 周岁 ) ”和“ 25周岁以下”分为两组,再将两组工人的日平均生产件数分为 5 组:[50,60) ,[60,70) ,[70,80) ,[80,90) ,[90,100) 分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“ 25 周岁以下组”工人的概率;解析:由已知得,样本中有25 周岁以上组工人 60 名, 25 周岁以下组工人 40 名.所以,样本中日平均生产件数不足60件的工人中, 25 周岁以上组工人有 60×0.05 = 3( 人) ,40×0.05 = 2( 人) ,记为记为 A ,A ,A ;25周岁以下组工人有123B1,B2.从中随机抽取2 名工人,所有的可能结果共有10 种,它们是:( A1,A2) ,( A1,A3) ,( A2,A3) ,( A1,B1) ,( A1,B2) ,( A2,B1 ) ,( A2,B2),( A3,B1),( A3,B2),( B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有 7 种,它们是: ( A1,B1) , ( A1,B2) , ( A2,B1) ,7( A2,B2) ,( A3,B1) ,( A3,B2) ,( B1,B2) .故所求的概率P=10.(2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”?附: K2=P( K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解析:由频率分布直方图可知,在抽取的 100 名工人中,“ 25 周岁以上组”中的生产能手 60×0.25 = 15( 人) ,“ 25 周岁以下组”中的生产能手 40×0.375 = 15( 人) ,据此可得 2×2列联表如下:生产能手非生产能手合计25 周岁以上组15456025 周岁以下组152540合计3070100因为 1.79 <2.706 ,所以没有 90%的把握认为“生产能手与工人所在年龄组有关”.。
数学人教A版选修1-2教材习题点拨:1.2 独立性检验的基本思想及其初步应用含解析
教材习题点拨
练习
解:(1)画条形图如图所示.
由图及表直观判断好像“成绩优秀与班级有关系”.
因为K2的观测值k≈0。
653<6。
635,由教科书中表1-11可知,在犯错误的概率不超过0.01的前提下,不能认为“成绩与班级有关系".
点拨:通过图形的直观感觉的结果可能会出错误.本题计算得到的K2的值较小,所以没有充足的理由说明“成绩优秀与班级有关系”.
习题1。
2
1.解:假设“服药与患病之间没有关系”,则K2的值应该比较小;如果K2的值很大,则说明“服药与患病之间有关系".由列联表中数据可得K2的观测值k≈6。
110>5.024,而由教材表1-11知P(K2≥5。
024)≈0。
025,所以在犯错误的概率不超过0.025的前提下可以认为“服药与患病之间有关系”.又因为服药群体中患病的频
率0.182小于没有服药群体中患病的频率0。
400,所以“服药与患病之间有关系”可以解释为药物对于疾病有预防作用.因此在犯错误的概率不超过0.025的前提下,可以认为药物有效.
2.解:如果“性别与读营养说明之间没有关系”,由题目中所给数据计算,得K2的观测值k≈8。
416,而由教材表1-11知P(K2≥7.879)≈0.005,所以在犯错误的概率不超过0.005的前提下认为“性别与读营养说明之间有关系”.
3.略.
4.略.。
2020-2021学年人教A版数学选修1-2配套训练:1.2 独立性检验的基本思想及其初步应用
[A 组 学业达标]1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( )A .平均数与方差B .回归分析C .独立性检验D .概率解析:判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 答案:C2.如表是2×2列联表:y 1 y 2 总计 x 1 a 21 73 x 2 2 25 27 总计b46则表中a ,b 处的值分别为A .94,96 B .52,50 C .52,54D .54,52 解析:由⎩⎨⎧ a +21=73,a +2=b ,得⎩⎨⎧a =52,b =54.答案:C3.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例为80%C .男生比女生喜欢理科的可能性大些D .男生不喜欢理科的比例为60%解析:由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此B、D不正确.从图形中,男生比女生喜欢理科的可能性大些.答案:C4.分类变量X和Y的列联表如下:则下列说法正确的是(A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:|ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.答案:C5.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是()A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有解析:这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.答案:D6.有2×2列联表:由上表可计算K2解析:k=189×(54×63-32×40)294×95×86×103≈10.76.答案:10.767.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是8.对某校小学生进行心理障碍测试得到如下列联表:附:k =110×(10×70-20×10)30×80×20×90≈6.366>5.024,所以有97.5%的把握认为心理障碍与性别有关.9.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为415.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关.说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少? 参考数据:解析:(1)设患肝病中常饮酒的人有x 人,30=415,x =6.由已知数据可求得K 2=10×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A ,B ,C ,D ,女性为E ,F ,则任取两人有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种. 故抽出一男一女的概率是P =815.[B 组 能力提升]1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,观测值k =110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 解析:由k ≈7.8及P (K 2≥6.635)=0.010可知,在犯错误的概率不超过1%的前提下认为“爱好该项运动与性别有关”,也就是有99%以上的把握认为“爱好该项运动与性别有关”. 答案:A2.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到列联表:A .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关”解析:列出列联表:≈3.030,∴K2的观测值k=75×25×55×45又3.030>2.706,且P(K2≥2.706)=0.10,∴在犯错误的概率不超过0.1的前提下,认为该市居民能否做到“光盘”与性别有关.答案:C3.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K2的观测值k>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知,在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知,在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________(填序号).解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③4.下列关于K2的说法中,正确的有________(填序号).①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d);③若求出K2=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.解析:对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.答案:③④5.国家规定,疫苗在上市前必须经过严格的检测,并通过临床试验获得相关数据,以保证疫苗使用的安全和有效.某生物制品研究所将某一型号疫苗用在动物小白鼠身上进行科研和临床试验,得到统计数据如下:现从未注射疫苗的小白鼠中任取1只,取到“感染病毒”的小白鼠的概率为3 5.(1)求2×2列联表中的数据p,q,x,y的值;(2)能否有99.9%把握认为注射此种疫苗有效?(3)在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例抽取5只进行病例分析,然后从这五只小白鼠中随机抽取3只对注射疫苗情况进行核实,求至少抽到2只为未注射疫苗的小白鼠的概率.附:K2=n(ad-bc)2(a+b)(a+c)(c+d)(b+d),n=a+b+c+d.解析:(1)p=60(2)由K 2=n (ad -bc )2(a +b )(a +c )(c +d )(b +d ),得K 2=200(40×40-60×60)2100×100×100×100=8<10.828,所以没有99.9%把握认为注射此种疫苗有效.(3)由于在感染病毒的小白鼠中,按未注射疫苗和注射疫苗的比例为3∶2,故抽取的5只小白鼠中3只未注射疫苗,用a ,b ,c 表示,2只已注射疫苗,用D ,E 表示,从这五只小白鼠中随机抽取3只,可能的情况共有以下10种:(a ,b ,c ),(a ,b ,D ),(a ,b ,E ),(a ,c ,D ),(a ,c ,E ),(a ,D ,E ),(b ,c ,D ),(b ,c ,E ),(b ,D ,E ),(c ,D ,E ).其中至少抽到2只为未注射疫苗的小白鼠的情况有以下7种:(a ,b ,c ),(a ,b ,D ),(a ,b ,E ),(a ,c ,D ),(a ,c ,E ),(b ,c ,D ),(b ,c ,E ) 所以至少抽到2只为未注射疫苗的小白鼠的概率为710.。
2020-2021学年高二数学人教A版选修1-2配套作业:1.2 独立性检验的基本思想及其初步应用
第一章 1.2请同学们认真完成练案[2]A级基础巩固一、选择题1.下列关于等高条形图的叙述正确的是(C)A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对[解析]在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.2.下图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出(C)A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%[解析]由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是(C)A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对[解析]“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.4.利用独立性检测来考查两个分类变量X,Y是否有关系,当随机变量K2的值(A)A .越大,“X 与Y 有关系”成立的可能性越大B .越大,“X 与Y 有关系”成立的可能性越小C .越小,“X 与Y 有关系”成立的可能性越大D .与“X 与Y 有关系”成立的可能性无关[解析] 用独立性检验来考查两个分类变量是否有关系时,算出的随机变量K 2的值越大,说明“X 与Y 有关系”成立的可能性越大,由此可知A 正确.故选A .5.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到了“打鼾与患心脏病有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的是( D )A .100个心脏病患者中至少有99人打鼾B .1个人患心脏病,那么这个人有99%的概率打鼾C .在100个心脏病患者中一定有打鼾的人D .在100个心脏病患者中可能一个打鼾的人都没有[解析] 有99%以上的把握认为“打鼾与患心脏病有关”的结论成立,与多少个人打鼾没有关系,只有D 选项正确,故选D .6.假设有两个分类变量X 与Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:( D ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4[解析] 比较|a a +b -cc +d |.选项A 中,|59-35|=245;选项B 中,|58-46|=124;选项C 中,|25-49|=245;选项D 中,|25-59|=745.故选D .二、填空题7.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:__7.469__[解析]K=339×(43×121-162×13)2≈7.469.56×283×205×1348.为研究某新药的疗效,给男女各50名患者服用此药,跟踪调查后得下表中的数据:计算K2≈__4.882__,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为__5%__.[解析]K2=100(15×44-35×6)221×79×50×50≈4.882>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.三、解答题9.近年来,共享单车已经悄然进入了广大市民的日常生活,并慢慢改变了人们的出行方式.为了更好地服务民众,某共享单车公司在其官方APP中设置了用户评价反馈系统,以了解用户对车辆状况和优惠活动的评价.现从评价系统中选出200条较为详细的评价信息进行统计,车辆状况的优惠活动评价的2×2列联表如下:系?参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.[解析]由2×2列联表的数据,有K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200×(3 000-1 200)2 140×60×70×130=200×18214×6×7×13≈8.48<10.823.因此,在犯错误的概率不超过0.001的前提下,不能认为优惠活动好评与车辆状况好评有关系.B级素养提升一、选择题1.某研究中心为研究运动与性别的关系得到2×2列联表如下:A.4.762 B.9.524C.0.011 9 D.0.023 8[解析]K2=100×(60×10-20×10)270×30×80×20≈4.762.2.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:A.99% B.95%C.90% D.无充分依据[解析]由表中数据得k=50×(18×15-8×9)226×24×27×23≈5.059>3.841.所以约有95%的把握认为两变量之间有关系.3.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数的35,若有95%的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有______人( BC )附表:附:χ2=n (ad -bc )(a +d )(c +d )(a +c )(b +d )A .25B .45C .60D .75 [解析] 设男生的人数为5n ,根据题意列出2×2列联表如下表所示:则χ2=105n ×5n ×7n ×3n=10n21, 由于有95%的把握认为是否喜欢抖音和性别有关, 则3.841≤χ2<6.635,即3.841≤10n21<6.635,得8.066 1≤n <13.933 5,∵n ∈N *,则n 的可能取值有9,10,11,12,13,因此,调查人数中男生人数的可能值为45,50,55,60,65. 故选BC .4.(多选题)独立性检验中,为了调查变量X 与变量Y 的关系,经过计算得到P (K 2≥6.635)=0.01,表示的意义是( CD )A .有99%的把握认为变量X 与变量Y 没有关系B .有1%的把握认为变量X 与变量Y 有关系C .有99%的把握认为变量X 与变量Y 有关系D .有1%的把握认为变量X 与变量Y 没有关系 [解析] 独立性检验中,由P (K 2≥6.635)=0.01,它表示的意义是:有1%的把握认为变量X 与变量Y 没有关系,D 正确;即有99%的把握认为变量X 与变量Y 有关系,C 正确.故选CD .二、填空题5.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过__0.025__的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.[解析] 根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得,K 2的观测值k =20×(4×12-1×3)25×15×7×13≈5.934,因为k >5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有__99%__的把握说,打鼾与患心脏病是有关的.[解析] ∵χ2=7.63,∴χ2>6.635,因此,有99%的把握说,打鼾与患心脏病是有关的. 三、解答题7.高中流行这样一句话:“文科就怕数学不好,理科就怕英语不好.”下表是一次针对高三文科学生进行调查所得的数据,试判断文科学生总成绩不好与数学成绩不好是否有关.[解析] 根据题意计算得K 2=913×(478×30-12×393)2490×423×871×42≈11.153>6.635.因此有99%的把握认为“文科学生总成绩不好与数学成绩不好有关系.”8.为了解学生的课外阅读时间情况,某学校随机抽取了 50人进行统计分析,把这50人每天阅读的时间(单位:分钟)绘制成频数分布表,如下表所示:若把每天阅读时间在60分钟以上(含60分钟)的同学称为“阅读达人”,根据统计结果中男女生阅读达人的数据,制作出如图所示的等高条形图.(1)根据抽样结果估计该校学生的每天平均阅读时间(同一组数据用该区间的中点值作为代表);(2)根据已知条件完成下面的2×2列联表,并判断是否有99%的把握认为“阅读达人”跟性别有关?男生 女生 总计 阅读达人 非阅读达人总计附:参考公式K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .临界值表:P (K 2≥k )0.100 0.050 0.010 0.001 k2.7063.8416.63510.828[10×850+30×1050+50×1250+70×1150+90×750+110×250=1.6+6+12+15.4+12.6+4.4=52(分);(2)由频数分布表得,“阅读达人”的人数是11+7+2=20人, 根据等高条形图作出2×2列联表如下:男生 女生 总计 阅读达人 6 14 20 非阅读达人 18 12 30 总计242650计算K 2=50×(6×12-18×14)20×30×24×26=22552≈4.327, 由于4.327<6.635,故没有99%的把握认为“阅读达人”跟性别有关.莘莘学子,最重要的就是不要去看远方模糊的,而要做手边清楚的事。
2020-2021学年高二数学人教A版选修1-2配套学案:1.2 独立性检验的基本思想及其初步应用
1.2 独立性检验的基本思想及其初步应用自主预习·探新知情景引入饮用水的质量是人类普遍关心的问题.据统计,饮用优质水的518人中,身体状况优秀的有466人,饮用一般水的312人中,身体状况优秀的有218人,人的身体健康状况与饮用水的质量之间有关系吗?新知导学1.分类变量和列联表 (1)分类变量:变量的不同“值”表示个体所属的__不同类别__,像这样的变量称为分类变量. (2)列联表:①定义:列出的两个分类变量的__频数表__称为列联表. ②2×2列联表.一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为2×2列联表)为y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +d2.等高条形图(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否__相互影响__,常用等高条形图表示列联表数据的__频率特征__.(2)观察等高条形图发现__a a +b __和__cc +d__相差很大,就判断两个分类变量之间有关系.3.独立性检验定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=__a+b+c+d__具体步骤①确定α,根据实际问题的需要,确定允许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定__临界值K0__.②计算K2,利用公式计算随机变量K2的__观测值k__.③下结论,如果__k≥K0__,就推断“X与Y有关系”,这种推断__犯错误的概率__不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中__没有发现足够证据__支持结论“X与Y有关系”预习自测1.如下是一个2×2列联表,则表中m,n的值分别为(B)y1y2总计x1 a 3545x27 b n总计m 73sA.10,38B.17,45C.10,45D.17,38[解析]由题意,根据2×2列联表可知:a+35=45,解得a=10,则m=a+7=10+7=17,又由35+b=73,解得b=38,则n=7+38=45,故选B.2.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅临界值表来确定断言“X与Y有关系”的可信度,如果k>5.024,那么就推断“X和Y有关系”,这种推断犯错误的概率不超过(C)A.0.25B.0.75C.0.025 D.0.975[解析]通过查表确定临界值k.当k>k0=5.024时,推断“X与Y”有关系这种推断犯错误的概率不超过0.025.3.春节期间,“厉行节约,反对浪费”之风悄然吹开.某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下表格:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).参照附表,得到的正确结论是__③__.(只填正确的序号)①在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”; ②在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”; ③有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”; ④有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”.[解析] 由2×2列联表得到a =43,b =9,c =32,d =16,则a +b =52,c +d =48,a +c =75,b +d =25,ad =688,bc =288,n =100.代入K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),得K 2=100×(688-288)252×48×75×25≈3.419.因为2.706<3.419<3.841.所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.4.(2019·全国卷Ⅰ文,17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解析] (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.互动探究·攻重难互动探究解疑 命题方向❶等高条形图的应用典例1 从发生交通事故的司机中抽取2 000名司机作随机样本,根据他们血液中是否含有酒精以及他们是否对事故负有责任将数据整理如下:有责任 无责任 总计 有酒精 650 150 800 无酒精 700 500 1 200 总计1 3506502 000试分析血液中含有酒精与对事故负有责任是否有关系.[解析] 作等高条形图如下,图中阴影部分表示有酒精负责任与无酒精负责任的比例,从图中可以看出,两者差距较大,由此我们可以在某种程度上认为“血液中含有酒精与对事故负有责任”有关系.『规律方法』 通过等高条形图可以粗略地直观判断两个分类变量是否有关系,一般地,在等高条形图中,a a +b 与cc +d相差越大,两个分类变量有关系的可能性就越大.┃┃跟踪练习1__■某学校对高三学生做了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.[解析]作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计426594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格类型有关.命题方向❷独立性检验的应用典例2某中学对高二甲、乙两个同类班级,进行“加强‘语文阅读理解’训练,对提高‘数学应用题’得分率的作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下61-70分71-80分81-90分91-100分甲班(人数)31161218乙班(人数)78101015现规定平均成绩在80分以上(不含80分)的为优秀.(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,根据以上数据,能否有95%的把握认为加强“语文阅读理解”训练对提高“数学应用题”得分率有帮助?优秀人数非优秀人数合计甲班乙班参考公式及数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[思路分析] (1)由表格统计出甲、乙两个班的总人数和优秀人数,求出优秀率; (2)依统计数据填写列联表,代入公式计算K 2的估计值,查表下结论. [解析] (1)由题意知,甲、乙两班均有学生50人, 甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%. (2)因为K 2=100×(25×30-25×20)255×45×50×50≈1.010<3.841,所以由参考数据知,没有95%的把握认为有帮助. 『规律方法』 1.独立性检验的步骤:第一步,确定分类变量,获取样本频数,得到列联表.第二步,根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k 0.第三步,利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值K 0.第四步,作出判断.如果k ≥k 0,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够证据支持结论“X 与Y 有关系”.2.由于独立性检验计算量大,要细致,避免计算失误. ┃┃跟踪练习2__■目前,学案导学模式已经成为教学中不可或缺的一部分,为了了解学案的合理使用是否对学生的期末复习有着重要的影响,我校随机抽取100名学生,对学习成绩和学案使用程度进行了调查,统计数据如下表所示:善于使用学案不善于使用学案合计 学习成绩优秀 40 学习成绩一般30 合计100已知随机抽查这100名学生中的一名学生,抽到的是善于使用学案的学生的概率是0.6. (1)请将上表补充完整(不用写计算过程);(2)试运用独立性检验的思想方法分析:有多大的把握认为学生的学习成绩与对学案的使用程度有关.[解析] (1)补全的列联表如下:善于使用学案不善于使用学案合计 学习成绩优秀 40 10 50 学习成绩一般20 30 50 合计6040100(2)K 2=100×(40×30-10×20)250×50×60×40≈16.667>6.635,故有99%的把握认为学生的学习成绩与对学案的使用程度有关.易混易错警示准确掌握公式中的参数含义典例3 有甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计后,得到如下的列联表班级与成绩列联表优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计177390试问能有多大把握认为“成绩与班级有关系”?[错解]由公式得:K2=90×(10×7-35×38)217×73×45×45=56.86,56.86>6.635所以有99%的把握认为“成绩与班级有关系”.[辨析]由于对2×2列联表中a,b,c,d的位置不清楚,在代入公式时代错了数值导致计算结果的错误.[正解]K2=90×(10×38-7×35)217×73×45×45=0.653,0.653<2.706,所以没有充分证据认为成绩与班级有关.学科核心素养独立性检验的基本思想1.独立性检验的基本思想独立性检验的基本思想是要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设“两个分类变量没有关系”成立,在该假设下我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关这一结论成立的可信度为99%,不合理的程度可查下表得出:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.828 反证法假设检验要证明结论A 备选假设H1在A不成立的前提下进行推理在H1不成立,即H0成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H1成立的小概率事件发生,意味着H1成立的可能性没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H1成立的小概率事件不发生,接受原假设独立性检验的思想来自统计中的假设检验思想,它与反证法类似.假设检验和反证法都是先假设结论不成立,然后根据是否能够推出“矛盾”来断定结论是否成立.但二者“矛盾”的含义不同,反证法中的“矛盾”是指一种不符合逻辑事情的发生,而假设检验中的“矛盾”是指一种不符合逻辑的小概率事件的发生,即在结论不成立的假设下,推出有利于结论成立的小概率事件发生.我们知道小概率事件在一次试验中通常是不会发生的,若在实际中这个事件发生了,说明保证这个事件为小概率事件的条件有问题,即结论在很大的程度上应该成立.其基本步骤如下:(1)考察需抽样调查的背景问题,确定所涉及的变量是否为二值分类变量.(2)根据样本数据作出2×2列联表.(3)通过等高条形图直观地判断两个分类变量是否相关.(4)计算随机变量K2,并查表分析,当K2的观测值很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关.典例4海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有90%的把握认为箱产量与养殖方法有关;箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.附:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ).[思路分析] (1)根据频率估计概率. (2)根据独立性检验的步骤求解.(3)观察频率分布直方图得出平均值(或中位数)的取值区间,再进行比较. [解析] (1)旧养殖法的箱产量低于50 kg 的频率为 (0.012+0.014+0.024+0.034+0.040)×5=0.62, 因此,事件A 的概率估计值为0.62. (2)根据箱产量的频率分布直方图得列联表K 2=200×(62×66-34×38)100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.莘莘学子,最重要的就是不要去看远方模糊的,而要做手边清楚的事。
人教版高中数学选修(1-2)-1.2同步检测:独立性检验的基本思想及其初步应用3
1.2 独立性检验的基本思想及其初步应用
基础强化
1.下列关于K2的说法正确的是()
A.K2在任何相互独立问题中都可以用来检验有关还是无关
B.K2的值越大,两个事件的相关性越大
C.K2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合
D.K2的观测值的计算公式为K2=n(ad-bc)
(a+b)(c+d)(a+c)(b+d)
2.下面是一个2×2列联表
则表中a、b
A.94、96B.52、50
C.52、54 D.54、52
3.观察下列各图,其中两个分类变量x,y之间关系最强的是()
4.考察棉花种子经过处理跟生病之间的关系得到如下表数据:
A.种子经过处理跟是否生病有关
B.种子经过处理跟是否生病无关
C.种子是否经过处理决定是否生病
D.以上都是错误的
5.分类变量x和y的列联表如下,则()
A.ad
B.ad-bc越大,说明x与y的关系越弱
C.(ad-bc)2越大,说明x与y的关系越强
D.(ad-bc)2越小,说明x与y的关系越强
6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:
A.99% B.95%
C.90% D.无充分依据
7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据。
2020-2021学年人教A版数学选修1-2课时素养评价 1.2 独立性检验的基本思想及其初步应用
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
课时素养评价二独立性检验的基本思想及其初步应用(15分钟30分)1.与表格相比,能更直观地反映出相关数据总体状况的是( )A.列联表B.散点图C.残差图D.等高条形图【解析】选D.对于A,列联表需要计算K2的值,不是直观地分析;对于B,散点图体现的是变量间相关性的强弱;对于C,残差图体现预报变量与实际值之间的差距,对于D,等高条形图能直观地反映两个分类变量是否有关系.2.某班主任对全班50名学生进行了作业量的调查,数据如表:认为作业量不总计认为作业量大大男生18 9 27女生8 15 23总计26 24 50则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过( )A.0.01B.0.005C.0.025D.0.001【解析】选C.k=≈5.059>5.024.因为P(K2≥5.024)=0.025,所以犯错误的概率不超过0.025.3.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:y1y2x110 18x2m 26则当m取下面何值时,X与Y的关系最弱( )A.8B.9C.14D.19【解析】选C.由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.4.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.【解析】K2≈3.918>3.841,而P(K2≥3.841)≈0.05,所以在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案:①5.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:男女需要40 30不需要160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?附:K2=【解析】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为=14%.(2)由列联表中数据,得K2的观测值为k=≈9.967.由于9.967>6.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(25分钟50分)一、选择题(每小题5分,共20分)1.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)月收入2 000元以下月收入2 000元及以上总计高中文化以上10 45 55高中文化及以下20 30 50总计30 75 105由上表中数据计算得K2的观测值k=≈6.109,请估计认为“文化程度与月收入有关系”,其犯错误的概率为( ) A.1% B.99% C.2.5% D.97.5%【解析】选C.由于6.109>5.024,故在犯错误的概率不超过0.025的前提下,认为“文化程度与月收入有关系”.2.下列说法正确的有( )①分类变量的取值仅表示个体所属的类别,它们的取值一定是离散的;②分类变量的取值也可以用数字来表示,但这时的数字除了分类以外没有其他的含义;③2×2列联表是两个分类变量的频数汇总统计表;④2×2列联表和等高条形图都能反映出两个分类变量间是否相互影响.A.①②③④B.①②C.②③D.④【解析】选A.由分类变量的定义可知①②正确;由2×2列联表的定义可知③正确;2×2列联表和等高条形图都能展示样本的频率特征,若在一个分类变量所取值的群体中,另一个分类变量所取值的频率相差较小,则说明这两个变量不相互影响,否则就相互影响.故④正确.3.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的比例为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比例为60%【解析】选C.由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.还可知男生比女生喜欢理科的可能性大些.4.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有显著效果的图形是 ( )【解析】选D.分析四个等高条形图得选项D中,不服用药物患病的概率最大,服用药物患病的概率最小,所以最能体现该药物对预防禽流感有显著效果.二、填空题(每小题5分,共10分)5.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.【解析】列出2×2列联表:发病不发病总计阳性家族史16 93 109阴性家族史17 240 257总计33 333 366所以随机变量K2的观测值k=≈6.067>5.024,所以在犯错误的概率不超过0.025的前提下,认为糖尿病患者与遗传有关.答案:0.9756.在研究性别(是否为女性)与是否爱吃零食这两个分类变量是否有关系时,下列说法中正确的是________.①若K2的观测值k≈6.635,则我们在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系,那么在100个爱吃零食的人中必有99人是女性;②由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,如果某人爱吃零食,那么此人是女性的可能性为99%;③由独立性检验可知在犯错误的概率不超过0.01的前提下认为爱吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误.【解析】K2的观测值是支持确定有多大把握认为“两个分类变量吃零食与性别有关系”的随机变量值,所以由独立性检验可知在犯错误的概率不超过0.01的前提下认为吃零食与性别有关系时,是指每进行100次这样的推断,平均有1次推断错误,故填③.答案:③三、解答题(每小题10分,共20分)7.某学生对其亲属30人的饮食进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列2×2列联表:主食蔬菜主食肉类总计50岁以下50岁以上总计(2)能否在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关?并写出简要分析.【解析】(1)2×2列联表如下:主食蔬菜主食肉类总计50岁以下 4 8 1250岁以上16 2 18总计20 10 30(2)因为K2的观测值k==10>6.635,P(K2>6.635)=0.01,所以可以在犯错误的概率不超过0.01的前提下认为其亲属的饮食习惯与年龄有关.8.随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n个人,其中男性占调查人数的.已知男性中有一半的人的休闲方式是运动,而女性中只有的人的休闲方式是运动.(1)完成下列2×2列联表:非运运动总计动男性女性总计n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?【解题指南】(1)依据2×2列联表的定义填表;(2)计算K2,利用临界值建立不等关系,求n的值.【解析】(1)补全2×2列联表如下:非运运动总计动男性n n n女性n n n总计n n n(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,则k0≈3.841.由于K2的观测值k==,故≥3.841,即n≥138.276.又由n∈Z,故n≥140.故若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的至少有140人.关闭Word文档返回原板块。
2020-2021学年高二数学人教A版选修1-2配套作业:独立性检验的基本思想及其初步应用 课堂
第一章 1.21.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是(C) A.频率分布直方图B.回归分析C.独立性检验D.用样本估计总体[解析]根据题意,结合题目中的数据,列出2×2列联表,求出K2观测值,对照数表可得出概率结论,这种分析数据的方法是独立性检验.2.如表是一个2×2列联表:则表中a,b的值分别为(C)y1y2总计x1 a 2173x2222547总计 b 46120A.94,72 B.52,50C.52,74 D.74,52[解析]a=73-21=52,b=a+22=52+22=74.3.为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是(B)A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果[解析]从等高条形图可以看出,服用药物A后未患病的比例比服用药物B后未患病的比例大得多,预防效果更好.4.某高校《统计初步》课程的老师随机调查了选该课程的学生的一些情况,具体数据如下表:则K2≈__4.914__,有__95%__的把握判定主修统计专业与性别有关.[解析]依题意知:K2=96×(33×26-20×17)253×43×50×46≈4.914,因为4.914>3.841,所以有95%的把握判定主修统计专业与性别有关.5.高二(1)班班主任对全班50名同学的学习积极性与对待班级工作的态度进行调查,统计数据如表所示:试运用独立性检验的思想方法分析,能否在犯错误的概率不超过0.001的前提下认为学生的学习积极性与对待班级工作的态度有关系.[解析]由题设知a=18,b=7,c=6,d=19,a+b=25,c+d=25,a+c=24,b+d=26,n=50,所以K2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=50×(18×19-6×7)224×26×25×25≈11.538,因为P(K2≥10.828)≈0.001且11.538>10.828.所以在犯错误的概率不超过0.001的前提下认为“学生的学习积极性与对待班级工作的态度有关系”.莘莘学子,最重要的就是不要去看远方模糊的,而要做手边清楚的事。
高中数学人教A版选修1-2同步练习1.2独立性检验的基本思想及其初步应用练习 Word版含解析
.独立性检验的基本思想及其初步应用
.分类变量的定义.
如果某种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.
.×列联表.
一般地,假设有两个分类变量和,它们的取值分别为{,}和{,},其样本频数列联表(称为×列联表)为:
.
.下列变量中不属于分类变量的是()
.性别.吸烟
.宗教信仰.国籍
解析:“吸烟”不是分类变量,“是否吸烟”才是分类变量.故选.
.下面是一个×列联表
.、.、
.、.、
解析:由+=,得=,由+=,得=.
.某高校“统计初步”课程的教师随机调查了选修该课程的一些学生情况,具体数据如下表:
为了判断主修统计专业是否与性别有关系,根据表中的数据,得到=≈>,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.解析:(>)=,判断出错的可能性为.
答案:
通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.。
人教A版数学选修1-2同步练习:1.2 独立性检验的基本思想及其初步应用 测评案达标反馈
1.观察下列各图,其中两个分类变量x ,y 之间关系最强的是( )
解析:选D.在四幅图中,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强,故选D.
2.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( )
A .k 越大,“X 与Y 有关系”的可信程度越小
B .k 越小,“X 与Y 有关系”的可信程度越小
C .k 越接近于0,“X 与Y 没有关系”的可信程度越小
D .k 越大,“X 与Y 没有关系”的可信程度越大
解析:选B.根据随机变量K 2的观测值k 的意义知,只有B 正确.
3.某小学在对232名小学生调查中发现:180名男生中有98名有多动症,另外82名没有多动症,52名女生中有2名有多动症,另外50名没有多动症,用独立性检验的方法判断多动症与性别是否有关系.
解:由题目数据列出如下列联表:
多动症 无多动症 总计 男生
98 82 180 女生
2 50 52 总计
100 132 232
由表中数据可得到K 2的观测值
k =232×(98×50-82×2)2
100×132×180×52
≈42.117>10.828. 所以在犯错误的概率不超过0.001的前提下认为多动症与性别有关系.
由Ruize收集整理。
感谢您的支持!。
【人教A版】高中数学:选修1-2全集第一章1.2独立性检验的基本思想及其初步应用
第一章统计案例1.2 独立性检验的基本思想及其初步应用A级基础巩固一、选择题1.给出下列实际问题,其中不可以用独立性检验解决的是() A.喜欢参加体育锻炼与性别是否有关B.喝酒者得胃病的概率C.喜欢喝酒与性别是否有关D.青少年犯罪与上网成瘾是否有关解析:独立性检验主要是对两个分类变量是否有关进行检验,故不可用独立性检验解决的问题是B.答案:B2.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:由等高条形图知:女生喜欢理科的比例为20%,男生不喜欢理科的比例为40%,因此,B、D不正确.从图形中,男生比女生喜欢理科的可能性大些.答案:C3.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是()A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有解析:这是独立性检验,在犯错误的概率不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义可知答案应选D.答案:D4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:以下说法正确的是()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关解析:根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.答案:D5.(2014·江西卷)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表3A.成绩B.视力C.智商D.阅读量解析:根据K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),代入题中数据计算得D选项K2最大.答案:D二、填空题6.独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此________,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设________.解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量K2的观测值来判断假设是否成立.答案:无关系不成立7.某高校《统计初步》课程的教师随机调查了选该课的一些学生的情况,具体数据如表:随机变量K2的观测值为k=50×(13×20-10×7)223×27×20×30≈4.844.因为k>3.841,所以确认“主修统计专业与性别有关系”,这种判断出现错误的可能性为________.解析:因为随机变量K2的观测值k>3.841,所以在犯错误的概率不超过0.05的前提下认为“主修统计专业与性别有关系”.故这种判断出现错误的可能性为5%.答案:5%8.对某校小学生进行心理障碍测试得到的列联表解析:由2×2列联表,代入计算k2的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=110×(700-200)230×80×20×90≈6.365 7.因为6.365 7>5.024,所以在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.答案:在犯错误的概率不超过0.025的前提下认为心理障碍与性别有关系.三、解答题9.下表是某地区的一种传染病与饮用水的调查表:(1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种传染病是否与饮用水有关,并比较两种样本在反映总体时的差异.附表:解:(1)把表中数据代入公式,得K2=830×(52×218-466×94)2518×312×146×684≈54.21.因为54.21>10.828,所以有99.9%的把握认为该地区这种传染病与饮用不干净水有关.(2)依题意得2×2列联表:把表中数据代入公式,得K2=86×(5×22-50×9)255×31×14×72≈5.785,因为5.785>3.841,所以我们有95%的把握认为该地区这种传染病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但可信度不同,(1)中有99.9%的把握肯定结论的正确性,(2)中有95%的把握肯定结论的正确性.10.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据:出生时间在晚上的男婴为24人,女婴为8人;出生时间在白天的男婴为31人,女婴为26人.(1)将2×2列联表补充完整.(2)生时间有关系?解:(1)列2×2列联表:(2)由所给数据计算K2的观测值k=89×(24×26-31×8)255×34×32×57≈3.689>2.706.根据临界值表知P(K2≥2.706)≈0.10.因此在犯错误的概率不超过0.1的前提下认为婴儿的性别与出生的时间有关系.B级能力提升1.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下的列联表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该运动与性别无关”解析:由2×2列联表,得K2的观测值k=100×(38×5-25×32)270×30×63×37≈7.601>6.635.又由P(K2≥6.635)≈0.01,知选项C正确.答案:C2.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①在犯错误的概率不超过0.05的前提下认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的效率为5%.解析:由独立性检验的思想方法,知①正确.答案:①3.“开门大吉”是某电视台推出的游戏节目,选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁).其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;判断能否在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系,说明你的理由.(下面的临界值表供参考)(2)6名选手,求20~30岁与30~40岁各有几人.参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解析:(1)根据所给的二维条形图得到列联表:根据列联表所给的数据代入观测值的公式得到k=120×(10×70-10×30)220×100×40×80=3.因为3>2.706,所以在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系.(2)按照分层抽样方法可知,20~30岁年龄段抽取:6×40120=2(人);30~40岁年龄段抽取:6×80120=4(人).在上述抽取的6名选手中,年龄在20~30岁的有2人,年龄在30~40岁的有4人.。