独立性检验的基本思想及其初步应用测试题
高中数学 1.2 独立性检验的基本思想及其初步应用
独立性查验的大体思想及其初步应用一、选择题(每题3分,共12分)1.与表格相较,能更直观地反映出相关数据整体状况的是( )A.列联表B.散点图C.残差图D.等高条形图【解析】选只能反映个体数据的情形,B只能反映数据的相关性,C只能反映数据的相关程度,D能直观地反映出相关数据的整体状况.2.分类变量X和Y的列联表如下:Y1Y2总计X1a b a+bX2c d c+d总计a+c b+d a+b+c+d那么以下说法中正确的是( )越小,说明X与Y关系越弱越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强【解析】选C.因为K2=(a+b+c+d)(ad−bc)2(a+b)(c+d)(a+c)(b+d),因此(ad-bc)2越大,那么K2越大,X与Y关系越强,应选C.3.(2021·临沂高二检测)下面是2×2列联表.y1y2总计x1332154x2a1346总计b34那么表中a,b处的值应为( ),66 ,50 ,67 ,56【解析】选A.由2×2列联表知a+13=46,因此a=33,又b=a+33,因此b=33+33=66. 4.研究生毕业的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:硕士博士总计男16227189女1438151总计30535340依照以上数据,那么( )A.性别与获取学位类别有关B.性别与获取学位类别无关C.性别决定获取学位的类别D.以上都是错误的【解析】选A.直观上能够看出在博士学位中男的比例远远高于在硕士学位中的比例.二、填空题(每题4分,共8分)5.某高校教“统计初步”课程的教师随机调查了选该课的一些学生情形,具体数据如下表:专业非统计专业统计专业性别男1310女720为了判定主修统计专业是不是与性别有关系,依照表中的数据,取得K 2的观测值k=50×(13×20−10×7)223×27×20×30≈.因为k ≥,因此判定主修统计专业与性别有关系,那么这种判定犯错的可能性不超过 .【解析】依照K 2的临界值表可知,k ≥时在犯错误的概率不超过的前提下以为其有关,也确实是这种判定犯错的可能性不超过5%. 答案:5%【变式训练】(2021·安庆高二检测)调查某养殖场某段时刻内幼崽诞生的时刻与性别的关系,取得下面的数据表:晚上 白天 总计 雄性 12 8 20 雌性 2 8 10 总计141630从中能够得出在犯错误的概率不超过 的前提下能够以为幼崽诞生的时刻与性别有关系.附:K 2=n (ad −bc )2(a +b )(c +d )(a +c )(b +d )P(K 2≥k 0) k 0【解题指南】利用K 2=n (ad −bc )2(a +b )(c +d )(a +c )(b +d ),求出K 2的观测值,与临界值比较,即可取得结论.【解析】由题意k=30×(12×8−2×8)220×10×14×16=307≈>,因此犯错误的概率不超过.答案:6.在对某小学的学生进行吃零食的调查中,取得如下表数据:依照上述数据分析,咱们得出的K 2的观测值k 约为 .【解析】由公式可计算得k=89×(24×26−31×8)255×34×32×57≈.答案:【触类旁通】在题目条件不变的情形下,在犯错误的概率不超过量少时以为吃零食与性别有关. 【解析】因为>,且P(K 2≥≈,因此在犯错误的概率不超过的前提下以为吃零食与性别有关. 三、解答题(每题10分,共20分)7.为了解铅中毒病人与尿棕色素为阳性是不是有关系,别离对病人组和对照组的尿液作尿棕色素定性检查,结果如下:试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无不同,铅中毒病人与尿棕色素为阳性是不是有关系. 【解析】等高条形图如下图:其中两个浅色条的高别离代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图能够直观地看出铅中毒病人与对照组相较较尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性有关系.8.(2021·马鞍山高二检测)某中学共2200名学生中有男生1200名,按男女性别用分层抽样抽出110名学生,询问是不是爱好某项运动.已知男生中有40名爱好该项运动,女生中有30名不爱好该项运动. (1)完成如下的列联表:男 女 总计 爱好 40 不爱好 30 总计(2)通过计算说明,是不是在犯错误的概率不超过的前提下以为“爱好该项运动与性别有关”? 【解析】(1)男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110(2)K 2的观测值k=110×(40×30−20×20)260×50×60×50≈>.因此在犯错误的概率不超过的前提下以为“爱好该项运动与性别有关”. 一、选择题(每题4分,共12分)1.(2021·德州高二检测)假设两个分类变量X 与Y,它们的取值别离为{x 1,x 2},{y 1,y 2},其2×2列联表如下图:关于以下数据,对同一样本能说明X 与Y 有关的可能性最大的一组为( )y1y2总计x1a b a+bx2c d c+d总计a+c b+d a+b+c+d=50,b=40,c=30,d=20=50,b=30,c=20,d=40=50,b=20,c=40,d=30=20,b=30,c=50,d=40【解题指南】ad与bc差距越大,两个变量有关的可能性就越大,查验四个选项中所给的ad与bc的差距,比较即可.【解析】选B.依照观测值求解的公式能够明白,ad与bc差距越大,两个变量有关的可能性就越大.选项A,|ad-bc|=|1000-1200|=200;选项B,|ad-bc|=|2000-600|=1400;选项C,|ad-bc|=|1500-800|=700;选项D,|ad-bc|=|800-1500|=700.2.(2021·合肥高二检测)在一次独立性查验中取得如以下联表:A A̅总计B2008001000B̅180a180+a总计380800+a1180+a且最后发觉,两个分类变量A和B没有关系,那么a的可能值是( )B.720【解题指南】将选项中的值代入K 2公式,结合临界值表即得答案.【解析】选B.计算K 2=(1 180+a )×(200a −180×800)2380×(800+a )×(180+a )×1 000,当a=200时,K 2=(1 180+200)×(200×200−180×800)2380×(800+200)×(180+200)×1 000≈>,两个分类变量A 和B 有关系.当a=720时,K 2=(1 180+720)×(200×720−180×800)2380×(800+720)×(180+720)×1 000=0,由K 2<知现在两个分类变量无关系.3.(2021·菏泽高二检测)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是不是能做到“光盘”行动,取得如以下联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015由此列联表取得的正确结论是( )A.在犯错误的概率不超过1%的前提下,以为“该市居民可否做到′光盘′与性别有关”B.在犯错误的概率不超过1%的前提下,以为“该市居民可否做到′光盘′与性别无关”C.在犯错误的概率不超过的前提下,以为“该市居民可否做到′光盘′与性别有关”D.在犯错误的概率不超过的前提下,以为“该市居民可否做到′光盘′与性别无关” 【解析】选C.由2×2列联表取得a=45,b=10,c=30,d=15. 那么a+b=55,c+d=45,a+c=75,b+d=25,ad=675,bc=300,n=100.代入K 2=n (ad −bc )2(a +b )(c +d )(a +c )(b +d )得K 2的观测值k=100×(675−300)255×45×75×25≈.因为<<,因此在犯错误的概率不超过的前提下以为“该市居民可否做到′光盘′与性别有关”.应选C. 二、填空题(每题4分,共8分)4.某研究小组为了研究中学生的躯体发育情形,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,依照列联表中的数据,能够在犯错误的概率不超过 的前提下以为该学校15至16周岁的男生的身高和体重之间有关系.超重 不超重 总计 偏高 4 1 5 不偏高 3 12 15 总计71320【解析】依照公式K 2=n (ad −bc )2(a +b )(c +d )(a +c )(b +d )得,K 2的观测值k=20×(4×12−1×3)25×15×7×13≈,因为k>,因此在犯错误的概率不超过的前提下以为该学校15至16周岁的男生的身高和体重之间有关系. 答案:5.对某校小学生进行心理障碍测试取得如下的列联表有心理障碍 没有心理障碍 总计 女生 10 20 30 男生 10 70 80 总计2090110试说明心理障碍与性别的关系: .【解题指南】依照计算出的临界值,同临界值表进行比较,取得心理障碍与性别是不是有关系的判定. 【解析】由表可知,a=10,b=20,c=10,d=70,a+b=30,c+d=80,a+c=20,b+d=90,n=110,ad=700,bc=200,把以上数值代入K 2=n (ad −bc )2(a +b )(c +d )(a +c )(b +d )=110×(700−200)230×80×20×90≈.因为>,因此在犯错误的概率不超过的前提下以为心理障碍与性别有关系. 答案:在犯错误的概率不超过的前提下以为心理障碍与性别有关系 三、解答题(每题10分,共20分)6.在500个用血清的人身上实验某种血清预防伤风的作用,把一年中的记录与另外500个未用血清的人作比较,取得如下的列联表:由以上数据可否在犯错误的概率不超过的前提下以为血清能对预防伤风起到必然的作用?【解析】由列联表中的数据得k=1 000×(252×276−224×248)2500×500×476×524≈.由于<,故不能在犯错误的概率不超过的前提下以为血清对预防伤风有作用. 【方式技术】利用等高条形图判定两变量相关的方式等高条形图,能够粗略地判定两个分类变量是不是有关系,可是这种判定无法精准地给出所得结论的可信程度.在等高条形图中,能够估量知足条件X=x 1的个体中具有Y=y 1的个体所占的比例aa +b,也能够估量知足条件X=x 2的个体中具有Y=y 2的个体所占的比例cc +d,两个比例的值相差越大,结论成立的可能性就越大.7.某地域甲校高二年级有1100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采纳分层抽样的方式在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数10253530x乙校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数153025y5(1)计算x,y的值,并别离估量以上两所学校数学成绩的平均分(精准到1分).(2)假设数学成绩不低于80分为优秀,低于80分为非优秀,依照以上统计数据写下面2×2列联表,并回答可否在犯错误的概率不超过的前提下以为“两个学校的数学成绩有不同”?甲校乙校总计优秀非优秀总计【解题指南】(1)依照抽取的人数和两个学校的人数,利用分层抽样取得两个学校要抽取的人数,别离得出x,y 的值,利用平均数的公式得出两个学校的平均分.(2)依照数学成绩不低于80分为优秀,低于80分为非优秀,得出优秀的人数和不优秀的人数,填出列联表,依照列联表的数据,写出观测值的计算公式,取得观测值,同临界值进行比较,取得结论.【解析】(1)依题意知甲校应抽取110人,乙校应抽取90人,因此x=10,y=15,估量两个学校的平均分,甲校的平均分为55×10+65×25+75×35+85×30+95×10110≈75,乙校的平均分为55×15+65×30+75×25+85×15+95×590≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,取得列联表:因此K 2的观测值k=200×(40×70−20×70)2110×90×60×140≈,又因为>,故能在犯错误的概率不超过的前提下以为“两个学校的数学成绩有不同”.。
(完整版)1.2.2独立性检验的基本思想及其初步应用习题及答案
数学·选修1-2(人教A版)1.2 独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( )A.散点图B.等高条形图C.2×2列联表 D.以上均不对答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.aa+b与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( )A.k越大,“ X与Y有关系”可信程度越小B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B4.下面是一个2×2列联表:则表中a、b的值分别为( )A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于 ( )A.0.043 B.0.367C.22 D.26.87答案:C6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( )A.0.4 B.0.5 C.0.75 D.0.85答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( )A .男人、女人中患有色盲的频率分别为0.038、0.006B .男人、女人患色盲的概率分别为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的D .调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110由K 2=算得, K 2=≈7.8.附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.841 6.635 10.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=可得,K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P (K2≥k0)0.050.0100.001k03.8416.63510.8285.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:P(K2≥k0)0.500.400.250.150.100.050.0250.010.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678910 数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920 数学成绩67936478779057837283物理成绩77824885699161847886若单科成绩85以上(含85分),则该科成绩优秀.数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计解析:(1)2×2列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀 527物理成绩不优秀 1 1213 合计 6 1420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:y1y2合计x1 a b a+bx2 c d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:P(K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P(K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828解析:根据列联表可以求得K2的观测值k=≈8.802>7.879.在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.7. 2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530 使用未经淡化海砂151530 总计402060的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得P(K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?P(K2≥k)0.100.0500.0250.0100.001 k 2.706 3.841 5.024 6.63510.828解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=23.即取出的2个样本混凝土耐久性都达标的概率是2 3 .8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P(K2≥k0)0.150.100.050.0250.010.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:∵K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=80×(120-360)266×14×40×40≈3.117>2.706.∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析:K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967,由于9.967>6.635所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.8282.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10 .(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
高二数学独立性检验的基本思想及其初步应用试题
高二数学独立性检验的基本思想及其初步应用试题1.(12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如列联表所示(单位:人).80及8080分以45(1)求,;(2)你有多大把握认为“教学方式与成绩有关系”?参考公式及数据:,其中为样本容量.【答案】解:⑴,.⑵有99.5%的把握认为“教学方式与成绩”有关系.【解析】第一问中利用列联表求解,第二问中,利用,得到值因为,从而说明有99.5%的把握认为“教学方式与成绩”有关系解:⑴,……………………………2分.………………………………4分⑵…………………………8分…………………………………………………9分因为,所以………………………… 11分所以有99.5%的把握认为“教学方式与成绩”有关系.……………12分则根据以下参考公式可得随机变量K2的值为 (保留三位小数),有 %的把握认为喜爱打篮球与性别有关.(参考公式:K2=,其中n=a+b+c+d)【答案】8.333 99.5%.【解析】根据公式,所以有99.5%的把握认为喜爱打蓝球与性别有关.3.经过对卡方X2统计量分布的研究,已经得到两个临界值,当根据具体的数据算出的X2>3.841时,有______ 的把握说事件A和B有关。
【答案】95%【解析】当>3.841时,有95%的把握说事件A与B有关4.右图是2×2列联表:则表中a、b的值分别为A.94,72B.52,50C.52,74D.74,52【答案】C【解析】a=73-21=52 b=a+22=52+22=74 故选C5.下列说法正确的有()个①在回归分析中,可用指数系数的值判断模型的拟合效果,越大,模型的拟合效果越好.②在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好.③在回归分析中,可用相关系数的值判断模型的拟合效果,越大,模型的拟合效果越好.④在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高.A.1B.2C.3D.4【答案】B【解析】用系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,故(1)正确,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,故(2)不正确可用相关系数r的值判断模型的拟合效果,|r|越大,模型的拟合效果越好,故(3)正确,一般不能用残差图判断模型的拟合效果,故(4)不正确,综上可知有2个命题正确,故选B.6.对分类变量X 与Y 的随机变量的观测值K ,说法正确的是( )A.k 越大," X 与Y 有关系”可信程度越小;B.k 越小," X 与Y 有关系”可信程度越小;C.k 越接近于0," X 与Y 无关”程度越小D.k 越大," X 与Y 无关”程度越大【答案】B【解析】k值越大,说明备择假设“两个分类变量没有关系”的假设不成立。
高二数学独立性检验的基本思想及其初步应用试题答案及解析
高二数学独立性检验的基本思想及其初步应用试题答案及解析1.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下列联表喜爱打篮球不喜爱打篮球合计则至少有的把握认为喜爱打篮球与性别有关(请用百分数表示).附【答案】99.5%【解析】解:根据所给的列联表,得到k2=50(20×15-10×5)2(30×20×25×25) =8.333>7.879,∴至少有99.5%的把握说明喜爱打篮球与性别有关.故答案为:99.5%2.下面是一个22列联表,则表中a、b处的值分别为( )y y总计A. 94、96B. 52、54C. 52、50D. 54、52【答案】B【解析】解:因为根据表格中的数据可知,2+a=b,b+46=100,b=54,a=52,选B3.(本小题满分12分)为考察某种药物预防疾病的效果,进行动物试验,调查了105个样本,统计结果为:服用药的共有55个样本,服用药但患病的仍有10个样本,没有服用药且未患病的有30个样本.(1)根据所给样本数据画出2×2列联表;(2)请问能有多大把握认为药物有效?【答案】 (1)(2)这种判断出错的可能性不超过5%【解析】根据题意,列出服用药的共有55个样本,则未服药的50个样本,服用药但未患病的有20个样本,没有服用药且未患病的有30个样本,列出2×2列联表;求出,记忆卡方范围,得出判断。
解:(1)根据所给样本数据可画出2×2列联表如下:服药未服药合计.。
6分(2)将表中数据代入公式,得到。
10分因为,所以有95%以上的把握认为药物有效,即这种判断出错的可能性不超过5%.。
12分4.统计中有一个非常有用的统计量,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A老师教, 乙班B老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.根据的值,你认为不及格人数的多少与不同老师执教有关系的把握大约为A.99.5% B.99.9% C.95% D.无充分依据.【答案】A【解析】解:k2= =80(4×24-16×36) 2/ 20×60×40×40 =9.6>7.879 ∴不及格人数的多少与不同老师执教有关系的把握大约为99.5%故选A.5.统计中有一个非常有用的统计量,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A老师教, 乙班B老师教)进行某学科测试,按学生考试及格与不及格统计成绩后的2×2列联表.不及格及格总计甲班(A教)43640乙班(B教)162440总计206080经计算=9.6,你认为不及格人数的多少与不同老师执教有关系的把握大约为( )下面的临界值表供参考:A.99.5% B.99.9% C.95% D.无充分依据.【答案】A【解析】因为=9.6 大于7.879,所以选A.6.随着生活水平的提高,越来越多的人参与了潜水这项活动。
高中数学321_独立性检验的基本思想及其初步应用(一)(有答案)
3.2.1 独立性检验的基本思想及其初步应用(一)一、选择题。
1. 下面是2×2列联表:则表中a,b的值分别为()A.21,46B.52,50C.52,54D.54,522. 在等高条形图形中,下列哪两个比值相差越大,“两个分类变量有关系”成立的可能性越大()A.a a+b 与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c3. 在研究两个分类变量之间是否有关系时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对4. 下面是一个2×2列联表:则表中a、b的值分别是()A.94、96B.25、21C.25、27D.27、255. 某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)由上表中数据计算得K2的观测值k=6.109,请估计认为“文化程度与月收入有关系”的把握是()A.1%B.99%C.2.5%D.97.5%6. 下面是调查中国东部地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%二、填空题。
中国医药学院周医师从事原住民痛风流行率的研究,周医师发现原住民342人中,患有痛风的有40人,其中17位TG(三酸甘油酯)超出正常值160,而非痛风组302人中有66位TG超出正常值.通过计算犯错误的概率认为“TG超出正常值与痛风________关.(填“有”或“无”)为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:根据表中数据,得k=________.某卫生机构对366人进行健康体检,有阳性家族史者糖尿病发病的有16例,不发病的有93例,有阴性家族史者糖尿病发病的有17例,不发病的有240例,认为糖尿病患者与遗传有关系的概率为________.三、解答题。
高二数学独立性检验的基本思想及其初步应用试题答案及解析
高二数学独立性检验的基本思想及其初步应用试题答案及解析1.某高校“统计初步”课程教师随机调查了选该课的一些学生情况,共调查了50人,其中女生27人,男生23人。
女生中有20人选统计专业。
另外7人选非统计专业;男生中中有10人统计专业,另外,13人选非统计专业。
(1)根据以上数据完成下列的2×2列联表(2)根据以上数据,能否在犯错误的概率不超过0.05的前提下,认为主修统计专业与性别有关系?【答案】(1) 列联表见解析(2)能在犯错误的概率不超过0.05的前提下,有95%认为主修统计专业与性别有关系【解析】本试题主要是考查了独立性检验的思想在实际中的运用。
根据已知的列联表中的数据得到a,b,c,d,然后代入公式k2=得到的结果P(k2可知犯错率,得到结论。
解:(1)根据以上数据完成下列的2×2列联表专业非统计统计专业总计……6分(2)根据列联表中的数据,得到观测值k2=…………10分P(k2答:在犯错误的概率不超过0.005的前提下,有95%认为主修统计专业与性别有关系12分2.下面是一个22列联表,则表中a、b处的值分别为( )y y总计A. 94、96B. 52、54C. 52、50D. 54、52【答案】B【解析】解:因为根据表格中的数据可知,2+a=b,b+46=100,b=54,a=52,选B3.(本小题满分12分)为考察某种药物预防疾病的效果,进行动物试验,调查了105个样本,统计结果为:服用药的共有55个样本,服用药但患病的仍有10个样本,没有服用药且未患病的有30个样本.(1)根据所给样本数据画出2×2列联表;(2)请问能有多大把握认为药物有效?【答案】 (1)(2)这种判断出错的可能性不超过5%【解析】根据题意,列出服用药的共有55个样本,则未服药的50个样本,服用药但未患病的有20个样本,没有服用药且未患病的有30个样本,列出2×2列联表;求出,记忆卡方范围,得出判断。
人教版数学高二《独立性检验的基本思想及其初步应用》 同步检测
第3章 3.2《独立性检验的基本思想及其初步应用》课时卷(本栏目内容,在学生用书中以活页形式分册装订!)一、选择题(每小题5分,共20分)1.分类变量X 和Y 的列联表如下,则( )y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计a +cb +da +b +c +dA.ad -bc 越小,说明X 与Y 的关系越弱 B .ad -bc 越大,说明X 与Y 的关系越强 C .(ad -bc )2越大,说明X 与Y 的关系越强 D .(ad -bc )2越接近于0,说明X 与Y 的关系越强解析: 结合独立性检验的思想可知|ad -bc |越大,X 与Y 的相关性越强,从而(ad -bc )2越大,说明X 与Y 的相关性越强.答案: C2.某班主任对全班50名学生进行了作业量的调查,数据如表认为作业量大认为作业量不大合计 男生 18 9 27 女生 8 15 23 合计262450则推断“学生的性别与认为作业量大有关”,这种推断犯错误的概率不超过( ) A .0.01 B .0.05 C .0.10D .0.95解析: K 2=50×(18×15-8×9)226×24×27×23≈5.059>3.841∵P (K 2≥3.841)=0.05. ∴犯错误的概率不超过0.05. 答案: B3.想要检验是否喜欢参加体育活动是不是与性别有关,应该检验( )K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=392×(39×167-157×29)2196×196×68×324≈1.78.因为1.78<2.706,所以我们没有理由说在餐厅墙壁上张贴文明标语对减少餐椅损坏数有效果,即效果不明显.尖子生题库☆☆☆9.(10分)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出500件,量其内径尺寸,结果如下表:甲厂分组[29.86,29.90) [29.90,29.94)[29.94,29.98)[29.98,30.02)[30.02,30.06)[30.0630.10),[30.10,30.14)频数1263861829261 4 乙厂分组[29.86,29.90)[29.90,29.94)[29.94.29.98)[29.98,30.02)[30.02,30.06)[30.06,30.10)[30.10,30.14)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂乙厂合计优质品非优质品合计附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)P(K2≥k0)0.0050.01。
独立性检验的基本思想及其初步应用习题及答案
答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( )A.aa+b与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( )A.k越大,“ X与Y有关系”可信程度越小B.k越小,“ X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B4.下面是一个2×2列联表:则表中a、b的值分别为( )A.94、96 B.52、50C.52、54 D.54、52答案:C5.性别与身高列联表如下:那么,检验随机变量K2的值约等于 ( )A.0.043 B.0.367C.22 D.26.87答案:C6.给出列联表如下:根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( )A.0.4 B.0.5 C.0.75 D.0.85答案:B其差值为⎪⎪⎪⎪⎪⎪38480-6520≈0.067 6,差值较大. 答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计 60 50 110由K 2=算得, K 2=≈7.8.附表:P (K 2≥k 0)0.050 0.010 0.001 k 03.841 6.635 10.828参照附表,得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110P(K2≥k0)0.050.0100.001k 03.8416.63510.8285.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:P(K2≥k0)0.500.400.250.150.100.050.0250.010.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828 判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表序号12345678910 数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920 数学成绩67936478779057837283物理成绩778248856991618478860.005的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:y1y2合计x1 a b a+bx2 c d c+d合计a+c b+d a+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:P(K2≥k0)0.500.400.250.150.10k00.4550.708 1.323 2.072 2.706P(K2≥k0)0.050.0250.0100.0050.001 k0 3.841 5.024 6.6357.87910.828解析:根据列联表可以求得K2的观测值k=≈8.802>7.879.在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.7. 2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530 使用未经淡化海砂151530 总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得P(K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=23.即取出的2个样本混凝土耐久性都达标的概率是2 3 .8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P(K2≥k0)0.150.100.050.0250.010.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:甲流水线乙流水线合计合格品a=30b=3666 不合格品c=10d=414 合计4040n=80∵K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=80×(120-360)266×14×40×40≈3.117>2.706.∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.8282.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;解析:由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).其中至少有1名“25岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=7 10 .(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:K2=P(K2≥k0)0.1000.0500.0100.001k0 2.706 3.841 6.63510.828解析:由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:生产能手非生产能手合计25周岁以上组15456025周岁以下组152540合计3070100因为1.79<2.706,所以没有90%的把握认为“生产能手与工人所在年龄组有关”.。
独立性检验的基本思想及其初步应用测试题
独立性检验的基本思想及其初步应用测试题 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-独立性检验的基本思想及其初步应用练习一一、选择题1.下面是一个2×2列联表y 1y2总计x1a2173x222527总计b46则表中a、b处的值分别为( )A.94、96 B.52、50 C.52、54 D.54、522.关于独立性检验的说法中,错误的是( )A.独立性检验依据小概率原理B.独立性检验原理得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X与Y有关系”的可信程度.如果k2>5.024,那么就有把握认为“X与Y有关系”的百分比为()25%75% 2.5%97.5%二、填空题4、我们常利用随机变量2K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的.5. 某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别专业非统计专业统计专业男13 10女7 20(保留三位小数)三、解答题6.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将它们的身高和体重制成2×2列联表,根据列联表的数据,可以有多大的把握认为该学校15至16周岁的男生的身高和体重之间有关系。
超重不超重合计偏高415不偏高31215合计71320独立性检验临界值表P(K2≥k)k练习二一、选择题1.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表优秀不优秀总计甲班113445乙班8 3745总计19719则随机变量2K的观测值约为(A.B.C.D.2. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.3.男女总计爱好40 20 60不爱好20 30 50总计60 50 110()22110403020207.8K ⨯⨯-⨯=≈ A .再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” B .再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” C .有99%以上的把握认为“爱好该项运动与性别有关” D .有99%以上的把握认为“爱好该项运动与性别无关” 二、填空题4、统计推断,当______时,说事件A 与B 有关犯错误的概率不会超过。
2020年高中数学选修2-3《3.2独立性检验的基本思想及其初步应用》测试卷及答案解析
2020年高中数学选修2-3
《3.2独立性检验的基本思想及其初步应用》测试卷
一.选择题(共10小题)
1.为了解某高校学生使用手机支付和现金支付的情况,抽取了部分学生作为样本,统计其喜欢的支付方式,并制作出如下等高条形图:
根据图中的信息,下列结论中不正确的是()
A.样本中的男生数量多于女生数量
B.样本中喜欢手机支付的数量多于现金支付的数量
C.样本中多数男生喜欢手机支付
D.样本中多数女生喜欢现金支付
2.利用独立性检测来考查两个分类变量X,Y是否有关系,当随机变量K2的值()A.越大,“X与Y有关系”成立的可能性越大
B.越大,“X与Y有关系”成立的可能性越小
C.越小,“X与Y有关系”成立的可能性越大
D.与“X与Y有关系”成立的可能性无关
3.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:
p(k2≥k)0.0500.0100.001
k 3.841 6.63510.828
男女总计
第1 页共28 页。
独立性检验的基本思想综合测试题(有答案)
独立性检验的基本思想综合测试题(有答案)选修2-33.2独立性检验的基本思想及其初步应用一、选择题1.统计假设H0:P(AB)=P(A)•P(B)成立时,有以下判断:①P(AB)=P(A)P(B);②P(AB)=P(A)P(B);③P(AB)=P(A)P(B).其中真命题个数是()A.1B.2C.3D.4答案]C2.在对吸烟与患肺病这两个分类变量的计算中,下列说法正确的是() A.若随机变量K2的观测值k>6.635,我们有99%的把握说明吸烟与患肺病有关,则若某人吸烟,那么他有99%的可能患有肺病B.若由随机变量求出有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99个人患有肺病C.若由随机变量求出有95%的把握说吸烟与患肺病有关,那么有5%的可能性使得推断错误D.以上说法均不正确答案]C解析]K2的意义与概率不能混淆.3.对两个分类变量A、B的下列说法中正确的个数为()①A与B无关,即A与B互不影响;②A与B关系越密切,则K2的值就越大;③K2的大小是判定A与B是否相关的唯一依据A.1B.2C.3D.4答案]A解析]①正确,A与B无关即A与B相互独立;②不正确,K2的值的大小只是用来检验A与B是否相互独立;③不正确,例如借助三维柱形图、二维条形图等.故选A.4.以下关于独立性检验的说法中,错误的是()A.独立性检验依据小概率原理B.独立性检验得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两分类变量是否相关的唯一方法答案]B解析]独立性检验得到的结论不一定正确,如我们得出有90%的把握认为A与B有关,只是说这种判断的正确性为90%,具体问题中A与B 可能有关,可能无关,故答案选B.5.根据下面的列联表判断患肝病与嗜酒有关系的把握有()嗜酒不嗜酒合计患肝病7775427817未患肝病2099492148总计9874919965A.90%B.95%C.97.5%D.99.9%答案]D解析]由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得其观测值k=9965×(7775×49-2099×42)27817×2148×9874×91≈56.6>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.二、填空题6.吃零食是中学生中普遍存在的现象.吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的列联表男女总计喜欢吃零食51217不喜欢吃零食402868合计454085试回答吃零食与性别有关系吗?(答有或没有)____________.答案]有解析]k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=85(140-480)217×68×45×40=98260002080800≈4.700>3.841.故约有95%的把握认为“吃零食与性别”有关.7.根据下表,计算K2的观测值k≈________.(保留两位小数)又发病未发病作移植手术39157未作移植手术29167答案]1.78解析]k=392×(39×167-157×29)2196×196×68×324≈1.78.8.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组的序号为________.①a=9,b=8,c=7,d=6②a=9,b=7,c=6,d=8③a=8,b=6,c=9,d=7④a=6,b=7,c=8,d=9答案]②解析]对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad -bc|越大,说明X与Y之间的关系越强.|ad-bc|越大,K2越大,|ad -bc|越小,则K2越小.三、解答题9.调查339名50岁以上有吸烟习惯与患慢性气管炎的人的情况,获数据如下患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134合计56283339试问:(1)有吸烟习惯与患慢性气管炎病是否有关?(2)用假设检验的思想给予说明.解析](1)根据列联表的数据,得到k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=339×(43×121-162×13)2205×56×283×134=6.674>6.635.所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患病之间没有关系”,由于事件A={K2≥6.635}的概率P(A)≈0.01,即A为小概率事件,而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.10.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目进行分析,根据上述数据能得出什么结论?解析]由公式k=189×(54×63-40×32)294×95×86×103≈10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”有关,可以认为企业的全体员工对待企业改革的态度与其工作的积极性是有关的.11.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示.种子灭菌种子未灭菌合计有黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计推断.解析]由公式得,k=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,所以我们有95%的把握认为种子灭菌与发生黑穗病是有关系的.12.打鼾不仅影响别人休息,而且可能与患有某种疾病有关.下表是一次调查所得的数据,试问:每一晚都打鼾与患心脏病有关吗?患心脏病未患心脏病合计每一晚都打鼾30224254不打鼾2413551379合计5415791633解析]由公式②,k=1633×(30×1355-224×24)21379×254×54×1579≈68.33.因为68.33>6.635,所以有99%的把握说,每一晚都打鼾与患心脏病有关.。
人教新课标版(A)高二选修2-3-3.2独立性检验的基本思想及其初步应用同步训练题
人教新课标版(A )高二选修2-3:3.2独立性检验的基本思想及其初步应用同步训练题知识·能力练 夯实基础,提升能力 ◆独立性检验1. 在进行独立性检验时,统计量K 2的计算公式是( )A. )d b )(c a )(d c )(b a ()bc ad (n K 22+++++=B. )d b )(c a )(d c )(b a ()adbc (n K 22++++=C. )d b )(c a )(d c )(b a ()bc ad (K 22++++-=D. )d b )(c a )(d c )(b a ()bc ad (n K 22++++-=2. 经过对K 2统计量分布的研究,已经得到了两个临界值:2.706与6.635. 下列说法正确的是( ) A. 当根据具体的数据算出的k<2.706时,有95%的把握说事件A 与B 有关 B. 当k<6.635时,有99%的把握说事件A 与B 有关 C. 当k ≥2.706时,认为事件A 与B 是无关的 D. 当k ≤2.706时,认为事件A 与B 是无关的为了判断主修统计专业是否与性别有关系,根据表中数据,得到.844.430202723)7102013(50k 2≈⨯⨯⨯⨯-⨯⨯=因为k ≥3.841,所以断定主修统计专业与性别有关系,那么这种判断出错的可能性约为方法·技巧练 巧练方法,事半功倍 信息探究4. 某保健药品推销商为推销某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”,经调查发现,在不使用该药品的418人中仅有18人患A 疾病.请用所学知识分析该药品对患A 疾病是否有效?5. 利用统计变量K 2的观测值来判断两个分类变量之间的关系的可信程度.试按照原试验目的作统计分析推断: 难题巧解根据以上数据比较这两种情况看40岁以上的人患胃病与生活规律有关吗?7. 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?8. 为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人,每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人,试问患慢性气管炎是否与吸烟量相互独立?综合·拓展练综合运用,拓展知能创新设计题9. 某矿石粉厂当生产一种矿石粉石时,在数天内即有部分工人患职业性皮肤炎,从生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤问这种新防护服对工人患职业性皮肤炎是否有效?并说明你的理由.合作交流题试利用图形和独立性检验来判断新措施对防治猪白痢是否有效?【参考答案】1. D2. D3. 5%将上述数据代入公式)d b )(c a )(d c )(b a ()bc ad (n K 22++++-=中,计算可得04145.0K 2=,而查表可知5.0)445.0K (P 2≈≥,故没有充分理由认为该保健药品对预防A 疾病有效.5. 解:利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K 2的值,如果K 2的值越大说明两个变量之间有关系的可能性也就越大,再参考临界值,从而判断两个变量有关系的可信程度.由列联表可知a=26,b=184,c=50,d=200,a+b=210,c+d=250,a+c=76,b+d=384,n=460,代入公式)d b )(c a )(d c )(b a ()bc ad (n K 22++++-=38476250210)5018420026(4602⨯⨯⨯⨯-⨯⨯=804.4≈,由841.3804.4K 2>≈,∴有95%的把握认为种子灭菌与小麦发生黑穗病是有关系的.6. 分析:先计算K 2,然后利用K 2>6.635,则说患胃病与生活规律有关,而K 2≤2.706,就断定患胃病与生活规律无关.解析:由公式)d b )(c a )(d c )(b a ()bc ad (n K 22++++-=得.638.946080220320)2026020060(540K 22≈⨯⨯⨯⨯-⨯=∵9.638>6.635,∴40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病. 7. 解:根据题目所给数据得到如下列联表:相应的三维柱形图如图所示,比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.根据列联表中的数据,得到7726651048389)451175597214(1437K 22⨯⨯⨯⨯-⨯⨯=≈16.373>10.828.所以有99.9%的把握认为“秃顶与患心脏病有关”.因为这组数据来自住院的病人,因此所得到的结论适合住院的病人群体.提出假设H 0:患慢性气管炎与吸烟量是相互独立的. 由公式得41187105123)25891698(228K 22⨯⨯⨯⨯-⨯=.323.1994.0<≈当H 0成立时,K 2≥0.994的概率大于25%,故我们认为不能否定假设H 0,即不能作出患慢性气管炎与吸烟量有关的结论.9. 解:通过计算穿新、旧防护服的工人患皮肤病的发病率可知,穿上新的发病率为6.7%,而穿旧的则发病率为35.7%,说明新防护服对预防皮肤炎有一定效果.通过作频率分布条形图可知,穿上新防护服后也有明显的效果. 通过计算K 2知,)d b )(c a )(d c )(b a ()bc ad (n K 22++++-==13.826,查表可知,001.0)828.10K (P 2≈≥,而13.826大于10.828,故至少有99.9%的把握说明新防护服比旧防护服对患这种皮肤病有效. 10. 解:作出二维条形图如图所示.从二维条形图中,可以估计在新措施中的死亡数占的比例数为15018,在对照组中的死亡数占的比例数为15036,二者的差值为150181501815036=-,差别很大,因此从二维条形图中我们可以看出新措施对防治猪白痢也是有效的.利用独立性检验来计算,由列联表可知,a=132,b=18,c=114,d=36,a+b=150,c+d=150,a+c=246,b+d=54,n=300,代入)d b )(d c )(c a )(b a ()bc ad (n K 22++++-=得.32.724654150150)1141836132(300K 22≈⨯⨯⨯⨯-⨯⨯=由于K 2≈7.32>6.635,因此我们有99%的把握认为新措施对预防猪白痢是有效的.。
高中数学《独立性检验的基本思想及其初步应用》练习
独立性检验的基本思想及其初步应用一、选择题1.下面是一个2×2列联表:不健康健康总计不优秀 a 2173优秀22527总计 b 46100则表中a,b的值分别是()A.94,96B.52,50C.52,54D.54,52解析:由a+21=73,得a=52,由b+46=100,得b=54.答案:C2.为考察A,B两种药物预防某疾病的效果,进行动物实验,分别得到如下等高条形图:根据图中信息,在下列各项中,说法最佳的一项是()A.药物B的预防效果优于药物A的预防效果B.药物A的预防效果优于药物B的预防效果C.药物A,B对该疾病均有显著的预防效果D.药物A,B对该疾病均没有预防效果解析:根据两个表中的等高条形图知,药物A实验显示不服药与服药时患病差异较药物B实验显示明显大,∴药物A的预防效果优于药物B的预防效果,故选B.答案:B3.(2020·延安市第一中学高二月考)为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算P(K2≥k0)=0.01,根据这一数据分析,下列说法正确的是()A.有1%的人认为该栏目优秀B.有1%的把握认为该栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有理由认为电视栏目是否优秀与改革有关系解析:∵P(K2≥k0)=0.01表示“电视栏目是否优秀与改革没有关系”的概率,∴有99%的把握认为电视栏目是否优秀与改革有关系,故选C.答案:C4.(2020·四川省宜宾市第四中学高二月考)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)附表:A.列联表中cB.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:由题意知,成绩优秀的学生数是105×27=30,成绩非优秀的学生数是105-30=75,所以c =20,b =45,选项A ,B 错误;根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”,选项C 正确.故选C. 答案:C5.(多选)(2020·山东省淄川中学高二期中)我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄群体中随机抽取了容量为140的调查样本,其中城镇户籍与农村户籍各70人;男性60人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是( )A .是否倾向选择生育二胎与户籍有关B .是否倾向选择生育二胎与性别有关C .调查样本里面倾向选择生育二胎的人群中,男性人数少于女性人数D .倾向选择不生育二胎的人群中,农村户籍人数多于城镇户籍人数 解析:由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:在A 中,城镇户籍倾向选择生育二胎的比例为40%,农村户籍倾向选择生育二胎的比例为80%,∴是否倾向选择生育二胎与户籍有关,故A 正确;在B 中,男性倾向选择生育二胎的比例为80%,女性倾向选择生育二胎的比例为60%,∴是否倾向选择生育二胎与性别有关,故B正确;在C中,男性倾向选择生育二胎的比例为80%,人数为60×80%=48人,女性倾向选择生育二胎的比例为60%,人数为80×60%=48人,∴倾向选择生育二胎的人员中,男性人数与女性人数相同,故C错误;在D中,倾向选择不生育二胎的人员中,农村户籍人数为70×(1-80%)=14人,城镇户籍人数为70×(1-40%)=42人,∴倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选A、B.答案:AB二、填空题6.(2020·广东省阳山县阳山中学高二月考)在独立性检验中,统计量K2有两个临界值:3.841和6.635.当K2>3.841时,有95%的把握说明两个事件有关,当K2>6.635时,有99%的把握说明两个事件有关,当K2≤3.841时,认为两个事件无关.在一项打鼾与患心脏病的调查中,共调查了2 000人,经计算K2=20.87.根据这一数据分析,我们有理由认为打鼾与患心脏病之间是________的(有关、无关).解析:K2=20.87>6.635时,有99%的把握说明打鼾与患心脏病有关.答案:有关7.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题,为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行实验,得到如下列联表:参照附表,可认为“注射疫苗”与“感染流感”有关系.参照公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解析:由题意得K 2=100×(10×30-20×40)230×70×50×50≈4.762>3.841,∴在犯错误的概率最多不超过0.05的前提下,可认为“注射疫苗”与“感染流感”有关系.答案:0.058.若两个分类变量X 和Y 的列联表为:则x 与y 解析:由2×2列联表知,a =5,b =15,c =40,d =10,∴a +b =20,c +d =50,a +c =45,b +d =25,n =70,则K 2的观测值k =70×(5×10-15×40)220×50×45×25≈18.8.由P (K 2≥10.828)≈0.001,知X 与Y 之间有关系的概率约为0.999.答案:0.999 三、解答题9.(2020·海南省高考)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO 2浓度(单位μg/m 3).得下表:(1)2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).解:(1)75,且SO2浓度不超过150的天数有32+6+18+8=64天,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率为64100=0.64.(2)由所给数据,可得2×2列联表为:(3)根据2K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10-16×10)280×20×74×26=3 600341≈7.484 4>6.635.因为根据临界值表可知,有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关.10.(2020·广东省高三三模)随机调查某城市80名有子女在读小学的成年人,以研究晚上八点至十点时间段辅导子女作业与性别的关系,得到下面的数据表:(1)(2)用样本的频率估计总体的概率,估计这个城市有子女在读小学的成人女性晚上八点至十点辅导子女作业的概率;(3)根据以上数据,能否有99%以上的把握认为“晚上八点至十点时间段是否辅导子女作业与性别有关?”参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 参考数据:(2)在样本中有20位女士,其中有15位辅导孩子作业,其频率为P=15 20=0.75,∴估计成人女士晚上八点至十点辅导孩子作业的概率为0.75.(3)∵K2=80(25×5-15×35)240×40×20×60=203≈6.67>6.635,∴有99%的把握认为“晚上八点至十点时间段是否辅导孩子作业与性别有关”.。
独立性检验的基本思想及其初步应用习题
1.通过随机询问110名性别不同的学生是否爱好某项运动,得到如下的列联表:由K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d) 算得, K 2≈. 附表:参照附表,得到的正确结论是( )A. 有99%以上的把握认为“爱好该项运动与性别有关”B. 有99%以上的把握认为“爱好该项运动与性别无关”C. 在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”根据表中数据,通过计算统计量()()()()()22n ad bc K a b c d a c b d -=++++,并参考以A. 0.05B. 0.025C. 0.01D. 0.0053.某同学利用课余时间做了一次社交软件使用习惯调查,得到22⨯列联表A. 在犯错的概率不超过的前提下认为社交软件使用习惯与年龄有关B. 在犯错的概率超过的前提下认为社交软件使用习惯与年龄有关C. 在犯错的概率不超过的前提下认为社交软件使用习惯与年龄有关D. 在犯错的概率超过的前提下认为社交软件使用习惯与年龄有关4.某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则最高有(填百分数)的把握认为“学生性别与是否支持该活动有关系”.量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率;(2)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附:()()()()()22n ad bcka b c d a c b d-=++++,。
数学选修2-3独立性检验的基本思想及其初步应用练习题含答案
数学选修2-3独立性检验的基本思想及其初步应用练习题含答案学校:__________ 班级:__________ 姓名:__________ 考号:__________1. 下列是一个2×2列联表则表中a ,b 处的值分别为( ) A.94,96 B.52,50C.52,54D.54,522. 为了判断我校学生考试成绩是否与阅读量有关,现随机抽取992名学生,得到如下2×2列联表:已知P K 0.005,根据题目数据,得到K 2的观测值k =992×(700×32−60×200)2760×232×900×92≈7.349,则认为考试成绩与阅读量有关系出错的可能性为( ) A.1% B.2.5%C.5%D.10%3. 如图2×2列联表中a ,b 的值分别为( )A.54,43B.53,43C.53,42D.54,424. 统计中有一个非常有用的统计量k 2,用它的大小可以确定在多大程度上可以认为“两个分类变量有关系”,下表是反映甲、乙两个平行班(甲班A 老师教,乙班B 老师教)进行某次数学考试,按学生考试及格与不及格统计成绩后的2×2列联表.)A.99.5%B.99.9%C.95%D.无充分依据5. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②6. 为了考察某种药物预防疾病的效果,进行抽样调查,得到如下的列联表,你认为此药物有效的把握有()A.80%B.90%C.95%D.99%7. 下列四个命题中:①设有一个回归方程y=2−3x,变量x增加一个单位时,y平均增加3个单位;②命题P“∃x0∈R,x02−x0−1>0”的否定¬p:“∀x∈R,x2−x−1≤0”;③设随机变量X服从正态分布N(0, 4),若P(X>1)=0.2,则P(−l<X<0)=0.3;④在一个2×2列联表中,由计算得K2=6.679,则有99%的把握确认这两个变量间有关系.其中正确的命题的个数有()本题可以参考独立性检验临界值表:8. 2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( ),其中n=a+b+c+d.附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)D.2509. 为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0.99,根据这一数据分析,下列说法正确的是()A.有99%的人认为该栏目优秀B.有99%的人认为该栏目是否优秀与改革有关系C.有99%的把握认为电视栏目是否优秀与改革有关系D.没有理由认为电视栏目是否优秀与改革有关系10. 千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”……小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A的100天日落和夜晚天气,得到如下2×2列联表:并计算得到K2≈19.05,下列小波对地区A天气判断不正确的是()A.夜晚下雨的概率约为12B.未出现“日落云里走”夜晚下雨的概率约为514C.有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D.出现“日落云里走”,有99.9%的把握认为夜晚会下雨11. 在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参照附表,在犯错误的概率最多不超过________(填百分比)的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.12. 为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:则至少有________的把握认为喜爱打篮球与性别有关?(请用百分数表示)附:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)13. 下表是关于新生婴儿的性别与出生时间段调查的列联表,那么,A=________,B=________,C=________,D=________.14. 如图是两个分类变量X、Y的部分2×2列联表,则K2的观测值为________.15. 为了研究高中学生中性别与对乡村音乐态度(喜欢和不喜欢两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=8.026,则所得到的统计学结论是:有________的把握认为“性别与喜欢乡村音乐有关系”16. 利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表至少有________以上得把握认为“爱好该项运动与性别有关”.17. 为考察高中生的性别与是否喜欢数学课程之间的关系,在我市某普通中学高中生中随机抽取200名学生,得到如下2×2列联表:经计算K________(填百分数)的把握认为“性别与喜欢数学课之间有关系”.18. 判断真假:从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病.________.19. 有如下四个命题:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67,则甲乙的中位数分别为45和44.②相关系数r=−0.83,表明两个变量的相关性较弱.③若由一个2×2列联表中的数据计算得K2的观测值k≈4.103,那么有95%的把握认为两个变量有关.④用最小二乘法求出一组数据(x i, y i),(i=1,…,n)的回归直线方程ŷ=b̂x+â后要进行残差分析,相应于数据(x i, y i),(i=1,…,n)的残差是指e î=y i−(b̂x i+â).以上命题“错误”的序号是________.20. 2016年10月9日,教育部考试中心下发了《关于2017年普通高考考试大纲修订内容的通知》,在各科修订内容中明确提出,增加中华优秀传统文化的考核内容,积极培育和践行社会主义核心价值观,充分发挥高考命题的育人功能和积极导向作用.宿州市教育部门积极回应,编辑传统文化教材,在全市范围内开设书法课,经典诵读等课程.为了了解市民对开设传统文化课的态度,教育机构随机抽取了200位市民进行了解,发现支持开展的占75%,在抽取的男性市民120人中持支持态度的为80人.(Ⅱ)为了进一步征求对开展传统文化的意见和建议,从抽取的200位市民中对不支持的按照分层抽样的方法抽取5位市民,并从抽取的5人中再随机选取2人进行座谈,求选取的2人恰好为1男1女的概率.附:K2=n(ad−bc)2.(a+b)(c+d)(a+c)(b+d)21. 通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:为了判断爱好该项运动是否与性别有关,由表中的数据此算得k2≈7.8,因为P(k2≥6.635)≈0.01,所以判定爱好该项运动与性别有关,那么这种判断出错的可能性为________.22. 某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,所以判定主修统计专业)与性别有关系,那么这种判断出错的可能性为________.(x2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)23. 考察棉花种子经过处理与否跟生病之间的关系得到下表数据:根据以上数据,则种子经过处理与否跟生病________.24. 某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练的提高”数学应题“得分率”的试验,其中甲班为试验班(加强语文阅读理解训练〕,乙班为对比班(常规教学,无额外训练).在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致.试验结束后,统计几次数学应用题测试的平均成绩(均取整放)如下表所示:现规定平均成绩在80分以上(不含80分)的为优秀(I)试分别估计两个班级的优秀率:(II)用以上统计数据填写下面2×2列联表,并问是否有75%的把握认为.加强“语史阅读理解”训练对提高“数学应题”得分率有帮助?参考个公式K2=n(ad−bc)2,其中n=a+b+c+d(a+b)(c+d)(a+c)(b+d)参考数据:25. 某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得Χ2≈3.918,经查对临界值表知P(Χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是________(1)有95%的把握认为“这种血清能起到预防感冒的作用”(2)若某人未使用该血清,那么他在一年中有95%的可能性得感冒(3)这种血清预防感冒的有效率为95%(4)这种血清预防感冒的有效率为5%26. 为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:已知P(K2≥5.024)≈0.025.≈4.844,则认为选修文理科与性别有关系根据表中数据,得到K2=50×(13×20−10×7)223×27×20×30出错的可能性约为________.27. 为了考察某种药物预防疾病的效果,进行动物实验,得到如下列联表.则认为该药物对预防疾病有效果的把握大约为________.28. 为了判断高二学生选择文理是否与性别有关,现随机抽取50名学生,得到如下2×2列联表若p(k2≥3.841)≈0.05,p(k2≥5.024)≈0.025根据计算公式k2=n(ad−bc)2≈4.844则认为选修文理科与性别有关系出错的可能性为________.(a+b)(c+d)(a+c)(b+d)29. 为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:根据表中数据,得k =________.30. 近年来我国电子商务行业迎来发展的新机遇.2016年618期间,某购物平台的销售业绩高达516亿人民币.与此同时,相关管理部门推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功交易,并对其评价进行统计,对商品的好评率为0.6,对服务的好评率为0.75,其中对商品和服务都做出好评的交易为80次. (I)先完成关于商品和服务评价的2×2列联表,再判断能否在犯错误的概率不超过0.001的前提下,认为商品好评与服务好评有关?(II)若将频率视为概率,某人在该购物平台上进行的3次购物中,设对商品和服务全好评的次数为随机变量X :①求对商品和服务全好评的次数X 的分布列; ②求X 的数学期望和方差. 附临界值表:K 2的观测值:k =n(ad−bc)2(a+b)(c+d)(a+c)(b+d)(其中n =a +b +c +d )关于商品和服务评价的2×2列联表:31.某机构对某市工薪阶层的收入情况与超前消费行为进行调查,随机抽查了200人,将他们的月收入(单位:百元)频数分布及超前消费的认同人数整理得到如下表格:(1)根据以上统计数据填写下面2×2列联表;(2)是否有99%的把握认为当月收入以8000元为分界点时,该市的工薪阶层对“超前消费”的态度有差异?说明理由.,其中n=n11+n12+n21+n22.参考公式:χ2=n(n11n22−n12n21)2(n11+n12)(n11+n21)(n21+n22)(n12+n22)参考数据:32. 骑行有很多好处:1.习惯性的单车运动,更能扩大你的心脏.2.单车是需要大量氧气的运动.3.单车运动同时也能防止高血压,有时比药物更有效.还能防止发胖、血管硬化,并使骨骼强硬.4.自行车是减肥的工具.5.单车运动,不只可以减肥,还使你的身段更为匀称迷人.6.事实上因为踩单车压缩血管,使得血液循环加速,大脑摄入更多的氧气,因此你吸进了更多的新鲜空气.7.它不止是一种减肥运动,更是心灵愉悦的放逐.某机构为调查我国公民对骑行的喜爱态度,随机选了某城市某小区的100位居民调查,调查结果统计如表:(1)根据已有数据,把表格数据填写完整;(2)判断能否在犯错误的概率不超过0.1%的前提下认为是否喜爱骑行与年龄有关? 附: K 2=n (ad−bc )2(a+b )(c+d )(a+c )(b+d ),其中n =a +b +c +d .33. 某企业对现有设备进行了改造,为了了解设备改造后的效果,现从设备改造前后生产的大量产品中各抽取了100件产品作为样本检测其质量指标值,若质量指标值在[20,60)内,则该产品视为合格品,否则视为不合格品.图1是设备改造前的样本的频率分布直方图,表1是设备改造后的样本的频数分布表质量指标值频数0.040[20,30)88[50,60)表1:设备改造后样本的频数分布表图1设备改造前样本的频率分布直方图(1)完成下面的2×2列联表并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关设备改造前设备改造后合计不合格品(2)根据图1和表1提供的数据试从产品合格率的角度对改造前后设备的优劣进行比较;(3)企业将不合格品全部销毁后,根据客户需求对合格品进行等级细分,质量指标值落在[30,40)内的定为一等品,每件售价180元;质量指标值落在[20,30)或[40,50)内的定为二等品,每件售价150元其他的合格品定为三等品,每件售价120元根据频数分布表1的数据,用该组样本中一等品、二等品、三等品各自在合格品中的频率代替从所有合格产品中抽到一件相应等级产品的概率,现有一名顾客随机购买两件产品,设其支付的费用为X(单位:元),求X 的分布列和数学期望P(K≥k)0.0256.635n(ad -bc )2(a+b)(c+d)(a+c)(b+d)34. 随着生活水平的提高,人们的休闲方式也发生了变化.某机构随机调查了n 个人,其中男性占调查人数的25.已知男性中有一半的人的休闲方式是运动,而女性只有13的人的休闲方式是运动. (1)完成下列2×2列联表:(2)若在犯错误的概率不超过0.05的前提下,可认为“性别与休闲方式有关”,那么本次被调查的人数至少有多少?(3)根据(2)的结论,本次被调查的人中,至少有多少人的休闲方式是运动?参考公式:K2=n(ad−bc)2,其中n=a+b+c+d.(a+b)(c+d)(a+c)(b+d)35. 为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:(1)用分层抽样的方法在喜欢打蓝球的学生中抽6人,其中男生抽多少人?(2)在上述抽取的6人中选2人,求恰有一名女生的概率.(3)为了研究喜欢打蓝球是否与性别有关,计算出K2≈8.333,你有多大的把握认为是否喜欢打蓝球与性别有关?下面的临界值表供参考:36. 为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据,试问色盲与性别是否是相互独立的?37. 手机作为客户端越来越为人民所青睐,通过手机实现衣食住行消费已经成为一种主要的下方方式,在某市,随机调查了200名顾客购物时所用手机支付的情况,得到如下的2×2列联表,已知从所用手机支付的人群中随机抽取1人,抽到青年的概率为7.10 (Ⅰ)根据已知条件完成2×2列联表,并根据此资料判断是否有99.5%的把握认为“市场购物用手机支付与年龄有关”?2×2列联表:“使用手机支付”和“不使用手机支付”抽取得到一个容量为5的样本,设事件A 为“从这个样本中任选2人,这2人中至少有1人是不使用手机支付的”求事件A 发生的概率. 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)38. 2015年7月9日21时15分,台风“莲花”在我国广东省陆丰市甲东镇沿海登陆,造成165.17万人受灾,5.6万人紧急转移安置,288间房屋倒塌,46.5千公顷农田受灾,直接经济损失12.99亿元.距离陆丰市222千米的梅州也受到了台风的影响,适逢暑假,小明调查了梅州某小区的50户居民由于台风造成的经济损失,将收集的数据分成[0, 2000],(2000, 4000],(4000, 6000],(6000, 8000],(8000, 10000]五组,并作出如下频率分布直方图(图1):(1)试根据频率分布直方图估计小区每户居民的平均损失(同一组中的数据用该组区间的中点值作代表);(2)小明向班级同学发出倡议,为该小区居民捐款.现从损失超过6000元的居民中随机抽出2户进行捐款援助,求这两户在同一分组的概率;(3)台风后区委会号召小区居民为台风重灾区捐款,小明调查的50户居民捐款情况如下表,在图2表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额多于或少于500元和自身经济损失是否到4000元有关?,n=a+b+c+d.附:临界值表参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)39. 某班主任老师对全班60名学生的性别与利用手机上网的情况进行调查,从中随机抽查一名学生,经计算发现,男生中喜欢手机上网的比不喜欢手机上网的概率大1,而10.女生中则喜欢手机上网的比不喜欢手机上网的概率小115(1)根据以上信息完成下面2×2列联表.(2)根据以上信息你是否认为男生比女生更喜欢利用手机上网?,附:Χ2=n(n11n22−n12n21)2n1+n2+n+1n+240. “中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是8.15(1)请将上面的列联表补充完整(在答题卷上直接填写结果,不需要写求解过程);(2)据此资料判断是否有95%的把握认为反感“中国式过马路”与性别有关?参考答案与试题解析数学选修2-3独立性检验的基本思想及其初步应用练习题含答案一、选择题(本题共计 10 小题,每题 3 分,共计30分)1.【答案】C【考点】独立性检验【解析】此题暂无解析【解答】解∵a+21=73,∴a=52.又∵a+2=b,∴ b=54.故选C.2.【答案】A【考点】独立性检验【解析】此题暂无解析【解答】≈7.349>6.635,解:已知K2=992(700×32−60×200)2760×232×900×92而P(K2≥6.635)≈0.01=1% .故认为考试成绩与阅读量有关系出错的可能性为1%.故选A.3.【答案】B【考点】独立性检验【解析】【解答】解:b=121−78=43,c=43−23=20,e=121−48=73,a=73−20=53.故选B.4.【答案】独立性检验的基本思想【解析】先利用公式计算k2的值,再对照“x与y有关系可信程度表”,得两个分类变量相关的程度.【解答】解:k2=n(ad−bc)2(a+c)(b+d)(a+b)(c+d)=80(4×24−16×36)220×60×40×40=9.6>7.879∴不及格人数的多少与不同老师执教有关系的把握大约为99.5%故选A.5.【答案】C【考点】独立性检验的基本思想【解析】观测值同临界值进行比较得到一个概率,这个概率是推断出错误的概率,若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误,从而得出答案.【解答】解:要正确认识观测值的意义,观测值同临界值进行比较得到一个概率,这个概率是推断出错误的概率,若k2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,但不表示在100个吸烟的人中必有99人患有肺病,故①不正确.也不表示某人吸烟,那么他有99%的可能患有肺病,故②不正确.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误,③正确.故选C.6.【答案】B【考点】独立性检验独立性检验的基本思想【解析】根据列联表,看出各种情况的数据,代入求临界值的公式,做出观测值,拿观测值同临界值表进行比较,得到有90%的把握认为药物有效.【解答】解:由题意,假设服药和患病没有关系,则K2的观测值应该很小,而K2=100(15×26−24×35)2÷(39×61×50×50)≈3.405.3.405>2.706,由独立性检验临界值表可以得出,有90%的把握药物有效.故选B7.【答案】独立性检验【解析】①设有一个回归方程y=2−3x,变量x增加一个单位时,y平均减少3个单位;②命题P“∃x0∈R,x02−x0−1>0”的否定¬p:“∀x∈R,x2−x−1≤0”;③设随机变量X服从正态分布N(0, 4),若P(X>1)=0.2,则P(−l<X<0)=0.5−0.2=0.3;④在一个2×2列联表中,由计算得K2=6.679>6.535,则有99%的把握确认这两个变量间有关系.【解答】①设有一个回归方程y=2−3x,变量x增加一个单位时,y平均减少3个单位,故不正确;②命题P“∃x0∈R,x02−x0−1>0”的否定¬p:“∀x∈R,x2−x−1≤0”,正确;③设随机变量X服从正态分布N(0, 4),若P(X>1)=0.2,则P(−l<X<0)=0.5−0.2=0.3,正确;④在一个2×2列联表中,由计算得K2=6.679>6.535,则有99%的把握确认这两个变量间有关系,正确.8.【答案】B【考点】独立性检验的应用【解析】左侧图片未给出解析.【解答】解:依题意,设男、女生的人数各为5x,建立2×2列联表如下所示:故K2=(8x2−3x2)2⋅10x5x⋅5x⋅3x⋅7x =10x21,由题可知6.635<10x21<10.828,所以139.335<10x<227.388,只有B符合题意.故选B.9.【答案】D【考点】独立性检验的应用【解析】本题的考查点是独立性检验的应用,根据独立性检测考查两个变量是否有关系的方法进行判断,准确的理解判断方法及K2的含义是解决本题的关键.【解答】解:只有K2>6.635时,才能有99%的把握认为电视栏目是否优秀与改革有关系,而即使K2>6.635,也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,不是否有99%的人有何种看法,故选D.10.【答案】D【考点】独立性检验【解析】(1)根据题目所给信息进行解题即可.【解答】解:根据列联表可知在100天中夜晚下的有50天,选项A正确;而未出现“日落云里走”夜晚下雨的概率约为514,选项B正确;由K2≈19.05>10.828,所以我们有99.9%的把握认为“日落云里走”与“当晚是否下雨”有关,选项C正确;而出现“日落云里走”无法有99.9%的把握认为夜晚会下雨.故选D.二、填空题(本题共计 20 小题,每题 3 分,共计60分)11.【答案】5%【考点】独立性检验【解析】根据列联表中数据计算观测值,对照数表得出结论.【解答】解:根据列联表中数据,计算K2=100×(10×30−20×40)230×70×50×50=10021≈4.762≥3.841,对照数表知,在犯错误的概率最多不超过5%的前提下,可认为“该种疫苗有预防埃博拉病毒感染的效果”.故答案为:5%.12.【答案】99.5%【考点】独立性检验【解析】根据所给的列联表得到求观测值所用的数据,把数据代入观测值公式中,做出观测值,同所给的临界值表进行比较,得到所求的值所处的位置,得到百分数.【解答】解:根据所给的列联表,得到k2=50(20×15−10×5)230×20×25×25=8.333>7.879,∴至少有99.5%的把握说明喜爱打篮球与性别有关.故答案为:99.5%13.【答案】47,53,88,82【考点】独立性检验【解析】根据列联表中各数据之间的关系计算可得.【解答】解:由列联表知:A=92−45=47;B=98−45=53;C=53+35=88;D=47+35=82.故答案为:47,53,88,82.14.【答案】409【考点】独立性检验的应用【解析】直接利用公式,可得K2的观测值.【解答】解:由题意,根据公式可得K2=120×(10×40−20×50)2(10+50)(20+40)(10+20)(50+40)=409.故答案为:409.15.【答案】99%【考点】独立性检验的应用【解析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:∵ χ2=8.026,>6.635,对照表格:故答案为:99%.16.【答案】99%【考点】独立性检验【解析】此题暂无解析【解答】解:因为K2≈7.245>6.635,所以有1−0.010=0.99即99%的把握认为“爱好该项运动与性别有关”.故答案为:99%.17.【答案】97.5%【考点】独立性检验的基本思想【解析】把观测值同临界值进行比较.得到有97.5%的把握认为“性别与喜欢数学课之间有关系”.【解答】解:∵K2≈6.06>5.024,对照表格:故答案为:97.5%.18.【答案】假【考点】独立性检验的基本思想【解析】在一个独立性检验中,我们有99%的把握认为吸烟与患肺病有关系,这一句话的意思是有有99%的把握认为这个推理是正确的,有1%的可能性认为推理出现错误,得到结果.【解答】解:从独立性检验可知,我们有99%的把握认为吸烟与患肺病有关系,这一句话的意思是有有99%的把握认为这个推理是正确的,有1%的可能性认为推理出现错误,并不是说某人吸烟,那么他有99%的可能患有肺病故答案为:假.19.【答案】②【考点】独立性检验的基本思想最小二乘法【解析】利用中位数、相关系数、K2的观测值、残差分析,即可得出结论.【解答】解:①甲乙两组数据分别为甲:28,31,39,42,45,55,57,58,66;乙:29,34,35,48,42,46,55,53,55,67,则甲乙的中位数分别为45和46+482=47,正确;②相关系数r=−0.83,表明两个变量的相关性较弱,不正确.③若由一个2×2列联表中的数据计算得K2的观测值k≈4.103,那么有95%的把握认为两个变量有关,正确.④用最小二乘法求出一组数据(x i, y i),(i=1,…,n)的回归直线方程ŷ=b̂x+â后要进行残差分析,相应于数据(x i, y i),(i=1,…,n)的残差是指e î=y i−(b̂x i+â),正确.故答案为:②.20.【答案】80,40,120,70,10,80,150,50,200【考点】独立性检验【解析】(Ⅰ)根据分层抽样原理计算并填写列联表,求出观测值,对照临界值得出结论;(Ⅱ)用列举法求出基本事件数,计算所求的概率值.【解答】(1)抽取的男性市民为120人,持支持态度的为200×75%=150人,男性公民中持支持态度的为80人,列出2×2列联表如下:所以κ2=200×(80×10−40×70)2150×50×120×80=1009≈11.11>10.828,所以在犯错误的概率不超过0.1%的前提下,可以认为性别与支持与否有关;(2)抽取的5人中抽到的男性的人数为:5×4050=4,女性的人数为:5×1050=1;记被抽取4名男性市民为A,B,C,D,1名女性市民为e,从5人中抽取的2人的所有抽法有:AB,AC,AD,Ae,BC,BD,Be,CD,Ce,De,共有10种,恰有1名女性的抽法有:Ae,Be,Ce,De,共有4种,由于每人被抽到是等可能的,。
2024年高二数学专项练习01独立性检验的基本思想及其初步应用
2024年高二数学专项练习独立性检验的基本思想及其初步应用 一、 知识讲解研究两个变量的相关关系:问题:为了解患慢性支气管炎与吸烟是否有关,进行了一次抽样调查。
共调查了339名50岁以上的人,其中吸烟者205人,不吸烟者134人. 结果是:吸烟的205人中有43人患呼吸道疾病(简称患病),162人 未患呼吸道疾病(简称未患病);不吸烟的134人中有13人患病, 121人未患病.患病 未患病 合计 吸烟 43 162 205 不吸烟 13 121 134 合计56283339独立性检验的一般步骤: 一般地,对于两个研究对象X 和Y ,X 有两类取 值:12X X 和(如吸烟与不吸烟),Y 也有两类取值:12Y Y 和(如患呼吸 道疾病与不患呼吸道疾病),得到数据如下:1X2X 合计1Y11n 12n1n + 2Y21n22n 2n +合计1n +2n +n推断“X 和Y 有关系”的步骤为:第一步,提出假设0H :两个分类变量X 和Y 没有关系; 第二步,根据2×2列联表和公式计算2χ统计量; 第三步,比对两个临界值,作出判断.二、典型例题例1 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据比较两种手术对病人又发作心脏病的影响有没有差别。
例2 在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此资料你是否认为在恶劣气候飞行中男性比女性更容易晕机?例3 在500人身上试验某种血清预防感冒作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。
问:该种血清能否起到预防感冒的作用?例4 为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的193个病人的数据,能否作出药的效果和给药方式有关的结论?分类加法计数原理与分步乘法计数原理问题1从A城市到B城市可以选择坐汽车、坐火车或者乘飞机。
数学:3.2《独立性检验的基本思想及其初步运用》测试(新人教a版选修2-3)
3.2 独立性检验的基本思想及其初步运用一、选择题1.下列说法正确的有( )①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法; ②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法; ③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;④因为由任何一观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验. A.1个 B.2个 C.3个 D.4个答案:B2.设有一个回归直线方程2 1.5y x =-,则变量x 增加1个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D.y 平均减少2个单位答案:C3.线性回归直线方程y a bx =+必过定点( ) A.(00),B.(0)x ,C.(0)y , D.()x y ,答案:D4.下列变量关系是相关关系的是( ) ①学生的学习态度与学习成绩之间的关系;②教师的执教水平与学生的学习成绩之间的关系; ③学生的身高与学生的学习成绩之间的关系; ④家庭的经济条件与学生的学习成绩之间的关系. A .①② B .①③ C .②③ D .②④答案:A5.下列变量关系是函数关系的是( ) A .三角形的边长与面积之间的关系 B .等边三角形的边长与面积之间的关系 C .四边形的边长与面积之间的关系 D .菱形的边长与面积之间的关系答案:B二、填空题6.线性回归模型y bx a e =++中,b = ,a = .答案:121()()()nii i nii xx y y xx ==---∑∑,y bx -7.我们可用相关指数2R 来刻画回归的效果,其计算公式为 .答案:22121()1()nii i n ii yy R yy ==-=--∑∑8.我们常利用随机变量2K 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验,其思想类似于数学上的 .答案:反证法9.从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为 .答案:正相关10.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表根据列联表数据,求得2K = .答案:7.469三、解答题 11.在7块面积相同的试验田上进行施化肥量对水稻产量影响的试验,得到如下表所示的一组数据(单位:kg )(1)试求y 对x(2)当施化肥量28x=kg时,预测水稻产量.解:(1) 4.75256.79y x=+;(2)389.79kg12.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:解:根据列联表中的数据,得到22189(54634032)10.76949586103K⨯⨯-⨯==⨯⨯⨯.因10.767.879>,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.解:可求出物理成绩与数学成绩的相关系数0.870.75r≈>,从而认为物理成绩与数学成绩之间具有很强的线性相关关系.而由语文成绩与数学成绩的相关系数0.092r≈远小于0.75,说明语文成绩与数学成绩不具有线性相关关系.因此,数学成绩好的同学,一般来说物理成绩也较好,它们之间的联系较紧密,而数学成绩好的同学,语文成绩也可能好,也可能差,它们之间的关系不大.教。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
独立性检验的基本思想及其初步应用练习一一、选择题1.下面是一个2×2列联表y1y2总计x1a2173x222527总计b46则表中a、bA.94、96 B.52、50 C.52、54 D.54、522.关于独立性检验的说法中,错误的是( )A.独立性检验依据小概率原理B.独立性检验原理得到的结论一定正确C.样本不同,独立性检验的结论可能有差异D.独立性检验不是判定两类事物是否相关的唯一方法3.利用独立性检验来考察两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X与Y有关系”的可信程度.如果k2>5.024,那么就有把握认为“X与Y有关系”的百分比为()A.25%B.75%C.2.5%D.97.5%二、填空题K来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的4、我们常利用随机变量2独立性检验,其思想类似于数学上的.5. 某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别专业非统计专业统计专业男13 10女7 20为了判断主修统计专业是否与性别有关系,根据表中的数据,得到(保留三位小数)三、解答题6.某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将它们的身高和体重制成2×2列联表,根据列联表的数据,可以有多大的把握认为该学校15至16周岁的男生的身高和体重之间有关系。
超重不超重合计偏高415不偏高31215合计71320独立性检验临界值表P(K2≥k0)k0一、选择题1.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到如下列联表:班级与成绩列联表优秀不优秀总计甲班113445乙班83745总计19719则随机变量2K的观测值约为()A.B.C.D.2. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.3.男女总计爱好40 20 60不爱好20 30 50总计60 50 110计算得,()22110403020207.8K⨯⨯-⨯=≈0.050 0.010 0.0013.841 6.635 10.828A.再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.再犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”二、填空题4、统计推断,当______时,说事件A 与B 有关犯错误的概率不会超过。
5.若由一个2*2列联表中的数据计算得k2=,那么有把握认为两个变量有关系三、解答题6、为考察某种药物预防禽流感的效果,进行家禽试验,调查了100只家禽,统计结果为:服用药的共有60只家禽,服用药但患病的仍有20只家禽,没有服用药且未患病的有20只家禽.(1)根据所给样本数据完成2×2列联表;(2)请问能有多大把握认为药物有效?测试题一、选择题1.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大,“ X 与Y 有关系”可信程度越小; B . k 越小,“ X 与Y 有关系”可信程度越小; C . k 越接近于0,“ X 与Y 无关”程度越小D . k 越大," X 与Y 无关”程度越大2.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如下表所示. 根据以上数据,则( )A .含杂质的高低与设备改造有关B .含杂质的高低与设备改造无关 C .设备是否改造决定含杂质的高低 D .以上答案都不对3、分类变量X 和Y 的列联表如下则下列说法正确的是( )A .xd -bc 越小,说明X 和Y 关系越弱B .xd -bc 越大,说明X 和Y 关系越强C .(xd -bc )2越大 ,说明X 和Y 关系越强 D .(xd -bc )2越接近于0 ,说明X 和Y 关系越强4、某医疗研究所为了检验新研发的流感疫苗对甲型的H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设0H : “这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出)635.6(2≥KP 01.0≈,则下列说法正确的是( )A 、这种疫苗能起到预防甲型H1N1流感的有效率为1%;B 、若某人未使用该疫苗,则他在半年中有99%的可能性得到甲型H1N1;C 、有1%的把握认为“这种疫苗不能起到预防甲型H1N1流感的作用”D 、有99%的把握认为“这种疫苗不能起到预防甲型H1N1流感的作用”5、在用独立性检验的方法检验某单位招聘行政工作人员和技术工作人员所招聘的男女人数时,得到了K 2的观测值为。
则下列说法正确的是( ) A 、因为)2.4(2≥KP=,所以说明单位在两类工作岗位上的招聘中一定存在性别歧视;B 、因为)2.4(2≥K P =,所以说明单位在两类工作岗位上的招聘中不存在性别歧视;C 、因为)2.4(2≥K P =,所以说明单位在两类工作岗位上的招聘中存在性别歧视的概率为;D 、因为)2.4(2≥K P =,所以说明单位在两类工作岗位上的招聘中存在性别歧视的嫌疑很大。
6、调查339名50岁以上人的吸烟习惯与患慢性气管炎的情况,获数据如下:不吸烟121 合计则表中b a ,处的值分别为(A 、a =248,b 值无法确定 B 、a =162 ,b =13 C 、a =162,b 值无法确定 D 、a 值无法确定,b =13 二、填空题7、为了探究50岁以上的人患慢性气管炎与吸烟有无关系时,提出的假设是 ; 8 男 女 总计爱好 40 20 60 不爱好 20 30 50 总计6050110则2K 的观测值=k(保留一位小数)9、假设有两个分类变量X 和Y ,它们的取值分别为}{21,x x 和}{21,y y ,其2×2联表为:总计 a b a+b c d c+d 总计 a+cb+da+b+c+d定义||dc b a W+-+=,则W 越 (大或小),就有利于结论“X 和Y 有关系”; W 越 (大或小),就越有利于结论“X 和Y 没有关系”;10、某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K 2≈,经查对临界值表知P(K 2≥≈.对此,四名同学作出了以下的判断:①:有95%的把握认为“这种血清能起到预防感冒的作用”; ②:若某人未使用该血清,那么他在一年中有95%的可能性得感冒; ③:这种血清预防感冒的有效率为95%; ④:这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是________.(把你认为正确的命题序号都填上) 三、解答题11.某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下列联表:生产线与产品合格数列联表合格 不合格总计甲线97 3 100乙线95 5 100总182计 92 00请问甲、乙两线生产的产品合格率在多大程度上有关系?12.在对人们的休闲方式的一次调查中,共调查了120人,其中女性60人,男性60人。
女性中有40人主要的休闲方式是看电视,另外20人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外40人主要的休闲方式是运动。
(1)根据以上数据建立一个2×2的列联表; (2)判断性别与休闲方式是否有关系。
13、为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者 男女需要 40 30 不需要160270(1)建立一个2×2的列联表;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?参考答案练习一参考答案1、C 解析:∵a+21=73,∴a=52.又∵a+2=b ,∴b=54.2、B 解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有失误,不是一定正确.3、D 解析:由表可知,因为P(024.52≥K )=,所以“X 与Y 有关系”的百分比为=97.5%。
4、反证法5、 解析:由公式844.430202723)7102013(502≈⨯⨯⨯⨯-⨯⨯=k 6、解:根据公式))()()(()(2d b c a d c b a bc ad n k ++++-=,代入数据可求得:k =,根据独立性检验临界值表可知P(K 2≥=,所以我们有%的把握认为该校15至16周岁的男生的身高和体重之间有关系.练习二参考答案1、A 解析:由K =60.071194545)3483711(902≈⨯⨯⨯⨯-⨯⨯ 解析:A 、B 都是对K 2的观测值的错误理解。
3、C 解析:因为010.0)8.7(2=≥KP ,所以说有99%以上的把握认为“爱好该项运动与性别有关”。
4、635.62>K 解析:当635.62>K 时,就有99 %的把握说事件A 与B 有关,即犯错误的概率不会超过. 5. 95% 解析:查表得知。
6、解:(1)(2)假设H 0:服药与家禽得禽流感没有关系,K 2=40604060)20202040(100⨯⨯⨯⨯-⨯⨯≈,由于P(K 2≥=,所以大概有90%的把握认为药物有效.测试题参考答案解析:因为k 越小,“ X 与Y 有关系”可信程度越小;因为k 越大,“ X 与Y 有关系”可信程度越大; 2、A 解析:由已知数据得到如下2×2列联表杂质高 杂质低 合计 旧设备 37 121 158 新设备 22 202 224 合计59323382因为37×202=5454,22× 3、C 解析:因为| xd -bc |趆大,说明X 和Y 关系越强。
4、D 解析:)635.6(2≥KP 01.0≈说明“这种疫苗不能起到预防甲型H1N1流感的作用”的概率,所以说有99%的把握认为“这种疫苗不能起到预防甲型H1N1流感的作用”。
5、D 解析:根据独立性检验,当K 2的观测值为时,有95%的把握认为两个分类变量有关系,在本题中单纯从这点讲,该单位在招聘工作中存在性别歧视的嫌疑很大,其概率高达95%,但即使这样也不能100%就肯定该单位招聘中存在性别歧视.另一方面,由于男女在选择工作岗位上的心理不同,也会造成各个岗位招聘人数的差异,导致计算的K 2的观测值过大,因此单纯从这个计算结果不能作出该单位在两类工作岗位上的招聘中一定存在性别歧视的结论.6、B 解析:a =205—43=162,b =339-205-121=13。