独立性检验例题
独立性检验(历年高考)练习题

独立性检验(历年高考)练习题1.为了研究某班学生打篮球的喜好与性别是否相关,对60名学生进行了问卷调查,得到了如下的2×2列联表。
现在有以下问题需要解决:I)在喜欢打篮球的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述抽样的6人中,恰好有一名女生的概率是多少?III)是否可以有95%的把握认为喜欢打篮球与性别有关?请说明理由。
临界值表如下:2.2014年山东省第二十三届运动会将在济宁举行,为了调查该市某校高中生是否愿意提供志愿者服务,使用简单随机抽样的方法对50名学生进行了调查,结果如下:I)在愿意提供志愿者服务的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述6人中,恰好有一名女生的概率是多少?III)可以有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关吗?临界值表如下:3.为了研究某市学生的百米跑成绩,按照男女比例随机抽取了50名学生进行测试,测试结果显示所有学生的成绩都在13秒到18秒之间。
将测试结果按照以下方式分成了五组:第一组:[13,14)第二组:[14,15)第三组:[15,16)第四组:[16,17)第五组:[17,18]以下是按照上述分组方法得到的频率分布直方图:现在有以下问题需要解决:1)设m和n表示从第一组和第五组的所有学生中任意抽取的两名学生的百米测试成绩,即m,n∈[13,14)∪[17,18),求事件“m-n>2”的概率;2)根据规定,成绩小于16秒为达标。
如果男女生使用相同的达标标准,则男女生达标情况如下表:现在需要完成上表,并根据上表数据,判断是否可以有99%的把握认为“体育达标与性别有关”。
参考公式:nad-bc)K=,其中n=a+b+c+d。
a+b)(c+d)(a+c)(b+d)临界值表如下:。
独立性检验练习题

独立性检验练习题一、选择题1 •对长期吃含三聚氰胺的婴幼儿奶粉与患肾结石这两个分类变量的计算中,下列说法正确的是()2A. 若K的值大于6.635,我们有99%的把握认为长期吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,那么在100个长期吃含三聚氰胺的三鹿奶粉的婴幼儿中必有99人患有肾结石病;B. 从独立性检验可知有99%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系时,我们说某一个婴幼儿吃含三聚氰胺的三鹿婴幼儿奶粉,那么他有99%的可能患肾结石病;C. 若从统计量中求岀有95%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,是指有5%的可能性使得推判岀现错误;D. 以上三种说法都不正确。
根据上述数据,试问色盲与性别关系是( )A.相互独立B.不相互独立A. 0.4B. 0.5C. 0.75D. 0.85二、填空题24. 通过计算高中生的性别与喜欢唱歌列联表中的数据,得到K ■ 4.9 8并且已知2P(K -3.841) : 0.05,那么可以得到的结论是 _____________________________________________5•下面是一个2X 2列联表则三、计算题7.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:独立性检验练习题参考答案-、选择题1 • C对于A,若K2的值为6.635,我们有99%的把握认为吃含三聚氰胺的三鹿奶粉的婴幼儿与患肾结石有关系,但在100个吃含三聚氰胺的三鹿婴幼儿奶粉婴幼儿中未必有99人患有肺病;对于B同样不成立,C是正确的,故选C.2. B k =27.139 10,828,所以的99.9%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立.心 2 90(20 汉27— 25 182 729000 “、心亠八钿舟3. B计算K20.18218623 ::: 2.706可知,没有充分理由45 汶45 疋38 乂52 4001400说明成绩与班级有关系”,即成绩的优秀与不优秀”与班级是相互独立的,所以估计成绩与班级有关系”犯错误的概率约是0.5.二•填空题4 •有约95%以上的把握认为性别与喜欢唱歌之间有关系”5. 26,44因为a+42=68,b+54=68+30,所以a=68-42=26,b=68+30-54=44三、解答题7.解:根据列联表中的数据,得到K2」89 (54 63一4°彳2)? =10.76 .94 汉95^86003因10.76 7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.。
独立性检验练习含答案

§1.1 独立性检验一、基础过关1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥k ) 0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是________.①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100则有________的把握确定吸烟量与年龄有关. 二、能力提升6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业 性别非统计专业统计专业 合计 男 13 10 23 女 7 20 27 合计203050为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. 8.下列说法正确的是________.(填序号)①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效 有效 总计 男性患者 15 35 50 女性患者 6 44 50 总计2179100设H 0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计 教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.三、探究与拓展12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数9261 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数297185159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数766218(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.答案1.90% 2.16.373 3.③ 4.③ 5.99.9% 6.5% 7.2 8.② 9.4.882 5%10.解 由公式得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=71×(12×24-25×10)237×34×22×49≈0.08.∵χ2<2.706.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关. 由公式得χ2=830×(52×218-466×94)2146×684×518×312≈54.21.因为54.21>10.828.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×(5×22-50×9)255×31×14×72≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性. 12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%. (2)甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计5005001 000由列联表中的数据,得χ2=1 000×(360×180-320×140)2680×320×500×500≈7.353>6.635.所以有99%的把握认为“两个分厂生产的零件的质量有差异”.Welcome To Download !!!欢迎您的下载,资料仅供参考!。
独立性检验习题及答案

1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系.解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
独立性检验—高考真题

独立性检验—高考真题一、解答题二、解答题1.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g ).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成如下列联表m <m≥对照组试验组(ⅱ)根据(i )中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:()()()()22()n ad bc K a b c d a c b d -=++++,()2P K k ≥0.1000.0500.010k2.7063.841 6.6352.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.0500.0100.001k 3.841 6.63510.8283.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.010 0.001k 3.841 6.63510.8284.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.8285.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:P(2K k ≥)0.0500.0100.001k 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++6.甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A 24020B 21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k 0.1000.0500.010k2.7063.841 6.635参考答案:1.(1)19.8(2)(i)23.4m=;列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得23.4m=,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:1(7.89.211.412.413.215.516.518.018.819.219.820.220+++++++++++39621.622.823.623.925.128.232.336.5)19.820++++++++==(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位为23.2,第21位数据为23.6,所以23.223.623.42m+==,故列联表为:m<m≥合计对照组61420试验组14620合计202040(ii)由(i)可得,2240(661414)6.400 3.84120202020K⨯⨯-⨯==>⨯⨯⨯,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 2.(1)75%;60%;(2)能.【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075%200=,乙机床生产的产品中的一级品的频率为12060%200=.(2)()22400150801205040010 6.63527013020020039K ⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.3.(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量好3337空气质量不好228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.5.(1)7014%500=,(2)有99%的把握(3)见解析【详解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为7014% 500=(2)22500(4027030160)9.96720030070430K⨯⨯-⨯==⨯⨯⨯.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.6.(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K ,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A 共有班次260次,准点班次有240次,设A 家公司长途客车准点事件为M ,则24012()26013==P M ;B 共有班次240次,准点班次有210次,设B 家公司长途客车准点事件为N ,则210()27840==P N .A 家公司长途客车准点的概率为1213;B 家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。
专题08 独立性检验(解析版)

概率与统计专题08 独立性检验常见考点考点一独立性检验典例1.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,分8个指标对这两款车型进行了综合评测打分(满分:5分),如图所示:(1)求综合评测分数的平均值;从上图8个指标中任选1个,求指标分数为4.93的概率;(2)老李对两款车型的车主的性别作了统计,得到数据如下2×2列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关.附:()()()()22()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.)20 k【答案】(1)平均值为4.79,38(2)列联表见解析,有99.9%的把握认为喜欢哪款车型和性别有关.【解析】【分析】(1)根据平均数的计算公式求得综合评测分数的平均值;根据古典概型的概率公式即可求得指标分数为4.93的概率;(2)根据表中数列可算出需要补充的数据;计算出2K的值,和题中已知的表格数据相比较,可得答案.(1)平均值为4.69 4.89 4.80 4.93 4.56 4.93 4.59 4.9338.324.7988 +++++++==,8个指标中分数为4.93的指标有3个,故从8个指标中任选1个,指标分数为4.93的概率为38;(2)由于()221405545152526.2510.82070708060K⨯⨯-⨯==>⨯⨯⨯,所以有99.9%的把握认为喜欢哪款车型和性别有关.变式1-1.数字人民币是由中国人民银行发行的数字形式的法定货币,由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.为了进一步了解普通大众对数字人民币的认知情况,某机构进行了一次问卷调查,统计结果如下:(1)如果将高中及以下学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)根据(1)中所得列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析(2)没有【解析】【分析】(1)根据题中数据,填写列联表即可;(2)由22()()()()()n ad bcKa b c d a c b d-=++++,根据列联表数据计算,与临界值比较即可(1)完成的22⨯列联表如下:(2)根据列联表得:22800(150275125250)8003.463 3.841275525400400231K⨯⨯-⨯==≈<⨯⨯⨯,故没有95%的把握认为“是否了解数字人民币”与“学历高低”有关.变式1-2.某校开展党史知识竞赛.现从参加竞赛活动的学生中随机抽取了n名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(1)求a的值;(2)估计这n名学生的平均成绩(同一组中的数据用该组区间的中点值为代表);(3)活动规定:竞赛成绩位于60分以下为不及格,不低于80分为“优秀”,若抽取的学生中成绩不及格的有15人.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)0.025a = (2)74(3)列联表答案见解析,没有99.9%的把握认为“比赛成绩是否优秀与性别有关” 【解析】 【分析】(1)根据频率直方图的特征可知所有的频率之和为1,列出方程,解方程即可; (2)根据频率直方图,利用每组的组中值乘以对应的频率,加起来即可;(3)根据题意补充列联表,利用卡方的计算公式求出2K ,结合表中的数据即可得出结论. (1) 由题可得(0.0050.0100.0200.0300.010)101a +++++⨯=,解得0.025a =.(2)平均成绩为:450.05550.1650.2750.3850.25950.174⨯+⨯+⨯+⨯+⨯+⨯=, (3)∵不及格的人数为15人, ∴抽取的总人数为151000.15n ==, ∴比赛成绩优秀的有1000.3535⨯=人, 由此可得完整的2×2列联表:22100(10252540)9.89010.82835655050K ⨯-⨯=≈<⨯⨯⨯.∴没有99.9%的把握认为“比赛成绩是否优秀与性别有关”变式1-3.某科研机构为了研究喝酒与糖尿病是否有关,对该市30名成年男性进行了问卷调查,并得到了如下列联表,规定“”平均每天喝100mL 以上的”为常喝.已知在所有的30人中随机抽取1人,患糖尿病的概率为4 .(1)请将上表补充完整,并判断是否有99.5%的把握认为糖尿病与喝酒有关?请说明理由;(2)已知常喝酒且有糖尿病的6人中恰有两名老年人,其余为中年人,现从常喝酒且有糖尿病的这6人中随机抽取2人,求恰好抽到一名老年人和一名中年人的概率.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)列联表答案见解析,有99.5%的把握认为糖尿病与喝酒有关(2)8 15【解析】【分析】(1)根据题中信息完善22⨯列联表,计算出2K的观测值,结合临界值表可得出结论;(2)设两名老年人分别为a、b,其余四名中年人为c、d、e、f,列举出所有的基本事件,并确定所求事件所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.(1)解:由题意知430815⨯=,所以,糖尿病患者共有8名,其中不常喝酒的有862-=名,则22⨯列联表如下:由表中的数据可得()2230618428.5237.8791020822K ⨯⨯-⨯=≈>⨯⨯⨯, 因此,有99.5%的把握认为糖尿病与喝酒有关. (2)解:设两名老年人分别为a 、b ,其余四名中年人为c 、d 、e 、f ,则所有可能出现的结果有(),a b 、(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f 、(),c d 、(),c e 、(),c f 、(),d e 、(),d f 、(),e f ,共15种,其中事件“有一名老年人和一名中年人”包含的结果有:(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f ,有8种,因此,恰好抽到一名老年人和一名中年人的概率815P =. 典例2.2021年9月3日,教育部召开第五场金秋新闻发布会,会上发布了第八次全国学生体质与健康调研结果.根绝调研结果数据显示,我国大中小中学的健康情况有了明显改善,学生总体身高水平也有所增加.但同时在超重和肥胖率上,中小学生却有一定程度上升,大学生整体身体素质也有所下滑.某市为调研本市学生体质情况,采用按性别分层抽样的方法进行调查,得到体质测试样本的统计数据(单位:人)如下:附:()()()()()22n ad bc K a b c d a c b d -=++++.(1)根据所给数据,完成下面22⨯列联表,并据此判断:能否有95%的把握认为该市学生体质测试是否达标与性别有关.(注:体质测试成绩为优秀、良好或及格则体质达标,否则不达标)(2)体质测试成绩为优秀或良好则称体质测试成绩为优良,以样本数据中男、女生体质测试成绩优良的频率视为该市男、女生体质测试成绩优良的概率,在该市学生中随机选取2名男生,2名女生,设所选4人中体质测试成绩优良人数为X ,求X 的分布列及数学期望. 【答案】(1)表格见解析,没有; (2)分布列见解析,76. 【解析】 【分析】(1)完成列联表,再利用独立性检验求解;(2)由题得X 的所有可能取值为0,1,2,3,4,再求出对应的概率,即得分布列和期望. (1)解:由题得22⨯列联表如下:()22160108012084012019202409601200k ⨯-⨯=⨯⨯⨯27 3.375 3.8418==< ∴没有95%的把握认为该市学生体质达标与性别有关.(2)解:由题意男生体质测试优良率114P =,女生体质测试优良率213P =.X 的所有可能取值为0,1,2,3,4.()02202213121044334P X C C ⎛⎫⎛⎫⎛⎫⎛⎫=== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭()110202111001222213121312514433443312P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()200202201111200211222222131213121312372443344334433144P X C C C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==++=⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()201111202112222213121312534433443372P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()202022221312144433144P X C C ⎛⎫⎛⎫⎛⎫⎛⎫===⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭X ∴的分布列为:()153751701234412144721446E X ∴=⨯+⨯+⨯+⨯+⨯=.变式2-1.第24届冬季奥林匹克运动会将于2022年2月4日至20日在北京举行.践行“绿色奥运、科技奥运、人文奥运”理念,举办一届“有特色、高水平”的奥运会,是中国向世界的庄严承诺.为宣传北京冬奥会,某市开展了冬奥知识竞答活动.从参与的市民中随机抽取100人,统计他们的竞答成绩得到下面的列联表(单位:人).(1)完成列联表,并根据列联表判断是否有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关?(2)将频率视为概率,从该市所有参与冬奥知识竞答的市民中随机抽取10人赠送礼品,记其中成绩合格的人数为随机变量X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(1)列联表答案见解析,有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关(2)期望7,方差2.1 【解析】 【分析】(1)根据已知数据可得列联表,计算2K 后可得结论;(2)由题意得()~10,0.7X B ,由二项分布的期望公式和方差公式计算可得. (1)完成列联表(单位:人):由列联表,2K 的观测值()2100402010301004.762 3.8415050703021k ⨯⨯-⨯==≈>⨯⨯⨯,∴有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关. (2)从参与的市民中随机抽取100人,有70人竞答成绩合格,所以成绩合格的频率为0.7,将频率视为概率,从该市所有参与活动的市民中随机抽取一人,恰好抽到成绩合格的市民的概率为0.7, 由题意知()~10,0.7X B ,∴随机变量X的数学期望()100.77E X=⨯=,方差()100.70.3 2.1D X=⨯⨯=.变式2-2.从某地区高中二年级学生中随机抽取质量监测数学得分在120分以下和120分以上(含120分)的学生各250名作为样本(全体高二学生均参加监测),分别测出他们的注意力集中水平得分,统计如下表.(1)若将学生在质量监测中数学得分在120分以上(含120分)定义为数学成绩优秀,将学生注意力集中水平得分在500分以上(含500分)称为注意力集中水平高;试问:能否有99%以上的把握认为数学成绩优秀与注意力集中水平高有关?(2)若将上述样本的频率视为概率,现从该地区所有高二学生中随机抽取100人,设抽取到的数学得分在120分以上(含120分)且注意力集中水平得分在500分以上(含500分)的人数为随机变量X,求X的数学期望.(()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【答案】(1)有99%以上的把握认为数学成绩优秀与注意力集中水平高有关;(2)()E X=36.【解析】【分析】(1)根据表格中的数据,代入求观测值公式,求出观测值同临界值进行比较即可得出结论;(2)根据二项分布期望计算公式,计算出数学期望.(1)由22⨯列联表中数据计算可得,2K 的观测值为()25001007015018051.948 6.635250250280220k ⨯⨯-⨯=≈>⨯⨯⨯所以能有99%以上的把握认为数学成绩优秀与注意力集中水平高有关. (2)从22⨯列联表可知,数学得分在120分以上(含120分) 且注意力集中水平得分在500分以上(含500分)的频率为=180950025, 由题意知,XB ⎛⎫ ⎪⎝⎭910025,所以()E X =⨯=91003625.变式2-3.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,对市场上这个品牌汽车车主的性别情况进行了调查统计. (1)统计数据得到如下22⨯列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关; (2)若两款汽车的操控性能优秀率均为23,动力性能优秀率均为34,老李又对这两款车型进行操控性能和动力性能测试(假设进行的各项测试之间互相不影响),求两款车型的这两项测试中恰有2项指标优秀的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表见解析,有 (2)37144【解析】 【分析】(1)按照独立性检验公式进行计算即可;(2)分别计算两款操控性能优秀、两款动力性能优秀、一款操控性能优秀一款动力性能优秀的概率,相加求和即可. (1)男:55 80 女:45合计:70 140(列出表格也得分,其他形式答案正确即可得分)由于()221405545152707526.2510.08086082K ⨯⨯⨯-⨯=⨯>⨯=,所以有99.9%的把握认为喜欢哪款车型和性别有关. (2)记Y 表示混动版测试指标优秀的项目数,Z 表示纯电动版测试指标优秀的项目数,则“两款车型这两项测试中恰有2项指标优秀”的概率为()()()()20,21,12,0P Y Z P Y Z P Y Z P Y Z +====+==+== ()()()()()()021120P Y P Z P Y P Z P Y P Z ===+==+==223232323232337111111343434343434144⎡⎤⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯-⨯⨯+⨯-+-⨯+⨯⨯-⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎣⎦.巩固练习练习一 独立性检验1.每年的六、七月份,我国长江中下游地区进入梅雨季节,如图是江南某镇2012~2021年梅雨季节的降雨量(单位:mm )的频率分布直方图.(1)请用样本平均数估计该镇明年梅雨季节的降雨量;(2)该镇某杨梅种植户统计了他种植的某品种杨梅在2012~2021年的亩产量(单位:kg ),得到如下22⨯列联表(部分数据缺失),依据0.1α=的独立性检验,能否认为该品种杨梅的亩产量与降雨量有关?(完善列联表,并说明理由) 单位:年【答案】(1)280mm(2)表格见解析,认为该品种杨梅的亩产量与降雨量有关 【解析】 【分析】(1)先求出降雨量在[]400,500内的频率,再根据频率直方图求平均数的计算公式直接计算即可; (2)先求出降雨量在[)200,400内的频数,再补全列联表,根据卡方的计算公式求出2χ,利用独立性检验的思想即可得出结论. (1)样本中降雨量在[]400,500内的频率为()11000.0020.0040.0030.1-⨯++=, 所以样本平均数为1500.22500.43500.34500.1280⨯+⨯+⨯+⨯=,所以该镇明年梅雨季节的降雨量约为280mm . (2)根据频率分布直方图可知,降雨量在[)200,400内的频数为()101000.0030.0047⨯⨯+=. 补全22⨯列联表如下: 单位:年则()220.1101162 2.744 2.7067373x χ⨯⨯-⨯=≈>=⨯⨯⨯.所以根据小概率值0.1α=的独立性检验,认为该品种杨梅的亩产量与降雨量有关.2.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm×60cm×100cm ,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如下数据:(1)请完成如下的2×2列联表,依据0.05α=的独立性检验,能否认为托运行李重量与乘客乘坐的机舱等级有关? 单位:人(2)调研小组为感谢参与调查的旅客,决定从托运行李重量超出免费行李额且不超出10kg 的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补助券”,记赠送的补助券总金额为X 元,求X 的分布列与均值. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)表格见解析,在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)分布列见解析,16007【解析】 【分析】(1)依据独立性检验的概念,先计算,再进行判断即可.(2)依题意,行李重量超出免费行李额且不超出10kg 的旅客共7人,先明确随机变量X 的取值,然后利用超几何分布列出分布列. (1)补全2×2列联表如下: 单位:人假设0H 为:托运行李重量与乘客乘坐的机舱等级无关. 根据列联表中的数据,经计算得到()220.0510******* 5.499 3.84190105545x χ⨯⨯-⨯=≈>=⨯⨯⨯,根据小概率值0.05α=的独立性检验,我们推断0H 不成立,即在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)根据题意可得,托运行李重量超出免费行李额且不超过10kg 的旅客有7人,从中随机抽取4人,则其中女性旅客的人数可能为1,2,3,4,所以X 的所有可能取值为100,200,300,400,()134347C C 4100C 35P X ===,()224347C C 18C 20350P X ===,()314347C C 12300C 35P X ===,()404347C C 1400C 35P X ===,则X的分布列为故()41812110020030040035353535E X =⨯+⨯+⨯+⨯=16007. 3. “双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t (百元)的频率分布直方图如图1所示:(1)利用图1,求网民消费金额t的平均值t和中位数t;(2)把下表中空格里的数填上,能否有90%的把握认为网购消费与性别有关.t tt t<合计附表:P(χ2≥k0)参考公式:χ2=2()()()()()n ad bca b c d a c b d-++++.【答案】(1)11.5t=,010t=(2)列联表见解析,没有【解析】【分析】(1)根据平均数的定义求平均数,由于前2组的频率和恰好为0.5,从而可求出中位数,(2)根据频率分布表结合已知的数据计算完成列联表,然后计算χ2公式计算χ2,再根据临界值表比较可得结论(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值为2.50.27.50.312.50.217.50.1522.50.127.50.0511.5t=⨯+⨯+⨯+⨯+⨯+⨯=0.频率直方图中第一组、第二组的频率之和为0.0450.0650.5⨯+⨯=,∴中位数010t=;(2)把下表中空格里的数填上,得列联表如下;0 t t0 t t<合计计算22100(25302520)1001.012.7064555505099χ⨯⨯-⨯==≈<⨯⨯⨯,所以没有90%的把握认为网购消费与性别有关.4.网课是一种新兴的学习方式,它以互联网为平台,为学习者提供包含视频、图片、文字等多种形式的系列学习课程,由于具有方式多样,灵活便捷等优点,成为许多学生在假期实现自主学习的重要手段.为了调查A地区高中生一周网课学习的时间,随机抽取了500名上网课的学生,将他们一周上网课的时间(单位:h)按[1,6),[6,11),[11,16),[16,21),[21,26]分组,得到频率分布直方图如图所示.(1)求a的值,并估计这500名学生一周上网课时间的平均数(同一组中的数据用该组区间的中点值代表);(2)为了了解学生与家长对网课的态度是否具有差异性,研究人员随机抽取了200人调查,所得数据统计如下表所示,判断是否有99.5%的把握认为学生与家长对网课的态度具有差异性.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)0.03,13.35; (2)有 【解析】 【分析】(1)根据频率分布直方图各小矩形的面积之和为1求解,再利用平均数的定义求解; (2)根据列联表求得2K 的值,再与临界值表对照下结论. (1)解:因为()0.0220.050.0751a +++⨯=, 所以0.03a =,平均数为7172737470.0250.0550.0750.0350.03513.3522222⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=; (2)因为2250(30505070)87.87980120100100K ⨯⨯-⨯=≈>⨯⨯⨯, 所以有99.5%的把握认为学生与家长对网课的态度具有差异性.5.2022年2月1日是春节,百节年为首,春节是中华民族最隆重的传统佳节,它不仅集中体现了中华民族的思想信仰、理想愿望、生活娱乐和文化心理,而且还是祈福攮灾、饮食和娛乐活动的狂欢式展示.为调查某地从外地工作回来过年的市民(以下称为“返赣人员”)人数情况,现对某一区域的居民进行抽样调查,并按年龄(单位:岁)分成五组,得到如图所示的频率分布直方图,其中年龄在[20,25)内的人数为10.(1)请根据样本数据补充完成22⨯列联表,并判断是否有99.9%的把握认为是否是从外地回来过年与性别相关;(2)据了解,该地区今年返赣人员占14.现从该社区居民中随机抽取3人进行调查,记X为这3人中今年是返赣人员的人数,求X的分布列与数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:【答案】(1)列联表见解析,有99.9%的把握认为是否是从外地回来过年与性别相关(2)分布列见解析,3()4E X=【解析】【分析】(1)由题意可得列联表,根据表格中的数据,代入公式,求出观测值同临界值进行比较即可得出结论;(2)根据独立重复试验概率计算公式,计算出概率可得分布列并求得数学期望.(1)由频率分布直方图可知年龄在[20,25)上的占比为1(0.0220.060.075)50.125-⨯++⨯=,根据已知人数为10计算可得总人数为80,列联表如下:∴22280(25301510)8060011.42910.82835454040354516100⨯⨯-⨯⨯==≈>⨯⨯⨯⨯⨯⨯K , 所以有99.9%的把握认为是否是从外地回来过年与性别相关. (2)X 的取值可为0,1,2,3,3327(0)464P X ⎛⎫=== ⎪⎝⎭,21133127(1)4464⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭P X C , 1223319(2)4464⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭P X C ,311(3)464P X ⎛⎫=== ⎪⎝⎭. 故分布列为:于是2727483()01239646464646414E X =⨯+⨯+⨯+⨯==. 6.受新冠肺炎疫情的影响,各地推出务工人员就地过年的鼓励政策.某市随机抽选了100名男务工人员和100名女务工人员,调查他们是否有就地过年的意愿,结果如下:(1)能否有99.9%的把握认为务工人员就地过年的意愿与性别有关?(2)若用频率估计概率,从该市所有女务工人员中随机抽取3人进行深入调查,X 表示抽取的女务工人员无就地过年的意愿的人数,求X 的分布列与数学期望.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)没有99.9%的把握认为务工人员就地过年的意愿与性别有关 (2)分布列见解析,数学期望为65【解析】 【分析】(1)计算出2χ后比较临界值可得结论;(2)由于2~3,5X B ⎛⎫⎪⎝⎭,由二项分布可得分布列,由二项分布的期望计算出期望.(1)22200(80402060)9.52410.82810010014060χ⨯⨯-⨯=≈<⨯⨯⨯,故没有99.9%的把握认为务工人员就地过年的意愿与性别有关. (2)由题意可知2~3,5X B ⎛⎫⎪⎝⎭.所以X 的取值范围是{0,1,2,3},3032227(0)C 155125P X ⎛⎫⎛⎫==-=⎪⎪⎝⎭⎝⎭, 12132254(1)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 21232236(2)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 3033228(3)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 所以X 的分布列为所以26()355E X =⨯=.7.2021年1月以来,教育部相继出台文件,对中小学生手机、睡眠、读物、作业、体质管理作出规定.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所需时间进行统计,部分数据如下表: 单位:人(1)求x ,y ,z 的值,并根据题中的列联表,依据小概率值0.05α=的独立性检验,判断是否可以认为完成作业所需时间在90分钟以上与性别有关;(2)学校从完成作业所需时间在90分钟以上的学生中用分层随机抽样的方法抽取9人了解情况,甲老师再从这9人中选取3人进行访谈,求甲老师选取的3人中男生人数大于女生人数的概率. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)100x =,80y =,140z =,不能认为完成作业所需时间在90分钟以上与性别有关; (2)1742. 【解析】 【分析】(1)求出x ,y ,z 的值,作出列联表,再利用独立性检验求解;(2)利用古典概型和互斥事件的概率求解. (1)解:由80180x +=可得100x =;由80160y +=可得80y =;由80220z +=可得140z =. 所以2×2列联表如下:()224008014010080 2.694 3.841180220160240χ⨯⨯-⨯=≈<⨯⨯⨯,所以依据小概率值0.05α=的独立性检验,不能认为完成作业所需时间在90分钟以上与性别有关. (2)解:抽取的9人中,男生有8094180⨯=(人),女生有10095180⨯=(人),从这9人中选取3人进行访谈,男生人数大于女生人数的情况分为:①男生2人,女生1人;②男生3人,女生0人.所以所求概率2134543399C C C 17C C 42P =+=.8.2022年是奥运会,我国北京和张家口联合承办第二十四届冬季奥运会,本届冬奥会共设7个大项(滑雪、滑冰、冰球、冰壶、雪车、雪橇、冬季两项)、15个分项(高山滑雪、自由式滑雪、单板滑雪、跳台滑雪、越野滑雪、北欧两项、短道速滑、速度滑冰、花样滑冰、冰球、冰壶、雪车、钢架雪车、雪橇、冬季两项)共计109个小项.某校为了调查学生是否喜欢冬季冰雪运动与性别有关,在高三年级特选取了200名学生进行了问卷调查,得到如下的22⨯列联表:已知从这200名学生中随机抽取1人,这个人喜欢冰雪运动的概率为0.8,表格中100a=,20d=.(1)完成22⨯列联表,并判断是否有90%的把握认为喜欢冰雪运动与性别有关;(2)从上述喜欢冰雪运动的学生中用分层抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用X表示3人中女生的人数,求X的分布列及数学期望.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关(2)分布列见解析,9 8【解析】【分析】(1)从这个人喜欢冰雪运动的概率为0.8,可以推算出200人中喜欢冰雪运动的总人数,进而可以完成表格;(2)按照分层抽样的原理算出8人中男生和女生的人数,进而确定X的可能取值,按照组合的方法即可算出分布列.(1)由题可知,从200名学生中抽取1人,这个人喜欢冰雪运动的概率为0.8,故喜欢冰雪运动的有2000.8160⨯=人,不喜欢冰雪运动的有20016040-=人,即100a=,60b=,20c=,20d=,22⨯列联表如下:()22200100206020 2.083 2.711604012080K ⨯-⨯=≈<⨯⨯⨯,故没有90%的把握认为是否喜欢冰雪运动与性别有关; (2)按分层抽样,设抽取女生x 名,男生y 名,816060100x y ==,解得3x =,5y =, 即抽取的8人中喜欢冰雪运动的女生有3人,男生有5人, 故X 0=,1,2,3,()3538C 50C 28P X ===,()123538C C 151C 28P X ===,()213538C C 152C 56P X ===,()3035381356C C C P X ===,X 的分布列如下:()51515190123282856568E X =⨯+⨯+⨯+⨯=; 故答案为:列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关; 分布列见解析,98.。
高中数学独立性检验精选题

独立性检验精选题26道一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,则下列说法正确的是()已知在全部105人中随机抽取1人,成绩优秀的概率为27A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++据此表,可得()A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%6.如表是一个22⨯列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,527.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.309.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:22()()()()()n a d b cKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130B.190C.240D.25010.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b cKa b c d a c b d-=++++A.12B.11C.10D.1811.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .1814.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法.正确的是()参考公式及数据:22()6.109()()()()n a d b c K a b c d a c b d -=≈++++附表:A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 15.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()A .B .C .D .16.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”⋯⋯小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下22⨯列联表:临界值表并计算得到219.05K ≈,下列小波对地区A 天气判断不正确的是()A .夜晚下雨的概率约为12B .未出现“日落云里走”夜晚下雨的概率约为514C .有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D .出现“日落云里走”,有99.9%的把握认为夜晚会下雨 17.有关独立性检验的四个命题,其中不正确的是()A .两个变量的22⨯列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大B .对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越小C .从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病D .从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关18.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是()A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大.B .k 越大,“患胃病与生活不规律有关系”的可信程度越小.C .若计算得23.918K ≈,经查临界值表知2( 3.841)0.05P K ≈…,则在100个生活不规律的人中必有95人患胃病.D .从统计量中得知有95%的把握认为患胃病与生活不规律有关,是指有5%的可能性使得推断出现错误. 二.填空题(共3小题)19.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下22⨯列联表(部分数据缺失):表中a的值为;计算可知,在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式:22()()()()()n a d b cKa b c d a c b d-=++++,n a b c d=+++.参考数据:20.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++根据上表,有的把握认为“小动物是否被感染与服用疫苗有关”21.某学生为了研究高二年级同学的体质健康成绩与学习成绩的关系,从高二年级同学中随机抽取30人,统计其体质健康成绩和学习成绩,得到22⨯列联表如表:有 的把握认为学生的体质健康成绩高低与学习成绩高低有关. 附:22()()()()()n a d b c Ka b c d a c b d -=++++.三.解答题(共5小题)22.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)m in 绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n a d b c Ka b c d a c b d -=++++,23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)k g ,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n a d b c K a b c d a c b d -=++++.24.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n a d b cKa b c d a c b d-=++++.25.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:22()()()()()n a d b cKa b c d a c b d-=++++.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n a d b c Ka b c d a c b d -=++++独立性检验精选题26道参考答案与试题解析一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于6.635,得到有99%以上的把握认为“爱好这项运动与性别有关”.【解答】解:由题意算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.7.8 6.635>,∴有0.011%=的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”故选:C.【点评】本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【分析】根据条件中所给的观测值,同题目中节选的观测值表进行检验,得到观测值对应的结果,得到结论有99%以上的把握认为“爱好该项运动与性别有关”.【解答】解:由题意知本题所给的观测值,2 2110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯7.8 6.635>,∴这个结论有0.011%=的机会说错,即有99%以上的把握认为“爱好该项运动与性别有关”故选:A.【点评】本题考查独立性检验的应用,考查对于观测值表的认识,这种题目一般运算量比较大,主要考查运算能力,本题有所创新,只要我们看出观测值对应的意义就可以,是一个基础题.3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%【分析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:2 6.705 6.635K=>,对照表格:∴有99%的把握说学生性别与支持该活动有关系,∴有1%的把握说学生性别与支持该活动没有关系,故选:C.【点评】本题考查独立性检验知识,难度不大,属于基础题.4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是() A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得c和b的值;再根据公式计算相关指数2K的值,比较与临界值的大小,判断“成绩与班级有关系”的可靠性程度.【解答】解:成绩优秀的概率为27,∴成绩优秀的学生数是2105307⨯=,成绩非优秀的学生数是75,20c∴=,45b=,选项A、B错误.又根据列联表中的数据,得到2105(10302045)26.109 3.84155503075K ⨯⨯-⨯=≈>⨯⨯⨯,因此有95%的把握认为“成绩与班级有关系”, 故选:C .【点评】本题考查了独立性检验思想方法,熟练掌握列联表个数据之间的关系及相关指数2K 的计算公式是解题的关键.5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b c Ka b c d a c b d -=++++据此表,可得( )A .认为机动车驾驶技术与性别有关的可靠性不足50%B .认为机动车驾驶技术与性别有关的可靠性超过50%C .认为机动车驾驶技术与性别有关的可靠性不足60%D .认为机动车驾驶技术与性别有关的可靠性超过60% 【分析】由表中数据计算观测值,对照临界值得出结论. 【解答】解:由表中数据,计算22100(40103515)0.33670.45555457525K⨯⨯-⨯=≈<⨯⨯⨯,∴认为机动车驾驶技术与性别有关的可靠性不足50%;故选:A .【点评】本题考查独立性检验的应用,关键是理解独立性检验的思路.属中档题. 6.如表是一个22⨯列联表:则表中a ,b 的值分别为()A.94,72B.52,50C.52,74D.74,52【分析】由列联表中数据的关系求得.【解答】解:732152b a=+=+=.a=-=,22522274故选:C.【点评】本题考查了列联表的做法,属于基础题.7.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视,近视的人数,并填入表格的相应位置.根据列联表,及2K的计算公式,计算出2K的值,并代入临界值表中进行比较,不难得到答案.【解答】解:分析已知条件,易得如下表格.根据列联表可得:2K,再根据与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.故选:D.【点评】独立性检验,就是要把采集样本的数据,利用公式计算2K的值,比较与临界值的大小关系,来判定事件A与B是否无关的问题.具体步骤:(1)采集样本数据.(2)由公式计算的2K值.(3)统计推断,当2 3.841K>时,有95%的把握说事件A与B有关;当2 6.635K>时,有99%的把握说事件A与B有关;当2 3.841K…时,认为事件A与B是无关的.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.30【分析】设男生可能有x人,依题意填写列联表,由2 3.841K>求出x的取值范围,从而得出正确的选项.【解答】解:设男生可能有x人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K>,由2242312()255553.841732155x x x x xxKx x x x⋅-⋅==>⋅⋅⋅,解得40.335x>,由题意知0x>,且x是5的整数倍,60∴满足题意.故选:C.【点评】本题考查列联表与独立性检验的应用问题,考查运算求解能力,是基础题.9.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:22()()()()()n a d b c K a b c d a c b d -=++++,其中na b c d=+++.参考数据:A .130B .190C .240D .250【分析】根据题意设男、女生的人数各为5x ,建立22⨯列联表,计算2K ,列不等式组求出x 的取值范围,即可确定满足条件的选项.【解答】解:依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:由表中数据,计算2210(423)10557321x x x x x x K x x x x⋅⋅-⋅==⋅⋅⋅,由题可知106.63510.82821x <<,所以139.33510227.388x <<.只有B 符合题意. 故选:B .【点评】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力,是基础题. 10.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326636 3.841822x x x x x K x x x x x ⋅-⋅==>⋅⋅⋅,解得10.24x >,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,是基础题.11.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【分析】“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,得到结论.【解答】解: “吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立, 与多少个人患肺癌没有关系, 只有D 选项正确, 故选:D .【点评】本题考查独立性检验的应用,是一个基础题,解题的关键是正确理解有多大把握认为这件事正确,实际上是对概率的理解.12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 【分析】利用已知概率对照表,在2K 大于对应值是认为相关,在小于对应值时不认为相关. 【解答】解:27.218 6.635K ≈>,对应的20()P K k …为0.010,可得有99%以上的把握认为“学生性别与中学生追星有关”, 故选:B .【点评】本题考查了独立性检验的应用问题,考查判断相关性,是基础题目.13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( )参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326663 3.841822xx x x x x K x x x x⨯-⨯==>⨯⨯⨯,解得10.24x>,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,属于基础题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
题型142 独立性检验

题型142 独立性检验2013年1.(2013福建文19)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:))50,60,60,70,⎡⎡⎣⎣)70,80,⎡⎣))80,90,90,100⎡⎡⎣⎣分别加以统计,得到如图所示的频率分布直方图. (1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:()1122122121212n n n n n n n n n χ****-=注:此公式也可以写成22()()()()()n ad bc k a b c d a c b d -=++++25周岁以上组 25周岁以下组2014年1.(2014江西文7)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查了52名中学生,得到统计数据如表1至表4所示,则与性别有关联的可能性最大的变量是( )表1 表2表3 表4A.成绩B.视力C.智商D.阅读量2.(2014安徽文17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[]0,2,(]2,4,(]4,6,(]6,8,(]8,10,(]10,12.估计该校学生每周平均体育运动时).0.070.01.0.0间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:))()()(()(22d b c a d c b a bc ad n K ++++-=.3.(2014辽宁文18)某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:()22112212211212n n nn n n n n n χ++++-=.2017年1.(2017全国2卷文19)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg )的某频率直方图如图所示.(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ”, 估计A 的概率;(修图:下面表中原点处加数字0)(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.(3)根据箱产量的频率分布直方图,求新养殖法的箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .1.解析(1)由频率分布直方图知,旧养殖法的箱产量低于50kg 的频率为()0.0120.0140.0240.0340.04050.62++++⨯=,则估计事件A 的概率为()0.62P A =.(2)列联表如下:箱产量/kg新养殖法旧养殖法箱产量/kg所以22200(62663834)15.70510.82810010010496K ⨯-⨯=≈>⨯⨯⨯,所以有99%的有把握认为箱产量与养殖方法有关.(3)因为()()500.0040.0200.04450.34<0.5P x <=++⨯=,()()550.0040.0200.0440.06850.68>0.5P x <=+++⨯=.所以中位数介于5055之间,则新养殖法的箱产量的中位数的估计值为0.50.345052.350.068-+=.2019年1.(2019全国1文17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++.1.解析 (1)由调查数据,男顾客中对该商场服务满意的比率为0.850=,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯. 由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.根据下表计算k≈_____.
【解析】根据列联表中的数据得K2的观测值
n ad bc2
392 39167 157 292
k a bc da c(b d) 196196 68 324
≈1.78.
答案:1.78
5.运动员参加比赛前往往做热身运动,下表是一体育运动的 研究机构对160位专业运动员追踪而得的数据,试问:由此数 据,你认为运动员受伤与不做热身运动有关吗?
1 500 98217 49382
k
13.097 10.828,
990 5101 475 25
因此,在犯错误的概率不超过0.001的前提下,认为质量监
督员甲在不在生产现场与产品质量好坏有关系.
【典例】(12分)(1)下表是某地区的一种传染病与饮用水的 调查表:
这种传染病是否与饮用水的卫生程度有关,请说明理由;
【规范解答】由已知数据列出2×2列联表如下:
由2×2列联表中的数据,得K2的观测值为
k 180 65 49≈1320.3386>210.828,
9585101 79
所以在犯错误的概率不超过0.001的前提下认为“生产合格品 与设备改造有关系”.
【例】为调查某地区老年人是否需要志愿者提供帮助,用简 单随机抽样方法从该地区调查了500位老年人,结果如下:
bc
ad bc2 da c(b
d)
【审题指导】解答第(2)问时,可先计算K2的值,再对照表格作
出判断.
【规范解答】(1)调查的500位老年人中有70位需要志愿者提 供帮助,因此该地区老年人中,需要志愿者提供帮助的老年 人的比例的估计值为 70 =14%.
500
(2) K2=500 40 270≈93.096176.0由2 于9.967>6.635,所
【解析】选D.独立性检验的结果与实际问题有差异,即独立 性检验的结论是一个数学统计量,它与实际问题中的确定性 存在差异.
2.分类变量X和Y的列联表如下,则( )
(A)ad-bc越小,说明X与Y的关系越弱 (B)ad-bc越大,说明X与Y的关系越强 (C)(ad-bc)2越大,说明X与Y的关系越强 (D)(ad-bc)2越接近于0,说明X与Y的关系越强
概率不超过α;否则,就认为在犯错误的概率不超过α的前
提下不能推断“X与Y有关系”,或者在样本数据中没有发现
足够证据支持结论“X与Y有关系”.
通常认为k<2.706时,样本数据就没有充分的证据显 示“X与Y有关系”.
【例2】某企业为了更好地了解设备改造与生产合格品的关系, 随机抽取了180件产品进行分析,其中设备改造前生产的合格 品有36件,不合格品有49件;设备改造后生产的合格品有65 件,不合格品有30件,根据上面的数据,你能得出什么结论? 【审题指导】可先由题中已给数据,列出2×2列联表,再计 算K2的值作出判断.
【解析】选C.由K2的计算公式可知,(ad-bc)2越大,则K2越 大,故相关关系越强.
3.若由一个2×2列联表中的数据计算得K2=4.013,则两个变 量有关系的概率为_____. 【解析】因随机变量K2的观测值k=4.013>3.841.所以在犯 错误的概率不超过0.05的前提下,认为两个变量有关系. 答案:0.95
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9 人,不得病22人.按此样本数据分析这种疾病是否与饮用水有 关,并比较两种样本在反映总体时的差异. 【审题指导】(1)根据表中的信息计算K2的观测值,并根据临 界值表来分析相关性的大小,对于(2)要列出2×2列联表,方 法同(1).
【规范解答】(1)假设H0:传染病与饮用水无关.把表中数据 代入公式得:
有关“相关性检验” 解决一般的独立性检验问题的步骤:
(1)根据实际问题的需要确定容许推断“两个分类变量有关系” 犯错误概率的上界α,然后查下表确定临界值k0.
(2)根据2×2列联表,利用公式K2an
bc
ad bc2 da c(b
d)
计算随机变量K2的观测值k.
(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的
K2的观测值k 830 52 218≈54646.2194,…2 ………3分
146 684 518 312
∵54.21>10.828,所以拒绝H0. 因此在犯错误的概率不超过0.001的前提下认为该地区这种传
染病与饮用不干净水有关. ……………………………………5分
(2)依题意得2×2列联表:
此时,K2的观测值k 86 5 22≈ 550.78952. …………9分
通过等高条形图可以粗略地判断两个分类变量是否有 关系,但无法精确地给出所得结论的可靠程度.
【例1】从发生交通事故的司机中抽取2 000名司机作随机样 本,根据他们血液中是否含有酒精以及他们是否对事故负有 责任将数据整理如下:
试分析血液中含有酒精与对事故负有责任是否有关系.
【审题指导】题目已给出了2×2列联表,可利用等高条形图 定性分析两个分类变量之间的相关性. 【规范解答】作等高条形图如下,图中阴影部分表示有酒精 负责任与无酒精负责任的比例,从图中可以看出,两者差距 较大,由此我们可以在某种程度上认为“血液中含有酒精与 对事故负有责任”有关系.
分类变量关系的分析
1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变量 是否相关是判断变量相关的常见方法. (2)一般地,在等高条形图中, a 与 c 相差越大,两个
ab cd
分类变量有关系的可能性就越大.
2.分析分类变量关系的步骤: (1)作大量的调查、研究,统计出结果. (2)列出列联表利用频率粗略估计. (3)作出等高条形图,从直观上进一步判断分类变量之间的关 联关系.
独立性检验的综合应用
判断变量X与Y有无关系的三种方法: (1)2×2列联表:由2×2列联表中|ad-bc|的大小判断. (2)等高条形图:观察条形图中的阴影比例大小判断. (3)独立性检验:计算K2的观测值k,再利用临界值的大小判 断. 其中独立性检验的方法相对较准确.
【例3】为了调查某生产线上质量监督员甲对产品质量好坏有 无影响,现统计数据如下:甲在生产现场时,990件产品中有 合格品982件,次品8件;甲不在生产现场时,510件产品中有 合格品493件,次品17件.试分别用列联表、等高条形图、独 立性检验的方法分析监督员甲对产品质量好坏有无影响.能否 在犯错误的概率不超过0.001的前提下,认为质量监督员甲是 否在生产现场与产品质量有关? 【审题指导】本题要求分别用列联表、等高条形图、独立性 检验的方法分析,要注意三种方法的判断思路.
14 72 55 31
由于5.785>2.706 所以在犯错误的概率不超过0.1的前提下认为该种疾病与饮用 不干净水有关. …………………………………………………10分
两个样本都能统计得到传染病与饮用不干净水有关这一相同 结论,但(1)中在犯错误的概率不超过0.001的前提下肯定结 论的正确性,(2)中在犯错误的概率不超过0.1的前提下肯定 结论的正确性. …………………………………………………12分
【误区警示】对解答本题时易犯错误具体分析如下:
1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析 数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率 不超过0.01的前提下认为这个结论是成立的,下列说法中正 确的是( ) (A)100个吸烟者中至少有99人患有肺癌 (B)1个人吸烟,那么这个人有99%的概率患有肺癌 (C)在100个吸烟者中一定有患肺癌的人 (D)在100个吸烟者中可能一个患肺癌的人也没有
【规范解答】(1)2×2列联表如下:
由列联表可得|ad-bc|=|982×17-493×8|=12 750. 相差较大,可在某种程度上认为“质量监督员甲是否在现场 与产品质量有关系”.
(2)画等高条形图. 如图可知,在某种程度上认为“质量监督员甲是否在生产现 场与产品质量有关系”.
(3)由2×2列联表中数据,计算得到K2的观测值为
• 思考题4 在对人们的休闲方式的一次调查 中,共调查了124人,其中女性70人,男 性54人,女性中有43人主要的休闲方式是 看电视,另外27人主要的休闲方式是运动 ;男性中有21人主要的休闲方式是看电视 ,另外33人主要的休闲方式是运动.
• (1)根据以上数据建立一个2×2的列联表; • (2)试判断性别与休闲方式是否有关系
200 300 70 430
以在犯错误的概率不超过0.01的前提下认为该地区的老年人
是否需要志愿者提供帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要志愿者提供帮助 与性别有关,并且从样本数据能看出该地区男性老年人与女 性老年人中需要帮助的比例有明显差异,因此在调查时,先 确定该地区老年人中男、女的比例,再把老年人分成男、女 两层并采用分层抽样方法,这比采用简单随机抽样方法更好.
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比 例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老 年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区 的老年人中,需要志愿者提供帮助的老年人的比例?说明理 由.
附:
K2
a
n