独立性检验例题
独立性检验(历年高考)练习题
![独立性检验(历年高考)练习题](https://img.taocdn.com/s3/m/8a1f063abb1aa8114431b90d6c85ec3a86c28b50.png)
独立性检验(历年高考)练习题1.为了研究某班学生打篮球的喜好与性别是否相关,对60名学生进行了问卷调查,得到了如下的2×2列联表。
现在有以下问题需要解决:I)在喜欢打篮球的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述抽样的6人中,恰好有一名女生的概率是多少?III)是否可以有95%的把握认为喜欢打篮球与性别有关?请说明理由。
临界值表如下:2.2014年山东省第二十三届运动会将在济宁举行,为了调查该市某校高中生是否愿意提供志愿者服务,使用简单随机抽样的方法对50名学生进行了调查,结果如下:I)在愿意提供志愿者服务的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述6人中,恰好有一名女生的概率是多少?III)可以有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关吗?临界值表如下:3.为了研究某市学生的百米跑成绩,按照男女比例随机抽取了50名学生进行测试,测试结果显示所有学生的成绩都在13秒到18秒之间。
将测试结果按照以下方式分成了五组:第一组:[13,14)第二组:[14,15)第三组:[15,16)第四组:[16,17)第五组:[17,18]以下是按照上述分组方法得到的频率分布直方图:现在有以下问题需要解决:1)设m和n表示从第一组和第五组的所有学生中任意抽取的两名学生的百米测试成绩,即m,n∈[13,14)∪[17,18),求事件“m-n>2”的概率;2)根据规定,成绩小于16秒为达标。
如果男女生使用相同的达标标准,则男女生达标情况如下表:现在需要完成上表,并根据上表数据,判断是否可以有99%的把握认为“体育达标与性别有关”。
参考公式:nad-bc)K=,其中n=a+b+c+d。
a+b)(c+d)(a+c)(b+d)临界值表如下:。
独立性检验练习题
![独立性检验练习题](https://img.taocdn.com/s3/m/1f245622ba0d4a7303763aa5.png)
独立性检验练习题一、选择题1 •对长期吃含三聚氰胺的婴幼儿奶粉与患肾结石这两个分类变量的计算中,下列说法正确的是()2A. 若K的值大于6.635,我们有99%的把握认为长期吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,那么在100个长期吃含三聚氰胺的三鹿奶粉的婴幼儿中必有99人患有肾结石病;B. 从独立性检验可知有99%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系时,我们说某一个婴幼儿吃含三聚氰胺的三鹿婴幼儿奶粉,那么他有99%的可能患肾结石病;C. 若从统计量中求岀有95%的把握认为吃含三聚氰胺的三鹿婴幼儿奶粉与患肾结石有关系,是指有5%的可能性使得推判岀现错误;D. 以上三种说法都不正确。
根据上述数据,试问色盲与性别关系是( )A.相互独立B.不相互独立A. 0.4B. 0.5C. 0.75D. 0.85二、填空题24. 通过计算高中生的性别与喜欢唱歌列联表中的数据,得到K ■ 4.9 8并且已知2P(K -3.841) : 0.05,那么可以得到的结论是 _____________________________________________5•下面是一个2X 2列联表则三、计算题7.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:独立性检验练习题参考答案-、选择题1 • C对于A,若K2的值为6.635,我们有99%的把握认为吃含三聚氰胺的三鹿奶粉的婴幼儿与患肾结石有关系,但在100个吃含三聚氰胺的三鹿婴幼儿奶粉婴幼儿中未必有99人患有肺病;对于B同样不成立,C是正确的,故选C.2. B k =27.139 10,828,所以的99.9%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立.心 2 90(20 汉27— 25 182 729000 “、心亠八钿舟3. B计算K20.18218623 ::: 2.706可知,没有充分理由45 汶45 疋38 乂52 4001400说明成绩与班级有关系”,即成绩的优秀与不优秀”与班级是相互独立的,所以估计成绩与班级有关系”犯错误的概率约是0.5.二•填空题4 •有约95%以上的把握认为性别与喜欢唱歌之间有关系”5. 26,44因为a+42=68,b+54=68+30,所以a=68-42=26,b=68+30-54=44三、解答题7.解:根据列联表中的数据,得到K2」89 (54 63一4°彳2)? =10.76 .94 汉95^86003因10.76 7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.。
独立性检验练习含答案
![独立性检验练习含答案](https://img.taocdn.com/s3/m/7733165eb90d6c85ec3ac697.png)
§1.1 独立性检验一、基础过关1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥k ) 0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是________.①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100则有________的把握确定吸烟量与年龄有关. 二、能力提升6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业 性别非统计专业统计专业 合计 男 13 10 23 女 7 20 27 合计203050为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. 8.下列说法正确的是________.(填序号)①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效 有效 总计 男性患者 15 35 50 女性患者 6 44 50 总计2179100设H 0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计 教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.三、探究与拓展12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数9261 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数297185159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数766218(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.答案1.90% 2.16.373 3.③ 4.③ 5.99.9% 6.5% 7.2 8.② 9.4.882 5%10.解 由公式得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=71×(12×24-25×10)237×34×22×49≈0.08.∵χ2<2.706.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关. 由公式得χ2=830×(52×218-466×94)2146×684×518×312≈54.21.因为54.21>10.828.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×(5×22-50×9)255×31×14×72≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性. 12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%. (2)甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计5005001 000由列联表中的数据,得χ2=1 000×(360×180-320×140)2680×320×500×500≈7.353>6.635.所以有99%的把握认为“两个分厂生产的零件的质量有差异”.Welcome To Download !!!欢迎您的下载,资料仅供参考!。
独立性检验习题及答案
![独立性检验习题及答案](https://img.taocdn.com/s3/m/51a09adcf61fb7360b4c6594.png)
1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系.解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
独立性检验—高考真题
![独立性检验—高考真题](https://img.taocdn.com/s3/m/8b371048eef9aef8941ea76e58fafab069dc441e.png)
独立性检验—高考真题一、解答题二、解答题1.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g ).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成如下列联表m <m≥对照组试验组(ⅱ)根据(i )中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:()()()()22()n ad bc K a b c d a c b d -=++++,()2P K k ≥0.1000.0500.010k2.7063.841 6.6352.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.0500.0100.001k 3.841 6.63510.8283.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.010 0.001k 3.841 6.63510.8284.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.8285.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:P(2K k ≥)0.0500.0100.001k 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++6.甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A 24020B 21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k 0.1000.0500.010k2.7063.841 6.635参考答案:1.(1)19.8(2)(i)23.4m=;列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得23.4m=,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:1(7.89.211.412.413.215.516.518.018.819.219.820.220+++++++++++39621.622.823.623.925.128.232.336.5)19.820++++++++==(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位为23.2,第21位数据为23.6,所以23.223.623.42m+==,故列联表为:m<m≥合计对照组61420试验组14620合计202040(ii)由(i)可得,2240(661414)6.400 3.84120202020K⨯⨯-⨯==>⨯⨯⨯,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 2.(1)75%;60%;(2)能.【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075%200=,乙机床生产的产品中的一级品的频率为12060%200=.(2)()22400150801205040010 6.63527013020020039K ⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.3.(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量好3337空气质量不好228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.5.(1)7014%500=,(2)有99%的把握(3)见解析【详解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为7014% 500=(2)22500(4027030160)9.96720030070430K⨯⨯-⨯==⨯⨯⨯.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.6.(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K ,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A 共有班次260次,准点班次有240次,设A 家公司长途客车准点事件为M ,则24012()26013==P M ;B 共有班次240次,准点班次有210次,设B 家公司长途客车准点事件为N ,则210()27840==P N .A 家公司长途客车准点的概率为1213;B 家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。
专题08 独立性检验(解析版)
![专题08 独立性检验(解析版)](https://img.taocdn.com/s3/m/d13caf4df4335a8102d276a20029bd64783e626f.png)
概率与统计专题08 独立性检验常见考点考点一独立性检验典例1.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,分8个指标对这两款车型进行了综合评测打分(满分:5分),如图所示:(1)求综合评测分数的平均值;从上图8个指标中任选1个,求指标分数为4.93的概率;(2)老李对两款车型的车主的性别作了统计,得到数据如下2×2列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关.附:()()()()22()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.)20 k【答案】(1)平均值为4.79,38(2)列联表见解析,有99.9%的把握认为喜欢哪款车型和性别有关.【解析】【分析】(1)根据平均数的计算公式求得综合评测分数的平均值;根据古典概型的概率公式即可求得指标分数为4.93的概率;(2)根据表中数列可算出需要补充的数据;计算出2K的值,和题中已知的表格数据相比较,可得答案.(1)平均值为4.69 4.89 4.80 4.93 4.56 4.93 4.59 4.9338.324.7988 +++++++==,8个指标中分数为4.93的指标有3个,故从8个指标中任选1个,指标分数为4.93的概率为38;(2)由于()221405545152526.2510.82070708060K⨯⨯-⨯==>⨯⨯⨯,所以有99.9%的把握认为喜欢哪款车型和性别有关.变式1-1.数字人民币是由中国人民银行发行的数字形式的法定货币,由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.为了进一步了解普通大众对数字人民币的认知情况,某机构进行了一次问卷调查,统计结果如下:(1)如果将高中及以下学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)根据(1)中所得列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析(2)没有【解析】【分析】(1)根据题中数据,填写列联表即可;(2)由22()()()()()n ad bcKa b c d a c b d-=++++,根据列联表数据计算,与临界值比较即可(1)完成的22⨯列联表如下:(2)根据列联表得:22800(150275125250)8003.463 3.841275525400400231K⨯⨯-⨯==≈<⨯⨯⨯,故没有95%的把握认为“是否了解数字人民币”与“学历高低”有关.变式1-2.某校开展党史知识竞赛.现从参加竞赛活动的学生中随机抽取了n名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(1)求a的值;(2)估计这n名学生的平均成绩(同一组中的数据用该组区间的中点值为代表);(3)活动规定:竞赛成绩位于60分以下为不及格,不低于80分为“优秀”,若抽取的学生中成绩不及格的有15人.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)0.025a = (2)74(3)列联表答案见解析,没有99.9%的把握认为“比赛成绩是否优秀与性别有关” 【解析】 【分析】(1)根据频率直方图的特征可知所有的频率之和为1,列出方程,解方程即可; (2)根据频率直方图,利用每组的组中值乘以对应的频率,加起来即可;(3)根据题意补充列联表,利用卡方的计算公式求出2K ,结合表中的数据即可得出结论. (1) 由题可得(0.0050.0100.0200.0300.010)101a +++++⨯=,解得0.025a =.(2)平均成绩为:450.05550.1650.2750.3850.25950.174⨯+⨯+⨯+⨯+⨯+⨯=, (3)∵不及格的人数为15人, ∴抽取的总人数为151000.15n ==, ∴比赛成绩优秀的有1000.3535⨯=人, 由此可得完整的2×2列联表:22100(10252540)9.89010.82835655050K ⨯-⨯=≈<⨯⨯⨯.∴没有99.9%的把握认为“比赛成绩是否优秀与性别有关”变式1-3.某科研机构为了研究喝酒与糖尿病是否有关,对该市30名成年男性进行了问卷调查,并得到了如下列联表,规定“”平均每天喝100mL 以上的”为常喝.已知在所有的30人中随机抽取1人,患糖尿病的概率为4 .(1)请将上表补充完整,并判断是否有99.5%的把握认为糖尿病与喝酒有关?请说明理由;(2)已知常喝酒且有糖尿病的6人中恰有两名老年人,其余为中年人,现从常喝酒且有糖尿病的这6人中随机抽取2人,求恰好抽到一名老年人和一名中年人的概率.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)列联表答案见解析,有99.5%的把握认为糖尿病与喝酒有关(2)8 15【解析】【分析】(1)根据题中信息完善22⨯列联表,计算出2K的观测值,结合临界值表可得出结论;(2)设两名老年人分别为a、b,其余四名中年人为c、d、e、f,列举出所有的基本事件,并确定所求事件所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.(1)解:由题意知430815⨯=,所以,糖尿病患者共有8名,其中不常喝酒的有862-=名,则22⨯列联表如下:由表中的数据可得()2230618428.5237.8791020822K ⨯⨯-⨯=≈>⨯⨯⨯, 因此,有99.5%的把握认为糖尿病与喝酒有关. (2)解:设两名老年人分别为a 、b ,其余四名中年人为c 、d 、e 、f ,则所有可能出现的结果有(),a b 、(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f 、(),c d 、(),c e 、(),c f 、(),d e 、(),d f 、(),e f ,共15种,其中事件“有一名老年人和一名中年人”包含的结果有:(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f ,有8种,因此,恰好抽到一名老年人和一名中年人的概率815P =. 典例2.2021年9月3日,教育部召开第五场金秋新闻发布会,会上发布了第八次全国学生体质与健康调研结果.根绝调研结果数据显示,我国大中小中学的健康情况有了明显改善,学生总体身高水平也有所增加.但同时在超重和肥胖率上,中小学生却有一定程度上升,大学生整体身体素质也有所下滑.某市为调研本市学生体质情况,采用按性别分层抽样的方法进行调查,得到体质测试样本的统计数据(单位:人)如下:附:()()()()()22n ad bc K a b c d a c b d -=++++.(1)根据所给数据,完成下面22⨯列联表,并据此判断:能否有95%的把握认为该市学生体质测试是否达标与性别有关.(注:体质测试成绩为优秀、良好或及格则体质达标,否则不达标)(2)体质测试成绩为优秀或良好则称体质测试成绩为优良,以样本数据中男、女生体质测试成绩优良的频率视为该市男、女生体质测试成绩优良的概率,在该市学生中随机选取2名男生,2名女生,设所选4人中体质测试成绩优良人数为X ,求X 的分布列及数学期望. 【答案】(1)表格见解析,没有; (2)分布列见解析,76. 【解析】 【分析】(1)完成列联表,再利用独立性检验求解;(2)由题得X 的所有可能取值为0,1,2,3,4,再求出对应的概率,即得分布列和期望. (1)解:由题得22⨯列联表如下:()22160108012084012019202409601200k ⨯-⨯=⨯⨯⨯27 3.375 3.8418==< ∴没有95%的把握认为该市学生体质达标与性别有关.(2)解:由题意男生体质测试优良率114P =,女生体质测试优良率213P =.X 的所有可能取值为0,1,2,3,4.()02202213121044334P X C C ⎛⎫⎛⎫⎛⎫⎛⎫=== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭()110202111001222213121312514433443312P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()200202201111200211222222131213121312372443344334433144P X C C C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==++=⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()201111202112222213121312534433443372P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()202022221312144433144P X C C ⎛⎫⎛⎫⎛⎫⎛⎫===⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭X ∴的分布列为:()153751701234412144721446E X ∴=⨯+⨯+⨯+⨯+⨯=.变式2-1.第24届冬季奥林匹克运动会将于2022年2月4日至20日在北京举行.践行“绿色奥运、科技奥运、人文奥运”理念,举办一届“有特色、高水平”的奥运会,是中国向世界的庄严承诺.为宣传北京冬奥会,某市开展了冬奥知识竞答活动.从参与的市民中随机抽取100人,统计他们的竞答成绩得到下面的列联表(单位:人).(1)完成列联表,并根据列联表判断是否有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关?(2)将频率视为概率,从该市所有参与冬奥知识竞答的市民中随机抽取10人赠送礼品,记其中成绩合格的人数为随机变量X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(1)列联表答案见解析,有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关(2)期望7,方差2.1 【解析】 【分析】(1)根据已知数据可得列联表,计算2K 后可得结论;(2)由题意得()~10,0.7X B ,由二项分布的期望公式和方差公式计算可得. (1)完成列联表(单位:人):由列联表,2K 的观测值()2100402010301004.762 3.8415050703021k ⨯⨯-⨯==≈>⨯⨯⨯,∴有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关. (2)从参与的市民中随机抽取100人,有70人竞答成绩合格,所以成绩合格的频率为0.7,将频率视为概率,从该市所有参与活动的市民中随机抽取一人,恰好抽到成绩合格的市民的概率为0.7, 由题意知()~10,0.7X B ,∴随机变量X的数学期望()100.77E X=⨯=,方差()100.70.3 2.1D X=⨯⨯=.变式2-2.从某地区高中二年级学生中随机抽取质量监测数学得分在120分以下和120分以上(含120分)的学生各250名作为样本(全体高二学生均参加监测),分别测出他们的注意力集中水平得分,统计如下表.(1)若将学生在质量监测中数学得分在120分以上(含120分)定义为数学成绩优秀,将学生注意力集中水平得分在500分以上(含500分)称为注意力集中水平高;试问:能否有99%以上的把握认为数学成绩优秀与注意力集中水平高有关?(2)若将上述样本的频率视为概率,现从该地区所有高二学生中随机抽取100人,设抽取到的数学得分在120分以上(含120分)且注意力集中水平得分在500分以上(含500分)的人数为随机变量X,求X的数学期望.(()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【答案】(1)有99%以上的把握认为数学成绩优秀与注意力集中水平高有关;(2)()E X=36.【解析】【分析】(1)根据表格中的数据,代入求观测值公式,求出观测值同临界值进行比较即可得出结论;(2)根据二项分布期望计算公式,计算出数学期望.(1)由22⨯列联表中数据计算可得,2K 的观测值为()25001007015018051.948 6.635250250280220k ⨯⨯-⨯=≈>⨯⨯⨯所以能有99%以上的把握认为数学成绩优秀与注意力集中水平高有关. (2)从22⨯列联表可知,数学得分在120分以上(含120分) 且注意力集中水平得分在500分以上(含500分)的频率为=180950025, 由题意知,XB ⎛⎫ ⎪⎝⎭910025,所以()E X =⨯=91003625.变式2-3.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,对市场上这个品牌汽车车主的性别情况进行了调查统计. (1)统计数据得到如下22⨯列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关; (2)若两款汽车的操控性能优秀率均为23,动力性能优秀率均为34,老李又对这两款车型进行操控性能和动力性能测试(假设进行的各项测试之间互相不影响),求两款车型的这两项测试中恰有2项指标优秀的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表见解析,有 (2)37144【解析】 【分析】(1)按照独立性检验公式进行计算即可;(2)分别计算两款操控性能优秀、两款动力性能优秀、一款操控性能优秀一款动力性能优秀的概率,相加求和即可. (1)男:55 80 女:45合计:70 140(列出表格也得分,其他形式答案正确即可得分)由于()221405545152707526.2510.08086082K ⨯⨯⨯-⨯=⨯>⨯=,所以有99.9%的把握认为喜欢哪款车型和性别有关. (2)记Y 表示混动版测试指标优秀的项目数,Z 表示纯电动版测试指标优秀的项目数,则“两款车型这两项测试中恰有2项指标优秀”的概率为()()()()20,21,12,0P Y Z P Y Z P Y Z P Y Z +====+==+== ()()()()()()021120P Y P Z P Y P Z P Y P Z ===+==+==223232323232337111111343434343434144⎡⎤⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯-⨯⨯+⨯-+-⨯+⨯⨯-⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎣⎦.巩固练习练习一 独立性检验1.每年的六、七月份,我国长江中下游地区进入梅雨季节,如图是江南某镇2012~2021年梅雨季节的降雨量(单位:mm )的频率分布直方图.(1)请用样本平均数估计该镇明年梅雨季节的降雨量;(2)该镇某杨梅种植户统计了他种植的某品种杨梅在2012~2021年的亩产量(单位:kg ),得到如下22⨯列联表(部分数据缺失),依据0.1α=的独立性检验,能否认为该品种杨梅的亩产量与降雨量有关?(完善列联表,并说明理由) 单位:年【答案】(1)280mm(2)表格见解析,认为该品种杨梅的亩产量与降雨量有关 【解析】 【分析】(1)先求出降雨量在[]400,500内的频率,再根据频率直方图求平均数的计算公式直接计算即可; (2)先求出降雨量在[)200,400内的频数,再补全列联表,根据卡方的计算公式求出2χ,利用独立性检验的思想即可得出结论. (1)样本中降雨量在[]400,500内的频率为()11000.0020.0040.0030.1-⨯++=, 所以样本平均数为1500.22500.43500.34500.1280⨯+⨯+⨯+⨯=,所以该镇明年梅雨季节的降雨量约为280mm . (2)根据频率分布直方图可知,降雨量在[)200,400内的频数为()101000.0030.0047⨯⨯+=. 补全22⨯列联表如下: 单位:年则()220.1101162 2.744 2.7067373x χ⨯⨯-⨯=≈>=⨯⨯⨯.所以根据小概率值0.1α=的独立性检验,认为该品种杨梅的亩产量与降雨量有关.2.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm×60cm×100cm ,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如下数据:(1)请完成如下的2×2列联表,依据0.05α=的独立性检验,能否认为托运行李重量与乘客乘坐的机舱等级有关? 单位:人(2)调研小组为感谢参与调查的旅客,决定从托运行李重量超出免费行李额且不超出10kg 的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补助券”,记赠送的补助券总金额为X 元,求X 的分布列与均值. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)表格见解析,在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)分布列见解析,16007【解析】 【分析】(1)依据独立性检验的概念,先计算,再进行判断即可.(2)依题意,行李重量超出免费行李额且不超出10kg 的旅客共7人,先明确随机变量X 的取值,然后利用超几何分布列出分布列. (1)补全2×2列联表如下: 单位:人假设0H 为:托运行李重量与乘客乘坐的机舱等级无关. 根据列联表中的数据,经计算得到()220.0510******* 5.499 3.84190105545x χ⨯⨯-⨯=≈>=⨯⨯⨯,根据小概率值0.05α=的独立性检验,我们推断0H 不成立,即在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)根据题意可得,托运行李重量超出免费行李额且不超过10kg 的旅客有7人,从中随机抽取4人,则其中女性旅客的人数可能为1,2,3,4,所以X 的所有可能取值为100,200,300,400,()134347C C 4100C 35P X ===,()224347C C 18C 20350P X ===,()314347C C 12300C 35P X ===,()404347C C 1400C 35P X ===,则X的分布列为故()41812110020030040035353535E X =⨯+⨯+⨯+⨯=16007. 3. “双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t (百元)的频率分布直方图如图1所示:(1)利用图1,求网民消费金额t的平均值t和中位数t;(2)把下表中空格里的数填上,能否有90%的把握认为网购消费与性别有关.t tt t<合计附表:P(χ2≥k0)参考公式:χ2=2()()()()()n ad bca b c d a c b d-++++.【答案】(1)11.5t=,010t=(2)列联表见解析,没有【解析】【分析】(1)根据平均数的定义求平均数,由于前2组的频率和恰好为0.5,从而可求出中位数,(2)根据频率分布表结合已知的数据计算完成列联表,然后计算χ2公式计算χ2,再根据临界值表比较可得结论(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值为2.50.27.50.312.50.217.50.1522.50.127.50.0511.5t=⨯+⨯+⨯+⨯+⨯+⨯=0.频率直方图中第一组、第二组的频率之和为0.0450.0650.5⨯+⨯=,∴中位数010t=;(2)把下表中空格里的数填上,得列联表如下;0 t t0 t t<合计计算22100(25302520)1001.012.7064555505099χ⨯⨯-⨯==≈<⨯⨯⨯,所以没有90%的把握认为网购消费与性别有关.4.网课是一种新兴的学习方式,它以互联网为平台,为学习者提供包含视频、图片、文字等多种形式的系列学习课程,由于具有方式多样,灵活便捷等优点,成为许多学生在假期实现自主学习的重要手段.为了调查A地区高中生一周网课学习的时间,随机抽取了500名上网课的学生,将他们一周上网课的时间(单位:h)按[1,6),[6,11),[11,16),[16,21),[21,26]分组,得到频率分布直方图如图所示.(1)求a的值,并估计这500名学生一周上网课时间的平均数(同一组中的数据用该组区间的中点值代表);(2)为了了解学生与家长对网课的态度是否具有差异性,研究人员随机抽取了200人调查,所得数据统计如下表所示,判断是否有99.5%的把握认为学生与家长对网课的态度具有差异性.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)0.03,13.35; (2)有 【解析】 【分析】(1)根据频率分布直方图各小矩形的面积之和为1求解,再利用平均数的定义求解; (2)根据列联表求得2K 的值,再与临界值表对照下结论. (1)解:因为()0.0220.050.0751a +++⨯=, 所以0.03a =,平均数为7172737470.0250.0550.0750.0350.03513.3522222⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=; (2)因为2250(30505070)87.87980120100100K ⨯⨯-⨯=≈>⨯⨯⨯, 所以有99.5%的把握认为学生与家长对网课的态度具有差异性.5.2022年2月1日是春节,百节年为首,春节是中华民族最隆重的传统佳节,它不仅集中体现了中华民族的思想信仰、理想愿望、生活娱乐和文化心理,而且还是祈福攮灾、饮食和娛乐活动的狂欢式展示.为调查某地从外地工作回来过年的市民(以下称为“返赣人员”)人数情况,现对某一区域的居民进行抽样调查,并按年龄(单位:岁)分成五组,得到如图所示的频率分布直方图,其中年龄在[20,25)内的人数为10.(1)请根据样本数据补充完成22⨯列联表,并判断是否有99.9%的把握认为是否是从外地回来过年与性别相关;(2)据了解,该地区今年返赣人员占14.现从该社区居民中随机抽取3人进行调查,记X为这3人中今年是返赣人员的人数,求X的分布列与数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:【答案】(1)列联表见解析,有99.9%的把握认为是否是从外地回来过年与性别相关(2)分布列见解析,3()4E X=【解析】【分析】(1)由题意可得列联表,根据表格中的数据,代入公式,求出观测值同临界值进行比较即可得出结论;(2)根据独立重复试验概率计算公式,计算出概率可得分布列并求得数学期望.(1)由频率分布直方图可知年龄在[20,25)上的占比为1(0.0220.060.075)50.125-⨯++⨯=,根据已知人数为10计算可得总人数为80,列联表如下:∴22280(25301510)8060011.42910.82835454040354516100⨯⨯-⨯⨯==≈>⨯⨯⨯⨯⨯⨯K , 所以有99.9%的把握认为是否是从外地回来过年与性别相关. (2)X 的取值可为0,1,2,3,3327(0)464P X ⎛⎫=== ⎪⎝⎭,21133127(1)4464⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭P X C , 1223319(2)4464⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭P X C ,311(3)464P X ⎛⎫=== ⎪⎝⎭. 故分布列为:于是2727483()01239646464646414E X =⨯+⨯+⨯+⨯==. 6.受新冠肺炎疫情的影响,各地推出务工人员就地过年的鼓励政策.某市随机抽选了100名男务工人员和100名女务工人员,调查他们是否有就地过年的意愿,结果如下:(1)能否有99.9%的把握认为务工人员就地过年的意愿与性别有关?(2)若用频率估计概率,从该市所有女务工人员中随机抽取3人进行深入调查,X 表示抽取的女务工人员无就地过年的意愿的人数,求X 的分布列与数学期望.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)没有99.9%的把握认为务工人员就地过年的意愿与性别有关 (2)分布列见解析,数学期望为65【解析】 【分析】(1)计算出2χ后比较临界值可得结论;(2)由于2~3,5X B ⎛⎫⎪⎝⎭,由二项分布可得分布列,由二项分布的期望计算出期望.(1)22200(80402060)9.52410.82810010014060χ⨯⨯-⨯=≈<⨯⨯⨯,故没有99.9%的把握认为务工人员就地过年的意愿与性别有关. (2)由题意可知2~3,5X B ⎛⎫⎪⎝⎭.所以X 的取值范围是{0,1,2,3},3032227(0)C 155125P X ⎛⎫⎛⎫==-=⎪⎪⎝⎭⎝⎭, 12132254(1)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 21232236(2)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 3033228(3)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 所以X 的分布列为所以26()355E X =⨯=.7.2021年1月以来,教育部相继出台文件,对中小学生手机、睡眠、读物、作业、体质管理作出规定.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所需时间进行统计,部分数据如下表: 单位:人(1)求x ,y ,z 的值,并根据题中的列联表,依据小概率值0.05α=的独立性检验,判断是否可以认为完成作业所需时间在90分钟以上与性别有关;(2)学校从完成作业所需时间在90分钟以上的学生中用分层随机抽样的方法抽取9人了解情况,甲老师再从这9人中选取3人进行访谈,求甲老师选取的3人中男生人数大于女生人数的概率. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)100x =,80y =,140z =,不能认为完成作业所需时间在90分钟以上与性别有关; (2)1742. 【解析】 【分析】(1)求出x ,y ,z 的值,作出列联表,再利用独立性检验求解;(2)利用古典概型和互斥事件的概率求解. (1)解:由80180x +=可得100x =;由80160y +=可得80y =;由80220z +=可得140z =. 所以2×2列联表如下:()224008014010080 2.694 3.841180220160240χ⨯⨯-⨯=≈<⨯⨯⨯,所以依据小概率值0.05α=的独立性检验,不能认为完成作业所需时间在90分钟以上与性别有关. (2)解:抽取的9人中,男生有8094180⨯=(人),女生有10095180⨯=(人),从这9人中选取3人进行访谈,男生人数大于女生人数的情况分为:①男生2人,女生1人;②男生3人,女生0人.所以所求概率2134543399C C C 17C C 42P =+=.8.2022年是奥运会,我国北京和张家口联合承办第二十四届冬季奥运会,本届冬奥会共设7个大项(滑雪、滑冰、冰球、冰壶、雪车、雪橇、冬季两项)、15个分项(高山滑雪、自由式滑雪、单板滑雪、跳台滑雪、越野滑雪、北欧两项、短道速滑、速度滑冰、花样滑冰、冰球、冰壶、雪车、钢架雪车、雪橇、冬季两项)共计109个小项.某校为了调查学生是否喜欢冬季冰雪运动与性别有关,在高三年级特选取了200名学生进行了问卷调查,得到如下的22⨯列联表:已知从这200名学生中随机抽取1人,这个人喜欢冰雪运动的概率为0.8,表格中100a=,20d=.(1)完成22⨯列联表,并判断是否有90%的把握认为喜欢冰雪运动与性别有关;(2)从上述喜欢冰雪运动的学生中用分层抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用X表示3人中女生的人数,求X的分布列及数学期望.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关(2)分布列见解析,9 8【解析】【分析】(1)从这个人喜欢冰雪运动的概率为0.8,可以推算出200人中喜欢冰雪运动的总人数,进而可以完成表格;(2)按照分层抽样的原理算出8人中男生和女生的人数,进而确定X的可能取值,按照组合的方法即可算出分布列.(1)由题可知,从200名学生中抽取1人,这个人喜欢冰雪运动的概率为0.8,故喜欢冰雪运动的有2000.8160⨯=人,不喜欢冰雪运动的有20016040-=人,即100a=,60b=,20c=,20d=,22⨯列联表如下:()22200100206020 2.083 2.711604012080K ⨯-⨯=≈<⨯⨯⨯,故没有90%的把握认为是否喜欢冰雪运动与性别有关; (2)按分层抽样,设抽取女生x 名,男生y 名,816060100x y ==,解得3x =,5y =, 即抽取的8人中喜欢冰雪运动的女生有3人,男生有5人, 故X 0=,1,2,3,()3538C 50C 28P X ===,()123538C C 151C 28P X ===,()213538C C 152C 56P X ===,()3035381356C C C P X ===,X 的分布列如下:()51515190123282856568E X =⨯+⨯+⨯+⨯=; 故答案为:列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关; 分布列见解析,98.。
高中数学独立性检验精选题
![高中数学独立性检验精选题](https://img.taocdn.com/s3/m/d755207cff4733687e21af45b307e87101f6f82f.png)
独立性检验精选题26道一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,则下列说法正确的是()已知在全部105人中随机抽取1人,成绩优秀的概率为27A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++据此表,可得()A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%6.如表是一个22⨯列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,527.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.309.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:22()()()()()n a d b cKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130B.190C.240D.25010.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b cKa b c d a c b d-=++++A.12B.11C.10D.1811.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .1814.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法.正确的是()参考公式及数据:22()6.109()()()()n a d b c K a b c d a c b d -=≈++++附表:A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 15.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()A .B .C .D .16.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”⋯⋯小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下22⨯列联表:临界值表并计算得到219.05K ≈,下列小波对地区A 天气判断不正确的是()A .夜晚下雨的概率约为12B .未出现“日落云里走”夜晚下雨的概率约为514C .有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D .出现“日落云里走”,有99.9%的把握认为夜晚会下雨 17.有关独立性检验的四个命题,其中不正确的是()A .两个变量的22⨯列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大B .对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越小C .从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病D .从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关18.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是()A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大.B .k 越大,“患胃病与生活不规律有关系”的可信程度越小.C .若计算得23.918K ≈,经查临界值表知2( 3.841)0.05P K ≈…,则在100个生活不规律的人中必有95人患胃病.D .从统计量中得知有95%的把握认为患胃病与生活不规律有关,是指有5%的可能性使得推断出现错误. 二.填空题(共3小题)19.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下22⨯列联表(部分数据缺失):表中a的值为;计算可知,在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式:22()()()()()n a d b cKa b c d a c b d-=++++,n a b c d=+++.参考数据:20.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++根据上表,有的把握认为“小动物是否被感染与服用疫苗有关”21.某学生为了研究高二年级同学的体质健康成绩与学习成绩的关系,从高二年级同学中随机抽取30人,统计其体质健康成绩和学习成绩,得到22⨯列联表如表:有 的把握认为学生的体质健康成绩高低与学习成绩高低有关. 附:22()()()()()n a d b c Ka b c d a c b d -=++++.三.解答题(共5小题)22.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)m in 绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n a d b c Ka b c d a c b d -=++++,23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)k g ,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n a d b c K a b c d a c b d -=++++.24.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n a d b cKa b c d a c b d-=++++.25.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:22()()()()()n a d b cKa b c d a c b d-=++++.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n a d b c Ka b c d a c b d -=++++独立性检验精选题26道参考答案与试题解析一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于6.635,得到有99%以上的把握认为“爱好这项运动与性别有关”.【解答】解:由题意算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.7.8 6.635>,∴有0.011%=的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”故选:C.【点评】本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【分析】根据条件中所给的观测值,同题目中节选的观测值表进行检验,得到观测值对应的结果,得到结论有99%以上的把握认为“爱好该项运动与性别有关”.【解答】解:由题意知本题所给的观测值,2 2110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯7.8 6.635>,∴这个结论有0.011%=的机会说错,即有99%以上的把握认为“爱好该项运动与性别有关”故选:A.【点评】本题考查独立性检验的应用,考查对于观测值表的认识,这种题目一般运算量比较大,主要考查运算能力,本题有所创新,只要我们看出观测值对应的意义就可以,是一个基础题.3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%【分析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:2 6.705 6.635K=>,对照表格:∴有99%的把握说学生性别与支持该活动有关系,∴有1%的把握说学生性别与支持该活动没有关系,故选:C.【点评】本题考查独立性检验知识,难度不大,属于基础题.4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是() A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得c和b的值;再根据公式计算相关指数2K的值,比较与临界值的大小,判断“成绩与班级有关系”的可靠性程度.【解答】解:成绩优秀的概率为27,∴成绩优秀的学生数是2105307⨯=,成绩非优秀的学生数是75,20c∴=,45b=,选项A、B错误.又根据列联表中的数据,得到2105(10302045)26.109 3.84155503075K ⨯⨯-⨯=≈>⨯⨯⨯,因此有95%的把握认为“成绩与班级有关系”, 故选:C .【点评】本题考查了独立性检验思想方法,熟练掌握列联表个数据之间的关系及相关指数2K 的计算公式是解题的关键.5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b c Ka b c d a c b d -=++++据此表,可得( )A .认为机动车驾驶技术与性别有关的可靠性不足50%B .认为机动车驾驶技术与性别有关的可靠性超过50%C .认为机动车驾驶技术与性别有关的可靠性不足60%D .认为机动车驾驶技术与性别有关的可靠性超过60% 【分析】由表中数据计算观测值,对照临界值得出结论. 【解答】解:由表中数据,计算22100(40103515)0.33670.45555457525K⨯⨯-⨯=≈<⨯⨯⨯,∴认为机动车驾驶技术与性别有关的可靠性不足50%;故选:A .【点评】本题考查独立性检验的应用,关键是理解独立性检验的思路.属中档题. 6.如表是一个22⨯列联表:则表中a ,b 的值分别为()A.94,72B.52,50C.52,74D.74,52【分析】由列联表中数据的关系求得.【解答】解:732152b a=+=+=.a=-=,22522274故选:C.【点评】本题考查了列联表的做法,属于基础题.7.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视,近视的人数,并填入表格的相应位置.根据列联表,及2K的计算公式,计算出2K的值,并代入临界值表中进行比较,不难得到答案.【解答】解:分析已知条件,易得如下表格.根据列联表可得:2K,再根据与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.故选:D.【点评】独立性检验,就是要把采集样本的数据,利用公式计算2K的值,比较与临界值的大小关系,来判定事件A与B是否无关的问题.具体步骤:(1)采集样本数据.(2)由公式计算的2K值.(3)统计推断,当2 3.841K>时,有95%的把握说事件A与B有关;当2 6.635K>时,有99%的把握说事件A与B有关;当2 3.841K…时,认为事件A与B是无关的.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.30【分析】设男生可能有x人,依题意填写列联表,由2 3.841K>求出x的取值范围,从而得出正确的选项.【解答】解:设男生可能有x人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K>,由2242312()255553.841732155x x x x xxKx x x x⋅-⋅==>⋅⋅⋅,解得40.335x>,由题意知0x>,且x是5的整数倍,60∴满足题意.故选:C.【点评】本题考查列联表与独立性检验的应用问题,考查运算求解能力,是基础题.9.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:22()()()()()n a d b c K a b c d a c b d -=++++,其中na b c d=+++.参考数据:A .130B .190C .240D .250【分析】根据题意设男、女生的人数各为5x ,建立22⨯列联表,计算2K ,列不等式组求出x 的取值范围,即可确定满足条件的选项.【解答】解:依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:由表中数据,计算2210(423)10557321x x x x x x K x x x x⋅⋅-⋅==⋅⋅⋅,由题可知106.63510.82821x <<,所以139.33510227.388x <<.只有B 符合题意. 故选:B .【点评】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力,是基础题. 10.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326636 3.841822x x x x x K x x x x x ⋅-⋅==>⋅⋅⋅,解得10.24x >,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,是基础题.11.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【分析】“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,得到结论.【解答】解: “吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立, 与多少个人患肺癌没有关系, 只有D 选项正确, 故选:D .【点评】本题考查独立性检验的应用,是一个基础题,解题的关键是正确理解有多大把握认为这件事正确,实际上是对概率的理解.12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 【分析】利用已知概率对照表,在2K 大于对应值是认为相关,在小于对应值时不认为相关. 【解答】解:27.218 6.635K ≈>,对应的20()P K k …为0.010,可得有99%以上的把握认为“学生性别与中学生追星有关”, 故选:B .【点评】本题考查了独立性检验的应用问题,考查判断相关性,是基础题目.13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( )参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326663 3.841822xx x x x x K x x x x⨯-⨯==>⨯⨯⨯,解得10.24x>,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,属于基础题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
题型142 独立性检验
![题型142 独立性检验](https://img.taocdn.com/s3/m/88292574580216fc700afdf2.png)
题型142 独立性检验2013年1.(2013福建文19)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:))50,60,60,70,⎡⎡⎣⎣)70,80,⎡⎣))80,90,90,100⎡⎡⎣⎣分别加以统计,得到如图所示的频率分布直方图. (1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:()1122122121212n n n n n n n n n χ****-=注:此公式也可以写成22()()()()()n ad bc k a b c d a c b d -=++++25周岁以上组 25周岁以下组2014年1.(2014江西文7)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查了52名中学生,得到统计数据如表1至表4所示,则与性别有关联的可能性最大的变量是( )表1 表2表3 表4A.成绩B.视力C.智商D.阅读量2.(2014安徽文17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (1)应收集多少位女生样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据分组区间为:[]0,2,(]2,4,(]4,6,(]6,8,(]8,10,(]10,12.估计该校学生每周平均体育运动时).0.070.01.0.0间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别的列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:))()()(()(22d b c a d c b a bc ad n K ++++-=.3.(2014辽宁文18)某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:()22112212211212n n nn n n n n n χ++++-=.2017年1.(2017全国2卷文19)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg )的某频率直方图如图所示.(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg ”, 估计A 的概率;(修图:下面表中原点处加数字0)(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.(3)根据箱产量的频率分布直方图,求新养殖法的箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .1.解析(1)由频率分布直方图知,旧养殖法的箱产量低于50kg 的频率为()0.0120.0140.0240.0340.04050.62++++⨯=,则估计事件A 的概率为()0.62P A =.(2)列联表如下:箱产量/kg新养殖法旧养殖法箱产量/kg所以22200(62663834)15.70510.82810010010496K ⨯-⨯=≈>⨯⨯⨯,所以有99%的有把握认为箱产量与养殖方法有关.(3)因为()()500.0040.0200.04450.34<0.5P x <=++⨯=,()()550.0040.0200.0440.06850.68>0.5P x <=+++⨯=.所以中位数介于5055之间,则新养殖法的箱产量的中位数的估计值为0.50.345052.350.068-+=.2019年1.(2019全国1文17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++.1.解析 (1)由调查数据,男顾客中对该商场服务满意的比率为0.850=,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为300.650=,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯. 由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.。
独立性检验典型题例解析
![独立性检验典型题例解析](https://img.taocdn.com/s3/m/7c2d48045ef7ba0d4b733bac.png)
独立性检验典型题例解析所谓独立性检验,就是要把采集样本的数据,利用公式计算2χ的值,比较与临界值的大小关系,来判定事件A 与B 是否无关的问题。
具体步骤:(1)采集样本数据。
(2)由()21212211222112+++++++-=n n n n n n n n n χ计算2χ的值。
(3)统计推断,当2χ>3.841时,有95%的把握说事件A 与B 有关;当2χ>6.635时,有99%的把握说事件A 与B 有关;当2χ≤3.841时,认为事件A 与B 是无关的。
下面我们通过几个典型例题对独立性检验问题进行剖析,使同学们进一步掌握这类问题的研究方法。
例1、为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据试问色盲与性别是否是相互独立的? 分析:问题归结为二元总体的独立性检验问题。
解:由已知条件可得下表依据公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()5204804495651438644210002⨯⨯⨯⨯-⨯=27.139。
由于27.139>6.635,所以有99%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立的。
评注:根据假设检验的思想,比较计算出的2χ与临界值的大小,选择接受假设还是拒绝假设。
变式引申1:为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人;每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人。
试问患慢性气管炎是否与吸烟量互相独立?分析:即求独立性检验问题。
解:由已知条件得出下表:由公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()4118710512325891698228⨯⨯⨯⨯-⨯=0.994。
高中试卷-专题8.3 列联表与独立性检验(含答案)
![高中试卷-专题8.3 列联表与独立性检验(含答案)](https://img.taocdn.com/s3/m/ba537a6cef06eff9aef8941ea76e58fafab045a1.png)
专题8.3 列联表与独立性检验姓名:班级:重点分类变量与列联表难点独立性检验例1-1.在一次独立性检验中,其把握性超过了%99,则随机变量2K 的可能值为( )。
A 、841.3B 、024.5C 、635.6D 、897.7【答案】D【解析】∵在一次独立性检验中,其把握性超过了%99,对应的临界值表中数值为小于01.0,查表可得01.0)635.6(2=≥K P ,故635.62>K ,故选D 。
例1-2.把两个分类变量的频数列出,称为( )。
A 、三维柱形图B 、二维条形图C 、列联表D 、独立性检验【答案】C【解析】选项A 、B 是粗略地判断两个分类变量是否相关的方法,错,选项C 用两个分类变量的频数列表,对,选项D 是通过列联表计算得到两变量是否相关的方法,错,故选C 。
例1-3.通过随机询问200名性别不同的大学生是否爱好踢毽子运动,计算得到统计量2K 的观测值892.4≈k ,参照附表,得到的正确结论是( )。
)(02k K P ≥100.0050.0025.00k 706.2841.3024.5A 、有%5.97以上的把握认为“爱好该项运动与性别有关”B 、有%5.97以上的把握认为“爱好该项运动与性别无关”C 、在犯错误的概率不超过%5的前提下,认为“爱好该项运动与性别有关”D 、在犯错误的概率不超过%5的前提下,认为“爱好该项运动与性别无关”【答案】C【解析】∵计算得到统计量值2K 的观测值841.3892.4>≈k ,参照题目中的数值表,得到正确的结论是:在犯错误的概率不超过%5的前提下,认为“爱好该运动与性别有关”,故选C 。
例1-4.某22⨯列联表:1y 2y 总计1x 431622052x 13121134总计56283339则随机变量2K 的值为 。
【答案】469.7【解析】469.728356134205)1621312143(33922=⨯⨯⨯⨯-⨯⨯=K 。
专题19 独立性检验(解析版)
![专题19 独立性检验(解析版)](https://img.taocdn.com/s3/m/5999831f66ec102de2bd960590c69ec3d5bbdba1.png)
专题19 独立性检验一、解答题 1.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.(|)(|)P B A P B A 与(|)(|)P B A P B A 的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R . (ⅰ)证明:(|)(|)(|)(|)P A B P A B R P A B P A B =⋅;(ⅰ)利用该调查数据,给出(|),(|)P A B P A B 的估计值,并利用(ⅰ)的结果给出R 的估计值.附22()()()()()n ad bc K a b c d a c b d -=++++,(2)(i )证明见解析;(ii)6R =; 【解析】 【分析】(1)由所给数据结合公式求出2K 的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i )结合已知数据求R . (1)由已知222()200(40906010)=24()()()()50150100100n ad bc K a b c d a c b d -⨯-⨯==++++⨯⨯⨯, 又2( 6.635)=0.01P K ≥,24 6.635>,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. (2) (i)因为(|)(|)()()()()=(|)(|)()()()()P B A P B A P AB P A P AB P A R P B A P B A P A P AB P A P AB =⋅⋅⋅⋅,所以()()()()()()()()P AB P B P AB P B RP B P AB P B P AB =⋅⋅⋅所以(|)(|)(|)(|)P A B P A BRP A B P A B=⋅,(ii)由已知40(|)100P A B=,10(|)100P A B=,又60(|)100P A B=,90(|)100P A B=,所以(|)(|)=6 (|)(|)P A B P A BRP A B P A B=⋅2.(2022·全国·高考真题(文))甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.1000.0500.010 k 2.706 3.841 6.635【答案】(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【解析】【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K,再利用临界值表比较即可得结论.(1)根据表中数据,A共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则24012 ()26013==P M;B共有班次240次,准点班次有210次,设B 家公司长途客车准点事件为N , 则210()27840==P N . A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78.(2) 列联表2()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关. 3.(2021·全国·高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++(2)能. 【解析】根据给出公式计算即可 【详解】(1)甲机床生产的产品中的一级品的频率为15075%200=, 乙机床生产的产品中的一级品的频率为12060%200=. (2)()22400150801205040010 6.63527013020020039K ⨯-⨯==>>⨯⨯⨯, 故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.4.(2022·四川省内江市第六中学模拟预测(理))国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[]0,3,若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如下2×2列联表:前提下认为性别与“是否为‘运动达人’”有关;(2)将此样本的频率估计为总体的概率,随机调查该校的3名男生,设调查的3人中运动达人的人数为随机变量X ,求X 的分布列和数学期望()E X 及方差()D X . 附表及公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表答案见解析,在犯错误概率不超过0.025的前提下,可以认为性别与“是否为‘运动达人’”有关(2)分布列答案见解析,9()5E X =,18()25D X =【分析】(1)根据题意完善2×2列联表,根据卡方公式计算出2K ,结合临界表即可得出结论;(2)根据题意可知随机变量X 满足二项分布,求出对应事件的概率,列出随机变量的分布列,结合二项分别的数学期望和方差公式直接计算即可. (1)由题意,该校根据性别采取分层抽样的方法抽取的100人中,有60人为男生, 40人为女生,据此2×2列联表中的数据补充如下.所以2650506040K ==⨯⨯⨯,又6 5.024>, 所以在犯错误概率不超过0.025的前提下,可以认为性别与“是否为‘运动达人’”有关. (2)由题意可知,该校每个男生是运动达人的概率为363605=, 故35~3,X B ⎛⎫⎪⎝⎭,X 可取的值为0,1,2,3,所以30003238(0)C 55125P X -⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭,311132336(1)C 55125P X -⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭, 322232354(2)C 55125P X -⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭,333332327(3)C 55125P X -⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭. X 的分布列为:∴()355E X =⨯=,3218()35525D X =⨯⨯=. 5.(2022·青海·海东市第一中学模拟预测(文))某公司为了解用户对公司生产的产品的满意度做了一次随机调查,共随机选取了100位用户对其产品进行评分.用户对产品评分情况如表所示(已知满分100分,选取的100名用户的评分分值在区间[)70,100上). 选取的100名用户中男性用户评分情况:(1)分别估计用户对产品评分分值在70,80,80,90,的概率;(2)若用户评分分值不低于80分,则定位用户对产品满意.填写下面的22⨯列联表,并分析有没有95%以上的把握认为用户对产品满意与否与性别有关?参考公式与数据:22()()()()()n ad -bc K a+b c+d a+c b+d =,n a b c d =+++.【答案】(1)1025,, (2)表格见解析,没有95%以上的把握认为用户对产品满意与否与性别有关. 【解析】 【分析】(1)利用古典概型分别去求用户对产品评分分值在[)70,80,[)80,90,[)90,100的概率;(2)先按要求填写22⨯列联表,再计算出2K 并与3.841进行大小比较,进而判断是否有95%以上的把握认为用户对产品满意与否与性别有关. (1)由统计数据得,用户对产品评分分值在[)70,80的概率为71139303=10010010+++=,用户对产品评分分值在[)80,90的概率为18121285011001002+++==,用户对产品评分分值在[)90,100的概率为88222011001005+++==.(2)男性用户有64人,女性用户有36人,根据统计数据得到22⨯列联表:2100(46122418)0.298 3.84164367030K ⨯-⨯=≈<⨯⨯⨯.所以没有95%以上的把握认为用户对产品满意与否与性别有关.6.(2022·全国·模拟预测)某社区为庆祝中国共产党成立100周年,举办一系列活动,通过调查得知其中参加文艺活动与体育活动的居民人数如下表:0.5%的前提下认为参加活动的类型与性别有关? (2)在参加活动的男性居民中,用分层抽样方法抽取7人,再从这7人中随机抽取3人接受采访,记抽到参加文艺活动的人数为X ,求X 的分布列与期望. 附:()()()()2()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)填表见解析;在犯错的概率不超过0.5%的前提下,可以认为参加活动的类型与性别有关(2)分布列见解析;期望为97【解析】 【分析】(1)先直接补齐联列表,然后计算2K ,即可求解;(2)先求出参加文艺活动的应抽取3人,参加体育活动的有4人,则X 的可能取值为0,1,2,3,再求出每个值所对应的概率即可求解 (1)依题意,22⨯列联表如下:275(15103020)2258.0367.8794530354028K ⨯⨯-⨯==≈>⨯⨯⨯,故在犯错的概率不超过0.5%的前提下,可以认为参加活动的类型与性别有关.(2)因为男性居民中参加文艺活动的有15名,参加体育活动的有20名,用分层抽样方法抽取7人,则参加文艺活动的应抽取3人,参加体育活动的有4人,则X 的可能取值为0,1,2,3,所以()()031234343377C C C C 4180,1C 35C 35P X P X ⋅======,()()2133433377C C C 1212,3C 35C 35P X P X ⋅======. 所以X 的分布列为所以()12190123353535357E X =⨯+⨯+⨯+⨯=. 7.(2022·山西大附中三模(文))甲、乙两所学校高三年级分别有1000人,1100人,为了了解两所学校全体高三年级学生高中某学科基础知识测试情况,采用分层抽样方法从两个学校一共抽取了105名学生的该学科成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀. 甲校:(2)由以上统计数据填写下面2×2列联表,若按是否优秀来判断,是否有97.5%的把握认为两个学校的数学成绩有差异?(2)有97.5%的把握认为两个学校的数学成绩有差异 【解析】 【分析】(1)由分层抽样计算甲乙两校分别抽取的人数,结合表格即可求解;(2)补充列联表,计算卡方,根据独立性检验的性质判断. (1)由题可知,采用分层抽样共抽取105人,1000:110010:11=, 所以甲校抽取101055021⨯=人,乙校抽取111055521⨯=人, 故12981010350x +++++++=,解得7x =,231015153155y +++++++=,解得6y =;(2)由频数分布表可得22⨯列联表为所以()210520453010 6.109 5.024********K ⨯⨯-⨯=≈>⨯⨯⨯ 故有97.5%的把握认为两个学校的数学成绩有差异.8.(2022·全国·模拟预测(文))在一次数学考试中,将某班所有学生的成绩按照性别绘制成如下茎叶图,规定;分数不低于125分为优秀.(1)求本次成绩的众数、中位数;(2)从该班中任意抽取一位学生,求该学生成绩优秀的概率;(3)完成下列22⨯列联表,并判断是否有90%的把握认为学生数学成绩是否优秀与性别有关?附:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.(2)1425(3)答案见解析 【解析】 【分析】(1)根据茎叶图可得答案;(2)由图可知,该班有50名学生,成绩优秀的有28名,根据古典概型概率计算公式可得答案; (3)根据茎叶图完成22⨯列联表,代入2K 可得答案. (1)本次成绩的众数为124,中位数为127128127.52+=. (2)由图可知,该班有50名学生,成绩优秀的有28名,所以从该班中任意抽取一名学生,该学生成绩优秀的概率为28145025P ==. (3)22⨯列联表如下,25016131291001.2992822252577⨯⨯-⨯==≈⨯⨯⨯K,因为1.299 2.705<,所以没有90%的把握认为学生数学成绩是否优秀与性别有关.9.(2022·青海西宁·二模(文))第24届冬季奥运会于2022年2月4日在北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为10m(*m∈N),统计得到以下22⨯列联表,经过计算可得2 4.040K≈.(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取9人,再从这9人中抽取2人进行面对面交流,求“至少抽到一名女生”的概率.附:独立性检验临界值表(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【答案】(1)20m=,有95%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关(2)5 6【解析】【分析】(1)根据题意完成表格,再根据公式计算即可;(2) 抽取的9人中男生的人数为4,设为a,b,c,d,女生的人数为5,设为1,2,3,4,5,用列举法求解即可.(1)解:列联表如下表所示:则()()()()()()2220654520 4.0401010119911n ad bc m m m m m mK a b c d a c b d m m m m-⨯-⨯===≈++++⨯⨯⨯⨯ 因为*m ∈N ,可得20m =, 而4.040 3.841>,且4.040 5.024<因此,有95%的把握认为该校学生对冬季奥运会项目的了解情况与性别有关. (2)采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取9人, 这9人中男生的人数为4,设为a ,b ,c ,d ,女生的人数为5,设为1,2,3,4,5,则从这9人中抽取2人的情况有:ab ,ac ,ad ,1a ,2a ,3a ,4a ,5a ,bc ,bd ,1b ,2b ,3b ,4b ,5b ,cd ,1c ,2c ,3c ,4c ,5c ,1d ,2d ,3d ,4d ,5d ,12,13,14,15,23,24,25,34,35,45,共36种;其中这2人中至少抽到一名女生的有1a ,2a ,3a ,4a ,5a ,1b ,2b ,3b ,4b ,5b ,1c ,2c ,3c ,4c ,5c ,1d ,2d ,3d ,4d ,5d ,12,13,14,15,23,24,25,34,35,45,共30种.所以这9人中抽取2人进行面对面交流,“至少抽到一名女生”的概率为305366P ==. 10.(2022·吉林·洮南市第一中学模拟预测(文))某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如表:(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++,【答案】(1)见解析 (2)815【解析】 【分析】(1)由公式计算出2K 值,与题中所给的值进行比较可得答案;(2)根据分层抽样的定义可知样本中有4个男生,2个女生,然后利用古典概型的概率公式求解可得答案. (1)由公式可得()2255202010511.9787.87930252530K ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%的把握认为喜欢“应用统计”课程与性别有关.(2)设所抽样本中有m 个男生,则63020m=,得4m =,所以样本中有4个男生,2个女生,分别记作1B ,2B ,3B ,4B ,1G ,2G ,从中任选2人的基本事件有()12,B B ,()13,B B ,()14,B B ,()11,B G ,()12,B G ,()23,B B ,()24,B B ,()21,B G ,()22,B G ,()34,B B ,()31,B G ,()32,B G ,()41,B G ,()42,B G ,()12,G G ,共15个,其中恰有1个男生和1个女生的事件有()11,B G ,()12,B G ,()21,B G ,()22,B G ,()31,B G ,()32,B G ,()41,B G ,()42,B G ,共8个, 所以恰有1个男生和1个女生的概率为815. 11.(2022·河南·平顶山市第一高级中学模拟预测(文))2021年10月1日是中华人民共和国第72个国庆日,很多人通过短视频APP 或微信、微博表达了对祖国的祝福.某调查机构为了解通过短视频APP 或微信、微博表达对祖国祝福的人们是否存在年龄差异,将年龄不低于45岁的人称为中老年,低于45岁的人称为青少年.通过不同途径调查了数千个通过短视频APP 或微信、微博表达对祖国祝福的人,并从参与者中随机选出400人.经统计这400人中通过微信、微博表达对祖国祝福的有320人,其中中老年占25,这400人中通过短视频APP 表达对祖国祝福的青少年有28人.(1)完成下列22⨯列联表,并判断是否有99.9%的把握认为通过短视频APP 或微信、微博表达对祖国的祝福与年龄有关?5人,再从这5人中随机抽取2人,求这2人中恰好有一个是青少年的概率. 附:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表答案见解析,有99.9%的把握认为通过短视频APP 或微信、微博表达对祖国的祝福与年龄有关(2)35【解析】 【分析】(1)首先完成22⨯列联表,再计算2K 即可得到答案. (2)根据古典概型公式求解即可. (1)由题意得22⨯列联表:()2400281285219216.16210.82880320220180K ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.9%的把握认为通过短视频APP 或微信、微博表达对祖国的祝福与年龄有关. (2)抽取的5人中,青少年:51923320⨯=人,记为a ,b ,c ; 中老年:51282320⨯=人,记为d ,e . 从这5人中随机抽取2人有(a ,b ),(a ,c ),(a ,d ),(a ,e ),(b ,c ),(b ,d ), (b ,e ),(c ,d ),(c ,e ),(d ,e ),共10种情况.其中恰好有一个是青少年的有(a ,d ),(a ,e ),(b ,d ),(b ,e ),(c ,d ),(c ,e ), 共6种情况.所以这2人中恰好有一个是青少年的概率63105P ==. 12.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:把千粒质量不低于200克的大豆视为籽粒饱满,否则视为籽粒不饱满. (1)判断是否有97.5%的把握认为大豆籽粒饱满与播种日期有关?(2)从A ,B 两块实验田中各抽取一份大豆,求抽取的大豆中至少有一份籽粒饱满的概率;(3)用样本估计总体,从A 试验田随机抽取100份(每份千粒)大豆,记籽粒饱满的份数为X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.(2)1625(3)()55E X =,99()4=D X 【解析】 【分析】(1)根据完成列联表,然后根据公式()()()()()22n ad bc K a b c d a c b d -=++++计算2K ,再与临界值表比较可得结论,(2)A ,B 两块实验田中各抽取一份大豆中,籽粒饱满的概率分别为111,,205两份大豆都籽粒不饱满的概率为94920525⨯=,再结合对立事件概率和为1求解即可; (3)根据已知条件,结合二项分布的期望与方差公式,即可求解. (1)22⨯列联表为()()()()()()22240111649 5.227 5.024********n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯,所以有97.5%的把握认为大豆籽粒饱满与播种日期有关. (2)A ,B 两块实验田中各抽取一份大豆, 抽取的大豆中有一份籽粒饱满的概率分别为1120,15, 两份大豆籽粒都不饱满的概率为111911,20525⎛⎫⎛⎫-⨯-= ⎪ ⎪⎝⎭⎝⎭故抽取的大豆中至少有一份籽粒饱满的概率为91251625-=. (3)从A 试验田的样本中随机抽取1份小麦,抽到饱满的概率为1120, 则11~(100,)20X B ,故11()1005520=⨯=E X , 111199()100(1)20204=⨯⨯-=D X . 13.(2022·山东·德州市教育科学研究院三模)某学校对男女学生是否喜欢长跑进行了调查,调查男女生人数均为()*10n n ∈N ,统计得到以下2×2列联表,经过计算可得2 4.040K ≈.(2)①为弄清学生不喜欢长跑的原因,采用分层抽样的方法从调查的不喜欢长跑的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,求“至少抽到一名女生”的概率;②将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对长跑喜欢的人数为X ,求X 的数学期望. 附表:附:()()()()2n ad bc K a b c d a c b d -=++++. 【答案】(1)列联表答案见解析,20n =,有95%的把握认为该校学生对长跑喜欢情况与性别有关; (2)①2021;②112. 【解析】 【分析】(1)利用给定数据完善2×2列联表,计算2K 的观测值即可求出n ,再与临界值表比对作答.(2)①利用分层抽样求出抽取的9人中男女生人数,再利用古典概型结合对立事件概率求解作答;②利用二项分布的期望公式计算作答. (1)2×2列联表如下表所示:220(6545)20 4.040101011999n n n n n n K n n n n ⨯⨯-⨯==≈⨯⨯⨯,而*n ∈N ,于是得20n =,又2 4.040 3.841K ≈>,所以有95%的把握认为该校学生对长跑喜欢情况与性别有关. (2)①采用分层抽样的方法从调查的不喜欢长跑的学生中随机抽取9人,这9人中男生的人数为4,女生的人数为5,再从这9人中抽取3人进行面对面交流,“至少抽到一名女生”的概率为3439C 42011C 8421P =-=-=; ②由(1)知,任抽1人喜欢长跑的概率1120p =, 依题意,11~(10,)20X B ,所以X 的数学期望是1111()10202E X =⨯=. 14.(2022·四川省泸县第二中学模拟预测(理))中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了50名学生进行调查,调查样本中有20名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“嫦娥五号”的部分).“嫦娥五号”的关注程度与性别有关”?(2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量X,求X的分布列及数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.”关注程度与性别有关(2)分布列见解析,数学期望为9 10【解析】【分析】(1)根据题意中的等高条形图完善22⨯列联表,结合卡方公式计算出2K,比较临界值,利用独立性检验的思想即可得出结论;(2)根据二项分布求出随机变量对应的概率,结合求二项分布数学期望公式计算即可. (1)22⨯列联表如下:所以()()()()()2n ad bc K a b c d a c b d -=++++ ()250151415612001.970 3.84121293020609⨯-⨯==≈<⨯⨯⨯, 所以没有95%的把握认为对“嫦娥五号”关注程度与性别有关. (2)因为随机选一个高三的女生,对此事关注的概率为1234010P ==, 由题意可知随机变量X 满足二项分布,即33,10XB ⎛⎫ ⎪⎝⎭, 所以有()3333C 11010kkk P X k -⎛⎫⎛⎫==- ⎪⎪⎝⎭⎝⎭.所以随机变量X 的分布列为:故()31010E X np ==⨯=. 15.(2022·青海·大通回族土族自治县教学研究室三模(文))如今大家对运动越来越重视,讨论也越来越多,时常听到有人说“有氧运动”和“无氧运动”,有氧运动主要的作用是健身,而无氧运动主要的作用是塑形,一般的健身计划都是有氧运动配合无氧运动以达到强身健体的目的.某健身机构对其60位会员的健身运动进行了一次调查,统计发现有氧运动为主的有42人,30岁以下无氧运动为主的有12人,占30岁以下调查人数的25.(1)根据以上数据完成如下22⨯列联表;附:参考公式:()()()()()2n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)答案见解析(2)没有99%的把握认为运动方式与年龄有关【解析】【分析】(1)根据题干所给数据完善列联表;(2)由(1)中列联表计算出卡方,即可判断;(1)解:依题意可得30岁以下的有212305÷=人,则30岁以上的有603030-=人,所以22⨯列联表如下表所示:(2)由题意,()26024121862.857 6.63542183030K⨯⨯-⨯=≈<⨯⨯⨯,所以没有99%的把握认为运动方式与年龄有关.16.(2022·四川省宜宾市第四中学校模拟预测(文))为了助力北京2022年冬奥会、冬残奥会,某校组织全校学生参与了奥运会项目知识竞赛.为了解学生的竞赛成绩(竞赛成绩都在区间[50,100]内)的情况,随机抽取n名学生的成绩,并将这些成绩按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成了如图所示的频率分布直方图.其中[50,60),[60,70),[70,80)三组的频率成等比数列,且成绩在[90,100]的有16人.(1)求n 的值;(2)在这n 名学生中,将成绩在[80,100]的学生定义为“冬奥达人”,成绩在[50,80)的学生定义为“非冬奥达人”.请将下面的列联表补充完整,并判断是否有99%的把握认为“是否是冬奥达人与性别有关”?并说明你的理由.参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 临界值表:(2)列联表见解析,有,理由见解析【解析】【分析】(1)根据题意列出相应的方程,求得公比,即可求得答案;(2)根据题意结合频率分布直方图可得列联表,计算2K 的观测值k ,和临界值表比较,可得答案.(1)由题意知[50,60),[60,70),[70,80)三组的频率成等比数列,设公比为(1)q q >,则20.080.080.080.280.081q q q ++++=,解得2q 或4q =-(舍去),则[90,100]这一组的频率为0.0820.16⨯=,由题意知160.16n=,解得100n =.(2)成绩在[50,80)的人数为(0.080.160.32)10056++⨯=,成绩在[80,100]的人数为44.补充完整的列联表如下:计算得2K 的观测值10.390 6.6355050564477k ==≈>⨯⨯⨯, 故有99%的把握认为“是否是冬奥达人与性别有关”.17.(2022·福建漳州·三模)漳州布袋木偶戏是传统民俗艺术,2006年被列入首批国家非物质文化产保护,据《漳州府志》记载,漳州地区在宋代就已经有布袋木偶戏了,清朝中叶后,布袋木偶戏开始进入兴盛时期,一直到抗日战争前,漳州的龙溪、漳浦、海澄、长泰等县,几乎乡乡都有布袋木偶戏,在传承的基础上,不断创新和发展壮大,走向更广阔的世界,为了了解民众对布袋木偶戏的了解程度,某单位随机抽取了漳州地区男女各100名市民,进行问卷调查根据调查结果绘制出得分条形图,如图所示形图,完成22⨯联表,并根据列联表,判断能否有90%的把握认为对布袋木偶戏的了解程度与性别有关?(2)恰逢三八妇女节,该单位对参与调查问卷的女市民制定如下抽奖方案;得分低于60分的可以获得1次抽奖机会,得分不低于60分的可以获得2次抽奖机会,每次抽奖结果相互独立,在一次抽奖中,获得一个木偶纪念品的概率为13,获得两个木偶纪念品的概率为16,不获得木偶纪念品的概率为12,在这100名女市民中任选一人.记X 为她获得木偶纪念品的个数,求X 的分布列和数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++ 参考数据.(2)分布列见解析;期望为76【解析】【分析】(1)直接根据题意即可完成表格,计算出2K 的值即可得结果;(2)求出得分低于60分的概率,列出X 的可能取值,分别求出对应的概率,即可得分布列和数学期望.(1)2×2列联表如下:假设0H :对布袋木偶戏的了解程度与性别无关,根据列联表的数据,可以求得 ()222003575256550 2.381 2.7061001006014021K ⨯⨯-⨯===<⨯⨯⨯, 故没有90%的把握认为对布袋木偶戏的了解程度与性别有关,.(2)在这100名女市民中任选一人,得分低于60分的概率为2511004=,得分不低于60分的概率为7531004=,X 的所有取值为0,1,2,3,4,.()1131113504242281616P X ==⨯+⨯⨯=+= ()11311131124343212123P X ==⨯+⨯⨯⨯=+= ()11311311122464334624P X ==⨯+⨯⨯+⨯⨯⨯=()31113246312 P X==⨯⨯⨯= ()3111446648 P X==⨯⨯=所以X的分布列为故()5111111117 0123416341248324126E X=⨯+⨯+⨯+⨯+⨯=+++=.18.(2022·陕西·宝鸡中学模拟预测(理))2020年至今,因为新冠病毒的肆虐,各地不停地按下暂停键,居家隔离期间,人们对社会的依赖,对政府部门的期待也达到了前所未有的高度.某机构对封管区居民对政府部门的态度进行了一项网络调查,并随机抽取了100份问卷进行了成绩统计,得到下表,规定成绩在[]70,100为满意.状相同的4个白球,4个红球的口袋中,一次摸4个球,如果摸到2个红球获得20元话费,摸到3个红球获得50元话费,4个都是红球获得100元话费,某人参加了问卷调查,他获得的话费为X元,求X的分布列及数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++(2)分布列见解析;数学期望()1627E X =【解析】【分析】 (1)由表格数据补全列联表即可;由列联表计算可得2 3.683 2.706K ≈>,由此可得结论;(2)首先确定X 所有可能的取值,并计算得到每个取值对应的概率,由此可得分布列;利用数学期望公式计算可得期望.(1)由表格数据可得22⨯列联表如下:由列联表计算得:)2210020202535 3.683 2.70655454555K ⨯⨯-⨯=≈>⨯⨯⨯, ∴有90%的把握认为满意度与年龄有关.(2)由题意知:X 所有可能的取值为0,20,50,100;()13444448C C C 170C 70P X +===;()224448C C 361820C 7035P X ====;()314448C C 16850C 7035P X ====;()4448C 1100C 70P X ===; X ∴的分布列为:则数学期望()02050100703535707E X =⨯+⨯+⨯+⨯=. 19.(2022·湖南·长沙县第一中学模拟预测)2021年9月,教育部印发《关于全面加强和改进新时代学校卫生与健康教育工作的意见》中指出:中小学生各项身体素质有所改善,大学生整体下降.某高校为提高学生身体素质,号召全校学生参加体育锻炼运,结合“微信运动”APP 每日统计运动情况,对每日平均运动10000步或以上的学生授予“运动达人”称号,低于10000步称为“参与者”,统计了200名学生在某月的运动数据,结果如下:0.1的前提下认为获得“运动达人”称号与性别有关?(2)从全校运动“参与者”中按性别分层抽取8人,再从8人中选取3人参加特训,将男生人数记为X ,求X 的分布列与期望EX .参考公式:()()()()()22n ad bc X a b c d a c b d -=++++,n a b c d =+++.(2)分布列见解析;期望为158 【解析】【分析】(1)先完善列联表,通过卡方检验中计算2X 与2.706比较大小从而判断在犯错误概率不超过0.1的前提下认为获得“运动达人”称号与性别的相关性;(2)判断X 服从超几何分布概型,得到X 的分布列与期望E (X ).(1)由题意完善23⨯列联表:运动达人参与者合计男生7050[20此时:()2220070305050250.35 2.706120801208072X ⨯⨯-⨯==≈<⨯⨯⨯. 所以:在犯错误概率不超过0.1的前提下不能认为获得“运动达人”称号与性别有关;(2)由题意知:选取的8人运动参与者中男生5人,女生3人则X 服从超几何分布,X 的所有可能情况为:0、1、2、3且()05381056C P X C ===,()31258315156C C P X C ⋅===。
独立性检验(历年高考)练习题
![独立性检验(历年高考)练习题](https://img.taocdn.com/s3/m/14b4d00f2f60ddccdb38a017.png)
精选历年高考题:独立性检验练习题1. 为了解某班学生喜爱打篮球是否与性别有关,对本班60人进行了问卷调查得到了如下的2×2列联表:(I)用分层抽样的方法在喜爱打篮球的学生中抽6人,其中男生抽多少人?(II)在上述抽取的人中选2人,求恰有一名女生的概率;(III)你是否有95%的把握认为喜爱打篮球与性别有关?说明你的理由。
下面的临界值表供参考:2. 2014年山东省第二十三届运动会将在济宁召开,为调查我市某校高中生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了50人,结果如下:(I)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?(II)在(I)中抽取的6人中任选2人,求恰有一名女生的概率;(III)你能否有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:独立性检验统计量()()()()(),22dbcadcbabcadnK++++-=其中.dcban+++=3. 为调查某市学生百米运动成绩,从该市学生中按照男女比例随机抽取50名学生进行百米测试,学生成绩全部都介于13秒到18秒之间,将测试结果按如下方式分成五组,第一组[),14,13第二组[)15,14, 第五组[]18,17,如图是按上述分组方法得到的频率分布直方图.(1)设n m ,表示从第一组和第五组的所有学生中任意抽取的两名学生的百米测试成绩,即[)[]18,1714,13,⋃∈n m ,求事件“2>-n m ”的概率;(2)根据有关规定,成绩小于16秒为达标.如果男女生使用相同的达标标准,则男女生达标情况如下表:男 女 总计 达标a=24 b=_____ _____ 不达标c=_____ d=12 _____ 总计 _____ _____ n=50完成上表,并根据上表数据,能否有99﹪的把握认为“体育达标与性别有关”? 参考公式:()()()()().,22d c b a n d b c a d c b a bc ad n K +++=++++-=其中 参考数据:。
独立性检验高考题
![独立性检验高考题](https://img.taocdn.com/s3/m/f3117be76294dd88d0d26bca.png)
独立性检验1、(09辽宁文)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm )的值落在[29.94,30.06)的零件为优质品。
从两个分厂生产的零件中各抽出500件,量其内径尺寸,的结果如下表:甲厂:乙厂:(1) 试分别估计两个分厂生产的零件的优质品率;(2) 由以上统计数据填下面22⨯列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量附:2112212211212()()0.050.01,3.841n n n n n p x k x n n n n k ++++-≥ = 6.6352、(2010辽宁理科)为了比较注射A, B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。
(Ⅰ)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(Ⅱ)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表(ⅰ)完成下面频率分布直方图,并比较注射两种药物后疱疹面积的中位数大小;(ⅱ)完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:3、(2012辽宁理科)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查。
下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”。
(Ⅰ)根据已知条件完成下面的列联表,并据此资料你是否认为“体育迷”与性别 有关?(Ⅱ)将上述调查所得到的频率视为概率。
现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X 。
若每次抽取的结果是相互独立的,求X 的分布列,期望和方差。
附:22⨯()E X ()D X 22112212211212(),n n n n n n n n n χ++++-=。
7独立性检验习题简单
![7独立性检验习题简单](https://img.taocdn.com/s3/m/a2c8ccce9a89680203d8ce2f0066f5335a81672b.png)
7独立性检验习题简单独立性检验习题一、选择题(共14小题;共70分)1. 某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了人,计算发的观测值现,根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系这一断言犯错误的概率不超过A. B. C. D. 名 2. 某企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了员工进行调查,所得的数据如表所示:合计积极支持改革不太支持改革工作积极工作一般合计对于人力资源部的研究项目,根据上述数据能得出的结论是时,有的把握说(参考公式与数据:.当时认为有关;当与时,有的把握说事件事件与有关;当无关.)与事件A. 有的把握说事件与有关B. 有的把握说事件与有关C. 有的把握说事件与有关D. 事件与无关 3. 通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好不爱好合计,方公式算得:由附表:参照附表:得到的正确的结论是的前提下,认为”“爱好该运动与性别无关A. 在犯错的概率不超过B. 在犯错的概率不超过的前提下,认为爱好该运动与性别有关”“”爱好该运动与性别有关“以上的把握认为有C.D. 有以上的把握认为“爱好该运动与性别无关” 4. 通过随机询问名不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计.计算得,由附表:参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别有关”B. 有以上的把握认为“爱好该项运动与性别有无关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关” 5. 某医疗研究所为了检验新开发的流感疫苗对甲型流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作比较,提出假设:“这种疫苗不能起到,则下列说法正确的是,并计算出预防甲型流感的作用”A. 这种疫苗能起到预防甲型流感的有效率为;B. 若某人未使用该疫苗,则他在半年中有的可能性得甲型;C. 有的把握认为“这种疫苗能启动预防甲型流感的作用”;D. 有的把握认为“这种疫苗能启动预防甲型流感的作用”. 6. 考察棉花种子经过处理跟生病之间的关系,得到下表中的数据:种子经过处理种子未处理合计得病不得病合计根据以上数据可以判断B. A. 种子经过处理跟是否得病有关种子经过处理跟是否得病无关D. 以上都是错误的C. 种子是否经过处理决定是否得病7. 某校为了研究“学生的性别”和“对待某项运动的喜爱程度”是否有关,运用列联表进行独立,则认为“学生性别与对待某项运动的喜爱程度有关系”的犯错误的概性检验,经计算率不超过附:A. D. C.B.8. 某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用的把握认为,则所得到的统计学结论是:有列联表进行独立性检验,经计算“学生性别与支持该活动有关系”.B. C. D. A. 9. 利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的列联表,由计算可得大学生是否爱好某项运动,利用参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别无关”B. 有以上的把握认为“爱好该项运动与性别有关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”10. 下列说法中正确的是的观测值越大,则“与若分类变量和的随机变量相关”的可信程度越小A.B. 对于自变量和因变量,当取值一定时,的取值具有一定的随机性,,间的这种非确定关系叫做函数关系越接近,表明两个随机变量线性相关性越弱C. 相关系数的观测值越小,则两个分类变量有关系的把握性越小 D. 若分类变量与的随机变量11. 通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计.由算得,附表:参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别有关”B. 有以上的把握认为“爱好该项运动与性别无关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”列联表:的和假设有两个分类变量12.总计总计有关系的可能性最大的一组为对同一样本,以下数据能说明与C. ,,D. , A. , B. 13. 某同学利用课余时间做了一次社交软件使用习惯调查,得到列联表如下:偏爱微信偏爱合计岁以下岁以上合计则下列结论正确的是A. 在犯错误的概率不超过的前提下认为社交软件使用习惯与年龄有关B. 在犯错误的概率超过的前提下认为社交软件使用习惯与年龄有关C. 在犯错误的概率不超过的前提下认为社交软件使用习惯与年龄有关D. 在犯错误的概率超过的前提下认为社交软件使用习惯与年龄有关14. 随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了位育龄妇女,结果如表.非一线一线总计愿生不愿生总计附表:.参照附表,得到的正确结论是由算得,A. 在犯错误的概率不超过的前提下,认为“生育意愿与城市级别有关”B. 在犯错误的概率不超过的前提下,认为“生育意愿与城市级别无关”C. 有以上的把握认为“生育意愿与城市级别有关”D. 有以上的把握认为“生育意愿与城市级别无关”二、填空题(共4小题;共20分)某高校《统计学初步》课程的教师随机调查了选该课的一些学生的情况,具体数据见下表:15. 非统计专业统计专业合计男女合计为了判断主修统计专业是否与性别有关系,根据表中的数据求得,所以主修统计专业与性别有关系.这种判断出错的可能性为..因为16. 为了研究服用某种新药是否会患某种慢性病,调查了名服用此种新药和名未服用此种新药的人,调查结果见下表:患慢性病未患慢性病合计服用新药未服用新药合计.根据列联表中的数据可得17. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了名电视观众,相关的数据如表所示:总计文艺节目新闻节目岁至岁大于岁总计由表中数据直观分析,收看新闻节目的观众是否与年龄有关(填“是”或“否”).18. 若两个分类变量与的列联表为:总计总计则“与之间有关系”这个结论出错的概率为.三、解答题(共2小题;共26分)19. 某同学对本市一家妇产科医院在一天中男、女孩的出生时间进行了调查,他把一天的时间分为白天至与晚上至次日,然后作出了出生时间和性别之间的独立性检验,并得出如下结论:有的把握认为“性别与出生时间有关”,请你解释这个结论.20. 为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了个样本,统计结果为:服用药的共有个样本,服用药但患病的仍有个样本,没有服用药且未患病的有个样本.(1)根据所给样本数据画出列联表;(2)请问能有多大把握认为药物有效?。
独立性检验练习含答案
![独立性检验练习含答案](https://img.taocdn.com/s3/m/5a41433aeef9aef8941ea76e58fafab069dc44e3.png)
独立性检验练习含答案一、基础过关1. 5 2×2.706 时,就有 的把握认为“x与y 百大系”。
2.在某医院,由于意心解病而住院的 665名男性病人中,有 214人类殖,而另外772名不是由于忠心鼓励自住院的男性病人中有175人先项,统 计~ (结果保留 3位小数)①ad b c 接小,说明X 与Y 的关系线段. ②ad -bc 越大,说明X 与Y 的关系越来。
②[ad -bo]'越大,说明X 与Y 的关系基础. ①(ad -bc)²能按照下0.说明x 与Y 的关系解析.4. 请对随机询问110名性别有限的血拉工品五级每上项目sh ,是到up 下的网联表:lna −n (ad−log 3)(a+b/c+d/a+c ]b+d其中 xx =110×(40×30−20×20)60×50×60×50=7.8参照班表,得到的正确结论是 .②在配错误的概率不超过 0.1%的前提下,认为“爱好该难运动与性别无关”。
③有 99%以上的把握认为“爱好该项运动与性别有关”。
①有 99%以上的把握认为“爱好该项运动与性别无关”。
3.分类型是 X 和Y填序号)进入.5.为了争辩男子的年龄与吸烟的关系,并查了100个男子,按年龄超过和不超过40岁.0烟就有 的把握确定吸烟量与年龄有关。
二、才能提升为了判定上修统计专业是否与性别有关,依据表示的数据,智可能性为 .7.0.2×2列联表中,如哪个数据变为较大的20.认中方们交入课 文的 。
B.以下说法正确选项 .(填序号)00对大事A 与B 的检验无关,即两个大事无不影响. ②大事A 与B 关系越宗热, x 就越大.③义的大小处判定大事 A 与B 是否相关的参一数据. ④如判定两大事 A 与8有关,就 A 发生8确定发生。
9.为争辩某新药的疗效,输无论 “” 。
”4124 46 36 50 ␡ “ “ -- 21 79 400设 H 。
专题11 独立性检验(解析版)
![专题11 独立性检验(解析版)](https://img.taocdn.com/s3/m/01f664f74b73f242326c5f6f.png)
专题11 独立性检验例1.2019年11月5日至10日,第二届中国国际进口博览会在上海举行.某宣传媒体组织业内人士对某型号智能机器人进行评分,所得情况如图所示:(Ⅰ)试估计业内人士评分的平均数以及方差(用每个小矩形底边中点近似替代本组数据);参考公式:(1)2()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.(2)2221122()()()n n DX x EX p x EX p x EX p =-⨯+-⨯+⋯+-⨯. 参考数据:2.072【解析】解:(Ⅰ)依题意,所求平均数为300.1500.3700.4900.2315281864⨯+⨯+⨯+⨯=+++=, 方差为2222(3064)0.1(5064)0.3(7064)0.4(9064)0.2115.658.814.4135.2324-⨯+-⨯+-⨯+-⨯=+++=. (Ⅱ)由题意完善22⨯列联表如下:∴260(14201016)10 2.706243630309K ⨯⨯-⨯==<⨯⨯⨯,∴没有90%的把握认为评分的高低与性别有关.例2.某校举行了一次数学竞赛,为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为)n 进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,已知得分在[50,60),[90,100]的频数分别为16,4.(Ⅰ)求样本容量n 和频率分布直方图中的a ,b 的值;(Ⅱ)估计本次竞赛学生成绩的平均数(同一组中的数据用该组区间的中点值代表);(Ⅲ)在选取的样本中,若男生和女生人数相同,我们规定成绩在70分以上称为“优秀”,70分以下称为“不优秀”,其中男女生中成绩优秀的分别有24人和30人,请完成列联表,并判断是否有90%的把握认为“学生的成绩优秀与性别有关”?附:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)由题意可知,样本容量161000.01610n ==⨯,40.00410010b ==⨯,0.1000.0040.0100.0160.0400.030a =----=.(Ⅱ)设本次竞赛学生成绩的平均数为x ,则(0.016550.030650.040750.010850.00495)1070.6x =⨯+⨯+⨯+⨯+⨯⨯=.(Ⅲ)100位学生中男女生各有50名,成绩优秀共有54名,所以学生的成绩优秀与性别列联表如下表:22100(24203026)1001.4492.7065050465469K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有90%的把握认为“学生的成绩优秀与性别有关”.例3.某健身馆为了宣传健身效果,吸引顾客,特别请专业的评估机构对他们500名学员的锻炼成果进行评估打分(满分100分),并且认为评分不低于80分的参与者为健身达人,得到如表:(Ⅰ)判断能否在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系?(Ⅱ)若500名学员中40岁以上的有100人,30岁到40岁的有300人,30岁以下的100人,先从中分层抽取5人进行抽奖活动,再从这5人中抽取两位对其进行全年免单活动,求两人全年免单都在30岁到40岁之间的概率是多少? 附:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. 【解析】解:(Ⅰ)因为22500(20015050100)83.33310.828250250200300K ⨯⨯-⨯=≈>⨯⨯⨯,所以能在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系.(Ⅱ)根据分层抽样可知在40岁以上的学员中应抽取1人,记为a ;在30岁到40岁的学员中应抽取3人,记为A ,B ,C ;在30岁以下的学员中应抽取1人,记为b ,则从这5人中抽取2人,所有可能情况如下:(,)a A ,(,)a B ,(a ,)(C a ,)b ,(,)A B ,(,)A C ,(,)A b ,(,)B C ,(,)B b ,(,)C b共10种情况,2人都在30岁到40岁之间的有(,)A B ,(,)A C ,(,)B C 共3种情况, 所以两人全年免单都在30岁到40岁之间的概率310P =. 例4.某公司为了推广某项技术,对旗下200名员工的年龄和人数进行了统计,统计其对这项技术的接受程度,从而为后期宣传工作做准备,并绘制了如下频率分布直方图.(Ⅰ)根据如图求样本年龄的中位数和平均数(同一组中的数据用该组区间的中点值为代表)(保留两位小数);(Ⅱ)若将样本分为两个年龄段,年龄在区间[18,38)和[38,68]分别称为“青少年”和“中老年”,根据相关条件完成下表,并判断是否有95%的把握认为对新技术接受程度与年龄段有关?参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:3.841【解析】解:(Ⅰ)根据频率分布直方图可知样本年龄的平均数230.01010330.02010430.03010530.02510630.0151044.50x =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=.设样本年龄的中位数为x ,由题知组距为10, [18,38)的频率为(0.0100.020)100.300.5+⨯=<,[18,48)的频率为0.300.030100.600.5+⨯=>,所以中位数在区间[38,48)内,所以(38)0.030100.50.3x -⨯⨯=-, 即238~38.673x =+, 所以样本年龄的平均数为44.50,中位数为38.67.(Ⅱ)由题意知,样本中的“青少年”共有200(0.0100.020)1060⨯+⨯=(人), 则“中老年”共有20060140-=(人). 根据频率分布直方图完成列联表如下:则:22()200(20704070) 4.714 3.841()()()()9011060140n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯,所以有95%的把握认为对新技术接受程度与年龄段有关.例5.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(Ⅰ)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率; (Ⅱ)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关? 附:22()()()()()n ad bc k a b c d a c b d -=++++,【解析】解:(Ⅰ)由题意知,40人中该日走路步数超过5000步的有35人,频率为357408=, 所以估计他的所有微信好友中每日走路步数超过5000步的概率为78; (Ⅱ)由表中数据,填写列联表如下;计算观测值240(141268)403.8412020221811K ⨯⨯-⨯==<⨯⨯⨯, 所以没有95%以上的把握认为“评定类型”与“性别”有关.例6.为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表表2:女生上网时间与频数分布表(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的22⨯列联表(此表应画在答题卷上),并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率. 表3:附:2()()()()k a b c d a c b d =++++,其中n a b c d =+++0.455【解析】解:(1)设估计上网时间不少于60分钟的人数x , 依据题意有30750100x =,解得:225x =, 所以估计其中上网时间不少于60分钟的人数是225人;⋯(4分) (2)根据题目所给数据得到如下列联表:其中22200(6034070)2002.198 2.7061001001307091K ⨯⨯-⨯==≈<⨯⨯⨯,因此,没有90%的把握认为“学生周日上网时间与性别有关”; ⋯(8分) (3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为3:2, 所以5人中上网时间少于60分钟的有3人,记为A 、B 、C , 上网时间不少于60分钟的有2人,记为d 、e , 从中任取两人的所有基本事件为:AB 、AC 、Ad 、Ae 、BC 、Bd 、Be 、Cd 、Ce 、de 共10种,其中“至少有一人上网时间超过60分钟”包含了7种, 故所求的概率为710P =. ⋯(12分) 例7.某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z ,女性人数为2z ,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的1.(1)完成22⨯联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费(0)m m >元.甲团队研发的药物每次接种后产生抗体的概率为p ,根据以往试验统计,甲团队平均花费为226mp m -+;乙团队研发的药物每次接种后产生抗体的概率为q ,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发? 附:22()()()()()n ad bc K a b c d a c b d -=++++【解析】解:(1)根据题意填写列联表如下;若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则225423()263637.879333222z z z z z z K z z z z-==>,解得11.8185z >,由*6z N ∈,且*3zN ∈,所以z 的最小值为12,即男性患者至少有12人; (2)设甲研发试验品花费为X ,则2()26E X mp m =-+; 设乙研发试验品花费为Y ,则Y 的可能取值为3m 、6m , 所以223323(3)(1)23P Y m C q q q q q ==-+=-+,32(6)123P Y m q q ==+-,所以323232()3(23)6(123)696E Y m q q m q q mq mq m =-+++-=-+; 因为2p q=,所以322322322()()696266926(61)E Y E X mq mq m mp m mq mq mp mq mq mq q -=-++-=-+=-=-; ①当106q <<时,610q -<,因为0m >,所以2(61)0mq q -<,所以()()E X E Y >,乙团队试验的平均花费较少,所以选择乙团队进行研发;②当116q <<时,610q ->,因为0m >,所以2(61)0mq q ->,所以()()E X E Y <,甲团队试验的平均花费较少,所以选择甲团队进行研发; ③当16q =时,2(61)0mq q -=,所以()()E X E Y =,甲团队试验的平均花费和乙团队试验的平均费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.例8.某房产中介统计了深圳市某高档小区从2018年12月至2019年11月当月在售二手房均价(单位:万元/平方米)的散点图,如图所示,图中月份代码1至12分别对应2018年12月至2019年11月的相应月份.根据散点图选择y a bx =+和y c dlnx =+两个模型进行拟合,根据数据处理得到两个回归方程分别为ˆ 6.90570.0195yx =+和ˆ 6.86390.1012y lnx =+,并得到以下一些统计量的值:(1)请利用相关指数2R 判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年5月份购买深圳市福田区(50160)s s 平方米的二手房(欲购房为其家庭首套房).若该小区所有住房的房产证均已满3年,请你利用(1)中拟合效果更好的模型解决以下问题: ()i 估算该购房者应支付的购房金额.(购房金额=房款+税费;房屋均价精确到0.01万元/平方米) ()ii 若该购房者拟用不超过760万元的资金购买该小区一套二手房,试估算其可购买的最大面积(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按照房屋的计税价格进行征收.(计税价格=房款)征收方式见如表:1%2%参考数据:20.69ln ≈,3 1.10ln ≈,7 2.83ln ≈,19 2.94ln ≈ 1.41≈,3 1.73≈ 4.12≈ 4.36≈,参考公式:相关指数22121ˆ()1()nii i nii i y yR yy ==-=--∑∑.【解析】解:(1)设模型ˆ 6.90570.0195yx =+和ˆ 6.86390.1012y lnx =+的相关指数分别是21R 和22R , 则210.014855710.069193R =-,220.004878110.069193R =-,0.01485570.0048781>,∴2212R R <,∴模型ˆ 6.86390.1012ylnx =+的拟合效果更好. (2)2020年5月份的对应月份代码为18,由(1)知,模型ˆ 6.86390.1012ylnx =+的拟合效果更好, 利用该模型预测可得,这个小区2020年5月份的在售二手房均价为: ˆ 6.86390.1012187.16yln =+≈万元/平方米, ()i 设该购房者应支付的购房金额为h 万元,税费中买方只需缴纳契税,∴①当5090s 时,契税为计税价格的1%,故7.16(1%1)7.2316h s s =⨯⨯+=;②当90144s <时,契税为计税价格的2%, 故7.16(2%1)7.3032h s s =⨯⨯+=;③当144160s <时,契税为计税价格的4%, 故7.16(4%1)7.4464h s s =⨯⨯+=. 故7.2316,50907.3032,901447.4464,144160s s h s s s s ⎧⎪=<⎨⎪<⎩.∴当5090s 时,购房金额为7.2316s 万元;当90144s <时,购房金额为7.3032s 万元;当144160s <时,购房金额为7.4464s 万元.()ii 设该购房者可购买该小区二手房的最大面积为t 平方米,由()i 知,当5090s 时,应支付的购房金额为7.2316s 万元, 又7.23167.231690760s ⨯<,又房屋均价约为7.16万元/平方米,7.16144760⨯>, 144t ∴<,得90144t <<.由7.3032760t ,解得760104.17.3032t≈,∴该购房者可购买该小区二手房的最大面积为104平方米.例9.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图1.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[50,150)内的用户记为A 类用户,标记为低用电家庭,用电量在区间[250,350)内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图如图2:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:2()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++. 【解析】解:(1)1(0.0060.00360.002420.0012)0.004450x =-++⨯+=, 按用电量从低到高的六组用户数分别为6,9,15,11,6,3, 所以平均用电量为675912515175112256275332518650⨯+⨯+⨯+⨯+⨯+⨯=.(2)①B 类用户共9人,打分超过8(5分)的有6人,所以打分超过8(5分)的概率为6293=. ②2224(6963) 1.6 3.8411212915k ⨯⨯-⨯==<⨯⨯⨯,所以没有95%的把握认为“满意度与用电量高低有关”.例10.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关.现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,在将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?2()()()()()n ad bc K a b c d a c b d -=++++. 【解析】解:(1)由已知得:样本中有25周岁以上组工人60名,25周岁以下组工人40人,所以样本中日平均生产件数不足60件的工人中25周岁以上组有600.053⨯=人,分别记为:1A ,2A ,3A , 25周岁以下组有工人400.052⨯=人,分别记为1B ,2B ,从中随机抽取2人,所有可能的结果共10种,他们分别是1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,2)B ,3(A ,2)B ,1(B ,2)B ,其中“至少有1名”,25周岁以下组的结果有7种, 故所求概率为710P =; (2)由频率分别直方图可知:在抽取的100名工人中, “25周岁以上组”中的生产能手600.2515⨯=人, “25周岁以下组”中的生产能手400.37515⨯=人, 据此可得22⨯列联表:所以2()100(15254515) 1.786 2.706()()()()60403070n ad bc K a b c d a c b d -⨯⨯-⨯==≈<++++⨯⨯⨯.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.例11.某市在对学生的综合素质评价中,将其测评结果分为“优秀、合格、不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其它为“合格”.(Ⅰ)某校高二年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层抽样的方法从高二学生中抽取了90名学生的综合素质评价结果,其各个等级的频数统计如表:根据表中统计的数据填写下面22⨯列联表,并判断是否有90%的把握认为“综合素质评价测评结果为优秀与性别有关”?(Ⅱ)以(Ⅰ)中抽取的90名学生的综合素质评价等级的频率作为全市各个评价等级发生的概率,且每名学生是否“优秀”相互独立,现从该市高二学生中随机抽取4人. ()i 求所选4人中恰有3人综合素质评价为“优秀”的概率;()ii 记X 表示这4人中综合素质评价等级为“优秀”的人数,求X 的数学期望.附:参考数据与公式 (1)临界值表:(2)参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)设从高二年级男生中抽出m 人,则90500500400m =+, 解得50m =.503812x ∴=-=,40364y =-=.22∴⨯列联表为:2290(30102030) 2.25 2.70650406030K ⨯⨯-⨯∴==<⨯⨯⨯,∴没有90%的把握认为“综合素质评价测评结果为优秀与性别有关”.(Ⅱ)()i 由(Ⅰ)知等级为“优秀”的学生的频率为23, ∴从该市高二学生中随机抽取一名学生,该生为“优秀”的概率为23. 记“所选4名学生中恰有3人综合素质评价为‘优秀’学生”为事件A , 则事件A 发生的概率为:P (A )3342132()3381C =⨯⨯=. ()ii X 表示这4个人中综合速度评价等级为“优秀”的个数, 由题意,随机变量2~(4,)3X B ,X ∴的数学期望28()433E X =⨯=.例12.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X附:22112212211212()n n n n n X n n n n ++++-=,【解析】解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515) 3.03075254555K ⨯⨯-⨯=≈⨯⨯⨯.⋯(5分)因为3.030 3.841<,所以我们没有充分理由认为“体育迷”与性别有关. ⋯(6分) (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率14, 即从观众中抽取一名“体育迷”的概率.⋯(7分) 由题意知1~(3,)4X B ,从而X 的分布列为⋯(10分)13()344E X np==⨯=,139()(1)34416D X np p=-=⨯⨯=.⋯(12分)例13.随着节能减排意识深入人心以及共享单车在饶城的大范围推广,越来越多的市民在出行时喜欢选择骑行共享单车.为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成22⨯列表(见答题卡),并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢骑行共享单车”与性别有关?(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,视频率为概率,在我市所有“骑行达人”中,随机抽取4名用户.①求抽取的4名用户中,既有男生“骑行达人”又有女“骑行达人”的概率;②为了鼓励女性用户使用共享单车,对抽出的女“骑行达人”每人奖励500元,记奖励总金额为X,求X的分布列及数学期望.附表及公式:22()()()()()n ad bcKa b c d a c b d-=++++【解析】(1)由图中表格可得22⨯列联表如下:将22⨯列联表中的数据代入公式计算得22100(45153010) 3.03 3.84125755545K ⨯-⨯=≈<⨯⨯⨯,所以在犯错误概率不超过0.05的前提下,不能认为是否“喜欢骑行共享单车”与性别有关.(2)视频率为概率,在我市“骑行达人”中,随机抽取1名用户,该用户为男“骑行达人”的概率为35,女“骑行达人”的概率为25. ①抽取的4名用户中,既有男“骑行达人”,又有女“骑行达人”的概率为 44325281()()55625P =--=; ②记抽出的女“骑行达人”人数为Y ,则500X Y =.由题意得2~(4,)5Y B ,4423()()()55i i iP Y i C -∴== (0i =,1,2,3,4),Y ∴的分布列为X ∴的分布列为所以28()455E Y =⨯=, 所以X 的数学期望()500()800E X E Y ==元.例14.2021年,辽宁省将实施新高考,2018年暑期入学的高一学生是新高考首批考生,新高考不再分文理科,采用33+模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层抽样的方法从中抽取n 名学生进行调查.(1)已知抽取的n 名学生中含女生45人,求n 的值及抽取到的男生人数;(2)学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到n 名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表:请将上面的列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由; (3)在抽取到的45名女生中按分层抽样再抽出9名女生,了解女生对“历史”的选课意向情况,在这9名女生中再抽取4人,设这4人中含选择“地理”的人数为X ,求X 的分布列及期望.参考公式:22112212211212()n n n n n K n n n n ++++-=【解析】解:(1)由题意得:451000450n =,解得100n =, 男生人数为:100550551000⨯=人.⋯⋯⋯⋯(2分) (2)22⨯列联表为:222111212211212()100(45202510)8.1289 6.63555457030n n n n n n n n n ++++-⨯⨯-⨯X ==≈>⨯⨯⨯所以有99%的把握认为选择科目与性别有关.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(7分)(3)从45名女生中分层抽样抽9名女生,所以这9名女生中有5人选择物理,4人选择地理, 9名女生中再选择4名女生,则这4名女生中选择地理的人数X 可为0,1,2,3,4. 设事件X 发生概率为()P X , 则45495(0)126C P X C ===,31544940(1)126C C P X C ===,22544960(2)126C C P X C ===, 13544920(3)126C C P X C ===,44491(4)126C P X C ===,X 的分布列为:期望406020116()2341261261261269E X =+⨯+⨯+⨯=.⋯⋯⋯⋯(12分) 例15.微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余每天使用微信在一小时以上.若将员工年龄分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,经常使用微信的员工中23是青年人. (Ⅰ)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22⨯列联表;(Ⅱ)由列联表中所得数据,是否有99.9%的把握认为“经常使用微信与年龄有关”?附:2()()()()()n ad bc K a b c d a c b d -=++++.【解析】解:(Ⅰ)由已知可得,该公司员工中使用微信的共:2000.9180⨯=人 经常使用微信的有18060120--人,其中青年人:2120803⨯=人 所以可列下面22⨯列联表:(Ⅱ)将列联表中数据代入公式可得:2180(8055540)13.33310.8281206013545K ⨯⨯-⨯=≈>⨯⨯⨯所以有99.9%的把握认为“经常使用微信与年龄有关”. 甲抽取的样本数据乙抽取的样本数据(Ⅰ)在乙抽取的样本中任取3人,记投篮优秀的学生人数为X ,求X 的分布列和数学期望.(Ⅱ)请你根据乙抽取的样本数据完成下列22⨯列联表,判断是否有95%以上的把握认为投篮成绩和性别有关?(Ⅲ)判断甲、乙各用何种抽样方法,并根据(Ⅱ)的结论判断哪种抽样方法更优?说明理由. 下面的临界值表供参考:k(参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++【解析】解:(Ⅰ)在乙抽取的10个样本中,投篮优秀的学生人数为4,X ∴的取值为0,1,2,3463103.(),0,1,2,3k kC C P X k k C -=== 分布列为:1131601236210305EX =+++=(6分) (Ⅱ)设投篮成绩与性别无关,由乙抽取的样本数据,得22⨯列联表如下:(7分)2210(4402) 4.444 3.8414664K ⨯⨯-⨯=≈>⨯⨯⨯,(9分) 所以有95%以上的把握认为投篮成绩与性别有关.(10分) (Ⅲ)甲用的是系统抽样,乙用的是分层抽样. ⋯(11分)由(Ⅱ)的结论知,投篮成绩与性别有关,并且从样本数据能看出投篮成绩与性别有明显差异,因此采用分层抽样方法比系统抽样方法更优.⋯(12分)例17.已知某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯列联表,并判断是否能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?(相关系数22()()()()()n ad bc K a b c d a c b d -=++++,2 2.706K >时有99%的把握具有相关性) 【解析】解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名, 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053⨯=(人), 记为1A ,2A ,3.25A 周岁以下组工人有400.052⨯=(人),记为1B ,2B . 从中随机抽取2名工人,所有可能的结果共有10种,即: 1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B , 2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .其中,至少抽到一名“25周岁以下组”工人的可能结果共有7种,是:1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .故所求概率710P =. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515⨯=(人),“25周岁以下组”中的生产能手有400.37515⨯=(人),据此可得22⨯列联表如下:所以得:22100(15251545)251.796040307014K ⨯⨯-⨯==≈⨯⨯⨯. 因为1.79 2.706<,所以不能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”.例18.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图. 表1:甲流水线样本频数分布表(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.参考公式:2()()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++;临界值表供参考:k2.072【解析】解:(1)根据所给的每一组的频数和样本容量做出每一组的频率,在平面直角坐标系中做出频率分步直方图,甲流水线样本的频率分布直方图如下:(2)由图知,甲样本中合格品数为30,合格品的频率为300.7540=,乙样本中合格品数为(0.060.090.03)54036++⨯⨯=,合格品的频率为360.940=,据此可估计从甲、乙流水线上任取一件产品该产品为合格品的概率分别为0.75、0.9;(3)22⨯列联表如下2280(120360) 3.117 2.70666144040k ⨯-=≈>⨯⨯⨯∴有90%的把握认为产品的包装质量与两条自动包装流水线的选择有关.。
高中数学统计案例--独立性检验 例题解析
![高中数学统计案例--独立性检验 例题解析](https://img.taocdn.com/s3/m/b0de9fa183d049649b6658f6.png)
统计案例--独立性检验 例题解析【要点梳理】1、统计学提出假设0H ,采用统计量=2χ 作出判断.2、一般地,对两个研究对象I 和II ,要推断“I 与II 有关系”,其基本步骤:(1) ;(2) ;(3) .3、(1)如果观测值2χ ,那么有99.9%的把握认为“I 与II 有关系”;(2)如果观测值2χ ,那么有99%的把握认为“I 与II 有关系”;(3)如果观测值2χ ,那么有90%的把握认为“I 与II 有关系”;(4)如果观测值2χ ,那么就认为没有充分的证据显示“I 与II 有关系”,但也不能认为“Ⅰ与Ⅱ没有关系”。
【典型例题】例1、为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机解:提出假设H0:性别与是否喜欢数学课程之间没有关系根据列联表中的数据,可以求得514.41781222287235851433730022≈⨯⨯⨯⨯-⨯⨯=)(χ 因为当H0成立时,841.32≥χ的概率约为0.05,所以有95%的把握认为:性别与是否喜欢数学课程之间有关系.点评:由列联表的数据可知,有%3012237≈的男生喜欢数学课程,有 %2017835≈的女生喜欢数学课程,从直观上看,性别与是否喜欢数学课程之间有关系.用2χ进行独立检验,给出这个判断的可信程度.例2、调查339名50岁以上吸烟习惯与患慢性气管炎的情况,获数据如下(2)用假设检验的思想给予证明.解:(1)根据列联表的数据,得到()()()()()c d b d c a b a bc ad n ++++-=22χ =()1342835620513162121433392⨯⨯⨯⨯-⨯⨯ =7.469>6.635.所以有99%的把握认为“吸烟与患慢性气管炎病有关”.(2)假设“吸烟与患慢性气管炎之间没有关系”,由于事件A={}635.62≥χ的概率为P 01.0)635.6(2≈≥χ,即A 为小概率事件而小概率事件发生了,进而得假设错误,这种推断出错的可能性约有1%.点评:用独立性检验解决问题要抓住步骤,用好公式细心计算.例3、对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟.解:提出假设:0H :两种手术对病人又发作心脏病的影响没有差别.根据列联表中的数据,可以求得78.119619632468157291673939222≈⨯⨯⨯⨯-⨯⨯=)(χ. 当0H 成立时78.12≈χ,而072.22<χ的概率为0.85.所以,不能否定假设0H .也就是不能作出这两种手术对病人又发作心脏病的影响有差别的结论.点评:本题是利用))()()(()(22d b c a d c b a bc ad n ++++-=χ,求出2χ的值,再利用临界值的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式;准确进行比较与判断.。
【知识点解析】配套例题——独立性检验
![【知识点解析】配套例题——独立性检验](https://img.taocdn.com/s3/m/f43fe567ce84b9d528ea81c758f5f61fb7362802.png)
独立性检验例1 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.根据表8.3-2中的数据,计算得到χ2=()288337103843457117⨯⨯-⨯⨯⨯⨯≈0.837<2.706=x0.1.根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.例2 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,如表8.3-5所示.表8.3-5单位:人根据列联表中的数据,经计算得到χ2=()21361563526676921115⨯⨯-⨯⨯⨯⨯≈4.881<7.879=x0.005.根据小概率值α=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.例3 为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9 965人,得到成对样本观测数据的分类统计结果,如表8.3-6所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.表8.3-6单位:人解:零假设为H0:吸烟与患肺癌之间无关联.根据列联表中的数据,经计算得到χ2=()2996577754942209978172148987491⨯⨯-⨯⨯⨯⨯≈56.632>10.828=x0.001.根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001.根据表8.3-6中的数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为7775 7817≈0.994 6和427817≈0.005 4;吸烟者中不患肺癌和患肺癌的频率分别为2099 2148≈0.977 2和492148≈0.022 8.由0.02280.0054≈4.2可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上.于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌的概率,即吸烟更容易引发肺癌.。
高中数学9-2独立性检验1苏教版选择性必修第二册
![高中数学9-2独立性检验1苏教版选择性必修第二册](https://img.taocdn.com/s3/m/17eb5d369a6648d7c1c708a1284ac850ad0204dc.png)
数学建构
为了便于研究一般情况,我们将数据用字母代替,得到字母表示的 2×2 列
联表.
患病
未患病
合计
吸烟
a
不吸烟
c
b
a+b
d
c+d
合计
a+c
b+d
a+b+c+d
如果实际观测值与在事件 A,B 相互独立的假设下的估计值相差不“大”,
那么我们就可以认为这些差异是由随机误差造成的,假设 H0 不能被所给数据否 定;否则,应认为假设 H0 不能接受.
根据这些数据能否断定:患呼吸道疾病与吸烟有关?
学生活动
为了研究这个问题,我们将数据用下表表示(单位
183
220
不吸烟
21
274
295
合计
58
457
515
这样的表格称为 2×2 列联表.由此表可以粗略地估计出:在吸烟的人中,有
37 ≈16.82%的人患病;在不吸烟的人中有 21 ≈7.12%的人患病.因此,从直
课堂练习
1.某桑场为了解职工发生皮炎是否与采桑有关,对其工作人员进行了一次
调查,结果如下表.问:发生皮炎是否与采桑有关?
患皮炎 未患皮炎 合计
采桑 18 4 22
不采桑 12 78 90
合计 30 82 112
课堂练习
2.为了鉴定新疫苗的效力,将 60 只豚鼠随机地分为两组,在其中一组接种
疫苗后,两组都注射了病源菌,其结果列于下表.问:能否有 90%的把握认为新
数学建构
现在的2=11.8634>6.635,由(2)式可知出现这样的观测值2 的概率不超 过 0.01.因此,我们有 99%的把握认为 H0 不成立,即有 99%的把握认为“患呼 吸道疾病与吸烟有关系”.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.根据下表计算k≈_____.
【解析】根据列联表中的数据得K2的观测值
n ad bc2
392 39167 157 292
k a bc da c(b d) 196196 68 324
≈1.78.
答案:1.78
5.运动员参加比赛前往往做热身运动,下表是一体育运动的 研究机构对160位专业运动员追踪而得的数据,试问:由此数 据,你认为运动员受伤与不做热身运动有关吗?
1 500 98217 49382
k
13.097 10.828,
990 5101 475 25
因此,在犯错误的概率不超过0.001的前提下,认为质量监
督员甲在不在生产现场与产品质量好坏有关系.
【典例】(12分)(1)下表是某地区的一种传染病与饮用水的 调查表:
这种传染病是否与饮用水的卫生程度有关,请说明理由;
【规范解答】由已知数据列出2×2列联表如下:
由2×2列联表中的数据,得K2的观测值为
k 180 65 49≈1320.3386>210.828,
9585101 79
所以在犯错误的概率不超过0.001的前提下认为“生产合格品 与设备改造有关系”.
【例】为调查某地区老年人是否需要志愿者提供帮助,用简 单随机抽样方法从该地区调查了500位老年人,结果如下:
bc
ad bc2 da c(b
d)
【审题指导】解答第(2)问时,可先计算K2的值,再对照表格作
出判断.
【规范解答】(1)调查的500位老年人中有70位需要志愿者提 供帮助,因此该地区老年人中,需要志愿者提供帮助的老年 人的比例的估计值为 70 =14%.
500
(2) K2=500 40 270≈93.096176.0由2 于9.967>6.635,所
【解析】选D.独立性检验的结果与实际问题有差异,即独立 性检验的结论是一个数学统计量,它与实际问题中的确定性 存在差异.
2.分类变量X和Y的列联表如下,则( )
(A)ad-bc越小,说明X与Y的关系越弱 (B)ad-bc越大,说明X与Y的关系越强 (C)(ad-bc)2越大,说明X与Y的关系越强 (D)(ad-bc)2越接近于0,说明X与Y的关系越强
概率不超过α;否则,就认为在犯错误的概率不超过α的前
提下不能推断“X与Y有关系”,或者在样本数据中没有发现
足够证据支持结论“X与Y有关系”.
通常认为k<2.706时,样本数据就没有充分的证据显 示“X与Y有关系”.
【例2】某企业为了更好地了解设备改造与生产合格品的关系, 随机抽取了180件产品进行分析,其中设备改造前生产的合格 品有36件,不合格品有49件;设备改造后生产的合格品有65 件,不合格品有30件,根据上面的数据,你能得出什么结论? 【审题指导】可先由题中已给数据,列出2×2列联表,再计 算K2的值作出判断.
【解析】选C.由K2的计算公式可知,(ad-bc)2越大,则K2越 大,故相关关系越强.
3.若由一个2×2列联表中的数据计算得K2=4.013,则两个变 量有关系的概率为_____. 【解析】因随机变量K2的观测值k=4.013>3.841.所以在犯 错误的概率不超过0.05的前提下,认为两个变量有关系. 答案:0.95
(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9 人,不得病22人.按此样本数据分析这种疾病是否与饮用水有 关,并比较两种样本在反映总体时的差异. 【审题指导】(1)根据表中的信息计算K2的观测值,并根据临 界值表来分析相关性的大小,对于(2)要列出2×2列联表,方 法同(1).
【规范解答】(1)假设H0:传染病与饮用水无关.把表中数据 代入公式得:
有关“相关性检验” 解决一般的独立性检验问题的步骤:
(1)根据实际问题的需要确定容许推断“两个分类变量有关系” 犯错误概率的上界α,然后查下表确定临界值k0.
(2)根据2×2列联表,利用公式K2an
bc
ad bc2 da c(b
d)
计算随机变量K2的观测值k.
(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的
K2的观测值k 830 52 218≈54646.2194,…2 ………3分
146 684 518 312
∵54.21>10.828,所以拒绝H0. 因此在犯错误的概率不超过0.001的前提下认为该地区这种传
染病与饮用不干净水有关. ……………………………………5分
(2)依题意得2×2列联表:
此时,K2的观测值k 86 5 22≈ 550.78952. …………9分
通过等高条形图可以粗略地判断两个分类变量是否有 关系,但无法精确地给出所得结论的可靠程度.
【例1】从发生交通事故的司机中抽取2 000名司机作随机样 本,根据他们血液中是否含有酒精以及他们是否对事故负有 责任将数据整理如下:
试分析血液中含有酒精与对事故负有责任是否有关系.
【审题指导】题目已给出了2×2列联表,可利用等高条形图 定性分析两个分类变量之间的相关性. 【规范解答】作等高条形图如下,图中阴影部分表示有酒精 负责任与无酒精负责任的比例,从图中可以看出,两者差距 较大,由此我们可以在某种程度上认为“血液中含有酒精与 对事故负有责任”有关系.
分类变量关系的分析
1.判断分类变量及其关系的方法: (1)利用数形结合思想,借助等高条形图来判断两个分类变量 是否相关是判断变量相关的常见方法. (2)一般地,在等高条形图中, a 与 c 相差越大,两个
ab cd
分类变量有关系的可能性就越大.
2.分析分类变量关系的步骤: (1)作大量的调查、研究,统计出结果. (2)列出列联表利用频率粗略估计. (3)作出等高条形图,从直观上进一步判断分类变量之间的关 联关系.
独立性检验的综合应用
判断变量X与Y有无关系的三种方法: (1)2×2列联表:由2×2列联表中|ad-bc|的大小判断. (2)等高条形图:观察条形图中的阴影比例大小判断. (3)独立性检验:计算K2的观测值k,再利用临界值的大小判 断. 其中独立性检验的方法相对较准确.
【例3】为了调查某生产线上质量监督员甲对产品质量好坏有 无影响,现统计数据如下:甲在生产现场时,990件产品中有 合格品982件,次品8件;甲不在生产现场时,510件产品中有 合格品493件,次品17件.试分别用列联表、等高条形图、独 立性检验的方法分析监督员甲对产品质量好坏有无影响.能否 在犯错误的概率不超过0.001的前提下,认为质量监督员甲是 否在生产现场与产品质量有关? 【审题指导】本题要求分别用列联表、等高条形图、独立性 检验的方法分析,要注意三种方法的判断思路.
14 72 55 31
由于5.785>2.706 所以在犯错误的概率不超过0.1的前提下认为该种疾病与饮用 不干净水有关. …………………………………………………10分
两个样本都能统计得到传染病与饮用不干净水有关这一相同 结论,但(1)中在犯错误的概率不超过0.001的前提下肯定结 论的正确性,(2)中在犯错误的概率不超过0.1的前提下肯定 结论的正确性. …………………………………………………12分
【误区警示】对解答本题时易犯错误具体分析如下:
1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析 数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率 不超过0.01的前提下认为这个结论是成立的,下列说法中正 确的是( ) (A)100个吸烟者中至少有99人患有肺癌 (B)1个人吸烟,那么这个人有99%的概率患有肺癌 (C)在100个吸烟者中一定有患肺癌的人 (D)在100个吸烟者中可能一个患肺癌的人也没有
【规范解答】(1)2×2列联表如下:
由列联表可得|ad-bc|=|982×17-493×8|=12 750. 相差较大,可在某种程度上认为“质量监督员甲是否在现场 与产品质量有关系”.
(2)画等高条形图. 如图可知,在某种程度上认为“质量监督员甲是否在生产现 场与产品质量有关系”.
(3)由2×2列联表中数据,计算得到K2的观测值为
• 思考题4 在对人们的休闲方式的一次调查 中,共调查了124人,其中女性70人,男 性54人,女性中有43人主要的休闲方式是 看电视,另外27人主要的休闲方式是运动 ;男性中有21人主要的休闲方式是看电视 ,另外33人主要的休闲方式是运动.
• (1)根据以上数据建立一个2×2的列联表; • (2)试判断性别与休闲方式是否有关系
200 300 70 430
以在犯错误的概率不超过0.01的前提下认为该地区的老年人
是否需要志愿者提供帮助与性别有关.
(3)由(2)的结论知,该地区的老年人是否需要志愿者提供帮助 与性别有关,并且从样本数据能看出该地区男性老年人与女 性老年人中需要帮助的比例有明显差异,因此在调查时,先 确定该地区老年人中男、女的比例,再把老年人分成男、女 两层并采用分层抽样方法,这比采用简单随机抽样方法更好.
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比 例; (2)能否在犯错误的概率不超过0.01的前提下认为该地区的老 年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区 的老年人中,需要志愿者提供帮助的老年人的比例?说明理 由.
附:
K2
a
n