独立性检验练习含答案
课时作业1:4.3.2 独立性检验

4.3.2 独立性检验1.下面是一个2×2列联表:Y Y 总计 X a 11 63 X b 15 23 总计6026则表中a ,b 处的值分别为( A .74,38 B .52,10 C .52,8 D .8,52答案 C解析 ∵a +11=63,b +15=23,∴a =52,b =8.2.下列选项中,哪一个χ2的值可以有99%以上的把握认为“A 与B 有关系”( ) A .χ2=2.715 B .χ2=3.910 C .χ2=6.165 D .χ2=7.014 答案 D解析 ∵7.014>6.635,查阅χ2表知有99%的把握认为两个随机事件之间有关系. 3.通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110经计算得χ2=110×(40×30-20×20)260×50×60×50≈7.822.则正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”答案 C解析 根据独立性检验的思想方法,正确选项为C.4.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:根据以上数据可得出( )A .种子是否经过处理与是否生病有关B .种子是否经过处理与是否生病无关C .种子是否经过处理决定是否生病D .有90%的把握认为种子经过处理与生病有关 答案 B 解析χ2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有充足的理由认为种子是否经过处理跟生病有关.5.(多选)下列说法正确的是( )A .事件A 与B 独立,即两个事件互不影响 B .事件A 与B 关系越密切,则χ2就越大C .χ2的大小是判定事件A 与B 是否相关的唯一根据D .若判定两事件A 与B 相关,则A 发生B 一定发生 答案 AB解析 由事件的独立性知,A 选项正确;由独立性检验的意义知,B 选项正确;χ2的大小是判定事件A 与B 是否相关的一种方法,不是唯一依据,C 选项不正确;若事件A 与B 相关,则A 发生B 可能发生,也可能不发生,D 选项不正确.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有________的把握说,打鼾与患心脏病是________的.(填“有关”“无关”) 答案 99% 有关解析 ∵χ2=7.63,∴χ2>6.635,因此,有99%的把握说,打鼾与患心脏病是有关的. 7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得 χ2=50×(13×20-10×7)223×27×20×30≈4.844>3.841.因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________. 答案 0.05解析 根据χ2>3.841,可判断有95%的把握认为主修统计专业与性别有关系.故出错的概率为0.05.8.下表是关于男婴与女婴出生时间调查的列联表:那么,A =________,B =________,C =________,D =________,E =________. 答案 47 92 88 82 53解析 由列联表得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.9.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:(1)根据上述表格完成列联表:(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义? 解 (1)2×2列联表如下表所示:(2)计算可知,午休的考生及格率为P 1=80180=49.不午休的考生的及格率为P 2=65200=1340,由P 1>P 2,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.10.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程); (2)能否有95%的把握认为喜爱打篮球与性别有关?(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值.解 (1)列联表补充如下:(2)由χ2=48×(220-60)228×20×32×16≈4.286>3.841,所以有95%的把握认为喜爱打篮球与性别有关.(3)喜爱打篮球的女生人数X 的可能取值为0,1,2. 其概率分别为 P (X =0)=C 210C 220=938,P (X =1)=C 110C 110C 220=1019,P (X =2)=C 210C 220=938,故X 的分布列为X 0 1 2 P9381019938X 的均值为E (X )=0+1019+919=1.11.(多选)下列关于回归分析与独立性检验的说法不正确的是( ) A .回归分析和独立性检验没有什么区别B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D .独立性检验可以100%确定两个变量之间是否具有某种关系 答案 ABD12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男人、女人中患色盲的频率分别为0.038和0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 答案 C解析 男人中患色盲的比例为38480=19240,要比女人中患色盲的比例6520=3260大,其差值为⎪⎪⎪⎪19240-3260≈0.067 6,差值较大,故认为患色盲与性别是有关的. 13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:乙厂:(1)两个分厂生产的零件的优质品率分别为________;(2)有________的把握认为“两个分厂生产的零件的质量有差异”. 答案 (1)72%,64% (2)99%解析 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1 000×(360×180-320×140)2500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.14.2018年世界杯期间,某电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:总计a b 100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关. 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).临界值表:a =P (χ2≥k )0.10 0.05 0.010 0.005 0.001 k2.7063.8416.6357.87910.828答案 95%解析 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35, 所以q =25,p =25,a =40,b =60. χ2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841. 故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.15.(多选)有两个分类变量X ,Y ,其2×2列联表如下所示:Y 1 Y 2 总计 X 1 a 20-a 20 X 2 15-a 30+a 45 总计155065其中a,15-a 均为大于5的整数,若有95%的把握认为X ,Y 有关,则a 的值为( ) A .6 B .7 C .8 D .9 答案 CD 解析 由题意可知 χ2=65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是815.(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X ,求X 的分布列和均值. 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由已知数据得χ2=30×(10×8-6×6)216×14×16×14≈1.158<2.706.所以,没有充足的理由认为反感“中国式过马路”与性别有关. (2)X 的可能取值为0,1,2, P (X =0)=C 28C 214=413,P (X =1)=C 16C 18C 214=4891,P (X =2)=C 26C 214=1591.所以X 的分布列为X 的均值为E (X )=0×413+1×4891+2×1591=67.。
独立性检验练习含答案

§1.1 独立性检验一、基础过关1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥k ) 0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是________.①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100则有________的把握确定吸烟量与年龄有关. 二、能力提升6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业 性别非统计专业统计专业 合计 男 13 10 23 女 7 20 27 合计203050为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. 8.下列说法正确的是________.(填序号)①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效 有效 总计 男性患者 15 35 50 女性患者 6 44 50 总计2179100设H 0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计 教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.三、探究与拓展12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数9261 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数297185159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数766218(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.答案1.90% 2.16.373 3.③ 4.③ 5.99.9% 6.5% 7.2 8.② 9.4.882 5%10.解 由公式得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=71×(12×24-25×10)237×34×22×49≈0.08.∵χ2<2.706.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关. 由公式得χ2=830×(52×218-466×94)2146×684×518×312≈54.21.因为54.21>10.828.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×(5×22-50×9)255×31×14×72≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性. 12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%. (2)甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计5005001 000由列联表中的数据,得χ2=1 000×(360×180-320×140)2680×320×500×500≈7.353>6.635.所以有99%的把握认为“两个分厂生产的零件的质量有差异”.Welcome To Download !!!欢迎您的下载,资料仅供参考!。
独立性检验习题及答案

1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系.解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
独立性检验—高考真题

独立性检验—高考真题一、解答题二、解答题1.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g ).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成如下列联表m <m≥对照组试验组(ⅱ)根据(i )中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:()()()()22()n ad bc K a b c d a c b d -=++++,()2P K k ≥0.1000.0500.010k2.7063.841 6.6352.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.0500.0100.001k 3.841 6.63510.8283.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.010 0.001k 3.841 6.63510.8284.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.8285.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:P(2K k ≥)0.0500.0100.001k 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++6.甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A 24020B 21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k 0.1000.0500.010k2.7063.841 6.635参考答案:1.(1)19.8(2)(i)23.4m=;列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得23.4m=,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:1(7.89.211.412.413.215.516.518.018.819.219.820.220+++++++++++39621.622.823.623.925.128.232.336.5)19.820++++++++==(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位为23.2,第21位数据为23.6,所以23.223.623.42m+==,故列联表为:m<m≥合计对照组61420试验组14620合计202040(ii)由(i)可得,2240(661414)6.400 3.84120202020K⨯⨯-⨯==>⨯⨯⨯,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 2.(1)75%;60%;(2)能.【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075%200=,乙机床生产的产品中的一级品的频率为12060%200=.(2)()22400150801205040010 6.63527013020020039K ⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.3.(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量好3337空气质量不好228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.5.(1)7014%500=,(2)有99%的把握(3)见解析【详解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为7014% 500=(2)22500(4027030160)9.96720030070430K⨯⨯-⨯==⨯⨯⨯.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.6.(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K ,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A 共有班次260次,准点班次有240次,设A 家公司长途客车准点事件为M ,则24012()26013==P M ;B 共有班次240次,准点班次有210次,设B 家公司长途客车准点事件为N ,则210()27840==P N .A 家公司长途客车准点的概率为1213;B 家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。
北师大版数学【选修2-3】练习:3.2 独立性检验(含答案)

第三章 §2一、选择题1.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关,那么下列说法中正确的是( )A .在100个男性中约有90个人爱喝酒B .若某人爱喝酒,那么此人为男性的可能性为90%C .判断出错的可能性为10%D .有90%的把握认为10个男性中有9个人爱喝酒 [答案] C2.提出统计假设H 0,计算出χ2的值,即拒绝H 0的是( ) A .χ2=6.635 B .χ2=2.63 C .χ2=0.725 D .χ2=1.832[答案] A[解析] 依据独立性检验的思想及其结论的应用,应选A.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C[解析] 根据独立性检验的思想方法,正确选项为C. 二、填空题4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是____________________________________.[答案] 男正教授人数,副教授人数;女正教授人数,副教授人数.5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能以________的把握认为婴儿的性别与出生时间有关系.[答案] 90%[解析] 由列联表可以看出a =24,b =31,c =8,d =26,a +b =55,c +d =34,a +c =32,b +d =57,n =a +b +c +d =89,代入公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得χ2=89×(24×26-31×8)255×34×32×57≈3.689,由于χ2≈3.689>2.706,∴我们有90%的把握认为婴儿的性别与出生时间有关系. 三、解答题6.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:[分析] 先计算χ2的数值,然后比较χ2与3.841及6.635的大小,进而得出是否有关的结论.[解析] 由公式得χ2=540(60×200-260×20)2320×220×80×460=540(12 000-5 200)22 590 720 000=2 496 960259 072≈9.638.∴9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[点评]本题利用χ2公式计算出χ2的值,再利用临界性的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.一、选择题1.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析]根据χ2计算公式可知,阅读量与性别相关数据较大,所以选D.2.在一次独立性检验中,其把握性超过99%,则随机变量χ2的一个可能的值为() A.6.635 B.5.024C.7.897 D.3.841[答案] C[解析]若有99%把握,则χ2>6.635,只有C满足条件.3.分类变量X和Y的列联表如下,则()A.ad-bcB.ad-bc越大,说明X与Y的关系越强C .(ad -bc )2越大,说明X 与Y 的关系越强D .(ad -bc )2越接近于0,说明X 与Y 的关系越强 [答案] C[解析] 由统计量χ2的计算公式计算χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )可知(ad -bc )2越大,则计算出的统计量的值也越大,而统计量越大,说明(ad -bc )2越大,故选C.4.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90% C .97.5% D .99.9%[答案] D[解析] 由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值k =9 965×(7 775×49-2 099×42)27 817×2 148×9 874×91≈56.632>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.5.为了研究性格和血型的关系,抽查80人实验,血型和性格情况如下:O 型或A 型者是内向型的有18人,外向型的有22人,B 型或AB 型是内向型的有12人,是外向型的有28人,则有多大的把握认为性格与血型有关系( )A.99.9% B .99%C .没有充分的证据显示有关D .1% [答案] C [解析]χ2=n (n 11n 22-12n 21)50×30×40×40=80×(22×12-28×18)50×30×40×40≈1.92<2.706,∴没有充分的证据显示有关.二、填空题6.在一次打鼾与患心脏病的调查中,共调查了1671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是____________的.填(“有关”或“无关”)[答案] 有关[解析] ∵27.63>6.635∴打鼾与患心脏病有关的可能性很大,我们可以有99%的把握这么认为.7.为了了解小学生是否喜欢吃零食与性别之间的关系,调查者随机调查了89名小学生的情况,得到的数据如下表(单位:人):[答案] 3.689[解析] χ2=89×(24×26-31×8)255×34×32×57≈3.689.三、解答题8.在某医院,因为患心脏病而住院的655名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶是否与患心脏病有关.[解析] 问题是判断男性病人的秃顶是否与患心脏病有关.计算得到下表(单位:人)由公式计算得χ2=1437×(214×597-175×451)389×1048×665×772≈16.373.因为16.373>6.635,所以有99%以上的把握认为男性病人的秃顶与患心脏病有关.9.为检验回答一个问题的对错是否和性别有关,有人作了一个调查,其中女生人数是男生人数的12,男生答对人数占男生人数的56,女生答错人数占女生人数的23.(1)若有99%的把握认为回答结果的对错和性别有关,则男生至少有多少人? (2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人? [分析] 若有99%的把握认为回答结果的对错和性别有关,说明χ2>6.635;没有充分的证据显示回答结果的对错和性别有关,说明χ2≤2.706.设出男生人数,并且它分别表示各类别人数,代入χ2的计算公式,建立不等式求解即可.[解析] 设男生人数为x ,依题意可得2×2列联表如下:(1)若有99%, 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x 8>6.635,解得x >17.693.因为x 2,x 6,x3为整数,所以若有99%的把握认为回答结果的对错和性别有关,则男生至少有18人.(2)没有充分的证据显示回答结果的对错和性别有关,则χ2≤3.841. 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x8≤2.706,解得x ≤7.216.因为x 2,x 3,x6为整数,所以若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.[点评] 本题是逆向型思维问题,即将根据已知数据判断相关性问题变式为了一道由已知相关性求表中的字母数据问题,同时也是一个独立性检验和不等式的综合问题,解答时要注意理解“至少”“至多”的含义,充分建立不等式(组)来解决.10.为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:附:χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)[解析]2×2列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.解:(1)甲、乙两只家兔分在不同组的概率为p =2C 99198C 100200=100199.(2)①可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.②表3:χ2=200×(70×65-35×30)100×100×105×95≈24.56,由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.。
北师大版数学【选修2-3】练习:3.2独立性检验(含答案)(可编辑修改word版)

第三章§2一、选择题1.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关,那么下列说法中正确的是( )A.在100 个男性中约有90 个人爱喝酒B.若某人爱喝酒,那么此人为男性的可能性为90%C.判断出错的可能性为10%D.有90%的把握认为10 个男性中有9 个人爱喝酒[答案] C2.提出统计假设H0,计算出χ2 的值,即拒绝H0的是( )A.χ2=6.635 B.χ2=2.63C.χ2=0.725 D.χ2=1.832[答案] A[解析] 依据独立性检验的思想及其结论的应用,应选A.3.通过随机询问110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 20 60不爱好20 30 50总计60 50 110n(ad-bc)2 110 × (40 × 30-20 × 20)2由K2=算得,K2=≈7.8.(a+b)(c+d)(a+c)(b+d) 60 × 50 × 60 × 50 附表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”[答案] C[解析] 根据独立性检验的思想方法,正确选项为C.二、填空题4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是.[答案] 男正教授人数,副教授人数;女正教授人数,副教授人数.5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能以的把握认为婴儿的性别与出生时间有关系.[答案] 90%[解析] 由列联表可以看出a=24,b=31,c=8,d=26,a+b=55,c+d=34,a+c=32,b+d=57,n=a+b+c+d=89,n(ad-bc)2代入公式χ2=得(a+b)(c+d)(a+c)(b+d)89 × (24 × 26-31 × 8)2χ2=55 × 34 × 32 × 57≈3.689,由于χ2≈3.689>2.706,∴我们有90%的把握认为婴儿的性别与出生时间有关系.三、解答题6.为了调查胃病是否与生活规律有关,在某地对540 名40 岁以上的人的调查结果如下:[分析] 先计算χ2 的数值,然后比较χ2 与3.841 及6.635 的大小,进而得出是否有关的结论.540(60 × 200-260 × 20)2[解析] 由公式得χ2=320 × 220 × 80 × 460540(12 000-5 200)2 2 496 960=2 590 720 000 =259 072≈9.638.∴9.638>6.635,∴有99%的把握说40 岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[点评] 本题利用χ2 公式计算出χ2 的值,再利用临界性的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.一、选择题1.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4 个变量之间的关系,随机抽查52 名中学生,得到统计数据如表1 至表4,则与性别有关联的可能性最大的变量是( )A.成绩B.视力C.智商D.阅读量[答案] D[解析] 根据χ2 计算公式可知,阅读量与性别相关数据较大,所以选 D.2.在一次独立性检验中,其把握性超过99%,则随机变量χ2 的一个可能的值为( )A.6.635 B.5.024C.7.897 D.3.841[答案] C[解析] 若有99%把握,则χ2>6.635,只有C 满足条件.3.分类变量X 和Y 的列联表如下,则( )Y1Y2总计A.ad-bcB.ad-bc 越大,说明X 与Y 的关系越强C.(ad-bc)2 越大,说明X 与Y 的关系越强D.(ad-bc)2越接近于0,说明X 与Y 的关系越强[答案]Cn(ad-bc)2[解析] 由统计量χ2 的计算公式计算χ2=可知(ad-bc)2 越大,(a+b)(c+d)(a+c)(b+d)则计算出的统计量的值也越大,而统计量越大,说明(ad-bc)2 越大,故选C.4.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90%C.97.5% D.99.9%[答案] D[解析] 由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得其观测值9 965 × (7 775 × 49-2 099 × 42)2k=≈56.632>10.828.7 817 × 2 148 × 9 874 × 91故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.5.为了研究性格和血型的关系,抽查80 人实验,血型和性格情况如下:O 型或A 型者是内向型的有18 人,外向型的有22 人,B 型或AB 型是内向型的有12 人,是外向型的有28 人,则有多大的把握认为性格与血型有关系( )A.99.9%B.99%C.没有充分的证据显示有关D.1%[答案] C[解析]n(n11n22)χ2=50 × 30 × 40 × 40=的证据显示有关.二、填空题50 × 30 × 40 × 40≈1.92<2.706,∴没有充分6.在一次打鼾与患心脏病的调查中,共调查了1671 人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是的.填(“有关”或“无关”)[答案] 有关[解析] ∵27.63>6.635∴打鼾与患心脏病有关的可能性很大,我们可以有99%的把握这么认为.7.为了了解小学生是否喜欢吃零食与性别之间的关系,调查者随机调查了89 名小学生的情况,得到的数据如下表(单位:人):≈.[答案] 3.68989 × (24 × 26-31 × 8)2[解析] χ2=≈3.689.55 × 34 × 32 × 57三、解答题8.在某医院,因为患心脏病而住院的655 名男性病人中,有214 人秃顶;而另外772 名不是因为患心脏病而住院的男性病人中,有175 人秃顶.根据以上数据判断男性病人的秃顶是否与患心脏病有关.[解析] 问题是判断男性病人的秃顶是否与患心脏病有关.计算得到下表(单位:人)≈16.373.由公式计算得χ2=389 × 1048 × 665 × 772因为16.373>6.635,所以有99%以上的把握认为男性病人的秃顶与患心脏病有关.9.为检验回答一个问题的对错是否和性别有关,有人作了一个调查,其中女生人数是1 5 2男生人数的,男生答对人数占男生人数的,女生答错人数占女生人数的.2 6 3(1)若有 99%的把握认为回答结果的对错和性别有关,则男生至少有多少人? (2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人? [分析] 若有 99%的把握认为回答结果的对错和性别有关,说明 χ2>6.635;没有充分的证据显示回答结果的对错和性别有关,说明 χ2≤2.706.设出男生人数,并且它分别表示各类别人数,代入 χ2 的计算公式,建立不等式求解即可.[解析] 设男生人数为 x ,依题意可得 2×2 列联表如下:(1) 若有 99%,3x 2 ·( 5x x ·- x x · )2 由 χ2= 6 3 6 6 x x x · · ·x3x= 8 >6.635,解得 x >17.693. 2 2x x x因为 ,, 为整数,所以若有 99%的把握认为回答结果的对错和性别有关,则男生至2 63 少有 18 人.(2) 没有充分的证据显示回答结果的对错和性别有关,则 χ2≤3.841.3x 2 ·( 5x x ·- x x · )2 由 χ2= 6 3 6 6 x x x · · ·x3x= 8 ≤2.706, 2 2解得 x ≤7.216.x x x因为 ,, 为整数,所以若没有充分的证据显示回答结果的对错和性别有关,则男生至2 3 6 多有 6 人.[点评] 本题是逆向型思维问题,即将根据已知数据判断相关性问题变式为了一道由已知相关性求表中的字母数据问题,同时也是一个独立性检验和不等式的综合问题,解答时要注意理解“至少”“至多”的含义,充分建立不等式(组)来解决.10.为了比较注射A,B 两种药物后产生的皮肤疱疹的面积,选200 只家兔做实验,将这200 只家兔随机地分成两组,每组100 只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200 只家兔中的2 只,求甲、乙分在不同组的概率;(2)下表1 和表2 分别是注射药物A 和B 后的试验结果.(疱疹面积单位:mm2)表1:注射药物A 后皮肤疱疹面积的频数分布表疱疹面积[60,65) [65,70) [70,75) [75,80)频数30 40 20 10疱疹面积[60,65) [65,70) [70,75) [75,80) [80,85) 频数10 25 20 30 15②完成下面2×2 列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物A a=b=注射药物B c=d=合计n=附:χ2=-(a+b)(c+d)(a+c)(b+d)P(K2≥k) 0.100 0.050 0.025 0.010 0.001k 2.706 3.841 5.024 6.635 10.828 [解析] 2×2 列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2 列联表并计算χ2与临界值比较,说明是否有关.2C19998 100解:(1)甲、乙两只家兔分在不同组的概率为p=1200 =.C 199(2)①可以看出注射药物A 后的疱疹面积的中位数在65 至70 之间,而注射药物B 后的疱疹面积的中位数在70 至75 之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.②表3:χ2=≈24.56,100 × 100 × 105 × 95由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.。
独立性测试题及答案

独立性测试题及答案一、选择题1. 在统计学中,独立性指的是两个事件的发生互不影响。
以下哪项描述正确地反映了独立性的概念?A. 事件A的发生增加了事件B发生的概率B. 事件A的发生减少了事件B发生的概率C. 事件A的发生不影响事件B发生的概率D. 事件A和B不能同时发生答案:C2. 假设有两个事件A和B,已知P(A) = 0.3,P(B) = 0.4,要判断A 和B是否独立,需要计算:A. P(A ∩ B)B. P(A) + P(B)C. P(A|B) - P(A)D. P(A ∪ B)答案:A3. 如果事件A和B是独立的,那么P(A ∩ B)等于:A. P(A) * P(B)B. P(A) + P(B)C. |P(A) - P(B)|D. P(A) / P(B)答案:A二、填空题4. 如果P(A) = 0.2,P(B) = 0.5,并且A与B独立,那么P(A ∩ B)等于_________。
答案:0.15. 在一次随机抽样调查中,如果P(事件A发生) = 0.3,P(事件B发生|事件A发生) = 0.4,那么事件A和B独立的概率是_________。
答案:0.4三、简答题6. 解释为什么事件A和B的独立性意味着P(A ∩ B) = P(A) * P(B)。
答案:如果事件A和B是独立的,那么意味着事件A的发生不会影响事件B发生的概率,反之亦然。
因此,我们可以将两个独立事件同时发生的概率看作是它们各自发生概率的乘积,即P(A ∩ B) = P(A) * P(B)。
7. 如果事件A和B不独立,那么P(A ∩ B)与P(A) * P(B)的关系是什么?答案:如果事件A和B不独立,那么它们同时发生的概率P(A ∩ B)不等于它们各自发生概率的乘积P(A) * P(B)。
在这种情况下,P(A ∩ B)可能会大于或小于P(A) * P(B),具体取决于一个事件的发生是否增加了或减少了另一个事件发生的概率。
四、计算题8. 假设在一个班级中,学生通过数学考试的概率是0.7,通过物理考试的概率是0.6。
独立性检验(解析版)

独立性检验例1.2019年11月5日至10日,第二届中国国际进口博览会在上海举行.某宣传媒体组织业内人士对某型号智能机器人进行评分,所得情况如图所示:(Ⅰ)试估计业内人士评分的平均数以及方差(用每个小矩形底边中点近似替代本组数据);(Ⅱ)为了调查评分与性别是否具有相关性,研究人员随机抽取了60位参加评分的业内人士,其中男性与女性人数各一半,根据已知条件完成下面22⨯列联表,据此资料,是否有90%的把握认为评分的高低与性别有关?参考公式:(1)2()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.(2)2221122()()()n n DX x EX p x EX p x EX p =-⨯+-⨯+⋯+-⨯. 参考数据:2)0.152.072【解析】解:(Ⅰ)依题意,所求平均数为300.1500.3700.4900.2315281864⨯+⨯+⨯+⨯=+++=, 方差为2222(3064)0.1(5064)0.3(7064)0.4(9064)0.2115.658.814.4135.2324-⨯+-⨯+-⨯+-⨯=+++=. (Ⅱ)由题意完善22⨯列联表如下:∴2260(14201016)102.706243630309K⨯⨯-⨯==<⨯⨯⨯,∴没有90%的把握认为评分的高低与性别有关.例2.某校举行了一次数学竞赛,为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为)n进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,已知得分在[50,60),[90,100]的频数分别为16,4.(Ⅰ)求样本容量n和频率分布直方图中的a,b的值;(Ⅱ)估计本次竞赛学生成绩的平均数(同一组中的数据用该组区间的中点值代表);(Ⅲ)在选取的样本中,若男生和女生人数相同,我们规定成绩在70分以上称为“优秀”,70分以下称为“不优秀”,其中男女生中成绩优秀的分别有24人和30人,请完成列联表,并判断是否有90%的把握认为“学生的成绩优秀与性别有关”?2)附:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)由题意可知,样本容量161000.01610n ==⨯,40.00410010b ==⨯,0.1000.0040.0100.0160.0400.030a =----=.(Ⅱ)设本次竞赛学生成绩的平均数为x ,则(0.016550.030650.040750.010850.00495)1070.6x =⨯+⨯+⨯+⨯+⨯⨯=.(Ⅲ)100位学生中男女生各有50名,成绩优秀共有54名,所以学生的成绩优秀与性别列联表如下表:22100(24203026)1001.4492.7065050465469K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有90%的把握认为“学生的成绩优秀与性别有关”. 例3.某健身馆为了宣传健身效果,吸引顾客,特别请专业的评估机构对他们500名学员的锻炼成果进行评估打分(满分100分),并且认为评分不低于80分的参与者为健身达人,得到如表:(Ⅰ)判断能否在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系?(Ⅱ)若500名学员中40岁以上的有100人,30岁到40岁的有300人,30岁以下的100人,先从中分层抽取5人进行抽奖活动,再从这5人中抽取两位对其进行全年免单活动,求两人全年免单都在30岁到40岁之间的概率是多少?附:2)2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)因为22500(20015050100)83.33310.828250250200300K ⨯⨯-⨯=≈>⨯⨯⨯,所以能在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系.(Ⅱ)根据分层抽样可知在40岁以上的学员中应抽取1人,记为a ;在30岁到40岁的学员中应抽取3人,记为A ,B ,C ;在30岁以下的学员中应抽取1人,记为b ,则从这5人中抽取2人,所有可能情况如下:(,)a A ,(,)a B ,(a ,)(C a ,)b ,(,)A B ,(,)A C ,(,)A b ,(,)B C ,(,)B b ,(,)C b共10种情况,2人都在30岁到40岁之间的有(,)A B ,(,)A C ,(,)B C 共3种情况, 所以两人全年免单都在30岁到40岁之间的概率310P =. 例4.某公司为了推广某项技术,对旗下200名员工的年龄和人数进行了统计,统计其对这项技术的接受程度,从而为后期宣传工作做准备,并绘制了如下频率分布直方图.(Ⅰ)根据如图求样本年龄的中位数和平均数(同一组中的数据用该组区间的中点值为代表)(保留两位小数);(Ⅱ)若将样本分为两个年龄段,年龄在区间[18,38)和[38,68]分别称为“青少年”和“中老年”,根据相关条件完成下表,并判断是否有95%的把握认为对新技术接受程度与年龄段有关?参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2)0.050【解析】解:(Ⅰ)根据频率分布直方图可知样本年龄的平均数230.01010330.02010430.03010530.02510630.0151044.50x=⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=.设样本年龄的中位数为x,由题知组距为10,[18,38)的频率为(0.0100.020)100.300.5+⨯=<,[18,48)的频率为0.300.030100.600.5+⨯=>,所以中位数在区间[38,48)内,所以(38)0.030100.50.3x-⨯⨯=-,即238~38.673x=+,所以样本年龄的平均数为44.50,中位数为38.67.(Ⅱ)由题意知,样本中的“青少年”共有200(0.0100.020)1060⨯+⨯=(人),则“中老年”共有20060140-=(人).根据频率分布直方图完成列联表如下:则:22()200(20704070)4.714 3.841()()()()9011060140n ad bcKa b c d a c b d-⨯⨯-⨯==≈> ++++⨯⨯⨯,所以有95%的把握认为对新技术接受程度与年龄段有关.例5.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(Ⅰ)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率; (Ⅱ)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关? 附:22()()()()()n ad bc k a b c d a c b d -=++++,20)k【解析】解:(Ⅰ)由题意知,40人中该日走路步数超过5000步的有35人,频率为357408=, 所以估计他的所有微信好友中每日走路步数超过5000步的概率为78; (Ⅱ)由表中数据,填写列联表如下;计算观测值2240(141268)403.8412020221811K ⨯⨯-⨯==<⨯⨯⨯,所以没有95%以上的把握认为“评定类型”与“性别”有关.例6.为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表表2:女生上网时间与频数分布表(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的22⨯列联表(此表应画在答题卷上),并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率. 表3:附:2()()()()k a b c d a c b d =++++,其中n a b c d =+++20)k 0.5000.455【解析】解:(1)设估计上网时间不少于60分钟的人数x , 依据题意有30750100x =,解得:225x =, 所以估计其中上网时间不少于60分钟的人数是225人;⋯(4分) (2)根据题目所给数据得到如下列联表:其中22200(6034070)2002.198 2.7061001001307091K ⨯⨯-⨯==≈<⨯⨯⨯,因此,没有90%的把握认为“学生周日上网时间与性别有关”; ⋯(8分) (3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为3:2, 所以5人中上网时间少于60分钟的有3人,记为A 、B 、C , 上网时间不少于60分钟的有2人,记为d 、e , 从中任取两人的所有基本事件为:AB 、AC 、Ad 、Ae 、BC 、Bd 、Be 、Cd 、Ce 、de 共10种,其中“至少有一人上网时间超过60分钟”包含了7种, 故所求的概率为710P =. ⋯(12分) 例7.某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z ,女性人数为2z ,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的1.(1)完成22⨯联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费(0)m m >元.甲团队研发的药物每次接种后产生抗体的概率为p ,根据以往试验统计,甲团队平均花费为226mp m -+;乙团队研发的药物每次接种后产生抗体的概率为q ,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:22()()()()()n ad bc K a b c d a c b d -=++++20)k0k【解析】解:(1)根据题意填写列联表如下;Ⅰ型病男 若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则225423()263637.879333222z z z z z z K z z z z-==>,解得11.8185z >,由*6z N ∈,且*3zN ∈,所以z 的最小值为12,即男性患者至少有12人; (2)设甲研发试验品花费为X ,则2()26E X mp m =-+; 设乙研发试验品花费为Y ,则Y 的可能取值为3m 、6m ,所以223323(3)(1)23P Y m C q q q q q ==-+=-+, 32(6)123P Y m q q ==+-,所以323232()3(23)6(123)696E Y m q q m q q mq mq m =-+++-=-+; 因为2p q=,所以322322322()()696266926(61)E Y E X mq mq m mp m mq mq mp mq mq mq q -=-++-=-+=-=-;①当106q <<时,610q -<,因为0m >,所以2(61)0mq q -<,所以()()E X E Y >,乙团队试验的平均花费较少,所以选择乙团队进行研发;②当116q <<时,610q ->,因为0m >,所以2(61)0mq q ->,所以()()E X E Y <,甲团队试验的平均花费较少,所以选择甲团队进行研发;③当16q=时,2(61)0mq q-=,所以()()E X E Y=,甲团队试验的平均花费和乙团队试验的平均费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.例8.某房产中介统计了深圳市某高档小区从2018年12月至2019年11月当月在售二手房均价(单位:万元/平方米)的散点图,如图所示,图中月份代码1至12分别对应2018年12月至2019年11月的相应月份.根据散点图选择y a bx=+和y c dlnx=+两个模型进行拟合,根据数据处理得到两个回归方程分别为ˆ 6.90570.0195y x=+和ˆ 6.86390.1012y lnx=+,并得到以下一些统计量的值:(1)请利用相关指数2R判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年5月份购买深圳市福田区(50160)s s平方米的二手房(欲购房为其家庭首套房).若该小区所有住房的房产证均已满3年,请你利用(1)中拟合效果更好的模型解决以下问题:()i估算该购房者应支付的购房金额.(购房金额=房款+税费;房屋均价精确到0.01万元/平方米)()ii若该购房者拟用不超过760万元的资金购买该小区一套二手房,试估算其可购买的最大面积(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按照房屋的计税价格进行征收.(计税价格=房款)征收方式见如表:90s144s参考数据:20.69ln ≈,3 1.10ln ≈,7 2.83ln≈,19 2.94ln ≈ 1.41 1.73≈ 4.12≈ 4.36,参考公式:相关指数22121ˆ()1()nii i nii i y yR yy ==-=--∑∑.【解析】解:(1)设模型ˆ 6.90570.0195yx =+和ˆ 6.86390.1012y lnx =+的相关指数分别是21R 和22R , 则210.014855710.069193R =-,220.004878110.069193R =-,0.01485570.0048781>,∴2212R R <,∴模型ˆ 6.86390.1012ylnx =+的拟合效果更好. (2)2020年5月份的对应月份代码为18,由(1)知,模型ˆ 6.86390.1012ylnx =+的拟合效果更好, 利用该模型预测可得,这个小区2020年5月份的在售二手房均价为: ˆ 6.86390.1012187.16yln =+≈万元/平方米, ()i 设该购房者应支付的购房金额为h 万元,税费中买方只需缴纳契税,∴①当5090s 时,契税为计税价格的1%,故7.16(1%1)7.2316h s s =⨯⨯+=;②当90144s <时,契税为计税价格的2%, 故7.16(2%1)7.3032h s s =⨯⨯+=;③当144160s <时,契税为计税价格的4%, 故7.16(4%1)7.4464h s s =⨯⨯+=. 故7.2316,50907.3032,901447.4464,144160s s h s s s s ⎧⎪=<⎨⎪<⎩.∴当5090s 时,购房金额为7.2316s 万元;当90144s <时,购房金额为7.3032s 万元;当144160s <时,购房金额为7.4464s 万元.()ii 设该购房者可购买该小区二手房的最大面积为t 平方米,由()i 知,当5090s 时,应支付的购房金额为7.2316s 万元, 又7.23167.231690760s ⨯<,又房屋均价约为7.16万元/平方米,7.16144760⨯>,144t ∴<,得90144t <<.由7.3032760t ,解得760104.17.3032t≈,∴该购房者可购买该小区二手房的最大面积为104平方米.例9.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图1.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[50,150)内的用户记为A 类用户,标记为低用电家庭,用电量在区间[250,350)内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图如图2:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:0)k22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.【解析】解:(1)1(0.0060.00360.002420.0012)0.004450x =-++⨯+=, 按用电量从低到高的六组用户数分别为6,9,15,11,6,3, 所以平均用电量为675912515175112256275332518650⨯+⨯+⨯+⨯+⨯+⨯=.(2)①B 类用户共9人,打分超过8(5分)的有6人,所以打分超过8(5分)的概率为6293=. ②2224(6963) 1.6 3.8411212915k ⨯⨯-⨯==<⨯⨯⨯,所以没有95%的把握认为“满意度与用电量高低有关”.例10.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关.现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,在将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?2)k2()()()()()n ad bc K a b c d a c b d -=++++.【解析】解:(1)由已知得:样本中有25周岁以上组工人60名,25周岁以下组工人40人,所以样本中日平均生产件数不足60件的工人中25周岁以上组有600.053⨯=人,分别记为:1A ,2A ,3A , 25周岁以下组有工人400.052⨯=人,分别记为1B ,2B ,从中随机抽取2人,所有可能的结果共10种,他们分别是1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,2)B ,3(A ,2)B ,1(B ,2)B ,其中“至少有1名”,25周岁以下组的结果有7种, 故所求概率为710P =; (2)由频率分别直方图可知:在抽取的100名工人中, “25周岁以上组”中的生产能手600.2515⨯=人, “25周岁以下组”中的生产能手400.37515⨯=人, 据此可得22⨯列联表:所以2()100(15254515) 1.786 2.706()()()()60403070n ad bc K a b c d a c b d -⨯⨯-⨯==≈<++++⨯⨯⨯. 所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.例11.某市在对学生的综合素质评价中,将其测评结果分为“优秀、合格、不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其它为“合格”.(Ⅰ)某校高二年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层抽样的方法从高二学生中抽取了90名学生的综合素质评价结果,其各个等级的频数统计如表:根据表中统计的数据填写下面22⨯列联表,并判断是否有90%的把握认为“综合素质评价测评结果为优秀与性别有关”?(Ⅱ)以(Ⅰ)中抽取的90名学生的综合素质评价等级的频率作为全市各个评价等级发生的概率,且每名学生是否“优秀”相互独立,现从该市高二学生中随机抽取4人. ()i 求所选4人中恰有3人综合素质评价为“优秀”的概率;()ii 记X 表示这4人中综合素质评价等级为“优秀”的人数,求X 的数学期望.附:参考数据与公式 (1)临界值表:(2)参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)设从高二年级男生中抽出m 人,则90500500400m =+, 解得50m =.503812x ∴=-=,40364y =-=.22∴⨯列联表为:290(30102030) 2.25 2.70650406030K ⨯⨯-⨯∴==<⨯⨯⨯,∴没有90%的把握认为“综合素质评价测评结果为优秀与性别有关”. (Ⅱ)()i 由(Ⅰ)知等级为“优秀”的学生的频率为23, ∴从该市高二学生中随机抽取一名学生,该生为“优秀”的概率为23. 记“所选4名学生中恰有3人综合素质评价为‘优秀’学生”为事件A , 则事件A 发生的概率为:P (A )3342132()3381C =⨯⨯=.()ii X 表示这4个人中综合速度评价等级为“优秀”的个数,由题意,随机变量2~(4,)3X B ,X ∴的数学期望28()433E X =⨯=.例12.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷“与性别有关?(注:0.95以上把握说明有关)(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X附:22112212211212()n n n n n X n n n n ++++-=,2)k【解析】解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515) 3.03075254555K ⨯⨯-⨯=≈⨯⨯⨯.⋯(5分)因为3.030 3.841<,所以我们没有充分理由认为“体育迷”与性别有关. ⋯(6分) (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率14, 即从观众中抽取一名“体育迷”的概率.⋯(7分) 由题意知1~(3,)4X B ,从而X 的分布列为⋯(10分)13()344E X np ==⨯=,139()(1)34416D X np p =-=⨯⨯=.⋯(12分) 例13.随着节能减排意识深入人心以及共享单车在饶城的大范围推广,越来越多的市民在出行时喜欢选择骑行共享单车.为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成22⨯列表(见答题卡),并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢骑行共享单车”与性别有关?(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,视频率为概率,在我市所有“骑行达人”中,随机抽取4名用户.①求抽取的4名用户中,既有男生“骑行达人”又有女“骑行达人”的概率;②为了鼓励女性用户使用共享单车,对抽出的女“骑行达人”每人奖励500元,记奖励总金额为X ,求X 的分布列及数学期望.附表及公式:22()()()()()n ad bc K a b c d a c b d -=++++【解析】(1)由图中表格可得22⨯列联表如下:将22⨯列联表中的数据代入公式计算得22100(45153010) 3.03 3.84125755545K ⨯-⨯=≈<⨯⨯⨯,所以在犯错误概率不超过0.05的前提下,不能认为是否“喜欢骑行共享单车”与性别有关.(2)视频率为概率,在我市“骑行达人”中,随机抽取1名用户,该用户为男“骑行达人”的概率为35,女“骑行达人”的概率为25.①抽取的4名用户中,既有男“骑行达人”,又有女“骑行达人”的概率为 44325281()()55625P =--=; ②记抽出的女“骑行达人”人数为Y ,则500X Y =.由题意得2~(4,)5Y B ,4423()()()55i i iP Y i C -∴== (0i =,1,2,3,4),Y ∴的分布列为X ∴的分布列为所以28()455E Y =⨯=, 所以X 的数学期望()500()800E X E Y ==元.例14.2021年,辽宁省将实施新高考,2018年暑期入学的高一学生是新高考首批考生,新高考不再分文理科,采用33+模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层抽样的方法从中抽取n 名学生进行调查.(1)已知抽取的n 名学生中含女生45人,求n 的值及抽取到的男生人数;(2)学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到n 名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表:请将上面的列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由; (3)在抽取到的45名女生中按分层抽样再抽出9名女生,了解女生对“历史”的选课意向情况,在这9名女生中再抽取4人,设这4人中含选择“地理”的人数为X ,求X 的分布列及期望.)k参考公式:22112212211212()n n n n n K n n n n ++++-=【解析】解:(1)由题意得:451000450n =,解得100n =, 男生人数为:100550551000⨯=人.⋯⋯⋯⋯(2分) (2)22⨯列联表为:222111212211212()100(45202510)8.1289 6.63555457030n n n n n n n n n ++++-⨯⨯-⨯X ==≈>⨯⨯⨯所以有99%的把握认为选择科目与性别有关.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(7分)(3)从45名女生中分层抽样抽9名女生,所以这9名女生中有5人选择物理,4人选择地理, 9名女生中再选择4名女生,则这4名女生中选择地理的人数X 可为0,1,2,3,4. 设事件X 发生概率为()P X ,则45495(0)126C P X C ===,31544940(1)126C C P X C ===,22544960(2)126C C P X C ===,13544920(3)126C C P X C ===,44491(4)126C P X C ===,X 的分布列为:期望406020116()2341261261261269E X =+⨯+⨯+⨯=.⋯⋯⋯⋯(12分) 例15.微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余每天使用微信在一小时以上.若将员工年龄分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,经常使用微信的员工中23是青年人. (Ⅰ)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22⨯列联表;(Ⅱ)由列联表中所得数据,是否有99.9%的把握认为“经常使用微信与年龄有关”?)k附:22()()()()()n ad bcKa b c d a c b d-=++++.【解析】解:(Ⅰ)由已知可得,该公司员工中使用微信的共:2000.9180⨯=人经常使用微信的有18060120--人,其中青年人:2 120803⨯=人所以可列下面22⨯列联表:(Ⅱ)将列联表中数据代入公式可得:22180(8055540)13.33310.8281206013545K⨯⨯-⨯=≈>⨯⨯⨯所以有99.9%的把握认为“经常使用微信与年龄有关”.例16.某校高三4班有50名学生进行了一场投篮测试,其中男生30人,女生20人.为了了解其投篮成绩,甲、乙两人分别都对全班的学生进行编号(150-号),并以不同的方法进行数据抽样,其中一人用的是系统抽样,另一人用的是分层抽样.若此次投篮测试的成绩大于或等于80分视为优秀,小于80分视为不优秀,如表是甲、乙两人分别抽取的样本数据:甲抽取的样本数据乙抽取的样本数据(Ⅰ)在乙抽取的样本中任取3人,记投篮优秀的学生人数为X,求X的分布列和数学期望.(Ⅱ)请你根据乙抽取的样本数据完成下列22⨯列联表,判断是否有95%以上的把握认为投篮成绩和性别有关?(Ⅲ)判断甲、乙各用何种抽样方法,并根据(Ⅱ)的结论判断哪种抽样方法更优?说明理由. 下面的临界值表供参考:2)k(参考公式:2()()()()K a b c d a c b d =++++,其中)n a b c d =+++【解析】解:(Ⅰ)在乙抽取的10个样本中,投篮优秀的学生人数为4,X ∴的取值为0,1,2,3463103.(),0,1,2,3k kC C P X k k C -=== 分布列为:1131601236210305EX =+++=(6分) (Ⅱ)设投篮成绩与性别无关,由乙抽取的样本数据,得22⨯列联表如下:(7分)2210(4402) 4.444 3.8414664K ⨯⨯-⨯=≈>⨯⨯⨯,(9分) 所以有95%以上的把握认为投篮成绩与性别有关.(10分) (Ⅲ)甲用的是系统抽样,乙用的是分层抽样. ⋯(11分)由(Ⅱ)的结论知,投篮成绩与性别有关,并且从样本数据能看出投篮成绩与性别有明显差异,因此采用分层抽样方法比系统抽样方法更优.⋯(12分)例17.已知某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯列联表,并判断是否能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?(相关系数22()()()()()n ad bc K a b c d a c b d -=++++,2 2.706K >时有99%的把握具有相关性)【解析】解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名, 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053⨯=(人), 记为1A ,2A ,3.25A 周岁以下组工人有400.052⨯=(人),记为1B ,2B . 从中随机抽取2名工人,所有可能的结果共有10种,即: 1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B , 2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .其中,至少抽到一名“25周岁以下组”工人的可能结果共有7种,是:1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .故所求概率710P =. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515⨯=(人),“25周岁以下组”中的生产能手有400.37515⨯=(人),据此可得22⨯列联表如下:所以得:22100(15251545)251.796040307014K⨯⨯-⨯==≈⨯⨯⨯.因为1.79 2.706<,所以不能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”.例18.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图.表1:甲流水线样本频数分布表(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++其中n a b c d=+++;临界值表供参考:)k0.15k 2.072【解析】解:(1)根据所给的每一组的频数和样本容量做出每一组的频率,在平面直角坐标系中做出频率分步直方图,甲流水线样本的频率分布直方图如下:(2)由图知,甲样本中合格品数为30,合格品的频率为300.7540=,乙样本中合格品数为(0.060.090.03)54036++⨯⨯=,合格品的频率为360.940=,据此可估计从甲、乙流水线上任取一件产品该产品为合格品的概率分别为0.75、0.9;(3)22⨯列联表如下。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§ 独立性检验
一、基础过关
1.当χ2>时,就有________的把握认为“x 与y 有关系”.
2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)
3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)
y 1
y 2 总计 x 1 (
a b a +b x 2 c d c +d
总计
a +c
b +d
&
a +
b +
c +d
①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计 】
爱好 40 20 60 不爱好 20 30
50 总计
60
%
50 110
由
χ2=n ad -bc 2
a +
b
c +
d a +c b +d
算得,
χ2=110×40×30-20×20260×50×60×50≈. 附表:
P (χ2≥k )
k
)
参照附表,得到的正确结论是________.
①在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”;
③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.
5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸
.
年龄
合计
不超过40岁
超过40岁
吸烟量不多于20支/天
50 15 65 )
吸烟量多于20支/天
10 25 35 合计
60
40
100
则有________的把握确定吸烟量与年龄有关. 二、能力提升
—
6.某高校“
专业 性别
非统计专业
统计专业 合计 男
13 10 23 |
女 7 20 27
合计
20
30
50
为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×13×20-10×7
2
23×27×20×30
≈.
因为χ2≈>,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________. 7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍.
~
8.下列说法正确的是________.(填序号)
①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;
③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.
9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:
无效 有效 总计 (
男性患者 15 35 50 女性患者
6
44
50
设H0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,
*
根据此资料,你是否认为教龄的长短与支持新的数学教材有关
11
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.
.
按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.
三、探究与拓展
12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[,的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
(1)分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
答案
1.90% 3.③ 4.③ 8.② 5%
10.解 由公式得χ2=
n ad -bc 2
a +
b
c +
d a +c
b +d
=71×12×24-25×10237×34×22×49≈. ∵χ2<.
【
∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关.
由公式得χ2
=830×52×218-466×942146×684×518×312 ≈. 因为>.
因此我们有%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:
得病 不得病 %
总计 干净水 5 50 55 不干净水 9
22 31 总计
?
14
72
86
此时,χ2=
86×5×22-50×9
2
55×31×14×72
≈.
由于>,所以我们有%的把握认为该种传染病与饮用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有%的把握肯定结论的正确性,(2)问中我们只有%的把握肯定结论的正确性.
12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360
500×100%=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320
500×100%=64%. (2)
甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计
500
500
1 000
由列联表中的数据,得
χ2=1 000×360×180-320×1402
680×320×500×500
≈>.
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.。