独立性检验练习含答案
课时作业1:4.3.2 独立性检验
4.3.2 独立性检验1.下面是一个2×2列联表:Y Y 总计 X a 11 63 X b 15 23 总计6026则表中a ,b 处的值分别为( A .74,38 B .52,10 C .52,8 D .8,52答案 C解析 ∵a +11=63,b +15=23,∴a =52,b =8.2.下列选项中,哪一个χ2的值可以有99%以上的把握认为“A 与B 有关系”( ) A .χ2=2.715 B .χ2=3.910 C .χ2=6.165 D .χ2=7.014 答案 D解析 ∵7.014>6.635,查阅χ2表知有99%的把握认为两个随机事件之间有关系. 3.通过随机询问110名大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110经计算得χ2=110×(40×30-20×20)260×50×60×50≈7.822.则正确结论是( )A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关”答案 C解析 根据独立性检验的思想方法,正确选项为C.4.考察棉花种子经过处理与生病之间的关系,得到下表中的数据:根据以上数据可得出( )A .种子是否经过处理与是否生病有关B .种子是否经过处理与是否生病无关C .种子是否经过处理决定是否生病D .有90%的把握认为种子经过处理与生病有关 答案 B 解析χ2=407×(32×213-61×101)293×314×133×274≈0.164<2.706,即没有充足的理由认为种子是否经过处理跟生病有关.5.(多选)下列说法正确的是( )A .事件A 与B 独立,即两个事件互不影响 B .事件A 与B 关系越密切,则χ2就越大C .χ2的大小是判定事件A 与B 是否相关的唯一根据D .若判定两事件A 与B 相关,则A 发生B 一定发生 答案 AB解析 由事件的独立性知,A 选项正确;由独立性检验的意义知,B 选项正确;χ2的大小是判定事件A 与B 是否相关的一种方法,不是唯一依据,C 选项不正确;若事件A 与B 相关,则A 发生B 可能发生,也可能不发生,D 选项不正确.6.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=7.63,根据这一数据分析,有________的把握说,打鼾与患心脏病是________的.(填“有关”“无关”) 答案 99% 有关解析 ∵χ2=7.63,∴χ2>6.635,因此,有99%的把握说,打鼾与患心脏病是有关的. 7.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得 χ2=50×(13×20-10×7)223×27×20×30≈4.844>3.841.因此,判定主修统计专业与性别有关系,那么这种判断出错的概率为________. 答案 0.05解析 根据χ2>3.841,可判断有95%的把握认为主修统计专业与性别有关系.故出错的概率为0.05.8.下表是关于男婴与女婴出生时间调查的列联表:那么,A =________,B =________,C =________,D =________,E =________. 答案 47 92 88 82 53解析 由列联表得⎩⎪⎨⎪⎧ 45+E =98,98+D =180,A +35=D ,E +35=C ,B +C =180,解得⎩⎪⎨⎪⎧A =47,B =92,C =88,D =82,E =53.9.在某测试中,卷面满分为100分,60分为及格,为了调查午休对本次测试前两个月复习效果的影响,特对复习中进行午休和不进行午休的考生进行了测试成绩的统计,数据如下表所示:(1)根据上述表格完成列联表:(2)根据列联表可以得出什么样的结论?对今后的复习有什么指导意义? 解 (1)2×2列联表如下表所示:(2)计算可知,午休的考生及格率为P 1=80180=49.不午休的考生的及格率为P 2=65200=1340,由P 1>P 2,可以粗略判断午休与考生考试及格有关系,并且午休的及格率高,所以在以后的复习中考生应尽量适当午休,以保持最佳的学习状态.10.为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程); (2)能否有95%的把握认为喜爱打篮球与性别有关?(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值.解 (1)列联表补充如下:(2)由χ2=48×(220-60)228×20×32×16≈4.286>3.841,所以有95%的把握认为喜爱打篮球与性别有关.(3)喜爱打篮球的女生人数X 的可能取值为0,1,2. 其概率分别为 P (X =0)=C 210C 220=938,P (X =1)=C 110C 110C 220=1019,P (X =2)=C 210C 220=938,故X 的分布列为X 0 1 2 P9381019938X 的均值为E (X )=0+1019+919=1.11.(多选)下列关于回归分析与独立性检验的说法不正确的是( ) A .回归分析和独立性检验没有什么区别B .回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C .回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D .独立性检验可以100%确定两个变量之间是否具有某种关系 答案 ABD12.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男人、女人中患色盲的频率分别为0.038和0.006B .男、女患色盲的概率分别为19240,3260C .男人中患色盲的比例比女人中患色盲的比例大,可以认为患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关 答案 C解析 男人中患色盲的比例为38480=19240,要比女人中患色盲的比例6520=3260大,其差值为⎪⎪⎪⎪19240-3260≈0.067 6,差值较大,故认为患色盲与性别是有关的. 13.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: 甲厂:乙厂:(1)两个分厂生产的零件的优质品率分别为________;(2)有________的把握认为“两个分厂生产的零件的质量有差异”. 答案 (1)72%,64% (2)99%解析 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1 000×(360×180-320×140)2500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.14.2018年世界杯期间,某电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:总计a b 100若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关. 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).临界值表:a =P (χ2≥k )0.10 0.05 0.010 0.005 0.001 k2.7063.8416.6357.87910.828答案 95%解析 设“从所有人中任意抽取一人,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35, 所以q =25,p =25,a =40,b =60. χ2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841. 故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关.15.(多选)有两个分类变量X ,Y ,其2×2列联表如下所示:Y 1 Y 2 总计 X 1 a 20-a 20 X 2 15-a 30+a 45 总计155065其中a,15-a 均为大于5的整数,若有95%的把握认为X ,Y 有关,则a 的值为( ) A .6 B .7 C .8 D .9 答案 CD 解析 由题意可知 χ2=65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.16.“中国式过马路”存在很大的交通安全隐患.某调查机构为了解路人对“中国式过马路”的态度是否与性别有关,从马路旁随机抽取30名路人进行了问卷调查,得到了如下列联表:已知在这30人中随机抽取1人抽到反感“中国式过马路”的路人的概率是815.(1)请将上面的列联表补充完整(直接写结果,不需要写求解过程),并据此资料分析反感“中国式过马路”与性别是否有关?(2)若从这30人中的女性路人中随机抽取2人参加一活动,记反感“中国式过马路”的人数为X ,求X 的分布列和均值. 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由已知数据得χ2=30×(10×8-6×6)216×14×16×14≈1.158<2.706.所以,没有充足的理由认为反感“中国式过马路”与性别有关. (2)X 的可能取值为0,1,2, P (X =0)=C 28C 214=413,P (X =1)=C 16C 18C 214=4891,P (X =2)=C 26C 214=1591.所以X 的分布列为X 的均值为E (X )=0×413+1×4891+2×1591=67.。
独立性检验练习含答案
§1.1 独立性检验一、基础过关1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”.2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P (χ2≥k ) 0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是________.①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100则有________的把握确定吸烟量与年龄有关. 二、能力提升6.某高校“统计初步”课程的教师随机调查了选该课的一些情况,具体数据如下表:专业 性别非统计专业统计专业 合计 男 13 10 23 女 7 20 27 合计203050为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2≈4.844>3.841,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________.7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. 8.下列说法正确的是________.(填序号)①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:无效 有效 总计 男性患者 15 35 50 女性患者 6 44 50 总计2179100设H 0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如下表所示:支持新教材支持旧教材合计 教龄在15年以上的教师122537教龄在15年以下的教师102434合计224971根据此资料,你是否认为教龄的长短与支持新的数学教材有关?11.下表是某地区的一种传染病与饮用水的调查表:得病不得病总计干净水52466518不干净水94218312总计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.三、探究与拓展12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98)[29.98,30.02)频数126386182分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数9261 4乙厂:分组[29.86,29.90) [29.90,29.94) [29.94,29.98) [29.98,30.02)频数297185159分组[30.02,30.06) [30.06,30.10) [30.10,30.14)频数766218(1)分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.答案1.90% 2.16.373 3.③ 4.③ 5.99.9% 6.5% 7.2 8.② 9.4.882 5%10.解 由公式得χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=71×(12×24-25×10)237×34×22×49≈0.08.∵χ2<2.706.∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关. 由公式得χ2=830×(52×218-466×94)2146×684×518×312≈54.21.因为54.21>10.828.因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:得病 不得病 总计 干净水 5 50 55 不干净水 9 22 31 总计147286此时,χ2=86×(5×22-50×9)255×31×14×72≈5.785.由于5.785>5.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关. 两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2)问中我们只有97.5%的把握肯定结论的正确性. 12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500×100%=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500×100%=64%. (2)甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计5005001 000由列联表中的数据,得χ2=1 000×(360×180-320×140)2680×320×500×500≈7.353>6.635.所以有99%的把握认为“两个分厂生产的零件的质量有差异”.Welcome To Download !!!欢迎您的下载,资料仅供参考!。
独立性检验习题及答案
1.2 独立性检验的基本思想及其初步应用例题:1.三维柱形图中柱的高度表示的是( )A .各分类变量的频数B .分类变量的百分比C .分类变量的样本数D .分类变量的具体值解析: 三维柱形图中柱的高度表示图中各个频数的相对大小.选A2. 统计推断,当______时,有95 %的把握说事件A 与B 有关;当______时,认为没有充分的证据显示事件A 与B 是有关的.解析:当841.3>k 时,就有95 %的把握说事件A 与B 有关,当076.2≤k 时认为没有充分的证据显示事件A 与B 是有关的.3.为了探究患慢性气管炎与吸烟有无关系,调查了却339名50岁以上的人,结果如下表所示,据此数据请问:50岁以上的人患慢性气管炎与吸烟习惯有关系吗?分析:有表中所给的数据来计算2K 的观测值k,再确定其中的具体关系.解:设患慢性气管炎与吸烟无关.a=43,b=162,c=13,d=121,a+b=205,c+d=134, a+c=56,b+d=283,n=339所以2K 的观测值为469.7))()()(()(2==+++-=d b c a d c b a bc ad n k .因此635.6>k ,故有99%的把握认为患慢性气管炎与吸烟有关.课后练习:1. 在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就( )A.越大B.越小C.无法判断D.以上都不对2.下列关于三维柱形图和二维条形图的叙述正确的是: ( ) A .从三维柱形图可以精确地看出两个分类变量是否有关系B .从二维条形图中可以看出两个变量频数的相对大小,从三维柱形图中无法看出相对频数的大小C .从三维柱形图和二维条形图可以粗略地看出两个分类变量是否有关系D .以上说法都不对3.对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是() A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大4. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若K 2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误;D.以上三种说法都不正确.5.若由一个2*2列联表中的数据计算得k 2=4.013,那么有 把握认为两个变量有关系6.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:250(1320107) 4.84423272030k ⨯⨯-⨯=≈⨯⨯⨯因为23.841K ≥,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为 ____;7.在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。
独立性检验—高考真题
独立性检验—高考真题一、解答题二、解答题1.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g ).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.132.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2试验组的小白鼠体重的增加量从小到大排序为7.8 9.2 11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.219.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成如下列联表m <m≥对照组试验组(ⅱ)根据(i )中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:()()()()22()n ad bc K a b c d a c b d -=++++,()2P K k ≥0.1000.0500.010k2.7063.841 6.6352.甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++()2P K k≥0.0500.0100.001k 3.841 6.63510.8283.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:22()()()()()n ad bcKa b c d a c b d-=++++,P(K2≥k)0.0500.010 0.001k 3.841 6.63510.8284.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.P(K2≥k)0.0500.0100.001k 3.841 6.63510.8285.为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿性别男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由附:P(2K k ≥)0.0500.0100.001k 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++6.甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A 24020B 21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,()2P K k 0.1000.0500.010k2.7063.841 6.635参考答案:1.(1)19.8(2)(i)23.4m=;列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得23.4m=,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:1(7.89.211.412.413.215.516.518.018.819.219.820.220+++++++++++39621.622.823.623.925.128.232.336.5)19.820++++++++==(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6, ,故第20位为23.2,第21位数据为23.6,所以23.223.623.42m+==,故列联表为:m<m≥合计对照组61420试验组14620合计202040(ii)由(i)可得,2240(661414)6.400 3.84120202020K⨯⨯-⨯==>⨯⨯⨯,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 2.(1)75%;60%;(2)能.【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075%200=,乙机床生产的产品中的一级品的频率为12060%200=.(2)()22400150801205040010 6.63527013020020039K ⨯-⨯==>>⨯⨯⨯,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.3.(1)该市一天的空气质量等级分别为1、2、3、4的概率分别为0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率;(2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论.【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=;(2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:人次400≤人次400>空气质量好3337空气质量不好228()221003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.4.(1)43 ,55;(2)能有95%的把握认为男、女顾客对该商场服务的评价有差异.【分析】(1)从题中所给的22⨯列联表中读出相关的数据,利用满意的人数除以总的人数,分别算出相应的频率,即估计得出的概率值;(2)利用公式求得观测值与临界值比较,得到能有95%的把握认为男、女顾客对该商场服务的评价有差异.【详解】(1)由题中表格可知,50名男顾客对商场服务满意的有40人,所以男顾客对商场服务满意率估计为1404 505P==, 50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估计为2303 505P==,(2)由列联表可知22100(40203010)1004.762 3.8417030505021K⨯-⨯==≈>⨯⨯⨯,所以能有95%的把握认为男、女顾客对该商场服务的评价有差异.【点睛】该题考查的是有关概率与统计的知识,涉及到的知识点有利用频率来估计概率,利用列联表计算2K的值,独立性检验,属于简单题目.5.(1)7014%500=,(2)有99%的把握(3)见解析【详解】(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估算值为7014% 500=(2)22500(4027030160)9.96720030070430K⨯⨯-⨯==⨯⨯⨯.由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.6.(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K ,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A 共有班次260次,准点班次有240次,设A 家公司长途客车准点事件为M ,则24012()26013==P M ;B 共有班次240次,准点班次有210次,设B 家公司长途客车准点事件为N ,则210()27840==P N .A 家公司长途客车准点的概率为1213;B 家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计4505050022()()()()()n ad bc K a b c d a c b d -=++++=2500(2403021020) 3.205 2.70626024045050⨯⨯-⨯≈>⨯⨯⨯,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.。
北师大版数学【选修2-3】练习:3.2 独立性检验(含答案)
第三章 §2一、选择题1.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关,那么下列说法中正确的是( )A .在100个男性中约有90个人爱喝酒B .若某人爱喝酒,那么此人为男性的可能性为90%C .判断出错的可能性为10%D .有90%的把握认为10个男性中有9个人爱喝酒 [答案] C2.提出统计假设H 0,计算出χ2的值,即拒绝H 0的是( ) A .χ2=6.635 B .χ2=2.63 C .χ2=0.725 D .χ2=1.832[答案] A[解析] 依据独立性检验的思想及其结论的应用,应选A.3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” [答案] C[解析] 根据独立性检验的思想方法,正确选项为C. 二、填空题4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是____________________________________.[答案] 男正教授人数,副教授人数;女正教授人数,副教授人数.5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能以________的把握认为婴儿的性别与出生时间有关系.[答案] 90%[解析] 由列联表可以看出a =24,b =31,c =8,d =26,a +b =55,c +d =34,a +c =32,b +d =57,n =a +b +c +d =89,代入公式χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得χ2=89×(24×26-31×8)255×34×32×57≈3.689,由于χ2≈3.689>2.706,∴我们有90%的把握认为婴儿的性别与出生时间有关系. 三、解答题6.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人的调查结果如下:[分析] 先计算χ2的数值,然后比较χ2与3.841及6.635的大小,进而得出是否有关的结论.[解析] 由公式得χ2=540(60×200-260×20)2320×220×80×460=540(12 000-5 200)22 590 720 000=2 496 960259 072≈9.638.∴9.638>6.635,∴有99%的把握说40岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[点评]本题利用χ2公式计算出χ2的值,再利用临界性的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.一、选择题1.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量[答案] D[解析]根据χ2计算公式可知,阅读量与性别相关数据较大,所以选D.2.在一次独立性检验中,其把握性超过99%,则随机变量χ2的一个可能的值为() A.6.635 B.5.024C.7.897 D.3.841[答案] C[解析]若有99%把握,则χ2>6.635,只有C满足条件.3.分类变量X和Y的列联表如下,则()A.ad-bcB.ad-bc越大,说明X与Y的关系越强C .(ad -bc )2越大,说明X 与Y 的关系越强D .(ad -bc )2越接近于0,说明X 与Y 的关系越强 [答案] C[解析] 由统计量χ2的计算公式计算χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )可知(ad -bc )2越大,则计算出的统计量的值也越大,而统计量越大,说明(ad -bc )2越大,故选C.4.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90% C .97.5% D .99.9%[答案] D[解析] 由K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值k =9 965×(7 775×49-2 099×42)27 817×2 148×9 874×91≈56.632>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.5.为了研究性格和血型的关系,抽查80人实验,血型和性格情况如下:O 型或A 型者是内向型的有18人,外向型的有22人,B 型或AB 型是内向型的有12人,是外向型的有28人,则有多大的把握认为性格与血型有关系( )A.99.9% B .99%C .没有充分的证据显示有关D .1% [答案] C [解析]χ2=n (n 11n 22-12n 21)50×30×40×40=80×(22×12-28×18)50×30×40×40≈1.92<2.706,∴没有充分的证据显示有关.二、填空题6.在一次打鼾与患心脏病的调查中,共调查了1671人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是____________的.填(“有关”或“无关”)[答案] 有关[解析] ∵27.63>6.635∴打鼾与患心脏病有关的可能性很大,我们可以有99%的把握这么认为.7.为了了解小学生是否喜欢吃零食与性别之间的关系,调查者随机调查了89名小学生的情况,得到的数据如下表(单位:人):[答案] 3.689[解析] χ2=89×(24×26-31×8)255×34×32×57≈3.689.三、解答题8.在某医院,因为患心脏病而住院的655名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.根据以上数据判断男性病人的秃顶是否与患心脏病有关.[解析] 问题是判断男性病人的秃顶是否与患心脏病有关.计算得到下表(单位:人)由公式计算得χ2=1437×(214×597-175×451)389×1048×665×772≈16.373.因为16.373>6.635,所以有99%以上的把握认为男性病人的秃顶与患心脏病有关.9.为检验回答一个问题的对错是否和性别有关,有人作了一个调查,其中女生人数是男生人数的12,男生答对人数占男生人数的56,女生答错人数占女生人数的23.(1)若有99%的把握认为回答结果的对错和性别有关,则男生至少有多少人? (2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人? [分析] 若有99%的把握认为回答结果的对错和性别有关,说明χ2>6.635;没有充分的证据显示回答结果的对错和性别有关,说明χ2≤2.706.设出男生人数,并且它分别表示各类别人数,代入χ2的计算公式,建立不等式求解即可.[解析] 设男生人数为x ,依题意可得2×2列联表如下:(1)若有99%, 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x 8>6.635,解得x >17.693.因为x 2,x 6,x3为整数,所以若有99%的把握认为回答结果的对错和性别有关,则男生至少有18人.(2)没有充分的证据显示回答结果的对错和性别有关,则χ2≤3.841. 由χ2=3x 2·(5x 6·x 3-x 6·x 6)2x ·x 2·x 2·x =3x8≤2.706,解得x ≤7.216.因为x 2,x 3,x6为整数,所以若没有充分的证据显示回答结果的对错和性别有关,则男生至多有6人.[点评] 本题是逆向型思维问题,即将根据已知数据判断相关性问题变式为了一道由已知相关性求表中的字母数据问题,同时也是一个独立性检验和不等式的综合问题,解答时要注意理解“至少”“至多”的含义,充分建立不等式(组)来解决.10.为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做实验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .(1)甲、乙是200只家兔中的2只,求甲、乙分在不同组的概率;(2)下表1和表2分别是注射药物A和B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表②完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.表3:附:χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)[解析]2×2列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2列联表并计算χ2与临界值比较,说明是否有关.解:(1)甲、乙两只家兔分在不同组的概率为p =2C 99198C 100200=100199.(2)①可以看出注射药物A 后的疱疹面积的中位数在65至70之间,而注射药物B 后的疱疹面积的中位数在70至75之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.②表3:χ2=200×(70×65-35×30)100×100×105×95≈24.56,由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.。
北师大版数学【选修2-3】练习:3.2独立性检验(含答案)(可编辑修改word版)
第三章§2一、选择题1.独立性检验显示:有90%的把握认为性别与是否喜爱喝酒有关,那么下列说法中正确的是( )A.在100 个男性中约有90 个人爱喝酒B.若某人爱喝酒,那么此人为男性的可能性为90%C.判断出错的可能性为10%D.有90%的把握认为10 个男性中有9 个人爱喝酒[答案] C2.提出统计假设H0,计算出χ2 的值,即拒绝H0的是( )A.χ2=6.635 B.χ2=2.63C.χ2=0.725 D.χ2=1.832[答案] A[解析] 依据独立性检验的思想及其结论的应用,应选A.3.通过随机询问110 名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好40 20 60不爱好20 30 50总计60 50 110n(ad-bc)2 110 × (40 × 30-20 × 20)2由K2=算得,K2=≈7.8.(a+b)(c+d)(a+c)(b+d) 60 × 50 × 60 × 50 附表:A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”[答案] C[解析] 根据独立性检验的思想方法,正确选项为C.二、填空题4.某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集的数据是.[答案] 男正教授人数,副教授人数;女正教授人数,副教授人数.5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.能以的把握认为婴儿的性别与出生时间有关系.[答案] 90%[解析] 由列联表可以看出a=24,b=31,c=8,d=26,a+b=55,c+d=34,a+c=32,b+d=57,n=a+b+c+d=89,n(ad-bc)2代入公式χ2=得(a+b)(c+d)(a+c)(b+d)89 × (24 × 26-31 × 8)2χ2=55 × 34 × 32 × 57≈3.689,由于χ2≈3.689>2.706,∴我们有90%的把握认为婴儿的性别与出生时间有关系.三、解答题6.为了调查胃病是否与生活规律有关,在某地对540 名40 岁以上的人的调查结果如下:[分析] 先计算χ2 的数值,然后比较χ2 与3.841 及6.635 的大小,进而得出是否有关的结论.540(60 × 200-260 × 20)2[解析] 由公式得χ2=320 × 220 × 80 × 460540(12 000-5 200)2 2 496 960=2 590 720 000 =259 072≈9.638.∴9.638>6.635,∴有99%的把握说40 岁以上的人患胃病与生活是否有规律有关,即生活不规律的人易患胃病.[点评] 本题利用χ2 公式计算出χ2 的值,再利用临界性的大小关系来判断假设是否成立,解题时应注意准确代数与计算,不可错用公式,要准确进行比较与判断.一、选择题1.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4 个变量之间的关系,随机抽查52 名中学生,得到统计数据如表1 至表4,则与性别有关联的可能性最大的变量是( )A.成绩B.视力C.智商D.阅读量[答案] D[解析] 根据χ2 计算公式可知,阅读量与性别相关数据较大,所以选 D.2.在一次独立性检验中,其把握性超过99%,则随机变量χ2 的一个可能的值为( )A.6.635 B.5.024C.7.897 D.3.841[答案] C[解析] 若有99%把握,则χ2>6.635,只有C 满足条件.3.分类变量X 和Y 的列联表如下,则( )Y1Y2总计A.ad-bcB.ad-bc 越大,说明X 与Y 的关系越强C.(ad-bc)2 越大,说明X 与Y 的关系越强D.(ad-bc)2越接近于0,说明X 与Y 的关系越强[答案]Cn(ad-bc)2[解析] 由统计量χ2 的计算公式计算χ2=可知(ad-bc)2 越大,(a+b)(c+d)(a+c)(b+d)则计算出的统计量的值也越大,而统计量越大,说明(ad-bc)2 越大,故选C.4.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90%C.97.5% D.99.9%[答案] D[解析] 由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得其观测值9 965 × (7 775 × 49-2 099 × 42)2k=≈56.632>10.828.7 817 × 2 148 × 9 874 × 91故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.5.为了研究性格和血型的关系,抽查80 人实验,血型和性格情况如下:O 型或A 型者是内向型的有18 人,外向型的有22 人,B 型或AB 型是内向型的有12 人,是外向型的有28 人,则有多大的把握认为性格与血型有关系( )A.99.9%B.99%C.没有充分的证据显示有关D.1%[答案] C[解析]n(n11n22)χ2=50 × 30 × 40 × 40=的证据显示有关.二、填空题50 × 30 × 40 × 40≈1.92<2.706,∴没有充分6.在一次打鼾与患心脏病的调查中,共调查了1671 人,经过计算得χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是的.填(“有关”或“无关”)[答案] 有关[解析] ∵27.63>6.635∴打鼾与患心脏病有关的可能性很大,我们可以有99%的把握这么认为.7.为了了解小学生是否喜欢吃零食与性别之间的关系,调查者随机调查了89 名小学生的情况,得到的数据如下表(单位:人):≈.[答案] 3.68989 × (24 × 26-31 × 8)2[解析] χ2=≈3.689.55 × 34 × 32 × 57三、解答题8.在某医院,因为患心脏病而住院的655 名男性病人中,有214 人秃顶;而另外772 名不是因为患心脏病而住院的男性病人中,有175 人秃顶.根据以上数据判断男性病人的秃顶是否与患心脏病有关.[解析] 问题是判断男性病人的秃顶是否与患心脏病有关.计算得到下表(单位:人)≈16.373.由公式计算得χ2=389 × 1048 × 665 × 772因为16.373>6.635,所以有99%以上的把握认为男性病人的秃顶与患心脏病有关.9.为检验回答一个问题的对错是否和性别有关,有人作了一个调查,其中女生人数是1 5 2男生人数的,男生答对人数占男生人数的,女生答错人数占女生人数的.2 6 3(1)若有 99%的把握认为回答结果的对错和性别有关,则男生至少有多少人? (2)若没有充分的证据显示回答结果的对错和性别有关,则男生至多有多少人? [分析] 若有 99%的把握认为回答结果的对错和性别有关,说明 χ2>6.635;没有充分的证据显示回答结果的对错和性别有关,说明 χ2≤2.706.设出男生人数,并且它分别表示各类别人数,代入 χ2 的计算公式,建立不等式求解即可.[解析] 设男生人数为 x ,依题意可得 2×2 列联表如下:(1) 若有 99%,3x 2 ·( 5x x ·- x x · )2 由 χ2= 6 3 6 6 x x x · · ·x3x= 8 >6.635,解得 x >17.693. 2 2x x x因为 ,, 为整数,所以若有 99%的把握认为回答结果的对错和性别有关,则男生至2 63 少有 18 人.(2) 没有充分的证据显示回答结果的对错和性别有关,则 χ2≤3.841.3x 2 ·( 5x x ·- x x · )2 由 χ2= 6 3 6 6 x x x · · ·x3x= 8 ≤2.706, 2 2解得 x ≤7.216.x x x因为 ,, 为整数,所以若没有充分的证据显示回答结果的对错和性别有关,则男生至2 3 6 多有 6 人.[点评] 本题是逆向型思维问题,即将根据已知数据判断相关性问题变式为了一道由已知相关性求表中的字母数据问题,同时也是一个独立性检验和不等式的综合问题,解答时要注意理解“至少”“至多”的含义,充分建立不等式(组)来解决.10.为了比较注射A,B 两种药物后产生的皮肤疱疹的面积,选200 只家兔做实验,将这200 只家兔随机地分成两组,每组100 只,其中一组注射药物A,另一组注射药物B.(1)甲、乙是200 只家兔中的2 只,求甲、乙分在不同组的概率;(2)下表1 和表2 分别是注射药物A 和B 后的试验结果.(疱疹面积单位:mm2)表1:注射药物A 后皮肤疱疹面积的频数分布表疱疹面积[60,65) [65,70) [70,75) [75,80)频数30 40 20 10疱疹面积[60,65) [65,70) [70,75) [75,80) [80,85) 频数10 25 20 30 15②完成下面2×2 列联表,并回答能否有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:疱疹面积小于70 mm2疱疹面积不小于70 mm2合计注射药物A a=b=注射药物B c=d=合计n=附:χ2=-(a+b)(c+d)(a+c)(b+d)P(K2≥k) 0.100 0.050 0.025 0.010 0.001k 2.706 3.841 5.024 6.635 10.828 [解析] 2×2 列联表等统计学知识.解题思路是(1)古典概型的概率公式的应用,需用到组合数公式.(2)绘制频率分布直方图,并从图中观察出中位数进行比较,(3)从频率分布表中读取数值填制2×2 列联表并计算χ2与临界值比较,说明是否有关.2C19998 100解:(1)甲、乙两只家兔分在不同组的概率为p=1200 =.C 199(2)①可以看出注射药物A 后的疱疹面积的中位数在65 至70 之间,而注射药物B 后的疱疹面积的中位数在70 至75 之间,所以注射药物A 后疱疹面积的中位数小于注射药物B 后疱疹面积的中位数.②表3:χ2=≈24.56,100 × 100 × 105 × 95由于χ2>10.828,所以有99.9%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.[点评] 本题比较新颖,将统计学与古典概型、组合联系在一起,难度不大,但考查知识全面,而且还需要一定的识图表能力,是今年命题一热点方向.。
独立性测试题及答案
独立性测试题及答案一、选择题1. 在统计学中,独立性指的是两个事件的发生互不影响。
以下哪项描述正确地反映了独立性的概念?A. 事件A的发生增加了事件B发生的概率B. 事件A的发生减少了事件B发生的概率C. 事件A的发生不影响事件B发生的概率D. 事件A和B不能同时发生答案:C2. 假设有两个事件A和B,已知P(A) = 0.3,P(B) = 0.4,要判断A 和B是否独立,需要计算:A. P(A ∩ B)B. P(A) + P(B)C. P(A|B) - P(A)D. P(A ∪ B)答案:A3. 如果事件A和B是独立的,那么P(A ∩ B)等于:A. P(A) * P(B)B. P(A) + P(B)C. |P(A) - P(B)|D. P(A) / P(B)答案:A二、填空题4. 如果P(A) = 0.2,P(B) = 0.5,并且A与B独立,那么P(A ∩ B)等于_________。
答案:0.15. 在一次随机抽样调查中,如果P(事件A发生) = 0.3,P(事件B发生|事件A发生) = 0.4,那么事件A和B独立的概率是_________。
答案:0.4三、简答题6. 解释为什么事件A和B的独立性意味着P(A ∩ B) = P(A) * P(B)。
答案:如果事件A和B是独立的,那么意味着事件A的发生不会影响事件B发生的概率,反之亦然。
因此,我们可以将两个独立事件同时发生的概率看作是它们各自发生概率的乘积,即P(A ∩ B) = P(A) * P(B)。
7. 如果事件A和B不独立,那么P(A ∩ B)与P(A) * P(B)的关系是什么?答案:如果事件A和B不独立,那么它们同时发生的概率P(A ∩ B)不等于它们各自发生概率的乘积P(A) * P(B)。
在这种情况下,P(A ∩ B)可能会大于或小于P(A) * P(B),具体取决于一个事件的发生是否增加了或减少了另一个事件发生的概率。
四、计算题8. 假设在一个班级中,学生通过数学考试的概率是0.7,通过物理考试的概率是0.6。
独立性检验(解析版)
独立性检验例1.2019年11月5日至10日,第二届中国国际进口博览会在上海举行.某宣传媒体组织业内人士对某型号智能机器人进行评分,所得情况如图所示:(Ⅰ)试估计业内人士评分的平均数以及方差(用每个小矩形底边中点近似替代本组数据);(Ⅱ)为了调查评分与性别是否具有相关性,研究人员随机抽取了60位参加评分的业内人士,其中男性与女性人数各一半,根据已知条件完成下面22⨯列联表,据此资料,是否有90%的把握认为评分的高低与性别有关?参考公式:(1)2()()()()()n ad bc K a c b d a b c d -=++++,其中n a b c d =+++.(2)2221122()()()n n DX x EX p x EX p x EX p =-⨯+-⨯+⋯+-⨯. 参考数据:2)0.152.072【解析】解:(Ⅰ)依题意,所求平均数为300.1500.3700.4900.2315281864⨯+⨯+⨯+⨯=+++=, 方差为2222(3064)0.1(5064)0.3(7064)0.4(9064)0.2115.658.814.4135.2324-⨯+-⨯+-⨯+-⨯=+++=. (Ⅱ)由题意完善22⨯列联表如下:∴2260(14201016)102.706243630309K⨯⨯-⨯==<⨯⨯⨯,∴没有90%的把握认为评分的高低与性别有关.例2.某校举行了一次数学竞赛,为了了解本次竞赛学生的成绩情况,从中抽取了部分学生的分数(得分取正整数,满分为100分)作为样本(样本容量为)n进行统计,按照[50,60),[60,70),[70,80),[80,90),[90,100]的分组作出频率分布直方图,已知得分在[50,60),[90,100]的频数分别为16,4.(Ⅰ)求样本容量n和频率分布直方图中的a,b的值;(Ⅱ)估计本次竞赛学生成绩的平均数(同一组中的数据用该组区间的中点值代表);(Ⅲ)在选取的样本中,若男生和女生人数相同,我们规定成绩在70分以上称为“优秀”,70分以下称为“不优秀”,其中男女生中成绩优秀的分别有24人和30人,请完成列联表,并判断是否有90%的把握认为“学生的成绩优秀与性别有关”?2)附:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)由题意可知,样本容量161000.01610n ==⨯,40.00410010b ==⨯,0.1000.0040.0100.0160.0400.030a =----=.(Ⅱ)设本次竞赛学生成绩的平均数为x ,则(0.016550.030650.040750.010850.00495)1070.6x =⨯+⨯+⨯+⨯+⨯⨯=.(Ⅲ)100位学生中男女生各有50名,成绩优秀共有54名,所以学生的成绩优秀与性别列联表如下表:22100(24203026)1001.4492.7065050465469K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有90%的把握认为“学生的成绩优秀与性别有关”. 例3.某健身馆为了宣传健身效果,吸引顾客,特别请专业的评估机构对他们500名学员的锻炼成果进行评估打分(满分100分),并且认为评分不低于80分的参与者为健身达人,得到如表:(Ⅰ)判断能否在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系?(Ⅱ)若500名学员中40岁以上的有100人,30岁到40岁的有300人,30岁以下的100人,先从中分层抽取5人进行抽奖活动,再从这5人中抽取两位对其进行全年免单活动,求两人全年免单都在30岁到40岁之间的概率是多少?附:2)2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)因为22500(20015050100)83.33310.828250250200300K ⨯⨯-⨯=≈>⨯⨯⨯,所以能在犯错误的概率不超过0.001的前提下认为健身达人与性别有关系.(Ⅱ)根据分层抽样可知在40岁以上的学员中应抽取1人,记为a ;在30岁到40岁的学员中应抽取3人,记为A ,B ,C ;在30岁以下的学员中应抽取1人,记为b ,则从这5人中抽取2人,所有可能情况如下:(,)a A ,(,)a B ,(a ,)(C a ,)b ,(,)A B ,(,)A C ,(,)A b ,(,)B C ,(,)B b ,(,)C b共10种情况,2人都在30岁到40岁之间的有(,)A B ,(,)A C ,(,)B C 共3种情况, 所以两人全年免单都在30岁到40岁之间的概率310P =. 例4.某公司为了推广某项技术,对旗下200名员工的年龄和人数进行了统计,统计其对这项技术的接受程度,从而为后期宣传工作做准备,并绘制了如下频率分布直方图.(Ⅰ)根据如图求样本年龄的中位数和平均数(同一组中的数据用该组区间的中点值为代表)(保留两位小数);(Ⅱ)若将样本分为两个年龄段,年龄在区间[18,38)和[38,68]分别称为“青少年”和“中老年”,根据相关条件完成下表,并判断是否有95%的把握认为对新技术接受程度与年龄段有关?参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2)0.050【解析】解:(Ⅰ)根据频率分布直方图可知样本年龄的平均数230.01010330.02010430.03010530.02510630.0151044.50x=⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=.设样本年龄的中位数为x,由题知组距为10,[18,38)的频率为(0.0100.020)100.300.5+⨯=<,[18,48)的频率为0.300.030100.600.5+⨯=>,所以中位数在区间[38,48)内,所以(38)0.030100.50.3x-⨯⨯=-,即238~38.673x=+,所以样本年龄的平均数为44.50,中位数为38.67.(Ⅱ)由题意知,样本中的“青少年”共有200(0.0100.020)1060⨯+⨯=(人),则“中老年”共有20060140-=(人).根据频率分布直方图完成列联表如下:则:22()200(20704070)4.714 3.841()()()()9011060140n ad bcKa b c d a c b d-⨯⨯-⨯==≈> ++++⨯⨯⨯,所以有95%的把握认为对新技术接受程度与年龄段有关.例5.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(Ⅰ)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率; (Ⅱ)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关? 附:22()()()()()n ad bc k a b c d a c b d -=++++,20)k【解析】解:(Ⅰ)由题意知,40人中该日走路步数超过5000步的有35人,频率为357408=, 所以估计他的所有微信好友中每日走路步数超过5000步的概率为78; (Ⅱ)由表中数据,填写列联表如下;计算观测值2240(141268)403.8412020221811K ⨯⨯-⨯==<⨯⨯⨯,所以没有95%以上的把握认为“评定类型”与“性别”有关.例6.为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果:表1:男生上网时间与频数分布表表2:女生上网时间与频数分布表(Ⅰ)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(Ⅱ)完成表3的22⨯列联表(此表应画在答题卷上),并回答能否有90%的把握认为“学生周日上网时间与性别有关”?(Ⅲ)从表3的男生中“上网时间少于60分钟”和“上网时间不少于60分钟”的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取两人,求至少有一人上网时间超过60分钟的概率. 表3:附:2()()()()k a b c d a c b d =++++,其中n a b c d =+++20)k 0.5000.455【解析】解:(1)设估计上网时间不少于60分钟的人数x , 依据题意有30750100x =,解得:225x =, 所以估计其中上网时间不少于60分钟的人数是225人;⋯(4分) (2)根据题目所给数据得到如下列联表:其中22200(6034070)2002.198 2.7061001001307091K ⨯⨯-⨯==≈<⨯⨯⨯,因此,没有90%的把握认为“学生周日上网时间与性别有关”; ⋯(8分) (3)因为上网时间少于60分钟与上网时间不少于60分钟的人数之比为3:2, 所以5人中上网时间少于60分钟的有3人,记为A 、B 、C , 上网时间不少于60分钟的有2人,记为d 、e , 从中任取两人的所有基本事件为:AB 、AC 、Ad 、Ae 、BC 、Bd 、Be 、Cd 、Ce 、de 共10种,其中“至少有一人上网时间超过60分钟”包含了7种, 故所求的概率为710P =. ⋯(12分) 例7.某种疾病可分为Ⅰ、Ⅱ两种类型,为了解该疾病类型与性别的关系,在某地区随机抽取了患该疾病的病人进行调查,其中男性人数为z ,女性人数为2z ,男性患Ⅰ型病的人数占男性病人的56,女性患Ⅰ型病的人数占女性病人的1.(1)完成22⨯联表若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,求男性患者至少有多少人?(2)某药品研发公司欲安排甲乙两个研发团队来研发此疾病的治疗药物,两个团队各至多安排2个接种周期进行试验.每人每次接种花费(0)m m >元.甲团队研发的药物每次接种后产生抗体的概率为p ,根据以往试验统计,甲团队平均花费为226mp m -+;乙团队研发的药物每次接种后产生抗体的概率为q ,每个周期必须完成3次接种,若一个周期内至少出现2次抗体,则该周期结束后终止试验,否则进入第二个接种周期.假设两个研发团队每次接种后产生抗体与否均相互独立.若2p q =,从两个团队试验的平均花费考虑,该公司应选择哪个团队进行药品研发?附:22()()()()()n ad bc K a b c d a c b d -=++++20)k0k【解析】解:(1)根据题意填写列联表如下;Ⅰ型病男 若在犯错误的概率不超过0.005的前提下认为“所患疾病类型”与“性别”有关,则225423()263637.879333222z z z z z z K z z z z-==>,解得11.8185z >,由*6z N ∈,且*3zN ∈,所以z 的最小值为12,即男性患者至少有12人; (2)设甲研发试验品花费为X ,则2()26E X mp m =-+; 设乙研发试验品花费为Y ,则Y 的可能取值为3m 、6m ,所以223323(3)(1)23P Y m C q q q q q ==-+=-+, 32(6)123P Y m q q ==+-,所以323232()3(23)6(123)696E Y m q q m q q mq mq m =-+++-=-+; 因为2p q=,所以322322322()()696266926(61)E Y E X mq mq m mp m mq mq mp mq mq mq q -=-++-=-+=-=-;①当106q <<时,610q -<,因为0m >,所以2(61)0mq q -<,所以()()E X E Y >,乙团队试验的平均花费较少,所以选择乙团队进行研发;②当116q <<时,610q ->,因为0m >,所以2(61)0mq q ->,所以()()E X E Y <,甲团队试验的平均花费较少,所以选择甲团队进行研发;③当16q=时,2(61)0mq q-=,所以()()E X E Y=,甲团队试验的平均花费和乙团队试验的平均费用相同,从两个团队试验的平均花费考虑,该公司应选择甲团队或乙团队进行研发均可.例8.某房产中介统计了深圳市某高档小区从2018年12月至2019年11月当月在售二手房均价(单位:万元/平方米)的散点图,如图所示,图中月份代码1至12分别对应2018年12月至2019年11月的相应月份.根据散点图选择y a bx=+和y c dlnx=+两个模型进行拟合,根据数据处理得到两个回归方程分别为ˆ 6.90570.0195y x=+和ˆ 6.86390.1012y lnx=+,并得到以下一些统计量的值:(1)请利用相关指数2R判断哪个模型的拟合效果更好;(2)某位购房者拟于2020年5月份购买深圳市福田区(50160)s s平方米的二手房(欲购房为其家庭首套房).若该小区所有住房的房产证均已满3年,请你利用(1)中拟合效果更好的模型解决以下问题:()i估算该购房者应支付的购房金额.(购房金额=房款+税费;房屋均价精确到0.01万元/平方米)()ii若该购房者拟用不超过760万元的资金购买该小区一套二手房,试估算其可购买的最大面积(精确到1平方米)附注:根据有关规定,二手房交易需要缴纳若干项税费,税费是按照房屋的计税价格进行征收.(计税价格=房款)征收方式见如表:90s144s参考数据:20.69ln ≈,3 1.10ln ≈,7 2.83ln≈,19 2.94ln ≈ 1.41 1.73≈ 4.12≈ 4.36,参考公式:相关指数22121ˆ()1()nii i nii i y yR yy ==-=--∑∑.【解析】解:(1)设模型ˆ 6.90570.0195yx =+和ˆ 6.86390.1012y lnx =+的相关指数分别是21R 和22R , 则210.014855710.069193R =-,220.004878110.069193R =-,0.01485570.0048781>,∴2212R R <,∴模型ˆ 6.86390.1012ylnx =+的拟合效果更好. (2)2020年5月份的对应月份代码为18,由(1)知,模型ˆ 6.86390.1012ylnx =+的拟合效果更好, 利用该模型预测可得,这个小区2020年5月份的在售二手房均价为: ˆ 6.86390.1012187.16yln =+≈万元/平方米, ()i 设该购房者应支付的购房金额为h 万元,税费中买方只需缴纳契税,∴①当5090s 时,契税为计税价格的1%,故7.16(1%1)7.2316h s s =⨯⨯+=;②当90144s <时,契税为计税价格的2%, 故7.16(2%1)7.3032h s s =⨯⨯+=;③当144160s <时,契税为计税价格的4%, 故7.16(4%1)7.4464h s s =⨯⨯+=. 故7.2316,50907.3032,901447.4464,144160s s h s s s s ⎧⎪=<⎨⎪<⎩.∴当5090s 时,购房金额为7.2316s 万元;当90144s <时,购房金额为7.3032s 万元;当144160s <时,购房金额为7.4464s 万元.()ii 设该购房者可购买该小区二手房的最大面积为t 平方米,由()i 知,当5090s 时,应支付的购房金额为7.2316s 万元, 又7.23167.231690760s ⨯<,又房屋均价约为7.16万元/平方米,7.16144760⨯>,144t ∴<,得90144t <<.由7.3032760t ,解得760104.17.3032t≈,∴该购房者可购买该小区二手房的最大面积为104平方米.例9.从某小区抽取50户居民进行月用电量调查,发现其用电量都在50到350度之间,频率分布直方图如图1.(1)求频率分布直方图中x 的值并估计这50户用户的平均用电量;(2)若将用电量在区间[50,150)内的用户记为A 类用户,标记为低用电家庭,用电量在区间[250,350)内的用户记为B 类用户,标记为高用电家庭,现对这两类用户进行问卷调查,让其对供电服务进行打分,打分情况见茎叶图如图2:①从B 类用户中任意抽取1户,求其打分超过85分的概率;②若打分超过85分视为满意,没超过85分视为不满意,请填写下面列联表,并根据列联表判断是否有95%的把握认为“满意度与用电量高低有关”?附表及公式:0)k22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.【解析】解:(1)1(0.0060.00360.002420.0012)0.004450x =-++⨯+=, 按用电量从低到高的六组用户数分别为6,9,15,11,6,3, 所以平均用电量为675912515175112256275332518650⨯+⨯+⨯+⨯+⨯+⨯=.(2)①B 类用户共9人,打分超过8(5分)的有6人,所以打分超过8(5分)的概率为6293=. ②2224(6963) 1.6 3.8411212915k ⨯⨯-⨯==<⨯⨯⨯,所以没有95%的把握认为“满意度与用电量高低有关”.例10.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关.现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,在将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯的列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?2)k2()()()()()n ad bc K a b c d a c b d -=++++.【解析】解:(1)由已知得:样本中有25周岁以上组工人60名,25周岁以下组工人40人,所以样本中日平均生产件数不足60件的工人中25周岁以上组有600.053⨯=人,分别记为:1A ,2A ,3A , 25周岁以下组有工人400.052⨯=人,分别记为1B ,2B ,从中随机抽取2人,所有可能的结果共10种,他们分别是1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,2)B ,3(A ,2)B ,1(B ,2)B ,其中“至少有1名”,25周岁以下组的结果有7种, 故所求概率为710P =; (2)由频率分别直方图可知:在抽取的100名工人中, “25周岁以上组”中的生产能手600.2515⨯=人, “25周岁以下组”中的生产能手400.37515⨯=人, 据此可得22⨯列联表:所以2()100(15254515) 1.786 2.706()()()()60403070n ad bc K a b c d a c b d -⨯⨯-⨯==≈<++++⨯⨯⨯. 所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.例11.某市在对学生的综合素质评价中,将其测评结果分为“优秀、合格、不合格”三个等级,其中不小于80分为“优秀”,小于60分为“不合格”,其它为“合格”.(Ⅰ)某校高二年级有男生500人,女生400人,为了解性别对该综合素质评价结果的影响,采用分层抽样的方法从高二学生中抽取了90名学生的综合素质评价结果,其各个等级的频数统计如表:根据表中统计的数据填写下面22⨯列联表,并判断是否有90%的把握认为“综合素质评价测评结果为优秀与性别有关”?(Ⅱ)以(Ⅰ)中抽取的90名学生的综合素质评价等级的频率作为全市各个评价等级发生的概率,且每名学生是否“优秀”相互独立,现从该市高二学生中随机抽取4人. ()i 求所选4人中恰有3人综合素质评价为“优秀”的概率;()ii 记X 表示这4人中综合素质评价等级为“优秀”的人数,求X 的数学期望.附:参考数据与公式 (1)临界值表:(2)参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【解析】解:(Ⅰ)设从高二年级男生中抽出m 人,则90500500400m =+, 解得50m =.503812x ∴=-=,40364y =-=.22∴⨯列联表为:290(30102030) 2.25 2.70650406030K ⨯⨯-⨯∴==<⨯⨯⨯,∴没有90%的把握认为“综合素质评价测评结果为优秀与性别有关”. (Ⅱ)()i 由(Ⅰ)知等级为“优秀”的学生的频率为23, ∴从该市高二学生中随机抽取一名学生,该生为“优秀”的概率为23. 记“所选4名学生中恰有3人综合素质评价为‘优秀’学生”为事件A , 则事件A 发生的概率为:P (A )3342132()3381C =⨯⨯=.()ii X 表示这4个人中综合速度评价等级为“优秀”的个数,由题意,随机变量2~(4,)3X B ,X ∴的数学期望28()433E X =⨯=.例12.电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否认为“体育迷“与性别有关?(注:0.95以上把握说明有关)(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷“人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X附:22112212211212()n n n n n X n n n n ++++-=,2)k【解析】解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515) 3.03075254555K ⨯⨯-⨯=≈⨯⨯⨯.⋯(5分)因为3.030 3.841<,所以我们没有充分理由认为“体育迷”与性别有关. ⋯(6分) (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率14, 即从观众中抽取一名“体育迷”的概率.⋯(7分) 由题意知1~(3,)4X B ,从而X 的分布列为⋯(10分)13()344E X np ==⨯=,139()(1)34416D X np p =-=⨯⨯=.⋯(12分) 例13.随着节能减排意识深入人心以及共享单车在饶城的大范围推广,越来越多的市民在出行时喜欢选择骑行共享单车.为了研究广大市民在共享单车上的使用情况,某公司在我市随机抽取了100名用户进行调查,得到如下数据:(1)如果认为每周使用超过3次的用户为“喜欢骑行共享单车”,请完成22⨯列表(见答题卡),并判断能否在犯错误概率不超过0.05的前提下,认为是否“喜欢骑行共享单车”与性别有关?(2)每周骑行共享单车6次及6次以上的用户称为“骑行达人”,视频率为概率,在我市所有“骑行达人”中,随机抽取4名用户.①求抽取的4名用户中,既有男生“骑行达人”又有女“骑行达人”的概率;②为了鼓励女性用户使用共享单车,对抽出的女“骑行达人”每人奖励500元,记奖励总金额为X ,求X 的分布列及数学期望.附表及公式:22()()()()()n ad bc K a b c d a c b d -=++++【解析】(1)由图中表格可得22⨯列联表如下:将22⨯列联表中的数据代入公式计算得22100(45153010) 3.03 3.84125755545K ⨯-⨯=≈<⨯⨯⨯,所以在犯错误概率不超过0.05的前提下,不能认为是否“喜欢骑行共享单车”与性别有关.(2)视频率为概率,在我市“骑行达人”中,随机抽取1名用户,该用户为男“骑行达人”的概率为35,女“骑行达人”的概率为25.①抽取的4名用户中,既有男“骑行达人”,又有女“骑行达人”的概率为 44325281()()55625P =--=; ②记抽出的女“骑行达人”人数为Y ,则500X Y =.由题意得2~(4,)5Y B ,4423()()()55i i iP Y i C -∴== (0i =,1,2,3,4),Y ∴的分布列为X ∴的分布列为所以28()455E Y =⨯=, 所以X 的数学期望()500()800E X E Y ==元.例14.2021年,辽宁省将实施新高考,2018年暑期入学的高一学生是新高考首批考生,新高考不再分文理科,采用33+模式,其中语文、数学、外语三科为必考科目,满分各150分,另外考生还要依据想考取的高校及专业的要求,结合自己的兴趣爱好等因素,在思想政治、历史、地理、物理、化学、生物6门科目中自选3门参加考试(6选3),每科目满分100分.为了应对新高考,某高中从高一年级1000名学生(其中男生550人,女生450人)中,采用分层抽样的方法从中抽取n 名学生进行调查.(1)已知抽取的n 名学生中含女生45人,求n 的值及抽取到的男生人数;(2)学校计划在高一上学期开设选修中的“物理”和“地理”两个科目,为了了解学生对这两个科目的选课情况,对在(1)的条件下抽取到n 名学生进行问卷调查(假定每名学生在这两个科目中必须选择一个科目且只能选择一个科目),下表是根据调查结果得到的22⨯列联表:请将上面的列联表补充完整,并判断是否有99%的把握认为选择科目与性别有关?说明你的理由; (3)在抽取到的45名女生中按分层抽样再抽出9名女生,了解女生对“历史”的选课意向情况,在这9名女生中再抽取4人,设这4人中含选择“地理”的人数为X ,求X 的分布列及期望.)k参考公式:22112212211212()n n n n n K n n n n ++++-=【解析】解:(1)由题意得:451000450n =,解得100n =, 男生人数为:100550551000⨯=人.⋯⋯⋯⋯(2分) (2)22⨯列联表为:222111212211212()100(45202510)8.1289 6.63555457030n n n n n n n n n ++++-⨯⨯-⨯X ==≈>⨯⨯⨯所以有99%的把握认为选择科目与性别有关.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯(7分)(3)从45名女生中分层抽样抽9名女生,所以这9名女生中有5人选择物理,4人选择地理, 9名女生中再选择4名女生,则这4名女生中选择地理的人数X 可为0,1,2,3,4. 设事件X 发生概率为()P X ,则45495(0)126C P X C ===,31544940(1)126C C P X C ===,22544960(2)126C C P X C ===,13544920(3)126C C P X C ===,44491(4)126C P X C ===,X 的分布列为:期望406020116()2341261261261269E X =+⨯+⨯+⨯=.⋯⋯⋯⋯(12分) 例15.微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余每天使用微信在一小时以上.若将员工年龄分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,经常使用微信的员工中23是青年人. (Ⅰ)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出22⨯列联表;(Ⅱ)由列联表中所得数据,是否有99.9%的把握认为“经常使用微信与年龄有关”?)k附:22()()()()()n ad bcKa b c d a c b d-=++++.【解析】解:(Ⅰ)由已知可得,该公司员工中使用微信的共:2000.9180⨯=人经常使用微信的有18060120--人,其中青年人:2 120803⨯=人所以可列下面22⨯列联表:(Ⅱ)将列联表中数据代入公式可得:22180(8055540)13.33310.8281206013545K⨯⨯-⨯=≈>⨯⨯⨯所以有99.9%的把握认为“经常使用微信与年龄有关”.例16.某校高三4班有50名学生进行了一场投篮测试,其中男生30人,女生20人.为了了解其投篮成绩,甲、乙两人分别都对全班的学生进行编号(150-号),并以不同的方法进行数据抽样,其中一人用的是系统抽样,另一人用的是分层抽样.若此次投篮测试的成绩大于或等于80分视为优秀,小于80分视为不优秀,如表是甲、乙两人分别抽取的样本数据:甲抽取的样本数据乙抽取的样本数据(Ⅰ)在乙抽取的样本中任取3人,记投篮优秀的学生人数为X,求X的分布列和数学期望.(Ⅱ)请你根据乙抽取的样本数据完成下列22⨯列联表,判断是否有95%以上的把握认为投篮成绩和性别有关?(Ⅲ)判断甲、乙各用何种抽样方法,并根据(Ⅱ)的结论判断哪种抽样方法更优?说明理由. 下面的临界值表供参考:2)k(参考公式:2()()()()K a b c d a c b d =++++,其中)n a b c d =+++【解析】解:(Ⅰ)在乙抽取的10个样本中,投篮优秀的学生人数为4,X ∴的取值为0,1,2,3463103.(),0,1,2,3k kC C P X k k C -=== 分布列为:1131601236210305EX =+++=(6分) (Ⅱ)设投篮成绩与性别无关,由乙抽取的样本数据,得22⨯列联表如下:(7分)2210(4402) 4.444 3.8414664K ⨯⨯-⨯=≈>⨯⨯⨯,(9分) 所以有95%以上的把握认为投篮成绩与性别有关.(10分) (Ⅲ)甲用的是系统抽样,乙用的是分层抽样. ⋯(11分)由(Ⅱ)的结论知,投篮成绩与性别有关,并且从样本数据能看出投篮成绩与性别有明显差异,因此采用分层抽样方法比系统抽样方法更优.⋯(12分)例17.已知某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率.(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成22⨯列联表,并判断是否能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”?(相关系数22()()()()()n ad bc K a b c d a c b d -=++++,2 2.706K >时有99%的把握具有相关性)【解析】解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名, 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有600.053⨯=(人), 记为1A ,2A ,3.25A 周岁以下组工人有400.052⨯=(人),记为1B ,2B . 从中随机抽取2名工人,所有可能的结果共有10种,即: 1(A ,2)A ,1(A ,3)A ,2(A ,3)A ,1(A ,1)B ,1(A ,2)B , 2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .其中,至少抽到一名“25周岁以下组”工人的可能结果共有7种,是:1(A ,1)B ,1(A ,2)B ,2(A ,1)B ,2(A ,2)B ,3(A ,1)B ,3(A ,2)B ,1(B ,2)B .故所求概率710P =. (2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手有600.2515⨯=(人),“25周岁以下组”中的生产能手有400.37515⨯=(人),据此可得22⨯列联表如下:所以得:22100(15251545)251.796040307014K⨯⨯-⨯==≈⨯⨯⨯.因为1.79 2.706<,所以不能在犯错误的概率不超过0.1的前提下认为“生产能手与工人所在的年龄组有关”.例18.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,如图是乙流水线样本的频率分布直方图.表1:甲流水线样本频数分布表(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++其中n a b c d=+++;临界值表供参考:)k0.15k 2.072【解析】解:(1)根据所给的每一组的频数和样本容量做出每一组的频率,在平面直角坐标系中做出频率分步直方图,甲流水线样本的频率分布直方图如下:(2)由图知,甲样本中合格品数为30,合格品的频率为300.7540=,乙样本中合格品数为(0.060.090.03)54036++⨯⨯=,合格品的频率为360.940=,据此可估计从甲、乙流水线上任取一件产品该产品为合格品的概率分别为0.75、0.9;(3)22⨯列联表如下。
02-独立性检验第二课时答案
3.1.2 独立性检验(第2 课时)课后练习题一、选择题1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A.若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100 个吸烟的人中必有99 人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确答案 C2.在使用独立性检验时,下列说法正确的是( )A.对事件A 与B 的检验无关时,两个事件互不影响B.事件A 与B 关系越密切,则χ2就越大C.χ2的大小是判定事件A 与B 是否相关的唯一根据D.若判定两事件A 与B 有关,则A 发生B 一定发生答案 B解析对于A,事件A 与B 的检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故A 错.B 是正确的.对于C,判断A 与B 是否相关的方式很多,可以用列联表,也可以借助于概率运算,故C 错.对于D,两事件A 与B 有关,说明两者同时发生的可能性相对来说较大,但并不是A 发生B 一定发生,故D 错.3.某学校为判断高三学生选修文科是否与性别有关,现随机抽取 50 名学生,得到如下2 ⨯ 2 列联表:2根据表中数据得到K 2 =≈ 4.844 ,已知P (K ≥ 3.841)≈ 0.05 ,23⨯ 27 ⨯ 20⨯ 30P (K 2 ≥ 5.024)≈ 0.025.现作出结论“选修文科与性别相关”,估计这种判断出错的可能= ≈ 2 性约为()A . 97.5%B . 95%C . 2.5%D . 5%【答案】D【解析】由题意得 K 2 ≈ 4.844 > 3.841,而 P (K 2≥ 3.841)≈0.05 ,这种判断出错的可能性约为5%,故选 D.4.为了解某班学生喜爱打篮球是否与性别有关,对本班50 人进行了问卷调查得到了下表:n (ad - bc )2K 6.349 ,临界值表:(a + b )(c + d )(a + c )(b + d )根据表中的数据你认为喜爱打篮球与性别之间有关系的把握是( )A . 97.5%B . 99%C . 99.5%D . 99.9%【答案】A【解析】由已知可得2n (ad - bc )250 ⨯ (25⨯10 -10 ⨯ 5)2K ==≈ 6.3492 ,(a + b )(c + d )(a + c )(b + d )35⨯15⨯ 30 ⨯ 20由临界值表可知 P (K 2≥ 5.024) = 0.025 ,所以根据表中的数据可以认为喜爱打篮球与性别之间有关系的把握是97.5%,故选 A.5.为了普及环保知识,增强环保意识,某大学从理工类专业的 A 班和文史类专业的 B 班各 抽取 20 名同学参加环保知识测试.统计得到成绩与专业的列联表:则下列说法正确的是( )A.有 99%的把握认为环保知识测试成绩与专业有关B.有 99%的把握认为环保知识测试成绩与专业无关C.有 95%的把握认为环保知识测试成绩与专业有关D.有 95%的把握认为环保知识测试成绩与专业无关【答案】C【解析】因为K 2 = 40⨯(14⨯13 -7 ⨯6)220⨯ 20⨯ 21⨯19≈ 4.912 ,所以 3.841<K2<6.635,所以有 95%的把握认为环保知识测试成绩与专业有关.二、填空题6、为研究某新药的疗效,给50 名患者服用此药,跟踪调查后得下表中的数据:计算χ2≈,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为.答案4.882 5%解析由公式计算得χ2≈4.882,∵χ2>3.841,∴我们有95%的把握认为服用此药的效果与患者的性别有关,从而有5%的可能性出错.7.某高校“统计初步”课程的教师随机调查了一些学生,具体数据如下表所示,为了判断选250×(13×20-10×7)2修统计专业是否与性别有关系,根据表中数据,得到χ =23×27×20×30 ≈4.844,因为4.844>3.841.所以选修统计专业与性别有关系,那么这种判断正确的可能性为.K 2 =≈ 8.333答案 95%8.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的 50 份调查问卷,得到了如下的列联表:则结合附表,认为“是否同意限定区域停车与家长的性别有关”的把握约为.n (ad - bc )2(a + b )(c + d )(a + c )(b + d )【答案】99.5%【解析】因为 K 2=50⨯ (20⨯15-5⨯10)225⨯ 25⨯ 30⨯ 20≈8.333,且 P (K 2≥7.789)=0.005=0.5%.所以,我们有 99.5%的把握认为是否同意限定区域停车与家长的性别有关.故答案为 99.5%.【名师点睛】本题考查独立性检验知识,考查学生的计算能力,考查学生分析解决问题的能力,属于中档题.利用公式求得 K 2,与临界值比较,即可得到结论. 三、解答题9、某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分成绩优秀的人数如下表所示,能否在犯错误的概率不超过 0.01 的前提下认为数学成绩优秀与物理、化学、总分成绩优秀有关系?人. 解列出数学成绩与物理成绩的 2×2 列联表如下:数学优秀228 132 360数学非优秀143 737 880合计371 869 1 240 21 240×(228×737-132×143)2χ1 =360×880×371×869≈270.1>6.635.列出数学成绩与化学成绩的2×2 列联表如下:化学优秀化学非优秀合计数学优秀225 135 360数学非优秀156 724 880合计381 859 1 240 21 240×(225×724-156×135)2χ2 =360×880×381×859≈240.6>6.635.列出数学成绩与总分成绩的2×2 列联表如下:总分优秀总分非优秀合计数学优秀267 93 360数学非优秀99 781 880合计366 874 1 240 21 240×(267×781-93×99)2χ3 =360×880×366×874≈486.1>6.635.由上面的分析知,x2值都大于6.635,说明有99%的把握即在犯错误的概率不超过0.01 的前提下认为数学成绩优秀与物理、化学、总分成绩优秀都有关系10、(2018 年高考新课标Ⅲ卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取 40 名工人,将他们随机分成两组,每组 20 人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求 40 名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过 m 和不超过 m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有 99%的把握认为两种生产方式的效率有差异?n (ad - bc )2附: K 2=(a + b )(c + d )(a + c )(b + d ),【答案】(1)第二种生产方式的效率更高,理由如下;○1 由茎叶图可知,用第一种生产方式的工人中,有 75%的工人完成生产任务所需时间至少 80 分钟,用第二种生产方式的工人中, 75%的工人完成生产任务所需时间至多 79 分钟,因此,第二种生产方式效率更高○ 2 用第一种生产方式的工人完成生产任务所需时间的中位数为 85.5 分钟,用第二种生产方式的工人完成生产任务所需时间低于 80 分钟,因此第二种生产方式效率更高○ 3 用第一种生产方式的工人完成生产任务平均所需时间的高于 80 分钟,用第二种生产方式的工人完成生产任务所需时间低于 80 分钟,因此第二种生产方式效率更高○ 4 由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎 8 上的最多, 关于茎 8 大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎 7 上的最多,关于茎 7 大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了 4 种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知m = 79 + 81 = 80 .2列联表如下:(3)由于χ40(15⨯15 -5⨯5)2=20⨯ 20⨯ 20⨯ 20= 10 > 6.635所以有 99%的把握认为两种生产方式的效率有差异2。
独立性检验答案
一、选择题 1. C2.A 在三维柱形图中,主对角线上两个柱形高度的乘积(ab )与副对角线上的两个柱形的高度的乘积(bc )相差越大,“X 与Y 有关系”成立的可能性就越大,即两个变量有关系的可能性就越大,3.C 首先观察该资料取自什么样的试验设计,由于参加讨论的公民按性别被随机的分成了两组,而且每一组又被分成了两种情况:认为是朝鲜所为与遭受陷害,故该资料取自完全随机统计,符合2×2列联表的要求,故用独立性检验最有说服力。
故选C 。
4.D 从表中可知,当024.5=k 时,对应的P(k K ≥2)为0.025,所以选D.5.D 对于同一样本,||bc ad -越小,说明X与Y之间的关系越弱;||bc ad -越大,说明X与Y之间的关系越强;6.B 2407(352039871)0.008133274106301k ⨯⨯-⨯=≈⨯⨯⨯, 因为0.008 2.706k =<,所以,玉米种子经过药物处理跟生病之间无关,故选B 7.C 对于A ,若2K 的值为6.635,我们有99%的把握认为吃含三聚氰胺的三鹿奶粉的婴幼儿与患肾结石有关系,但在100个吃含三聚氰胺的三鹿婴幼儿奶粉婴幼儿中未必有99人患有肺病; 对于B 同样不成立,C 是正确的,故选C.8. B 27.13910,828k =>,所以的99.9%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立.9. B 计算2290(20272518)7290000.18218623 2.706454538524001400K ⨯-⨯===<⨯⨯⨯可知,没有充分理由说明“成绩与班级有关系”,即成绩的“优秀与不优秀”与班级是相互独立的,所以估计“成绩与班级有关系”犯错误的概率约是0.5.10.B 222()913(4782412399) 6.233()()()()49042387736n ad bc K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯。
独立性检验练习含答案
独立性检验练习含答案一、基础过关1. 5 2×2.706 时,就有 的把握认为“x与y 百大系”。
2.在某医院,由于意心解病而住院的 665名男性病人中,有 214人类殖,而另外772名不是由于忠心鼓励自住院的男性病人中有175人先项,统 计~ (结果保留 3位小数)①ad b c 接小,说明X 与Y 的关系线段. ②ad -bc 越大,说明X 与Y 的关系越来。
②[ad -bo]'越大,说明X 与Y 的关系基础. ①(ad -bc)²能按照下0.说明x 与Y 的关系解析.4. 请对随机询问110名性别有限的血拉工品五级每上项目sh ,是到up 下的网联表:lna −n (ad−log 3)(a+b/c+d/a+c ]b+d其中 xx =110×(40×30−20×20)60×50×60×50=7.8参照班表,得到的正确结论是 .②在配错误的概率不超过 0.1%的前提下,认为“爱好该难运动与性别无关”。
③有 99%以上的把握认为“爱好该项运动与性别有关”。
①有 99%以上的把握认为“爱好该项运动与性别无关”。
3.分类型是 X 和Y填序号)进入.5.为了争辩男子的年龄与吸烟的关系,并查了100个男子,按年龄超过和不超过40岁.0烟就有 的把握确定吸烟量与年龄有关。
二、才能提升为了判定上修统计专业是否与性别有关,依据表示的数据,智可能性为 .7.0.2×2列联表中,如哪个数据变为较大的20.认中方们交入课 文的 。
B.以下说法正确选项 .(填序号)00对大事A 与B 的检验无关,即两个大事无不影响. ②大事A 与B 关系越宗热, x 就越大.③义的大小处判定大事 A 与B 是否相关的参一数据. ④如判定两大事 A 与8有关,就 A 发生8确定发生。
9.为争辩某新药的疗效,输无论 “” 。
”4124 46 36 50 ␡ “ “ -- 21 79 400设 H 。
高中数学独立性检验精选题目(附解析)
高中数学独立性检验精选题目(附解析)(1)分类变量和列联表①分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.②列联表(ⅰ)定义:列出的两个分类变量的频数表,称为列联表.(ⅱ)2×2列联表.一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为(2)等高条形图①等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.②观察等高条形图发现aa+b和cc+d相差很大,就判断两个分类变量之间有关系.(3)独立性检验一、用2×2列联表分析两分类变量间的关系1.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人.六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主.请根据以上数据作出饮食习惯与年龄的列联表,并利用aa+b与cc+d判断二者是否有关系.解:2×2列联表如下:a a+b =4364=0.671 875.cc+d=2760=0.45.显然二者数据具有较为明显的差距,据此可以在某种程度上认为饮食习惯与年龄有关系.注:(1)作2×2列联表时,关键是对涉及的变量分清类别.计算时要准确无误.(2)利用2×2列联表分析两个分类变量间的关系时,首先要根据题中数据获得2×2列联表,然后根据频率特征,即将aa+b与cc+d⎝⎛⎭⎪⎫ba+b与dc+d的值相比,直观地反映出两个分类变量间是否相互影响,但方法较粗劣.2.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:则当m取下面何值时,X)A.8B.9C.14D.19解析:选C由10×26≈18m,解得m≈14.4,所以当m=14时,X与Y的关系最弱.3.分类变量X和Y的列联表如下:则下列说法正确的是()A.ad-bc越小,说明X与Y关系越弱B.ad-bc越大,说明X与Y关系越强C.(ad-bc)2越大,说明X与Y关系越强D.(ad-bc)2越接近于0,说明X与Y关系越强解析:选C|ad-bc|越小,说明X与Y关系越弱,|ad-bc|越大,说明X与Y关系越强.4.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:为()A.a=50,b=40,c=30,d=20B.a=50,b=30,c=40,d=20C.a=20,b=30,c=40,d=50 D.a=20,b=30,c=50,d=40解析:选D当(ad-bc)2的值越大,随机变量K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.5.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.答案:是二、用等高条形图分析两分类变量间的关系1.某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类型是否有关系.解:作列联表如下:续表考前心情不紧94381475张总计426594 1 020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的人数的比例,从图中可以看出考前心情紧张的样本中性格内向的人数占的比例比考前心情不紧张样本中性格内向的人数占的比例高,可以认为考前紧张与性格类型有关.注:利用等高条形图判断两个分类变量是否相关的步骤:2.在调查的480名男人中有38人患色盲,520名女人中有6名患色盲,试利用图形来判断色盲与性别是否有关?解:根据题目给出的数据作出如下的列联表:色盲不色盲总计男38442480女6514520总计449561000根据列联表作出相应的等高条形图:从等高条形图来看,在男人中患色盲的比例要比在女人中患色盲的比例大得多,因此,我们认为患色盲与性别是有关系的.3.观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:选D在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.4.在独立性检验中,可以粗略地判断两个分类变量是否有关系的是() A.散点图B.等高条形图C.假设检验的思想D.以上都不对解析:选B用等高条形图可以粗略地判断两个分类变量是否有关系,体现了数形结合思想,但是无法给出结论的可信程度,故选B.5.为了研究子女吸烟与父母吸烟的关系,调查了一千多名青少年及其家长,数据如下:父母吸烟父母不吸烟总计子女吸烟23783320子女不吸烟678522 1 200总计915605 1 520利用等高条形图判断父母吸烟对子女吸烟是否有影响?解:等高条形图如图所示:由图形观察可以看出父母吸烟者中子女吸烟的比例要比父母不吸烟者中子女吸烟的比例高,因此可以在某种程度上认为“子女吸烟与父母吸烟有关系”.三、独立性检验1.研究人员选取170名青年男女大学生为样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;110名男生在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?用独立性检验的方法判断.(链接教材P95-例1)附:解:根据2×2k=170×(22×38-22×88)2110×60×44×126≈5.622>5.024.所以在犯错误的概率不超过0.025的前提下,认为“性别与态度有关系”.注:根据题意列出2×2列联表,计算K2的观测值,如果K2的观测值很大,说明两个分类变量有关系的可能性很大;如果K2的观测值比较小,则认为没有充分的证据显示两个分类变量有关系.2.“开门大吉”是某电视台推出的游戏节目.选手面对1~8号8扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查中,发现参赛选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表;判断能否在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系;说明你的理由;(下面的临界值表供参考)P(K2≥k0)0.100.050.0100.005k0 2.706 3.841 6.6357.879(2)6名选手,并抽取3名幸运选手,求3名幸运选手中至少有一人在20~30岁之间的概率.解:(1)根据所给的二维条形图得到列联表:正确错误总计20~30岁10304030~40岁107080总计20100120k=120×(10×70-10×30)220×100×40×80=3.∵3>2.706,∴在犯错误的概率不超过0.10的前提下认为猜对歌曲名称与年龄有关系.(2)按照分层抽样方法可知,20~30(岁)抽取:6×40120=2(人);30~40(岁)抽取:6×80120=4(人).在上述抽取的6名选手中,年龄在20~30(岁)有2人,年龄在30~40(岁)有4人.记至少有一人年龄在20~30岁为事件A,则P(A)=1-C34C36=1-420=45.故至少有一人年龄在20~30岁之间的概率为4 5.3.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差B.回归分析C.独立性检验D.概率解析:选C判断两个分类变量是否有关的最有效方法是进行独立性检验.4.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是() A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大解析:选B k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,即k越小,“X与Y有关系”的可信程度越小.5.某班主任对全班50名学生进行了作业量的调查,数据如下表,则学生的性别与认为作业量的大小有关的把握大约为()A.99%C.90% D.无充分证据解析:选B由2×2列联表得K2的观测值k=50×(18×15-8×9)2 27×23×26×24≈5.059>5.024,故有97.5%的把握认为学生性别与认为作业量大小有关,故选B.6.为了解决高二年级统计案例入门难的问题,某校在高一年级的数学教学中设有试验班,着重加强统计思想的渗透,下面是高二年级统计案例的测验成绩统计表(单位:分)的一部分,试分析试验效果.附:解:k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100(32×38-18×12)250×50×44×56≈16.234.因为16.234>6.635,所以,在犯错误的概率不超过0.01的前提下认为高二年级统计案例的测试成绩与高一年级数学教学中增加统计思想的渗透有联系.巩固练习:1.下列关于K2的说法不正确的是()A.根据2×2列联表中的数据计算得出K2的观测值k≥6.635,而P(K2≥6.635)≈0,01,则有99%的把握认为两个分类变量有关系B.K2的观测值k越大,两个分类变量的相关性就越大C.K2是用来判断两个分类变量是否有关系的随机变量D.K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量解析:选D D选项的公式中分子应该是n(ad-bc)2.故选D.2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查了52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()表1表2A.成绩B.视力C.智商D.阅读量解析:选D因为K21=52×(6×22-14×10)2 16×36×32×20=52×8216×36×32×20,K22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,K23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,K24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有K24>K22>K23>K21,所以阅读量与性别有关联的可能性最大.2.在某次独立性检验中,得到如下列联表:最后发现,两个分类变量没有任何关系,则a的值可能是() A.200 B.720C.100 D.180解析:选B由于A和B没有任何关系,根据列联表可知2001 000和180180+a基本相等,检验可知,B满足条件,故选B.3.两个分类变量X,Y,它们的取值分别为{x1,x2}和{y1,y2},其列联表为:若两个分类变量X,Y没有关系,则下列结论正确的是________(填序号).①ad≈bc;②aa+b≈cc+d;③c+da+b+c+d≈b+da+b+c+d;④c+aa+b+c+d≈b+da+b+c+d;⑤(a+b+c+d)(ad-bc)2(a+b)(b+d)(a+c)(c+d)≈0.解析:因为分类变量X,Y独立,所以aa+b ≈cc+d,化简得ad≈bc,所以①②⑤正确,③④显然不正确.答案:①②⑤4.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:已知在全部30人中随机抽取1人,抽到肝病患者的概率为4 15.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?解:(1)设患肝病中常饮酒的人有x人,x+230=415,x=6.常饮酒不常饮酒总计患肝病628 不患肝病41822 总计102030由已知数据可求得K2=30×(6×18-2×4)210×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=8 15.5.某食品厂为了检查甲乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.表1是甲流水线样本频数分布表,图1是乙流水线样本频率分布直方图.表1甲流水线样本频数分布表产品质量/克频数(490,495] 6(495,500]8(500,505]14(505,510]8(510,515] 4(1)根据上表数据作出甲流水线样本频率分布直方图;(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率分别是多少;(3)由以上统计数据作出2×2列联表,并回答在犯错误的概率不超过多少的前提下认为“产品的包装质量与两条要自动包装流水线的选择有关”.解:(1)甲流水线样本频率分布直方图如下:(2)由表1知甲样本合格品数为8+14+8=30,由图1知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9,据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75. 从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9. (3)2×2列联表如下:甲流水线 乙流水线 总计 合格品 a =30 b =36 66 不合格品 c =10 d =4 14 总计4040n =80因为K 2k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80×(120-360)266×14×40×40≈3.117>2.706, 所以在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.。
《4.3 独立性检验》(同步训练)高中数学选择性必修 第二册_湘教版_2024-2025学年
《4.3 独立性检验》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、在下列关于独立性检验的描述中,正确的是()A. 卡方检验适用于两个分类变量之间的独立性检验B. 独立性检验是用于检验两个事件是否相互独立的统计方法C. 在进行独立性检验时,需要满足总体是正态分布的假设D. 独立性检验的结果总是显著的2、为了研究中学生的性别与对待某一新教学方法的态度之间是否有关系,调查了某学校的300名学生,其中200名男生和100名女生。
在这300名学生中,有120名学生支持新教学方法,其中男生支持的人数为80人。
假设有90%的把握,下列正确的是()。
A、性别与态度的相关系数为0.2,可以认为两者的相关性为强相关。
B、通过捉样表明,性别与态度独立,两者之间没有关系。
C、性别与态度有关,男生比女生更倾向于支持新教学方法。
D、基于上述数据,两者之间可能存在一定的关联性,但无法得出明确的结论。
3、甲乙两城市天气变化的相关系数为0.8,则以下说法正确的是()A、甲乙两城市天气变化无关B、甲乙两城市天气总是同时降温或同时升温C、甲乙两城市天气变化的相关程度极高D、甲乙两城市天气变化呈完全正相关4、(单选题)某班同学对数学、英语、物理三门课程的兴趣程度进行了调查,其中对数学感兴趣的同学人数为20人,对英语感兴趣的同学人数为25人,对物理感兴趣的同学人数为15人,同时对数学和英语感兴趣的同学人数为10人,同时对数学和物理感兴趣的同学人数为8人,同时对英语和物理感兴趣的同学人数为5人,那么对三门课程都感兴趣的同学人数为()。
A. 3人B. 4人C. 5人D. 6人5、在进行独立性检验时,如果将多个属性合并为一个属性,以下描述正确的是()。
A、会增大实验的数量,降低检验的准确性B、会减小实验的数量,降低检验的准确性C、不会影响实验的数量和检验的准确性D、会减小实验的数量,提高检验的准确性6、在一次社会调查活动中,随机调查了男女各100人,让他们依次回答是否支持某项社会改革措施,结果显示:支持的男生有40人,支持的女生有30人。
课时作业4:4.3.2 独立性检验
4.3.2独立性检验基础练一、选择题1.在下列关于吸烟与患肺癌的2×2列联表中,d的值为()A.48B.49C.50D.512.在一次独立性检验中,得出列联表如表:且最后发现,两个事件A和B没有任何关系,则a的可能值是()A.200B.720C.100D.180二、填空题3.对电视节目单上的某一节目,观众的态度如表:根据以上数据,得χ2≈1.224,则得出的结论是________.4.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过________的前提下认为“是否色弱与性别有关”?三、解答题5.“学习强国”学习平台是由中宣部主管,以习近平新时代中国特色社会主义思想和党的十九大精神为主要内容,立足全体党员、面向全社会的优质平台.某单位共有党员200人(男女各100人),从2019年1月1日起在“学习强国”学习平台学习.现统计他们的学习积分,得到如下男党员的频率分布表和女党员的频率分布直方图.男党员(1)已知女党员中积分不低于6千分的有72人,求图中a与b的值;(2)估算女党员学习积分的平均数(同一组中的数据用该组区间的中点值为代表)和女党员学习积分的中位数(精确到0.1千分);(3)若将学习积分不低于8千分的党员视为学习带头人,完成下面2×2列联表,并判断能否有95%把握认为该单位的学习带头人与性别有关?附:χ2=提升练一、选择题1.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用2×2列联表,由计算得χ2≈7.218,参照下表:得到正确结论是()A.有99%以上的把握认为“学生性别与中学生追星无关”B.有99%以上的把握认为“学生性别与中学生追星有关”C.在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D.在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关”2.(多选题)针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,,女生喜欢抖音的人数其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有占女生人数的35________人()附表:附:χ2=A.25B.45C.60D.753.通过随机询问50名性别不同的大学生是否爱好某项运动,得到如下的列联表,由χ2=得χ2=≈8.333.参照附表,得到的正确结论是()附表:A.有99.5%以上的把握认为“爱好该项运动与性别有关”B.有99.5%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”二、填空题4.某医疗机构为了了解肝病与酗酒是否有关,对成年人进行了一次随机抽样抽查,结果如表:从直观上你能得到的结论是________,得到患肝病与酗酒有关系的判断有______的把握.5.某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如图所示:得出下列结论:①甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前②乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前③甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前④乙同学的总成绩排名比丙同学的总成绩排名更靠前则所有正确结论的序号是________.6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:试根据上述数据计算χ2≈________,能否作出这两种手术对病人又发作心脏病的影响有差别的结论________(填“能”或“不能”).三、解答题7.第十三届全国人大常委会第十一次会议审议的《固体废物污染环境防治法(修订草案)》中,提出推行生活垃圾分类制度,这是生活垃圾分类首次被纳入国家立法中.为了解某城市居民的垃圾分类意识与政府相关法规宣传普及的关系,对某试点社区抽取50户居民进行调查,得到如下的2×2列联表.已知在抽取的50户居民中随机抽取1户,抽到分类意识强的概率为0.58.(1)请将上面的2×2列联表补充完整;(2)判断是否有99.5%的把握认为居民分类意识的强弱与政府宣传普及工作有关?说明你的理由;参考公式:χ2=,其中n=a+b+c+d.下面的临界值表仅供参考8.自2017年起,部分省、市陆续实施了新高考,某省采用了“3+3”的选科模式,即:考试除必考的语、数、外三科外,再从物理、化学、生物、历史、地理、政治六个学科中,任意选取三科参加高考,为了调查新高考中考生的选科情况,某地区调查小组进行了一次调查,研究考生选择化学与选择物理是否有关.已知在调查数据中,选物理的考生与不选物理的考生人数相同,其中选物理且选化学的人数占选物理人数的,在不选物理的考生中,选化学与不选化学的人数比为1∶4.(1)若在此次调查中,选物理未选化学的考生有100人,试完成下面的列联表:(2)根据第(1)问的数据,能否有99%的把握认为选择化学与选择物理有关?(3)若研究得到在犯错误的概率不超过0.01的前提下,认为选化学与选物理有关,则选物理又选化学的人数至少有多少?(单位:千人;精确到0.001)附:χ2=.参考答案基础练一、选择题1.【答案】B【解析】在2×2列联表中,总计患肺癌的人数为9 965-9 874=91,则吸烟且患肺癌的人数是d=91-42=49.2.【答案】B【解析】因为两个随机事件A和B没有任何关系,所以χ2=<2.706,代入验证可知a=720.二、填空题3.【答案】观众是否认同这一节目与性别无关【解析】由题意,根据表中的数据求解χ2≈1.224<2.706,所以观众是否认同这一节目与性别无关.4.【答案】0.05【解析】由题意得2×2列联表为由列联表中的数据可得χ2=≈3.947>3.841,所以在犯错误的概率不超过0.05的前提下可认为“是否色弱与性别有关”.三、解答题5.解:(1)由女党员中积分不低于6千分的有72人,则低于6千分的有100-72=28(人);所以0.075×2+2a==0.28,解得a=0.065;又0.15×2+0.12×2+2b=,解得b=0.09;所以a=0.065,b=0.09.(2)由频率分布直方图可知:平均数为=3×0.15+5×0.13+7×0.3+9×0.24+11×0.18=7.34≈7.3.设中位数为x,在[2,4)与[4,6)上的频率之和为0.075×2+0.065×2=0.15+0.13=0.28,所以0.15(x-6)+0.28=0.5,解得x=6+≈7.5;综上知,平均数约为7.3,中位数约为7.5.(3)由题意填写列联表如下:由表中数据计算χ2====3.125<3.841所以没有95%的把握认为该单位的学习带头人与性别有关.提升练一、选择题1.【答案】B【解析】χ2≈7.218>6.635,可得有99%以上的把握认为“学生性别与中学生追星有关”.2.【答案】BC【解析】设男生的人数为5n(n∈N*),根据题意列出2×2列联表如表所示:则χ2==,由于有95%的把握认为是否喜欢抖音和性别有关,则3.841≤χ2<6.635,即3.841≤<6.635,得8.066 1≤n<13.933 5,因为n∈N*,则n的可能取值有9、10、11、12,因此调查人数中男生人数的可能值为45,50,55或60.3.【答案】A【解析】由χ2≈8.333>7.879,参照附表可得:有99.5%以上的把握认为“爱好该项运动与性别有关”.二、填空题4.【答案】患肝病与酗酒有关系的可能性很大99.5%【解析】由已知数据可求得χ2=≈9.259,由于9.259>7.879,所以得到患肝病与酗酒有关系的判断有99.5%的把握.5.【答案】③④【解析】根据图示可得,甲同学的逻辑思维成绩排名很靠前但总排名靠后,说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前,说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则乙同学的总成绩排名比丙同学的总成绩排名更靠前;甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故③④正确.6.【答案】1.779不能【解析】根据列联表中的数据,χ2=≈1.779.χ2<2.706的概率为90%.不能作出这两种手术对病人又发作心脏病的影响有差别的结论.三、解答题7.解:(1)根据在抽取的50户居民中随机抽取1户,得到分类意识强的概率为0.58,可得分类意识强的有29户,故可得2×2列联表如下:(2)χ2==≈9.934≥7.879,所以有99.5%的把握认为居民分类意识强弱与政府宣传普及工作有关.8. 解:(1)列联表如下:(2)由列联表可知χ2==>6.635,所以有99%的把握认为选择化学与选择物理有关.(3)设选物理又选化学的人数为x千人,则列联表如下:x xx x xx x所以χ2==x,在犯错误的概率不超过0.01的前提下,则χ2≥6.635,即x≥6.635,解得x≥11.943(千人),所以选物理又选化学的人数至少有11.943千人.。
2025届高考数学复习:历年高考真题、模拟题专项(列联表与独立性检验)练习(附答案)
调研,随机抽查了 100 天空气中的 PM2.5 和 SO2 浓度(单位:μg/m3),得下表:
SO2
PM2.5
[0,50]
(50,150]
(150,475]
[0,35]
32
18
4
(35,75]
6
8
12
(75,115]
3
7
10
(1)估计事件“该市一天空气中 PM2.5 浓度不超过 75,且 SO2 浓度不超过 150”的概率;
(2)根据所给数据,完成下面的 2×2 列联表:
SO2
PM2.5
[0,150]
(150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有 99%的把握认为该市一天空气中 PM2.5 浓度与 SO2
d
合计
e
f
50
已知抽取的老年人、年轻人各 25 名.则完成上面的列联表数据正确的有(
)
A.a=18
B.b=19
C.f-e=-2
D.c+d=50
3.(多选题)(2024ꞏ山东济宁模拟)某中学为了解性别因素是否对本校学生体育锻炼的经常
性有影响,从本校所有学生中随机调查了 50 名男生和 50 名女生,得到如下列联表:
2025 届高考数学复习:历年高考真题、模拟题专项(列联表与独立性检验)练习
1.(多选题)(2024ꞏ广西桂林模拟)某学校想了解该校学生对于某项运动的爱好是否与性别
有关,通过随机抽查 110 名学生,得到如下 2×2 列联表:
态度
性别
不喜欢该项运动
《9.2 独立性检验》(同步训练)高中数学选择性必修第二册_苏教版_2024-2025学年
《9.2 独立性检验》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、在下列关于独立性检验的描述中,正确的是()A. 独立性检验用于检验两个分类变量之间是否存在某种关系B. 独立性检验是一种用于估计参数的统计方法C. 独立性检验只能用于二分类变量D. 独立性检验的结果不受样本大小的影响2、在某高中的学生中,对A和B两个课外活动项目的兴趣进行独立性检验。
根据表1的数据,当α=0.05时,可以认为学生对这两个课外活动项目的兴趣具有独立性。
表1是检验的数据摘要:参加B活动不参加B活动总计参加A活动503080不参加A活动204060总计7070140给出选项:A、独立B、相关C、不足以判断D、以上都不对3、以下哪个选项不是独立性检验中的假设检验类型?A、双侧检验B、左尾检验C、右尾检验D、非参数检验4、以下关于独立性检验的描述,不正确的是()A. 独立性检验可以用来判断两个分类变量之间是否独立;B. 卡方检验是独立性检验中常用的一种方法;C. 当样本量较小时,可以使用费舍尔精确检验;D. 独立性检验的结果可以用来指导决策,但不能直接用来预测具体事件发生的概率。
5、在下列关于两个样本数据的相关性的描述中,哪一项是正确的?A、两个样本数据相关系数的绝对值接近0时,表明两个变量之间没有线性关系;B、两个样本数据相关系数的绝对值接近1时,表明两个变量之间有极弱的线性关系;C、两个样本数据相关系数的绝对值接近1时,表明两个变量之间有极强的非线性关系;D、两个样本数据相关系数为负时,表明两个变量之间有极弱的相关性。
6、从甲、乙两城市各随机抽取100名居民,调查他们对某项新政策的支持率。
甲城市居民中支持该政策的有68人,乙城市居民中支持该政策的有58人。
为检验两个城市居民对政策支持率的差异是否显著,应采用以下哪种检验方法?A. 方差分析B. 拉丁方分析C. 卡方检验D. t检验7、在进行独立性检验时,假设检验的原假设(H0)是什么?A. 两个分类变量之间独立B. 两个分类变量之间不独立C. 两个分类变量之间相关D. 两个分类变量之间显著相关8、在下列假设检验中,经计算得知卡方值接近于9.488,显著性水平为0.05,假设检验后的结论是:A. 拒绝零假设,说明两个总体频率分布有显著差异;B. 接受零假设,说明两个总体频率分布无显著差异;C. 结论不能确定,需进一步检查自由度和P值;D. 结论不能确定,需进一步检查样本量和显著水平。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§ 独立性检验
一、基础过关
1.当χ2>时,就有________的把握认为“x 与y 有关系”.
2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数)
3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号)
y 1
y 2 总计 x 1 (
a b a +b x 2 c d c +d
总计
a +c
b +d
&
a +
b +
c +d
①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强.
4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男 女 总计 】
爱好 40 20 60 不爱好 20 30
50 总计
60
%
50 110
由
χ2=n ad -bc 2
a +
b
c +
d a +c b +d
算得,
χ2=110×40×30-20×20260×50×60×50≈. 附表:
P (χ2≥k )
k
)
参照附表,得到的正确结论是________.
①在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”;
③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”.
5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸
.
年龄
合计
不超过40岁
超过40岁
吸烟量不多于20支/天
50 15 65 )
吸烟量多于20支/天
10 25 35 合计
60
40
100
则有________的把握确定吸烟量与年龄有关. 二、能力提升
—
6.某高校“
专业 性别
非统计专业
统计专业 合计 男
13 10 23 |
女 7 20 27
合计
20
30
50
为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×13×20-10×7
2
23×27×20×30
≈.
因为χ2≈>,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________. 7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍.
~
8.下列说法正确的是________.(填序号)
①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大;
③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生.
9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据:
无效 有效 总计 (
男性患者 15 35 50 女性患者
6
44
50
设H0:服用此药的效果与患者的性别无关,则χ2的值约为________,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为________.
10.某县对在职的71名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,
*
根据此资料,你是否认为教龄的长短与支持新的数学教材有关
11
(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;
(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.
.
按此样本数据分析这种疾病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.
三、探究与拓展
12.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[,的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
(1)分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
答案
1.90% 3.③ 4.③ 8.② 5%
10.解 由公式得χ2=
n ad -bc 2
a +
b
c +
d a +c
b +d
=71×12×24-25×10237×34×22×49≈. ∵χ2<.
【
∴我们没有理由说教龄的长短与支持新的数学教材有关. 11.解 (1)假设:传染病与饮用水的卫生程度无关.
由公式得χ2
=830×52×218-466×942146×684×518×312 ≈. 因为>.
因此我们有%的把握认为该地区这种传染病与饮用水的卫生程度有关. (2)依题意得2×2列联表:
得病 不得病 %
总计 干净水 5 50 55 不干净水 9
22 31 总计
?
14
72
86
此时,χ2=
86×5×22-50×9
2
55×31×14×72
≈.
由于>,所以我们有%的把握认为该种传染病与饮用水的卫生程度有关.
两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有%的把握肯定结论的正确性,(2)问中我们只有%的把握肯定结论的正确性.
12.解 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360
500×100%=72%;
乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320
500×100%=64%. (2)
甲厂 乙厂 总计 优质品 360 320 680 非优质品 140 180 320 总计
500
500
1 000
由列联表中的数据,得
χ2=1 000×360×180-320×1402
680×320×500×500
≈>.
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.。