收集一,独立性检验题型归纳
独立性检验(历年高考)练习题
独立性检验(历年高考)练习题1.为了研究某班学生打篮球的喜好与性别是否相关,对60名学生进行了问卷调查,得到了如下的2×2列联表。
现在有以下问题需要解决:I)在喜欢打篮球的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述抽样的6人中,恰好有一名女生的概率是多少?III)是否可以有95%的把握认为喜欢打篮球与性别有关?请说明理由。
临界值表如下:2.2014年山东省第二十三届运动会将在济宁举行,为了调查该市某校高中生是否愿意提供志愿者服务,使用简单随机抽样的方法对50名学生进行了调查,结果如下:I)在愿意提供志愿者服务的学生中,采用分层抽样的方法抽取6人,其中男生应该抽几个?II)在上述6人中,恰好有一名女生的概率是多少?III)可以有99%的把握认为该校高中生是否愿意提供志愿者服务与性别有关吗?临界值表如下:3.为了研究某市学生的百米跑成绩,按照男女比例随机抽取了50名学生进行测试,测试结果显示所有学生的成绩都在13秒到18秒之间。
将测试结果按照以下方式分成了五组:第一组:[13,14)第二组:[14,15)第三组:[15,16)第四组:[16,17)第五组:[17,18]以下是按照上述分组方法得到的频率分布直方图:现在有以下问题需要解决:1)设m和n表示从第一组和第五组的所有学生中任意抽取的两名学生的百米测试成绩,即m,n∈[13,14)∪[17,18),求事件“m-n>2”的概率;2)根据规定,成绩小于16秒为达标。
如果男女生使用相同的达标标准,则男女生达标情况如下表:现在需要完成上表,并根据上表数据,判断是否可以有99%的把握认为“体育达标与性别有关”。
参考公式:nad-bc)K=,其中n=a+b+c+d。
a+b)(c+d)(a+c)(b+d)临界值表如下:。
追踪考题 晒晒考点一独立性检验高考考点题型例析
iiS€题晒晒看蛊一独立牲枪验高看看蛊题型例祈■江苏省盐城市时杨中学刘长柏随着新高考的不断深入,独立性检验及其综合应用也进入了高考命题者的视野。
独立性检验是考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法。
利用独立性检验,能够帮助同学们对日常生活中的实际问题作出合理的推断和预测。
因此,大家在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题中的应用,以提高大家处理实际问题的能力。
独立性检验既会单独考查一个知识点,也会与概率、随机变量的分布列与期望等交汇考查,这也为我们的学习及高考备考鸣响了警钟——不可忽视独立性检验综合应用题。
下面借助于考题举例说明。
亶接考査独立性检验侧/【2021年南京市、盐城市高三年级第一次模拟考试】某词汇研究机构为对某城市人们使用流行语的情况进行调査,随机抽取了200人进行调查统计,得下方的2X2列联表(表1)。
则根据列联表可知(表2P(K2>k)0.150.100.050.0250.0100.0050.001 k 2.072 2.706 3.841 5.024 6.6357.87910.828解析:K?200X(125X15—25X35严160X40X150X504.167>3,841,所以有95%的把握认为“经常用流行用语”与“年轻人”有关系,选A。
点评:本题主要考查了独殳性检验的直接应用,要想解答独立性检验问题应做好两方面:一是准确解读2X2列联表,落实表中相关数据;二是正确利用公式求出K2的观测值,并与临界值比较。
练习1:【2020年四川省绵阳南山中学高三一模】为调查某地区被隔离者是否需要社区非医护人员提供帮助,用简单随机抽样方法从该地区调査了500位被隔离者,结果如下:表3性别是否轟男女需要4030不需要160270表1年轻人非年轻人总计经常用流行用语12525150不常用流行用语351550总计16040200表4PU。
独立性检验——精选推荐
独⽴性检验⼀、新知:1.分类变量:2.列联表(22 列联表)⼆、探究任务:吸烟与患肺癌的关系为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965⼈,得到如下结果:那么,吸烟是否对患肺癌有影响?1.由列联表可粗略的看出:(1)不吸烟者有患肺癌;(2)不吸烟者有患肺癌.因此,直观上的结论:.2、通过数据和图形,得到的直观印象是患肺癌有关.那是否有⼀定的把握认为“吸烟与患肺癌有关”呢?我们可以通过统计分析来回答这个问题。
(独⽴性检验的必要性)3、统计量2K为了使不同样本容量的数据有统⼀的评判标准,使⽤2K 2K=吸烟与患肺癌列联表判断⽅法:1、先假设两变量没有关系2、计算2K注意:①2K⼀般要⼤于6.635②2K越⼤,证明假设不成⽴(即两变量有关系),说明两变量之间关系越强;2K越⼩,证明假设成⽴(即两变量没有关系),说明两变量之间关系越弱。
三、独⽴性检验:利⽤随机变量2K来判断“两个分类变量有关系”的⽅法称为独⽴性检验。
(独⽴性检验是检验两个分类变量是都有关系的⼀种常⽤统计⽅法)四、※典型例题例1 吸烟与患肺癌列联表求2K.※动⼿试试练1. 性别与喜欢数学课程列联表:求2K.课后作业某市为调查全市⾼中⽣学习状况是否对⽣理健康有影响,随机进⾏调查并得到如下的列联表:求2K.第⼆节⼀、复习1. 分类变量:.2. 22 列联表:.3. 统计量2K:.⼆、新课例 1 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965⼈,得到如下结果:那么,吸烟是否对患肺癌有影响?第⼀步:提出假设检验问题:H第⼆步:根据公式求2K观测值k=2、思考:究竟吸烟与患肺癌有关系的概率是多少呢?(有百分之多少把握认为两者有关系呢?)2K 临界值表3、独⽴性检验的步骤:第⼀步:提出假设第⼆步:根据公式求2K 观测值第三步:查表得出结论(⽐较与临界值的⼤⼩关系)4、※典型例题例1为考察⾼中⽣的性别与是否喜欢数学课程之间的关系,在某城市的某校⾼中⽣中随机抽取300名学⽣,得到如下列联表:由表中数据计算得到2K 的观察值 4.513k . 在多⼤程度上可以认为⾼中⽣的性别与是否数学课程之间有关系?为什么?例2 在某医院,因为患⼼脏病⽽住院的665名男性病⼈中,有214⼈秃顶;⽽另外772名不是因为患⼼脏病⽽住院的男性病⼈中有175名秃顶. 分别利⽤图形和独⽴性检验⽅法判断秃顶与患⼼脏病是否有关系?你所得的结论在什么范围内有效?5、※动⼿试试练1. 某市为调查全市⾼中⽣学习状况是否对⽣理健康有影响,随机进⾏调查并得到如下的列联表:请问有多⼤把握认为“⾼中⽣学习状况与⽣理健康有关”?课堂练习:1. 在独⽴性检验中,当统计量2K满⾜时,我们有99%的把握认为这两个分类变量有关系.2. 在22 列联表中,统计量2K= .3. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A. 若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B. 从独⽴性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某⼈吸烟,那么他有99%的可能性患肺病.C. 若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D. 以上三种说法都不对.则表中a,b的之分别是()A. 94,96B. 52,50C. 52,54D. 54,525.某班主任对全班50名学⽣进⾏了作业量多少的调查,数据如下表:则认为喜欢玩游戏与认为作业量多少有关系的把握⼤约为( ) A. 99% B. 95% C. 90% D.⽆充分依据6、为考察某种药物预防疾病的效果,进⾏动物试验,得到如下列联表能以97.5%的把握认为药物有效吗?为什么?7、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100 名吸烟者中,有99个患肺病.B.从独⽴性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某⼈吸烟,那么他有99%的可能性患肺病.C.若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D.以上三种说法都不对.12、在独⽴性检验时计算的2K的观测值k=3.99,那么我们有的把握认为这两个分类变量有关系( )A.90% B.95%C.99% D.以上都不对16、在⼀项打鼾与患⼼脏病的调查中,共调查1768⼈,经计算的2K=27.63,根据这⼀数据分析,我们有理由认为打鼾与患⼼脏病是的.(填“有关”“⽆关”)。
专题08 独立性检验(解析版)
概率与统计专题08 独立性检验常见考点考点一独立性检验典例1.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,分8个指标对这两款车型进行了综合评测打分(满分:5分),如图所示:(1)求综合评测分数的平均值;从上图8个指标中任选1个,求指标分数为4.93的概率;(2)老李对两款车型的车主的性别作了统计,得到数据如下2×2列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关.附:()()()()22()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.)20 k【答案】(1)平均值为4.79,38(2)列联表见解析,有99.9%的把握认为喜欢哪款车型和性别有关.【解析】【分析】(1)根据平均数的计算公式求得综合评测分数的平均值;根据古典概型的概率公式即可求得指标分数为4.93的概率;(2)根据表中数列可算出需要补充的数据;计算出2K的值,和题中已知的表格数据相比较,可得答案.(1)平均值为4.69 4.89 4.80 4.93 4.56 4.93 4.59 4.9338.324.7988 +++++++==,8个指标中分数为4.93的指标有3个,故从8个指标中任选1个,指标分数为4.93的概率为38;(2)由于()221405545152526.2510.82070708060K⨯⨯-⨯==>⨯⨯⨯,所以有99.9%的把握认为喜欢哪款车型和性别有关.变式1-1.数字人民币是由中国人民银行发行的数字形式的法定货币,由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.为了进一步了解普通大众对数字人民币的认知情况,某机构进行了一次问卷调查,统计结果如下:(1)如果将高中及以下学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)根据(1)中所得列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析(2)没有【解析】【分析】(1)根据题中数据,填写列联表即可;(2)由22()()()()()n ad bcKa b c d a c b d-=++++,根据列联表数据计算,与临界值比较即可(1)完成的22⨯列联表如下:(2)根据列联表得:22800(150275125250)8003.463 3.841275525400400231K⨯⨯-⨯==≈<⨯⨯⨯,故没有95%的把握认为“是否了解数字人民币”与“学历高低”有关.变式1-2.某校开展党史知识竞赛.现从参加竞赛活动的学生中随机抽取了n名学生,将他们的比赛成绩(满分为100分)分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]得到如图所示的频率分布直方图.(1)求a的值;(2)估计这n名学生的平均成绩(同一组中的数据用该组区间的中点值为代表);(3)活动规定:竞赛成绩位于60分以下为不及格,不低于80分为“优秀”,若抽取的学生中成绩不及格的有15人.请将下面的2×2列联表补充完整,并判断是否有99.9%的把握认为“比赛成绩是否优秀与性别有关”?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)0.025a = (2)74(3)列联表答案见解析,没有99.9%的把握认为“比赛成绩是否优秀与性别有关” 【解析】 【分析】(1)根据频率直方图的特征可知所有的频率之和为1,列出方程,解方程即可; (2)根据频率直方图,利用每组的组中值乘以对应的频率,加起来即可;(3)根据题意补充列联表,利用卡方的计算公式求出2K ,结合表中的数据即可得出结论. (1) 由题可得(0.0050.0100.0200.0300.010)101a +++++⨯=,解得0.025a =.(2)平均成绩为:450.05550.1650.2750.3850.25950.174⨯+⨯+⨯+⨯+⨯+⨯=, (3)∵不及格的人数为15人, ∴抽取的总人数为151000.15n ==, ∴比赛成绩优秀的有1000.3535⨯=人, 由此可得完整的2×2列联表:22100(10252540)9.89010.82835655050K ⨯-⨯=≈<⨯⨯⨯.∴没有99.9%的把握认为“比赛成绩是否优秀与性别有关”变式1-3.某科研机构为了研究喝酒与糖尿病是否有关,对该市30名成年男性进行了问卷调查,并得到了如下列联表,规定“”平均每天喝100mL 以上的”为常喝.已知在所有的30人中随机抽取1人,患糖尿病的概率为4 .(1)请将上表补充完整,并判断是否有99.5%的把握认为糖尿病与喝酒有关?请说明理由;(2)已知常喝酒且有糖尿病的6人中恰有两名老年人,其余为中年人,现从常喝酒且有糖尿病的这6人中随机抽取2人,求恰好抽到一名老年人和一名中年人的概率.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)列联表答案见解析,有99.5%的把握认为糖尿病与喝酒有关(2)8 15【解析】【分析】(1)根据题中信息完善22⨯列联表,计算出2K的观测值,结合临界值表可得出结论;(2)设两名老年人分别为a、b,其余四名中年人为c、d、e、f,列举出所有的基本事件,并确定所求事件所包含的基本事件,利用古典概型的概率公式可求得所求事件的概率.(1)解:由题意知430815⨯=,所以,糖尿病患者共有8名,其中不常喝酒的有862-=名,则22⨯列联表如下:由表中的数据可得()2230618428.5237.8791020822K ⨯⨯-⨯=≈>⨯⨯⨯, 因此,有99.5%的把握认为糖尿病与喝酒有关. (2)解:设两名老年人分别为a 、b ,其余四名中年人为c 、d 、e 、f ,则所有可能出现的结果有(),a b 、(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f 、(),c d 、(),c e 、(),c f 、(),d e 、(),d f 、(),e f ,共15种,其中事件“有一名老年人和一名中年人”包含的结果有:(),a c 、(),a d 、(),a e 、(),a f 、(),b c 、(),b d 、(),b e 、(),b f ,有8种,因此,恰好抽到一名老年人和一名中年人的概率815P =. 典例2.2021年9月3日,教育部召开第五场金秋新闻发布会,会上发布了第八次全国学生体质与健康调研结果.根绝调研结果数据显示,我国大中小中学的健康情况有了明显改善,学生总体身高水平也有所增加.但同时在超重和肥胖率上,中小学生却有一定程度上升,大学生整体身体素质也有所下滑.某市为调研本市学生体质情况,采用按性别分层抽样的方法进行调查,得到体质测试样本的统计数据(单位:人)如下:附:()()()()()22n ad bc K a b c d a c b d -=++++.(1)根据所给数据,完成下面22⨯列联表,并据此判断:能否有95%的把握认为该市学生体质测试是否达标与性别有关.(注:体质测试成绩为优秀、良好或及格则体质达标,否则不达标)(2)体质测试成绩为优秀或良好则称体质测试成绩为优良,以样本数据中男、女生体质测试成绩优良的频率视为该市男、女生体质测试成绩优良的概率,在该市学生中随机选取2名男生,2名女生,设所选4人中体质测试成绩优良人数为X ,求X 的分布列及数学期望. 【答案】(1)表格见解析,没有; (2)分布列见解析,76. 【解析】 【分析】(1)完成列联表,再利用独立性检验求解;(2)由题得X 的所有可能取值为0,1,2,3,4,再求出对应的概率,即得分布列和期望. (1)解:由题得22⨯列联表如下:()22160108012084012019202409601200k ⨯-⨯=⨯⨯⨯27 3.375 3.8418==< ∴没有95%的把握认为该市学生体质达标与性别有关.(2)解:由题意男生体质测试优良率114P =,女生体质测试优良率213P =.X 的所有可能取值为0,1,2,3,4.()02202213121044334P X C C ⎛⎫⎛⎫⎛⎫⎛⎫=== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭()110202111001222213121312514433443312P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()200202201111200211222222131213121312372443344334433144P X C C C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==++=⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()201111202112222213121312534433443372P X C C C C ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==+= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭()202022221312144433144P X C C ⎛⎫⎛⎫⎛⎫⎛⎫===⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭X ∴的分布列为:()153751701234412144721446E X ∴=⨯+⨯+⨯+⨯+⨯=.变式2-1.第24届冬季奥林匹克运动会将于2022年2月4日至20日在北京举行.践行“绿色奥运、科技奥运、人文奥运”理念,举办一届“有特色、高水平”的奥运会,是中国向世界的庄严承诺.为宣传北京冬奥会,某市开展了冬奥知识竞答活动.从参与的市民中随机抽取100人,统计他们的竞答成绩得到下面的列联表(单位:人).(1)完成列联表,并根据列联表判断是否有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关?(2)将频率视为概率,从该市所有参与冬奥知识竞答的市民中随机抽取10人赠送礼品,记其中成绩合格的人数为随机变量X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(1)列联表答案见解析,有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关(2)期望7,方差2.1 【解析】 【分析】(1)根据已知数据可得列联表,计算2K 后可得结论;(2)由题意得()~10,0.7X B ,由二项分布的期望公式和方差公式计算可得. (1)完成列联表(单位:人):由列联表,2K 的观测值()2100402010301004.762 3.8415050703021k ⨯⨯-⨯==≈>⨯⨯⨯,∴有95%的把握认为该市参与此次冬奥知识竞答的市民的成绩与性别有关. (2)从参与的市民中随机抽取100人,有70人竞答成绩合格,所以成绩合格的频率为0.7,将频率视为概率,从该市所有参与活动的市民中随机抽取一人,恰好抽到成绩合格的市民的概率为0.7, 由题意知()~10,0.7X B ,∴随机变量X的数学期望()100.77E X=⨯=,方差()100.70.3 2.1D X=⨯⨯=.变式2-2.从某地区高中二年级学生中随机抽取质量监测数学得分在120分以下和120分以上(含120分)的学生各250名作为样本(全体高二学生均参加监测),分别测出他们的注意力集中水平得分,统计如下表.(1)若将学生在质量监测中数学得分在120分以上(含120分)定义为数学成绩优秀,将学生注意力集中水平得分在500分以上(含500分)称为注意力集中水平高;试问:能否有99%以上的把握认为数学成绩优秀与注意力集中水平高有关?(2)若将上述样本的频率视为概率,现从该地区所有高二学生中随机抽取100人,设抽取到的数学得分在120分以上(含120分)且注意力集中水平得分在500分以上(含500分)的人数为随机变量X,求X的数学期望.(()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)【答案】(1)有99%以上的把握认为数学成绩优秀与注意力集中水平高有关;(2)()E X=36.【解析】【分析】(1)根据表格中的数据,代入求观测值公式,求出观测值同临界值进行比较即可得出结论;(2)根据二项分布期望计算公式,计算出数学期望.(1)由22⨯列联表中数据计算可得,2K 的观测值为()25001007015018051.948 6.635250250280220k ⨯⨯-⨯=≈>⨯⨯⨯所以能有99%以上的把握认为数学成绩优秀与注意力集中水平高有关. (2)从22⨯列联表可知,数学得分在120分以上(含120分) 且注意力集中水平得分在500分以上(含500分)的频率为=180950025, 由题意知,XB ⎛⎫ ⎪⎝⎭910025,所以()E X =⨯=91003625.变式2-3.在2021年的一次车展上,某国产汽车厂家的一个品牌推出了1.5升混动版和纯电动版两款车型,自这两款车型上市后,便获得了不错的口碑,汽车测评人老李通过自媒体平台,对市场上这个品牌汽车车主的性别情况进行了调查统计. (1)统计数据得到如下22⨯列联表:请将上述22⨯列联表补充完整,并判断是否有99.9%的把握认为喜欢哪款车型和性别有关; (2)若两款汽车的操控性能优秀率均为23,动力性能优秀率均为34,老李又对这两款车型进行操控性能和动力性能测试(假设进行的各项测试之间互相不影响),求两款车型的这两项测试中恰有2项指标优秀的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表见解析,有 (2)37144【解析】 【分析】(1)按照独立性检验公式进行计算即可;(2)分别计算两款操控性能优秀、两款动力性能优秀、一款操控性能优秀一款动力性能优秀的概率,相加求和即可. (1)男:55 80 女:45合计:70 140(列出表格也得分,其他形式答案正确即可得分)由于()221405545152707526.2510.08086082K ⨯⨯⨯-⨯=⨯>⨯=,所以有99.9%的把握认为喜欢哪款车型和性别有关. (2)记Y 表示混动版测试指标优秀的项目数,Z 表示纯电动版测试指标优秀的项目数,则“两款车型这两项测试中恰有2项指标优秀”的概率为()()()()20,21,12,0P Y Z P Y Z P Y Z P Y Z +====+==+== ()()()()()()021120P Y P Z P Y P Z P Y P Z ===+==+==223232323232337111111343434343434144⎡⎤⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫=-⨯-⨯⨯+⨯-+-⨯+⨯⨯-⨯-= ⎪ ⎪ ⎪ ⎪ ⎪ ⎪⎢⎥⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭⎣⎦.巩固练习练习一 独立性检验1.每年的六、七月份,我国长江中下游地区进入梅雨季节,如图是江南某镇2012~2021年梅雨季节的降雨量(单位:mm )的频率分布直方图.(1)请用样本平均数估计该镇明年梅雨季节的降雨量;(2)该镇某杨梅种植户统计了他种植的某品种杨梅在2012~2021年的亩产量(单位:kg ),得到如下22⨯列联表(部分数据缺失),依据0.1α=的独立性检验,能否认为该品种杨梅的亩产量与降雨量有关?(完善列联表,并说明理由) 单位:年【答案】(1)280mm(2)表格见解析,认为该品种杨梅的亩产量与降雨量有关 【解析】 【分析】(1)先求出降雨量在[]400,500内的频率,再根据频率直方图求平均数的计算公式直接计算即可; (2)先求出降雨量在[)200,400内的频数,再补全列联表,根据卡方的计算公式求出2χ,利用独立性检验的思想即可得出结论. (1)样本中降雨量在[]400,500内的频率为()11000.0020.0040.0030.1-⨯++=, 所以样本平均数为1500.22500.43500.34500.1280⨯+⨯+⨯+⨯=,所以该镇明年梅雨季节的降雨量约为280mm . (2)根据频率分布直方图可知,降雨量在[)200,400内的频数为()101000.0030.0047⨯⨯+=. 补全22⨯列联表如下: 单位:年则()220.1101162 2.744 2.7067373x χ⨯⨯-⨯=≈>=⨯⨯⨯.所以根据小概率值0.1α=的独立性检验,认为该品种杨梅的亩产量与降雨量有关.2.某航空公司规定:国内航班(不构成国际运输的国内航段)托运行李每件重量上限为50kg ,每件尺寸限制为40cm×60cm×100cm ,其中头等舱乘客免费行李额为40kg ,经济舱乘客免费行李额为20kg .某调研小组随机抽取了100位国内航班旅客进行调查,得到如下数据:(1)请完成如下的2×2列联表,依据0.05α=的独立性检验,能否认为托运行李重量与乘客乘坐的机舱等级有关? 单位:人(2)调研小组为感谢参与调查的旅客,决定从托运行李重量超出免费行李额且不超出10kg 的旅客中(其中女性旅客4人)随机抽取4人,对其中的女性旅客赠送“100元超额行李补助券”,记赠送的补助券总金额为X 元,求X 的分布列与均值. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)表格见解析,在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)分布列见解析,16007【解析】 【分析】(1)依据独立性检验的概念,先计算,再进行判断即可.(2)依题意,行李重量超出免费行李额且不超出10kg 的旅客共7人,先明确随机变量X 的取值,然后利用超几何分布列出分布列. (1)补全2×2列联表如下: 单位:人假设0H 为:托运行李重量与乘客乘坐的机舱等级无关. 根据列联表中的数据,经计算得到()220.0510******* 5.499 3.84190105545x χ⨯⨯-⨯=≈>=⨯⨯⨯,根据小概率值0.05α=的独立性检验,我们推断0H 不成立,即在犯错误的概率不超过0.05的前提下,认为托运行李重量与乘客乘坐的机舱等级有关. (2)根据题意可得,托运行李重量超出免费行李额且不超过10kg 的旅客有7人,从中随机抽取4人,则其中女性旅客的人数可能为1,2,3,4,所以X 的所有可能取值为100,200,300,400,()134347C C 4100C 35P X ===,()224347C C 18C 20350P X ===,()314347C C 12300C 35P X ===,()404347C C 1400C 35P X ===,则X的分布列为故()41812110020030040035353535E X =⨯+⨯+⨯+⨯=16007. 3. “双十一”已经成为网民们的网购狂欢节,某电子商务平台对某市的网民在今年“双十一”的网购情况进行摸底调查,用随机抽样的方法抽取了100人,其消费金额t (百元)的频率分布直方图如图1所示:(1)利用图1,求网民消费金额t的平均值t和中位数t;(2)把下表中空格里的数填上,能否有90%的把握认为网购消费与性别有关.t tt t<合计附表:P(χ2≥k0)参考公式:χ2=2()()()()()n ad bca b c d a c b d-++++.【答案】(1)11.5t=,010t=(2)列联表见解析,没有【解析】【分析】(1)根据平均数的定义求平均数,由于前2组的频率和恰好为0.5,从而可求出中位数,(2)根据频率分布表结合已知的数据计算完成列联表,然后计算χ2公式计算χ2,再根据临界值表比较可得结论(1)以每组的中间值代表本组的消费金额,则网民消费金额t的平均值为2.50.27.50.312.50.217.50.1522.50.127.50.0511.5t=⨯+⨯+⨯+⨯+⨯+⨯=0.频率直方图中第一组、第二组的频率之和为0.0450.0650.5⨯+⨯=,∴中位数010t=;(2)把下表中空格里的数填上,得列联表如下;0 t t0 t t<合计计算22100(25302520)1001.012.7064555505099χ⨯⨯-⨯==≈<⨯⨯⨯,所以没有90%的把握认为网购消费与性别有关.4.网课是一种新兴的学习方式,它以互联网为平台,为学习者提供包含视频、图片、文字等多种形式的系列学习课程,由于具有方式多样,灵活便捷等优点,成为许多学生在假期实现自主学习的重要手段.为了调查A地区高中生一周网课学习的时间,随机抽取了500名上网课的学生,将他们一周上网课的时间(单位:h)按[1,6),[6,11),[11,16),[16,21),[21,26]分组,得到频率分布直方图如图所示.(1)求a的值,并估计这500名学生一周上网课时间的平均数(同一组中的数据用该组区间的中点值代表);(2)为了了解学生与家长对网课的态度是否具有差异性,研究人员随机抽取了200人调查,所得数据统计如下表所示,判断是否有99.5%的把握认为学生与家长对网课的态度具有差异性.附:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)0.03,13.35; (2)有 【解析】 【分析】(1)根据频率分布直方图各小矩形的面积之和为1求解,再利用平均数的定义求解; (2)根据列联表求得2K 的值,再与临界值表对照下结论. (1)解:因为()0.0220.050.0751a +++⨯=, 所以0.03a =,平均数为7172737470.0250.0550.0750.0350.03513.3522222⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=; (2)因为2250(30505070)87.87980120100100K ⨯⨯-⨯=≈>⨯⨯⨯, 所以有99.5%的把握认为学生与家长对网课的态度具有差异性.5.2022年2月1日是春节,百节年为首,春节是中华民族最隆重的传统佳节,它不仅集中体现了中华民族的思想信仰、理想愿望、生活娱乐和文化心理,而且还是祈福攮灾、饮食和娛乐活动的狂欢式展示.为调查某地从外地工作回来过年的市民(以下称为“返赣人员”)人数情况,现对某一区域的居民进行抽样调查,并按年龄(单位:岁)分成五组,得到如图所示的频率分布直方图,其中年龄在[20,25)内的人数为10.(1)请根据样本数据补充完成22⨯列联表,并判断是否有99.9%的把握认为是否是从外地回来过年与性别相关;(2)据了解,该地区今年返赣人员占14.现从该社区居民中随机抽取3人进行调查,记X为这3人中今年是返赣人员的人数,求X的分布列与数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:【答案】(1)列联表见解析,有99.9%的把握认为是否是从外地回来过年与性别相关(2)分布列见解析,3()4E X=【解析】【分析】(1)由题意可得列联表,根据表格中的数据,代入公式,求出观测值同临界值进行比较即可得出结论;(2)根据独立重复试验概率计算公式,计算出概率可得分布列并求得数学期望.(1)由频率分布直方图可知年龄在[20,25)上的占比为1(0.0220.060.075)50.125-⨯++⨯=,根据已知人数为10计算可得总人数为80,列联表如下:∴22280(25301510)8060011.42910.82835454040354516100⨯⨯-⨯⨯==≈>⨯⨯⨯⨯⨯⨯K , 所以有99.9%的把握认为是否是从外地回来过年与性别相关. (2)X 的取值可为0,1,2,3,3327(0)464P X ⎛⎫=== ⎪⎝⎭,21133127(1)4464⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭P X C , 1223319(2)4464⎛⎫⎛⎫===⎪⎪⎝⎭⎝⎭P X C ,311(3)464P X ⎛⎫=== ⎪⎝⎭. 故分布列为:于是2727483()01239646464646414E X =⨯+⨯+⨯+⨯==. 6.受新冠肺炎疫情的影响,各地推出务工人员就地过年的鼓励政策.某市随机抽选了100名男务工人员和100名女务工人员,调查他们是否有就地过年的意愿,结果如下:(1)能否有99.9%的把握认为务工人员就地过年的意愿与性别有关?(2)若用频率估计概率,从该市所有女务工人员中随机抽取3人进行深入调查,X 表示抽取的女务工人员无就地过年的意愿的人数,求X 的分布列与数学期望.附:22()()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)没有99.9%的把握认为务工人员就地过年的意愿与性别有关 (2)分布列见解析,数学期望为65【解析】 【分析】(1)计算出2χ后比较临界值可得结论;(2)由于2~3,5X B ⎛⎫⎪⎝⎭,由二项分布可得分布列,由二项分布的期望计算出期望.(1)22200(80402060)9.52410.82810010014060χ⨯⨯-⨯=≈<⨯⨯⨯,故没有99.9%的把握认为务工人员就地过年的意愿与性别有关. (2)由题意可知2~3,5X B ⎛⎫⎪⎝⎭.所以X 的取值范围是{0,1,2,3},3032227(0)C 155125P X ⎛⎫⎛⎫==-=⎪⎪⎝⎭⎝⎭, 12132254(1)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 21232236(2)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 3033228(3)C 155125P X ⎛⎫⎛⎫==-= ⎪⎪⎝⎭⎝⎭, 所以X 的分布列为所以26()355E X =⨯=.7.2021年1月以来,教育部相继出台文件,对中小学生手机、睡眠、读物、作业、体质管理作出规定.为了在“控量”的同时力求“增效”,提高作业质量,某学校计划设计差异化作业.因此该校对初三年级的400名学生每天完成作业所需时间进行统计,部分数据如下表: 单位:人(1)求x ,y ,z 的值,并根据题中的列联表,依据小概率值0.05α=的独立性检验,判断是否可以认为完成作业所需时间在90分钟以上与性别有关;(2)学校从完成作业所需时间在90分钟以上的学生中用分层随机抽样的方法抽取9人了解情况,甲老师再从这9人中选取3人进行访谈,求甲老师选取的3人中男生人数大于女生人数的概率. 附:参考公式:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)100x =,80y =,140z =,不能认为完成作业所需时间在90分钟以上与性别有关; (2)1742. 【解析】 【分析】(1)求出x ,y ,z 的值,作出列联表,再利用独立性检验求解;(2)利用古典概型和互斥事件的概率求解. (1)解:由80180x +=可得100x =;由80160y +=可得80y =;由80220z +=可得140z =. 所以2×2列联表如下:()224008014010080 2.694 3.841180220160240χ⨯⨯-⨯=≈<⨯⨯⨯,所以依据小概率值0.05α=的独立性检验,不能认为完成作业所需时间在90分钟以上与性别有关. (2)解:抽取的9人中,男生有8094180⨯=(人),女生有10095180⨯=(人),从这9人中选取3人进行访谈,男生人数大于女生人数的情况分为:①男生2人,女生1人;②男生3人,女生0人.所以所求概率2134543399C C C 17C C 42P =+=.8.2022年是奥运会,我国北京和张家口联合承办第二十四届冬季奥运会,本届冬奥会共设7个大项(滑雪、滑冰、冰球、冰壶、雪车、雪橇、冬季两项)、15个分项(高山滑雪、自由式滑雪、单板滑雪、跳台滑雪、越野滑雪、北欧两项、短道速滑、速度滑冰、花样滑冰、冰球、冰壶、雪车、钢架雪车、雪橇、冬季两项)共计109个小项.某校为了调查学生是否喜欢冬季冰雪运动与性别有关,在高三年级特选取了200名学生进行了问卷调查,得到如下的22⨯列联表:已知从这200名学生中随机抽取1人,这个人喜欢冰雪运动的概率为0.8,表格中100a=,20d=.(1)完成22⨯列联表,并判断是否有90%的把握认为喜欢冰雪运动与性别有关;(2)从上述喜欢冰雪运动的学生中用分层抽样的方法抽取8名学生,再从这8人中抽取3人调查其喜欢的运动,用X表示3人中女生的人数,求X的分布列及数学期望.参考公式及数据:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关(2)分布列见解析,9 8【解析】【分析】(1)从这个人喜欢冰雪运动的概率为0.8,可以推算出200人中喜欢冰雪运动的总人数,进而可以完成表格;(2)按照分层抽样的原理算出8人中男生和女生的人数,进而确定X的可能取值,按照组合的方法即可算出分布列.(1)由题可知,从200名学生中抽取1人,这个人喜欢冰雪运动的概率为0.8,故喜欢冰雪运动的有2000.8160⨯=人,不喜欢冰雪运动的有20016040-=人,即100a=,60b=,20c=,20d=,22⨯列联表如下:()22200100206020 2.083 2.711604012080K ⨯-⨯=≈<⨯⨯⨯,故没有90%的把握认为是否喜欢冰雪运动与性别有关; (2)按分层抽样,设抽取女生x 名,男生y 名,816060100x y ==,解得3x =,5y =, 即抽取的8人中喜欢冰雪运动的女生有3人,男生有5人, 故X 0=,1,2,3,()3538C 50C 28P X ===,()123538C C 151C 28P X ===,()213538C C 152C 56P X ===,()3035381356C C C P X ===,X 的分布列如下:()51515190123282856568E X =⨯+⨯+⨯+⨯=; 故答案为:列联表见解析,没有90%的把握认为是否喜欢冰雪运动与性别有关; 分布列见解析,98.。
高考数学一轮复习专题04 独立性检验(解析版)
概率与统计 专题四:独立性检验一、知识储备 1.22⨯列联表设X ,Y 为两个变量,它们的取值分别为12{}x x ,和12{}y y ,,其样本频数列联表(22⨯列联表)如下:2.独立性检验利用随机变量2K (也可表示为2χ)2()()()()()n ad bc a b c d a c b d -=++++(其中n a b c d =+++为样本容量)来判断“两个变量有关系”的方法称为独立性检验. 3.独立性检验的一般步骤(1)根据样本数据列出22⨯列联表;(2)计算随机变量2K 的观测值k ,查下表确定临界值k 0:(3)如果0k k ≥,就推断“X 与Y 有关系”,这种推断犯错误的概率不超过()20P K k ≥;否则,就认为在犯错误的概率不超过()20P K k ≥的前提下不能推断“X 与Y 有关系”.【注意】(1)通常认为 2.706k ≤时,样本数据就没有充分的证据显示“X 与Y 有关系”.(2)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.(3)独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断.二、例题讲解1.(2022·榆林市第十中学高三月考(文))随着经济的发展,人们的生活水平显著提高,健康意识不断增强,健康管理理念深入人心,人们参加体育锻炼的次数与时间在逐渐增加.某校一个课外学习小组为研究居民参加体育锻炼的时长(时长不超过60分钟)是否与性别有关,对某小区居民进行调查,并随机抽取了100名居民的调查结果,其中男性有55人,根据调查结果绘制了居民日均锻炼时间的频率分布直方图如下:(1)求样本中居民日均锻炼时间的中位数;(2)将日均锻炼时间不低于40分钟的居民称为“健生达人”(健康生活达人),已知样本中“健生达人”中有10名女性,根据已知条件完成下面22⨯列联表,并据此资料判断是否有95%的把握认为“健生达人”与性别有关.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)32.8分钟;(2)表格见解析,没有95%的把握认为“健生达人”与性别有关. 【分析】(1)根据中位数的定义求样本中居民日均锻炼时间的中位数;(2)分析数据,完成列联表,计算2K ,通过比较其与临界值的大小,确定是否接受假设. 【详解】解:本题考查独立性检验.(1)由频率分布直方图知日均锻炼时间在[)0,30对应的频率为0.050.180.20.43++=,则中位数位于[)30,40,且中位数为0.500.43301032.80.25-+⨯=(分钟)(2)由频率分布直方图可知在抽取的100人中,“健生达人”有32人,从而22⨯列联表如下:得()210033103522 3.595 3.84155456832K ⨯-⨯=≈<⨯⨯⨯,所以没有95%的把握认为“健生达人”与性别有关2.(2022·江苏南京市·高三开学考试)科研小组为提高某种水果的果径,设计了一套实验方案,并在两片果园中进行对比实验.其中实验园采用实验方案,对照园未采用.实验周期结束后,分别在两片果园中各随机选取100个果实,按果径分成5组进行统计:[)21,26,[)26,31,[)31,36,[)36,41,[]41,46(单位:mm ).统计后分别制成如下的频率分布直方图,并规定果径达到36mm 及以上的为“大果”.(1)请根据题中信息完成下面的列联表,并判断是否有99.9%的把握认为“大果”与“采用实验方案”有关;(2)根据长期种植经验,可以认为对照园中的果径X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,5.5σ≈,请估计对照园中果径落在区间()39,50内的概率.(同一组中的数据以这组数据所在区间中点的值作代表)附:①()()()()()22n ad bc K a b c d a c b d -=++++;②若X 服从正态分布()2,N μσ,则()0.683P X μσμσ-<<+=,()220.954P X μσμσ-<<+=,()330.997P X μσμσ-<<+=.【答案】(1)列联表见解析,有99.9%的把握认为两者有关;(2)0.157. 【分析】(1)根据频率分布直方图分别求出采用实验方案大果和非大果数量及未采用实验方案大果和非大果数量,从而可得出列联表,再根据公式求出2K ,对照临界值表即可得出结论;(2)求出样本平均数x ,再根据正态分布的性质即可得出答案. 【详解】解:(1)由频率分布直方图可得:采用实验方案大果的数量为()50.1100.01010060⨯+⨯=个, 则非大果数量为1006040-=个,未采用实验方案大果的数量为()50.0400.02010030⨯+⨯=个, 则非大果数量为1003070-=个, 列联表如下:22006070304020010.8281001009011011K ⨯-⨯==⨯⨯⨯>,所以有99.9%的把握认为两者有关; (2)由题中数据,23.50.128.50.233.50.438.50.243.50.133.5x =⨯+⨯+⨯+⨯+⨯=, 则33.5μ=,则()()0.9970.683395030.157P X P X μσμσ-=++==<<<<.三、实战练习1.(2022·定远县育才学校高三开学考试(文))微信是腾讯公司推出的一种手机通信软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人.为了调查微信用户每天使用微信的时间,某经销化妆品的店家在一广场随机采访男性、女性用户各50名,将男性、女性平均每天使用微信的时间(单位:h )分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图估计女性平均每天使用微信的时间;(2)若每天玩微信超过4h 的用户称为“微信控”,否则称为“非微信控”,判断是否有90%的把握认为“微信控”与性别有关. 附表:(参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)【答案】(1)4.76()h ;(2)有90%的把握认为“微信控”与性别有关. 【分析】(1)用每个小矩形的面积乘以对应小矩形底边的中点,然后求和即可得到答案;(2)先通过频率分布直方图面积为1求出a ,进而根据参考公式求出K 2,然后将数据进行对比即可得到答案. 【详解】(1)由女性的频率分布直方图,可知女性用户平均每天使用微信的时间为0.1610.2430.2850.2070.129 4.76()h ⨯+⨯+⨯+⨯+⨯=.(2)由男性的频率分布直方图,可得2(0.040.1420.12)1a +++⨯=,解得0.08a =.由两个频率分布直方图,可得22⨯列联表如下:2K的观测值2100(38203012)2.941 2.70650506832k⨯⨯-⨯=≈>⨯⨯⨯,所以有90%的把握认为“微信控”与性别有关.2.(2022·河北唐山·高三开学考试)数字人民币是由央行发行的法定数字货币,它由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.截至2022年6月30日,数字人民币试点场景已超132万个,覆盖生活缴费、餐饮服务、交通出行、购物消费、政务服务等领域.为了进一步了解普通大众对数字人民币的感知以及接受情况,某机构进行了-次问卷调查,部分结果如下:(1)如果将高中及高中以下的学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表;(2)若从低学历的被调查者中,按对数字人民币的了解程度用分层抽样的方法抽取8人,然后从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率;(3)根据列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关? 附:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(1)列联表答案见解析;(2)914;(3)没有95%的把握认为“是否了解数字人民币”与“学历高低”有关. 【分析】(1)根据题中所给数据完成22⨯列联表即可;(2)根据分层抽样分别求出不了解数字人民币和了解数字人民币的人数,再根据古典概型公式即可得解; (3)根据公式求出2K ,在参照临界值表即可得出结论. 【详解】解:(1)22⨯列联表如下:(2)从低学历被调查者中按对数字人民币的了解程度用分层抽样的方法抽取8人,抽取的8人中,不了解数字人民币的有81503400⨯=人, 了解数字人民币的有82505400⨯=人, 从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率2528C 91C 14P =-=.(3)根据列联表得()22800125250150275800 3.463 3.841275525400400231K ⨯⨯-⨯==≈<⨯⨯⨯.故没有95%的把握认为“是否了解数字人民币”与“学历高低”有关.3.(2022·广东实验中学高三月考)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状时止的这一阶段称为潜伏期.一研究团队统计了某地区1000名患者的相关信息,得到如下表格:(1)求这1000名患者的潜伏期的样本平均值x (同一组中的数据用该组区间的中点值作代表); (2)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,以潜伏期是否超过6天为标准进行分层抽样,从上述1000名患者中抽取200人,得到如下列联表请将列联表补充完整,并根据列联表判断是否有95%的把捏认为潜伏期与息者年龄有关;(3)以这1000名患者的潜伏期超过6天的频率,代替该地区1名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该研究团队随机调查了20名患者,其中潜伏期超过6天的人数最有可能(即概率最大)...........是多少? 附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)5.4天;(2)列联表见解析,没有95%的把捏认为潜伏期与息者年龄有关.(3)潜伏期超过6天最有可能....是8人.【分析】(1)根据频率直方表求平均值即可.(2)由题设写出列联表,根据卡方检验公式计算卡方值,比照参考值即可知是否有95%的把捏认为潜伏期与息者年龄有关;(3)由题意知潜伏期超过6天的人数2(20,)5X B ,则202032()()()55k k kP X k C -==,应用不等法求最大概率时的k 值即可. 【详解】(1)10.08530.20550.3170.2590.13110.015130.005x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 5.4=天.(2)由题设知:[0,6]的频率为0.6,(6,14]的频率为0.4,故200人中潜伏期在[0,6]上有120人,在(6,14]上有80人. 列联表如下:∴22200(65453555) 2.083 3.84110010012080K ⨯⨯-⨯=≈<⨯⨯⨯,故没有95%的把捏认为潜伏期与息者年龄有关.(3)由患者潜伏期超过6天发生的概率400210005=, 设潜伏期超过6天的人数为X ,则2(20,)5XB ,∴202032()()()55k k kP X k C -==且020k ≤≤,*k N ∈,由题意,()(1)()(1)P X k P X k P X k P X k =≥=+⎧⎨=≥=-⎩,即2019112020202111202032325555{32325555k k k k k k k k k k k k C C C C --++----⎛⎫⎛⎫⎛⎫⎛⎫≥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎛⎫⎛⎫⎛⎫⎛⎫≥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭,化简得3(1)2(20)2(21)3k k k k +≥-⎧⎨-≥⎩,解得374255k ≤≤, ∴8k ,即潜伏期超过6天最有可能....是8人. 4.(2022·黑龙江高三其他模拟(文))据有关部门统计,2021年本科生的平均签约薪酬为每月4300元.2021年某高校毕业生就业指导中心为了分析本校本科毕业生的专业课成绩优秀与否与本科毕业生就业后获得薪酬的关系,随机调查了从学校毕业的200名本科毕业学进行研究.研究结果表明:在专业课成绩优秀的120名本科毕业生中有90人每月工资超过人民币4300元,另30人每月工资低于人民币4300元;在专业课成绩不优秀的80名本科毕业生中有20人每月工资超过人民币4300元,另60人每月工资低于人民币4300元. (1)试根据上述数据完成22⨯列联表;(2)能否在犯错误的概率不超过0.001的前提下认为“该高校本科毕业生的专业课成绩优秀”与“每月工资超过当年本科生的平均签约薪酬”有关系?参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析;(2)能. 【分析】(1)根据题目已知数据完成22⨯列联表;(2)计算2K,根据临界值表判断即可【详解】(1)22⨯列联表如下:(2)因为()22009060302016004810.828 120801109033K⨯⨯-⨯==>>⨯⨯⨯.所以能在犯错误的概率不超过0.001的前提下认为“该校毕业生的专业课成绩优秀”与“每月工资超过当年本科生的平均签约薪酬”有关系.【点睛】方法点睛:本题考查22⨯联表判断相关性,独立性检验的一般步骤:第一步,提出假设0H:两个分类变量A和B没有关系;第二步,根据22⨯列联表和公式计算2K统计量;第三步,查对课本中临界值表,作出判断。
高中数学独立性检验精选题
独立性检验精选题26道一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:,则下列说法正确的是()已知在全部105人中随机抽取1人,成绩优秀的概率为27A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++据此表,可得()A.认为机动车驾驶技术与性别有关的可靠性不足50%B.认为机动车驾驶技术与性别有关的可靠性超过50%C.认为机动车驾驶技术与性别有关的可靠性不足60%D.认为机动车驾驶技术与性别有关的可靠性超过60%6.如表是一个22⨯列联表:则表中a,b的值分别为()A.94,72B.52,50C.52,74D.74,527.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.309.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为()参考公式附:22()()()()()n a d b cKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:A.130B.190C.240D.25010.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b cKa b c d a c b d-=++++A.12B.11C.10D.1811.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .1814.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法.正确的是()参考公式及数据:22()6.109()()()()n a d b c K a b c d a c b d -=≈++++附表:A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 15.为考察某种药物对预防禽流感的效果,在四个不同的实验室取相同的个体进行动物试验,根据四个实验室得到的列联表画出如下四个等高条形图,最能体现该药物对预防禽流感有效果的图形是()A .B .C .D .16.千百年来,我国劳动人民在生产实践中根据云的形状、走向、速度、厚度、颜色等的变化,总结了丰富的“看云识天气”的经验,并将这些经验编成谚语,如“天上钩钩云,地上雨淋淋”“日落云里走,雨在半夜后”⋯⋯小波同学为了验证“日落云里走,雨在半夜后”,观察了所在地区A 的100天日落和夜晚天气,得到如下22⨯列联表:临界值表并计算得到219.05K ≈,下列小波对地区A 天气判断不正确的是()A .夜晚下雨的概率约为12B .未出现“日落云里走”夜晚下雨的概率约为514C .有99.9%的把握认为“‘日落云里走’是否出现”与“当晚是否下雨”有关D .出现“日落云里走”,有99.9%的把握认为夜晚会下雨 17.有关独立性检验的四个命题,其中不正确的是()A .两个变量的22⨯列联表中,对角线上数据的乘积相差越大,说明两个变量有关系成的可能性就越大B .对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,“X 与Y 有关系”的可信程度越小C .从独立性检验可知:有95%把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有95%可能患有心脏病D .从独立性检验可知:有99%把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过1%前提下认为吸烟与患肺癌有关18.为了调查患胃病是否与生活不规律有关,在患胃病与生活不规律这两个分类变量的计算中,下列说法正确的是()A .k 越大,“患胃病与生活不规律没有关系”的可信程度越大.B .k 越大,“患胃病与生活不规律有关系”的可信程度越小.C .若计算得23.918K ≈,经查临界值表知2( 3.841)0.05P K ≈…,则在100个生活不规律的人中必有95人患胃病.D .从统计量中得知有95%的把握认为患胃病与生活不规律有关,是指有5%的可能性使得推断出现错误. 二.填空题(共3小题)19.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下22⨯列联表(部分数据缺失):表中a的值为;计算可知,在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式:22()()()()()n a d b cKa b c d a c b d-=++++,n a b c d=+++.参考数据:20.在西非“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附:22()()()()()n a d b cKa b c d a c b d-=++++根据上表,有的把握认为“小动物是否被感染与服用疫苗有关”21.某学生为了研究高二年级同学的体质健康成绩与学习成绩的关系,从高二年级同学中随机抽取30人,统计其体质健康成绩和学习成绩,得到22⨯列联表如表:有 的把握认为学生的体质健康成绩高低与学习成绩高低有关. 附:22()()()()()n a d b c Ka b c d a c b d -=++++.三.解答题(共5小题)22.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:)m in 绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n a d b c Ka b c d a c b d -=++++,23.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)k g ,其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A 表示事件“旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n a d b c K a b c d a c b d -=++++.24.某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n a d b cKa b c d a c b d-=++++.25.某高校共有学生15000人,其中男生10500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:22()()()()()n a d b cKa b c d a c b d-=++++.26.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:22()()()()()n a d b c Ka b c d a c b d -=++++独立性检验精选题26道参考答案与试题解析一.选择题(共18小题)1.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa b c d a c b d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【分析】题目的条件中已经给出这组数据的观测值,我们只要把所给的观测值同节选的观测值表进行比较,发现它大于6.635,得到有99%以上的把握认为“爱好这项运动与性别有关”.【解答】解:由题意算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯.7.8 6.635>,∴有0.011%=的机会错误,即有99%以上的把握认为“爱好这项运动与性别有关”故选:C.【点评】本题考查独立性检验的应用,这种问题一般运算量比较大,通常是为考查运算能力设计的,本题有创新的地方就是给出了观测值,只要进行比较就可以,本题是一个基础题.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由22()()()()()n a d b cKa d c d a cb d-=++++算得,22110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯附表:参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”【分析】根据条件中所给的观测值,同题目中节选的观测值表进行检验,得到观测值对应的结果,得到结论有99%以上的把握认为“爱好该项运动与性别有关”.【解答】解:由题意知本题所给的观测值,2 2110(40302020)7.860506050K⨯⨯-⨯=≈⨯⨯⨯7.8 6.635>,∴这个结论有0.011%=的机会说错,即有99%以上的把握认为“爱好该项运动与性别有关”故选:A.【点评】本题考查独立性检验的应用,考查对于观测值表的认识,这种题目一般运算量比较大,主要考查运算能力,本题有所创新,只要我们看出观测值对应的意义就可以,是一个基础题.3.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验,经计算2 6.705K=,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动没有关系”.附:A.99.9%B.99%C.1%D.0.1%【分析】把观测值同临界值进行比较.得到有99%的把握说学生性别与支持该活动有关系.【解答】解:2 6.705 6.635K=>,对照表格:∴有99%的把握说学生性别与支持该活动有关系,∴有1%的把握说学生性别与支持该活动没有关系,故选:C.【点评】本题考查独立性检验知识,难度不大,属于基础题.4.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是() A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【分析】根据成绩优秀的概率求出成绩优秀的学生数,从而求得c和b的值;再根据公式计算相关指数2K的值,比较与临界值的大小,判断“成绩与班级有关系”的可靠性程度.【解答】解:成绩优秀的概率为27,∴成绩优秀的学生数是2105307⨯=,成绩非优秀的学生数是75,20c∴=,45b=,选项A、B错误.又根据列联表中的数据,得到2105(10302045)26.109 3.84155503075K ⨯⨯-⨯=≈>⨯⨯⨯,因此有95%的把握认为“成绩与班级有关系”, 故选:C .【点评】本题考查了独立性检验思想方法,熟练掌握列联表个数据之间的关系及相关指数2K 的计算公式是解题的关键.5.有人认为在机动车驾驶技术上,男性优于女性.这是真的么?某社会调查机构与交警合作随机统计了经常开车的100名驾驶员最近三个月内是否有交通事故或交通违法事件发生,得到下面的列联表:附:22()()()()()n a d b c Ka b c d a c b d -=++++据此表,可得( )A .认为机动车驾驶技术与性别有关的可靠性不足50%B .认为机动车驾驶技术与性别有关的可靠性超过50%C .认为机动车驾驶技术与性别有关的可靠性不足60%D .认为机动车驾驶技术与性别有关的可靠性超过60% 【分析】由表中数据计算观测值,对照临界值得出结论. 【解答】解:由表中数据,计算22100(40103515)0.33670.45555457525K⨯⨯-⨯=≈<⨯⨯⨯,∴认为机动车驾驶技术与性别有关的可靠性不足50%;故选:A .【点评】本题考查独立性检验的应用,关键是理解独立性检验的思路.属中档题. 6.如表是一个22⨯列联表:则表中a ,b 的值分别为()A.94,72B.52,50C.52,74D.74,52【分析】由列联表中数据的关系求得.【解答】解:732152b a=+=+=.a=-=,22522274故选:C.【点评】本题考查了列联表的做法,属于基础题.7.为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A.平均数B.方差C.回归分析D.独立性检验【分析】这是一个独立性检验应用题,处理本题时要注意根据已知构建方程计算出表格中男性近视与女性近视,近视的人数,并填入表格的相应位置.根据列联表,及2K的计算公式,计算出2K的值,并代入临界值表中进行比较,不难得到答案.【解答】解:分析已知条件,易得如下表格.根据列联表可得:2K,再根据与临界值比较,检验这些中学生眼睛近视是否与性别有关,故利用独立性检验的方法最有说服力.故选:D.【点评】独立性检验,就是要把采集样本的数据,利用公式计算2K的值,比较与临界值的大小关系,来判定事件A与B是否无关的问题.具体步骤:(1)采集样本数据.(2)由公式计算的2K值.(3)统计推断,当2 3.841K>时,有95%的把握说事件A与B有关;当2 6.635K>时,有99%的把握说事件A与B有关;当2 3.841K…时,认为事件A与B是无关的.8.针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的45,女生喜欢抖音的人数占女生人数35,若有95%的把握认为是否喜欢抖音和性别有关则调查人数中男生可能有( )人附表:附:22()()()()()n a d b cKa b c d a c b d-=++++A.20B.40C.60D.30【分析】设男生可能有x人,依题意填写列联表,由2 3.841K>求出x的取值范围,从而得出正确的选项.【解答】解:设男生可能有x人,依题意可得列联表如下;若有95%的把握认为是否喜欢抖音和性别有关,则2 3.841K>,由2242312()255553.841732155x x x x xxKx x x x⋅-⋅==>⋅⋅⋅,解得40.335x>,由题意知0x>,且x是5的整数倍,60∴满足题意.故选:C.【点评】本题考查列联表与独立性检验的应用问题,考查运算求解能力,是基础题.9.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有80%的男生喜欢网络课程,有40%的女生不喜欢网络课程,且有99%的把握但没有99.9%的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( )参考公式附:22()()()()()n a d b c K a b c d a c b d -=++++,其中na b c d=+++.参考数据:A .130B .190C .240D .250【分析】根据题意设男、女生的人数各为5x ,建立22⨯列联表,计算2K ,列不等式组求出x 的取值范围,即可确定满足条件的选项.【解答】解:依题意,设男、女生的人数各为5x ,建立22⨯列联表如下所示:由表中数据,计算2210(423)10557321x x x x x x K x x x x⋅⋅-⋅==⋅⋅⋅,由题可知106.63510.82821x <<,所以139.33510227.388x <<.只有B 符合题意. 故选:B .【点评】本题考查了列联表与独立性检验应用问题,也考查了运算求解能力,是基础题. 10.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有()人参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326636 3.841822x x x x x K x x x x x ⋅-⋅==>⋅⋅⋅,解得10.24x >,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,是基础题.11.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A .100个吸烟者中至少有99人患有肺癌B .1个人吸烟,那么这个人有99%的概率患有肺癌C .在100个吸烟者中一定有患肺癌的人D .在100个吸烟者中可能一个患肺癌的人也没有【分析】“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立,与多少个人患肺癌没有关系,得到结论.【解答】解: “吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,表示有99%的把握认为这个结论成立, 与多少个人患肺癌没有关系, 只有D 选项正确, 故选:D .【点评】本题考查独立性检验的应用,是一个基础题,解题的关键是正确理解有多大把握认为这件事正确,实际上是对概率的理解.12.某校团委对“学生性别与中学生追星是否有关”作了一次调查,利用22⨯列联表,由计算得27.218K ≈,参照如表:得到正确结论是( )A .有99%以上的把握认为“学生性别与中学生追星无关”B .有99%以上的把握认为“学生性别与中学生追星有关”C .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星无关”D .在犯错误的概率不超过0.5%的前提下,认为“学生性别与中学生追星有关” 【分析】利用已知概率对照表,在2K 大于对应值是认为相关,在小于对应值时不认为相关. 【解答】解:27.218 6.635K ≈>,对应的20()P K k …为0.010,可得有99%以上的把握认为“学生性别与中学生追星有关”, 故选:B .【点评】本题考查了独立性检验的应用问题,考查判断相关性,是基础题目.13.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的12,男生追星的人数占男生人数的16,女生追星的人数占女生人数的23.若有95%的把握认为是否追星和性别有关,则男生至少有( )参考数据及公式如下:22()()()()()n a d b c Ka b c d a c b d -=++++A .12B .11C .10D .18【分析】设男生人数为x ,依题意填写列联表,计算观测值,列不等式求出x 的取值范围,再根据题意求出男生的人数.【解答】解:设男生人数为x ,依题意可得列联表如下:若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则23.841K >,由2235()326663 3.841822xx x x x x K x x x x⨯-⨯==>⨯⨯⨯,解得10.24x>,2x ,6x 都为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢追星和性别有关,则男生至少有12人. 故选:A .【点评】本题考查了列联表与独立性检验的应用问题,属于基础题.14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如表所示的列联表:。
独立性检验典型题例解析
独立性检验典型题例解析所谓独立性检验,就是要把采集样本的数据,利用公式计算2χ的值,比较与临界值的大小关系,来判定事件A 与B 是否无关的问题。
具体步骤:(1)采集样本数据。
(2)由()21212211222112+++++++-=n n n n n n n n n χ计算2χ的值。
(3)统计推断,当2χ>3.841时,有95%的把握说事件A 与B 有关;当2χ>6.635时,有99%的把握说事件A 与B 有关;当2χ≤3.841时,认为事件A 与B 是无关的。
下面我们通过几个典型例题对独立性检验问题进行剖析,使同学们进一步掌握这类问题的研究方法。
例1、为了研究色盲与性别的关系,调查了1000人,调查结果如下表所示:根据上述数据试问色盲与性别是否是相互独立的? 分析:问题归结为二元总体的独立性检验问题。
解:由已知条件可得下表依据公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()5204804495651438644210002⨯⨯⨯⨯-⨯=27.139。
由于27.139>6.635,所以有99%的把握认为色盲与性别是有关的,从而拒绝原假设,可以认为色盲与性别不是相互独立的。
评注:根据假设检验的思想,比较计算出的2χ与临界值的大小,选择接受假设还是拒绝假设。
变式引申1:为了研究患慢性气管炎与吸烟量的关系,调查了228人,其中每天的吸烟支数在10支以上20支以下的调查者中,患者人数有98人,非患者人数有89人;每天的吸烟支数在20支以上的调查者中,患者人数有25人,非患者人数有16人。
试问患慢性气管炎是否与吸烟量互相独立?分析:即求独立性检验问题。
解:由已知条件得出下表:由公式()21212211222112+++++++-=n n n n n n n n n χ得2χ=()4118710512325891698228⨯⨯⨯⨯-⨯=0.994。
高考数学专题复习:独立性检验
高考数学专题复习:独立性检验一、单选题1.某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有97.5%的把握但没有99%的把握认为偏爱蔬菜还是肉类与性别有关,则2K 的观测值可能为( ) k 2.706 A .2 3.206K =B .2 6.625K =C .27.869K =D .211.208K =2.某校为了解学生“玩手机游戏”和“学习成绩”是否有关,随机抽取了100名学生,运用2×2列联表进行独立性检验,经计算得到2 3.936K =,所以判定玩手机游戏与学习成绩有关系,那么这种判断出错的可能性为( )A .1%B .5%C .95%D .99%3.某校为了调查喜欢语文与性别的关系,随机调查了一些学生,数据如下表,由此判断喜欢语文与性别有关系,那么这种判断出错的可能性为( )()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .99.5%B .5%C .0.5%D .95%4.以下四个命题,其中正确的个数有( )①在独立性检验中,随机变量2K 的观测值越大,“认为两个分类变量有关”,这种判断犯错误的概率越小.②在线性回归方程ˆ0.80.35yx =-时,变量x 与y 具有负的线性相关关系; ③随机变量X 服从正态分布2(3,)N σ,若(4)0.64P X ≤=,则(23)0.07P X ≤≤=; ④两个随机变量相关性越强,则相关系数r 的值越接近于1. A .1个B .2个C .3个D .4个5.两个分类变量X 和Y ,它们的取值分别为{}12,x x 和{}12,y y ,其样本频数列联表如下表所示:则下列四组数据中,分类变量X 和Y 之间关系最强的是( ) A .4a =,2b =,3c =,6d = B .2a =,1b =,3c =,5d = C .4a =,5b =,6c =,8d =D .2a =,3b =,4c =,6d =6.为了丰富教职工业余文化生活,某校计划在假期组织70名老师外出旅游,并给出了两种方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,则参照附表,得到的正确结论是( )附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.A .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别有关”B .在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别无关”C .有95%以上的把握认为“选择方案与性别有关”D .有95%以上的把握认为“选择方案与性别无关”7.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用22⨯列联表,由计算可得27.236K =,参照下表:得到的正确结论是( )A .有99%以上的把握认为“爱好该项运动与性别无关”B .有99%以上的把握认为“爱好该项运动与性别有关”C .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关"D .在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”8.如果根据性别与是否爱好运动的列联表得到2 3.852 3.841x ≈>,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( ) A .2.5%B .0.5%C .1%D .5%9.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用22⨯列联表进行独立性检验.经计算2 6.058K =,则所得到的统计学结论是:有( )的把握认为“学生性别与支持该活动有关系”A .0.025%B .97.5%C .99%D .99.9%10.根据分类变量x 与y 的观测数据,计算得到2 2.974χ=.依据0.05α=的独立性检验,结论为( )A .变量x 与y 不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.05C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.05二、填空题11.为了调查高中学生参加课外兴趣活动选篮球和舞蹈是否与性别有关,现随机调查了30名学生,得到如下22⨯列联表:根据表中的数据,及观测值2K(其中22()()()()()n ad bcKa b c d a c b d-=++++),参考数据:则在犯错误的概率不超过__________前提下,认为选择舞蹈与性别有关.12.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:(单位:人)由上表中数据计算得2K的观测值22105(10302045)6.10955503075K⨯⨯-⨯=≈⨯⨯⨯,请估计在犯错误的概率不超过__________的前提下认为“文化程度与月收入有关系”.13.利用独立性检验的方法调查高中性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用22⨯列联表,由计算可得27.245K≈,参照下表2.706 至少有__________以上的把握认为“爱好该项运动与性别有关”.14.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到K 2的观测值k =250(1320107)23272030⨯⨯-⨯⨯⨯⨯≈4.844.则认为选修文科与性别有关系出错的可能性为__________.三、解答题15.为了解某市市民对政府出台楼市限购令的态度,在该市随机抽取了50名市民进行调查,他们月收入(单位:百元)的频率分布直方图如下:(1)求该市市民平均月收入的估计值(每组数据以区间中点值为代表).(2)将月收入不低于7500元称为“高收入”,否则称为“非高收入”,根据已知条件完成下面的22⨯列联表,并判断能否有99%的把握认为市民对楼市限购令的态度与收入有关.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.16.为了调查某大学学生在某天上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查,得到了如下的统计结果: 表1:男生上网时间与频数分布表表2:女生上网时间与频数分布表(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数; (2)完成联表,并回答能否有90%的把握认为“大学生上网时间与性别有关”.附:()()()()22()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++为样本容量.0.45517.某大学为鼓励学生进行体育锻炼,购买了一批健身器材供学生使用,并从该校大一学生中随机抽取了100名学生调查使用健身器材的情况,得到数据如表所示:(1)设每周使用健身器材的次数不低于3次为“爱好健身”,根据上表数据,填写22⨯列联表,并判断能否在犯错误的概率不超过0.10的前提下认为“男生和女生在使用健身器材的爱好方面有差异”;(2)从上述每周使用健身器材3次的学生中,利用分层抽样的方法抽取5名学生,再从抽取的5名学生中随机抽取3人,求3人中至多有一名女生的概率.18.在对人们休闲方式的一次调查中,仅就看电视与运动这两种休闲方式比较喜欢哪一种进行了调查.调查结果:接受调查总人数110人,其中男、女各55人;受调查者中,女性有30人比较喜欢看电视,男性有35人比较喜欢运动.(1)请根据题目所提供的调查结果填写下列22⨯列联表:(2)能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”?注:22()()()()()n ad bcKa b c d a c b d-=++++,(其中n a b c d=+++为样本容量)参考答案1.B【分析】根据把握率确定2K的观测值区间范围即可选择.【详解】∵有97.5%的把握但没有99%的把握,∴2K的观测值区间范围为[5.024,6.635),结合选项可知,2K的观测值可能为6.625.故选:B2.B【分析】根据2K的值,对照附表即可得解.【详解】由题得2 3.936 3.841K=>,所以判定玩手机游戏与学习成绩有关系,这种判断出错的可能性为5%. 故选:B3.C【分析】计算出2K的值可得答案.【详解】因为()22501520510258.33320307.89225753K⨯⨯-⨯==≈>⨯⨯⨯,所有这种判断出错的可能性0.5%.故选:C.4.A【分析】利用随机变量2K的观测值越大,说明两个变量有关系的可能性越大判断①;根据回归方程一次项系数的正负判断②;根据正态分布的性质判断③; 利用线性相关的概念判断④. 【详解】①:在独立性检验中,因为随机变量2K 的观测值越大,说明两个变量有关系的可能性越大,即犯错误的概率越大,故①错误;②:回归方程ˆ0.80.35yx =-的一次项系数为-0.35<0,故变量x 与y 具有负的线性相关关系,故②正确;③:随机变量X 服从正态分布2(3)N σ,,则(34)(4)(3)0.640.50.14P X P X P X <≤=≤-<=-=, 由对称性可知,(23)0.14P X ≤≤=,故③错误;④:两个随机变量的线性相关关系越强,则相关系数r 的绝对值越接近于1,故④错误. 正确的选项有1个. 故选:A 5.A 【分析】逐项求出ad bc -的值并加以对比,最大值对应的分类变量之间关系最强. 【详解】我们可以用ad bc -的大小近似的判断两个分类变量之间关系的强弱,ad bc -的值越小,关系越弱,越大,关系越强.这四组数据中ad bc -的值分别为18、7、2、0, 所以A 组数据的ad bc -的值最大,相比较而言这组数据反应的X 和Y 的关系最强. 故选:A. 6.C 【分析】设该校男老师的人数为x ,女老师的人数为y ,根据条件,得到22⨯列联表,求出x ,y 的值,利用公式计算2K 的值,再与表中临界值比较可得结果. 【详解】设该校男老师的人数为x ,女老师的人数为y ,则可得如下表格:由题意0.40.50.25x y =+,可得43y x =,可得30x =,40y =,则()227015301510 4.667 3.84125453040K ⨯-⨯=≈>⨯⨯⨯, 但4.667 5.024<,所以无97.5%以上有95%以上的把握认为“选择方案与性别有关”. 故选:C. 7.B 【分析】由已知的27.236K =,对比临界值表可得答案 【详解】解:因为27.236 6.635K =>,所以有99%以上的把握认为“爱好该项运动与性别有关”. 故选:B. 8.D 【分析】根据临界值附表比较,即得结论. 【详解】根据以下临界值附表可知这种判断犯错的可能性不超过5%. 故选:D 9.B【分析】将2K 的值与表中数据比较大小可知5.024 6.058 6.635<<,由此确定出相应的把握有多少.【详解】因为2 6.058K =,对照表格:5.024 6.058 6.635<<,所以有10.0250.97597.5%-==的把握认为“学生性别与是否支持该活动有关系”. 故选:B.10.C【分析】由表中数据以及独立性检验的思想即可得出结果.【详解】0.05α=时,2 3.841 2.974χ=>,所以在犯错概率不超过0.1时变量x 与y 有关.故选:C11.0.025【分析】由列联表中的数据,根据公式计算出2K 的值,再对照临界表即可得答案.【详解】 解:由列联表中的数据可得,2230(13827)27 5.4 5.024*********K ⨯⨯-⨯===>⨯⨯⨯, 所以在犯错误的概率不超过0.025的前提下,认为选择舞蹈与性别有关.故答案为:0.025.12.0.025【分析】根据2K ,对比临界值即可得出结论.【详解】∵6.109 5.024>,故能在犯错误的概率不超过0.025的前提下认为“文化程度与月收入有关系”.故答案为:0.025.13.99%【分析】根据卡方的值与参考数据比较即可判断;【详解】解:因为27.245K ≈,6.6357.2457.879<<,所以10.0199%-=故至少有99%以上的把握认为“爱好该项运动与性别有关”,故答案为:99%14.5%【分析】根据观测值k ≈4.844以及独立性检验的基本思想即可得出结果.【详解】K 2的观测值k ≈4.844,这表明小概率事件发生.根据假设检验的基本原理,应该断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为5%.故答案为:5%15.(1)63;(2)表格见解析,有.【分析】(1)每组数据区间中点值乘以该组的频率求和可得答案;(2)根据每组频率乘以50可得每组的人数可完成列联表,计算2K 可得答案.【详解】(1)该市市民平均月收入的估计值为400.1500.2600.3700.2800.1900.163⨯+⨯+⨯+⨯+⨯+⨯=.(2)根据频率分布直方图知每组的人数分别为5,10,15,10,5,5.可得22⨯列联表如下:所以()22502882128.33340103020K ⨯⨯-⨯=≈⨯⨯⨯,因为8.333 6.635>,所以有99%的把握认为市民对楼市限购令的态度与收入有关.16.(1)225;(2)列联表答案见解析,没有90%的把握认为“大学生上网时间与性别有关”.【分析】(1)设上网时间不少于60分钟的人数为x ,依题意有30750100x =,计算即可; (2)填写列联表,计算2K ,对照临界值得出结论.【详解】(1)设上网时间不少于60分钟的人数为x ,依题意有30750100x =,解得225x =,所以估计其中上网时间不少于60分钟的人数是225.(2)塻22⨯列联表如下:由表中数据可得到22200(60304070) 2.20 2.70610010013070K ⨯-⨯=≈<⨯⨯⨯, 故没有90%的把握认为“大学生上网时间与性别有关”.17.(1)表格见解析,不能;(2)710. 【分析】(1)根据已知数据统计列联表中的各项的人数,填写列联表,进而计算2K 并与0.1的临界值进行比较,得到论断;(2)利用分层抽样的等比例原则求得抽取的5人中男女生的人数,利用符号表示每个学生,利用列举法计数,得到所求概率.【详解】解:(1)填写的列联表如下所示:()2210222422320.506 2.70644565446K ⨯⨯-⨯=≈<⨯⨯⨯.所以不能在犯错误的概率不超过0.1的前提下认为“男生和女生在使用健身器材的爱好方面有差异”.(2)从每周使用健身器材3次的学生中,利用分层抽样的方法抽取5名学生,则抽取男生3名,抽取女生2名.将抽取的3名男生分别记为a ,b ,c ,2名女生分别记为m ,n ,则从5人中随机抽取3人的不同情况有abc ,abm ,abn ,acm ,acn ,amn ,bcm ,bcn ,bmn ,cmn ,共10种, 其中至多有一名女生的情况有abc ,abm ,abn ,acm ,acn ,bcm ,bcn ,共7种. 所以从抽取的5名学生中随机抽取3人,至多有一名女生的概率为710. 18.(1)答案见解析;(2)不能.【分析】(1)由题意填写列联表即可;(2)代入数据计算2K 的观测值,比较观测值与3.841的大小,判断能否在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系” .【详解】解.(1)根据题目所提供的调查结果,可得下列22⨯列联表:(2)根据列联表中的数据,可计算()2211030352025 3.66750605555K ⨯⨯-⨯=≈⨯⨯⨯,因为03.667 3.841k k ≈<=,所以不能在犯错误的概率不超过0.05的前提下认为“性别与休闲方式有关系”.。
7独立性检验习题简单
7独立性检验习题简单独立性检验习题一、选择题(共14小题;共70分)1. 某市政府在调查市民收入增减与旅游愿望的关系时,采用独立性检验法抽查了人,计算发的观测值现,根据这一数据查阅下表,市政府断言市民收入增减与旅游愿望有关系这一断言犯错误的概率不超过A. B. C. D. 名 2. 某企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了员工进行调查,所得的数据如表所示:合计积极支持改革不太支持改革工作积极工作一般合计对于人力资源部的研究项目,根据上述数据能得出的结论是时,有的把握说(参考公式与数据:.当时认为有关;当与时,有的把握说事件事件与有关;当无关.)与事件A. 有的把握说事件与有关B. 有的把握说事件与有关C. 有的把握说事件与有关D. 事件与无关 3. 通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好不爱好合计,方公式算得:由附表:参照附表:得到的正确的结论是的前提下,认为”“爱好该运动与性别无关A. 在犯错的概率不超过B. 在犯错的概率不超过的前提下,认为爱好该运动与性别有关”“”爱好该运动与性别有关“以上的把握认为有C.D. 有以上的把握认为“爱好该运动与性别无关” 4. 通过随机询问名不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计.计算得,由附表:参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别有关”B. 有以上的把握认为“爱好该项运动与性别有无关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关” 5. 某医疗研究所为了检验新开发的流感疫苗对甲型流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人半年的感冒记录作比较,提出假设:“这种疫苗不能起到,则下列说法正确的是,并计算出预防甲型流感的作用”A. 这种疫苗能起到预防甲型流感的有效率为;B. 若某人未使用该疫苗,则他在半年中有的可能性得甲型;C. 有的把握认为“这种疫苗能启动预防甲型流感的作用”;D. 有的把握认为“这种疫苗能启动预防甲型流感的作用”. 6. 考察棉花种子经过处理跟生病之间的关系,得到下表中的数据:种子经过处理种子未处理合计得病不得病合计根据以上数据可以判断B. A. 种子经过处理跟是否得病有关种子经过处理跟是否得病无关D. 以上都是错误的C. 种子是否经过处理决定是否得病7. 某校为了研究“学生的性别”和“对待某项运动的喜爱程度”是否有关,运用列联表进行独立,则认为“学生性别与对待某项运动的喜爱程度有关系”的犯错误的概性检验,经计算率不超过附:A. D. C.B.8. 某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用的把握认为,则所得到的统计学结论是:有列联表进行独立性检验,经计算“学生性别与支持该活动有关系”.B. C. D. A. 9. 利用独立性检验的方法调查大学生的性别与爱好某项运动是否有关,通过随机询问名不同的列联表,由计算可得大学生是否爱好某项运动,利用参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别无关”B. 有以上的把握认为“爱好该项运动与性别有关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”10. 下列说法中正确的是的观测值越大,则“与若分类变量和的随机变量相关”的可信程度越小A.B. 对于自变量和因变量,当取值一定时,的取值具有一定的随机性,,间的这种非确定关系叫做函数关系越接近,表明两个随机变量线性相关性越弱C. 相关系数的观测值越小,则两个分类变量有关系的把握性越小 D. 若分类变量与的随机变量11. 通过随机询问名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好不爱好总计.由算得,附表:参照附表,得到的正确结论是A. 有以上的把握认为“爱好该项运动与性别有关”B. 有以上的把握认为“爱好该项运动与性别无关”C. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别有关”D. 在犯错误的概率不超过的前提下,认为“爱好该项运动与性别无关”列联表:的和假设有两个分类变量12.总计总计有关系的可能性最大的一组为对同一样本,以下数据能说明与C. ,,D. , A. , B. 13. 某同学利用课余时间做了一次社交软件使用习惯调查,得到列联表如下:偏爱微信偏爱合计岁以下岁以上合计则下列结论正确的是A. 在犯错误的概率不超过的前提下认为社交软件使用习惯与年龄有关B. 在犯错误的概率超过的前提下认为社交软件使用习惯与年龄有关C. 在犯错误的概率不超过的前提下认为社交软件使用习惯与年龄有关D. 在犯错误的概率超过的前提下认为社交软件使用习惯与年龄有关14. 随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了位育龄妇女,结果如表.非一线一线总计愿生不愿生总计附表:.参照附表,得到的正确结论是由算得,A. 在犯错误的概率不超过的前提下,认为“生育意愿与城市级别有关”B. 在犯错误的概率不超过的前提下,认为“生育意愿与城市级别无关”C. 有以上的把握认为“生育意愿与城市级别有关”D. 有以上的把握认为“生育意愿与城市级别无关”二、填空题(共4小题;共20分)某高校《统计学初步》课程的教师随机调查了选该课的一些学生的情况,具体数据见下表:15. 非统计专业统计专业合计男女合计为了判断主修统计专业是否与性别有关系,根据表中的数据求得,所以主修统计专业与性别有关系.这种判断出错的可能性为..因为16. 为了研究服用某种新药是否会患某种慢性病,调查了名服用此种新药和名未服用此种新药的人,调查结果见下表:患慢性病未患慢性病合计服用新药未服用新药合计.根据列联表中的数据可得17. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了名电视观众,相关的数据如表所示:总计文艺节目新闻节目岁至岁大于岁总计由表中数据直观分析,收看新闻节目的观众是否与年龄有关(填“是”或“否”).18. 若两个分类变量与的列联表为:总计总计则“与之间有关系”这个结论出错的概率为.三、解答题(共2小题;共26分)19. 某同学对本市一家妇产科医院在一天中男、女孩的出生时间进行了调查,他把一天的时间分为白天至与晚上至次日,然后作出了出生时间和性别之间的独立性检验,并得出如下结论:有的把握认为“性别与出生时间有关”,请你解释这个结论.20. 为考察某种药物预防禽流感的效果,进行动物家禽试验,调查了个样本,统计结果为:服用药的共有个样本,服用药但患病的仍有个样本,没有服用药且未患病的有个样本.(1)根据所给样本数据画出列联表;(2)请问能有多大把握认为药物有效?。
独立性检验练习含答案
独立性检验练习含答案一、基础过关1. 5 2×2.706 时,就有 的把握认为“x与y 百大系”。
2.在某医院,由于意心解病而住院的 665名男性病人中,有 214人类殖,而另外772名不是由于忠心鼓励自住院的男性病人中有175人先项,统 计~ (结果保留 3位小数)①ad b c 接小,说明X 与Y 的关系线段. ②ad -bc 越大,说明X 与Y 的关系越来。
②[ad -bo]'越大,说明X 与Y 的关系基础. ①(ad -bc)²能按照下0.说明x 与Y 的关系解析.4. 请对随机询问110名性别有限的血拉工品五级每上项目sh ,是到up 下的网联表:lna −n (ad−log 3)(a+b/c+d/a+c ]b+d其中 xx =110×(40×30−20×20)60×50×60×50=7.8参照班表,得到的正确结论是 .②在配错误的概率不超过 0.1%的前提下,认为“爱好该难运动与性别无关”。
③有 99%以上的把握认为“爱好该项运动与性别有关”。
①有 99%以上的把握认为“爱好该项运动与性别无关”。
3.分类型是 X 和Y填序号)进入.5.为了争辩男子的年龄与吸烟的关系,并查了100个男子,按年龄超过和不超过40岁.0烟就有 的把握确定吸烟量与年龄有关。
二、才能提升为了判定上修统计专业是否与性别有关,依据表示的数据,智可能性为 .7.0.2×2列联表中,如哪个数据变为较大的20.认中方们交入课 文的 。
B.以下说法正确选项 .(填序号)00对大事A 与B 的检验无关,即两个大事无不影响. ②大事A 与B 关系越宗热, x 就越大.③义的大小处判定大事 A 与B 是否相关的参一数据. ④如判定两大事 A 与8有关,就 A 发生8确定发生。
9.为争辩某新药的疗效,输无论 “” 。
”4124 46 36 50 ␡ “ “ -- 21 79 400设 H 。
专题19 独立性检验(原卷版)
专题19 独立性检验一、解答题1.(2022·全国·高考真题)一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(2)从该地的人群中任选一人,A表示事件“选到的人卫生习惯不够良好”,B表示事件“选到的人患有该疾病”.(|) (|)P B A P B A 与(|)(|)P B AP B A的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R.(ⅰ)证明:(|)(|)(|)(|)P A B P A BRP A B P A B=⋅;(ⅰ)利用该调查数据,给出(|),(|)P A B P A B的估计值,并利用(ⅰ)的结果给出R的估计值.附22()()()()()n ad bcKa b c d a c b d-=++++,A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.1000.0500.010k 2.706 3.841 6.6353.(2021·全国·高考真题(文))甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++)国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[]0,3,若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如下2×2列联表:前提下认为性别与“是否为‘运动达人’”有关;(2)将此样本的频率估计为总体的概率,随机调查该校的3名男生,设调查的3人中运动达人的人数为随机变量X ,求X 的分布列和数学期望()E X 及方差()D X . 附表及公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.5.(2022·青海·海东市第一中学模拟预测(文))某公司为了解用户对公司生产的产品的满意度做了一次随机调查,共随机选取了100位用户对其产品进行评分.用户对产品评分情况如表所示(已知满分100分,选取的100名用户的评分分值在区间[)70,100上).选取的100名用户中男性用户评分情况:(1)分别估计用户对产品评分分值在,,的概率;(2)若用户评分分值不低于80分,则定位用户对产品满意.填写下面的22⨯列联表,并分析有没有95%以上的把握认为用户对产品满意与否与性别有关?参考公式与数据:22()()()()()n ad-bcKa+b c+d a+c b+d=,n a b c d=+++.100周年,举办一系列活动,通过调查得知其中参加文艺活动与体育活动的居民人数如下表:0.5%的前提下认为参加活动的类型与性别有关?(2)在参加活动的男性居民中,用分层抽样方法抽取7人,再从这7人中随机抽取3人接受采访,记抽到参加文艺活动的人数为X,求X的分布列与期望.附:()()()()2()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.7.(2022·山西大附中三模(文))甲、乙两所学校高三年级分别有1000人,1100人,为了了解两所学校全体高三年级学生高中某学科基础知识测试情况,采用分层抽样方法从两个学校一共抽取了105名学生的该学科成绩,并作出了如下的频数分布统计表,规定考试成绩在[120,150]内为优秀. 甲校:(2)由以上统计数据填写下面2×2列联表,若按是否优秀来判断,是否有97.5%的把握认为两个学校的数学成绩有差异?规定;分数不低于125分为优秀.(1)求本次成绩的众数、中位数;(2)从该班中任意抽取一位学生,求该学生成绩优秀的概率;(3)完成下列22⨯列联表,并判断是否有90%的把握认为学生数学成绩是否优秀与性别有关?附:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.2022年2月4日在北京开幕,本次冬季奥运会共设7个大项,15个分项,109个小项.为调查学生对冬季奥运会项目的了解情况,某大学进行了一次抽样调查,若被调查的男女生人数均为10m (*m ∈N ),统计得到以下22⨯列联表,经过计算可得2 4.040K ≈.(2)为弄清学生不了解冬季奥运会项目的原因,采用分层抽样的方法从抽取的不了解冬季奥运会项目的学生中随机抽取9人,再从这9人中抽取2人进行面对面交流,求“至少抽到一名女生”的概率. 附:独立性检验临界值表(参考公式:()()()()()22n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)10.(2022·吉林·洮南市第一中学模拟预测(文))某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如表:(2)用分层抽样的方法从喜欢统计课程的学生中抽取6名学生做进一步调查,将这6名学生作为一个样本,从中任选2人,求恰有1个男生和1个女生的概率.附:()()()()()22n ad bcKa b c d a c b d-=++++,n a b c d=+++,11.(2022·河南·平顶山市第一高级中学模拟预测(文))2021年10月1日是中华人民共和国第72个国庆日,很多人通过短视频APP或微信、微博表达了对祖国的祝福.某调查机构为了解通过短视频APP或微信、微博表达对祖国祝福的人们是否存在年龄差异,将年龄不低于45岁的人称为中老年,低于45岁的人称为青少年.通过不同途径调查了数千个通过短视频APP或微信、微博表达对祖国祝福的人,并从参与者中随机选出400人.经统计这400人中通过微信、微博表达对祖国祝福的有320人,其中中老年占25,这400人中通过短视频APP表达对祖国祝福的青少年有28人.(1)完成下列22⨯列联表,并判断是否有99.9%的把握认为通过短视频APP或微信、微博表达对祖国的祝福与年龄有关?5人,再从这5人中随机抽取2人,求这2人中恰好有一个是青少年的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.12.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:(1)判断是否有97.5%的把握认为大豆籽粒饱满与播种日期有关?(2)从A ,B 两块实验田中各抽取一份大豆,求抽取的大豆中至少有一份籽粒饱满的概率;(3)用样本估计总体,从A 试验田随机抽取100份(每份千粒)大豆,记籽粒饱满的份数为X ,求X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.数均为()*10n n ∈N ,统计得到以下2×2列联表,经过计算可得2 4.040K ≈.(2)①为弄清学生不喜欢长跑的原因,采用分层抽样的方法从调查的不喜欢长跑的学生中随机抽取9人,再从这9人中抽取3人进行面对面交流,求“至少抽到一名女生”的概率;②将频率视为概率,用样本估计总体,从该校全体学生中随机抽取10人,记其中对长跑喜欢的人数为X,求X的数学期望.附表:附:()()()()()22n ad bcKa b c d a c b d-=++++.14.(2022·四川省泸县第二中学模拟预测(理))中国探月工程自2004年立项以来,聚焦“自主创新、重点跨越、支撑发展、引领未来”的目标,创造了许多项中国首次.2020年12月17日凌晨,嫦娥五号返回器携带“月壤”着陆地球,又首次实现了我国地外天体无人采样返回.为了了解某中学高三学生对此新闻事件的关注程度,从该校高三学生中随机抽取了50名学生进行调查,调查样本中有20名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“嫦娥五号”的部分).“嫦娥五号”的关注程度与性别有关”? (2)若将频率视为概率,现从该中学高三的女生中随机抽取3人.记被抽取的3名女生中对“嫦娥五号”新闻关注的人数为随机变量X ,求X 的分布列及数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)如今大家对运动越来越重视,讨论也越来越多,时常听到有人说“有氧运动”和“无氧运动”,有氧运动主要的作用是健身,而无氧运动主要的作用是塑形,一般的健身计划都是有氧运动配合无氧运动以达到强身健体的目的.某健身机构对其60位会员的健身运动进行了一次调查,统计发现有氧运动为主的有42人,30岁以下无氧运动为主的有12人,占30岁以下调查人数的25. (1)根据以上数据完成如下22⨯列联表;附:参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.16.(2022·四川省宜宾市第四中学校模拟预测(文))为了助力北京2022年冬奥会、冬残奥会,某校组织全校学生参与了奥运会项目知识竞赛. 为了解学生的竞赛成绩(竞赛成绩都在区间[50,100]内)的情况,随机抽取n 名学生的成绩,并将这些成绩按照[50,60),[60,70),[70,80),[80,90),[90,100]分成5组,制成了如图所示的频率分布直方图.其中[50,60),[60,70),[70,80)三组的频率成等比数列,且成绩在[90,100]的有16人.(1)求n 的值;(2)在这n 名学生中,将成绩在[80,100]的学生定义为“冬奥达人”,成绩在[50,80)的学生定义为“非冬奥达人”.请将下面的列联表补充完整,并判断是否有99%的把握认为“是否是冬奥达人与性别有关”?并说明你的理由.参考公式:2()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.临界值表:据《漳州府志》记载,漳州地区在宋代就已经有布袋木偶戏了,清朝中叶后,布袋木偶戏开始进入兴盛时期,一直到抗日战争前,漳州的龙溪、漳浦、海澄、长泰等县,几乎乡乡都有布袋木偶戏,在传承的基础上,不断创新和发展壮大,走向更广阔的世界,为了了解民众对布袋木偶戏的了解程度,某单位随机抽取了漳州地区男女各100名市民,进行问卷调查根据调查结果绘制出得分条形图,如图所示形图,完成22⨯联表,并根据列联表,判断能否有90%的把握认为对布袋木偶戏的了解程度与性别有关?(2)恰逢三八妇女节,该单位对参与调查问卷的女市民制定如下抽奖方案;得分低于60分的可以获得1次抽奖机会,得分不低于60分的可以获得2次抽奖机会,每次抽奖结果相互独立,在一次抽奖中,获得一个木偶纪念品的概率为13,获得两个木偶纪念品的概率为16,不获得木偶纪念品的概率为12,在这100名女市民中任选一人.记X为她获得木偶纪念品的个数,求X的分布列和数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++参考数据.居家隔离期间,人们对社会的依赖,对政府部门的期待也达到了前所未有的高度.某机构对封管区居民对政府部门的态度进行了一项网络调查,并随机抽取了100份问卷进行了成绩统计,得到下表,规定成绩在[]70,100为满意.状相同的4个白球,4个红球的口袋中,一次摸4个球,如果摸到2个红球获得20元话费,摸到3个红球获得50元话费,4个都是红球获得100元话费,某人参加了问卷调查,他获得的话费为X元,求X的分布列及数学期望.附:()()()()()22n ad bcKa b c d a c b d-=++++卫生与健康教育工作的意见》中指出:中小学生各项身体素质有所改善,大学生整体下降.某高校为提高学生身体素质,号召全校学生参加体育锻炼运,结合“微信运动”APP每日统计运动情况,对每日平均运动10000步或以上的学生授予“运动达人”称号,低于10000步称为“参与者”,统计了200名学生在某月的运动数据,结果如下:0.1的前提下认为获得“运动达人”称号与性别有关?(2)从全校运动“参与者”中按性别分层抽取8人,再从8人中选取3人参加特训,将男生人数记为X,求X 的分布列与期望EX.参考公式:()()()()()22n ad bcXa b c d a c b d-=++++,n a b c d=+++.“天宫课堂”第二课在中国空间站开讲,神舟十三号乘组航天员翟志刚、王亚平、叶光富相互配合进行授课,中央广播总台面向全球进行现场直播.此次授课活动采取天地对话方式进行,由航天员在轨演示太空“冰雪”实验、液桥演示实验、水油分离实验、太空抛物实验,介绍与展示空间科学实施,皆在传播普及空间科学知识,激发广大青年不断追寻“科学梦”实现“航天梦”的热情.某校组织在校中学生观看学习“天宫课堂”,并对其中500名学生进行了一次“飞天宇航梦”的调查,得到如下的两个等高条形图,其中被调查的男女学生比例为3:2.(1)求m ,n 的值(结果用分数表示);(2)完成以下表格,并根据表格数据判断能否有97.5%的把握认为学生性别和有飞天宇航梦有关?5人.若从这5人中随机抽取3人进一步调查,求抽到有飞天宇航梦的女生人数X 的分布列及数学期望.附表:()()()()()2,n ad bc K n a b c d a b c d a c b d -==+++++++.。
独立性检验的基本知识点及习题
独立性检验的基本知识点及习题22⨯列联表 随机变量))()()(()(22d b c a d c b a bc ad n K ++++-=. )(2k K P ≥与k 对应值表:)(2k K P ≥0.10 0.05 0.025 0.010 0.005 0.001k 2.706 3.841 5.024 6.635 7.879 10.828一、基础知识梳理1.独立性检验 利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。
2.判断结论成立的可能性的步骤:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。
(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。
二、例题选讲例1.甲乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表优秀 不优秀 总计 甲班 10 35 45 乙班 7 38 45 总计 17 73 90独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少。
解:列联表的条形图如图所示:由图及表直观判断,好像“成绩优秀与班级有关系”;由表中数据计算得K2的观察值为k≈0.653>0.455。
由下表中数据P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001 k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828从而有50%的把握认为“成绩与班级有关系”,即断言“成绩优秀与班级有关系”犯错误的概率为0.5。
例2.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调患病不患病合计吸烟43162205不吸烟13121134合计56283339解:根据列联表中的数据,得。
因为,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟习惯有关。
【知识点解析】配套例题——独立性检验
独立性检验例1 依据小概率值α=0.1的χ2独立性检验,分析例1中的抽样数据,能否据此推断两校学生的数学成绩优秀率有差异?解:零假设为H0:分类变量X与Y相互独立,即两校学生的数学成绩优秀率无差异.根据表8.3-2中的数据,计算得到χ2=()288337103843457117⨯⨯-⨯⨯⨯⨯≈0.837<2.706=x0.1.根据小概率值α=0.1的χ2独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两校的数学成绩优秀率没有差异.例2 某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.解:零假设为H0:疗法与疗效独立,即两种疗法效果没有差异.将所给数据进行整理,得到两种疗法治疗数据的列联表,如表8.3-5所示.表8.3-5单位:人根据列联表中的数据,经计算得到χ2=()21361563526676921115⨯⨯-⨯⨯⨯⨯≈4.881<7.879=x0.005.根据小概率值α=0.005的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为两种疗法效果没有差异.例3 为研究吸烟是否与肺癌有关,某肿瘤研究所采取有放回简单随机抽样的方法,调查了9 965人,得到成对样本观测数据的分类统计结果,如表8.3-6所示.依据小概率值α=0.001的独立性检验,分析吸烟是否会增加患肺癌的风险.表8.3-6单位:人解:零假设为H0:吸烟与患肺癌之间无关联.根据列联表中的数据,经计算得到χ2=()2996577754942209978172148987491⨯⨯-⨯⨯⨯⨯≈56.632>10.828=x0.001.根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为吸烟与患肺癌有关联,此推断犯错误的概率不大于0.001.根据表8.3-6中的数据计算,不吸烟者中不患肺癌和患肺癌的频率分别为7775 7817≈0.994 6和427817≈0.005 4;吸烟者中不患肺癌和患肺癌的频率分别为2099 2148≈0.977 2和492148≈0.022 8.由0.02280.0054≈4.2可见,在被调查者中,吸烟者患肺癌的频率是不吸烟者患肺癌的频率的4倍以上.于是,根据频率稳定于概率的原理,我们可以认为吸烟者患肺癌的概率明显大于不吸烟者患肺癌的概率,即吸烟更容易引发肺癌.。
高二独立性检验知识点总结
高二独立性检验知识点总结独立性检验是统计学中的一种重要方法,用于确定两个或多个变量之间是否存在关联性。
在高二阶段的学习中,独立性检验是一个必不可少的统计学概念。
本文将对高二独立性检验的知识点进行总结,旨在帮助同学们更好地理解和应用该概念。
1. 独立性检验的概念独立性检验用于判断两个分类变量之间是否存在显著关联。
其中,第一个分类变量称为自变量或行变量,第二个分类变量称为因变量或列变量。
独立性检验的目标是确定两个分类变量之间的关联性程度。
2. 卡方检验卡方检验是一种常用的独立性检验方法。
它基于卡方统计量,通过比较实际观察频数与期望频数之间的差异,判断两个分类变量是否独立。
卡方检验可以应用于两个或多个分类变量的关联性检验。
3. 单样本卡方检验单样本卡方检验用于检验一个分类变量在整体上是否符合期望分布。
通过计算观察频数与期望频数之间的差异,判断观察结果是否与期望分布存在显著差异。
单样本卡方检验是独立性检验的基础,可以帮助我们理解和掌握更复杂的卡方检验方法。
4. 独立性卡方检验独立性卡方检验用于判断两个分类变量之间是否存在关联。
它的原假设为两个分类变量独立,备择假设为两个分类变量不独立。
通过计算卡方统计量和查阅卡方分布表,我们可以得出检验结果,确定两个分类变量之间的关联性。
5. 列联表和期望频数独立性检验的前提是我们需要有观察数据和期望数据。
观察数据是指我们实际获得的数据,期望数据是指两个分类变量独立时的理论分布情况。
为了进行独立性检验,我们通常会将观察数据整理成列联表形式,并计算期望频数,以便进行后续分析。
6. 自由度和显著性水平在独立性检验中,自由度是一个重要的概念。
自由度取决于列联表的行数和列数。
自由度的选择会影响卡方统计量的分布。
显著性水平是我们设定的接受或拒绝原假设的临界点。
通常情况下,我们使用0.05的显著性水平作为判断标准。
7. 应用案例独立性检验广泛应用于各个领域,如医学、社会科学、市场调研等。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
专题一、独立性检验题型一、独立事件的判断1、独立事件的定义:对于两个事件A 、B ,如果有P(AB)=P(A)P(B)就称事件A 与B 互相独立,简称A 与B 独立.2、当事件A 与B 独立时,事件A 与B 、A 与B 、A 与B 也独立.【例1】从一副52张扑克牌(不含大小王)中,任意抽一张出来,设事件A :“抽到黑桃”,B: “抽到皇后Q ”,试用P(AB)=P(A)·P(B)验证事件A 与B 及A 与B 是否独立?【变式1】设两个独立事件A 和B 都不发生的概率为19,A 发生B 不发生的概率与B 发生A不发生的概率相同,则事件A 发生的概率P(A)是( )A 、29B 、118C 、13D 、23【变式2】掷一枚硬币,记事件A :“出现正面”,B :“出现反面”,则有( )A 、A 与B 相互独立 B 、P(AB)=P(A)·P(B)C 、A 与B 不相互独立D 、P(AB)=14【变式3】坛子中放有3个白球,2个黑球,从中进行不放回地摸球,用A 表示第一次摸到 白球,B 表示第二次摸到白球,则A 与B 是( )A 、互斥事件B 、相互独立事件C 、对立事件D 、不相互独立事件【变式4】假设生男孩和生女孩是等可能的,设事件A 为“一个家庭中既有男孩,又有女 孩”, 事件B 为“一个家庭中最多有一个女孩”.某一家庭有三个小孩,则事 件A 与 B 是否独立?【变式5】(1)甲、乙两名射手同时向一目标射击,设事件A :“甲击中目标”,事件B : “乙击中目标”,则事件A 与事件B ( ) A 、相互独立但不互斥B 、互斥但不相互独立C 、相互独立且互斥D 、既不相互独立也不互斥(2)掷一颗骰子一次,设事件A :“出现偶数点”,事件B :“出现3点或6点”, 则事 件A ,B 的关系是( )A 、互斥但不相互独立B 、相互独立但不互斥C 、互斥且相互独立D 、既不相互独立也不互斥题型二、独立性检验1、2×2列联表判断两个事件A 、B 是否有关,我们可以把A 发生、A 不发生(A )、B 发生、B 不发生(B )注意:(1)作独立性检验时,要求2×2列联表中的4个数据都要大于等于5。
(2)对于同一样本|11n 22n -12n 21n |越大,说明A 与B 之间的关系越强,反之越弱。
2、统计量K 2(读作“卡方”)21212211222112)(++++-=n n n n n n n n n K 用它的大小可以判断事件A ,B 是否有关。
3、独立性检验思想(1)用H 0表示事件A 与B 独立的决定式,即H 0:P(AB)=P(A)P(B),称H 0为统计假设。
(2)用K 2与其临界值3.841与6.635的大小关系来决定是否拒绝统计假设H 0,如表:【例2】某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是()。
A、成绩B、视力C、智商D、阅读量【变式1】假设两个分类变量X与Y,它们的取值分别为{x1,x2},{y1,y2},其2×2列联表如图所示:对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()Y1Y2总计X1a b a+bX2c d c+d总计a+c b+d a+b+c+dA、a=5,b=4,c=3,d=2B、a=5,b=3,c=2,d=4C、a=5,b=2,c=4,d=3D、a=2,b=3,c=5,d=4【变式2】某防疫站对屠宰场及肉食零售点的猪肉检查沙门氏菌带菌情况,结果如下表,试检验屠宰场与零售点猪肉带菌率有无差异.【变式3】为观察药物A、B治疗某病的疗效,某医生将100例该病病人随机地分成两组,一组40人,服用A药;另一组60人,服用B药.结果发现:服用A药的40人中有30人治愈;服用B药的60人中有11人治愈.问A、B两药对该病的治愈率之间是否有显著差别?【变式4】有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10 b乙班 c 30总计105 已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是()A、列联表中c的值为30,b的值为35B、列联表中c的值为15,b的值为50C、根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D、根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”【变式5】在一次对性别与是否说谎的调查中,得到如下数据,根据表中数据得到如下结论中正确的是()说谎不说谎合计男 6 7 13女8 9 17合计14 16 30A 、在此次调查中有95%的把握认为是否说谎与性别有关B 、在此次调查中有99%的把握认为是否说谎与性别有关C 、在此次调查中有99.5%的把握认为是否说谎与性别有关D 、在此次调查中没有充分证据显示说谎与性别有关【变式6】为了调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力() A 、平均数 B 、方差 C 、回归分析 D 、独立性检验【变式7】某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生 人数的21,男生喜欢韩剧的人数占男生人数的61,女生喜欢韩剧的人数占女生人 数的32.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关, 则男生至少有多少人?题型三、独立性检验思想的综合应用(Ⅰ)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;分析:(Ⅰ)根据表中数据,利用公式,即可得出结论;(Ⅱ)利用古典概型概率公式,即可求解.【变式1】某高校共有学生15 000人,其中男生10 500人,女生4500人.为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图,其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.P(K2≥k0) 0.10 0.05 0.010 0.005 K0 2.706 3.841 6.635 7.879(Ⅱ)由列联表中所得数据,是否有99.9%的把握认为“经常使用微信与年龄有关”? (Ⅲ)采用分层抽样的方法从“经常使用微信”中抽取6人,从这6人中任选2人,求事件A乙厂的零件内径尺寸:(Ⅰ)由以上统计数据填下面2×2列联表,并问是否有99.9%的把握认为“生产的零件是否为优质品与在不同分厂生产有关”;附:))()()(()(22d b d c c a b a bc ad n k ++++-=(Ⅱ)现用分层抽样方法(按优质品和非优质品分两层)从乙厂中抽取5件零件,求从这5件零件中任意取出2件,至少有1件非优质品的概率。
达标训练1、事件A、B相互独立,下列四个式子①P(AB)=P(A)·P(B) ②P(A B)=P(A)·P(B)③P(A B)=P(A)·P(B) ④P(A B)=P(A)·P(B)其中正确的有( )个A、1B、2C、3D、42、某甲上大学前把手机号码抄给同学乙.后来同学乙给他打电话时,发现号码的最后一个数字被撕掉了,于是乙在拨号时随意地添上最后一个数字,且用过了的数字不再重复,则拨号不超过2次而拨对甲的手机号码的概率是( )A、310B、15C、110D、133、在2×2列联表中,四个变量的取值n11,n12,n21,n22应是( )A、任意实数B、正整数C、不小于5的整数D、非负整数4、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )A、若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B、从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病C、若从χ2统计量中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D、以上三种说法都不正确5、对于分类变量A与B的统计量χ2,下列说法正确的是( )A、χ2越大,说明“A与B有关系”的可信度越小B、χ2越大,说明“A与B无关”的程度越大C、χ2越小,说明“A与B有关系”的可信度越小D、χ2接近于0,说明“A与B无关”的程度越小6、在使用独立性检验时,下列说法正确的个数为______.①对事件A与B的检验无关时,两个事件互不影响;②事件A与B关系越密切,则χ2就越大;③χ2的大小是判定事件A与B是否相关的唯一根据;④若判定两事件A与B 有关,则A发生B一定发生.7计算χ2≈_____,这种判断出错的可能性为___.8、在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并有99%以上的把握认为这个结论是成立的,下列说法中正确的是( )A、100个吸烟者中至少有99个患有肺癌B、1个人吸烟,那么这个人一定患有肺癌C、在100个吸烟者中一定有患肺癌的人D、在100个吸烟者中可能一个患肺癌的人也没有9、假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其2×2列联表为:( )A、a=5,b=4,c=3,d=2B、a=5,b=3,c=4,d=2C、a=2,b=3,c=4,d=5D、a=2,b=3,c=5,d=410、有2×2列联表如下:211、在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.请用独立性检验方法判断秃顶与患心脏病是否有关系?12、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外的27人主要的休闲方式是运动;男性中21人主要的休闲方式是看电视,另外的33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)判断性别与休闲方式是否有关系.。