高中数学 8_4 列联表独立性分析案例同步精练 湘教版选修2-31
【优化方案】2021-2021学年高中数学 第8章8.4知能演练轻松闯关 湘教版选修2-3(1)
【优化方案】2021-2021学年高中数学 第8章知能演练轻松闯关 湘教版选修2-31.下面是一个2×2列联表:y 1y 2 总计 x 1 a21 73 x 2825 33 总计b46那么表中a 、b 处的值别离为( ) A .94、96 B .52、50 C .5二、60D .54、52解析:选C.∵a +21=73,∴a =52, ∴b =a +8=52+8=60.2.(2021·巫山检测)在调查中发觉480名男人中有38名患有色盲,520名女人中有6名患有色盲.以下说法正确的选项是( )A .男人、女人中患色盲的频率别离为和B .男、女患色盲的概率别离为19240、3260C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关解析:选C.男人患色盲的比例为38480,女人中患色盲的比例为6520,其差值为|38480-6520|≈,差值较大,故能说明患色盲与性别是有关的.3.(2021·梁平调研)以下关于独立性分析的说法中,错误的选项是( ) A .独立性分析依托小概率原理B.独立性分析取得的结论必然正确C.样本不同,独立性分析的结论可能有不同D.独立性分析不是判定两事物是不是相关的唯一方式解析:选B.独立性分析,只是在必然的可信度下进行判定,不必然正确.4.若是χ2的值为,能够以为“X与Y无关”的可信度是________.解析:查表可知可信度为1%.答案:1%一、选择题1.给出以下实际问题①一种药物对某种病的治愈率;②两种药物医治同一种病是不是有区别;③抽烟者得肺病的概率;④抽烟人群是不是与性别有关系;⑤网吧与青青年犯法是不是有关系.其顶用独立性分析能够解决的问题有( )A.①②③B.②④⑤C.②③④⑤D.①②③④⑤答案:B2.在抽烟与患肺病这两个分类变量的独立性分析的计算中,以下说法正确的选项是( ) A.若χ2的值为,那么咱们能在犯错误的概率不超过的前提下以为抽烟与患肺病有关系,那么在100个抽烟的人中必有99人患有肺病B.从独立性分析的计算中求出能在犯错误的概率不超过的前提下以为抽烟与患肺病的关系时,咱们以为若是某人抽烟,那么他有99%的可能患有肺病C.假设从统计量中求出能在犯错误的概率不超过的前提下以为抽烟与患肺病有关系,是指有5%的可能性使得推断显现错误D .以上三种说法都不正确 答案:C3.某市政府在调查市民收入增减与旅行愿望的关系时,采纳独立性分析法抽查了3000人,计算发觉χ2=,依照这一数据可知,市政府断言市民收入增减与旅行愿望有关系,这一断言错误的概率不超过( ) A . B . C . D .答案:B4.(2021·云阳调研)某调查机构调查教师工作压力大小的情形,部份数据如表:喜欢教师职业 不喜欢教师职业 总计 认为工作压力大 50 37 87 认为工作压力不大 12 1 13 总计6238100那么推断“工作压力大与不喜爱教师职业有关系”,这种推断错误的概率不超过( ) A . B . C .D .解析:选B.χ2=100×(50×1-37×12)287×13×62×38≈>.5.考察棉花种子通过处置跟生病之间的关系取得下表数据:种子处理 种子未处理 总计 得病 32 101 133 不得病61213274依照以上数据,可得出( )A .种子是不是通过处理跟是不是生病有关B .种子是不是通过处置跟是不是生病无关C .种子是不是通过处置决定是不是生病D .以上都是错误的解析:选B.由χ2=407×(32×213-61×101)293×314×133×274≈<,即没有把握以为是否通过处置跟是不是生病有关.6.利用独立性分析来考察两个分类变量X 和Y 是不是有关系时,通过查阅下表来确信“X 与Y 有关系”的可信程度.P (χ2≥x 0) x 0 P (χ2≥x 0) x 0若是χ2≥,那么就有把握以为“X 与Y 有关系”的百分比为( ) A .25% B .75% C .%D .%解析:选=对应的是“X 与Y 有关系”不合理的程度,因此两个分类变量有关系的可信程度约为%. 二、填空题7.(2021·大足调研)以下是关于诞生男婴与女婴调查的列联表:晚上白天总计女婴 E35 C总计98D180那么A =________,B =________,C =________,D =________,E =________. 解析:由题意知,⎩⎪⎨⎪⎧45+A =B E +35=C E +45=98A +35=D 98+D =180,解得⎩⎪⎨⎪⎧A =47B =92C =88D =82E =53.答案:47 92 88 82 538.依照下表,计算χ2≈________.(保留两位小数)又发病 未发病 作移植手术 39 157 未作移植手术29167解析:χ2=(39+29+157+167)(39×167-29×157)2(39+157)×(29+167)×(39+29)×(157+167)≈. 答案:9.有2×2列联表:BB -总计 A 54 40 94 A32 63 95 总计86103189由上表可计算χ2≈________.(小数点后保留三位有效数字)解析:χ2=189(32×40-54×63)286×103×94×95≈.答案:三、解答题10.某聋哑研究机构,对聋与哑是不是有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得出相应结论吗?请运用独立性分析进行判定.解:能,依照题目所给数据取得如以下联表:哑不哑总计聋416241657不聋249431680总计6656721337假设“聋与哑无关”,依照列联表中数据得χ2=1337×(416×431-241×249)2657×680×665×672≈>.因此拒绝假设,因此在犯错误的概率不超过的前提下以为聋与哑有关系.11.(2021·巫山质检)为了调查胃病是不是与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)依照以上数据列出2×2列联表;(2)在犯错误的概率不超过的前提下以为40岁以上的人患病与否和生活规律有关系吗?什么缘故?解:(1)由已知可列2×2列联表:患胃病未患胃病总计(2)依照列联表中的数据,由计算公式得χ2值为 χ2=540×(20×260-200×60)2220×320×80×460≈.∵>,因此,在犯错误的概率不超过的前提下以为40岁以上的人患胃病与否和生活规律有关. 12.(创新题)为了解某班学生喜爱打篮球是不是与性别有关,对本班50人进行了问卷调查取得了如下的列联表:已知在全数50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是不是有%的把握以为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n (n 11·n 22-n 12·n 21)2n 1+n 2+n +1n +2.解:(1)列联表补充如下:(2)∵χ2=50×(20×15-10×5)230×20×25×25≈>,∴有%的把握以为喜爱打篮球与性别有关.。
高中数学选择性必修三 精讲精炼 8 列联表及独立性检验(精练)(含答案)
8.3 列联表及独立性检验(精练)【题组一独立性检验的辨析】1.(2021·全国·高二单元测试)给出下列实际问题,其中不可以用独立性检验解决的是( )A.喜欢参加体育锻炼与性别是否有关B.喝酒者得胃病的概率C.喜欢喝酒与性别是否有关D.学习成绩与上网成瘾是否有关【答案】B【解析】独立性检验主要是对随机事件是否有关进行检验,而B所描述的某种条件概率问题.故选:B.2(2021·全国·高二单元测试)2020年9月22日是第三个“中国农民丰收节”,全国处处五谷丰登、瓜果飘香,四川某地也是“小小花椒树种出致富路”!为更好提高花椒等级,该地组织了一次关于花椒田间种植技术学习时长的调查,随机收集了150户种植户的统计数据,以此研究种植户参与田间种植技术学习的时长和花椒等级的关系.则认为种植户参与田间种植技术学习时长和花椒等级有关的把握为( )参考公式:22()()()()()n ad bca b c d a c b dχ-=++++,A.90% B.95% C.99% D.99.9% 【答案】D【解析】由题知,()22150********18.7510.8281005012030χ⨯⨯-⨯==>⨯⨯⨯,故有99.9%的把握认为种植户参与田间种植技术学习时长和花椒等级有关.故选:D.3.(2021·全国·高二课时练习)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22⨯列联表:由2()()()()()n ad bca b c d a c b dχ-=++++算得,22110(40302020)7.860506050χ⨯⨯-⨯=≈⨯⨯⨯.附表:参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”;B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”;C.有99%以上的把握认为“爱好该项运动与性别有关”;D.有99%以上的把握认为“爱好该项运动与性别无关”.【答案】C【解析】由22110(40302020)7.8 6.63560506050χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99%以上的把握认为“爱好该项运动与性别有关.故选:C.4.(2021·全国·高二课时练习)下面的等高条形图可以说明的问题是( )A.“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响是绝对不同的B .“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响没有什么不同C .此等高条形图看不出两种手术有什么不同的地方D .“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握 【答案】D【解析】由等高条形图可知“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的频率不同, 所以“心脏搭桥”手术和“血管清障”手术对“诱发心脏病”的影响在某种程度上是不同的,但是没有100%的把握,所以选项D 正确,故选:D.5.(2021·全国·高二课时练习)(多选)下列说法正确的是( ) A .回归直线过样本点的中心(),x yB .两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1C .对分类变量X 与Y ,随机变量2χ的观测值k 越大,则判断“X 与Y 有关系”的把握程度越小D .在回归直线方程ˆ0.20.8y x =+中,当解释变量x 每增加1个单位时,预报变量ˆy 平均增加0.2个单位 【答案】ABD【解析】根据相关定义分析知A ,B ,D 正确;对分类变量X 与Y ,随机变量2χ的观测值k 越大,则判断“X 与Y 有关系”的把握程度越大,故C 错误.故选:ABD.6.(2021·全国·高二单元测试)(多选)在检验X 与Y 是否有关的过程中,()26.6350.01P χ≥=表示的意义是( )A .有99%的把握认为X 与Y 没有关系B .有1%的把握认为X 与Y 有关系C .有99%的把握认为X 与Y 有关系D .在犯错误的概率不超过1%的前提下,可以认为X 与Y 有关系 【答案】CD【解析】在独立性检验中,()26.6350.01P χ≥=表示的意义是:在犯错误的概率不超过1%的前提下,可以认为X 与Y 有关系,即有99%的把握认为X 与Y 有关系,所以C ,D 正确.故选:CD.7.(2021·全国·高二课时练习)在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算27.63χ=,根据这一数据分析,有___________的把握说,打鼾与患心脏病是___________的. 下面的临界值表供参考:【答案】99% 有关χ=>,∴有99%的把握说,打鼾与患心脏病是有关的.故答案为: 99%,有关【解析】27.63 6.63510.(2021·全国·高二课时练习)在吸烟与患肺病是否相关的判断中,有下面的说法:χ>,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟①若2 6.635的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是___________.【答案】③χ>,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,是【解析】对于①,若2 6.635指有99%的把握认为这个推理是正确的,有1%的人可能认为推理出理错误,并不是说在100人中必有99人患有肺病,所以①错误,对于②,从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,是指有99%的把握认为这个推理是正确的,有1%的人可能认为推理出理错误,并不是某人吸烟,则他有99%的可能患有肺病,所以②错误,对于③,从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误,所以③正确,故答案为:③【题组二独立性检验性的应用】1.(2021·全国·高二单元测试)在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主. (1)根据以上数据建立一个22⨯的列联表; (2)判断人的饮食习惯是否与年龄有关. 附表及公式:()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++,临界值表:【答案】(1)列联表见解析;(2)有97.5%的把握认为“人的饮食习惯与年龄有关”. 【解析】(1)22⨯列联表如下:(2)提出统计假设0:H 人的饮食习惯与年龄无关,则22124(43332721) 6.20170546460χ⨯-⨯=≈⨯⨯⨯当统计假设0H 成立时,2 5.024χ≥的概率约为2.5%, 即有97.5%的把握认为“人的饮食习惯与年龄有关”.2.(2021·全国·高二课时练习)单位:人对列联表中的数据,依据0.1α=的独立性检验,我们已经知道独立性检验的结论是学校和成绩无关.如果表中所有数据都扩大为原来的10倍,在相同的检验标准下,再用独立性检验推断学校和数学成绩之间的关联性,结论还一样吗?请你试着解释其中的原因. 附:临界值表:【答案】答案见解析【解析】数据扩大10倍的22⨯列联表为:假设0:H 学校与数学成绩无关,由列联表数据得()22880330703801008.365 2.706430450710170χ⨯⨯-⨯=≈>⨯⨯⨯,根据小概率值0.1α=的独立性检验,我们推断假设0H 不成立,即认为学校与数学成绩有关, 又因为甲校成绩优秀和不优秀的概率分别为1000.2326430≈,3300.7674430≈, 乙校成绩优秀和不优秀的概率分别为700.1556450≈,3800.8444450≈, 又因为0.23260.1556>,所以,从甲校、乙校各抽取一个学生,甲校学生数学成绩优秀的概率比乙校学生优秀的概率大.所以,结论不一样,不一样的原因在于样本容量, 当样本容量越大时,用样本估计总体的准确性会越高.3.(2021·新疆·阜康市第一中学高二期中(文))大型综艺节目《最强大脑》中,有一个游戏叫做盲拧魔方,就是玩家先观察魔方状态并进行记忆,记住后蒙住眼睛快速还原魔方.根据调查显示,是否喜欢盲拧魔方与性别有关.为了验证这个结论,某兴趣小组随机抽取了50名魔方爱好者进行调查,得到如下表所示的22⨯列联表:(1)将22⨯列联表补充完整;(2)并判断是否有97.5%的把握认为是否喜欢盲拧与性别有关? 参考公式及数据:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(1)列联表见解析 (2)有 【解析】(1)根据题意补充22⨯列联表如下:(2)由(1)中表格数据可得:()2243023502.0311*******>5.1802K ⨯⨯⨯⨯=⨯-⨯≈所以在犯错误的概率不超过0.025的前提下,有97.5%的把握认为是否喜欢盲拧与性别有关.4.(2021·新疆·新源县第二中学高二期末(文))为探索课堂教学改革,某中学数学老师用“传统教学”和“三学课堂”两种教学方式分别在甲、乙两个平行班进行教学实验.为了解教学效果,期末考试后,分别从两个班级各随机抽取20名学生的成绩进行统计,得到如下茎叶图.记成绩不低于70分者为“成绩优良”.(1)请大致判断哪种教学方式的教学效果更佳,并说明理由;(2)构造一个教学方式与成绩优良的22⨯列联表,并判断能否在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.参考公式:()()()()()22n ad bcKa cb d a bc d-=++++参考数据:【答案】(1)“三学课堂”教学方式教学效果更佳;理由见解析;(2)列联表见解析;能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.【解析】解:(1)“三学课堂”教学方式教学效果更佳.理由1:乙班样本数学成绩大多在70分以上,甲班样本数学成绩70分以下的明显更多.理由2:甲班样本数学成绩的平均分为70.2;乙班样本数学成绩的平均分为79.05.理由3:甲班样本数学成绩的中位数为6872702+=,乙班样本数学成绩的中位数为777877.52+=.(2)22⨯列联表如下:由上表数据可得()22401041016 3.956 3.84120202614K ⨯⨯-⨯=≈>⨯⨯⨯,所以能在犯错误的概率不超过0.05的前提下认为“成绩优良与教学方式有关”.5.(2021·河南·高二期末(理))市教育局举办了全市高中生关于创建文明城市的知识竞赛(满分120分),规定竞赛成绩不低于90分的为优秀,低于90分的为非优秀.为了解竞赛成绩与学生课外阅读量之间的关系,某研究机构随机抽取了参加竞赛的60名高中生,通过问卷调查,得到以下数据:(1)能否有99.5%的把握认为课外阅读量与本次竞赛的成绩优秀有关?(2)若参加这次竞赛的高中生共有20000名,参赛学生的竞赛成绩()~90,100N ξ,试估计竞赛成绩大于110分的学生大约有多少人?参考公式及数据:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()2~,N ξμσ时,() 0.6826P μσξμσ-<≤+=,()220.9544P μσξμσ-<≤+=.【答案】(1)有99.5%的把握认为课外阅读量与本次竞赛的成绩优秀有关;(2)456人. 【解析】(1)∵()()()()()()2226022208101359.6437.8793030322814n ad bc K a b c d a c b d -⨯-⨯===≈>++++⨯⨯⨯, ∴有99.5%的把握认为课外阅读量与本次竞赛的成绩优秀有关.(2)由()~90,100N ξ,知:90μ=,10σ=. ∴()()()111021220.02282P P P ξξμσμσξμσ>=>+=--<≤+=⎡⎤⎣⎦,故竞赛成绩大于110分的学生约有200000.0228456⨯=,∴估计竞赛成绩大于110分的学生大约有456人.6.(2021·全国·高二课时练习)某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试的成绩(百分制)如下表所示:若数学成绩90分(含90分)以上为优秀,物理成绩85分(含85分)以上为优秀. (1)根据上表完成下面的22⨯列联表(2)根据题(1)中表格的数据计算,有多少的把握认为学生的数学成绩与物理成绩之间有关系? 附:①独立性检验临界值表:②独立性检验统计量2x 值的计算公式:()22()()()()n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)列联表见解析;(2)有99.5%的把握认为学生的数学成绩与物理成绩之间有关系【解析】(1)根据表格中的数据,可得如下的22⨯列联表:(2)根据上述列联表可以求得()()22220512128.8027.879()()()()614713n ad bca b c d a c b dχ-⨯⨯-⨯==≈> ++++⨯⨯⨯,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.7.(2021·全国·高二课时练习)某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试的成绩(百分制)如下表所示:若数学成绩90分(含90分)以上为优秀,物理成绩85分(含85分)以上为优秀.(1)根据上表完成下面的2×2列联表:(2)根据题(1)中表格的数据计算,有多少的把握认为学生的数学成绩与物理成绩之间有关系?附:①独立性检验临界值表:②独立性检验统计量2χ值的计算公式:()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.【答案】(1)填表见解析 ;(2) 有99.5%的把握认为学生的数学成绩与物理成绩之间有关系. 【解析】【解】(1)2×2列联表为(2)根据上述列联表可以求得()2220512128.8027.879614713χ⨯⨯-⨯=≈>⨯⨯⨯,所以有99.5%的把握认为学生的数学成绩与物理成绩之间有关系.8.(2021·全国·高二课时练习)某市为了解小区成年居民对环境治理情况的满意度(满分按100计),随机对20位六十岁及以上和20位十八岁以上六十岁以下的居民进行了不记名的问卷调查,得到了如下统计结果:表1六十岁及以上的居民对环境治理情况满意度的统计结果表2十八岁以上六十岁以下的居民对环境治理情况满意度的统计结果表3(1)若该小区共有十八岁以上六十岁以下的居民500人,试估计其中满意度不少于80的人数;(2)完成表3的22⨯列联表,并回答能否有90%的把握认为小区成年居民对环境治理情况的满意度与年龄有关;(3)从表3的六十岁及以上的居民满意度小于80和满意度不小于80的人数中用分层抽样的方法抽取一个容量为5的样本,再从中任取3人,求这3人中至少有2人满意度小于80的概率.参考公式:22()()()()()n ad bca b c d a c b dχ-=++++(其中n a b c d=+++),参考数据:【答案】(1)150 ;(2)填表见解析;没有;(3)7 10.【解析】(1)根据表2中的数据,知20人中满意度不少于80的人数为6,所以该小区十八岁以上六十岁以下的500位居民中,满意度不少于80的人数约为6 50015020⨯=(2)表3的22⨯列联表补充如下:由表中数据可得2240(126148)0.440 2.70620202614χ⨯⨯-⨯=≈<⨯⨯⨯,所以没有90%的把握认为小区成年居民对环境治理情况的满意度与年龄有关.(3)由(2)中表3的数据,知用分层抽样的方法抽取一个容量为5的样本,其中满意度小于80的应抽取3人,满意度不小于80的应抽取2人,故所求的概率21332335710C C C P C +==. 9.(2021·重庆·高二月考)数字人民币是由央行发行的法定数字货币,它由指定运营机构参与运营并向公众兑换,与纸钞和硬币等价.截至2021年6月30日,数字人民币试点场景已超132万个,覆盖生活缴费、餐饮服务、交通出行、购物消费、政务服务等领域.为了进一步了解普通大众对数字人民币的感知以及接受情况,某机构进行了-次问卷调查,部分结果如下:(1)如果将高中及高中以下的学历称为“低学历”,大学专科及以上学历称为“高学历”,根据所给数据,完成下面的22⨯列联表; (2)若从低学历的被调查者中,按对数字人民币的了解程度用分层抽样的方法抽取8人,然后从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率; (3)根据列联表,判断是否有95%的把握认为“是否了解数字人民币”与“学历高低”有关?附:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(1)列联表答案见解析;(2)914;(3)没有95%的把握认为“是否了解数字人民币”与“学历高低”有关.【解析】(1)22⨯列联表如下:(2)从低学历被调查者中按对数字人民币的了解程度用分层抽样的方法抽取8人,抽取的8人中,不了解数字人民币的有81503400⨯=人, 了解数字人民币的有82505400⨯=人, 从这8人中抽取2人进行进一步调查,求被选中的2人中至少有1人对数字人民币不了解的概率2528C 91C 14P =-=.(3)根据列联表得()22800125250150275800 3.463 3.841275525400400231K ⨯⨯-⨯==≈<⨯⨯⨯.故没有95%的把握认为“是否了解数字人民币”与“学历高低”有关. 【题组三 独立性检验与其他知识的综合运用】1.(2021·宁夏·海原县第一中学 )电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的22⨯列联表,并据此资料你是否有95%的把握认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列,期望()E X 和方差()D X .附:()()()()()22n ad bc a b c d a c b d χ-=++++,【答案】(1)没有95%的把握认为“体育迷”与性别有关;(2)分布列见解析;()34E X =,()916D X =. 【解析】(1)由频率分布直方图可得100名观众中体育迷的人数为()1000.020.0051025+⨯=,故男性中体育迷为15人,故可得22⨯列联表如下:所以()221001003.841455575253010543135χ-==<⨯⨯⨯⨯⨯,故没有95%的把握认为“体育迷”与性别有关. (2)由(1)可得任取一人为体育迷的概率为2511004=, 故13,4X B ⎛⎫~ ⎪⎝⎭,所以()0303132704464P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()12131********P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()212313924464P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()303313134464P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭.故分布列为:又()13344E X =⨯=,()13934416D X =⨯⨯=.2.(2021·全国·高二课时练习) 2020年寒假是特殊的寒假,因为抗击疫情全体学生只能在家进行网上在线学习.为了研究学生在网上学习的情况,某学校在网上随机抽取120名学生对线上教育进行调查,其中男生与女生的人数之比为11:13,其中男生中有30名表示对线上教育满意,女生中有15名表示对线上教育不满.(1)完成2×2列联表,依据小概率值0.01α=的独立性检验,能否认为对线上教育是否满意与性别有关?(2)从被调查的对线上教育满意的学生中,利用分层抽样抽取8名学生,再从这8名学生中抽取3名学生,作线上学习的经验分享,其中抽取男生的人数为ξ,求出ξ的分布列及数学期望. 附:()()()()()22n ad bc a b c d a c b d χ-=++++,n a b c d =+++.【答案】(1)填表见解析;可以认为对线上教育是否满意与性别有关 ;(2)分布列见解析;期望为98.【解析】(1)男生人数为11120551113⨯=+,女生人数为120-55=65, 所以2×2列联表如下:令假设为0H :对线上教育是否满意与性别无关. 根据列联表中的数据,得到:()2212030152550960 6.713 6.63555658040143χ⨯⨯-⨯==≈>⨯⨯⨯,根据0.01α=的独立性检验,我们可以推断0H 不成立,即认为对线上教育是否满意与性别有关,该推断犯错误的概率不超过0.01; (2)由(1)可知男生抽取3人,女生抽取5人.依题可知ξ的所有可能取值为0,1,2,3,并且ξ服从超几何分布.则()35385028C P C ξ===,()21533815128C C P C ξ===,()23138515256C C P C ξ===,()33381356C P C ξ===.可得ξ的分布列为所以()51515190123282856568E ξ=⨯+⨯+⨯+⨯=. 3(2021·江苏连云港·高二月考)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.下表是某市一主干道路口监控设备所抓拍的5个月内驾驶员不“礼让行人”行为统计数据:(1)由表中看出,可用线性回归模型拟合违章人次y 与月份x 之间的关系,求y 关于x 的回归直线方程ˆˆˆybx a =+,并预测该路口9月份不“礼让行人”的违章驾驶人次; (2)交警从这5个月内通过该路口的驾驶员中随机抽査70人,调査驾驶员不“礼让行人”行为与驾龄的关系,得到下表:能否据此判断有90%的把握认为“礼让行人”行为与驾龄有关?附:1221ˆni ii nii x ynx y bxnx ==-⋅=-∑∑,ˆˆa y bx =-,()()()()()22n ad bc K ab c d a c b d -=++++(其中n a b c d =+++).【答案】(1)ˆ9127=-+yx ,46人次;(2)没有90%的把握认为“礼让行人”行为与驾龄有关. 【解析】(1)由表中的数据可得:1234535x ++++==,12010510095801005y ++++==, 1221514101500ˆ955455ni ii nii x y xybxx ==--∴===---∑∑,()ˆˆ10093127a y bx ∴=-=--⨯=, ∴所求的回归直线方程为ˆ9127=-+yx ; 令9x =,则ˆ9912746=-⨯+=y, 即该路口9月份不“礼让行人”的违章驾驶人次预测为46人次; (2)由表中的数据可得:()227024141616140.311 2.7064030403045K ⨯⨯-⨯==≈<⨯⨯⨯, 根据临界值可得:没有90%的把握认为“礼让行人”行为与驾龄有关.4.(2021·贵州省思南中学 )为了打赢脱贫攻坚战,某地大力扶持小龙虾养殖产业.为了解小龙虾的养殖面积(亩)与年利润的关系,统计了6个养殖户,并对当年利润情况统计后得到如下的数据表:由所给数据可知年利润y 与养殖面积x 具有线性相关关系.(1)求y 关于x 的线性回归方程(结果保留三位小数),并估计当养殖面积为15亩时年利润是多少; (2)为提高收益,稻虾生态种养(在稻田里种植水稻的同时养殖龙虾)是一种常见的形式,为研究小龙虾养殖密度(每亩放养小龙虾的尾数)对年利润的影响,对这6个养殖户养殖情况进行统计得到50组数据,制作2×2列联表如上表.完成上表,判断是否有95%的把握认为年利润的高低与“养殖密度”有关?附:参考公式及部分数据:61211.1i i i x y ==∑,621559i i x ==∑,1221ni i i n i i x y nxy b x nx Λ==-=-∑∑,ˆˆa y bx =-.()()()()()22n ad bc K a b c d a c b d -=++++其中n a b c d =+++.【答案】(1)线性回归方程为0.663 2.799y x =-,当养殖面积为15亩时,年利润约为7.1万元;(2)列联表答案见解析,有95%的把握认为年利润的高低与“养殖密度”有关. 【解析】解:(1)7891011129.56x +++++==, 1.9 2.3 3.3 3.8 4.5.5673y +++++==2211.169.5 3.511.60.66355969.517.5b -⨯⨯∴==≈-⨯3.50.6639.5 2.799a =-⨯≈-,∴线性回归方程为0.663 2.799y x =-当15x =时,0.66315 2.7997.1y =⨯-≈(万元), 即当养殖面积为15亩时,年利润约为7.1万元 (2)将2×2列联表补充完整如下:2250(313277) 4.688 3.84110402030K ⨯-⨯=≈>⨯⨯⨯因此有95%的把握认为年利润的高低与“养殖密度”有关.5.(2021·江苏启东·高二期中)机动车行经人行横道时,应当减速慢行;遇行人正在通过人行横道,应当停车让行,俗称“礼让行人”.如表是某市一主干道路口监控设备所抓拍的5个月内驾驶员不“礼让行人”行为统计数据:(1)由表中看出,可用线性回归模型拟合违章人次y 与月份x 之间的关系,求y 关于x 的回归方程ˆˆˆybxa =+,并预测该路口9月份不“礼让行人”违规驾驶人次;(2)交警从这5个月内通过该路口的驾驶员中随机抽查90人,调查驾驶员不“礼让行人”行为与驾龄的关系,得到如表: 能否据此判断有90%的把握认为“礼让行人”行为与驾龄有关?并用一句话谈谈你对结论判断的体会.附:()()()1122211ˆnnii i ii i nniii i xx y y x ynx ybx x xnx ====---==--∑∑∑∑,ˆˆay bx =-. 22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)10.5131.5y x =-+,预测该路口9月份不“礼让行人”违规驾驶人次为37;(2)没有90%的把握认为“礼让行人”行为与驾龄有关,体会答案见解析. 【解析】解:(1)1234535x ++++==,12510510090801005y ++++==, 511395i i i x y ==∑,52155i i x ==∑,所以13955300ˆ10.55545b-⨯==--,ˆ100(10.5)3131.5a=--⨯=, 所以10.5131.5y x =-+.所以当9x =时,10.59131.537y =-⨯+=,即预测该路口9月份不“礼让行人”违规驾驶人次为37.(2)由题意,得22⨯列联表为:所以()222902616240.576 2.70650405040K⨯-==<⨯⨯⨯,所以没有90%的把握认为“礼让行人”行为与驾龄有关.结果说明,目前驾驶员不“礼让行人”的违规驾驶还比较多,要加大宣全力度,必要时加大处罚力度,共创和谐社会.6.(2021·江苏省如皋中学高二月考)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力贫困地区农民脱贫增收.某贫困地区有统计数据显示,2020年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示.若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6或6以上的称为“经常使用直播销售用户”,使用次数为5或不足5的称为“不常使用直播销售用户”,则“经常使用直播销售用户”中有56是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成22⨯列联表,并根据列联表判断是否有85%的把握认为是否经常使用网络直播销售与年龄有关?(2)某投资公司在2021年年初准备将1000元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售.根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不赔不赚,且这三种情况发生的概率分别为710,15,110; 方案二:线上直播销售.根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,可能不赔不赚,且这三种情况发生的概率分别为35,310,110.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由. 附:其中:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】(1)表格见解析,有;(2)答案见解析.【解析】(1)由图2知,样本中经常使用直播销售的用户有()301%192%107%200120++⨯=...人,其中年轻人有51201006⨯=人,由图1知,样本中的年轻人有()455%345%200160+⨯=..人, 补充完整的22⨯列联表如下,所以2K 的观测值()2200100202060 2.083 2.0721208016040k ⨯⨯-⨯=≈>⨯⨯⨯, 故有85%的把握认为是否经常使用网络直播销售与年龄有关. (2)方案一:设获利X 万元,则X 的所有可能取值为300,150-,0, ()()711300150018010510E X =⨯+-⨯+⨯=, ()()()()22271115018300018030180510010510D X ⨯+--⨯+⨯==--; 方案二:设获利Y 万元,则Y 的所有可能取值为500,300-,0, ()()331500300021051010E Y =⨯+-⨯+⨯=,()()()()222331300210021013290051501010002D Y ⨯+--⨯+-⨯==-,∴()()E X E Y <,()()D X D Y <∴从获利的期望上看,方案二获得的利润更多些,但方案二的方差比方案一的方差大得多,从稳定性方面看方案一更稳妥,故从获利角度考虑,选择方案二;从规避风险角度考虑,选择方案一.7.(2021·江苏扬州·高二期末)有关研究表明,正确佩戴安全头盔能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.某市以巩固全国文明城市创建成果为抓手,组织开展“一路平安,多‘盔’有你”安全守护行动.行动期间,公安交管部门将加强执法管理,依法查纠电动自行车骑乘人员未佩戴安全头盔的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,下表是该市交警从周一到周五在一主干路口所检查到的未佩戴安全头盔行为统计数据:(1)请利用所给数据,求未佩戴安全头盔人数y 与星期代码x 之间的回归直线方程ˆˆˆybx a =+,并预测该路口周六“未戴安全头盔人数”(用四舍五入法将结果取整数):(2)下表是交警从这5天内在随机检查的1000名骑行人员中,记录其性别和是否佩戴头盔情况:。
高中数学新湘教版精品教案《湖南教育出版社高中数学选修2-3 8.4 列联表独立性分析案例》
《列联表独立性分析案例》教学设计授课教师:阮金锋指导教师:缪向光阮龙杰送选单位:福建省福安市第一中学【教材分析】这节课是湘教版2021课标版高中数学《选修2—3》第八章第4节的内容,是概率与统计的重要内容.在此之前,学生已经学习了随机事件发生的概率、概率的运算、事件的独立性、正态分布等内容.本节课在对前面学过有关知识的基础上,通过分析“吸烟与患肺癌是否有关”这一统计案例,明确独立性检验的基本步骤,理解独立性检验的基本思想.独立性检验的基本思想是建立在假设检验思想(小概率事件在一次试验中几乎不可能发生)基础之上,是一种重要的假设检验方法.独立性检验的基本思想的理解,有利于提升统计素养,有利于提升抽象概括、数学建模、数据分析等数学核心素养.【教学目标】1.知识与技能通过典型案例的探究,理解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,理解独立性检验与反证法的联系与区别,并能解决实际问题.2.过程与方法通过数据统计、分析和计算过程,从具体实例中学会用样本来估计总体的统计思想.通过主动探究、自主学习,从具体实例中抽象、概括、总结出独立性检验的基本原理和基本步骤,同时充分体会知识的发现过程.3.情感、态度与价值观通过本节课的学习,初步提高从生活中发现数学问题、解决数学问题的能力,提升抽象概括、数学建模、数据分析等数学素养.通过学生分析问题、解决问题的学习过程,激发学习兴趣,培养学生勇于探索的科学精神.【学情分析】学生之前已学了概率统计的相关内容,有了一定的统计分析能力,对本节课的学习奠定了一定的基础.但学生缺乏假设检验的有关知识背景,导致对独立性检验的基本思想的学习与理解存在困难,学生很难理解独立性X是从怎么检验的说理方式.为什么要假设?为什么判断会出错?既然出错了怎么又可以下结论?统计量卡方2X分布概率临界值表怎么理解?独立性检验思想与反证法的联系与区别如何?这些问题成构造出来的?卡方2为学生学习本节课的障碍,如果没有根本性解决,学生只能依葫画瓢,只能死记硬背,机械套用卡方公式.【教学重点】通过生活实例体会独立性检验的基本思想,掌握独立性检验的一般步骤.【教学难点】X的由来与结构特征1.统计量卡方2X分布概率临界值表的本质理解2.卡方23.独立性检验的基本思想的理解4.独立性检验思想与反证法的联系与区别5.小概率事件原理的理解【教学方式】多媒体辅助,几何画板辅助,探究式教学(以问题串指引)【教学策略】以“吸烟与患肺癌是否相关”案例的解决为主线,问题串指引探究教学,类比反证法思想,体会独立性检验的实际运用。
8.4列联表独立性分析案例课件-湘教版数学选修2-3
列联表
为了调查吸烟是否患呼吸道疾病有影响,某医疗研究 所随机地调查了515人,得到如下结果(单位:人)
吸烟与呼吸道疾病列联表
患病 不患病 总计
吸烟
37
183
220
不吸烟
21274Fra bibliotek295
总计
58
457
515
在不吸烟者中患呼吸道疾病的比重是 7.12% 在吸烟者中患呼吸道疾病的比重是 16.82%
用 统计量研究这类问题的方法称为独立性检验。
一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类 取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类 取值,即类1和2(如患病与不患病)。于是得到 下列联表所示的抽样数据:
类1 类2
总计
类A
a
b
a+b
类B
c
d
c+d
总计
a+c
b+d
a+b+c+d
要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:
患病 不患病 总计
吸烟
37
183
220
不吸烟 21
274
295
总计
58
457
515
通过公式计算
独立性检验
已知在 H0成立的情况下,
即在H0 成立的情况下, 2大于6.635概率非常小, 近似为0.01 现在的 2=11.8634的观测值远大于6.635, 出现这样的观测值的概率不超过0.01。 故有99%的把握认为H0不成立,即有99%的把 握认为“患呼吸道疾病与吸烟有关系”。
列联表独立性分析案例
某医疗机构为了了解呼吸道疾病与吸烟是否 有关,进行了一次抽样调查,共调查了515个 成年人,其中吸烟者220人,不吸烟者295人, 调查结果是:吸烟的220 人中37人患呼吸道 疾病, 183人不患呼吸道疾病;不吸烟的295 人中21人患呼吸道疾病, 274人不患呼吸道 疾病。
【优化方案】精品课件数学选修2-3(配湘教)第8章8.4
列联表独立性分析案例
8.4 列 联 表 独 立 性 分 析 案 例
学习目标
课前自主学案
课堂互动讲练
知能优化训练
学习目标
1.了解独立性检验 (只要求2×2列联表)的基本思 想、方法及其简单应用. 2.了解假设检验的基本思想、方法及其简单应 用.
课前自主学案
温故夯基
1.如果某测量值 X 服从正态分布,测量次数越 越近 . 多测量的平均值离真值 μ 就______ 1 x2 偶 函 2.标准正态密度曲线 Φ(x)= e- 是____ 2 2π 数.(奇偶性) 1 3.在标准正态分布中 P(x<a)+P(x<-a)=___.
越弱;|n11n22-n12n21|越大,关系越强.
在国家未实施西部开发战略前,一新闻单位在应
届大学毕业生中随机抽取 1000人进行问卷调查,
只有80人志愿加入国家西部建设,而国家公布实 施西部开发战略后,随机抽取1200名应届大学毕 业生进行问卷调查,有 400 人志愿加入国家西部 建设.
问:实施西部开发战略的公布是否对应届大学毕
【误区警示】
本题易出现结论写反“在犯错误
的概率不超过0.01的前提下认为没有影响”.
“无关”的独立性分析
某省2011年高中招生不再文理分科,为了探究学生 对此的赞同情况是否与性别有关.某机构调查了 361名高二在校学生,结果如下:男生赞同的有138 人,不赞同的有98人,女生赞同的有73人,不赞同 的有52人,试分析对这项政策的赞同是否与性别有 关? 【思路点拨】 先列出2×2列联表,再计算χ2的值, 运用独立性分析得出结论.
业生的选择产生了影响?
【思路点拨】 → 判断关系
【解】
列2×2列联表 → 计算χ2的观测值
8.4列联表独立性检验
患心脏病 214 451 665
患其他病 597
不患心脏病 175 597 772
总计 389 1048 1437
患其他病
秃头 不秃头
患心脏病
相应的三维柱形图如图所 示, 比较来说 ,底面副对 角线上两个 柱体高度的乘 积要大一些 ,因此可以在 某种程度上认为“秃顶与 患心脏病有关”。
课题:选修2-3 8.4独立性检验
解:设H0:感冒与是否使用该血清没有关系。
1000258 284 242 216 2 K 7.075 474 526 500 500 因当H0成立时,K2≥6.635的概率约为0.01,故有99%的把握认 为该血清能起到预防感冒的作用。
2
课题:选修2-3 8.4独立性检验
第四步:查对临界值表,作出判断。
P(k≥k0) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
课题:选修2-3 8.4独立性检验
思考
如果K 2 6.635,就断定H0不成立,这种判断出错的可能性有多大 ?
答:判断出错的概率为0.01。
9965(7775 49 42 2099)2 现在观测值k 56.632太大了, 7817 2148 9874 91 在H 0成立的情况下能够出现这样的观测值的概率不超过0.01, 因此我们有99%的把握认为H 0不成立,即有99%的把握认为“吸烟 与患肺癌有关系”。
再冷的石头,坐上三年也会暖 !
独立性检验
2 n ( ad bc ) 随机变量-----卡方统计量 K 2 , (a b)(c d )(a c)(b d )
2018年数学同步优化指导湘教版选修2-3练习:8-4 列联
第8章8.41.想要检验喜欢参加体育运动是不是与性别有关,应该检验()A.男性喜欢参加体育运动B.女性不喜欢参加体育运动C.喜欢参加体育运动与性别有关D.喜欢参加体育运动与性别无关解析:独立性检验假设有反证法的意味,应假设两类变量无关,这时的χ2应该很小.如果χ2很大,那么可以否定假设;如果χ2很小,那么不能够肯定或者否定假设.答案:D2.有两个因素X与Y的一组数据,由其列联表计算得χ2≈4.523,则认为X与Y有关系是错误的可信度为()A.95%B.90%C.5%D.10%解析:∵χ2≥3.841,∴X与Y有关系的概率为95%.∴X与Y有关系错误的可信度为5%.答案:C3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足()A.χ2>6.635 B.χ2>5.024C.χ2>7.879 D.χ2>3.841解析:当χ2>6.635时,有99%的把握认为“X与Y有关系”.答案:A4.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:对于以下数据,________.①a=9,b=8,c=7,d=6;②a=9,b=7,c=6,d=8;③a=8,b=6,c=9,d=7;④a=6,b=7,c=8,d=9.解析:对于同一样本,|ad—bc|越小,说明X与Y之间有关系的可能性越弱;|ad-bc|越大,说明X与Y之间有关系的可能性越强.答案:②5.给出如下列联表:解:χ2=1 537×(11×1 495-25×6)217×1 520×36×1 501≈292.285>10.828,约有99.9%的把握认为糖尿病与家族病史有关系.。
2018年数学同步优化指导湘教版选修2-3练习:8-4 列联表独立性分析案例 活页作业19 含解析 精品
活页作业(十九) 列联表独立性分析案例一、选择题1.对于因素X 与Y 的随机变量χ2的值,下列说法正确的是( ) A .χ2越大,“X 与Y 有关系”的可信程度越小 B .χ2越小,“X 与Y 有关系”的可信程度越小 C .χ2越接近于0,“X 与Y 没有关系”的可信程度越小 D .χ2越大,“X 与Y 没有关系”的可信程度越大解析:χ2越大,“X 与Y 没有关系”的可信程度越小,则“X 与Y 有关系”的可信程度越大,即χ2越小,“X 与Y 有关系”的可信程度越小.答案:B2.两个分类变量X 和Y ,值域分别为{X 1,X 2}和{Y 1,Y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度为90%,则c 等于( )A .4B .5C .6D .7解析:当c =5时,χ2=66×(10×30-5×21)215×51×31×35≈3.023 6>2.706.∴c =5时,X 与Y 有关系的可信程度为90%,而其余的值c =4,c =6,c =7皆不满足. 答案:B3.关于两个分类变量A ,B 的下列说法中,正确的个数为( ) ①A 与B 相关性越大,则χ2的值就越大; ②A 与B 无关,即A 与B 互不影响;③χ2的大小是判定A 与B 是否相关的唯一依据. A .1 B .2 C .3D .0解析:①正确,χ2的值的大小是用来检验A 与B 的相关性的,χ2的值越大,A 与B 的相关性越大.②正确,A 与B 无关即A 与B 相互独立.③不正确.答案:B4.为了探究学生的学习成绩是否与学习时间长短有关,在调查的500名学习时间较长的学生中有39名学习成绩比较好,500名学习时间较短的学生中有6名学习成绩比较好,那么你认为学生的学习成绩与学习时间长短有关的把握为( )A .0B .95%C .99%D .都不正确解析:计算出χ2与两个临界值比较,χ2=1 000×(39×494-6×461)245×955×500×500≈25.340 3>6.635.所以有99%的把握说学生的学习成绩与学习时间长短有关.故选C .答案:C 二、填空题5.独立性检验中,两个分类变量“X 和Y 有关系”的可信程度是97.5%,则随机变量χ2的取值范围是________________.解析:当χ2>5.024时,有97.5%的把握判断X 与Y 有关系;当χ2>6.635时,有99%的把握判断X 与Y 有关系.∴5.024<χ2≤6.635. 答案:(5.024,6.635]6.有两个分类变量X 与Y ,有一组观测的2×2列联表如下,其中,a,15-a 均为大于5的整数,则a =____时,有90%以上的把握认为“X 与Y 之间有关系”.解析:要使有, 即χ2=65[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)260×90>2.706,解得a >7.19或a <2.04.又因为a >5,且15-a >5,a ∈Z ,所以当a 取8或9时,有90%以上的把握认为“X 与Y 之间有关系”. 答案:8或9 三、解答题7.考察小麦种子经过灭菌与否跟发生黑穗病的关系.经试验观察,得到数据如下表所示:解:χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,所以有95%的把握认为种子灭菌与发生黑穗病是有关系的. 8.有甲、乙两个班级进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.已知在全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表.(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩优秀与否和班级有关系”?参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).附表:(3)名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6或10号的概率.解:(1)(2)χ2=105×(10×30-20×45)255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩优秀与否和班级有关系”.(3)设“抽到6或10号”为事件A ,先后两次抛掷一枚均匀的骰子,出现的点数为(x ,y ).所有的基本事件有(1,1),(1,2),(1,3),…,(6,6),共36个.事件A 包含的基本事件有:(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P (A )=836=29.一、选择题1.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的解析:由列联表可得χ2=340×(162×8-143×27)2305×35×189×151≈7.34>6.635,所以有99%的把握认为性别与获取学位的类别有关.答案:A2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表2表3表4A .成绩 C .智商 D .阅读量解析:因为χ21=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,χ22=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,χ23=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,χ24=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则有χ24>χ22>χ23>χ21,所以阅读量与性别关联的可能性最大.答案:D 二、填空题3.在吸烟与患肺病是否相关的判断中,有下列的说法:①若统计量χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是____________(填序号).解析:统计量χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①错误;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确.答案:③4.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题5.现对某市工薪阶层关于“楼市限购政策”的态度进行调查,随机抽查了50人,他们月收入(单位:百元)的频数分布及对“楼市限购政策”的赞成人数如下表:5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异;(2)“楼市限购政策”的概率.解:(1)由题意得2×2列联表:异,根据列联表中的数据,得到χ2=50×(3×11-7×29)210×40×32×18≈6.272<6.635,所以没有99%的把握认为当月收入以5 500元为分界点时,该市的工薪阶层对“楼市限购政策”的态度有差异.(2)已知在收入[55,65)中共有5人,2人赞成,3人不赞成.设至少有一个不赞成“楼市限购政策”为事件A ,则P (A )=1-C 22C 25=910.故所求概率为910.6.为了研究“教学方式”对教学质量的影响,某高中数学老师分别用两种不同的教学方式对入学数学平均分数和优秀率都相同的甲、乙两个高一新班进行教学(勤奋程度和自觉性都一样).以下茎叶图为甲、乙两班(每班均为20人)学生的数学期末考试成绩.(1)87分的同学至少有一名被抽中的概率.(2)学校规定:成绩不低于75分的为优秀.请填写下面的2×2列联表,并判断有多大把握认为“成绩优秀与教学方式有关”.⎝ ⎛⎭⎪⎫参考公式:χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )解:(1)记成绩为87分的同学为A ,B ,其他不低于80分的同学为C ,D ,E .“从甲班数学成绩不低于80分的同学中随机抽取两名同学”的一切可能结果组成的基本事件有(A ,B ),(A , C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),(D ,E ),共10个.“至少有一名87分的同学被抽中”所组成的基本事件有(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),共7个,所以P =710.(2)χ2=40×(6×6-14×14)20×20×20×20=6.4>5.024,因此,我们有97.5%的把握认为成绩优秀与教学方式有关.。
湘教版高中数学选修2-2《列联表独立性分析案例》教案3
列联表独立性分析案例(3)一、教学目标(一)知识目标通过对典型案例(如“色弱与性别是否有关”“中学生物理考试成绩和吃早点是否相关”)的探究,了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。
(二)能力目标让学生经历数据处理的过程,会用所学知识对具体案例进行检验,提高探索解决问题的能力。
(三)情感目标从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度。
二、教学重点进一步理解独立性检验的实施步骤三、教学难点对临界值的理解作出判断四、教学过程(一)引入课题独立性检验的步骤。
1.若要推断的论述为H1:“X与Y有关系”。
可按如下步骤判断H1成立的可能性。
A通过三维柱形图和二维条形图,粗略判断两个分类变量是否有关系。
B可以利用独立性检验来考察两个分类变量是否有关系。
并能精确判断可靠程度。
2.由观测数据算2 ,其值越大,说明“X与Y有关系”成立的可能性越大。
3.由临界值表确定可靠程度。
(二)案例讲解有300人按性别和是否色弱分类如表问色弱与性别是否有关?分析:设从表格中提供的统计数据,可以计算得到如下数值:男性所占百分比:132120.48300+=;女性所占百分比:15150.52300+= 在这300人的样本中,男性色弱患者的百分比:120.04300≈;女性色弱的百分比:50.017300≈ 直观上看,300人中男性色弱的比例高于女性(0.040.017>)。
色弱应该与性别有关。
下面进一步运用独立性的概念进行检验。
从300人中随机选取一人,设1A 表示男性,2A 表示女性,1B 表示色觉正常,2B 表示色弱。
则:1()0.48P A =,2()0.52P A =,2125()0.06300P B +=≈ P (此人为男性且色弱)=12()0.04P A B = 而12()()0.480.060.028P A P B =⨯= 显然1212()()()P A B P A P B ≠P (此人为女性且色弱)=22()0.017P A B =,22()()0.520.060.031P A P B =⨯= 显然2222()()()P A B P A P B ≠因此,1A 与2B 、2A 与2B 都不是独立的。
8.4列联表独立性分析案例课件-湘教版数学选修2-3
X
Y 有效
口服
58
无效 40
合计 98
注射
64
31
95
合计
122
71
193
解:设H0:药的效果与给药方式没有关系
<3.841
练习巩固:
1. 在吸烟与患肺病这两个分类变量的计算中,下列说法正确 的是( )
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
得到原结论成立的可信程度 故有 的把握认为X与Y相关
x0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
X Y 喜欢数学课程 不喜欢数学课程
男
15
35
总计 50
女
4
46
50
总计
19
81
100
例2、某项实验,在100次实验中,成功率只有10%,进行技术 改造后,又进行了100次实验.试问:若要有97.5%以上的把握 认为“技术改造有明显效果”,实验的成功率至少为多少? (设 P( 2 5) 0.025 )
40
3700% 2650%
30 2500%
20 341005%%
患肺癌患肺癌 不患肺不癌吸患肺烟癌
不吸烟
2100% 10 105%
不吸烟
从各个三频维数柱的形相图0对能0大清0% 小楚肺条不不吸癌形吸烟的图烟 比、例等高高于条不形患图肺能癌看的出比,例吸烟
独立假性设检验
《4.3 独立性检验》(同步训练)高中数学选择性必修 第二册_湘教版_2024-2025学年
《4.3 独立性检验》同步训练(答案在后面)一、单选题(本大题有8小题,每小题5分,共40分)1、在下列关于独立性检验的描述中,正确的是()A. 卡方检验适用于两个分类变量之间的独立性检验B. 独立性检验是用于检验两个事件是否相互独立的统计方法C. 在进行独立性检验时,需要满足总体是正态分布的假设D. 独立性检验的结果总是显著的2、为了研究中学生的性别与对待某一新教学方法的态度之间是否有关系,调查了某学校的300名学生,其中200名男生和100名女生。
在这300名学生中,有120名学生支持新教学方法,其中男生支持的人数为80人。
假设有90%的把握,下列正确的是()。
A、性别与态度的相关系数为0.2,可以认为两者的相关性为强相关。
B、通过捉样表明,性别与态度独立,两者之间没有关系。
C、性别与态度有关,男生比女生更倾向于支持新教学方法。
D、基于上述数据,两者之间可能存在一定的关联性,但无法得出明确的结论。
3、甲乙两城市天气变化的相关系数为0.8,则以下说法正确的是()A、甲乙两城市天气变化无关B、甲乙两城市天气总是同时降温或同时升温C、甲乙两城市天气变化的相关程度极高D、甲乙两城市天气变化呈完全正相关4、(单选题)某班同学对数学、英语、物理三门课程的兴趣程度进行了调查,其中对数学感兴趣的同学人数为20人,对英语感兴趣的同学人数为25人,对物理感兴趣的同学人数为15人,同时对数学和英语感兴趣的同学人数为10人,同时对数学和物理感兴趣的同学人数为8人,同时对英语和物理感兴趣的同学人数为5人,那么对三门课程都感兴趣的同学人数为()。
A. 3人B. 4人C. 5人D. 6人5、在进行独立性检验时,如果将多个属性合并为一个属性,以下描述正确的是()。
A、会增大实验的数量,降低检验的准确性B、会减小实验的数量,降低检验的准确性C、不会影响实验的数量和检验的准确性D、会减小实验的数量,提高检验的准确性6、在一次社会调查活动中,随机调查了男女各100人,让他们依次回答是否支持某项社会改革措施,结果显示:支持的男生有40人,支持的女生有30人。
高中数学选择性必修三 精讲精炼 8 列联表及独立性检验(精讲)(含答案)
8.3 列联表及独立性检验(精讲)考点一独立性检验的辨析【例1】(2021·全国·高二课时练习)北京市人民政府新闻办公室召开疫情防控第200场例行新闻发布会时表示不在18~59岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄段内和该年龄段外的110人进行了临床试验,得到如下2×2列联表:附:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段无关”B.在犯错误的概率不超过0.1%的前提下,认为“能接种与年龄段有关”C.有99%以上的把握认为“能接种与年龄段无关”D.有99%以上的把握认为“能接种与年龄段有关”【答案】D【解析】由2×2列联表可得()22110403020207.82260506050χ⨯⨯-⨯=≈⨯⨯⨯.因为6.6357.82210.828<<,所以在犯错误的概率不超过1%的前提下,认为“能接种与年龄段有关”,即有99%以上的把握认为“能接种与年龄段有关”.故选:D【一隅三反】1(2021·全国·高二专题练习)为了解某次考试中语文成绩是否优秀与性别的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:( )根据这一数据分析,下列说法正确的是( )下面的临界值表供参考:A.有99.5%的把握认为语文成绩是否优秀与性别有关系B.有99.9%的把握认为语文成绩是否优秀与性别有关系C.有99%的把握认为语文成绩是否优秀与性别有关系D.没有理由认为语文成绩是否优秀与性别有关系【答案】C【解析】由题意可得()2260101020206.667 6.63530303030χ⨯⨯-⨯==>⨯⨯⨯,所以有99%的把握认为语文成绩是否优秀与性别有关系.故选:C2.(2021·全国·高二学业考试)为大力提倡“厉行节约,反对浪费”,某大学通过随机询问100名学生能否做到“光盘”行动,得到如下列联表:经计算:2 3.03χ≈. 附:参考附表,得到的正确结论是( )A .有95%的把握认为“该校学生能否做到‘光盘’行动与性别有关”B .有95%的把握认为“该校学生能否做到‘光盘’行动与性别无关”C .有90%的把握认为“该校学生能否做到‘光盘’行动与性别有关”D .有90%的把握认为“该校学生能否做到‘光盘’行动与性别无关” 【答案】C 【解析】由题意得22⨯列联表如图:()2210045151030100 3.03 2.7065545752533χ⨯-⨯==≈>⨯⨯⨯,所以有90%的把握认为“该校学生能否做到‘光盘’行动与性别有关”. 故选:C.3.(2021·全国·高二单元测试)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则2χ的值可能为( )附表:A.3.206B.6.561C.7.879D.11.028【答案】C【解析】因为有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,6.635,10.828,因此2χ的值可能为7.879.所以k的取值范围为[)故选:C.考点二独立性检验的应用【例2】(2021·重庆九龙坡)为张扬学生的个性,彰显青春的智慧与力量,2021年5月某重点高中举办了一年一度的大型学生社团活动,学生社团有近40个,吸引了众多学生.此次活动由学校高一、高二的学生参加,参加社团的学生共有400多人.已知学校高一和高二的所有学生中男生与女生人数比为6:4,为了解学生参加社团活动的情况,从高一、高二所有学生中按性别采用分层抽样的方法抽取部分学生,统计得到如下等高条形图表示参加社团活动的学生频率.(1)求该重点高中参加社团的学生中,任选1人是女生的概率;p=的独立性检验,能否认为该学校(2)若抽取了100名学生,完成下列22⨯列联表,并依据小概率值0.05高一和高二学生的性别与参加学生社团有关联?请说明理由.附:22()()()()()n ad bc K a b c d a c b d -=++++,n a b c d =+++.【答案】 (1)47(2)列联表见解析,性别与参加学生社团无关.【解析】(1)由题设,参加社团的男生人数占总人数比例为31351050⨯=,参加社团的女生人数占总人数比例为22451050⨯=, ∴社团中男女生的比例为3:4,故该重点高中参加社团的学生中任选1人是女生的概率47.(2)22100(192432) 1.9934 3.84114866080K ⨯-=≈<⨯⨯⨯,∴依据小概率值0.05p =的独立性检验,不能说明“性别与参加学生社团无关”不成立,故可认为性别与参加学生社团无关. 【一隅三反】1.(2021·全国·高二单元测试)微信是腾讯公司推出的一种手机通信软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人.为了调查微信用户每天使用微信的时间,某经销化妆品的店家在一广场随机采访男性、女性用户各50名,将他们平均每天使用微信的时间(单位:h)分成5组:(]0,2,(]2,4,(]4,6,(]6,8,(]8,10,分别加以统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图估计女性用户平均每天使用微信的时间;(2)若把每天使用微信超过4h 的用户称为“微信控”,否则称为“非微信控”,请你根据已知条件完成下列22⨯列联表,并判断是否有90%的把握认为“微信控”与性别有关.【答案】(1)4.76(h);(2)列联表见解析,有把握. 【解析】(1)由女性的频率分布直方图,可估计女性用户平均每天使用微信的时间为0.1610.243⨯+⨯+ 0.2850.270.129 4.76⨯+⨯+⨯=(h);(2)由男性的频率分布直方图,可得()20.040.1420.121a +++⨯=,解得0.08a =. 由两个频率分布直方图,可得22⨯列联表如下:()2210038203012 2.941 2.70650506832K ⨯⨯-⨯=≈>⨯⨯⨯,所以有90%的把握认为“微信控”与性别有关.2.(2021·全国·高二课时练习 )某校高一年级进行安全知识竞赛(满分为100分),所有学生的成绩都不低于75分,从中抽取100名学生的成绩进行分组调研,第一组[)75,80,第二组[)80,85,,第五组[]95,100(单位:分),得到如下的频率分布直方图.若竞赛成绩不低于85分为优秀,低于85分为非优秀,且成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25,请判断是否有95%的把握认为竞赛成绩的优秀情况与性别有关.【答案】有.【解析】由已知,竞赛成绩在[)85,90的学生人数为0.06510030⨯⨯=, 竞赛成绩在[)90,95的学生人数为0.04510020⨯⨯=, 竞赛成绩在[]95,100的学生人数为0.02510010⨯⨯=,所以竞赛成绩不低于85(优秀)的学生人数为60,低于85(非优秀)的学生人数为40. 因为成绩优秀的男学生人数为35,成绩非优秀的女学生人数为25, 所以22⨯列联表如下:所以2K的观测值()2210015253525254.167505040606K⨯⨯-⨯==≈⨯⨯⨯.因为4.167 3.841>,所以有95%的把握认为竞赛成绩的优秀情况与性别有关.3(2021·全国·高二单元测试)下表是某地区的一种传染病与饮用水卫生程度的调查表:(1)得这种传染病(简称得病)是否与饮用不干净水有关?请说明理由;(2)若饮用干净水得病的有5人,未得病的有50人;饮用不干净水得病的有9人,未得病的有22人.按此样本数据分析:得这种传染病是否与饮用不干净水有关?并比较两种样本在反映总体时的差异.附表及公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++,临界值表:【答案】(1)有关,理由见解析;(2)答案见解析.【解析】(1)提出假设0:H得这种传染病与饮用不干净水无关.由表中数据可得()22830522189446654.212146684518312χ⨯⨯-⨯=≈⨯⨯⨯,因为当0H 成立时,210.828χ≥的概率约为0.001,所以我们有99.9%的把握认为“得这种传染病与饮用不干净水有关”; (2)依题意得22⨯列联表:此时,()2286522950 5.78514725531χ⨯⨯-⨯=≈⨯⨯⨯, 因为当0H 成立时,2 5.024χ≥的概率约为0.025,所以我们有97.5%的把握认为“得这种传染病与饮用不干净水有关”. 两个样本都能得到“得这种传染病与饮用不干净水有关”这一结论,但(1)中我们有99.9%的把握肯定结论,(2)中我们只有97.5%的把握肯定结论.4.(2021·全国·高二课时练习) “中国科学十大进展”遴选活动由科学技术部高技术研究发展中心牵头举办,旨在激励广大科技工作者的科学热情和奉献精神,开展基础研究科学普及,促进公众理解、关心和支持基础研究,在全社会营造良好的科学氛围.2021年2月,科技部高技术研究发展中心(基础研究管理中心)发布了2020年度中国科学十大进展.某校为调查本校中学生对2020年度中国科学十大进展的了解与关注情况,从该校高中年级在校生中,按高一、高二年级,高三年级分成两个年级段,随机抽取了200名学生进行调查,其中高一、高二年级共调查了120人,高三年级调查了80人,以说出10项科学进展的名称个数为标准,统计情况如下.假设以能至少说出四项科学进展的名称为成绩优秀.(1)根据频数分布表完成22⨯列联表,并回答是否有95%的把握认为成绩优秀与否与年级分段有关?(2)按分层抽样的方法,在被调查且成绩优秀的学生中抽取6名同学,再在这6名同学中随机抽取4名同学组成“2020科技展”宣讲队,求至少有2名高三年级的同学入选宣讲队的概率. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.【答案】(1)列联表答案见解析,没有95%的把握认为成绩优秀与否与年级分段有关;(2)45.【解析】(1)由题意,22⨯列联表如下:22200(90303050)25 3.571 3.84112080140607K ⨯-⨯==≈<⨯⨯⨯,所以没有95%的把握认为成绩优秀与否与年级分段有关; (2)被调查且成绩优秀的学生有60名,分层抽样抽取6名同学, 则从高一、高二年级抽取了3名同学,记为:a ,b ,c ,从高三年级抽取了3名同学,记为A ,B ,C ,在6名同学中随机选4名,不同的情况有15种,以下均只列出两名没入选的情况:(,)a b ,(,)a c ,(,)a A ,(,)a B ,(,)a C ,(,)b c ,(,)b A ,(,)b B ,(,)b C ,(,)c A ,(,)c B ,(,)c C ,(,)A B ,(A,C),(,)B C ,其中至少有2名高三年级的同学入选的情况的对立事件是只有1名高三年级的同学入选, 不同的情况有3种:(,)A B ,(A,C),(,)B C ,所以至少有2名高三年级的同学入选宣讲队的概率为341155-=.考点三独立性检验与其他的综合运用【例3】(2021·山东无棣·高二期中)某市为了解乡村振兴,农业农村现代化进程,对全市村庄进行全方位的调研.根据调研成绩评定“要加油”“良好”“优秀”三个等级.现随机抽取200个村庄的成绩统计结果如表:(1)若调研成绩在80分及以上认定为“优良”.抽取的200个村庄中东西部村庄的分布情况如下表.完成2×2列联表,并判断是否有99%的把握认为优良村庄与东西部位置有关?(2)用分层抽样的方法,从评定为“优秀”、“良好”、“要加油”的三个等级的村庄中随机选取5个进行细致调查,同时对相应等级进行量化:“优秀”记10分,“良好”记5分,“要加油”记0分.现再从抽取的5个村庄中任选2个村,所选村的量化分之和记为X,求X的分布列及数学期望.附表及公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【答案】(1)列联表见解析,有99%的把握认为优良村庄与东西部位置有关;(2)分布列见解析,数学期望为8.【解析】(1)由题意得,2×2列联表如下:∵22200(30505070)8.333 6.63510010012080K⨯⨯-⨯=≈>⨯⨯⨯,∴有99%的把握认为优良村庄与东西部位置有关.(2)按照分层抽样的方法,从“要加油”,“良好”,“优秀”三个等级的村庄中分别抽取2个、2个、1个,X的所有可能取值为0,5,10,15,P(X=0)=2225110CC=,P(X=5)=11222525C CC=,P(X=10)=21122125310C C CC+=,P(X=15)=11212515C Cc=,故X的分布列为:故E(X)=12310510158105105⨯+⨯+⨯+⨯=.【一隅三反】1.(2021·福建省宁德市教师进修学院高二期末)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我省某地区新能源乘用车的年销售量与年份的统计表:某机构调查了该地区60位购车车主的性别与购车种类情况,得到的部分数据如下表所示:(1)求新能源乘用车的销量y 关于x 年份的线性相关系数r ,并判断y与x 是否线性相关;(2)请将上述22⨯列联表补充完整,并判断是否有99%的把握认为购车车主是否购置新能源乘用车与性别有关; 参考公式:相关系数()()nntii ix x y y x y nx yr ---=∑∑;()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++;参考数据:()5210.66i i y y=-=∑,()()512.5i ii x xy y =--=∑ 2.6≈.备注:若0.75r >,则可判断y 与x 线性相关. 卡方临界值表:【答案】(1)0.96,y 与x 的线性相关;(2)表格见解析,有. 【解析】1)由表格知:2018x =,10.6y =, ∴()5214101410i i x x=-=++++=∑由上,有()()52.50.960.752.6tix x y y r --==≈>∑,(备注:未算出0.96r ≈,直接判断 2.50.752.6r =>的不扣分!) 则y 与x 的线性相关. (2)依题意,完善表格如下:()22603684127.5 6.63540204812K ⨯⨯-⨯==>⨯⨯⨯故有99%的把握认为购车车主是否购置新能源乘用车与性别有关.2.(2021·福建省永泰县第一中学高二期中)2021年某地区初中升学体育考试规定:考生必须参加长跑、200米游泳、1分钟跳绳三项测试.某学校在初三上学期开始,为了了解掌握全年级学生1分钟跳绳情况,抽取了100名学生进行测试,得到下面的频率分布直方图.(1)规定学生1分钟跳绳个数大于等于175为优秀.若在抽取的100名学生中,女生共有45人,男生1分钟跳绳个数大于等于175的有30人.根据已知条件完成下面的22⨯列联表,并根据这100名学生的测试成绩,判断能否有99%的把握认为学生1分钟跳绳成绩是否优秀与性别有关.(2)根据往年经验,该校初三年级学生经过训练,正式测试时每人1分钟跳绳个数都有明显进步.假设正式测试时每人1分钟跳绳个数都比初三上学期开始时增加10个,全年级恰有1000名学生,若所有学生的1分钟跳绳个数X 服从正态分布()2,N μσ,用样本数据的平均值和标准差估计μ和σ,各组数据用中点值代替,估计正式测试时1分钟跳绳个数大于173的人数(结果四舍五入到整数).附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.若随机变量X 服从正态分布()2,N μσ,则()0.6827,(22)0.9545,(33)0.9973,12.P X P X P X μσμσμσμσμσμσ-<≤+≈-<≤+≈-<≤+≈≈【答案】(1)联列表答案见解析,没有99%的把握认为学生1分钟跳绳成绩是否优秀与性别有关;(2)185μ=,12σ≈,估计正式测试时1分钟跳绳个数大于173的人数约为841.【解析】(1)由题意得样本中1分钟跳绳个数大于等于175的人数为1000.0300.0100.0081048⨯++⨯=(),即优秀的共有48人,补充完整的22⨯列联表如下表所示: 所以2210030272518 2.098 6.63555454852K ⨯⨯-⨯=≈<⨯⨯⨯(),所以没有99%的把握认为学生1分钟跳绳成绩是否优秀与性别有关;(2)因为1500.061600.121700.341800.31900.12000.08175⨯+⨯+⨯+⨯+⨯+⨯=, 所以17510185μ=+=,方差为()()()22221501750.061601750.121701750.34σ=-⨯+-⨯+-⨯()()()2221801750.31901750.12001750.08+-⨯+-⨯+-⨯222250.14150.2250.64⨯+⨯+⨯=,12≈,所以12σ≈, 所以()218512XN ,,06827(173)()0.50.841352P X P X μσ>=>-≈+=, 10000.84315841.35841⨯=≈故估计正式测试时1分钟跳绳个数大于173的人数约为841.3.(2021·四川眉山 )新疆地区的棉花是世界上最好的棉花之一,新疆长绒棉,世界顶级,做衣被,暖和、透气、舒适,长年供不应求.评价棉花质量的重要指标之一就是棉花的纤维长度,新疆农科所在土壤环境不同的A 、B 两块实验地分别种植某品种的棉花,为了评价该品种的棉花质量,在棉花成熟后,分别从A 、B 两地的棉花中各随机抽取40根棉花纤维进行统计,结果如下表:(记纤维长度不低于300mm 的为“长纤维”,其余为“短纤维”).(1)由以上统计数据,填写下面22⨯列联表,并判断能否在犯错误概率不超过0.01的前提下认为“纤维长度与土壤环境有关系”(2K 的观测值精确到0.01). 附:()()()()()22n ad bc K a b c d a c b d -=++++临界值表:(2)现从抽取的80根棉花纤维中“短纤维”里任意抽取2根做进一步研究,记B 地“短纤维”的根数为Y ,求Y 的分布列和数学期望;(3)根据上述B 地关于“长纤维”与“短纤维”的调查,将B 地“长纤维”的频率视为概率,现从B 地棉花(大量的棉花)中任意抽取3根棉花,记抽取的“长纤维”的根数为X ,求X 的数学期望和方差. 【答案】(1)列联表见解析,有,理由见解析;(2)分布列见解析,()12E Y =;(3)()218E X =,()2164D X =.【解析】(1)根据题中信息可得如下22⨯列联表:()22802551535 6.667 6.63560204040K ⨯⨯-⨯=≈>⨯⨯⨯,因此,在犯错误概率不超过0.01的前提下认为“纤维长度与土壤环境有关系”; (2)80根棉花纤维中“短纤维”共20根,其中,B 地的“短纤维”共5根, 所以,随机变量Y 的可能取值有0、1、2,()21522021038C P Y C ===,()1151522015138C C P Y C ===,()252201219C P Y C ===,所以,随机变量Y 的分布列如下表所示:所以,()2115110123838192E Y =⨯+⨯+⨯=; (3)从B 地棉花(大量的棉花)中任意抽取1根是“长纤维”的频率是78,所以,73,8XB ⎛⎫⎪⎝⎭, 故()721388E X =⨯=,()712138864D X =⨯⨯=.。
高中数学第八章成对数据的统计分析8.3列联表与独立性检验学案含解析选择性第三册
8.3 列联表与独立性检验最新课标(1)通过实例,理解2×2列联表的统计意义.(2)通过实例,了解2×2列联表独立性检验及其应用.[教材要点]要点一分类变量与列联表1。
分类变量:区别不同的现象或性质的随机变量称为分类变量.错误! 1.分类变量的取值一定是离散的.2。
分类变量是大量存在的,如是否吸烟,商品的等级等.2。
2×2列联表:一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为错误!(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅研究两个分类变量的列联表,并且每个分类变量(2)列联表有助于直观地观测数据之间的关系,如a表示既满足x1,又满足y1的样本量,错误!表示在x1情况下,又满足y1条件的样本所占的频率.要点二独立性检验1.定义:利用χ2的取值推断分类变量X和Y是否独立性的方法称为χ2独立性检验,读作“卡方独立性检验",简称独立性检验.2.公式:χ2=错误!。
3.临界值:忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立,称xα为α的临界值.这个临界值就可作为判断χ2大小的标准.常用临界值表如下:错误!列联表中的数据是样本数据,它只是总体的代表,具有随机性,因此,需要用独立性检验的方法确认所得结论在多大程度上适用于总体,即独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错χ2≥10.828,就认为有99。
9%以上的把握认为“两个分类变量有关系",或者说在犯错误的概率不超过0.1%的前提下,可以认为“两个分类变量有关系".通常认为χ2≤2.706时,样本数据中没有充分的证据支持结论“两个分类变量有关系".[基础自测]1。
2019年高中数学第8章统计与概率8.4列联表独立性分析案例讲义(含解析)湘教版
8.4列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.2.χ2公式χ2=n ad-bc2a +b c+d a+c b+d.3.独立性检验的概念用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:X与Y无关;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,就有99.9%的把握认为“X与Y有关系”;(2)如果χ2>6.635时,就有99%的把握认为“X与Y有关系”;(3)如果χ2>2.706时,就有90%的把握认为“X与Y有关系”;(4)如果χ2≤2.706时,就认为没有充分的证据显示“X与Y有关系”,但也不能作出结论“H0成立”,即X与Y没有关系.[小问题·大思维]1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P(χ2≥6.64)≈0.01和P(χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P(χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P(χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.[例1]数据:[解] 由列联表中的数据,得χ2的值为χ2=-2254×1 379×54×1 579≈68.033>6.635.因此,有99%的把握认为每一晚打鼾与患心脏病有关系.解决一般的独立性分析问题,首先由所给2×2列联表确定a,b,c,d,a+b+c+d 的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x0进行对比,确定有多大的把握认为两个分类变量有关系.1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:系?解:由列联表中的数据,得 χ2=-294×95×86×103≈10.759>6.635,∴有99%的把握认为工作态度与支持企业改革之间有关系.[例2] (1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=-2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关.(2)依题意得2×2列联表:此时,χ2=-214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.独立性分析的步骤:要推断“X与Y是否有关”可按下面的步骤进行:①提出统计假设H0:X与Y无关;②根据2×2列联表与χ2计算公式计算出χ2的值;③根据两个临界值,作出判断.2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?解:根据题目所给的数据得到如下列联表:χ2=-2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.[例3] 为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.下表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2) 表1:注射药物A后皮肤疱疹面积的频数分布表表2:注射药物B 后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答是否有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:[解]χ2=-2100×100×105×95≈24.56>6.635.因此,有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.3.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:χ2=a +bc +d a +cb +d解:(1)依题意得⎩⎪⎨⎪⎧+0.025+c +2b +a =1,2b =a +c ,解得b =0.01.因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人, 于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人. 于是本次测试的及格情况与性别的2×2列联表如下:结合列联表计算可得χ2=30×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.性别与患色盲是否有关?你所得到的结论在什么范围内有效?[解] 由题意作2×2列联表如下:法一:由列联表中数据可知,在调查的男人中,患色盲的比例是38480≈7.917%,女人中患色盲的比例为6520≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知,a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1 000,代入公式得χ2=-2480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握即在犯错误不超过0.01的前提下认为性别与患色盲有关系.这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:则表中a,b的值分别为A.94,96 B.52,50C.52,54 D.54,52解析:选C ∵a+21=73,∴a=52.又∵a+2=b,∴b=54.2.下列关于χ2的说法中正确的是( )A.χ2在任何相互独立问题中都可以用于检验是否相关B.χ2的值越大,两个事件的相关性越大C.χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题D.χ2=n ad-bca +b c+d a+c b+d答案:C3.对于因素X与Y的随机变量χ2的值,下列说法正确的是( )A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大解析:选B χ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.4.若由一个2×2列联表中的数据计算得χ2的观测值为4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:解析:χ2=-275×28×15×88≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效.答案:99%6.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵χ2=-230×20×25×25≈8.333>6.635,∴有99%的把握认为喜爱打篮球与性别有关.一、选择题1.有两个因素X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为X 与Y 有关系是错误的可信度为( )A .95%B .90%C .5%D .10%解析:选C ∵χ2≥3.841.∴X 与Y 有关系的概率为95%,∴X 与Y 有关系错误的可信度为5%.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:计算得,χ2=-260×50×60×50≈7.8.附表:A.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”解析:选C 根据独立性分析的思想方法,正确选项为C.3.某高校“统计初步”课程的老师随机调查了选该课的一些学生情况,具体数据如下表:为了分析主修统计中的数据,得到χ2=-223×27×20×30≈4.84,所以断定主修统计专业与性别有关系,这种判断出错的可能性为( )A.0.025 B.0.05C.0.975 D.0.95解析:选B ∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即判断出错的可能性为0.05.4.已知P(x2≥2.706)=0.10,两个因素X和Y,取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若在犯错误的概率不超过0.1的前提下,认为X与Y有关系,则c等于( )A.5 B.6C.7 D.8解析:选A 经分析,c=5.二、填空题5.班级与成绩2×2列联表:表中数据m,n,p,解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的判断中,有下面的说法:①若χ2>6.64,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说明③正确.答案:③7.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k<2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841 k<2.7068.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba +b =1858,dc +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题9.某市对该市一重点中学2018年高考上线情况进行统计,随机抽查得到表格:解:对于上述四个科目,分别构造四个随机变量 χ21,χ22,χ23,χ24. 由表中数据可以得到: 语文:χ21=-2201×43×204×40=7.294>6.64,数学:χ22=-2201×43×201×43=30.008>6.64,英语:χ23=-2201×43×200×44=24.155>6.64,综合科目: χ24=-2201×43×201×43=17.264>6.64.所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.10.一次对人们休闲方式的调查中共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.05的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表如下:(2)χ2=-270×54×64×60≈6.201.因为6.201>3.841,所以有理由认为假设休闲方式与性别无关是不合理的,即在犯错误的概率不超过0.05的前提下认为休闲方式与性别有关.。
2019年数学新同步湘教版选修2-3讲义+精练:第8章 8.4 列联表独立性分析案例 Word版含解析
8.4列联表独立性分析案例[读教材·填要点]1.列联表一般地,对于两个因素X和Y,X的两个水平取值:A和A(如吸烟和不吸烟),Y也有两个水平取值:B和B(如患肺癌和不患肺癌),我们得到下表中的抽样数据,这个表格称为2×2列联表.2.χ2的求法公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).3.独立性检验的概念用随机变量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“X与Y有关系”,可按下面的步骤进行:(1)提出假设H0:X与Y无关;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:表示在H0成立的情况下,事件“χ2≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,就有99.9%的把握认为“X与Y有关系”;(2)如果χ2>6.635时,就有99%的把握认为“X 与Y 有关系”; (3)如果χ2>2.706时,就有90%的把握认为“X 与Y 有关系”;(4)如果χ2≤2.706时,就认为没有充分的证据显示“X 与Y 有关系”,但也不能作出结论“H 0成立”,即X 与Y 没有关系.[小问题·大思维]1.利用χ2进行独立性分析,估计值的准确度与样本容量有关吗?提示:利用χ2进行独立性分析,可以对推断的正确性的概率作出估计,样本容量n 越大,这个估计值越准确.如果抽取的样本容量很小,那么利用χ2进行独立性检验的结果就不具有可靠性.2.在χ2运算后,得到χ2的值为29.78,在判断因素相关时,P (χ2≥6.64)≈0.01和P (χ2≥7.88)≈0.005,哪种说法是正确的?提示:两种说法均正确.P (χ2≥6.64)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两因素相关;而P (χ2≥7.88)≈0.005的含义是在犯错误的概率不超过0.005的前提下认为两因素相关.[例1] 数据:[解] 由列联表中的数据,得χ2的值为χ2=1 633×(30×1 355-224×24)2254×1 379×54×1 579≈68.033>6.635.因此,有99%的把握认为每一晚打鼾与患心脏病有关系.解决一般的独立性分析问题,首先由所给2×2列联表确定a ,b ,c ,d ,a +b +c +d 的值,然后代入随机变量的计算公式求出观测值χ2,将χ2与临界值x 0进行对比,确定有多大的把握认为两个分类变量有关系.1.某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,经过调查得到如下列联表:系?解:由列联表中的数据,得χ2=189×(54×63-40×32)294×95×86×103≈10.759>6.635,∴有99%的把握认为工作态度与支持企业改革之间有关系.[例2] (1)(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[解] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关. 两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.独立性分析的步骤:要推断“X 与Y 是否有关”可按下面的步骤进行: ①提出统计假设H 0:X 与Y 无关;②根据2×2列联表与χ2计算公式计算出χ2的值; ③根据两个临界值,作出判断.2.为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.是否有90%的把握认为“学生选报文、理科与对外语的兴趣有关”?解:根据题目所给的数据得到如下列联表:χ2=361×(138×52-73×98)2211×150×236×125≈1.871×10-4.因为1.871×10-4<2.706,所以没有90%的把握认为“学生选报文、理科与对外语的兴趣有关”.[例3] 为了比较注射A ,B 两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A ,另一组注射药物B .下表1和表2分别是注射药物A 和药物B 后的试验结果.(疱疹面积单位:mm 2)表1:注射药物A 后皮肤疱疹面积的频数分布表表2:注射药物B 后皮肤疱疹面积的频数分布表完成下面2×2列联表,并回答是否有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.表3:[解]χ2=200×(70×65-35×30)2100×100×105×95≈24.56>6.635.因此,有99%的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”.在绘制列联表时,应对问题中的不同数据分成不同的类别,然后列表.要注意列联表中各行、各列中数据的意义及书写格式.3.已知某班n 名同学的数学测试成绩(单位:分,满分100分)的频率分布直方图如图所示,其中a ,b ,c 成等差数列,且成绩在[90,100]内的有6人.(1)求n 的值;(2)规定60分以下为不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助独立性检验分析是否有90%的把握认为“本次测试的及格情况与性别有关”?附:χ2=n (ad -bc )(a +b )(c +d )(a +c )(b +d )解:(1)依题意得⎩⎪⎨⎪⎧10(0.035+0.025+c +2b +a )=1,2b =a +c ,解得b =0.01. 因为成绩在[90,100]内的有6人, 所以n =60.01×10=60.(2)由于2b =a +c ,而b =0.01,可得a +c =0.02,则不及格的人数为0.02×10×60=12,及格的人数为60-12=48,设及格的人中,女生有x 人,则男生有x -4人, 于是x +x -4=48,解得x =26,故及格的人中,女生有26人,男生有22人. 于是本次测试的及格情况与性别的2×2列联表如下:结合列联表计算可得χ2=60×(22×4-8×26)30×30×48×12=1.667<2.706,故没有90%的把握认为“本次测试的及格情况与性别有关”.性别与患色盲是否有关?你所得到的结论在什么范围内有效?[解] 由题意作2×2列联表如下:法一:由列联表中数据可知,在调查的男人中,患色盲的比例是38480≈7.917%,女人中患色盲的比例为6520≈1.154%,由于两者差距较大,因而我们可以认为性别与患色盲是有关系的.法二:由列联表中所给的数据可知, a =38,b =442,c =6,d =514,a +b =480,c +d =520,a +c =44,b +d =956,n =1 000, 代入公式得χ2=1 000×(38×514-6×442)2480×520×44×956≈27.1.由于χ2≈27.1>6.635,所以我们有99%的把握即在犯错误不超过0.01的前提下认为性别与患色盲有关系. 这个结论只对所调查的480名男人和520名女人有效.1.下面是2×2列联表:则表中a ,b 的值分别为A .94,96 B .52,50 C .52,54D .54,52 解析:选C ∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54.2.下列关于χ2的说法中正确的是( )A .χ2在任何相互独立问题中都可以用于检验是否相关B .χ2的值越大,两个事件的相关性越大C .χ2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题D.χ2=n(ad-bc)(a+b)(c+d)(a+c)(b+d)答案:C3.对于因素X与Y的随机变量χ2的值,下列说法正确的是()A.χ2越大,“X与Y有关系”的可信程度越小B.χ2越小,“X与Y有关系”的可信程度越小C.χ2越接近于0,“X与Y没有关系”的可信程度越小D.χ2越大,“X与Y没有关系”的可信程度越大解析:选Bχ2越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即χ2越小,“X与Y有关系”的可信程度越小.4.若由一个2×2列联表中的数据计算得χ2的观测值为4.013,那么在犯错误的概率不超过________的前提下,认为两个变量之间有关系.解析:因为4.013>3.841,所以在犯错误的概率不超过0.05的前提下,认为两个变量之间有关系.答案:0.055.某矿石粉厂当生产一种矿石粉时,在数天内即有部分工人患职业性皮肤炎,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤炎患病人数如下:解析:χ2=103×(5×18-70×10)275×28×15×88≈13.826>6.635.故有99%的把握说,新防护服比旧防护服对预防工人职业性皮炎有效.答案:99%6.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99%的把握认为喜爱打篮球与性别有关;请说明理由. 附参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)列联表补充如下:(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>6.635,∴有99%的把握认为喜爱打篮球与性别有关.一、选择题1.有两个因素X 与Y 的一组数据,由其列联表计算得χ2≈4.523,则认为X 与Y 有关系是错误的可信度为( )A .95%B .90%C .5%D .10%解析:选C ∵χ2≥3.841.∴X 与Y 有关系的概率为95%,∴X 与Y 有关系错误的可信度为5%.2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:计算得,χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别有关”B .在犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有99%以上的把握认为“爱好该项运动与性别有关”D .有99%以上的把握认为“爱好该项运动与性别无关” 解析:选C 根据独立性分析的思想方法,正确选项为C.3.某高校“统计初步”课程的老师随机调查了选该课的一些学生情况,具体数据如下表:为了分析主修统中的数据,得到χ2=50(13×20-10×7)223×27×20×30≈4.84,所以断定主修统计专业与性别有关系,这种判断出错的可能性为( )A .0.025B .0.05C .0.975D .0.95解析:选B ∵χ2≈4.84>3.841,所以我们有95%的把握认为主修统计专业与性别无关,即判断出错的可能性为0.05.4.已知P (x 2≥2.706)=0.10,两个因素X 和Y ,取值分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若在犯错误的概率不超过0.1的前提下,认为X 与Y 有关系,则c 等于( )A .5B .6C .7D .8解析:选A 经分析,c =5. 二、填空题5.班级与成绩2×2列联表:表中数据m,n,p,解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸烟与患肺病是否相关的判断中,有下面的说法:①若χ2>6.64,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性分析可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性分析可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________.解析:χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说明③正确.答案:③7.统计推断,当________时,在犯错误的概率不超过0.05的前提下认为事件A与B 有关;当________时,认为没有充分的证据显示事件A与B是有关的.解析:当k>3.841时,就有在犯错误的概率不超过0.05的前提下认为事件A与B有关,当k<2.706时认为没有充分的证据显示事件A与B是有关的.答案:k>3.841k<2.7068.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).解析:因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a +b =1858,d c +d =2742,两者相差较大,所以,经直观分析,收看新闻节目的观众与年龄是有关的.答案:是 三、解答题9.某市对该市一重点中学2018年高考上线情况进行统计,随机抽查得到表格:解:对于上述四个科目,分别构造四个随机变量χ21,χ22,χ23,χ24.由表中数据可以得到:语文:χ21=244×(174×13-27×30)2201×43×204×40=7.294>6.64,数学:χ22=244×(178×20-23×23)2201×43×201×43=30.008>6.64,英语:χ23=244×(176×19-25×24)2201×43×200×44=24.155>6.64,综合科目:χ24=244×(175×17-26×26)2201×43×201×43=17.264>6.64.所以有99%的把握认为语文、数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.10.一次对人们休闲方式的调查中共调查了124人,其中女性70人,男性54人,女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2列联表;(2)能否在犯错误的概率不超过0.05的前提下认为性别与休闲方式有关系? 解:(1)2×2列联表如下:(2)χ2=124×(43×33-27×21)270×54×64×60≈6.201.因为6.201>3.841,所以有理由认为假设休闲方式与性别无关是不合理的,即在犯错误的概率不超过0.05的前提下认为休闲方式与性别有关.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学 8.4 列联表独立性分析案例同步精练湘教版选修2-3
基础巩固
1在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若χ2=6.64,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误
D.以上三种说法都不正确
2由下表中的数据计算χ2的值约为( )
A.9.45 B.6.08 C.1.78 D.0.01
3博士生和研究生毕业情况的一个随机样本给出了关于所获取的学位类别与学生性别的分类数据如下表,由表中的数据,可得( )
A .性别与获取学位类别有关
B .性别与获取学位类别无关
C .性别决定获取学位的类别
D .以上说法都不正确 4关于2×2列联表:
下列说法正确的是( )
A .表中的数据n 11,n 12,n 21,n 22可以取任意的正整数
B .n =n +1+n 2+
C .χ2=
n n 11n 12-n 21n 222
n 1+n 2+n +1n +2
D .两个因素X ,Y 的值域分别为{A ,A },{B ,B }
5为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联表: 药物效果与动物试验列联表
患病 未患病 总计 服用药 10 45 55 没服用药 20 30 50 总计
30
75
105
依据表中的数据求χ2≈________.(精确到0.01)
6为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠,在照射后14小时的结果如下表所示:
列联表独立性分析时的假设是______________________________.
7为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在现场时,990件产品中合格品有982件,次品有8件,甲不在现场时,510件产品中,合格品有493件,次品有17件.试用列联表独立性分析的方法对数据进行分析.
综合过关
8有人发现多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:
则大约有________的把握认为多看电视与人变冷漠有关系.〔已知P(χ2≥10.828)≈0.001〕9某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:
工作积极544094
工作一般326395
合计86103189
依据表中的数据对人力资源部的研究项目进行分析能够得出什么结论?
能力提升
10为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:
(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.
(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?
(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
参考答案
1解析:A、B是对χ2的误解,99%的把握认为吸烟和患肺病有关,是指通过大量的观察实验得出的一个数值,并不是100个人中必有99个人患肺病,也可能这100个人全健康,同理B错.故选C.
答案:C
2解析:χ2=39×167-29×1572×392
68×324×196×196
≈1.78.
答案:C 3解析:χ2=
162×8-143×272×340
305×35×189×151
≈7.34>6.64,
所以有充足的理由认为性别与获取学位类别有关.故应选A.而C 中的表述不恰当,因为性别与获取学位类别不是因果关系,只是统计学上的一种非确定性关系,故不能用“决定”二字描述.
答案:A
4解析:表中的数据n ij ≥5,故排除A ;n =n +1+n +2=n 1++n 2+=n 11+n 12+n 21+n 22,故排除B ;χ2=
n n 11n 22-n 21n 12
2
n 1+n 2+n +1n +2
,故排除C.故选D.
答案:D 5
解析:χ2=
105×10×30-20×45
2
30×75×55×50
≈6.11.
答案:6.11
6解析:根据列联表独立性分析的基本思想,可知类似反证法,即要确认“两个因素有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个因素没有关系”成立.对本题进行列联表独立性分析时的假设应是“小白鼠死亡与剂量无关”.
答案:小白鼠死亡与剂量无关
7分析:先列出列联表,根据所得列联表计算χ2,再利用χ2与临界值的大小关系来判断假设检验是否成立.
解:2×2列联表如下.
由2×2列联表中的数据进行计算 χ2=
1 500×982×17-493×8
2
1 475×25×510×990
≈13.097>6.64.
所以至少有99%的把握认为“质量监督员甲不在现场与产品质量有关系”. 8解析:由2×2列联表中的数据进行计算 χ2=
168×68×38-20×42
2
110×88×58×80
≈11.376 5>10.828,
所以,至少有99.9%的把握认为多看电视与人变冷漠有关系,故填99.9%. 答案:99.9%
9解:χ2=
189×54×63-32×402
86×103×94×95
≈10.759>6.64,
∴企业员工工作积极性和对待企业改革态度有关系.
10解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为
70
500
=14%. (2)χ2=
500×40×270-30×160
2
200×300×70×430
≈9.967.
由于9.967>6.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关. (3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女
的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.。