2020版高中数学 第三章 统计案例 3.1 独立性检验学案 苏教版选修2-3
2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3
§3.2 独立性检验的基本思想及其初步应用学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一 分类变量及2×2列联表思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表.y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d知识点二 等高条形图1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.2.如果通过直接计算或等高条形图发现aa +b 和cc +d相差很大,就判断两个分类变量之间有关系.知识点三 独立性检验1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.2.K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.3.独立性检验的具体做法(1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(2)利用公式计算随机变量K2的观测值k.(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.1.列联表中的数据是两个分类变量的频数.( √)2.事件A与B的独立性检验无关,即两个事件互不影响.( ×)3.K2的大小是判断事件A与B是否相关的统计量.( √)类型一等高条形图的应用例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?考点定性分析的两类方法题点利用图形定性分析解等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.反思与感悟在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d.两个比例的值相差越大,X与Y有关系成立的可能性就越大.跟踪训练1 网络对现代人的生活影响较大,尤其是对青少年,为了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了1 000人调查,发现其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.利用图形判断学生经常上网与学习成绩有关吗?考点定性分析的两类方法题点利用图形定性分析解根据题目所给的数据得到如下2×2列联表:经常上网不经常上网总计不及格80120200及格120680800总计200800 1 000得出等高条形图如图所示:比较图中阴影部分的高可以发现经常上网不及格的频率明显高于经常上网及格的频率,因此可以认为经常上网与学习成绩有关.类型二独立性检验例2 某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100根据表中数据,问是否在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.考点独立性检验及其基本思想题点独立性检验的方法解 将2×2列联表中的数据代入公式计算,得K 2的观测值k =n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(60×10-20×10)270×30×80×20=10021≈4.762. 因为4.762>3.841,所以在犯错误的概率不超过0.05的前提下认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.反思与感悟 (1)独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad -bc ≈0,因此|ad -bc |越小,关系越弱;|ad -bc |越大,关系越强. (2)独立性检验的具体做法①根据实际问题的需要确定允许推断“两个分类变量有关系”犯错误的概率的上界α,然后查表确定临界值k 0.②利用公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算随机变量K 2的观测值k .③如果k ≥k 0,推断“X 与Y 有关系”这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X 与Y 有关系”,或者在样本数据中没有发现足够的证据支持结论“X 与Y 有关系”. 跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系. 考点 独立性检验及其基本思想 题点 独立性检验的方法 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得K 2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关. 类型三 独立性检验的综合应用例3 (2017·全国Ⅱ改编)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).考点独立性检验思想的应用题点分类变量与统计、概率的综合性问题解(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”,由P (A )=P (BC )=P (B )P (C ),则旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62,新养殖法的箱产量不低于50 kg 的频率为(0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66,则事件A 的概率估计值为P (A )=P (B )P (C )=0.62×0.66=0.409 2, ∴A 发生的概率为0.409 2.(2)根据箱产量的频率分布直方图得到列联表:则K 2=200×(62×66-38×34)2100×100×96×104≈15.705,由15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. 反思与感悟 两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件X =x 1的个体中具有Y =y 1的个体所占的比例aa +b,也可以估计满足条件X =x 2的个体中具有Y =y 1的个体所占的比例cc +d.两个比例的值相差越大,X 与Y 有关系成立的可能性就越大.(2)观测值法:通过2×2列联表,先计算K 2的观测值k ,然后借助k 的含义判断“两个分类变量有关系”这一结论成立的可信程度.跟踪训练3 为了解某班学生喜爱打篮球是否与性别有关,对本班48人进行了问卷调查得到了如下的2×2列联表:已知在全班48人中随机抽取1人,抽到喜爱打篮球的学生的概率为23.(1)请将上面的2×2列联表补充完整(不用写计算过程);(2)能否在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关?说明你的理由;(3)现从女生中抽取2人进一步调查,设其中喜爱打篮球的女生人数为X ,求X 的分布列与均值. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题 解 (1)列联表补充如下:喜爱打篮球不喜爱打篮球合计 男生 22 6 28 女生 10 10 20 合计321648(2)由K 2=48×(220-60)228×20×32×16≈4.286.因为4.286>3.841,所以,能在犯错误的概率不超过0.05的前提下认为喜爱打篮球与性别有关. (3)喜爱打篮球的女生人数X 的可能取值为0,1,2. 其概率分别为 P (X =0)=C 210C 220=938,P (X =1)=C 110C 110C 220=1019,P (X =2)=C 210C 220=938,故X 的分布列为X 0 1 2 P9381019938X 的均值为E (X )=0+1019+919=1.1.某机构调查中学生的近视情况,了解到某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数 B .方差 C .回归分析 D .独立性检验 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 D2.对于分类变量X 与Y 的随机变量K 2的观测值k ,下列说法正确的是( )A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大考点独立性检验及其基本思想题点独立性检验的思想答案 B解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大,k越小,“X与Y有关系”的可信程度越小.3.用等高条形图粗略估计两个分类变量是否相关,观察下列各图,其中两个分类变量关系最强的是( )考点定性分析的两类方法题点利用图形定性分析答案 D解析由等高条形图易知,D选项两个分类变量关系最强.4.若在研究吸烟与患肺癌的关系中,通过收集、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是( )A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有考点独立性检验及其基本思想题点独立性检验的方法答案 D解析独立性检验的结论是一个统计量,统计的结果只是说明事件发生的可能性的大小,具体到一个个体,则不一定发生.5.高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据.总成绩好 总成绩不好 总计 数学成绩好 478 a490 数学成绩不好39924423 总计b c913(1)计算a ,b ,c 的值;(2)文科学生总成绩不好与数学成绩不好有关系吗? 考点 独立性检验及其基本思想 题点 独立性检验的方法解 (1)由478+a =490,得a =12. 由a +24=c ,得c =12+24=36. 由b +c =913,得b =913-36=877. (2)计算随机变量K 2的观测值k =913×(478×24-399×12)2490×423×877×36≈6.233>5.024,因为P (K 2≥5.024)≈0.025,所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系.1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有相关关系. 2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K 2的值,如果K 2的值很大,说明假设不合理.K 2越大,两个分类变量有关系的可能性越大.一、选择题1.下面是一个2×2列联表:y 1 y 2总计 x 1 a21 73 x 2825 33 总计b46106则表中a ,b 的值分别为( ) A .94,96 B .52,50 C .52,60D .54,52考点 分类变量与列联表 题点 求列联表中的数据 答案 C2.为了研究高中学生对乡村音乐的态度(喜欢和不喜欢两种态度)与性别的关系,运用2×2列联表进行独立性检验,经计算得K 2=7.01,则认为“喜欢乡村音乐与性别有关系”的把握约为( ) A .0.1% B .1% C .99% D .99.9% 考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 C解析 易知K 2=7.01>6.635,对照临界值表知,有99%的把握认为喜欢乡村音乐与性别有关系.3.在独立性检验中,两个分类变量“X 与Y 有关系”的可信度为99%,则随机变量K 2的观测值k 的取值范围是( ) A .[3.841,5.024) B .[5.024,6.635) C .[6.635,7.879) D .[7.879,10.828)考点 分类变量与列联表 题点 求观测值 答案 C4.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人数后,得到如下列联表:则随机变量K 2的观测值约为( ) A .0.600 B .0.828 C .2.712D .6.004考点 分类变量与列联表 题点 求观测值 答案 A解析 根据列联表中的数据,可得随机变量K 2的观测值k =90×(11×37-34×8)245×45×19×71≈0.600.故选A.5.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么这两个比值为( )A.a a +b 与c c +d B.a c +d 与c a +b C.aa +d 与cb +cD.ab +d 与ca +c考点 定性分析的两类方法 题点 利用图形定性分析 答案 A 解析 由题意,⎪⎪⎪⎪⎪⎪a a +b -c c +d =⎪⎪⎪⎪⎪⎪ac +ad -ac -bc (a +b )(c +d )=⎪⎪⎪⎪⎪⎪ad -bc (a +b )(c +d ),因为|ad -bc |的值越大,两个分类变量有关系的可能性就越大,故选A.6.有两个分类变量X ,Y ,其列联表如下所示,其中a,15-a 均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X ,Y 有关,则a 的值为( ) A .8 B .9 C .8或9D .6或8考点 分类变量与列联表 题点 求列联表中的数据 答案 C解析 根据公式,得K 2的观测值 k =65×[a (30+a )-(15-a )(20-a )]220×45×15×50=13×(13a -60)220×45×3×2>3.841,根据a >5且15-a >5, a ∈Z ,求得当a =8或9时满足题意.7.某班主任对全班50名学生进行了作业量的调查,数据如下表:则推断“学生的性别与认为作业量大有关”这种推断犯错误的概率不超过( ) A .0.01 B .0.025 C .0.005 D .0.001 考点 独立性检验及其基本思想 题点 独立性检验的方法答案 B解析 由公式得K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024.∵P (K 2≥5.024)=0.025,∴犯错误的概率不超过0.025. 二、填空题8.在吸烟与患肺病是否相关的判断中,有下面的说法:①若K 2的观测值k >6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;③从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误.其中说法正确的是________. 考点 独立性检验及其基本思想 题点 独立性检验的思想 答案 ③解析 K 2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法①不正确;说法②中对“确定容许推断犯错误概率的上界”理解错误;说法③正确. 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具体数据如下表:为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为K 2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性最大为__________.考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 5%解析 因为K 2>3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.10.2014年世界杯期间,某一电视台对年龄高于40岁和不高于40岁的人是否喜欢西班牙队进行调查,对高于40岁的调查了50人,不高于40岁的调查了50人,所得数据制成如下列联表:若工作人员从所有统计结果中任取一个,取到喜欢西班牙队的人的概率为35,则有超过________的把握认为年龄与西班牙队的被喜欢程度有关.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).考点 独立性检验及其基本思想 题点 独立性检验的方法 答案 95%解析 设“从所有人中任意抽取一个,取到喜欢西班牙队的人”为事件A ,由已知得P (A )=q +35100=35,所以q =25,p =25,a =40,b =60.K 2=100×(25×35-25×15)240×60×50×50=256≈4.167>3.841.故有超过95%的把握认为年龄与西班牙队的被喜欢程度有关. 三、解答题11.研究人员选取170名青年男女大学生的样本,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的有22名,否定的有38名;男生110名在相同的项目上作肯定的有22名,否定的有88名.问:性别与态度之间是否存在某种关系?分别用条形图和独立性检验的方法判断. 考点 定性分析的两类方法 题点 利用图形定性分析解 建立性别与态度的2×2列联表如下:根据列联表中所给的数据,可求出男生中作肯定态度的频率为110=0.2,女生中作肯定态度的频率为2260≈0.37.作等高条形图如图,其中两个深色条形的高分别表示男生和女生中作肯定态度的频率,比较图中深色条形的高可以发现,女生中作肯定态度的频率明显高于男生中作肯定态度的频率,因此可以认为性别与态度有关系.根据列联表中的数据得到K 2的观测值k =170×(22×38-22×88)2110×60×44×126≈5.622>5.024.因此,在犯错误的概率不超过0.025的前提下认为性别和态度有关系.12.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市民,得到数据如下表所示:喜欢 不喜欢 合计 大于40岁 20 5 25 20岁至40岁10 20 30 合计302555(1)判断是否有99.5%的把握认为喜欢“人文景观”景点与年龄有关?(2)用分层抽样的方法从喜欢“人文景观”景点的市民中随机抽取6人作进一步调查,将这6名市民作为一个样本,从中任选2人,求恰有1位大于40岁的市民和1位20岁至40岁的市民的概率. 考点 独立性检验思想的应用题点 分类变量与统计、概率的综合性问题解 (1)由公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得,观测值k ≈11.978>7.879,所以有99.5%以上的把握认为喜欢“人文景观”景点与年龄有关.(2)由题意知抽取的6人中大于40岁的市民有4个,20岁至40岁的市民有2个,分别记为B 1,B 2,B 3,B 4,C 1,C 2,从中任选2人的基本事件有(B 1,B 2),(B 1,B 3),(B 1,B 4),(B 1,C 1),(B 1,C 2),(B 2,B 3),(B 2,B 4),(B 2,C 1),(B 2,C 2),(B 3,B 4),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),(C 1,C 2),共15个,其中恰有1位大于40岁的市民和1位20岁至40岁的市民的事件有(B 1,C 1),(B 1,C 2),(B 2,C 1),(B 2,C 2),(B 3,C 1),(B 3,C 2),(B 4,C 1),(B 4,C 2),共8个,所以恰有1位大于40岁的市民和1位20岁至40岁的市民的概率为815.四、探究与拓展13.假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其中2×2列联表为:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d对同一样本,以下数据能说明X 与Y 有关的可能性最大的一组是( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =3,b =2,c =4,d =5考点 分类变量与列联表 题点 求列联表中的数据 答案 D解析 对于同一样本,|ad -bc |越小,说明x 与y 相关性越弱,而|ad -bc |越大,说明x 与y 相关性越强,通过计算知,对于A ,B ,C 都有|ad -bc |=|10-12|=2.对于选项D ,有|ad -bc |=|15-8|=7,显然7>2. 14.2017年世界第一届轮滑运动会(the first edtion of Roller Games)在南京举行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者.调查发现,男、女志愿者分别有10人和6人喜爱轮滑,其余不喜爱.得到2×2列联表如下.(1)根据2×2列联表,判断能否在犯错误的概率不超过0.10的前提下认为性别与喜爱轮滑有关? (2)从女志愿者中抽取2人参加接待工作,若其中喜爱轮滑的人数为ξ,求ξ的分布列和均值. 考点 独立性检验思想的应用题点 独立性检验与线性回归方程、均值的综合应用解 (1)假设:是否喜爱轮滑与性别无关.由已知数据可求得K 2的观测值为 k =30×(10×8-6×6)216×14×16×14≈1.157 5<2.706.因此不能在犯错误的概率不超过0.10的前提下认为喜爱轮滑与性别有关. (2)喜爱轮滑的人数ξ的可能取值为0,1,2, 则P (ξ=0)=C 06C 28C 214=2891=413,P (ξ=1)=C 16C 18C 214=4891,P (ξ=2)=C 26C 08C 214=1591.所以喜爱轮滑的人数ξ的分布列为4 13+1×4891+2×1591=67.所以喜爱轮滑的人数ξ的均值为E(ξ)=0×。
高中数学苏教版教材目录
高中数学苏教版教材目录(总4页)-CAL-FENGHAI.-(YICAI)-Company One1-CAL-本页仅作为文档封面,使用请直接删除苏教版-----------------------------------必修-----------------------第1章集合集合的含义及其表示子集、全集、补集交集、并集第2章函数函数的概念函数的概念和图象函数的表示方法函数的简单性质函数的单调性函数的奇偶性映射的概念第3章指数函数、对数函数和幂函数指数函数分数指数幂指数函数对数函数对数对数函数幂函数函数的应用函数与方程函数模型及其应用-----------------------------------必修2-----------------------------------第1章立体几何初步空间几何体棱柱、棱锥和棱台圆柱、圆锥、圆台和球中心投影和平行投影直观图画法点、线、面之间的位置关系平面的基本性质空间两条直线的位置关系 1.平行直线2.异面直线直线与平面的位置关系1.直线与平面平行2.直线与平面垂直平面与平面的位置关系1.两平面平行2.平面垂直空间几何体的表面积和体积空间几何体的表面积空间几何体的体积第2章平面解析几何初步直线与方程直线的斜率直线的方程1.点斜式2.两点式3.一般式两条直线的平行与垂直两条直线的交点平面上两点间的距离点到直线的距离圆与方程圆的方程直线与圆的位置关系圆与圆的位置关系空间直角坐标系空间直角坐标系空间两点间的距离-----------------------------------必修3-----------------------------------第1章算法初步算法的意义流程图顺序结构选择结构循环结构基本算法语句赋值语句输入、输出语句条件语句循环语句算法案例第2章统计抽样方法简单随机抽样1.抽签法2.随机数表法系统抽样分层抽样总体分布的估计频率分布表频率分布直方图与折线图茎叶图总体特征数的估计平均数及其估计方差与标准差线性回归方程第3章概率随机事件及其概率随机现象随机事件的概率古典概型几何概型互斥事件-----------------------------------必修4-----------------------------------第1章三角函数任意角、弧度任意角弧度制任意角的三角函数任意角的三角函数同角三角函数关系三角函数的诱导公式三角函数的图象和性质三角函数的周期性三角函数的图象与性质函数y=Asin(ωx+ψ)的图象三角函数的应用第2章平面向量向量的概念及表示向量的线性运算向量的加法向量的减法向量的数乘向量的坐标表示平面向量基本定理平面向量的坐标运算向量的数量积向量的应用第3章三角恒等变换两角和与差的三角函数两角和与差的余弦两角和与差的正弦两角和与差的正切二倍角的三角函数几个三角恒等式-----------------------------------必修5-----------------------------------第1章解三角形1.1正弦定理1.2余弦定理451.3正弦定理、余弦定理的应用 第2章 数列 2.1数列2.2等差数列等差数列的概念等差数列的通项公式等差数列的前n 项和2.3等比数列等比数列的概念等比数列的通项公式等比数列的前n 项和 第3章 不等式 3.1不等关系3.2一元二次不等式3.3二元一次不等式组与简单的线性规划问题二元一次不等式表示的平面区域二元一次不等式组表示的平面区域 简单的线性规划问题3.4基本不等式2b a ab +≤)0,0(≥≥b a 基本不等式的证明基本不等式的应用-----------------------------------选修-------------------------第1章 常用逻辑用语1.1命题及其关系四种命题充分条件和必要条件 1.2简单的逻辑联结词1.3全称量词与存在量词量词含有一个量词的命题的否定 第2章 圆锥曲线与方程 2.1圆锥曲线2.2椭圆椭圆的标准方程椭圆的几何性质2.3双曲线双曲线的标准方程双曲线的几何性质 2.4抛物线抛物线的标准方程抛物线的几何性质 2.5圆锥曲线的共同性质 第3章 导数及其应用3.1导数的概念平均变化率瞬时变化率——导数3.2导数的运算常见函数的导数函数的和、差、积、商的导数 3.3导数在研究函数中的应用单调性极大值和极小值最大值和最小值3.4导数在实际生活中的应用-----------------------------------选修-------------------------第1章 统计案例 1.1独立性检验 1.2回归分析第2章 推理与证明2.1合情推理与演绎推理合情推理演绎推理推理案例欣赏 2.2直接证明与间接证明直接证明间接证明 第3章 数系的扩充与复数的引入 3.1数系的扩充 3.2复数的四则运算 3.3复数的几何意义 第4章 框图 4.1流程图 4.2结构图-----------------------------------选修2------------------------第1章 常用逻辑用语1.1命题及其关系四种命题充分条件和必要条件 1.2简单的逻辑联结词1.3全称量词与存在量词量词含有一个量词的命题的否定 第2章 圆锥曲线与方程 2.1圆锥曲线2.2椭圆椭圆的标准方程椭圆的几何性质2.3双曲线双曲线的标准方程双曲线的几何性质 2.4抛物线抛物线的标准方程抛物线的几何性质 2.5圆锥曲线的统一定义2.6曲线与方程曲线与方程求曲线的方程曲线的交点 第3章 空间向量与立体几何3.1空间向量及其运算空间向量及其线性运算共面向量定理空间向量基本定理空间向量的坐标表示空间向量的数量积 3.2空间向量的应用直线的方向向量与平面的法向量空间线面关系的判定空间的角的计算-----------------------------------选修2-2-----------------------------------第一章 导数及其应用1.1导数的概念平均变化率瞬时变化率——导数1.2导数的运算常见函数的导数函数的和、差、积、商的导数简单复合函数的导数1.3导数在研究函数中的应用单调性极大值和极小值最大值和最小值1.4导数在实际生活中的应用1.5定积分曲边梯形的面积定积分微积分基本定理第二章推理与证明2.1合情推理与演绎推理合情推理演绎推理推理案例欣赏2.2直接证明与间接证明直接证明间接证明2.3数学归纳法第三章数系的扩充与复数的引入3.1数系的扩充3.2复数的四则运算3.3复数的几何意义-----------------------------------选修2-3-----------------------------------第一章计数原理1.1两个基本原理1.2排列1.3组合1.4计数应用题1.5二项式定理二项式定理二项式系数的性质及用第二章概率2.1随机变量及其概率分布2.2超几何分布2.3独立性条件概率事件的独立性2.4二项分布2.5随机变量的均值与方差离散型随机变量的均值离散型随机变量的方差与标准差2.6正态分布第三章统计案例3.1独立性检验3.2回归分析-----------------------------------选修4------------------------相似三角形的进一步认识平行线分线段成比例定理相似三角形圆的进一步认识圆周角定理圆的切线圆中比例线段圆内接四边形圆锥截线球的性质圆柱的截线圆锥的截线学习总结报告-----------------------------------选修4-2-----------------------------------二阶矩阵与平面向量矩阵的概念二阶矩阵与平面列向量的乘法几种常见的平面变换恒等变换伸压变换反射变换旋转变换投影变换切变变换变换的复合与矩阵的乘法矩阵乘法的概念矩阵乘法的简单性质逆变换与逆矩阵逆矩阵的概念二阶矩阵与二元一次方程组特征值与特征向量矩阵的简单应用学习总结报告-----------------------------------选修4-4-----------------------------------直角坐标系直角坐标系极坐标系球坐标系与柱坐标系曲线的极坐标方程曲线的极坐标方程的意义常见曲线的极坐标方程平面坐标系中几种常见变换平面直角坐标系中的平移变换平面直角坐标系中的伸缩变换参数方程参数方程的意义参数方程与普通方程的互化6参数方程的应用平摆线与圆的渐开线学习总结报告-----------------------------------选修4-5-----------------------------------不等式的基本性质含有绝对值的不等式含有绝对值的不等式的解法含有绝对值的不等式的证明不等式的证明比较法综合法和分析法反证法放缩法几个著名的不等式柯西不等式排序不等式算术-几何平均值不等式运用不等式求最大(小)值运用算术-几何平均值不等式求最大(小)值运用柯西不等式求最大(小)值运用数学归纳法证明不等式学习总结报告7。
最新2020高中数学 第3章 统计案例 3.1 独立性检验教学案 苏教版选修2-3
3.1 独立性检验1.2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.这些取值可用下面的2×2列联表表示.2.χ2统计量的求法公式χ2=n(ad-bc)2(a+c)(b+d)(a+b)(c+d).3.独立性检验的概念用统计量χ2研究两变量是否有关的方法称为独立性检验.4.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ与Ⅱ没有关系;(2)根据2×2列联表及χ2公式,计算χ2的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001χ00.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 8表示在H0成立的情况下,事件“χ≥x0”发生的概率.5.变量独立性判断的依据(1)如果χ2>10.828时,那么有99.9%的把握认为“Ⅰ与Ⅱ有关系”;(2)如果χ2>6.635时,那么有99%的把握认为“Ⅰ与Ⅱ有关系”;(3)如果χ2>2.706时,那么有90%的把握认为“Ⅰ与Ⅱ有关系”;(4)如果χ2≤2.706时,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.1.在2×2列联表中,通常要求a,b,c,d的值均不小于5.2.表中|ad-bc|越小,Ⅰ与Ⅱ关系越弱;|ad-bc|越大,Ⅰ与Ⅱ关系越强.同时要记准表中a,b,c,d四个数据是交叉相乘然后再作差取绝对值,一定不要乘错.3.表中类A与类B,以及类1与类2的关系:对于对象Ⅰ来说,类A与类B是对立的,也就是说类A发生,类B一定不发生,类A不发生,则类B一定发生;同样对于对象Ⅱ来说,类1与类2的关系也是如此.[例1] 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.[思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后找出相应的数据,列表即可.[精解详析] 作列联表如下:喜欢甜食不喜欢甜食合计男117413530女492178670合计609591 1 200[一点通] 分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.1.下面是2×2y1y2合计x1 a 2173x222527合计 b 46则表中a,b的值分别为________,________.解析:∵a+21=73,∴a=52.又∵a+2=b,∴b=54.答案:52 542.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人 .作出2×2列联表.性格内向 性格外向 合计 考前心情紧张 332 213 545 考前心情不紧张94 381 475 合计4265941 020[例2] 下表是某地区的一种传染病与饮用水的调查表:得病 不得病 合计 干净水 52 466 518 不干净水 94 218 312 合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人,饮用不干净水得病9人,不得病22人.按此样本数据分析这种疾病是否与饮用水有关,并比较两种样本在反映总体时的差异.[思路点拨] (1)根据表中的信息计算χ2的值,并根据临界值表来分析相关性的大小,对于(2)要列出2×2列联表,方法同(1).[精解详析] (1)假设H 0:传染病与饮用水无关.把表中数据代入公式,得χ2=830×(52×218-466×94)2146×684×518×312≈54.21,因为当H 0成立时,χ2≥10.828的概率约为0.001,所以我们有99.9%的把握认为该地区这种传染病与饮用不干净水有关. (2)依题意得2×2列联表:得病 不得病 合计 干净水 5 50 55 不干净水 9 22 31 合计147286此时,χ2=86×(5×22-50×9)214×72×55×31≈5.785.由于5.785>2.706,所以我们有90%的把握认为该种疾病与饮用不干净水有关.两个样本都能统计得到传染病与饮用不干净水有关这一相同结论,但(1)中我们有99.9%的把握肯定结论的正确性,(2)中我们只有90%的把握肯定.[一点通] 解决独立性检验问题的基本步骤是:①指出相关数据,作列联表;②求χ2的值;③判断可能性,注意与临界值作比较,得出事件有关的可能性大小.3.某保健药品,在广告中宣传:“在服用该药品的105人中有100人未患A 疾病”.经调查发现,在不使用该药品的418人中仅有18人患A 疾病,请用所学知识分析该药品对患A 疾病是否有效?解:依题意得2×2的列联表:患病 不患病 合计 使用 5 100 105 不使用 18 400 418 合计23500523要判断该药品对患A 疾病是否有效,即进行独立性检验提出假设H 0:该药品对患A 疾病没有效.根据列联表中的数据可以求得χ2=523×(5×400-100×18)223×500×418×105≈0.041 45<0.455,而查表可知P (χ2≥0.455)≈0.5,故没有充分的理由认为该保健药品对预防A 疾病有效.4.在国家未实施西部开发战略前,一新闻单位在应届大学毕业生中随机抽取1 000人问卷,只有80人志愿加入西部建设.而国家实施西部开发战略后,随机抽取1 200名应届大学毕业生问卷,有400人志愿加入国家西部建设.实施西部开发战略是否对应届大学毕业生的选择产生了影响?志愿者 非志愿者 合计 开发战略公布前 80 920 1 000 开发战略公布后400 800 1 200 合计4801 7202 200提出假设H 0:实施西部开发战略的公布对应届大学毕业生的选择没有产生影响,根据列联表中的数据,可以求得χ2=2 200×(80×800-920×400)2480×1 720×1 000×1 200≈205.22.因为当H 0成立时,χ2≥10.828的概率约为0.001,所以有99.9%的所握认为西部开发战略的实施对应届大学毕业生的选择产生了影响.独立性检验的基本思想与反证法的思想比较反证法 独立性检验要证明结论A要确认“两个对象有关系”在A 不成立的前提下进行推理 假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下计算χ2推出矛盾意味着结论A 成立由观测数据计算得到的χ2的观测值很大,则在一定可信程度上说明假设不合理 没有找到矛盾,不能对A 下任何结论,即反根据随机变量χ2的含义,可以通过概率P (χ2证法不成立≥x0)的大小来评价该假设不合理的程度有多大,从而得出“两个对象有关系” 这一结论成立的可信程度有多大课下能力提升(十八)一、填空题1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 解析:由χ2值可判断有关.答案:有关2.若两个研究对象X和Y的列联表为:y1y2x1515x24010则X与Y之间有关系的概率约为________.解析:因为χ2=(5+15+40+10)×(5×10-40×15)2(5+15)×(40+10)×(5+40)×(15+10)≈18.8,查表知P(χ2≥10.828)≈0.001.答案:99.9%3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号)①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病.②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病.③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.④以上三种说法都不正确.解析:由独立性检验的意义可知,③正确.答案:③4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表:看营养说明不看营养说明总计男大学生28836从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”)解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2=72×(28×20-16×8)244×28×36×36≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关.答案:有关5.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则由表可知大约有解析:由公式得χ2=168×(68×38-42×20)2110×58×88×80≈11.377>10.828,所以我们有99.9%的把握说,多看电视与人变冷漠有关.答案:99.9% 二、解答题6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:学生的数学成绩好坏与对学习数学的兴趣是否有关?解析:提出假设H 0:学生数学成绩的好坏与对学习数学的兴趣无关.由公式得χ2的值为χ2=189×(64×73-22×30)286×103×95×94≈38.459.∵当H 0成立时,χ2≥10.828的概率约为0.001,而这里χ2≈38.459>10.828,∴有99.9%的把握认为学生数学成绩的好坏与对学习数学的兴趣是有关的.7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表.试按照原试验目的作统计推断.解:提出假设H 0:种子是否灭菌与有无黑穗病无关.由公式得,χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,即当H 0成立时,χ2>3.841的概率约为0.05,所以我们有95%的把握认为种子是否灭菌与有无黑穗病是有关系的.8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响.解:2×2列联表如下提出假设H 0根据χ2公式得χ2=1 500(982×17-493×8)2990×510×1 475×25≈13.097.因为H 0成立时,χ2>10.828的概率约为0.001,而这里χ2≈13.097>10.828,所以有99.9%的把握认为质量监督员甲是否在生产现场与产品质量的好坏有关系.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
高中数学 第三章 统计案例 3.1 独立性检验 假设检验(h
假设检验(hypothesis testing)方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA)➢概述假设检验是分析数据的一种方法。
回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。
这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?”最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。
这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。
最有名的分布就是正态分布,它是:检验的基础。
t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。
➢适用场合·想知道一组或更多组数据的平均值、比例、方差或其他特征时;·当结论是基于更大总体中所取得的样本时。
例如:·想确定一个过程的均值或方差有否改变;·想确定很多数据集的均值或方差是否不同:·想确定两组不同的数据集的比例是否不同;·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。
➢实施步骤假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。
虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。
如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。
这些定义解释了假设检验的慨念,然后再回来看这个步骤。
本书不可能详细地涉及假设检验。
这个步骤是个综述和快速参考。
要得到更多的信息,查阅统计学参考书或请教统计学家。
1确定要从数据中获得的结论。
选择适当的检验方法。
用哪种检验取决于检验的目的和数据的种类。
苏教版数学高二数学苏教版选修2-3学案3.1独立性检验
3.1 独立性检验学习目标重点、难点1.通过典型案例的探究,了解独立性检验的基本思想、方法;2.会求χ2,会利用χ2判断两个变量有关系的把握程度,了解独立性检验的初步应用.重点:独立性检验的基本思想. 难点:利用χ2判断两个变量的关联程度.独立性检验1.用字母表示的2×2列联表:χ2=n (ad -bc )2(a +c )(b +d )(a +b )(c +d ).2.用χ2统计量研究这类问题的方法称为独立性检验. 3.临界值 P (χ2≥x 0)0.5 0.4 0.25 0.15 0.10 0.05 0.025 0.010 0.0050.001 x 00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828预习交流独立性检验的基本思想是什么?提示:把假设检验的基本思想具体化到独立性检验中,就可以通过随机变量χ2把两个分类变量的独立性进行检验.独立性检验的随机变量χ2=n (ad -bc )2(a +c )(b +d )(a +b )(c +d ).在预习中,还有哪些问题需要你在听课时加以关注?请在下列表格中做个备忘吧!我的学困点我的学疑点独立性检验的基本思想试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗? 思路分析:根据所给数据先求出χ2,再根据χ2进行判断. 解:根据2×2列联表中的数据,得χ2=339×(43×121-162×13)2205×134×56×283≈7.469.因7.469>6.635,所以我们有99%的把握说:50岁以上的人患慢性气管炎与吸烟有关.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪根据以上数据,能否得出关于心脏搭桥手术与又发作过心脏病一定有关的结论为__________.答案:不能解析:χ2=392×(39×167-157×29)2196×196×68×324≈1.779.因为χ2<2.706,所以不能作出心脏搭桥手术与又发作心脏病之间有关系的结论.独立性检验的基本步骤:①根据题意列出2×2列联表;②根据公式求出χ2;③比较χ2与临界值的关系;④作出两变量是否有关系的程度把握.1.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响.影响学生的健康成长,下表给出性别与吃零食的列联表,根据表中数据得出结论:吃零食与性别__________.(填“有关”答案:有关解析:χ2=85×(5×28-12×40)217×68×45×40≈4.722>3.841.故约有95%的把握认为“吃零食与性别有关”.2.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到如下数据.试推断有答案:95%解析:χ2=460×(26×200-184×50)2210×250×76×384≈4.804.由于4.804>3.841,所以我们有95%的把握认为种子灭菌与发生黑穗病是有关系的. 3.对电视节目单上的某一节目,观众的态度如下表,根据表中数据得到χ2≈1.224,你的结论为__________.答案:观众是否同意这一节目与性别无关解析:χ2≈1.224<2.706,所以不能作出是否同意这一节目与性别有关,即观众是否同意这一节目与性别无关.4.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,下列说法中正确的有__________.①100个吸烟者中至少有99人患有肺癌;②1个人吸烟,那么这个人有99%的概率患有肺癌; ③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有. 答案:④ 解析:独立性检验的结果与实际问题是有差异的,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性是存在差异的.5.某班班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?(2)问:学生的学习积极性与对待班级工作的态度是否有关系?解:(1)积极参加班级工作的学生有24人,总人数为50,故所求概率为2450=1225.不太主动参加班级工作且学习积极性一般的学生有19人,故所求概率为1950.(2)由公式得χ2=50×(18×19-6×7)225×25×24×26≈11.538.因为11.538>10.828,所以我们有99.9%的把握认为学生的学习积极性与对待班级工作的态度有关系.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
高中数学各章节
高中数学目录此文为人教必修版新教材高中数学目录必修一第一章1.1集合与集合的表示方法1.1.1集合的概念1.1.2集合的表示方法第二章2.1函数2.1.1函数2.1.2函数的表示方法2.1.3函数的单调性2.1.4函数的奇偶性2.1.5用计算机作函数图像〔选学〕2.2一次函数和二次函数2.2.1一次函数的性质与图像2.2.2二次函数的性质与图像2.3函数的应用〔1〕2.4函数与方程2.4.1函数的零点2.4.2求函数零点近似解的一种计算方法----二分法第三章根本初等函数〔1〕3.1指数与指数函数3.1.1实数指数幕及其运算3.1.2指数函数3.2对数与对数函数3.2.1对数及其运算3.2.2对数函数3.2.3指数函数与对数函数的关系3.3黑函数3.4函数的应用〔2 〕必修二第一章立体几何初步1.1空间几何体1.1.1构成空间几何体的根本元素1.1.2棱柱棱锥棱台的结构特征1.1.3圆柱圆锥圆台和球1.1.4投影与直观图1.1.5三视图1.1.6棱柱棱锥棱台和球的外表积1.1.7柱锥台和球的体积1.2点线面之间的位置关系1.2.1平面的根本性质与推论1.2.2空间中的平行关系1.2.3空间中的垂直关系第二章平面解析几何初步2.1平面直角坐标系中的根本公式2.1.1数轴上的根本公式2.1.2平面直角坐标系中的根本公式2.2直线的方程2.2.1直线方程的概念与直线的斜率2.2.2直线方程的集中形式2.2.3两条直线的位置关系2.2.4点到直线的距离2.3圆的方程2.3.1圆的标准方程2.3.2圆的一般方程2.3.3直线与圆的位置关系2.3.4圆与圆的位置关系2.4空间直角坐标系2.4.1空间直角坐标系2.4.2空间两点距离公式必修三第一章算法初步1.1算法与程序框图1.1.1算法的概念1.1.2程序框图1.1.3算法的三种根本逻辑结构和框图表示1.2根本算法语句1.2.1赋值输入输出语句1.2.2条件语句1.2.3循环语句1.3中国古代数学中的算法案例第二章统计2.1随机抽样2.1.1简单的随机抽样2.1.2系统抽样2.1.3分层抽样2.1.4数据的收集2.2用样本估计总体2.2.1用样本的频率分布估计总体的分布2.2.2用样本的数字特征估计总体的数字特征2.3变量的相关性2.3.1变量间的相互关系2.3.2两个变量的线性相关第三章概率3.1事件与概率3.1.1随机现象3.1.2事件与根本领件空间3.1.3频率与概率3.1.4概率的加法公式3.2古典概型3.2.1古典概型3.2.2概率的一般加法公式〔选学〕3.3随机数的含义与应用3.3.1几何概型3.3.2随机数的含义与应用3.4概率的应用必修四第一章根本的初等函数〔2〕1.1任意角的概念与弧度制1.1.1角的概念的推广1.1.2弧度制和弧度制与角度制的换算1.2任意角的三角函数1.2.1三角函数的定义1.2.2单位圆与三角函数线1.2.3同角三角函数的根本关系式1.2.4诱导公式1.3三角函数的图像与性质1.3.1正弦函数的图像与性质1.3.2余弦函数正切函数的图像与性质1.3.3三角函数值求角第二章平面向量2.1向量的线性运算2.1.1向量的概念2.1.2向量的加法2.1.3向量的减法2.1.4数乘向量2.1.5向量共线的条件和轴上向量坐标运算2.2向量的分解和向量的坐标运算2.2.1平面向量根本定理2.2.2向量的正交分解与向量的直角坐标运算2.2.3用平面向量坐标表示向量共线条件2.3平面向量的数量积2.3.1向量数量积的物理背景与定义2.3.2向量数量积的运算律2.3.3向量数量积的坐标运算与度量公式2.4向量的应用2.4.1向量在几何中的应用2.4.2向量在物理中的应用第三章三角恒等变换3.1和角公式3.1.1两角和与差的余弦3.1.2两角和与差的正弦3.1.3两角和与差的正切3.2倍角公式和半角公式3.2.1倍角公式3.2.2半角的正弦余弦和正切3.3三角函数的积化和差与和差化积必修五第一章解三角形1.1正弦定理和余弦定理1.1.1正弦定理1.1.2余弦定理1.2应用举例第二章数列2.1数列2.1.1数列2.1.2数列的递推公式〔选学〕2.2等差数列2.2.1等差数列2.2.2等差数列的前n项和2.3等比数列2.3.1等比数列2.3.2等比数列的前n项和第三章不等式3.1不等关系与不等式3.1.1不等关系与不等式3.1.2不等式性质3.2均值不等式3.3一元二次不等式及其解法3.4不等式的实际应用3.5二元一次不等式〔组〕与简单的线性规划问题3.5.1二元一次不等式〔组〕所表示的平面区域3.5.2简单线性规划选修2-1第一章常用逻辑用语1.1命题与量词1.1.1命题1.1.2量词1.2根本逻辑联结词1.2.1且与或1.2.2非〔否认〕1.3充分条件必要条件与命题的四种形式1.3.1推出与充分条件必要条件1.3.2命题的四种形式第二章圆锥曲线方程2.1曲线方程2.1.1曲线与方程的概念2.1.2由曲线求它的方程由方程研究曲线性质2.2椭圆2.2.1椭圆的标准方程2.2.2椭圆的集几何性质2.3双曲线2.3.1双曲线的标准方程2.3.2双曲线的几何性质2.4抛物线2.4.1抛物线的标准方程2.4.2抛物线的几何性质2.5直线与圆锥曲线第三章空间向量与几何体3.1空间向量及其运算3.1.1空间向量的线性运算3.1.2空间向量的根本定理3.1.3两个向量的数量积3.1.4空间向量的直角坐标运算3.2空间向量在立体几何中的应用3.2.1直线的方向向量与直线的向量方程3.2.2平面的法向量与平面的向量表示3.2.3直线与平面的夹角3.2.4二面角及其度量3.2.5距离〔选学〕选修2-2第一章导数及其应用1.1导数1.1.1函数的平均变化率1.1.2瞬时速度与导数1.1.3导数的几何1.2导数的运算1.2.1常数函数与黑函数的导数1.2.2导数公式表及数学软件的应用1.2.3导数的四那么运算法那么1.3导数的应用1.3.1利用导数判断函数的单调性1.3.2利用导数研究函数的极值1.3.3导数的实际应用1.4定积分与微积分的根本定理1.4.1曲边梯形面积与定积分1.4.2微积分根本定理第二章推理与证实2.1合情推理与演绎推理2.1.1合情推理2.1.2演绎推理2.2直接证实与间接证实2.2.1综合法与分析法2.2.2反证法2.3数学归纳法2.3.1数学归纳法2.3.2数学归纳法应用举例第三章娄嫁的扩充与复数3.1数系的扩充与复数的概念3.1.1实数系3.1.2复数的概念3.1.3复数的几何意义3.2复数的运算3.2.1复数的加法与减法3.2.2复数的乘法3.2.3复数的除法选修2-3第一章计数原理1.1根本计数原理1.2排列与组合1.2.1排列1.2.2组合1.3二项式定理1.3.1二项式定理1.3.2杨辉三角第二章概率2.1离散型随机变量及其分布列2.1.1离散型随机变量2.1.2离散型随机变量的分布列2.1.3超几何分布2.2条件概率与实践的独立性2.2.1条件概率2.2.2事件的独立性2.2.3独立重复试验与二项分布2.3随机变量的数字特征2.3.1离散型随机变量的数学期望2.3.2离散型随机变量的方差2.4正态分布第三章统计案例3.1独立性检验3.2回归分析选修4-4第一章坐标系1.1直角坐标系平面上的伸缩变换1.1.1直角坐标系1.1.2平面上的伸缩变换1.2极坐标系1.2.1平面上点的极坐标1.2.2极坐标与直角坐标的关系1.3曲线的极坐标方程1.4圆的极坐标方程1.4.1圆心在极轴上且过极点的圆1.4.2圆心在点〔a,n/2〕处且过极点的圆1.5柱坐标系和球坐标系1.5.1柱坐标系1.5.2球坐标系第二章参数方程2.1曲线的参数方程2.1.1抛射体的运动2.1.2曲线的参数方程2.2直线与圆的参数方程2.2.1直线的参数方程2.2.2圆的参数方程2.3圆锥曲线的参数方程2.3.1椭圆的参数方程2.3.2双曲线的参数方程2.3.3抛物线的参数方程2.4一些常见曲线的参数方程2.4.1摆线的参数方程2.4.2圆的渐开线的参数方程。
3.1独立性检验
n
n
同理可得:吸烟但未患病人数:n P( AB) n a b b d
n
n
不吸烟但患病人数: n P( AB) n c d a c
n
n
不吸烟且未患病人数:nຫໍສະໝຸດ P( AB) n c d b d
n
n
实际观测值
如果实际观测值与预 期估计值差异不“大”, 那么我们就可以认为 这些差异是由随机误 差造成的,即假设 H 0 不能被所给数据否定。 否则,应认为假设 H0 不能接受
将以上数据代入公式得:
2 11.8634,
吸烟
这个值是大还是小呢? 不吸烟
总计
患病 37 21 58
不患病 183 274 457
总计 220 295 515
统计学家估算出如下的概率: P( 2 6.635 ) 0.01
即在H0成立的情况下,2的值大于6.635的概率非常小,近似于0.01,即1%.
问题一:我们想要研究“吸烟与患呼吸道疾病的关系”时,需要研究 哪些量呢?
吸烟且患病的人数、不吸烟但患病的人数
为了研究这个问题,我们将是否吸烟与患病的数据用2×2列联表表示:
列联表:分类变量的汇总统计表(频数表)
一般地,假设有两个分类变量 X 和 Y,它们的取值分别为
{x1,x2}和{y1,y2},其样本频数表称为列联表 ,又称为 2×2 列联表,其形式为
(b n a b b d )2 (c n c d a c )2 (d n c d b d )2
n n
n n
nn
n a b bd
n cd a c
n cd bd
nn
nn
nn
化简得: 2 =
n(adb)c2
江苏省苏州市高中数学 第三章 统计案例 3.2.1 独立性检验教学设计2 新人教A版选修2-3
独立性检验
一、教学目标
1.使学生理解分类变量(也称属性变量或定性变量)的含义,体会两个分类变量之间可能具有相关性;
2.通过对典型案例(吸烟和患肺癌有关吗?)的探究,使学生了解独立性检验(只要求2×2列联表)的基本思想、方法、步骤及应用;
3.鼓励学生体验用多种方法(等高条形图和独立性检验)解决同一问题,并对各种方法的优缺点进行比较;
4.让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性(如统计可能犯错误,原因可能是收集的数据样本容量小或样本采集不合理,也可能是理论上的漏洞,如在一次实验中,我们假设小概率事件不发生,这一点本身就值得质疑).
二、重点
本节的重点内容是通过实例让学生体会独立性检验的基本思想,掌握独立性检验的一般步骤.
三、难点
在授课过程中,学生学习过程中遇到的困难主要有以下几个方面:
K的结构的比较奇特,也来的有点突然,学生可能会提出疑问。
1.2
2.如何理解独立性检验的基本思想?
3.独立性检验的一般步骤及背后的理论依据是什么?
4.为什么在最后表达结论的时候要说明“在犯错误的概率不超过XX的前提下”。
四、教学模式
“问题串”模式为主,理清教学思路,鼓励学生思考;“讲授式”为辅,解释学生难以自主探究的知识内容.
五、教学过程设计
:吸烟会影响到烟民的寿命吗?“吸烟有害健康”,这是我
数据列成一张表格便于分类加
它们之间有某种相互关联?
只涉及两种解决方法,
:在数据处理过程中,我们用到的统计量题
一个成立而另外。
高中数学第三章统计案例1独立性检验卡方检验素材苏教版
2χ检验(一)掌握内容1. 2χ检验的用途。
2. 四格表的2χ检验.(1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。
3. 行⨯列表的2χ检验. (二) 熟悉内容频数分布拟合优度的2χ检验. (三) 了解内容1.2χ分布的图形。
2.四格表的确切概率法。
(一) 2χ检验的用途2χ检验(Chi —square test )用途较广,主要用途如下:1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想1.2χ检验的基本思想是以2χ值的大小来反映理论频数与实际频数的吻合程度。
在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2χ值不应该很大,若实际计算出的2χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠).2. 基本公式:()∑-=TT A 22χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency ).四格表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2χ值是一致的。
(三)率的抽样误差与可信区间 1.率的抽样误差与标准误样本率与总体率之间存在抽样误差,其度量方法:np )1(ππσ-=,π为总体率,或 (8—1)np p S p )1(-=,p为样本率;(8—2)2.总体率的可信区间当n 足够大,且p 和1—p 均不太小,p 的抽样分布逼近正态分布.总体率的可信区间:(ppS u p S u p ⨯+⨯-2/2/,αα)。
(8—3)(四)2χ检验的基本计算见表8-1。
表8—1 2χ检验的用途、假设的设立及基本计算公式资料形式 用途 0H 、1H 的设立与计算公式 自由度 四格表 ①独立资料两 样本率的比较②配对资料两样本率的比较0H :两总体率相等 1H :两总体率不等①专用公式))()()(()(22d b c a d c b a n bc ad ++++-=χ②当n ≥40但1≤T 〈5时,校正公式))()()(()2/(22d b c a d c b a n n bc ad ++++--=χ③配对设计cb c b +--=22)1(χ1 R ⨯C 表 ①多个样本率、 0H :多个总体率(构成比)相等 (R —1)构成比的比较②两个变量之间关联性分析(0H:两种属性间存在关联)1H:多个总体率(构成比)不全相等(H:两种属性间存在关联))1(22-=∑CRnnAnχ(C—1)频数分布表频数分布的拟合优度检验H:资料服从某已知的理论分布1H:资料不服从某已知的理论分布∑-TTA2)(据频数表的组数而定(五)四格表的确切概率法当四格表有理论数小于1或n〈40时,宜用四格表的确切概率法。
2020高中数学 第3章 统计案例章末小结与测评教学案 苏教版选修2-3
第3章统计案例一、独立性检验1.独立性检验的思想及方法独立性检验的基本思想类似于数学中的反证法,要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个对象没有关系”成立,在该假设下构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2的观测值很大,则在一定程度上说明假设不合理.根据随机变量X的含义,可以通过概率来评价假设不合理程度.2.独立性检验的一般步骤(1)提出假设H0;(2)根据样本数据列2×2列联表,计算χ2=n(ad-bc)2(a+b)(a+c)(b+d)(c+d);(3)比较χ2与临界值的大小并作出判断.二、回归分析回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.建立回归模型的基本步骤:(1)确定两个变量;(2)画出散点图;(3)进行相关系数检验;(4)确定线性回归方程类型,求出回归方程.建立回归模型的基本步骤,不仅适用于线性回归模型,也适用于非线性回归模型的建立.(考试时间:120分钟试卷总分:160分)一、填空题(本大题共14小题,每小题5分,共70分)1.下列有关线性回归的说法①变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;②在平面直角坐标系中用描点的方法得到具有相关关系的两个变量的一组数据的图形叫做散点图;③线性回归直线得到具有代表意义的线性回归方程;④任何一组观测值都能得到具有代表意义的线性回归方程.其中错误的是________. 解析:任何一组观测值并不都能得到具有代表意义的线性回归方程. 答案:④2.下表是x 与y ________.解析:∵x =0+1+2+34=1.5,y =1+3+5+74=4,∴样本点的中心为(1.5,4),而回归直线必过样本点的中心,故必过(1.5,4).答案:(1.5,4) 3.对两个变量y 和x 进行线性相关性检验,已知n 是观察值组数,r 是相关系数,且已知:①n =7,r =0.953 3;②n =15,r =0.301 2;③n =17,r =0.999 1;④n =3,r =0.995 0,则变量y 和x 具有线性相关关系的是________.(填序号)解析:判断变量y 与x 是否具有线性相关关系时,观察值组数n 不能太小.若y 与x 具有线性相关性,则相关系数|r |≥0.75,故②④错.答案:①③4.由线性回归直线方程y ∧=4.75x +157,当x =28时,y ∧为________. 解析:将x 的值代入回归直线方程得估计值y ∧=4.75×28+157=290. 答案:2905.一家保险公司调查其总公司营业部的加班情况,收集了10周中每周加班工作时间y (小时)与签发保险单数目x 的数据如下表所示:已知用最小二乘法估计求出的线性回归方程的斜率为0.003 585,则线性回归方程为________________________________________________________________________.解析:线性回归直线y ∧=b ∧x +a ∧过样本中心点(x -,y -),故将x -,y -求出代入即可.答案:y ∧=0.118 2+0.003 585x6.某班主任对全班50名学生进行了作业量多少的调查,数据如下表,则喜不喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为________.解析:假设H 0:喜欢玩电脑游戏与认为作业量的多少没有关系,根据列联表中的数据,可以求得χ2=50×(18×15-9×8)227×23×26×24≈5.06,对照临界值表,当假设成立时,χ2≥5.024的概率约为0.025,所以我们有97.5%的把握认为喜欢玩电脑游戏与认为作业量的多少有关系.答案:97.5%7.下列关于回归分析与独立性检验的说法正确的是________.(填序号) ①回归分析和独立性检验没有什么区别;②回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定性关系; ③回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验;④独立性检验可以100%确定两个变量之间是否具有某种关系.解析:由回归分析、独立性检验的意义知,回归分析与独立性检验都是研究两个变量之间的相关性,但方法与手段有所不同,研究角度不同.由其意义知,③正确.答案:③8. 如图,有5组数据对(x ,y ),去掉哪组数据后剩下的4组数据的线性相关程度最大________.解析:由散点图可知,除D 之外的其余各点近似地在某条直线附近,而D 点则偏离这一直线.故应去掉D . 答案:D9.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4 ℃时,用电量的度数约为________.解析:由题意可知x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68.答案:6810.吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表给出性别与吃零食的2×2列联表:解析:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=85(140-480)217×68×45×40≈4.722>3.841.故约有95%的把握认为“吃零食与性别”有关. 答案:有11.变量x ,y 具有线性相关关系,当x 的取值分别为8,12,14和16时,通过观测知y 的值分别为5,8,9和11,若在实际问题中,y 的预报值最大是10,则x 的最大取值不能超过________.解析:因为x =16时,y =11;当x =14时,y =9,所以当y 的最大值为10时,x 的最大值属于区间(14,16).答案:1512.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由某散点图可知,用水量y y ∧=-0.7x +a ∧,则该厂6月份的用水量约为________.解析:∵x =2.5,y =3.5,b ∧=-0.7,∴a ∧=3.5+0.7×2.5=5.25. ∴当x =6时,y ∧=-0.7×6+5.25=1.05. 答案:1.05百吨13.为研究变量x 和y 的线性相关关系,甲、乙两人分别作了研究,利用线性回归方程得到回归直线l 1和l 2,两人计算知x 相同,y 也相同,则l 1与l 2的位置关系是________.解析:每条回归直线都过样本的中心(x ,y ). 答案:l 1与l 2有公共点(x ,y )14.变量X 与Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U 与V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r 1表示变量Y 与X 之间的线性相关系数,r 2表示变量V 与U 之间的线性相关系数,则________.(填序号)①r 2<r 1<0;②0<r 2<r 1;③r 2<0<r 1;④r 2=r 1.解析:对于变量Y 与X 而言,Y 随X 的增大而增大,故Y 与X 正相关,即r 1>0;对于变量V 与U 而言,V 随U 的增大而减小,故V 与U 负相关,即r 2<0,所以有r 2<0<r 1.答案:③二、解答题(本大题共6小题,共90分,解答应写出必要的文字说明、证明过程或演算步骤)15.(本小题满分14分)某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:画出散点图并判断热茶销售量与气温之间是否具有线性相关关系.解:由表中数据画出散点图,如图所示.由散点图可知热茶销售量与气温之间具有较强的线性相关关系.16.(本小题满分14分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:其中a ,15-a 均为大于5的整数,则取何值时,有90%的把握认为x 与y 之间有关系?解:查表可知,要有90%的把握认为x 与y 之间有关系,则χ2≥2.706,而 χ2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90.由χ2≥2.706,得a ≥7.19或a ≤2.04.又a >5,且15-a >5,a ∈Z ,即a =8,9. 故a 为8或9时,有90%的把握认为x 与y 之间有关系.17.(本小题满分14分)某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:解:根据列联表中的数据,得到 χ2=189×(54×63-40×32)294×95×86×103=10.76.因为10.76>7.879,所以有99.5%的把握说:员工“工作积极”与“积极支持企业改革”是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.18.(本小题满分16分)某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高约为多少?解:由题意父亲身高x cm 与儿子身高y cm 对应关系如表:则x -=173+170+1763=173,y -=170+176+1823=176,∑3i =1 (x i -x )(y i -y )=(173-173)×(170-176)+(170-173)×(176-176)+(176-173)(182-176)=18,∑3i =1(x i -x )2=(173-173)2+(170-173)2+(176-173)2=18.19.(本小题满分16分)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:现规定平均成绩在80分以上(不含80分)的为优秀. (1)试分别估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.解:(1)由题意知,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%.(2)列联表如下:因为χ2=100×(30×25-20×25)250×50×55×45=10099≈1.010,所以由参考数据知,没有75%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.20.(本小题满分16分)某运动员训练次数与运动成绩之间数据关系如下:(1)作出散点图; (2)求出回归方程;(3)计算相关系数,并利用其检验两变量的相关关系的显著性; (4)试预测该运动员训练47次和55次的成绩.解:(1)作出该运动员训练次数(x )与成绩(y )之间的散点图,如图所示,由散点图可知,它们之间具有线性相关关系.(2)计算得x =39.25,y =40.875,b ∧≈1.0415,a ∧≈-0.004,所求回归方程为y ∧=1.0415 x -0.004.(3)计算得∑8i =1x 2i =12 656,∑8i =1y 2i =13 731,r=∑8i=1x i y i-8x-y-∑8i=1x2i-8x2∑8i=1y2i-8y2=345.2512 656-8×39.252×13 731-8×40 8752≈345.25347.79≈0.993,查表得r0.05=0.707,r>r0.05,由此可得出,训练次数与运动成绩有较强的线性相关关系.(4)由上述分析可知,我们可用回归方程y=1.041 5x-0.004作为该运动员成绩的预报值.将x=47和x=55分别代入该方程可得y≈49和y≈57.故预测该运动员训练47次和55次的成绩分别为49和57.。
2019-2020年高中数学3.1《独立性检验》教案1苏教版选修2-3
教学目标(1 )通过对典型案例的探究,了解独立性检验(只要求列联表)的基本思想、方法及初 步应用;(2 )经历由实际问题建立数学模型的过程,体会其基本方法.教学重点、难点: 独立性检验的基本方法是重点•基本思想的领会及方法应用是难点. 教学过程 一•问题情境5月31日是世界无烟日。
有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。
这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题:1.某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者 220人,不吸烟者295人.调查结果是:吸烟的 220人中有37 人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的 295人中有21人患病,274人未患病.问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? .学生活动(2 )估计吸烟者与不吸烟者患病的可能性差异: 在吸烟的人中,有的人患病,在不吸烟的人中,有的人患病. 问题:由上述结论能否得出患病与吸烟有关?把握有多大?三.建构数学1. 独立性检验:(1 )假设:患病与吸烟没有关系.若将表中“观测值”用字母表示,则得下表:的比例应差不多,由此可得,即a (c - d ) : c (a -b )= ad -be :“ 0,因此,越小,患病与吸烟之间的关系越弱,否则,关系越强.)设,在假设成立的条件下,可以通过求“吸烟且患病”、“吸烟但未患病”、“不吸烟但患病”、“不吸烟且未患病”的概率(观测频率) ,将各种人群的估计人数用表示出来.例如:“吸烟且患病”的估计人数为n P(AB) : na 亠b b 亠d“吸烟但未患病” 的估计人数为n P (AB ) n : n n“不吸烟但患病”的估计人数为 n P (ABh n * 匚;n n“不吸烟且未患病”的估计人数为n P (AB ) n乞卫.n n如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设•否则,应认为假设不能接受,即可作出与假设相反的结论.(2)卡方统计量:为了消除样本对上式的影响,通常用卡方统计量(x 2)来进行估计.卡方x 2统计量公式:c 亠d a’cnn2n ad -bca b c d a c b d下,随机事件“”发生的概率约为,即,也就是说,在成立的情况下,对统计量x 2进行多次观测,观测值超过的频率约为.由此,我们有 99%勺把握认为不成立,即有 99%勺把握认为“患病 与吸烟有关系”. 象以上这种用统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验. 说明:2(1)估计吸烟者与不吸烟者患病的可能性差异是用频率估计概率,利用x 进行独立性检验,可以对推断的正确性的概率作出估计,观测数据取值越大,效果越好•在实际 应用中,当均不小于 5,近似的效果才可接受.)这里所说的“呼吸道疾病与吸烟有关系”是一种统计关系,这种关系是指“抽烟的人患呼吸道疾病的可能性(风险)更大”,而不是说“抽烟的人一定患呼吸道疾病” (3)在假设下统计量 x 2应该很小,如果由观测数据计算得到x 2的观测值很大,则在一定程度上说明假设不合理(即统计量 x 2越大,“两个分类变量有关系”的可能性就越大).2•独立性检验的一般步骤:一般地,对于两个研究对象I 和n,i 有两类取值:类和类(如吸烟与不吸烟),nn类类合计I类类合计推断和有关系”的步骤为:(其中)由此若成立,即患病与吸烟没有关系,则x 2的值应该很小.把a =37,b =183,c =21,d =274 代入计算得x 2,统计学中有明确的结论,在成立的情况b-n -2:a-nx 兰5 Xnnfd _n第一步,提出假设:两个分类变量i和n没有关系;第二步,根据2X2列联表和公式计算x 2统计量;第三步,查对课本中临界值表,作出判断.3 •独立性检验与反证法:反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;独立性检验(假设检验)原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立.四•数学运用1例题:例仁在500人身上试验某种血清预防感冒的作用,把他们一年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示.问:该种血清能否起到预防感冒的作用?分析:在使用该种血清的人中,有的人患过感冒;在没有使用该种血清的人中,有的人患过感冒,使用过血清的人与没有使用过血清的人的患病率相差较大.从直观上来看,使用过血清的人与没有使用过血清的人的患感冒的可能性存在差异.解:提出假设:感冒与是否使用该种血清没有关系•由列联表中的数据,求得22 1000 (258 284 -242 216)7.075474 526 500 500•••当成立时,的概率约为,•••我们有99%勺把握认为:该种血清能起到预防感冒的作用.例2•为研究不同的给药方式(口服或注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查结果如表所示.根据所选择的193个病人的数据,能否作出药的效果与给药方式有关的结论?分析:在口服的病人中,有的人有效;在注射的病人中,有的人有效.从直观上来看,口服与注射的病人的用药效果的有效率有一定的差异,能否认为用药效果与用药方式一定有关呢?下面用独立性检验的方法加以说明.解:提出假设:药的效果与给药方式没有关系•由列联表中的数据,求得22 193 (58 31 -40 64)1.3896 <2.072122 71 98 95当成立时,的概率大于,这个概率比较大,所以根据目前的调查数据,不能否定假设,即不能作出药的效果与给药方式有关的结论.说明:如果观测值,那么就认为没有充分的证据显示“i与n有关系”,但也不能作出结论“成立”,即i与n没有关系.2. 练习:.五•回顾小结:1 •独立性检验的思想方法及一般步骤;2. 独立性检验与反证法的关系.六.课外作业:2019-2020年高中数学3.1《空间向量及其运算》教案新人教A版选修2-1 教学要求:理解空间向量的概念,掌握其表示方法;会用图形说明空间向量加法、减法、数乘向量及它们的运算律;能用空间向量的运算意义及运算律解决简单的立体几何中的问题.教学重点:空间向量的加减与数乘运算及运算律.教学难点:由平面向量类比学习空间向量.教学过程:一、复习引入1、有关平面向量的一些知识:什么叫做向量?向量是怎样表示的呢?既有大小又有方向的量叫向量.向量的表示方法有:用有向线段表示;用字母、等表示;用有向线段的起点与终点字母:.长度相等且方向相同的向量叫相等向量•2. 向量的加减以及数乘向量运算:向量的加法:向量的减法:实数与向量的积:实数入与向量的积是一个向量,记作入,其长度和方向规定如下:|入|=|入III (2)当入〉0时,入与同向;当入V 0时,入与反向;当入=0时,入=.3. 向量的运算运算律:加法交换律:+ = +4. 三个力都是200N,相互间夹角为60°,能否提起一块重500N的钢板?二、新课讲授1. 定义:我们把空间中具有大小和方向的量叫做空间向量. 向量的大小叫做向量的长度或模.T举例?表示?(用有向线段表示)记法?T零向量?单位向量?相反向量?T讨论:相等向量?同向且等长的有向线段表示同一向量或相等的向量.T 讨论:空间任意两个向量是否共面?2. 空间向量的加法、减法、数乘向量的定义与平面向量的运算一样:=+,(指向被减向量),入 (请学生说说数乘运算的定义?)空间向量的加法与数乘向量的运算律.⑴加法交换律:⑵加法结合律: ⑶数乘分配律: ⑶数乘结合律:| 4. 推广:⑴ A A 生 A 二旳二 AA ; ⑵AA A,A 3 A 3A 4 A 」A n • AA =0 ;⑶空间平行四边形法则. 5. 出示例:已知平行六面体(底面是平行四边形的四棱柱) (如图),化简下列向量表达式,并标出化简结果的向量:3. + = + ; (+ ) + =+ ( 入(+ )=入+ ; 入(u )j =(入 u ).师生共练T 变式训练6.练习:课本 P 927. 小结:概念、运算、思想(由平面向量类比学习空间向量) 三、巩固练习:作业:P106 A 组1、2题.第二课时3.1.2空间向量的数乘运算(二)教学要求:了解共线或平行向量的概念,掌握表示方法;理解共线向量定理及其推论;掌握空间直线的向量参数方程;会运用上述知识解决立体几何中有关的简单问题.教学重点:空间直线、平面的向量参数方程及线段中点的向量公式.教学过程:一、复习引入1. 回顾平面向量向量知识:平行向量或共线向量?怎样判定向量与非零向量是否共线?方向相同或者相反的非零向量叫做平行向量•由于任何一组平行向量都可以平移到同一条直线上,所以平行向量也叫做共线向量.向量与非零向量共线的充要条件是有且只有一个实数入,使=入•称平面向量共线定理,二、新课讲授1. 定义:与平面向量一样,如果表示空间向量的有向线段所在的直线互相平行或重合,则这些向量叫做共线向量或平行向量.平行于记作// .2•关于空间共线向量的结论有共线向量定理及其推论:共线向量定理:空间任意两个向量、(工0), //的充要条件是存在实数入,使=入.理解:⑴上述定理包含两个方面:①性质定理:若//(工0),则有=,其中是唯一确定的实数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 独立性检验学习目标 1.了解2×2列联表的意义.2.了解统计量χ2的意义.3.通过对典型案例分析,了解独立性检验的基本思想和方法.知识点一2×2列联表思考山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表:体育文娱合计男生210230440女生60290350合计270520790如何判定“喜欢体育还是文娱与性别是否有联系”?梳理(1)2×2列联表的定义对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类取值,即类A和类B;Ⅱ也有两类取值,即类1和类2.我们得到如下列联表所示的抽样数据:Ⅱ类1类2合计Ⅰ类A a b类B c d合计a+b+c+d(2)χ2统计量的求法公式χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).知识点二独立性检验独立性检验的概念用χ2统计量研究两变量是否有关的方法称为独立性检验.知识点三独立性检验的步骤1.独立性检验的步骤要判断“Ⅰ与Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:__________________;(2)根据2×2列联表及χ2公式,计算________的值;(3)查对临界值,作出判断.其中临界值如表所示:P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.708 1.323 2.072 2.706 3.841 5.024 6.6357.87910.82 8表示在H0成立的情况下,事件“_____________________________________”发生的概率.2.推断依据(1)若χ2>10.828,则有99.9%的把握认为“Ⅰ与Ⅱ有关系”.(2)若χ2>6.635,那么有99%的把握认为“Ⅰ与Ⅱ有关系”.(3)若χ2>2.706,那么有90%的把握认为“Ⅰ与Ⅱ有关系”.(4)若χ2≤2.706,那么就认为没有充分的证据显示“Ⅰ与Ⅱ有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系.类型一2×2列联表例1 在一项有关医疗保健的社会调查中,发现调查的男性为530人,女性为670人,其中男性中喜欢吃甜食的为117人,女性中喜欢吃甜食的为492人,请作出性别与喜欢吃甜食的列联表.反思与感悟分清类别是列联表的作表关键步骤.表中排成两行两列的数据是调查得来的结果.跟踪训练1 (1)下面是2×2列联表:y1y2合计x1 a 2173x222527(2)某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中有213名在考前心情紧张.作出2×2列联表.类型二由χ2进行独立性检验例2 对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示.反思与感悟独立性检验的关注点在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此|ad-bc|越小,关系越弱;|ad-bc|越大,关系越强.跟踪训练2 某省进行高中新课程改革已经四年了,为了解教师对新课程教学模式的使用情况,某一教育机构对某学校的教师关于新课程教学模式的使用情况进行了问卷调查,共调查了50人,其中有老教师20人,青年教师30人.老教师对新课程教学模式赞同的有10人,不赞同的有10人;青年教师对新课程教学模式赞同的有24人,不赞同的有6人.(1)根据以上数据建立一个2×2列联表;(2)判断是否有99%的把握说明对新课程教学模式的赞同情况与教师年龄有关系.类型三独立性检验的综合应用例3 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时间的频率分布直方图如图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料推断“体育迷”与性别是否有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的概率分布,均值E(X)和方差V(X).附:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(χ2≥x0)0.100.050.01x0 2.706 3.841 6.635反思与感悟独立性检验的步骤第一步,假设两个分类变量X与Y无关系;第二步,找相关数据,列出2×2列联表;第三步,由公式χ2=n(ad-bc)2(其中n=a+b+c+d)计算出χ2的值;第四步,将χ2的值与临界值进行比较,进而作(a+b)(c+d)(a+c)(b+d)出统计推断.这些临界值,在高考题中常会附在题后,应适时采用.跟踪训练3 某地区甲校高二年级有1 100人,乙校高二年级有900人,为了统计两个学校高二年级在学业水平考试中的数学学科成绩,采用分层抽样的方法在两校共抽取了200名学生的数学成绩,如下表:(已知本次测试合格线是50分,两校合格率均为100%)甲校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数10253530x乙校高二年级数学成绩:分组[50,60)[60,70)[70,80)[80,90)[90,100]频数153025y 5(1)计算x,y的值,并分别估计以上两所学校数学成绩的平均分;(精确到1分)(2)若数学成绩不低于80分为优秀,低于80分为非优秀,根据以上统计数据填写下面2×2列联表,并回答能否在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”?甲校乙校总计优秀非优秀总计1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(填有关,无关)2.为了考察长头发与女性头晕是否有关系,随机抽查301名女性,得到如下所示的列联表,试根据表格中已有数据填空.经常头晕 很少头晕 合计 长发 35 ① 121 短发 37 143 ② 合计72③④则空格中的数据分别为:①________;②________;③________;④________. 3.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是________.(填序号)①若χ2>6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病; ②从独立性检验可知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③若从χ2与临界值的比较中得出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 4.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到χ2=775×(20×450-5×300)225×750×320×455≈15.968,因为χ2>6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性为________. 5.根据下表计算:不看电视 看电视 男 37 85 女35143χ2≈________.(保留3位小数)1.列联表列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有相关关系. 2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算统计量χ2的值,如果χ2的值很大,说明假设不合理.χ2越大,两个分类变量有关系的可能性越大.答案精析问题导学 知识点一思考 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)a +b c +d a +c b +d 知识点三1.(1)Ⅰ与Ⅱ没有关系 (2)χ2(3)χ2≥x 0 题型探究例1 解 作列联表如下:跟踪训练1 (1)52 54 解析 ∵a +21=73,∴a =52. 又∵a +2=b ,∴b =54. (2)解 作列联表如下:例2 解 假设病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术没有关系,由表中数据得a =39,b =157,c =29,d =167,a +b =196,c +d =196,a +c =68,b +d =324,n =392, 由公式得χ2=392×(39×167-157×29)2196×196×68×324≈1.779.因为χ2≈1.779<2.706,所以不能得出病人又发作过心脏病与做过心脏搭桥手术还是血管清障手术有关系的结论,即这两种手术对病人又发作过心脏病的影响没有差别. 跟踪训练2 解 (1)2×2列联表如下所示:(2)假设“对新课程教学模式的赞同情况与教师年龄无关”. 由公式得χ2=50×(10×6-24×10)234×16×20×30≈4.963<6.635,所以没有99%的把握认为对新课程教学模式的赞同情况与教师年龄有关.例3 解 (1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:将2×2得χ2=100×(30×10-45×15)275×25×45×55=10033≈3.030.因为2.706<3.030<3.841,所以在犯错误的概率不超过0.10的前提下认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意知,X ~B (3,14),从而X 的概率分布为故E (X )=np =3×14=34,V (X )=np (1-p )=3×14×34=916.跟踪训练3 解 (1)依题意知,甲校应抽取110人,乙校应抽取90人, ∴x =10,y =15,估计两个学校的平均分,甲校的平均分为 55×10+65×25+75×35+85×30+95×10110≈75.乙校的平均分为55×15+65×30+75×25+85×15+95×590≈71.(2)数学成绩不低于80分为优秀,低于80分为非优秀,得到2×2列联表如下:χ2=200×(40×70-20×70)260×140×110×90≈4.714,又4.714>3.841,故能在犯错误的概率不超过0.05的前提下认为“两个学校的数学成绩有差异”. 当堂训练1.有关 2.86 180 229 301 3.③ 4.0.01 5.4.514。