高中数学 第三章《统计案例》综合测试题 新人教B版选修2-3
高中数学(人教,选修2-3)第三章《统计案例》测试题B卷.docx
高中数学学习材料马鸣风萧萧*整理制作高中数学选修2-3第三章《统计案例》测试题B 卷考试时间:100分钟,满分:150分一、选择题:在每小题给出的四个选项中,只有一项是符合题目要求的,请把正确答案的代号填在题后的括号内(每小题5分,共50分)1.已知一个线性回归方程为ˆy=1.5x +45(x i ∈{1,7,5,13,19}),则y =( ) A .58.5 B .58.6 C .58 D .57.52.对有线性相关关系的两个变量建立的回归直线方程 ˆˆˆya bx =+中,回归系数ˆb ( ) A .能等于0 B .小于0 C .可以小于0D .只能等于03.能表示n 个点与相应直线在整体上的接近程度的是( )A.1()ni i y i =-∑ B 1()ni i i y =-∑ C.21()nii y i =-∑ D.21()nii yy =-∑4.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男 女 总计 爱好 40 20 60 不爱好 20 30 50 总计6050110由K 2=2()()()()()n ad bc a b c d a c b d -++++算得K 2=2110(40302030)7.860506050⨯⨯-⨯≈⨯⨯⨯附表:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”5..已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx ,若∑i =110x i =17,∑i =110y i =4,则b 的值为( )A .2B .1C .-2D .-16.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为 ( ) A .90%B .97.5%C .95%D .99.9%7.在一次试验中,测得(x ,y )的四组值分别是A (1,2),B (2,3),C (3,4),D (4,5),则y 与x 间的线性回归方程为( )A. y ^=x +1B. y ^=x +2 C. y ^=2x +1 D . y ^=x-18.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀 非优秀 总计 甲班 10 b 乙班 c 30 总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系” 9.有下列数据x123y 3 5.99 12.01下列四个函数中,模拟效果最好的为( ) A .y =3×12x - B .y =log 2x C .y =3xD .y =x 210.已知数组(x 1,y 1),(x 2,y 2),…,(x 10,y 10)满足线性回归方程y ^=bx +a ,则“(x 0,y 0)满足线性回归方程y ^=bx +a ”是“x 0=x 1+x 2+…+x 1010,y 0=y 1+y 2+…+y 1010”的( ).A .充分不必要条件B .必要不充分条件C .充要条件D .既不充分也不必要条件二、填空题(每小题6分, 共24分) 11.关于x 与y ,有如下数据 x 2 4 5 6 8 y3040605070有如下的两个模型:5.175.6ˆ)1(+=x y,ˆ(2)717y x =+。
高中数学(人教B版,选修2-3):第三章+统计案例(课件+同步练习+章末归纳总结+综合检测,7份)2
第三章知能基础测试时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的.)1.下列说法正确的是( )A .相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B .独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中也没有多大的实际意义C .相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D .独立性检验如果得出的结论有99%的可信度就意味着这个结论一定是正确的 [答案] C[解析] 相关关系虽然是一种不确定关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的检验也是不确定的,但是其结果也有一定的实际意义.故选C.2.设有一个回归方程为y ^=2-2.8x ^,则变量x 增加一个单位时( ) A .y 平均增加2.8个单位 B .y 平均增加2个单位 C .y 平均减少2.8个单位 D .y 平均减少2个单位 [答案] C[解析] 根据回归方程可知y 是关于x 的单调递减函数,并且由系数知,x 增加一个单位,相应的y 值平均减少2.8个单位.故选C.3.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是y ^=-0.7x +a ,则a 等于( )A .10.5B .5.15C .5.2D .5.25[答案] D[解析] x =2.5,y =3.5, ∵回归直线方程过定点(x ,y ),∴3.5=-0.7×2.5+a ,∴a =5.25.故选D.4.“回归”一词是在研究子女的身高与父母的身高之间的遗传关系时,由高尔顿提出的,他的研究结果是子代的平均高身向中心回归.根据他的结论,在儿子的身高y 与父亲的身高x 的回归直线方程y ^=a ^+b ^x 中,b ^( )A .在(-1,0)内B .等于0C .在(0,1)内D .在[1,+∞)内[答案] C[解析] 子代平均身高向中心回归,b ^应为正的真分数.故选C.5.(2014·济南市模拟)为了解疾病A 是否与性别有关,在一医院随机地对入院50人进行了问卷调查得到了如下的列联表:请计算出统计量K 2下面的临界值表供参考:A.95% C .99.5% D .99.9%[答案] C[解析] 由公式得K 2=50×(20×15-5×10)225×25×30×20≈8.333>7.879,故有1-0.005=99.5%的把握认为疾病A 与性别有关.6.如下表给出5组数据(x ,y ),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )A.第2组 C .第3组 D .第5组[答案] C[解析] 通过散点图选择,画出散点图如图.应除去第3组,对应点是(-3,4).故选C.7.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )A.90% C .97.5% D .99.9%[答案] D[解析] 由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )得其观测值χ=9965×(7775×49-2099×42)27817×2148×9874×91≈56.6>10.828.故有99.9%的把握认为患肝病与嗜酒有关系,答案选D.8.若A 与B 相互独立,且P (A )=0.8,P (B )=0.9,则P (A B +A B )=________. A .0.72 B .0.92 C .0.82 D .0.26[答案] D[解析] ∵A 与B 相互独立,∵A 与B 、A 与B 相互独立,A B 与A B 互斥. ∴P (A B +A B )=P (A )P (B )+P (A )P (B )=(1-0.8)×0.9+0.8×(1-0.9)=0.26.故选D.9.由一组样本数据(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )得到的回归直线方程y ^=bx +a ,那么下面说法不正确的是( )A .直线y ^=bx +a 必经过点(x ,y )B .直线y ^=bx +a 至少经过点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )中的一个点C .直线y ^=bx +a 的斜率为b =∑i =1nx i y i -n x y ∑i =1nx 2i -n x2D .直线y ^=bx +a 和各点(x 1,y 1)、(x 2,y 2)、…、(x n ,y n )的偏差∑i =1n[y i -(bx i +a )]2是该坐标平面上所有直线中与这些点的偏差中最小的直线[答案] B10.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为( )A .83%B .72%C .67%D .66%[答案] A[解析] 将y =7.675代入回归方程,可计算得x ≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.故选A.11.(2014·江西理,6)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )表1表3A .成绩B .视力C .智商D .阅读量[答案] D[解析] A 中,χ2=52×(6×22-10×14)220×32×16×36=131440;B 中,χ2=52×(4×20-12×16)220×32×16×36=637360;C 中,χ2=52×(8×24-8×12)220×32×16×36=1310;D 中,χ2=52×(14×30-2×6)220×32×16×36=3757160.因此阅读量与性别相关的可能性最大,所以选D.12.2003年春季,我国部分地区SARS 流行,党和政府采取果断措施,防治结合,很快使病情得到控制.下表是某同学记载的5月1日至5月12日每天某市SARS 病患者治愈者数据,及根据这些数据绘制出的散点图.下列说法:①根据此散点图,可以判断日期与人数具有线性相关关系; ②根据此散点图,可以判断日期与人数具有一次函数关系; ③根据此散点图,可以判断日期与人数具有非线性相关关系. 其中正确的个数为( ) A .0个 B .1个 C .2个 D .3个[答案] B[解析] 只有①正确.故选B.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上) 13.对于一条线性回归直线y ^=a +bx ,如果x =3时,对应的y 的估计值是17,当x =8时,对应的y 的估计值是22,那么,可以估计出回归直线方程是____________,根据回归直线方程判断当x =____________时,y 的估计值是38.[答案] y ^=x +14 24[解析] 首先把两组值代入回归直线方程得⎩⎪⎨⎪⎧ 3b +a =178b +a =22⇒⎩⎪⎨⎪⎧b =1,a =14.所以回归直线方程是 y ^=x +14.令x +14=38,可得x =24.14.对有关数据的分析可知,每一立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度Y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y =0.30x +99.9.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.(精确到0.1kg)[答案] 265.7 [解析] ∵y ≥89.7, ∴0.30x +9.99≥89.7 ∴x ≥265.7故水泥用量最少应为265.7kg.15.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和及格统计人数后,得到如下列联表:班级与成绩列联表则χ2=________.(精确到[答案] 0.600 [解析] 由列联表得则χ2=90×(11×37-34×8)245×45×19×71≈0.600.16.在对两个变量x 、y 进行线性回归分析时有下列步骤: ①对所求出的回归方程作出解释; ②收集数据(x i ,y i ),i =1,2,…,n ; ③求线性回归方程; ④求相关系数;⑤根据所搜集的数据绘制散点图;如果根据可靠性要求能够作出变量x 、y 具有线性相关结论,则正确的操作顺序是____________. [答案] ②⑤④③①三、解答题(本大题共6个小题,共74分,解答应写出文字说明、证明过程或演算步骤) 17.(本题满分12分)高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”.下表是一次针对高三文科学生的调查所得的数据,试判断文科学生总成绩不好与数学成绩不好是否有关.[解析] 根据题意计算得 χ2=913(478×30-12×393)2490×423×871×42≈11.153>6.635.因此有99%的把握认为“文科学生总成绩不好与数学成绩不好有关系”.18.(本题满分12分)以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估计当房屋面积为150m 2时的销售价格. [解析] (1)数据对应的散点图如下图所示:(2)x =15∑i =15x i =109,l xx =∑i =15 (x i -x )2=1 570,y =23.2,l xy =∑i =15(x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xx l xy =3081 570≈0.196 2,a ^=y -b ^x =1.816 6.故所求回归直线方程为y ^=0.196 2x +1.816 6. (3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.816 6=31.246 6(万元).19.(本题满分12分)在研究一种新药对小白鼠的防治效果时,得到如下数据.[解析] 由公式χ2=339×(43×121-162×13)2205×134×56×283≈7.469.由于7.469>6.635,所以我们有99%的把握认为这种新药对小白鼠防治效果是有效的. 20.(本题满分12分)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品.从两个分厂生产的零件各中抽出了500件,量其内径尺寸,得结果如下表:甲厂(1)(2)由以上统计数据填下面2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”?附:χ2=n (n 11n 22-n 12n 21n 1+n 2+n +1n +2,[解析] (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为360500=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为320500=64%.(2)χ2=1000×(360×180-320×140)500×500×680×320≈7.35>6.635,所以有99%的把握认为“两个分厂生产的零件的质量有差异”.21.(本题满分12分)(2014·新课标Ⅱ理,19)某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表:(1)(2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.附:回归直线的斜率和截距的最小二乘法估计公式分别为:b ^=ni =1 (t i -t )(y i -y )ni =1(t i -t )2,a ^=y -b ^t [解析] (1)∵t =1+2+…+77=4,y =2.9+3.3+3.6+4.4+4.8+5.2+5.97=4.3设回归方程为y =bt +a ,代入公式,经计算得 b =3×14+2+0.7+0+0.5+1.8+4.8(9+4+1)×2=1414×2=12.a =y -b t =4.3-12×2=2.3所以,y 关于t 的回归方程为y =0.5t +2.3.(2)∵b =12>0,∴2007年至2013年该区人均纯收入稳步增长,预计到2015年,该区人均纯收入y=0.5·9+2.3=6.8(千元)所以,预计到2015年,该区人均纯收入约6千8百元左右.22.(本题满分14分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出Y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b ^=∑n i =1x i y i -n x y ∑n i =1x 2i -n x 2)=∑ni =1 (x i -x )(y i -y )∑n i =1(x i -x )2, a ^=y ^-b ^x )[解析] (1)设抽到相邻两个月的数据为事件A .因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种.所以P (A )=515=13. (2)由数据求得x =11,y =24,由公式求得b ^=187,再由a ^=y ^-b ^x =-307,所以Y 关于x 的线性回归方程为 y ^=187x -307. (3)当x =10时,y ^=1507,|1507-22|<2; 同样当x =6时,y ^=787,|787-12|<2, ∴该小组所得线性回归方程是理想的.。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试卷(答案解析)(1)
一、选择题1.设(1+x)n =a 0+a 1x+…+a n x n ,若a 1+a 2+…+a n =63,则展开式中系数最大的项是( ) A .15x 2B .20x 3C .21x 3D .35x 32.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 3.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则 下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01kkkP k C ξ-==4.为研究某两个分类变量是否有关系,根据调查数据计算得到k≈15.968,因为P(K 2≥10.828)=0.001,则断定这两个分类变量有关系,那么这种判断犯错误的概率不超过( ). A .0.1B .0.05C .0.01D .0.0015.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .46.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠 不冷漠 总计 多看电视 68 42 110 少看电视 20 38 58 总计8880168则认为多看电视与人冷漠有关系的把握大约为( ) 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%10.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )2()P K k ≥ … 0.25 0.15 0.10 0.025 0.010 0.005 … k …1.3232.0722.7065.0246.6357.879…A .90%B .95%C .97.5%D .99.5%11.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系12.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列表:由上表中数据计算得2K=()21051030204555503075⨯⨯-⨯⨯⨯⨯≈6.109,请根据下表,估计有多大把握认为“文化程度与月收入有关系”( )A .1%B .99%C .2.5%D .97.5%二、填空题13.利用独立性检验考察两个分类变量X 与Y 是否有关系时,若K2的观测值k=6.132,则有__________的把握认为“X 与Y 有关系”. P(K2≥k0) 0.05 0.025 0.010 0.005 k03.8415.0246.6357.87914.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.15.给出下列命题:①线性相关系数越大,两个变量的线性相关越强;反之,线性相关性越弱; ②由变量和的数据得到其回归直线方程:,则一定经过;③从越苏传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好; ⑤在回归直线方程中,当解释变量每增加一个单位时,预报变量增加0.1个单位,其中真命题的序号是___________.16.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”. 17.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.18.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.19.某班主任对全班50名学生的积极性和对待班级工作的态度进行了调查,统计数据如下表所示:则至少有________的把握认为学生的学习积极性与对待班级工作的态度有关.(请用百分数表示).注:独立性检验界值表20.已知如下四个命题:①在线性回归模型中,相关指数2R 表示解释变量x 对于预报变量y 的贡献率,2R 越接近于0,表示回归效果越好;②在回归直线方程ˆ0.812yx =-中,当解释变量x 每增加一个单位时,预报变量ˆy平均增加0.8个单位;③两个变量相关性越强,则相关系数的绝对值就越接近于1;④对分类变量X 与Y ,对它们的随机变量2K 的观测值k 来说,k 越小,则“X 与Y 有关系”的把握程度越大.其中正确命题的序号是__________.三、解答题21.某共享单车经营企业欲向甲巿投放单车,为制定适宜的经营策略﹐该企业首先在已投放单车的乙市进行单车使用情况调查.调查过程分随机问卷﹑整理分析及开座谈会三个阶段.在随机问卷阶段,A ,B 两个调查小组分赴全市不同区域发放问卷并及时收回﹔在整理分析阶段,两个调查小组从所获取的有效问卷中,针对15岁至45岁的人群,按比例随机抽取了300份,进行了数据统计,具体情况如下表:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:样本,再用分层抽样的方法将“年龄达到35岁”的被抽个体数分配到“经常使用单车”和“偶尔使用单车”中去.①求这60人中“年龄达到35岁且偶尔使用单车”的人数﹔②为听取对发展共享单车的建议,调查组专门组织所抽取的"年龄达到35岁且偶尔使用单车的人员召开座谈会,会后共有3份礼品赠送给其中3人,每人1份(其余人员仅赠送骑行优惠券).已知参加座谈会的人员中有且只有4人来自A 组,求A 组这4人中得到礼品的人数X 的分布列和数学期望;(2)从统计数据可直观得出“是否经常使用共享单车与年龄有关”的结论.在用独立性检验的方法说明该结论成立时,为使犯错误的概率尽可能小,当年龄设定为25岁时,根据已有数据,完成下列2×2列联表(单位:人),并判断是否在犯错误的概率不超过1%的前提下有把握认为“经常使用共享单车与年龄有关”?22.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:23.据我国一项专题调查显示,北京市高级职称知识分子中竟有高达75.3%的人处于亚健康状态,更令人担忧的是85%以上的企业管理者处于慢性疲劳状态或亚健康状态,这是由他们的特殊工作、生活环境和行为模式所决定的.亚健康是指非病非健康的一种临界状态,如果这种状态不能及时得到纠正,非常容易引起身心疾病.某高科技公司为了解亚健康与性别的关系,对本公司部分员工进行了不记名问卷调查.该公司处于正常工作状态的员工(包括管理人员)共有10000人.其中男性员工有6000人,女性员工有4000人,从10000中用分层抽样的方法随机抽取了500人的样本,以调查健康状况.(1)求男性员工、女性员工各抽取多少人?(2)通过不记名问卷调查方式,得到如下等高条形图:其中0.2a =、0.1b =,根据以上等高条形图,完成下列22⨯列联表;健康 亚健康 总计男员工 女员工总计500附:22(),()()()()n ad bc K n a b c d a b a c c d b d -==+++++++. ()20P K k ≥0.50 0.25 0.05 0.025 0.010 0k0.4551.3213.8405.0246.63524.目前,新冠病毒引发的肺炎疫情在全球肆虐,为了解新冠肺炎传播途径,采取有效防控措施,某医院组织专家统计了该地区500名患者新冠病毒潜伏期的相关信息,数据经过汇总整理得到如图所示的频率分布直方图(用频率作为概率).潜伏期不高于平均数的患者,称为“短潜伏者”,潜伏期高于平均数的患者,称为“长潜伏者”.(1)求这500名患者潜伏期的平均数(同一组中的数据用该组区间的中点值作代表),并计算出这500名患者中“长潜伏者”的人数;(2)为研究潜伏期与患者年龄的关系,从上述500名患者中抽取300人,得到如下列联表,根据列联表判断是否有97.5%的把握认为潜伏期长短与患者年龄有关:短潜伏者 长潜伏者 合计60岁及以上 90 70 160 60岁以下 60 80 140 合计 15015030020P K k ≥()0.15 0.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.8282()()()()()n ad bc K a b c d a c b d -=++++25.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:超过m 不超过m第一种学习方式 15 5 第二种学习方式515(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,P(2K k≥)0.0500.0100.001 k 3.841 6.63510.82826.2020年寒假是特殊的寒假,因为疫情全体学生只能在家进行网上在线学习,为研究学生网上学习的情况,某校社团对男女各10名学生进行了网上在线学习的问卷调查,每名学生给出评分(满分100分),得到如图所示的茎叶图.(1)根据茎叶图判断男生组和女生组哪个组对网课的评价更高?并说明理由;(2)如图是按该20名学生的评分绘制的频率分布直方图,求a的值并估计这20名学生评分的平均值(同一组中的数据用该组区间中点值作为代表);(3)求该20名学生评分的中位数m,并将评分超过m和不超过m的学生数填入下面的列联表:超过m不超过m男生女生根据列联表,能否有85%的把握认为男生和女生的评分有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,()2P K k0.500.400.250.150.100.050.025 0k0.4550.708 1.323 2.072 2.706 3.841 5.024【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【解析】 令x=1,则(1+1)n =++…+=64.∴n=6.故(1+x)6的展开式中系数最大的项为T 4=x 3=20x 3.2.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平3.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.4.D解析:D 【解析】 【分析】根据观测值,对照临界值得出结论. 【详解】根据15.968k ≈,及2(10.828)0.001P K ≥=,对照临界值得:判断秃发与心脏病有关系,这种判断出错的可能性为0.001. 故选D. 【点睛】本题的考查点是独立性检验的应用,根据独立性检测考查两个变量是否有关系的方法进行判断,准确的理解判断方法及2K 的含义是解决本题的关键.5.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D.【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .6.A解析:A 【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.A解析:A 【解析】由公式可计算得K 2≈11.377>6.635.故选A.点睛:(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.10.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
18学年高中数学第三章统计章末综合测评新人教B版选修2_3
(三) 统计案例(时间:120分钟,满分:150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中错误的是( )A.如果变量x 与Y 之间存在着线性相关关系,则我们根据试验数据得到的点(x i ,y i )(i =1,2,…,n )将散布在某一条直线的附近B.如果两个变量x 与Y 之间不存在着线性关系,那么根据它们的一组数据(x i ,y i )(i =1,2,…,n )不能写出一个线性方程C.设x ,Y 是具有相关关系的两个变量,且Y 关于x 的线性回归方程为y ^=bx +a ,b 叫做回归系数D.为使求出的线性回归方程有意义,可用统计检验的方法来判断变量Y 与x 之间是否存在线性相关关系【解析】 任何一组(x i ,y i )(i =1,2,…,n )都能写出一个线性方程,只是有的无意义. 【答案】 B2.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^等于( )A.10.5B.5.15C.5.2D.5.25【解析】 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a ^=5.25. 【答案】 D3.对变量x ,Y 由观测数据(x i ,y i )(i =1,2,…,10)得散点图1①.对变量u ,V 由观测数据(u i ,v i )(i =1,2,…,10)得散点图②.由这两个散点图可以判断( )① ②图1A.变量x 与Y 正相关,u 与V 正相关B.变量x 与Y 正相关,u 与V 负相关C.变量x 与Y 负相关,u 与V 正相关D.变量x 与Y 负相关,u 与V 负相关【解析】 由这两个散点图可以判断,变量x 与Y 负相关,u 与V 正相关,选C. 【答案】 C4.在下列各量与量之间的关系中是相关关系的是( )①正方体的表面积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的收入与支出之间的关系;⑤某家庭用水量与水费之间的关系.A.②③B.③④C.④⑤D.②③④【解析】 ①⑤属于函数关系. 【答案】 D5.设有一个线性回归方程为y ^=-2+10x ,则变量x 增加一个单位时( ) A.y 平均减少2个单位 B.y 平均增加10个单位 C.y 平均增加8个单位D.y 平均减少10个单位 【解析】 10是斜率的估计值,说明x 每增加一个单位时,y 平均增加10个单位. 【答案】 B6.在吸烟与患肺病这两个事件是否相关的判断中,下列说法中正确的是( ) ①若χ2>6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知在犯错误的概率不超过0.01前提下,认为吸烟与患肺病有关系时,我们说若某人吸烟,则他有99%的可能患有肺病;③从统计量中得知在犯错误的概率不超过0.05的前提下认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误.A.①B.①③C.③D.②【解析】 χ2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故①不正确;②中对“确定容许推断犯错误概率的上界”理解错误;③正确.【答案】 C7.已知变量x 与y 正相关,且由观测数据算得样本平均数x =3,y =3.5,则由该观测数据算得的线性回归方程可能是( )A.y ^=0.4x +2.3 B.y ^=2x -2.4 C.y ^=-2x +9.5 D.y ^=-0.3x +4.4【解析】 因为变量x 和y 正相关,则回归直线的斜率为正,故可以排除选项C 和D.因为样本点的中心在回归直线上,把点(3,3.5)的坐标分别代入选项A 和B 中的直线方程进行检验,可以排除B ,故选A.【答案】 A8.在一次对性别与是否说谎有关的调查中,得到如下数据,根据表中数据得到如下结论中正确的是( )A.在此次调查中有B.在此次调查中有95%的把握认为是否说谎与性别无关C.在此次调查中有99%的把握认为是否说谎与性别有关D.在此次调查中没有充分证据显示说谎与性别有关 【解析】 由表中数据得χ2=-214×16×13×17≈0.002 42<3.841.因此没有充分证据认为说谎与性别有关,故选D. 【答案】 D9.甲、乙两个班级进行一门课程考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:( ) A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7【解析】 ∵χ2=-245×45×17×73=90×13522 513 025≈0.652 7>0.455,P (χ2≥0.455)=0.5,故选B.【答案】 B10.以下是两个变量x 和Y 的一组数据:A.y ^=x 2B.y ^=x C.y ^=9x -15D.y ^=15x -9【解析】 根据数据可知每一个Y 值对应一个x 2值,故选A 【答案】 A11.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图2中的A ,B ,C 点;③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69; ④回归直线方程的意义是它反映了样本整体的变化趋势.图2A.0B.1C.2D.3【解析】 能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a ,b 得到的直线y ^=bx +a 才是回归直线,∴①不对;②正确;将x =25代入y ^=0.50x -0.81,解得y ^=11.69,∴③正确;④正确. 【答案】 D12.设某大学的女生体重y (单位:kg)与身高x (单位:cm)有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,下列结论中不正确的是( )A.y 与x 具有正的线性相关关系B.回归直线过样本点的中心(x ,y )C.若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg【解析】 由回归方程为y ^=0.85x -85.71知y 随x 的增大而增大,所以y 与x 具有正的线性相关关系;由最小二乘法建立回归方程的过程知y ^=b ^x +a ^=b ^x +y --b ^x -(a ^=y --b ^x -),所以回归直线过样本点的中心(x -,y -);利用回归方程可以估计总体,D 不正确.【答案】 D二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 13.已知一回归直线方程为y ^=1.5x +45,x ∈{1,5,7,13,19},则y =________. 【解析】 因为x =15(1+5+7+13+19)=9,且y =1.5x +45,所以y =1.5×9+45=58.5.【答案】 58.514.某大型企业人力资源部为了研究企业员工工作积极性和对企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:【解析】 根据列联表中的数据,得到χ2=-294×95×86×103≈10.76.【答案】 10.7615.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),求得回归方程y ^=0.67x +54.9.【解析】 由表知x =30,设模糊不清的数据为m ,则y =15(62+m +75+81+89)=307+m5,因为y =0.67x +54.9, 即307+m5=0.67×30+54.9, 解得m =68. 【答案】 6816.某地区恩格尔系数Y (%)与年份x 的统计数据如下表:从散点图可以看出Y 与x 线性相关,且可得回归方程为y =bx +4 055.25,据此模型可预测2015年该地区的恩格尔系数Y (%)为________.【解析】 由表可知x =2 007.5,y =44.25. 因为y =b x +4 055.25, 即44.25=2 007.5b +4 055.25,所以b ≈-2,所以回归方程为y ^=-2x +4 055.25,令x =2 015,得y ^=25.25. 【答案】 25.25三、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤) 17.(本小题满分10分)改革开放以来,我国高等教育事业有了迅速发展,有人记录了某村2006到2016年10年间每年考入大学人数所占该年参加高考总人数的百分比,为了便于计算,把2006年编号为0,2007年编号为1,…,2016年编号为10.如果把每年考入大学人数占该年参加高考总人数的百分比作为因变量,把年份从0到10作为自变量进行回归分析,可得到下面三条回归直线:农村y ^=0.42x +1.80; 县镇y ^=2.32x +6.76; 城市y ^=2.84x +9.50.(1)对于农村青年来讲,系数等于0.42意味着什么?(2)在这10年间,农村、县镇和城市哪一个的大学入学率增长最快? (3)预测2020年县镇的入学率是多少?【解】 (1)0.42是回归直线的斜率,意味着对于农村考生,每年的入学率平均增长0.42%.(2)城市对应回归直线的斜率最大,所以城市的年入学率增长最快. (3)y =2.32×14+6.76=39.24,故2020年县镇的入学率为39.24%.18.(本小题满分12分)为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据:【解】 由公式得:χ2=-286×103×95×94≈38.459.∵38.459>6.635,∴有99%的把握说,学生的学习数学兴趣与数学成绩是有关的. 19.(本小题满分12分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程y =b x +a ,其中b =-20,a =y -b x ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解】 (1)x -=8+8.2+8.4+8.6+8.8+96=8.5,y -=16(90+84+83+80+75+68)=80.∵b ^=-20,a ^=y --b ^x -,∴a ^=80+20×8.5=250,∴回归直线方程y ^=-20x +250.(2)设工厂获得的利润为L 元,则L =x (-20x +250)-4(-20x +250)=-20⎝ ⎛⎭⎪⎫x -3342+361.25,∴该产品的单位应定为334元,工厂获得的利润最大.20.(本小题满分12分)对于表中的数据:(1)(2)求线性回归方程.【解】 (1)如图,x ,y 具有很好的线性相关性.(2)因为x =2.5,y =5,∑i =1x i y i =60,∑i =14x 2i =30,∑i =14y 2i =120.04. 故b =60-4×2.5×530-4×2.52=2,a =y -b x =5-2×2.5=0,故所求的回归直线方程为y ^=2x .21.(本小题满分12分)某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图3表中w i =x i ,w =18∑i =18w i(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利率z 与x 、y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归线y =α+βu 的斜率和截距的最小二乘估计分别为:β^=∑i =1u i -uv i -v∑i =18u i -u2,α^=v -β^u .【解】 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1w i -w y i -y∑8i =1 w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)① 由(2)知,当x =49时,年销售量y 的预报值 y ^=100.6+6849=576.6,年利润z 的预报值 z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.22.(本小题满分12分)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:图4将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,【解】 (1)“体育迷”有25人,从而完成2×2列联表如下:将2×2χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=-275×25×45×55=10033≈3.030.因为3.030<3.841,所以我们没有理由认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,其中女生为2人. 记“从‘超级体育迷’中取2人,至少有1名女性”为事件A . 则P (A )=C 22C 03+C 12C 13C 25=710, 即从“超级体育迷”中任意选取2人,至少有1名女性观众的概率为710.。
(必考题)高中数学高中数学选修2-3第三章《统计案例》检测(含答案解析)
一、选择题1.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e2.已知两个统计案例如下:①为了探究患肺炎与吸烟的关系,调查了339名50岁以上的人,调查结果如下表:②为了解某地母亲与女儿身高的关系,随机测得10对母女的身高如下表:则对这些数据的处理所应用的统计方法是( ) A .①回归分析,②取平均值 B .①独立性检验,②回归分析 C .①回归分析,②独立性检验D .①独立性检验,②取平均值3.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==4.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:2()P K k≥0.0500.0250.0100.0050.001k 3.841 5.024 6.6357.87910.828由以上数据,计算得到K2的观测值k≈9.643,根据临界值表,以下说法正确的是() A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.有99.9%的把握认为课外阅读量大与作文成绩优秀有关D.有99.5%的把握认为课外阅读量大与作文成绩优秀有关5.某中学共有5000人,其中男生3500人,女生1500人,为了了解该校学生每周平均体育锻炼时间的情况以及该校学生每周平均体育锻炼时间是否与性别有关,现在用分层抽样的方法从中收集300位学生每周平均体育锻炼时间的样本数据(单位:小时),其频率分布直方图如下:附:22()=()()()()n ad bcKa cb d a d b c-++++,其中n a b c d=+++.2()P K k≥0.100.050.010.005k 2.706 3.841 6.6357.879已知在样本数据中,有60位女生的每周平均体育锻炼时间超过4小时,根据独立性检验原理,我们()A.没有理由认为“该校学生每周平均体育锻炼时间与性别有关”B.有95%的把握认为“该校学生每周平均体育锻炼时间与性别有关”C.有95%的把握认为“该校学生每周平均体育锻炼时间与性别无关”D .有99.5%的把握认为“该校学生每周平均体育锻炼时间与性别有关”6.通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘” 能做到“光盘” 男 45 10 女3015则有( )以上的把握认为“该市民能否做到‘光盘’与性别有关”,附表及公式()20P K k ≥0.100 0.050 0.010 0.001 0k 2.7063.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++A .90%B .95%C .99%D .99.9%7.为了普及环保知识,增强环保意识,随机抽取某大学30名学生参加环保知识测试,得分如图所示,若得分的中位数为m e ,众数为m 0,平均数为x -,则( )A .m e =m 0=x -B .m 0<x -<m e C .m e <m 0<x -D .m 0<m e <x -8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.给出以下四个说法:①绘制频率分布直方图时,各小长方形的面积等于相应各组的组距;②在刻画回归模型的拟合效果时,R2的值越大,说明拟合的效果越好;③设随机变量ξ服从正态分布N(4,22),则P(ξ>4)=12;④对分类变量X与Y,若它们的随机变量K2的观测值k越小,则判断“X与Y有关系”的犯错误的概率越小.其中正确的说法是()A.①④B.②③C.①③D.②④10.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差 B.回归分析C.独立性检验 D.概率11.某中学学生会为了调查爱好游泳运动与性别是否有关,通过随机询问110名性别不同的高中生是否爱好游泳运动得到如下的列联表:由()()()()()22n ad bcka b c d a c b d-=++++并参照附表,得到的正确结论是A.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别无关”C.有99.9%的把握认为“爱好游泳运动与性别有关”D.有99.9%的把握认为“爱好游泳运动与性别无关”12.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K=,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是()2()P K k≥…0.250.150.100.0250.0100.005…k… 1.323 2.072 2.706 5.024 6.6357.879…A.90%B.95%C.97.5%D.99.5%二、填空题13.给出下列结论:①在回归分析中,可用相关指数2R的值判断模型的拟合效果,2R越大,模型的拟合效果越好;②某工厂加工的某种钢管,内径与规定的内径尺寸之差是离散型随机变量;③随机变量的方差和标准差都反映了随机变量的取值偏离均值的平均程度,它们越小,则随机变量偏离均值的平均程度越小;④甲、乙两人向同一目标同时射击一次,事件A:“甲、乙中至少一人击中目标”与事件B:“甲、乙都没有击中目标”是相互独立事件.其中结论正确的是______.14.新闻媒体为了了解观众对央视某节目的喜爱与性别是否有关,随机调查了观看该节目的观众110名,得到如下的2×2列联表:试根据样本估计总体的思想,估计约有________的把握认为“喜爱该节目与否和性别有关”.参考附表:(参考公式:K2=()()()()()2n ad bca b c d a c b d-++++,其中n=a+b+c+d)15.某市电信宽带私人用户月收费标准如下表:假定每月初可以和电信部门约定上网方案.若某用户每月上网时间为66小时,应选择__________方案最合算.16.下列是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y与月份x 之间有较好的线性相关关系,其线性回归方程是=﹣0.7x+,则= . 月 份x 1 2 3 4 用水量y4.5432.517.为了判断高中二年级学生是否喜欢足球运动与性别的关系,现随机抽取50名学生,得到22⨯列联表:喜欢 不喜欢 总计 男 15 10 25 女520 25 总计 203050(参考公式22()()()()()n ad bc k a b c d a c b d -=++++,()n a b c d =+++)20()P K k ≥ 0.010 0.005 0.0010k 6.635 7.879 10.828则有___________以上的把握认为“喜欢足球与性别有关”.18.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科 文科 总计 男 13 10 23 女 7 20 27 总计203050已知P (K 2≥3.841)≈0.05,P (K 2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________. 19.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,1,1,3b x y ===则1a =.正确的序号是________________.20.已知下列命题:①从匀速传递的产品生产流水线上,质检员每30分钟从生产流水线中抽取一件产品进行某项指标检测,这样的抽样方法是系统抽样;②两个变量的线性相关程度越强,则相关系数的值越接近于1;③两个分类变量X 与Y 的观测值2k ,若2k 越小,则说明“X 与Y 有关系”的把握程度越大;④随机变量X ~(0,1)N ,则(1)2(1)1P X P X <=<-. 其中为真命题的是__________.三、解答题21.为研究男、女生的身高差异,现随机从高三某班选出男生、女生各10人,并测量他们的身高,测量结果如下(单位:厘米): 男:173 178 174 185 170 169 167 164 161 170 女:165 166 156 170 163 162 158 153 169 172(1)根据测量结果完成身高的茎叶图(单位:厘米),并分别求出男、女生身高的平均值;(2)请根据测量结果得到20名学生身高的中位数h (单位:厘米),将男、女生身高不低于h 和低于h 的人数填入下表中,并判断是否有90%的把握认为男、女生身高有差异? 人数 男生 女生身高h ≥ 身高h <参照公式:()()()()()22n ad bc k a b c d a c b d -=++++()20P K k ≥ 0.100.05 0.025 0.010 0.005 0.001 0k2.7063.8415.0246.6357.87910.828175厘米为偏高.采用分层抽样的方法从以上男生中抽取5人作为样本.若从样本中任取2人,试求恰有1人身高属于正常的概率.22.某实验学校为提高学习效率,开展学习方式创新活动,提出了完成某项学习任务的两种新的学习方式.为比较两种学习方式的效率,选取40名学生,将他们随机分成两组,每组20人,第一组学生用第一种学习方式,第二组学生用第二种学习方式.40名学生完成学习任务所需时间的中位数40min m =,并将完成学习任务所需时间超过min m 和不超过min m 的学生人数得到下面的列联表:(Ⅰ)估计第一种学习方式且不超过m 的概率、第二种学习方式且不超过m 的概率; (Ⅱ)能否有99%的把握认为两种学习方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,23.某科研小组为了验证一种治疗新冠肺炎的新药的效果,选60名患者服药一段时间后,记录了这些患者的生理指标x 和y 的数据,并统计得到如下的22⨯列联表(不完整):在生理指标 1.8x >的人中,设A 组为生理指标65y ≤的人,B 组为生理指标65y >的人,将他们服用这种药物后的康复时间(单位:天)记录如下: A 组:10,11,12,13,14,15,16,17,19. B 组:12,13,14,15,16,17,20,21,25.(1)填写上表,并判断是否有95%95%的把握认为患者的两项生理指标x 和y 有关系; (2)从A ,B 两组人中随机各选1人,A 组选出的人记为甲,B 组选出的人记为乙,求乙的康复时间比甲的康复时间长的概率.附:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.)20k0.2524.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.25.某足球运动员进行射门训练,若打进球门算成功,否则算失败.已知某天该球员射门成功次数与射门距离的统计数据如下:(1)请问是否有90%的把握认为该球员射门成功与射门距离是否超过30米有关?参考公式及数据:22(),()()()()n ad bc K n a b c d a b c d a c b d -==+++++++.(2)当该球员距离球门30米射门时,设射门角(射门点与球场底线中点的连线和底线所成的锐角或直角)为([0,])2πθθ∈,其射门成功率为2+3()cos sin 4f θθθθθ=+⋅-,求该球员射门成功率最高时射门角θ的值.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e=.故选:B.【点睛】本题考查非线性回归问题的转化,是基础题.2.B解析:B【分析】根据独立性检验和回归分析的概念,即可作出判定,得到答案.【详解】由题意,独立性检验通常是研究两个分类变量之间是否有关系,所以①采用独立性检验,回归分析通常是研究两个具有相关关系的变量的相关程度,②采用回归分析,综上可知①是独立性检验,②是回归分析,故选B.【点睛】本题主要考查了独立性检验和回归分析的概念及其判定,其中解答中熟记独立性检验和回归分析的概念是解答的关键,着重考查了分析问题和解答问题的能力,属于基础题.3.D解析:D【解析】【分析】根据公式()()()()()22n ad bcKa b c d a c b d-=++++,分别利用4个选项中所给数据求出2K的值,比较所求值的大小即可得结果.【详解】选项A:22160(535155)3204010502K⨯⨯-⨯==⨯⨯⨯,选项B:22260(5251515)152040204016K⨯⨯-⨯==⨯⨯⨯,选项C:22360(5201520)24204025357K⨯⨯-⨯==⨯⨯⨯,选项D:22 460(5101530)96 204035257K⨯⨯-⨯==⨯⨯⨯,可得222431K K K>>22K>,所以由选项D中的数据得到的2K值最大,说明X与Y有关系的可能性最大,故选D.【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2K越大两个变量有关的可能性越大这一性质.4.D解析:D【解析】【分析】由题意结合独立性检验的结论和临界值表给出结论即可.【详解】根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.本题选择D选项.【点睛】本题主要考查独立性检验的思想及其应用等知识,意在考查学生的转化能力和计算求解能力.5.B解析:B【解析】分析:根据题设收集的数据,得到男生学生的人数,进而得出22⨯的列联表,利用计算公式,求解2K的值,即可作出判断.详解:由题意得,从5000人中,其中男生3500人,女生1500人,抽取一个容量为300人的样本,其中男女各抽取的人数为35003002105000⨯=人,1500300905000⨯=人,又由频率分布直方图可知,每周体育锻炼时间超过4小时的人数的频率为0.75,所以在300人中每周体育锻炼时间超过4小时的人数为3000.75225⨯=人,又在每周体育锻炼时间超过4小时的人数中,女生有60人,所以男生有22560165-=人,可得如下的22⨯的列联表:结合列联表可算得22300(456016530)4.762 3.8412109075225K⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”,故选B.点睛:本题主要考查了独立性检验的基础知识的应用,其中根据题设条件得到男女生的人数,得出22⨯的列联表,利用公式准确计算是解答的关键,着重考查了分析问题和解答问题的能力.6.A解析:A【解析】分析:根据列联表中数据代入公式计算k 的值,和临界值表比对后即可得到答案. 详解:将列联表中数据代入公式可得()210045153010 3.030 2.70675255545k ⨯⨯-⨯=≈>⨯⨯⨯,所以有0090的把握认为“该市居民能否做到‘光盘’”与性别有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)7.D解析:D 【解析】由条形图知,30名学生的得分情况依次为2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分,中位数为第15,16个数(分别为5,6)的平均数,即m e =5.5,5出现的次数最多,故众数为m 0=5,平均数为x =130(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97,故m 0<m e <x . 故答案为D.点睛:这个题目考查的是条型分布直方表的应用,以及基本量:均值,平均数的考查;一般在这类图中平均数就是将数据加到一起除以数据的个数即可,在频率分布直方表中是取每个长方条的中点乘以相应的频率并相加即可.8.D解析:D 【解析】010.828,10.0010.99999.90k ≥∴-==,则有0099.9以上的把握认为秃发与患心脏病有关,故这种判断出错的可能性为10.9990.001-=,故选D.【方法点睛】本题主要考查独立性检验的实际应用,属于难题.独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.B解析:B 【解析】①中各小长方形的面积等于相应各组的频率;②正确,相关指数R 2越大,拟合效果越好,R 2越小,拟合效果越差;③随机变量ξ服从正态分布N (4,22),正态曲线对称轴为x =4,所以P (ξ>4)=;④对分类变量X 与Y ,若它们的随机变量K 2的观测值k 越小,则说明“X 与Y 有关系”的犯错误的概率越大.故选B.10.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.11.A解析:A 【解析】()22110403020207.8 6.63560506050k ⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为“爱好游泳运动与性别有关”,所以在犯错误的概率不超过1%的前提下,认为“爱好游泳运动与性别有关”12.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试(含答案解析)(1)
一、选择题1.下列四个命题中,正确的有( )①两个变量间的相关系数r 越小,说明两变量间的线性相关程度越低;②命题“x ∃∈R ,使得210x x ++<”的否定是:“对x ∀∈R ,均有210x x ++>”; ③命题“p g ∧为真”是命题“p q ∨为真”的必要不充分条件;④若函数322()3f x x ax bx a =+++在1x =-有极值0,则2a =,9b =或1a =,3b =.A .0B .1C .2D .32.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==3.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .44.下列命题正确的个数是:( )①对于两个分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握程度越大;②在相关关系中,若用211c x y c e =拟合时的相关指数为21R ,用2y bx a =+拟合时的相关指数为22R ,且2212R R >,则1y 的拟合效果好;③利用计算机产生0~1之间的均匀随机数a ,则事件“310a ->”发生的概率为23;④“0,0a b >>”是“2b aa b+≥”的充分不必要条件 A .1B .2C .3D .45.近年来,由于大学生不理智消费导致财务方面的新闻层出不穷,无力偿还校园贷,跳楼自杀也偶有发生,一时间人们对大学生的消费观充满了质疑.为进一步了解大学生的消费情况,对S 城某大学的10000名(其中男生6000名,女生4000名)在校本科生,按性别采用分层抽样的方式抽取了1000名学生进行了问卷调查,其中有一项是针对大学生每月的消费金额进行调查统计,通过整理得如图所示的频率分布直方图.已知在抽取的学生中,月消费金额超过2000元的女生有150人.根据上述数据和频率分布直方图,判断下列说法正确的是( )参考数据与参考公式:003 1.732,sin150.258,sin7.50.1305=≈≈.A .月消费金额超过2000元的女生人数少于男生人数B .所调查的同学中月消费金额不超过500元的共有4人C .样本数据的中位数约为1750元D .在犯错的概率不超过0.1%的情况下认为月消费金额在2000元以上的大学生与性别有关 6.对于相关指数R2,下列说法正确的是 A .R2的取值越小,模型拟合效果越好B .R2的取值可以任意大,且R2取值越大,拟合效果越好C .R2的取值越接近于1,模型拟合效果越好D .以上答案都不对7.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取3 000人,计算发现k 2=6.023,则根据这一数据查阅下表,市政府断言市民收入增减与旅游欲望有关系的把握是( ) P (K 2≥k )…0.250.150.100.025 0.010 0.005 …k … 1.323 2.072 2.706 5.024 6.635 7.879 …A .90%B .95%C .97.5%D .99.5%8.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据见下表:心脏病 无心脏病 秃发 20 300 不秃发5450根据表中数据得到()277520450530015.96820750320455k ⨯⨯-⨯=≈⨯⨯⨯,因为K 2≥10.828,则断定秃发与心脏病有关系,那么这种判断出错的可能性为( ) A .0.1B .0.05C .0.01D .0.0019.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.某家具厂的原材料费支出x 与销售量y (单位:万元)之间有如下数据,根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为ˆ8ˆy x b =+,则^b为( ) x 2 4 5 6 8 y2535605575A .5B .15C .10D .20 11.已知样本789x y 、、、、的平均数是82xy 值为 A .8B .32C .60D .8012.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.如图所示是世界20个地区受教育程度的人口百分比与人均收入的散点图,样本点基本集中在一个条型区域,因此两个变量呈线性相关关系.利用散点图中的数据建立的回归方程为ˆ 3.19388.193yx =+,若受教育的人口百分比相差10%,则其人均收入相差_________.14.x ,y 的取值如下表: x-2-1.5-1-0.5 00.51y 0.26 0.35 0.51 0.711.1 1.412.05则x ,y 之间的关系可选用函数___进行拟合.15.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计26 24 50由表中数据计算得到K 2的观测值k≈5.059,于是________(填“能”或“不能”)在犯错误的概率不超过0.01的前提下认为喜欢玩电脑游戏与认为作业多有关. 16.某单位为了了解用电量度与气温之间的关系,随机统计了某天的用电量与当天气温.由表中数据得回归直线方程中,据此预测当气温为5℃时,用电量的度数约为____.17.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x 中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.18.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是32;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N P σξ≤=则.其中正确结论的序号为________________19.以下四个命题,其中正确的序号是____________________.①从匀速传递的产品生产流水线上,每20分钟从中抽取一件产品进行检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1;③在线性回归方程0.212ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 平均增加0.2个单位;④分类变量X 与Y ,它们的随机变量2K 的观测值为k ,当k 越小,“X 与Y 有关系”的把握程度越大.20.某学校为了制定治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:则认为“是否同意限定区域停产与家长的性别有关”的把握约为__________.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.2020年江西省旅游产业发展大会于6月12日至6月13日在赣州顺利召开.为让广学生子解赣州旅游文化,赣州市旅游局在赣州市各中小学校开展“赣州市旅游知识网络竞赛”活动.为了更好地分析中学生和小学生对赣州市旅游知识掌握情况,将中学组和小学组的所有参赛选手按成绩分为优秀、良好、一般三个等级,随机从中抽取了100名选手进行调查,下面是根据调查结果绘制的选手等级人数的条形图.(1)若将一般和良好等级合称为合格等级,根据已知条件完成下面的22⨯列联表,并据此资料你是否有95%的把握认为选手成绩“优秀”与文化程度有关?优秀 合格 合计中学组 小学组 合计(2)若某县参赛选手共80人,用频率估计概率,试估计该县参赛选手中优秀等级的人数;(3)如果在优秀等级的选手中取3名,在良好等级的选手中取2名,再从这5人中任选3人组成一个比赛团队,求所选团队中恰有2名选手的等级为优秀的概率.注:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.P (20K k ≥)0.10 0.05 0.00523.为了解某企业生产的某产品的年利润与年广告投入的关系,该企业对最近一些相关数据进行了调查统计,得出相关数据见下表:根据以上数据,研究人员分别借助甲、乙两种不同的回归模型,得到两个回归方程:方程甲,2(1)(1) 2.75yb x =-+^^;方程乙,(2)1.6yc x =-^^.(1)求b ^(结果精确到0.01)与c ^的值.(2)为了评价两种模型的拟合效果,完成以下任务.①完成下表(备注:i i ie y y =-^^,i e ^称为相应于点(x i ,y i )的残差);②分别计算模型甲与模型乙的残差平方和Q 1及Q 2,并通过比较Q 1,Q 2的大小,判断哪个模型拟合效果更好.24.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付支付宝支付总计20.0500.0100.001()P K kk 3.841 6.63510.828()()()()()22n ad bc K a b c d a c b d -=++++. 25.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下列联表,并判断能否在犯错误率不超过0.05的前提下认为“体育迷”与性别有关?非体育迷 体育迷 合计男 女 合计(2)将日均收看该体育项目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()2P K k ≥0.050.01k 3.8416.63526.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下: 研发费用x (百万元)236101314(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】根据相关系数的定义可知①错误;根据特称命题(又叫存在性命题)的否定可知②错误;根据真值表即可判断“p q ∧为真”是命题“p q ∨为真”的充分不必要条件,故③错误;由条件可得,(1)0,(1)0,f f '-=-= 解得a=2,b=9或a=1,b=3,经检验,当a=1,b=3时,22()3633(1)0f x x x x '=++=+≥恒成立,此时()f x 没有极值点,故④错误。
人教版高中数学高二选修2-3课下检测第三章《统计案例》检测题
第三章检测题本检测题分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,满分150分,时间120分钟.第Ⅰ卷(选择题 共60分)一、选择题:本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.下列说法正确的个数是( )①事件A 与B 的检验无关时,则两个事件互不影响; ②事件A 与B 关系越密切,则K 2就越大;③K 2的大小是判定事件A 与B 是否相关的唯一根据; ④若判定两个事件A 与B 有关,则A 发生B 一定发生. A .1 B .2 C .3D .4由题意知,只有②正确. 故应选A. A2.在一个2×2列联表中,由数据计算得K 2=13.097,则两个变量间有关系的可能性为( )A .99%B .95%C .90%D .无关系∵如果K 2的估计值K 2>6.635时,就有99.9%的把握认为“x 与y 有关系”. 故应选A. A3.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截距为( )A .a =y -bxB .a =y -b ^x C.a ^=y -bxD.a ^=y -b ^x∵y ^=a ^+b ^,∴a ^=y -b ^x .故应选D. D4.有下列说法:①随机误差是引起预报值与真实之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是( ) A .0 B .1 C .2D .3由统计知识知①②③全对. 故应选D. D5.对于线性相关系数r ,下列叙述正确的是( )A .|r |∈(0,+∞),|r |越大,相关程度越大;反之,相关程度越小B .|r |∈(-∞,+∞),|r |越大,相关程度越大;反之,相关程度越小C .|r |≤1,|r |越接近于1,相关程度越大;|r |越接近于0,相关程度越小D .以上说法都不对∵|r |≤1且|r |越接近于1,相关程度越大,|r |越接近于0,相关程度越小. 故应选C. C6.为加强素质教育,使学生各方面全面发展,某学校对学生文化课与体育课的成绩进行了调查统计,结果如下:( ) A .1.255 B .38.214 C .0.0037D .2.058K 2=337×(57×43-221×16)2278×59×73×264=1.255.故选A. A7.在一个2×2列联表中,由其数据计算得K 2统计量为6.635,则在犯错误的概率不超过________的情况下两个变量间有关系( )A .0.001B .0.05C .0.01D .无关系由K 2=6.635知两个变量有关的可能性为99%,故犯错误的概率不超过0.01. 故应选C. C8.工人月工资y (元)依劳动生产率x (千元)变化的回归方程为y ^=100+90x ,下列判断正确的是( )A .劳动生产率为1 000元时,则工资为190元B .劳动生产率提高1 000元时,则工资平均提高90元C .劳动生产率提高1 000元时,则工资平均提高190元D .当月工资为118元时,劳动生产率为200元∵回归直线斜率为90,∴x 每增加1千元,y ^增加90,即劳动生产率提高1 000元时,工资提高90元.故应选B. B9.已知随机变量ξ只能取三个值:x 1,x 2,x 3,其概率依次成等差数列,则这个等差数列的公差的取值范围为( )A.⎣⎡⎦⎤-14,14B.⎣⎡⎦⎤-15,15 C.⎣⎡⎦⎤-13,13D.⎣⎡⎦⎤-12,12 由题设知P 1+P 2+P 3=1,2P 2=P 1+P 3, ∴P 2=13,P 1+P 3=23,且P 1>0,P 3>0,d =13-P 1=P 3-13,P 1=13-d ≥0, P 3=13+d ≥0⇒-13≤d ≤13.故应选C. C10.为了对新产品进行合理定价,对这类产品进行了试销试验,用以观察需求量y (单位:千克)对于价格x (单位:千元)的变化关系,得出数据如下:A.-0.993 1 B.0.993 1C.0.632 D.-0.632代入相关系数公式可得r≈-0.632.故应选D.D11.对四对变量y和x进行线性相关检验,已知n是观测值组数,r是相关系数,且已知:①n=7,r=0.953 3; ②n=15,r=0.301 2;③n=17,r=0.499 1; ④n=3,r=0.995 0.则变量y和x具有线性相关关系的是()A.①和②B.①和③C.②和④D.③和④相关系数r越大,数量x,y的线性相关关系越强.故应选B.B12.已知两组数据x1,x2,…,x n与y1,y2,…,y n,它们的平均数分别是x和y,则新的一组数据2x1-3y1+1,2x2-3y2+1,…,2x n-3y n+1的平均数是() A.2x-3y B.2x-3y+1C.4x-9y D.4x-9y+12x1-3y1+1+2x2-3y2+1+…+2x n-3y n+1)/n=2(x1+x2+…+x n)/n-3(y1+y2+…+y n)/n+1=2x-3y+1.故应选B.B第Ⅱ卷(非选择题共90分)二、填空题:本大题共4小题,每小题5分,共20分.把答案填在题中横线上.13.用身高(cm)预报体重(kg)满足y=0.849x-85.712,若要找到41.638 kg的人,________是在150 cm中.(填“一定”或“不一定”).∵统计的方法是可能犯错误的.利用线性回归方程预报变量的值不是精确值.但一般认为实际测量值应在预报值左右.不一定14.有下列关系:①人的年龄与其拥有的财富之间的关系;②曲线上的点与该点的坐标之间的关系;③苹果的产量与气候之间的关系;④森林中的同一树木,其横截面直径与高度之间的关系;⑤学生与其学号之间的关系,其中有相关关系的是________.其中②,⑤为确定性关系,不是相关关系. ∴有相关关系的是①③④. ①③④15.调查在2~3级风的海上航行中男女乘客的晕船情况,结果如下表所示:根据此资料,在2~________________________________________________________________________. K 2=71×(12×24-25×10)222×49×37×34≈0.076,由于K 2=0.076<2.706,所以我们没有充分的把握认为晕船与否和性别有关系. 不对16.若由一个2×2的列联表中的数据计算得K 2≈4.013,那么有________的把握认为两个变量间有关系.由题意知K 2≈4.013>3.843,所以有95%的把握认为两个变量有关. 95%三、解答题:本大题共6小题,共70分.解答应写出必要的文字说明、证明过程或演算步骤.17.(本小题满分10分)通过随机询问72名不同性别的大学生在购买食物时是否看营养说明,得到如下列联表:性别与读营养说明列联表由题意可知a=16,b=28,c=20,d=8,a+b=44,c+d=28,a+c=36,b+d=36,n=a+b+c+d=72,代入公式K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)得K2=72×(16×8-28×20)244×28×36×36≈8.42,由于K2≈8.42>7.879,我们就有99.5%的把握认为性别和读营养说明之间有关系,即我们就说性别和读营养说明之间有99.5%的可能是有关系的.18.(本小题满分12分)要分析学生初中升学的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生分析他们入学的数学成绩和高一年级期末数学考试成绩,如表所示:x 63674588817152995876Y 65785282928973985675(1)画出散点图;(2)求线性回归方程;(3)若学生王明亮的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩为多少?(1)作出散点图如图所示,从散点图可以看出,这两个变量具有线性相关关系.(2)i x i y i x2i x i y i16365 3 969 4 09526778 4 489 5 22634552 2 025 2 340488827 7447 21658192 6 5617 45267189 5 041 6 31975273 2 704 3 796899989 8019 70295856 3 364 3 248107675 5 776 5 700可求得x =110(63+67+…+76)=70,y =110(65+78+…+75)=76. b ^=55 094-10×70×7651 474-10×702≈0.765 56,a ^=76-0.765 56×70≈22.41.所求线性回归方程为y ^=22.41+0.765 56x .(3)若学生王明亮入学成绩为80分,代入上面线性回归方程y =22.41+0.765 56x ,可求得y ≈84.即王明亮同学高一期末数学成绩预测值为84分. 19.(本小题满分12分)下表表示的是关于11岁儿童患花粉热与湿疹情况的调查数据,对11岁儿童能否作出患花粉热与湿疹有关的结论?K 2=15 014×(141×13 525-928×420)21 069×13 945×561×14 453≈285.96>6.635.所以我们有99%的把握认为对于11岁儿童患花粉热与湿疹有关. 20.(本小题满分12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=bx +a ;(3)若由线性回归方程得到的估计数据与所选出的检验数据是误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?(1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25, ∴P (A )=1-P (A )=35.a ^=y -b x =27-2.5×12=-3, ∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的. 21.(本小题满分12分)某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总分也为优秀的人数如下表所示,则数学成绩优秀与物理、化学、总分也优秀哪个关系较大?(注:该年级此次考试中数学成绩优秀的有360人,非优秀的有880人.)物理 化学 总分 数学优秀 228 225 267 数学非优秀14315699(1)列出数学与物理优秀的2×2列联表如下:将表中数据代入22(2)列出数学与化学优秀的2×2列联表如下:将表中数据代入22(3)列出数学与总分优秀的2×2列联表如下:将表中数据代入22由上面的分析可知,数学成绩优秀与物理、化学、总分优秀都有关系.由于计算的K2值都大于10.28,这说明有99.9%的把握认为数学优秀与物理、化学、总分优秀有关系,但与总分关系最大,与物理其次.22.(本小题满分12分)从某大学中随机选取9名女大学生,其身高和体重数据如下表所示:大学生的体重.(1)由于问题中要求根据身高预报体重,因此选取身高为自变量x,真实体重为因变量y,作出散点图,如图所示.从散点图上可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系.(2)列表计算:身高x i 体重y i x 2i y 2i x i y i 165 48 27 225 2 304 7 920 165 57 27 225 3 249 9 405 157 50 24 649 2 500 7 850 170 54 28 900 2 916 9 180 175 64 30 625 4 096 11 200 165 61 27 225 3 721 10 065 155 43 24 025 1 849 6 665 170 59 28 900 3 481 10 030 1716129 2413 72110 431∴回归直线方程为y ^=0.872 651x -89.540 8. (3)计算相关系数(4)作出预报对于身高为172 cm 的女大学生,由回归直线方程可以预报其体重为y ^=0.872 651×172打印版本-89.540 8=60.555 kg.高中数学。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试题(含答案解析)(1)
一、选择题1.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==2.已知x 与y 之间的几组数据如下表: x 1 2 4 5 y 0 2 3 5假设根据上表数据所得线性回归直线方程y=bx+a,若某同学根据上表中的前两组数据(1,0)和(2,2),求得的直线方程为y=b'x+a',则以下结论正确的是( ) A .b>b',a>a' B .b<b',a<a' C .b>b',a<a' D .b<b',a>a'3.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 4.有如下几个结论: ①相关指数R 2越大,说明残差平方和越小,模型的拟合效果越好; ②回归直线方程:y bx a =+,一定过样本点的中心:(,)x y ③残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适; ④在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,说明“两个分类变量有关系”的可能性越强.其中正确结论的个数有( )个. A .1B .2C .3D .45.下列判断错误的是A .若随机变量ξ服从正态分布()()21,,30.72N P σξ≤=,则()10.28P ξ≤-=;B .若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上,则相关系数1r =-;C .若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭, 则()1E ξ=; D .am bm >是a b >的充分不必要条件;6.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:x 2 4 5 6 8 y3040506070根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元7.下列说法中,不正确的是A .两个变量的任何一组观测值都能得到线性回归方程B .在平面直角坐标系中,用描点的方法得到表示两个变量的关系的图象叫做散点图C .线性回归方程反映了两个变量所具备的线性相关关系D .线性相关关系可分为正相关和负相关8.为考察数学成绩与物理成绩的关系,在高二随机抽取了300名学生,得到下面的列联表:数学85~100分 数学85分以下 总计 物理85~100分 37 85 122 物理85分以下 35 143 178 总计72228300现判断数学成绩与物理成绩有关系,则犯错误的概率不超过 ( ) A .0.005 B .0.01C .0.02D .0.059.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是( )A .男、女人患色盲的频率分别为0.038,0.006B .男、女人患色盲的概率分别为,C .男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D .调查人数太少,不能说明色盲与性别有关10.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.已知变量x ,y 的一组观测数据如表所示: x 3 4 5 6 7 y4.02.5-0.50.5-2.0据此得到的回归方程为y bx a =+,若a =7.9,则x 每增加1个单位,y 的预测值就( ) A .增加1.4个单位 B .减少1.2个单位C .增加1.2个单位D .减少1.4个单位12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( )A .1B .2C .3D .4二、填空题13.x ,y 的取值如下表: x-2-1.5-1-0.50.51y 0.26 0.35 0.51 0.71 1.1 1.41 2.05则x ,y 之间的关系可选用函数___进行拟合.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x ,变量x 增加一个单位时,y 平均增加5个单位;③线性回归方程=x +必过(,);④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K 2=13.079,则其两个变量之间有关系的可能性是90%.其中错误的个数是________. 15.教材上一例问题如下:一只红铃虫的产卵数y 和温度x 有关,现收集了7组观测数据如下表,试建立y 与x 之间的回归方程. 温度 x /℃ 21 23 25 27 29 32 35 产卵数y /个711212466115325某同学利用图形计算器研究它时,先作出散点图(如图所示),发现两个变量不呈线性相关关系. 根据已有的函数知识,发现样本点分布在某一条指数型曲线21c xy c e =的附近(1c 和2c 是待定的参数),于是进行了如下的计算:根据以上计算结果,可以得到红铃虫的产卵数y 对温度x 的回归方程为__________.(精确到0.0001) (提示:21c xy c e =利用代换可转化为线性关系) 16.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.17.以下四个命题中:①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1; ③某项测量结果服从正太态布,则; ④对于两个分类变量和的随机变量的观测值来说,越小,判断“与有关系”的把握程度越大.以上命题中其中真命题的个数为___________.18.在吸烟与患肺病这两个分类变量的计算中,“若2x 的观测值为6.635,我们有99%的把握认为吸烟与患肺病有关系”这句话的意思: ①是指“在100个吸烟的人中,必有99个人患肺病 ②是指“有1%的可能性认为推理出现错误”; ③是指“某人吸烟,那么他有99%的可能性患有肺病”; ④是指“某人吸烟,如果他患有肺病,那么99%是因为吸烟”. 其中正确的解释是______.19.一个三位自然数百位,十位,个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等),若{},,1234a b c ∈,,,,且a ,b ,c 互不相同,则这个三位数为”有缘数”的概率是__________. 20.下列说法:①线性回归方程y bx a =+必过(),x y ;②命题“21,34x x ∀≥+≥”的否定是“21,34x x ∃<+<” ③相关系数r 越小,表明两个变量相关性越弱;④在一个22⨯列联表中,由计算得28.079K =,则有99%的把握认为这两个变量间有关系;其中正确..的说法是__________.(把你认为正确的结论都写在横线上) 本题可参考独立性检验临界值表:三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:男生 女生 合计 喜欢抖音上课 10不喜欢抖音上课8合计 30已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是815. (1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X ,求X 的分布列、数学期望. 附临界值表:()20P K k ≥0.10 0.05 0.010 0.005 0k2.7063.8416.637.879参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.22.某校从高三年级的男女生中各随机抽取了100人的体育测试成绩(以下称体测成绩,单位:分),数据都落在[)60100,内,其统计数据如表所示(其中不低于80分的学生为优秀).(1)请根据如表数据完成22⨯列联表,并通过计算判断,是否有95%的把握认为体测成绩与性别有关?(2)视频率为概率,在全校的高三学生中任取3人,记取出的3人中优秀的人数为X ,求X 的分布列和数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++23.支付宝和微信支付是目前市场占有率较高的支付方式,某第三方调研机构对使用这两种支付方式的人数作了对比,从全国随机抽取了100个地区作为研究样本,计算了各个地区样本的使用人数,其频率分布直方图如下,(1)记A表示事件“微信支付人数低于50千人”,估计A的概率;(2)填写下面2╳2列联表,并根据2╳2列联表判断是否有99%的把握认为支付人数与支付方式有关;支付人数<50千支付人数≥50千人总计人微信支付 支付宝支付 总计附:2()P K k ≥0.050 0.010 0.001 k3.8416.63510.828()()()()()22n ad bc K a b c d a c b d -=++++.24.2020突如其来的疫情让我们经历了最漫长、最特殊的一个假期,教育行政部门部署了“停课不停学”的行动,全力帮助学生在线学习.复课后某校进行了摸底考试,某数学教师为了调查高二学生这次摸底考试的数学成绩与每天在线学习数学的时长之间的相关关系,对在校高二学生随机抽取45名进行调查,了解到其中有25人每天在线学习数学的时长不超过1小时,并得到如下的等高条形图:(1)根据等高条形图填写下面22⨯列联表,并根据列联表判断能否在犯错误的概率不超过0.05的前提下认为“高二学生的这次摸底考试数学成绩与其每天在线学习数学的时长有关”;数学成绩不超过120分 数学成绩超过120分 总计 每天在线学习数学不超过1小时 25每天在线学习数学超过1小时总计45(2)从被抽查的,且这次数学成绩超过120分的学生中,再随机抽取3人,求抽取的3人中每天在线学习数学的时长超过1小时的人数ξ的分布列与数学期望. 附临界值表()20P K k ≥0.050 0.010 0.001 0k3.8416.63510.828参考公式:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.25.某单位组织开展“学习强国”的学习活动,活动第一周甲、乙两个部门员工的学习情况统计如下:学习活跃的员工人数 学习不活跃的员工人数甲 18 12 乙328(1)根据表中数据判断能否有95%的把握认为员工学习是否活跃与部门有关; (2)活动第二周,单位为检查学习情况,从乙部门随机抽取2人,发现这两人学习都不活跃,能否认为乙部门第二周学习的活跃率比第一周降低了?说明理由.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:2(0.1) 2.706P K ≥=,2(0.05) 3.841P K ≥=,2(0.01) 6.635P K ≥=. 26.根据国家统计局数据,1999年至2019年我国进出口贸易总额从3万亿元跃升至31.6万亿元,中国在国际市场上的贸易份额越来越大对外贸易在国民经济中的作用日益突出.将年份1999,2004,2009,2014,2019分别用1,2,3,4,5代替,并表示为t ,y 表示全国进出口贸易总额.(1)根据以上统计数据及图表,给出了下列两个方案,请解决方案1中的问题. 方案1:用y bt a =+作为全国进出口贸易总额y 关于t 的回归方程,根据以下参考数据,求出y 关于t 的回归方程,并求相关指数21R .方案2:用dt y ce =作为全国进出口贸易总额y 关于t 的回归方程,求得回归方程0.57212.3259x y e =,相关指数22R .(2)通过对比(1)中两个方案的相关指数,你认为哪个方案中的回归方程更合适,并利用此回归方程预测2020年全国进出口贸易总额. 参考数据:①0.140.340.66 1.86 2.048.192++++=②222220.140.34 1.86 2.04 2.1412.336++++=③8.1920.0147555.792≈④12.3360.0222555.792≈参考公式:线性回归方程中的斜率和截距的最小二乘法估计公式分别为:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.2.D解析:D 【解析】 【分析】先根据()()1,0,2,2求得直线y b x a ='+'的方程.然后计算出回归直线方程y bx a =+,由此比较大小,得出正确的结论. 【详解】由于直线y b x a ='+'过()()1,0,2,2,将两点坐标代入直线方程得022b a b a +=⎧⎨+=''''⎩,解得2,2b a ''==-.124534x +++==,02352.54y +++==,1122334414122542x y x y x y x y +++=+++=.2222123414162546x x x x +++=+++=,故24243 2.54230121.24643463610b -⨯⨯-====-⨯-, 2.5 1.23 2.5 3.6 1.1a =-⨯=-=-.所以,a a b b >'<',故选D.【点睛】本小题主要考查利用直线上的两点坐标求直线方程的方法,考查回归直线方程的计算,属于中档题.3.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > , 2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.4.D解析:D 【分析】根据相关指数定义、残差平方和含义可得①为真,根据回归直线方程特征可得②为真,根据残差点含义可得③为真,根据卡方含义可得④为真. 【详解】相关指数R 2越大,则残差平方和越小,模型的拟合效果越好;回归直线方程:ˆy bx a =+,一定过点() ,x y ;若残差点比较均匀地落在水平的带状区域中,则选用的模型比较合适; 在独立性检验中,若公式()()()()()22n ad bc K a b c d a c b d -=++++,中的|ad-bc|的值越大,则2K 越大, “两个分类变量有关系”的可能性越强.选D. 【点睛】相关指数R 2越大,残差平方和越小,残差点比较均匀地落在水平的带状区域,则模型的拟合效果越好;在独立性检验中,若2 K 越大,则两个变量有关系越强;回归直线方程:ˆy bx a =+,一定过点() ,x y .5.D解析:D 【解析】分析:根据正态分布的对称性求出()1P ξ≤-的值,判断A 正确; 根据线性相关关系与相关系数的定义,判断B 正确; 根据二项分布的均值计算公式求出()E ξ的值,判断C 正确; 判断充分性和必要性是否成立,得出D 错误.详解:对于A ,随机变量ξ服从正态分布()21,N σ,∴曲线关于1ξ=对称,131310.720.28PP P ξξξ∴≤-=≥=-≤=-=()()(),A 正确;对于B ,若n 组数据()()()1122,,,,...,,n n x y x y x y 的散点都在1y x =-+上, 则x y ,成负相关,且相关关系最强,此时相关系数1r =-,B 正确;对于C ,若随机变量ξ服从二项分布: 15,5B ξ⎛⎫~ ⎪⎝⎭,则1515E(),ξ=⨯= C 正确;对于D ,am >bm 时,a >b 不一定成立,即充分性不成立,a b am bm >时,> 不一定成立,即必要性不成立,是既不充分也不必要条件,D 错误. 故选:D .点睛:本题考查了命题真假的判断问题,是综合题.6.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.7.A解析:A 【解析】要得到线性回归方程应至少有两个变量的两组观测值,因此A 不正确.根据散点图、线性回归方程、线性相关关系的概念可得B ,C ,D 都正确.故选A .8.D解析:D 【解析】因为K 2的观测值k=2300(371433585)12217872228⨯-⨯⨯⨯⨯≈4.514>3.841, 所以在犯错误的概率不超过0.05的前提下认为数学成绩与物理成绩有关系. 选D.9.C解析:C 【解析】男人中患色盲的比例为,要比女人中患色盲的比例大,其差值为,差值较大,所以认为患色盲与性别是有关的.考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.D解析:D 【解析】由表格得 5x =, 0.9y =,∵回归直线方程为7ˆ9ˆ.y bx=+,过样本中心, ∴57.90.9b +=,即75b =-,则方程为77.95ˆyx =-+,则x 每增加1个单位,y 的预测值就减少1.4个单位,故选D.12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》测试(包含答案解析)(3)
一、选择题1.已知x 与y 之间的几组数据如下表: x 1 2 3 4 y1mn4参考公式:线性回归方程y bx a =+,其中()()()121niii nii x x y y b x x ==--=-∑∑,a y bx =-;相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑.上表数据中y 的平均值为2.5,若某同学对m 赋了三个值分别为1.5,2,2.5得到三条线性回归直线方程分别为11y b x a =+,22y b x a =+,33y b x a =+,对应的相关系数分别为1r ,2r ,3r ,下列结论中错误..的是( ) A .三条回归直线有共同交点 B .相关系数中,2r 最大 C .12b b >D .12a a >2.以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,其变换后得到线性回归方程0.53z x =+,则c =( ) A .3B .3eC .0.5D .0.5e3.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 4.设导弹发射的事故率为0.01,若发射10次,其出事故的次数为ξ,则下列结论正确的是 ( ) A .0.1E ξ=B .•01D ξ=C .10()0.01?0.99k k P k ξ-==D .1010()0.99?0.01k k kP k C ξ-==5.某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算2K 的观测值10k =,则下列选项正确的是( ) A .有99.5%的把握认为使用智能手机对学习有影响 B .有99.5%的把握认为使用智能手机对学习无影响 C .有99.9%的把握认为使用智能手机对学习有影响 D .有99.9%的把握认为使用智能手机对学习无影响 6.下列命题中正确命题的个数是(1)对分类变量X 与Y 的随机变量2K 的观测值k 来说,k 越小,判断“X 与Y 有关系”的把握越大;(2)若将一组样本数据中的每个数据都加上同一个常数后,则样本的方差不变; (3)在残差图,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高; (4)设随机变量ξ服从正态分布()0,1N ; 若()1P p ξ>=,则()1102P p ξ-<<=-( ) A .4B .3C .2D .17.在独立性检验中,统计量2χ有三个临界值:2.706、3.841和6.635,在一项打鼾与患心脏病的调查中,共调查了1000人,经计算的2χ=18.87,根据这一数据分析,认为打鼾与患心脏病之间 ( )A .有95%的把握认为两者无关B .约有95%的打鼾者患心脏病C .有99%的把握认为两者有关D .约有99%的打鼾者患心脏病8.对于独立性检验,下列说法正确的是( ) A .K 2>3.841时,有95%的把握说事件A 与B 无关 B .K 2>6.635时,有99%的把握说事件A 与B 有关 C .K 2≤3.841时,有95%的把握说事件A 与B 有关 D .K 2>6.635时,有99%的把握说事件A 与B 无关9.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.97510.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-11.通过随机询问2016名性别不同的大学生是否爱好某项运动,得到2 6.023K =,则根据这一数据查阅表,则有把握认为“爱好该项运动与性别有关”的可信程度是( )A .90%B .95%C .97.5%D .99.5%12.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.为了解适龄公务员对放开生育二胎政策的态度,某部门随机调查了200位30~40岁之间的公务员,得到的情况如下表:男公务员 女公务员 生二胎 80 40 不生二胎4040则________(填“有”或“没有”)99%以上的把握认为“生二胎与性别有关”. 附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.82816.为了解某班学生喜爱打篮球是否与性别有关,对该班50名 学生进行了问卷调查, 得到了如下22⨯ 列联表喜爱打篮球 不喜爱打篮球 合计男生20 525 女生 10 1525合计30 2050则至少有_____的把握认为喜爱打篮球与性别有关(请用百分数表示). 17.给出下列命题:①线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;②由变量x 和y 的数据得到其回归直线方程:l ˆybx a =+,则l 一定经过点(),x y P ; ③从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;④在回归分析模型中,残差平方和越小,说明模型的拟合效果越好;⑤在回归直线方程0.110ˆyx =+中,当解释变量x 每增加一个单位时,预报变量ˆy 增加0.1个单位,其中真命题的序号是___________.18.某单位为了了解用电量y (度)与气温x (℃)之间的关系,随机统计了某4天的用电量与当天气温(如表),并求得线性回归方程为^=-2x +60.不小心丢失表中数据c ,d ,那么由现有数据知2c+d=______. x c 13 10 -1 y243438d19.下列4个命题:①为了了解800名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔为40;②四边形ABCD 为长方形,2AB =,1BC =,O 为AB 中点,在长方形ABCD 内随机取一点P ,取得的P 点到O 的距离大于1的概率为12π-; ③把函数3sin 23y x π⎛⎫=+⎪⎝⎭的图象向右平移6π个单位,可得到3sin 2y x =的图象; ④已知回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为1.230.08y x =+.其中正确的命题有__________.(填上所有正确命题的编号)20.2018年春季,世界各地相继出现流感疫情,这已经成为全球性的公共卫生问题.为了考察某种流感疫苗的效果,某实验室随机抽取100只健康小鼠进行试验,得到如下列联表:关系.(参考公式:()()()()()22n ad bc K a b c d a c b d -=++++.)三、解答题21.第十八届中国国际农产品交易会于11月27日在重庆国际博览中心开幕,我市全面推广“遂宁红薯”及“遂宁鲜”农产品区域公用品牌,并组织了100家企业、1000个产品进行展示展销,扩大优质特色农产品市场的占有率和影响力,提升遂宁特色农产品的社会认知度和美誉度,让来自世界各地的与会者和消费者更深入了解遂宁,某记者对本次农交会进行了跟踪报道和实际调查,对某特产的最满意度()%x 和对应的销售额y (万元)进行了调查得到以下数据:关系数r 的绝对值在0.95以上(含0.95)是线性相关性较强;否则,线性相关性较弱.请你对线性相关性强弱作出判断,并给出理由;(2)如果没有达到较强线性相关,则采取“末位淘汰”制(即销售额最少的那一天不作为计算数据),并求在剔除“末位淘汰”的那一天后的销量额y 关于最满意度x 的线性回归方程(系数精确到0.1). 参考数据:24x =,81y =,52215146ii x x =-=∑, 52215176i i y y =-=∑,515151i ii x y xy =-=∑13.27≈≈.附:对于一组数据()()()1122,,,,,,n n x y x y x y ⋅⋅⋅.其回归直线方程 ˆˆˆy bx a =+的斜率和截距的最小二乘法估计公式分别为:1221ˆ·ni ii ni i x y nx y bx nx ==-=-∑∑,ˆa y bx=-,线性相关系数·ni ix y nx y r -=∑22.为了调查某生产线上质量监督员甲对产品质量好坏有无影响,现统计数据如下:质量监督员甲在生产现场时,990件产品中合格品有982件,次品有8件;甲不在生产现场时,510件产品中合格品有493件,次品有17件,试分别用列联表、独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响?23.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.24.某地一所妇产科医院为了解婴儿性别与出生时间(白天或晚上)之间的联系,从该医院最近出生的200名婴儿获知如下数据:这200名婴儿中男婴的比例为55%,晚上出生的男婴比白天出生的男婴多75%,晚上出生的女婴人数与白天出生的男婴人数恰好相等. (1)根据题意,完成下列2×2列联表;(2)根据列联表,判断能否有99%的把握认为婴儿的性别与出生时间有关,说明你的理由.附:22()()()()()n ad bcKa b c d a c b d-=++++(n=a+b+c+d),参考数据:221999≈0.0368.25.在第十五次全国国民阅读调查中,某地区调查组获得一个容量为200的样本,其中城镇居民150人,农村居民50人,在这些居民中,经常阅读的城镇居民100人,农村居民24人.(1)完成上面2×2列联表,并判断是否有95%的把握认为经常阅读与居民居住地有关?(2)从该地区居民城镇的居民中,随机抽取5位居民参加一次阅读交流活动,记这5位居民中经常阅读的人数为X,若用样本的频率作为概率,求随机变量X的分布列和期望.附:K2=2()()()()()n ad bca b c d a c b d-++++,其中n=a+b+c+d.26.“微粒贷”是腾讯旗下2015年9月开发上市的微众银行网货产品.腾讯公司为了了解“微粒贷”上市以来在C市的使用情况,统计了C市2015年至2019年使用了“微粒货”贷款的累计人数,统计数据如表所示:(1)已知变量x ,y 具有线性相关关系,求累计人数y (万人)关于年份代号x 的线性回归方程y bx a =+;并预测2020年使用“微粒贷“贷款的累计人数;(2)“微粒贷”用户拥有的贷款额度是根据用户的账户信用资质判定的,额度范围在500元至30万元不等,腾讯公司在统计使用人数的同时,对他们所拥有的贷款额度也作了相应的统计.我们把拥有货款额度在500元至5万元(不包括5万元)的人群称为“低额度贷款人群”,简称“A 类人群”;把拥有贷款额度在5万元及以上的人群称为“高额度贷款人群”,简称“B 类人群”.根据统计结果,随机抽取6人,其中A 类人群4人,B 类人群2人.现从这6人中任取3人,记随机变量ξ为A 类人群的人数,求ξ的分布列及其期望.参考公式:1122211()()()()nni iiii i nniii i x y nx y x x y y b xn x x x ====---==--∑∑∑∑, a y bx =-参考数据:5162i ii x y=≈∑【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】由题意可得5m n +=,分别取m 与n 的值,由公式计算出1122123,,,,,,b a b a r r r 的值,逐一分析四个选项,即可得到答案. 【详解】由题意,1410m n +++=,即5m n +=. 若 1.5m =,则 3.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 1.5 2.53 2.5 3.5 2.54 2.54 2.5 5.5iii x x y y =--=--+--+--+--=∑ ,()()()42222211.50.50.5 1.55i i x x =-=-+-++=∑ ,()()()42222211.511 1.5 6.5i i y y =-=-+-++=∑.则1 5.51.15b ==,1 2.5 1.1 2.50.25a =-⨯=- ,1r =≈; 若2m =,则3n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.52 2.53 2.53 2.54 2.54 2.55iii x x y y =--=--+--+--+--=∑,()4215ii x x =-=∑,()()()42222211.50.50.5 1.55i i y y =-=-+-++=∑.2515b ==,2 2.51 2.50a =-⨯=,21r ==; 若 2.5m =,则 2.5n =,此时12342.54x +++==, 2.5y =. ()()()()()()()()()()411 2.51 2.52 2.5 2.5 2.53 2.5 2.5 2.54 2.54 2.5 4.5iii x x y y =--=--+--+--+--=∑,()4215i i x x =-=∑,()()422211.5 1.5 4.5i i y y =-=-+=∑,3r ==由样本点的中心相同,故A 正确;由以上计算可得,相关系数中,2r 最大,12b b >,12a a <,故B ,C 正确,D 错误. 故选:D . 【点睛】本题考查线性回归方程与相关系数的求法,考查计算能力,是中档题.2.B解析:B 【分析】根据指对数互化求解即可. 【详解】解:因为0.53z x =+,ln z y =,所以0.53ln x y +=,所以0.5330.5x x y e e e +==⨯,故3c e =.故选:B. 【点睛】本题考查非线性回归问题的转化,是基础题.3.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 4.A解析:A 【解析】 【分析】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,实验的结果只有发生和不发生两种结果,故本题符合独立重复试验,由独立重复试验的期望公式得到结果. 【详解】由题意知本题是在相同的条件下发生的试验,发射的事故率都为0.01,故本题符合独立重复试验,即ξ~(10,0.01)B . ∴100.010.1E ξ=⨯= 故选A . 【点睛】解决离散型随机变量分布列和期望问题时,主要依据概率的有关概念和运算,同时还要注意题目中离散型随机变量服从什么分布,若服从特殊的分布则运算要简单的多.5.A解析:A 【解析】 【分析】由题意结合2K 的观测值k 由独立性检验的数学思想给出正确的结论即可. 【详解】由于2K 的观测值10k =7.879>,其对应的值0.0050.5%=,据此结合独立性检验的思想可知:有99.5%的把握认为使用智能手机对学习有影响. 本题选择A 选项. 【点睛】独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.6.B解析:B 【解析】 【分析】根据独立性检验的定义可判断(1);根据方差的性质可判断(2);根据残差的性质可判断(3);根据正态分布的对称性可判断(4).【详解】(1)对分类变量X 与Y 的随机变量2K 的观测值K 来说,K 越大,判断“X 与Y 有关系”的把握越大,故(1)错误;(2)若将一组样本数据中的每个数据都加上同一个常数后,数据的离散程度不变,则样本的方差不变,故(2)正确;(3)根据残差的定义可知,在残差图,残差点分布的带状区域的宽度越狭窄,预测值与实际值越接近,其模型拟合的精度越高,(3)正确;(4)设随机变量ξ服从正态分布()0,1N ,若()1P p ζ>=,则()1P p ζ<-=,则()1112P p ζ-<<=-,则()1102P p ζ-<<=-,故(4)正确, 故正确的命题的个数为3个,故选B. 【点睛】本题主要通过对多个命题真假的判断,主要综合考查独立性检验的定义、方差的性质、残差的性质以及正态分布的对称性,属于中档题. 这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.7.C解析:C 【解析】因为统计量2χ有三个临界值:2.706、3.841和6.635,而2χ=18.87>6.635,所以有99%的把握认为两者有关,选C.8.B解析:B【解析】由独立性检验的知识知:K 2>3.841时,有95%的把握认为“变量X 与Y 有关系”;K 2>6.635时,有99%的把握认为“变量X 与Y 有关系”.故选项B 正确.9.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.10.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A.点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 11.C解析:C 【解析】因为2 6.023K =,且5.024 6.023 6.635≤≤,所以有把握认为“爱好该项运动与性别有关”的可信度P 满足10.02510.010P -≤≤-,即0.9750.99P ≤≤,应选答案C 。
(压轴题)高中数学高中数学选修2-3第三章《统计案例》检测题(包含答案解析)(1)
一、选择题1.某商场为了了解不同厂家生产的散装面包的月销售量y (千克)与售价x (元/千克)之间的关系,随机统计了某几个月的月销售量与当月各散装面包的售价,相关数据如下表:由表中数据算出线性回归方程为 3.1ˆˆyx a =-+,则样本在()18180,处的残差为( ) A .0B .1.4C .2D .2.12.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是A .10200ˆyx =-+ B .10200ˆyx =+ C .10200ˆyx =-- D .10200ˆyx =- 3.已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据上表可得回归方程y bx a =+,计算得7b =,则当投入10万元广告费时,销售额的预报值为 A .75万元 B .85万元 C .99万元D .105万元4.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:则认为多看电视与人冷漠有关系的把握大约为( )附:K 2=. P (K 2≥k 0) 0.10 0.05 0.025 0.010 0.005 0.001 k 02.7063.8415.0246.6357.87910.828A .99%B .97.5%C .95%D .90%5.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅临界值表来确定推断“X 与Y 有关系”的可信度,如果k >5.024,那么就推断“X 和Y 有关系”,这种推断犯错误的概率不超过( ) A .0.25 B .0.75 C .0.025 D .0.9756.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力( ) A .平均数与方差 B .回归分析 C .独立性检验 D .概率 7.有下列数据: x123y35.9912.01下列四个函数中,模拟效果最好的为( ) A .B .C .D .8.已知,x y 的取值如下表:( )x0 1, 2 3 4 y11.33.25.68.9若依据表中数据所画的散点图中,所有样本点()(,)1,2,3,4,5i i x y i =都在曲线212y x a =+附近波动,则a =( ) A .1B .12C .13D .12-9.下列命题中:①线性回归方程y bx a =+必过点(),x y ;②在回归方程35y x =-中,当变量增加一个单位时,y 平均增加5个单位; ③在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好;④在回归直线0.58ˆyx =-中,变量2x =时,变量y 的值一定是-7. 其中假命题的个数是 ( ) A .1 B .2C .3D .410.由某个22⨯列联表数据计算得随机变量2K 的观测值k 6.879=,则下列说法正确的是 ( )0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.7081.3232.0722.7063.8415.0246.6357.87910.828A .两个分类变量之间有很强的相关关系B .有99%的把握认为两个分类变量没有关系C .在犯错误的概率不超过1.0%的前提下认为这两个变量间有关系D .在犯错误的概率不超过0.5%的前提下认为这两个变量间有关系 11.某商场为了解毛衣的月销售量y (件)与月平均气温()x C 之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温()xC17 1382月销售量y (件)2433 40 55由表中数据算出线性回归方程ˆybx a =+中的2b =-,气象部门預测下个月的平均气温约为6C ,据此估计该商场下个月毛衣销售量约为( )件. A .46B .40C .38D .5812.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大 其中正确的个数是 A .1B .2C .3D .4二、填空题13.x 和y 的散点图如图所示,则下列说法中所有正确命题的序号为______.①x ,y 是负相关关系;②x ,y 之间不能建立线性回归方程;③在该相关关系中,若用21c x y c e =拟合时的相关指数为21R ,用y bx a =+拟合时的相关指数为22R ,则2212R R >.14.某中学为了调研学生的数学成绩和物理成绩是否有关系,随机抽取了189名学生进行调查,调查结果如下:在数学成绩较好的94名学生中,有54名学生的物理成绩较好,有40名学生的物理成绩较差;在成绩较差的95名学生中,有32名学生的物理成绩较好,有63名学生的物理成绩较差.根据以上的调查结果,利用独立性检验的方法可知,约有________的把握认为“学生的数学成绩和物理成绩有关系”.15.甲、乙两人在5次综合测评中成绩的茎叶图如图所示,其中一个数字被污损,记甲、乙的平均成绩分别为x -甲,x -乙,则x -甲>x -乙的概率是________.16.今年一轮又一轮的寒潮席卷全国.某商场为了了解某品牌羽绒服的月销售量y (件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,数据如下表:由表中数据算出线性回归方程中的b≈﹣2.气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量的件数约为_____.17.某单位为了了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程=+x中=﹣2,据此预测当气温为5℃时,用电量的度数约为_____.18.已知下列表格所示数据的回归直线方程为 y =" 3.8x" + a,则a的值为__________.19.为了判断高中三年级学生选修文理科是否与性别有关,现随机抽取50名学生,得到2×2列联表:理科文科总计男131023女72027总计203050已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到≈4.844,则认为选修文理科与性别有关系出错的可能性约为________.20.某大学进行自主招生时,需要进行逻辑思维和阅读表达两项能力的测试.学校对参加测试的200名学生的逻辑思维成绩、阅读表达成绩以及这两项的总成绩进行了排名.其中甲、乙、丙三位同学的排名情况如下图所示:得出下面四个结论:①甲同学的阅读表达成绩排名比他的逻辑思维成绩排名更靠前②乙同学的逻辑思维成绩排名比他的阅读表达成绩排名更靠前③甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前④乙同学的总成绩排名比丙同学的总成绩排名更靠前则所有正确结论的序号是_________.三、解答题21.为了解使用手机是否对学生的学习有影响,某校随机抽取50名学生,对学习成绩和使用手机情况进行了调查,统计数据如表所示(不完整):与使用手机有关;(2)现从上表不使用手机的学生中按学习成绩是否优秀分层抽样选出9人,再从这9人中随机抽取3人,记这3人中“学习成绩优秀”的人数为X,试求X的分布列与数学期望.参考公式:()()()()()22n ad bca b c d a c b dχ-=++++,其中n a b c d=+++.参考数据:22.随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市发行2亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了50人,对是否使用过消费券的情况进行调查,结果如下表所示,其中年龄低于45岁的人数占总人数的3 5 .99%的把握认为是否使用消费券与人的年龄有关.年龄低于45岁的人数 年龄不低于45岁的人数 合计使用消费券人数 未使用消费券人数 合计参考数据:()20P K k 0.150.10 0.05 0.025 0.010 0.005 0.001 0k2.0722.7063.8415.0246.6357.87910.82822()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)从使用消费券且年龄在[15,25)与[25,35)的人中按分层抽样方法抽取6人,再从这6人中选取2名,记抽取的两人中年龄在[15,25)的人数为X ,求X 的分布列与数学期望. 23.2019年4月,中国电信公布了2019年的终端洞察报告,其中,国产手机品牌表现抢眼,统治地位不容置疑.在2018年6~11月上市的新机中,用户最满意机型与用户推荐机型的项目中国产手机优势明显,华为及荣耀手机分别占据不同价位段的榜单第一,OPPO 、vivo 、小米、魅族均有机型占据榜单.在用户满意机型调研项目中,曾经位于神坛地位的苹果手机也仅仅只有iPhone XR 一款位列第三.(1)从上表中15个机型中任取3个,求这3个机型恰好有2个是“华为”或“荣耀”的概率; (2)测试数据源于消费者的反馈,从反馈信息中随机抽取500个“华为畅享9plus ”消费者,其中来自城市300个,来自农村200个,统计他们对“华为畅想9plus ”的满意情况如下:满意 不满意城市270 30农村 170 30根据上表数据,问是否有95%的把握认为消费者是否满意与城市用户还是农村用户有关? (附:()()()()()22n ad bc a b c d a c b d χ-=++++,当2 3.841χ>时,有95%的把握说事件A 与B 有关;当26.635χ>时,有99%的把握说事件A 与B 有关;当2 3.841χ≤时,认为事件A 与B 是无关的)24.近年来,“家长辅导孩子作业”已成为家长朋友圈里的一个热门话题.某研究机构随机调查了该区有孩子正在就读小学的140名家长,以研究辅导孩子作业与家长性别的关系,得到下面的数据表:(1)请将下列列联表填写完整,并判断能否在犯错误的概率不超过0.05的前提下,认为是否辅导孩子作业与家长性别有关?是否辅导家长性别辅导不辅导 合计男50女 40 合计70(2)若从被调查的50名爸爸中任选2名爸爸,并用A 表示事件“至少1名爸爸辅导”,用B 表示事件“2名爸爸都辅导”,求()|P B A .参考公式:22(),()()()()n ad bc K a b c d a c b d -=++++其中n a b c d =+++. 参考数据:()P K k ︒≥0.15 0.10 0.05 0.025 0k 2.0722.7063.8415.02425.司机在开机动车时使用手机是违法行为,会存在严重的安全隐患,危及自己和他人的生命. 为了研究司机开车时使用手机的情况,交警部门调查了100名机动车司机,得到以下统计:在55名男性司机中,开车时使用手机的有40人,开车时不使用手机的有15人;在45名女性司机中,开车时使用手机的有20人,开车时不使用手机的有25人.(1)完成下面的22⨯列联表,并判断是否有99.5%的把握认为开车时使用手机与司机的性别有关;开车时使用手机 开车时不使用手机 合计男性司机人数 女性司机人数 合计(2)以上述的样本数据来估计总体,现交警部门从道路上行驶的大量机动车中随机抽检3辆,记这3辆车中司机为男性且开车时使用手机的车辆数为X ,若每次抽检的结果都相互独立,求X 的分布列和数学期望()E X . 参考公式与数据: 参考数据:()20P k χ>0.15 0.100.050.025 0.010 0.005 0.001 0k 2.0722.7063.8415.0246.6357.87910.828参考公式()()()()()22n ad bc a b c d a c b d χ-=++++,其中n a b c d =+++.26.云南是世界茶树的原产地之一,也是中国四大茶产区之一,独特的立体气候为茶叶的种质资源多样性创造了良好的自然条件,茶叶产业是云南高原特色农业的闪亮名片.某大型茶叶种植基地为了比较A 、B 两品种茶叶的产量,某季采摘时,随机选取种植A 、B 两品种茶叶的茶园各30亩,得到亩产量(单位:kg/亩)的茎叶图如下(整数位为茎,小数位为叶,如55.4的茎为55,叶为4):亩产不低于60kg 的茶园称为“高产茶园”,其它称为“非高产茶园”.(1)请根据已知条件完成以下22⨯列联表,并判断是否有95%的把握认为“高产茶园”与茶叶品种有关?(2)用样本估计总体,将频率视为概率,现从该种植基地A 品种的所有茶园中随机抽取4亩,且每次抽取的结果相互独立,设被抽取的4亩茶园中“高产茶园”的亩数为X ,求X 的分布列和数学期望()E X .附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++【参考答案】***试卷处理标记,请不要删除一、选择题 1.B 解析:B 【分析】根据表中的数据求出(),x y ,利用回归直线方程经过样本中心点(),x y 求出ˆa ,把18x = 代入回归直线方程求出ˆy,利用残差的定义ˆy y -即可求解. 【详解】由表格得(),x y 为()24,160 ,又回归直线方程 3.1ˆˆyx a =-+经过样本中心点(),x y , 所以160 3.124ˆa=-⨯+,解得ˆ234.4a =, 所以回归直线方程为 3.123.4ˆ4yx =-+,把18x = 代入回归直线方程可得,ˆ178.6y=, 故样本在()18180, 处的残差为180178.6 1.4-=. 故选:B 【点睛】本题考查回归直线方程经过样本中心点和利用回归直线方程求某点处的残差;考查运算求解能力;熟练掌握回归直线方程经过样本中心点和残差的定义是求解本题的关键;属于中档题.2.A解析:A 【解析】试题分析:因为商品销售量x 与销售价格ˆy负相关,所以排除B ,D 选项, 将0x =代入10200ˆyx =--可得2000ˆy =-<,不符合实际.故A 正确. 考点:线性回归方程.【方法点睛】本题主要考查线性回归方程,属容易题.线性回归方程ˆˆˆy bx a =+当ˆ0b<时ˆ,x y 负相关;当ˆ0b >时ˆ,x y 正相关. 3.B解析:B 【解析】分析:根据表中数据求得样本中心(,)x y ,代入回归方程ˆ7ˆyx a =+后求得ˆa ,然后再求当10x =的函数值即可. 详解:由题意得11(24568)5,(3040506070)5055x y =++++==++++=, ∴样本中心为(5,50).∵回归直线ˆ7ˆyx a =+过样本中心(5,50), ∴ˆ5075a=⨯+,解得ˆ15a =, ∴回归直线方程为ˆ715yx =+. 当10x =时,710158ˆ5y=⨯+=, 故当投入10万元广告费时,销售额的预报值为85万元. 故选B .点睛:本题考查回归直线过样本中心这一结论和平均数的计算,考查学生的运算能力,属容易题.4.A解析:A 【解析】由公式可计算得K 2≈11.377>6.635.故选A.点睛:(1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.5.C解析:C【解析】∵P (k >5.024)=0.025,故在犯错误的概率不超过0.025的条件下,认为“X 和Y 有关系”. 考点:独立性检验.6.C解析:C【解析】判断两个分类变量是否有关的最有效方法是进行独立性检验,故选C. 考点:独立性检验的意义.7.A解析:A 【解析】当x =1,2,3时,分别代入求y 值,离y 最近的值模拟效果最好,可知A 模拟效果最好.故选A.考点:非线性回归方程的选择.8.A解析:A 【解析】 设2t x = ,则11(014916)6,(1 1.3 3.2 5.68.9)455t y =++++==++++=,所以点(6,4)在直线12y t a =+上,求出1a =,选A. 点睛:本题主要考查了散点图,属于基础题.样本点的中心(),x y 一定在直线回归直线上,本题关键是将原曲线变形为12y t a =+,将点(6,4)代入,求出值. 9.C解析:C 【解析】对于①,线性回归方程 ˆˆˆybx a =+必过点)x y (,,满足回归直线的性质,所以①正确;对于②,在回归方程ˆ35y x =-中,当变量x 增加一个单位时,y 平均减少5个单位,不是增加5个单位;所以②不正确;对于③,在回归分析中,相关指数2R 为0.80的模型比相关指数2R 为0.98的模型拟合的效果要好,该判断恰好相反;所以③不正确;对于④,在回归直线0.58ˆy x =-中,变量2x =时,变量y 的值一定是-7.不是一定为7,而是可能是7,也可能在7附近,所以④不正确;故选C.10.C解析:C 【解析】由22⨯列联表数据计算得随机变量2K 的观测值是 6.879 6.635k =>,通过对照表中数据得,在犯错误的概率不超过1.0%的前提下,认为这两个变量间有关系,故选C.11.A解析:A 【解析】试题分析:根据题意,样本中心点的坐标为()10,38,所以38210,58a a =-⨯+∴=,因此回归直线方程为2ˆ58yx =-+,所以当6x =时,估计该商场下个月毛衣销售量约为26ˆ5846y=-⨯+=,故选A. 考点:回归直线方程.12.B解析:B 【解析】逐一考查所给的说法:①将一组数据中的每个数据都乘以同一个非零常数a 倍,原说法错误;②设有一个回归方程35y x =-,变量x 增加1个单位时,y 平均减少5个单位,原说法正确;③线性相关系数r 的绝对值越大,两个变量的线性相关性越强;反之,线性相关性越弱,原说法错误;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.5,原说法错误;⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大,原说法正确. 本题选择B 选项.二、填空题13.①③【分析】由图可知散点图呈整体下降趋势据此判断①的正误;由试验数据得到的点将散布在某一直线周围因此可以认为关于的回归函数的类型为线性函数据此判断②的正误;根据散点图比较两个方程的拟合效果比较那个拟解析:①③ 【分析】由图可知,散点图呈整体下降趋势,据此判断①的正误;由试验数据得到的点将散布在某一直线周围,因此,可以认为关于的回归函数的类型为线性函数,据此判断②的正误;根据散点图比较两个方程的拟合效果,比较那个拟合效果更好,据此判断③;. 【详解】在散点图中,点散布在从左上角到右下角的区域,因此x ,y 是负相关关系,故①正确; x,,y 之间可以建立线性回归方程,但拟合效果不好,故②错误;由散点图知用21c xy c e =拟合比用y bx a =+拟合效果要好,则2212R R >,故③正确. 故答案为:①③. 【点睛】本题考查由散点图反应两个变量的相关关系,散点图中如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.若点散布在从左下角到右上角的区域,则正相关,属于中档题.14.5【解析】【分析】根据题目中的数据利用的公式求得的值即可作出判断得到答案【详解】根据题目中所给的数据可得到2×2列联表再由公式得k =≈1076因为1076>7879所以约有995的把握认为学生的数学解析:5% 【解析】 【分析】根据题目中的数据,利用2K 的公式,求得2K 的值,即可作出判断,得到答案. 【详解】根据题目中所给的数据可得到2×2列联表,再由公式得k =≈10.76.因为10.76>7.879,所以约有99.5%的把握认为“学生的数学成绩和物理成绩有关系”. 【点睛】本题主要考查了独立性检验的应用,其中解答中认真审题,准确计算2K 的值是解答本题的关键,着重考查了推理与运算能力,属于基础题.15.【解析】由茎叶图知乙=90甲=89+污损处可取数字012…9共10种而甲>乙时污损处对应的数字有6789共4种故甲>乙的概率为答案:解析:25【解析】由茎叶图知x 乙=90,x 甲=89+5x.污损处可取数字0,1,2,…,9,共10种,而x 甲>x 乙时,污损处对应的数字有6,7,8,9,共4种,故x 甲>x 乙的概率为25. 答案:25. 16.【解析】试题分析:由数表得又将点代入得所以故当时考点:线性回归方程解析:【解析】试题分析:由数表,得,,又,将点代入,得,所以,故当时,.考点:线性回归方程.17.40【解析】试题分析:根据所给的表格做出本组数据的样本中心点根据样本中心点在线性回归直线上利用待定系数法做出a 的值现在方程是一个确定的方程根据所给的x 的值代入线性回归方程预报要销售的件数解:由表格得解析:40 【解析】试题分析:根据所给的表格做出本组数据的样本中心点,根据样本中心点在线性回归直线上,利用待定系数法做出a 的值,现在方程是一个确定的方程,根据所给的x 的值,代入线性回归方程,预报要销售的件数.解:由表格得=(14+12+8+6)÷4=10,=(22+26+34+38)÷4=30 即样本中心点的坐标为:(10,40), 又∵样本中心点(10,40)在回归方程 上且b=﹣2∴30=10×(﹣2)+a , 解得:a=50, ∴当x=5时,y=﹣2×(5)+50=40. 故答案为40.考点:回归分析的初步应用.18.【解析】试题分析:因为回归直线方程恒过点则代入得考点:回归直线方程解析:242.8a =【解析】试题分析:因为回归直线方程恒过点(),x y ,则234562512542572622664,25855x y ++++++++====,代入 3.8?y x a =+, 得258 3.84?242.8a a =⨯+⇒= 考点:回归直线方程19.5【解析】由K2=4844>3841故认为选修文科与性别有关系出错的可能性约为5 解析:【解析】由K 2=4.844>3.841.故认为选修文科与性别有关系出错的可能性约为5%.20.③④【解析】根据图示可得甲同学的逻辑思维成绩排名很靠前但总排名靠后说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排解析:③④ 【解析】根据图示可得,甲同学的逻辑思维成绩排名很靠前但总排名靠后,说明阅读表达成绩排名靠后;乙同学的逻辑思维成绩排名适中但总排名靠前,说明阅读表达成绩排名靠前;丙同学的逻辑思维成绩排名及阅读表达成绩排名居中,则乙同学的总成绩排名比丙同学的总成绩排名更靠前;甲、乙、丙三位同学的逻辑思维成绩排名中,甲同学更靠前,故③④正确.故答案为③④.三、解答题21.(1)没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)分布列见解析,()2E X =.【分析】(1)根据表格中数据和题中信息可完善22⨯列联表,计算出2χ的观测值,结合临界值表可得出结论;(2)由题意可知,随机变量X 的可能取值有0、1、2、3,计算出随机变量X 在不同取值下的概率,可得出随机变量X 的分布列,进而可求得随机变量X 的数学期望值. 【详解】(1)22⨯列联表如下表所示:()22505102015258.33310.828203025253χ⨯⨯-⨯==≈<⨯⨯⨯,所以,没有99.9%的把握认为学生的学习成绩与使用手机有关;(2)9人中学习成绩优秀的人有209630⨯=人,学习成绩一般的有109330⨯=人, X 可能的取值有0、1、2、3,()3911084P X C ===,()1263393114C C P X C ===,()21633915228C C P X C ===,()363953?21C P X C ===.所以,随机变量X 的分布列为()1232142821E X =⨯+⨯+⨯=. 【点睛】思路点睛:求解随机变量分布列的基本步骤如下:(1)明确随机变量的可能取值,并确定随机变量服从何种概率分布; (2)求出每一个随机变量取值的概率;(3)列成表格,对于抽样问题,要特别注意放回与不放回的区别,一般地,不放回抽样由排列、组合数公式求随机变量在不同取值下的概率,放回抽样由分步乘法计数原理求随机变量在不同取值下的概率.22.(1)列联表答案见解析,有99%的把握认为是否使用消费券与人的年龄有关;(2)分布列答案见解析,数学期望:23. 【分析】(1)根据年龄低于45岁的人数占总人数的35.可列出关于,m n 的方程组求解. 根据数据列联表,由公式22()()()()()n ad bc K a b c d a c b d -=++++计算k 的值,查表可作结论.(2)考查超几何分布求分布列,若随机变量服用超几何分布()~,,X H m M N ,则概率公式为()mNm k N MM k C C P X k C --==,可利用公式求出分布列,再求数学期望即可. 【详解】(1)由题意得515105505153505m n m +++++=⎧⎪++⎨=⎪⎩解得10,5m n ==;由以上统计数据填写下面22⨯列联表,如下根据公式计算250(1027103)9.98 6.635 37133020K⨯-⨯=≈>⨯⨯⨯,所以有99%的把握认为是否使用消费券与人的年龄有关:(2)由题意知抽取的6人中年龄在[15,25)的有2人,年龄在[25,35)的有4人,所以X的可能取值为0,1,2.且21124242222666281 (0),(1),(2)51515C C C CP X P X P XC C C=========,所以X的分布列为()012515153E X=⨯+⨯+⨯=.【点睛】1.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.2.超几何分布描述的是不放回抽样问题,随机变量为抽到的某类个体的个数.超几何分布的特征是:①考查对象分两类;②已知各类对象的个数;③从中抽取若干个个体,考查某类个体个数X的概率分布,超几何分布主要用于抽检产品、摸不同类别的小球等概率模型,其实质是古典概型.23.(1)2791;(2)没有95%的把握认为消费者是否满意与城市用户还是农村用户有关,理由见解析.【分析】(1)由题意可知,15个机型中,“华为”或“荣耀”的机型个数为6,利用组合计数原理以及古典概型的概率公式可求得所求事件的概率;(2)根据列联表中的数据可求得2χ的观测值,利用题中的参考数据可得出结论.【详解】(1)由题意可知,15个机型中,“华为”或“荣耀”的机型个数为6,所以,从上表中15个机型中任取3个,这3个机型恰好有2个是“华为”或“荣耀”的概率为21 69 3 1515927 351391C C PC ⨯===⨯;(2)由列联表中的数据可得()225002703017030 2.841 3.84144060300200χ⨯⨯-⨯=≈<⨯⨯⨯, 因此,没有95%的把握认为消费者是否满意与城市用户还是农村用户有关. 【点睛】本题考查古典概型概率的计算,同时也考查了利用独立性检验解决实际问题,考查数据处理能力,属于中等题.24.(1)列联表见解析,不能在犯错误的概率不超过0.05的前提下,认为辅导孩子作业与家长性别有关;(2)2969. 【分析】(1)根据题中条件,将表补齐,利用公式求得2K 的值,与临界值比较即可得结果;(2)根据题意,求得对应的基本事件数,结合条件概率公式求得结果. 【详解】(1)列联表填写如下图所示:是否辅导家长性别辅导不辅导 合计男 30 20 50 女 40 50 90 合计70701402140(30502040)140 3.11 3.8417070905045K ⨯⨯-⨯==≈<⨯⨯⨯,所以不能在犯错误的概率不超过0.05的前提下,认为辅导孩子作业与家长性别有关;(2)至少一名爸爸辅导的可能情况有225020()C C -种; 两名爸爸辅导的情况有230C 种;所以()230225020()29()69|C P AB P B A P A C C ===-. 【点睛】该题考查的是有关概率统计的问题,涉及到的知识点有列联表,独立性检验,条件概率公式,属于简单题目.25.(1)列联表见解析,有;(2)分布列见解析,1.2. 【分析】(1)根据已知数据即可得到列联表;计算出28.2497.879χ≈>,对比临界值表可得到结果;(2)由样本估计总体思想,可得到随机抽检1辆,司机为男性且开车使用手机的概率为25,可知235X B ⎛⎫⎪⎝⎭,,由二项分布概率公式可计算得到每个取值所对应的概率,从而得到分布列;由二项分布数学期望计算公式可得()E X . 【详解】(1)由已知数据可得22⨯列联表如下:()2100402515208.2497.87960405545χ⨯⨯-⨯=≈⨯⨯⨯>∴有99.5%的把握认为开车时使用手机与司机的性别有关(2)随机抽检1辆,司机为男性且开车时使用手机的概率4021005p == 有题意可知:X 可取值是0,1,2,3,且235XB ⎛⎫ ⎪⎝⎭, ()03032327055125P X C ⎛⎫⎛⎫∴=== ⎪ ⎪⎝⎭⎝⎭;()12132354155125P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭; ()21232336255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭;()333238355125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ 则X 的分布列为:数学期望()3 1.25E X =⨯= 【点睛】本题考查独立性检验的应用、二项分布的分布列及数学期望的求解等知识,对学生的计算和求解能力有一定要求,属于常考题型.26.(1)列联表见解析,有95%的把握认为“高产茶园”与茶叶品种有关;(2)分布列见解析,E (X )=43. 【分析】(1)根据已知条件填写列联表,计算K 2,对照临界值得出结论;。
(必考题)高中数学高中数学选修2-3第三章《统计案例》测试(答案解析)(3)
一、选择题1.某高校为调查学生喜欢“应用统计”课程是否与性别有关,随机抽取了选修课程的55名学生,得到数据如下表:临界值参考:(参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++)参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别无关”C.有99.99%以上的把握认为“喜欢“应用统计”课程与性别有关”D.有99.99%以上的把握认为“喜欢“应用统计”课程与性别无关”2.为了调查某校高二学生的身高是否与性别有关,随机调查该校64名高二学生,得到2×2列联表如表:附:K 2()()()()2()n ad bc a b c d a c b d -=++++由此得出的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“身高与性别无关”B .在犯错误的概率不超过0.01的前提下,认为“身高与性别有关”C .有99.9%的把握认为“身高与性别无关”D .有99.9%的把握认为“身高与性别有关” 3.下列说法中错误的是( )A .先把高二年级的2000名学生编号:1到2000,再从编号为1到50的学生中随机抽取1名学生,其编号为m ,然后抽取编号为50m +,100m +,150m +,……的学生,这种抽样方法是系统抽样法.B .一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x .C .若两个随机变量的线性相关性越强,则相关系数r 的值越接近于1.D .若一组数据1,a ,3的平均数是2,则该组数据的方差是23. 4.假设有两个分类变量X 和Y 的22⨯列联表为:对同一样本,以下数据能说明X 与Y 有关系的可能性最大的一组为参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.A .5,35b d ==B .15,25b d ==C .20,20b d ==D .30,10b d ==5.某科研机构为了研究中年人秃发与患心脏病是否有关,随机调查了一些中年人的情况,具体数据如表,根据表中数据则可判定秃发与患心脏病有关,那么这种判定出错的可能性为( )患心脏病情况秃发情况 患心脏病无心脏病 秃发 20 300 不秃发5450A .0.1B .0.05C .0.01D .0.996.经过对K 2的统计量的研究,得到了若干个观测值,当K 2≈6.706时,我们认为两分类变量A 、B ( )A .有67.06%的把握认为A 与B 有关系 B .有99%的把握认为A 与B 有关系C .有0.010的把握认为A 与B 有关系D .没有充分理由说明A 与B 有关系 7.对两个分类变量A ,B 的下列说法中正确的个数为( )①A 与B 无关,即A 与B 互不影响; ②A 与B 关系越密切,则K 2的值就越大; ③K 2的大小是判定A 与B 是否相关的唯一依据 A .0 B .1 C .2 D .38.通过随机询问250名不同性别的高中生在购买食物时是否看营养说明书,得到如下列联表:从调查的结果分析,认为性别和读营养说明书的关系为( ) 附:()()()()()22n ad bc K a b c d a c b d -=++++ .A .95%以上认为无关B .90%~95%认为有关C .95%~99.9%认为有关D .99.9%以上认为有关9.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”,得到如下的列联表:由此表得到的正确结论是( )A .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过0.01的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .在犯错误的概率不超过0.1的前提下,认为“该市居民能否做到‘光盘’与性别无关” 10.若在区间[-5,5]内任取一个实数a ,则使直线x +y +a =0与圆(x -1)2+(y +2)2=2有公共点的概率为( )A .5B .25C .35D .1011.如表为某公司员工工作年限x (年)与平均月薪y (千元)对照表.已知y 关于x 的线性回归方程为0.70.35y x =+,则下列结论错误的是( )A .回归直线一定过点(4.5,3.5)B .工作年限与平均月薪呈正相关C .t 的取值是3.5D .工作年限每增加1年,工资平均提高700元12.下列说法:①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大.②以模型kx y ce =去拟合一组数据时,为了求出回归方程,设ln z y =,将其变换后得到线性方程0.34z x =+,则,c k 的值分别是4e 和0.3.③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y a bx =+中,2,1,3b x y ===,则1a =.④如果两个变量x 与y 之间不存在着线性关系,那么根据它们的一组数据()(,1,2,,)i i x y i n =不能写出一个线性方程正确的个数是( ) A .1B .2C .3D .4二、填空题13.在一次独立试验中,有200人按性别和是否色弱分类如下表(单位:人)男 女 正常 73 117 色弱73你能在犯错误的概率不超过_____的前提下认为“是否色弱与性别有关”?14.登山族为了了解某山高y (km)与气温x (℃)之间的关系,随机统计了4次山高与相应的气温,并制作了对照表: 气温x (℃) 18 13 10 -1 山高y (km)24343864由表中数据,得到线性回归方程ˆy=-2x+ˆa (ˆa ∈R),由此估计出山高为72(km)处的气温为_____℃.15. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,下图是据某地某日早7点至晚8点甲、乙两个 2.5PM 监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是_________.16.某单位为了了解用电量y (度)与气温x (度)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下的对照表由表中数据,得回归直线方程ˆˆˆy bx a =+,若ˆ2b=-,则ˆa =________. 17.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考查某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:附表:参照附表,在犯错误的概率不超过______(填百分比)的前提下,认为“小动物是否被感染与有没有服用疫苗有关”. 18.给出下列四个结论:(1)如图Rt ABC ∆中,2,90,30.AC B C =∠=︒∠=︒是斜边上的点,.以为起点任作一条射线交于点,则点落在线段上的概率是32;(2)设某大学的女生体重与身高具有线性相关关系,根据一组样本数据,用最小二乘法建立的线性回归方程为,则若该大学某女生身高增加,则其体重约增加;(3)若()f x 是定义在上的奇函数,且满足,则函数()f x 的图像关于对称;(4)已知随机变量ξ服从正态分布()()21,,40.79,N P σξ≤=则.其中正确结论的序号为________________19.关于变量,x y 的一组样本数据11()a b ,,22()a b ,,……,(),n n a b (2n ≥,12,,,n a a a ⋅⋅⋅不全相等)的散点图中,若所有样本点(,)i i a b (1,2,,i n =⋅⋅⋅)恰好都在直线21y x =-+上,则根据这组样本数据推断的变量,x y 的相关系数为_____________.20.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下联表:感染 未感染 总计服用10 40 50参考公式:()()()()()22n ad bcKa b c d a c b d-=++++参照附表,在犯错误的概率最多不超过__________(填百分比)的前提下,可认为“该种疫苗由预防埃博拉病毒感染的效果”.三、解答题21.今年疫情期间,许多老师进行抖音直播上课某校团委为了解学生喜欢抖音上课是否与性别有关,从高三年级中随机抽取30名学生进行了问卷调查,得到如下列联表:已知在这30人中随机抽取1人抽到喜欢抖音上课的学生的概率是8 15.(1)请将上面的列联表补充完整,并据此资料分析能否有95%的把握认为喜欢抖音上课与性别有关?(2)若从这30人中的女生中随机抽取2人,记喜欢抖音上课的人数为X,求X的分布列、数学期望.附临界值表:参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.22.网购是当前人们购物的新方式,某公司为了改进营销方式,随机调查了100名市民,统计了不同年龄的人群网购的人数如下表:(1)若把年龄在2060,的人称为“网购迷”,否则称为“非网购迷”,请完成下面的22⨯列联表,并判断能否在犯错误的概率不超过1%的前提下,认为网购与性别有关?附:()()()()()2n ad bc K a b c d a c b d -=++++.两人年龄都小于20岁的概率.23.随着新冠疫情防控进入常态化,人们的生产生活逐步步入正轨.为拉动消费,某市发行2亿元消费券.为了解该消费券使用人群的年龄结构情况,该市随机抽取了50人,对是否使用过消费券的情况进行调查,结果如下表所示,其中年龄低于45岁的人数占总人数的35.99%的把握认为是否使用消费券与人的年龄有关.参考数据:)20k 0.152.0722()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (2)从使用消费券且年龄在[15,25)与[25,35)的人中按分层抽样方法抽取6人,再从这6人中选取2名,记抽取的两人中年龄在[15,25)的人数为X ,求X 的分布列与数学期望. 24.随着新高考改革的不断深入,高中学生生涯规划越来越受到社会的关注,下表为某高中为了调查学生成绩与选修生涯规划课程的关系,随机抽取50名学生的统计数据.(1)求a ,b ,c .(2)根据22⨯列联表,运用独立性检验的思想方法分析:能否有99%的把握认为“学生的成绩是否优秀与选修生涯规划课有关”.(3)如果从全校选修生涯规划课的学生中随机地抽取3名学生,求恰好抽到2名成绩不够优秀的学生的概率(将频率当作概率计算). 参考附表:参考公式()()()()()22n ad bc K a b a c b d c d -=++++,其中n a b c d =+++.25.2020年初,新型冠状病毒(2019-nCoV )肆虐,全民开启防疫防控.新型冠状病毒的传染主要是人与人之间进行传播,感染人群年龄大多数是40岁以上人群.该病毒进入人体后有潜伏期,潜伏期是指病原体侵入人体至最早出现临床症状的这段时间.潜伏期越长,感染到他人的可能性越高,现对200个病例的潜伏期(单位:天)进行调查,统计发现潜伏期平均数为7.1,方差为22.25.如果认为超过8天的潜伏期属于“长潜伏期”,按照年龄统计样本,得到下面的列联表:(1)是否有95%的把握认为“长期潜伏”与年龄有关;(2)假设潜伏期X 服从正态分布()2,N μσ,其中μ近似为样本平均数x ,2σ近似为样本方差2s .(ⅰ)现在很多省份对入境旅客一律要求隔离14天,请用概率的知识解释其合理性;(ⅱ)以题目中的样本频率估计概率,设1000个病例中恰有()*k k ∈N 个属于“长期潜伏”的概率是()g k ,当k 为何值时,()g k 取得最大值. 附:()()()()()22n ad bc a b c d a c b d χ-=++++若()2,N ξμσ则()0.6862P μσξμσ-<<+=.()220.9544P μσξμσ-<<+=,()330.9974P μσξμσ-<<+=.26.已知某种新型病毒的传染能力很强,给人们生产和生活带来很大的影响,所以创新研发疫苗成了当务之急.为此,某药企加大了研发投入,市场上这种新型冠状病毒的疫苗A 的研发费用x (百万元)和销量y (万盒)的统计数据如下:(1)根据上表中的数据,建立y 关于x 的线性回归方程y bx a =+(用分数表示); (2)根据所求的回归方程,估计当研发费用为1600万元时,销售量为多少?参考公式:()()()1122211n niii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】计算212.010.828K ≈>,对比临界值表得到答案. 【详解】()222552020105()53912.010.828()()()()3025302545n ad bc K a b c d a c b d ⨯-⨯-===≈>++++⨯⨯⨯,故在犯错误的概率不超过0.1%的前提下,认为“喜欢“应用统计”课程与性别有关”. 故选:A. 【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.2.D解析:D 【分析】根据22⨯列联表,计算2k ,与临界值表比较即可得出结论. 【详解】K 的观测值:K 2264(862426)34303232⨯⨯-⨯=≈⨯⨯⨯20.330;由于20.330>10.828,∴有99.9%的把握认为“身高与性别有关”,即在犯错误的概率不超过0.001的前提下,认为“身高与性别有关” 故选:D . 【点睛】本题主要考查了独立性检验的应用问题,K 2的计算,22⨯列联表,考查了运算能力,属于中档题.3.C解析:C 【分析】根据题意,对选项中的命题进行分析,判断真假性即可. 【详解】对于A ,根据抽样方法特征是数据多,抽样间隔相等,是系统抽样,所以A 正确; 对于B ,一组数据的方差为2s ,平均数为x ,将这组数据的每一个数都乘以2,所得的一组新数据的方差和平均数为24s ,2x ,所以B 正确;对于C ,两个随机变量的线性相关性越强,则相关系数||r 的值越接近于1,所以C 错误;对于D ,一组数据1、a 、3的平均数是2,所以2a =;所以该组数据的方差是222212[(12)(22)(32)]33s =⨯-+-+-=,所以D 正确.故选:C . 【点睛】本题主要考查抽样和统计,考查方差和平均数的计算,考查两个随机变量的相关性,意在考查学生对这些知识的理解掌握水平4.D解析:D 【解析】 【分析】 根据公式()()()()()22n ad bc K a b c d a c b d -=++++,分别利用4个选项中所给数据求出2K 的值,比较所求值的大小即可得结果. 【详解】选项A :22160(535155)3204010502K ⨯⨯-⨯==⨯⨯⨯,选项B :22260(5251515)152040204016K ⨯⨯-⨯==⨯⨯⨯,选项C :22360(5201520)24204025357K ⨯⨯-⨯==⨯⨯⨯,选项D :22460(5101530)96204035257K ⨯⨯-⨯==⨯⨯⨯,可得222431K K K >>22K >,所以由选项D 中的数据得到的2K 值最大,说明X 与Y 有关系的可能性最大,故选D . 【点睛】本题主考查独立性检验的基本性质,意在考查对基本概念的理解与应用,属于基础题.解答独立性检验问题时,要注意应用2 K 越大两个变量有关的可能性越大这一性质.5.C解析:C 【分析】首先列出22⨯联表,通过计算出2K 的值,然后作统计推断,得出正确的结论. 【详解】列出22⨯联表如下图所示:()277520450530015.96825750455320K ⨯⨯-⨯=≈⨯⨯⨯ 6.635>,故判断错误的概率不超过0.01,故选C .【点睛】本小题主要考查补全22⨯联表,考查2K 的计算以及独立性检验的概念,属于基础题. 独立性检验的步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式22n ad bc K a b c d a c b d -=++++()()()()(),计算2K 的观测值;(3)比较2K 与临界值的大小关系作统计推断. 6.B解析:B 【分析】根据所给的观测值,同临界值表中的临界值进行比较,根据P (K 2>3.841)=0.05,得到我们有1-0.05=95%的把握认为A 与B 有关系. 【详解】 依据下表:2 6.635K > ,2 6.6350.01P K =(>)∴我们在错误的概率不超过0.01的前提下有99%的把握认为A 与B 有关系, 故选B . 【点睛】本题考查独立性检验的应用,本题解题的关键是正确理解临界值对应的概率的意义,本题不用运算只要理解概率的意义即可.7.B解析:B 【解析】【分析】根据独立性检验的思想,对题目中的命题进行分析、判断正误即可. 【详解】对于①,对事件A 与B 无关时,说明两事件的影响较小,不是两个互不影响,①错误; 对于②,事件A 与B 关系密切,说明事件A 与B 的相关性就越强,K 2就越大,②正确; 对于③,K 2的大小不是判定事件A 与B 是否相关的唯一根据,判定两事件是否相关除了公式外;还可以用三维柱形图和二维条形图等方法来判定,③错误; 故选:B . 【点睛】本题考查了独立性检验思想的应用问题,属于基础题.K 2值是用来判断两个变量相关的把握度的,不是用来判断两个变量是否相关的.8.D解析:D 【解析】分析:由列联表中的数据,利用公式()()()()()22n ad bc K a b c d a c b d -=++++求得2K ,与邻界值比较,即可得到结论. 详解:()222509070603021.6310.828120130150100K ⨯⨯-⨯=≈>⨯⨯⨯,∴有0099.9的把握认为性别和读营养说明书的有关.点睛:独立性检验的一般步骤:(1)根据样本数据制成22⨯列联表;(2)根据公式()()()()()22n ad bc K a b a d a c b d -=++++计算2K 的值;(3) 查表比较2K 与临界值的大小关系,作统计判断.(注意:在实际问题中,独立性检验的结论也仅仅是一种数学关系,得到的结论也可能犯错误.)9.C解析:C 【解析】由2×2列联表得到a =45,b =10,c =30,d =15.则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100.所以K 2的观测值k =2100675-30055457525⨯⨯⨯()≈3.030.因为2.706<3.030<3.841.选C. 点睛:根据卡方公式求K 2,再与参考数据比较,最后作出判断.10.B解析:B 【解析】∵直线0x y a ++=与圆()()22122x y -+=+有公共点,∴≤13a -≤≤,∴在区间[55]-,内任取一个实数a ,使直线0x y a ++=与圆()()22122x y -+=+有公共点的概率为312555+=+,故选B. 点睛:本题主要考查了几何概型的概率,以及直线与圆相交的性质,解题的关键弄清概率类型,同时考查了计算能力,属于基础题;利用圆心到直线的距离小于等于半径可得到直线与圆有公共点,可求出满足条件的a ,最后根据几何概型的概率公式可求出所求.11.C解析:C 【解析】由已知中的数据可得:3456 4.54x +++== , 2.54 4.51144t ty ++++==,∵数据中心点(),x y 一定在回归直线上,∴110.7 4.50.354t+=⨯+解得3t =,故C 错误;故11 3.54t+=, 回归直线一定过点(4.53.5,),ABD 正确;故选C . 12.C解析:C 【解析】①分类变量A 与B 的随机变量2K 越大,说明“A 与B 有关系”的可信度越大,正确; ②∵kx y ce =,∴两边取对数,可得lny ln =(kx ce )kx lnc lnce lnc kx =+=+, 令z lny =,可得z lnc kx =+, ∵0.34z x =+, ∴40.3lnc k ==, ∴4c e =.即②正确;③根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y =a +bx 中,2,1,3b x y ===,则a =1,正确。
人教新课标版数学高二-高中数学选修2-3第三章《统计案例》质量评估
温馨提示:此套题为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,答案解析附后。
关闭Word文档返回原板块。
单元质量评估 (三)第三章(120分钟150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1. (2014·临沂高二检测)某商品的销售量y(件)与销售价格x(元/件)存在线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为=-10x+200,则下列结论正确的是( )A.y与x具有正的线性相关关系B.若r表示变量y与x之间的线性相关系数,则r=-10C.当销售价格为10元时,销售量为100件D.当销售价格为10元时,销售量为100件左右【解析】选D.x的系数为-10<0,故y与x具有负相关关系,故A错误;相关系数不等于回归方程x的系数,故B错误;由相关关系的特点可知,把x=10代入回归方程所得的y值,不是准确值,而是一个估计值,故C错误,D正确. 2.(2014·蚌埠高二检测)已知方程=0.85x-85.7是根据女大学生的身高预报体重的回归方程,其中x,的单位分别是cm,kg,则该方程在样本(165,57)处的残差是( )A.54.55B.2.45C.-2.45D.111.55【解题指南】利用回归方程,计算x=165时,y的值,进而可求方程在样本(165,57)处的残差.【解析】选B.当x=165时,=0.85x-85.7=54.55,所以方程在样本(165,57)处的残差是57-54.55=2.45.3.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(x n,y n),则不正确的说法是( )A.若求得的回归方程为=0.9x-0.3,则变量y和x之间具有正的线性相关关系B.若这组样本数据分别是(1,1),(2,1.5),(4,3),(5,4.5),则其回归方程=x+必过点(3,2.5)C.若同学甲根据这组数据得到的回归模型1的残差平方和为E1=0.8.同学乙根据这组数据得到的回归模型2的残差平方和为E2=2.1,则模型1的拟合效果更好D.若用R2(R2=1-)来刻画回归效果,回归模型3的=0.32,回归模型4的相关指数=0.91,则模型3的拟合效果更好【解析】选D.对于A:根据求得的回归方程为=0.9x-0.3,中的斜率为正,得出变量y和x之间具有正的线性相关关系;故A正确,对于B:样本中心点在直线上,故B正确,C:残差平方和越小的模型,拟合效果越好,故C正确,D:相关指数R2用来衡量两个变量之间线性关系的强弱,R2越接近于1,说明相关性越强,相反,相关性越小,故D不正确.4.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)满足y i=a+bx i+e i(i=1,2,…,n),若e i恒为0,则R2= ( )A.0B.0.5C.0.9D.1【解析】选D.e i恒为0,则残差平方和(y i-y)2=i=0,所以R2=1-=1-0=1.5.(2014·黄冈高二检测)有5组(x,y)的统计数据:(1,2),(2,4),(4,5),(3,10),(10,12),要使剩下的数据具有较强的相关关系,应去掉的一组数据是( )A.(1,2)B.(4,5)C.(3,10)D.(10,12)【解题指南】画出散点图,从中去掉一个,使剩余的点在一条直线附近. 【解析】选C.对于(1,2),(2,4),(4,5),(3,10),(10,12),在坐标系中画出五个点,结果除去(3,10)之外,其余的点都在一条线附近,所以去掉这个点以后剩下的数据更具有相关关系.6.(2014·泰安高二检测)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程=3-5x,变量x增加一个单位时,y平均增加5个单位;③当相关系数r>r0.05时,y与x之间具有相关关系;④在一个2×2列联表中,由计算得K2=13.079,则在犯错误的概率不超过0.001的前提下认为这两个变量间有关系.其中错误的个数是( )A.0B.1C.2D.3【解析】选B.①方差反映一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变,故①正确;②设有一个回归方程=3-5x,变量x增加一个单位时,y平均减少5个单位,故②不正确;③当相关系数r>r0.05时,y与x之间具有相关关系,故③正确;④由计算得K2=13.079,对照临界值,可得其两个变量间有关系的可能性是99.9%,故④正确,综上知,错误的个数是1个.7.(2014·汕头高二检测)若由一个2×2列联表中的数据计算得K2=6.825,那么确认两个变量有关系犯错误的的概率不超过( )A.0.1B.0.05C.0.01D.0.005【解析】选C.因为一个2×2列联表中的数据计算得K2=6.825,6.825>6.635,所以在犯错误的概率不超过0.01的前提下说这两个变量有关系.8.大学生和研究生毕业的一个随机样本给出了关于所获学位类别与学生性别的分类数据如表所示:硕士博士总计男162 27 189女143 8 151总计305 35 340根据以上数据,则( )A.性别与获取学位类别有关B.性别与获取学位类别无关C.性别决定获取学位的类别D.以上都是错误的【解题指南】根据列联表中两个分类变量的频数,可以粗略地算出博士和硕士中男性所占的比例,从所占的比例上可以粗略地看出和性别有关系.【解析】选A.由列联表可以直观上粗略地估计出在博士学位男的比例远远高于在硕士学位中的比例,即性别与获取学位类别有关.9.(2014·德州高二检测)在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是( )A.100个心脏病患者中至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有【解析】选D.因为“打鼾与患心脏病有关”的结论,在犯错误的概率不超过0.01的前提下表示有99%的把握认为这个结论成立,与多少个人打鼾没有关系,只有D选项正确.10.某地财政收入x与支出y满足线性回归方程y=bx+a+e(单位:亿元),其中b=0.8,a=2,|e|≤0.5,如果今年该地区财政收入是10亿元,年支出预计不会超过( )A.10亿元B.9亿元C.10.5亿元D.9.5亿元【解析】选C.代入数据得y=10+e,因为|e|≤0.5,所以|y|≤10.5,故不会超过10.5亿元.11.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:杂质高杂质低旧设备37 121新设备22 202根据以上数据,则下列说法正确的是( )A.含杂质的高低与设备改造有关B.含杂质的高低与设备改造无关C.设备是否改造决定含杂质的高低D.以上答案都不对【解析】选A.由已知数据得到如下2×2列联表杂质高杂质低总计旧设备37 121 158新设备22 202 224总计59 323 382K2的观测值k=≈13.11,由于13.11>10.828,故在犯错误的概率不超过0.001的前提下认为含杂质的高低与设备改造是有关的.12.有下列数据x 1 2 3y 3 5.99 12.01下列四个函数中,模拟效果最好的为( )A.y=3×2x-1B.y=log2xC.y=3xD.y=x2【解析】选A.当x=1,2,3,代入求值,求最接近y的.二、填空题(本大题共4小题,每小题5分,共20分,请把正确答案填在题中的横线上)13.(2014·洛阳高二检测)某饮料店的日销售收入y(单位:百元)与当天平均气温x(单位:℃)之间有下列数据:x -2 -1 0 1 2y 5 4 2 2 1甲、乙、丙三位同学对上述数据进行了研究,分别得到了x与y之间的三个线性回归方程:①=-x+3;②=-x+2.8;③=-x+2.6;④=-x+2.4,其中正确方程的序号是.【解析】=0,=2.8,(-2-0)(5-2.8)+(-1-0)(4-2.8)+(0-0)(2-2.8)+(1-0)(2-2.8)+(2-0)(1-2.8)=-10,(-2-0)2+(-1-0)2+(0-0)2+(1-0)2+(2-0)2=10.所以==-1,=-=2.8-(-1)×0=2.8,所以x与y之间的线性回归方程为=-x+2.8.答案:②14.已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=x+1与l2:y=x+,利用最小二乘法判断拟合程度更好的直线是.(填l1或l2).x 1 3 6 7 8y 1 2 3 4 5【解析】用y=x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=+(2-2)2+(3-3)2++=.用y=x+作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2++(4-4)2+=.因为S2<S1,故用直线l2:y=x+,拟合程度更好.答案:l215.(2014·徐州高二检测)某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业非统计专业统计专业性别男a=13 b=10女c=7 d=20为了判断主修统计专业是否与性别有关系,根据表中的数据,计算得到K2= (保留三位小数),所以判定(填“能”或“不能”)在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.参考公式:K2=;P(K2≥k0) 0.05 0.01k0 3.841 6.635【解析】根据提供的表格,得:K2=≈4.844>3.841.所以可以在犯错误的概率不超过0.05的前提下认为主修统计专业与性别有关系.答案:4.844 能16.(2013·深圳高二检测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程=0.67x+54.9.零件数x(个) 10 20 30 40 50加工时间y(min) 62 75 81 89现发现表中有一个数据模糊看不清,请你推断出该数据的值为. 【解析】由表知=30,设模糊不清的数据为m,则=(62+m+75+81+89)=,因为=0.67+54.9,即=0.67×30+54.9,解得m=68.答案:68三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明、证明过程或演算步骤)17.(10分)(2014·厦门高二检测)机器按照模具生产的产品有一些也会有缺陷,我们将有缺陷的产品称为次品,每小时出现的次品数随机器运转速度的不同而变化.下表为某机器生产过程的数据:速度x(百转/秒) 每小时生产次品数y(个)2 304 405 506 608 70(1)求机器运转速度与每小时生产有缺点的产品数之间的回归方程.(2)若实际生产所允许的每小时生产有缺点的产品数不超过75件,那么机器的速度每秒不超过多少百转?(写出满足的整数解)【解析】(1)=(2+4+5+6+8)=5,=(30+40+50+60+70)=50,=22+42+52+62+82=145,x i y i=2×30+4×40+5×50+6×60+8×70=1390.所以==7,=-=50-7×5=15,所以回归直线方程为=7x+15.(2)若实际生产所允许的每小时生产有缺点的产品数不超过75件,则≤75. 即7x+15≤75解得x≤8.57.所以实际生产所允许的每小时生产有缺点的产品数不超过75件,那么机器的速度应每秒不超过8百转.18.(12分)某班主任对全班50名学生的学习积极性和对待班级工作的态度进行了调查,统计数据如表所示:积极参加班级工作不太主动参加班级工作总计学习积极性高18学习积极性一般19总计50(1)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是,请完成上面的2×2列联表.(2)在(1)的条件下,试运用独立性检验的思想方法分析:在犯错误概率不超过0.1%的情况下判断学生的学习积极性与对待班级工作的态度是否有关?并说明理由.P(K2≥k0) 0.010 0.005 0.001k0 6.635 7.879 10.828【解析】(1)如果随机抽查这个班的一名学生,抽到积极参加班级工作的学生的概率是,所以积极参加班级工作的学生有24人,由此可以算出学习积极性一般且积极参加班级工作的人数为6,不太主动参加班级工作的人数为26,学习积极性高但不太主动参加班级工作的人数为7,学习积极性高的人数为25,学习积极性一般的人数为25,得到:积极参加班级工作不太主动参加班级工作总计学习积极性高18 7 25学习积极性一般 6 19 25总计24 26 50(2)K2=[50×(18×19-6×7)2]÷(25×25×24×26)=150÷13≈11.5,因为11.5>10.828,所以在犯错误的概率不超过0.001的前提下可以认为学习积极性与对待班级工作的态度有关系.19.(12分)(2014·大连高二检测)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺乙工艺总计一等品非一等品总计P(K2≥k0) 0.10 0.05 0.01k0 2.706 3.841 6.635附:K2=(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.【解题指南】(1)根据条件中所给的数据,写出列联表,注意数字比较多,不要写错位置;根据作出的列联表,把数据代入求观测值的公式,求出观测值,把观测值同临界值进行比较,得到结论.(2)由题知运用甲、乙工艺生产单件产品的利润的分布列,求出数学期望与方差,结合不同的统计量的意义,得出以后该工厂应该选择哪种工艺生产该种零件.【解析】(1)2×2列联表如下甲工艺乙工艺总计一等品50 60 110非一等品50 40 90总计100 100 200K2=≈2.02<2.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X 30 20 15P 0.5 0.3 0.2X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y 30 20 15P 0.6 0.1 0.3Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D(X)<D(Y),即甲工艺波动小,虽然E(X)<E(Y),但相差不大,所以以后选择甲工艺.20.(12分)(2014·青岛高二检测)日本发生的9.0级地震引发了海啸及核泄漏,某国际组织用分层抽样的方法从心理专家、核专家、地质专家三类专家中抽取若干人组成研究团队赴日本工作,有关数据见表1:(单位:人)核专家为了检测当地动物受核辐射后对身体健康的影响,随机选取了110只羊进行了检测,并将有关数据整理为不完整的2×2列联表(表2)表1相关人数抽样人数心理专家24 x核专家48 y地质专家72 6表2高度辐射轻微辐射总计身体健康30 A 50身体不健康 B 10 60总计 C D E(1)求研究小组的总人数.(2)写出表中的A,B,C,D,E值,并判断在犯错误的前提下,认为羊受到高度辐射与身体不健康有关的概率有多大.【解题指南】(1)根据分层抽样,比值相等,可以求出x,y的值,进而得研究小组的总人数.(2)假设羊受到高度辐射与身体不健康无关可求得K2的值,根据临界值表可以判断.【解析】(1)由题意,==,所以y=4,x=2,所以研究小组的总人数为2+4+6=12.(2)根据列联表可得A=20,B=50,C=80,D=30,E=110,假设羊受到高度辐射与身体不健康无关.所以K2=≈7.486>6.635.所以在犯错误的概率不超过0.01的前提下认为羊受到高度辐射与身体不健康有关.21.(12分)随着生活水平的提高,越来越多的人参与了潜水这项活动.某潜水中心调查了100名男性与100名女性下潜至距离水面5米时是否会耳鸣,如图为其等高条形图:(1)绘出2×2列联表.(2)利用独立性检验方法判断性别与耳鸣是否有关系?若有关系,所得的结论犯错误的概率有多大?【解题指南】(1)由男女生各100人及等高条形图可知耳鸣的男生,耳鸣的女生的人数及无耳鸣的男生,无耳鸣的女生的人数,从而可绘出2×2列联表.(2)由公式计算K2的观测值,与临界值比较,可得结论.【解析】(1)由男女生各100人及等高条形图可知耳鸣的男生有100×0.3=30人,耳鸣的女生有100×0.5=50人,所以无耳鸣的男生有100-30=70(人),无耳鸣的女生有100-50=50(人),所以2×2列联表如下:有耳鸣无耳鸣总计男30 70 100女50 50 100总计80 120 200(2)由公式计算K2的观测值:k=≈8.33>7.879.所以在犯错误的概率不超过0.005的前提下认为耳鸣与性别有关系.22.(12分)(2014·连云港高二检测)某市为了对学生的数理(数学与物理)学习能力进行分析,从10000名学生中随机抽出100位学生的数理综合学习能力等级分数(6分制)作为样本,分数频数分布如下表:等级得分(0,1] (1,2] (2,3] (3,4] (4,5] (5,6] 人数 3 17 30 30 17 3(1)如果以能力等级分数大于4分作为良好的标准,从样本中任意抽取2名学生,求恰有1名学生为良好的概率.(2)统计方法中,同一组数据常用该组区间的中点值(例如区间(1,2]的中点值为1.5)作为代表:①据此,计算这100名学生数理学习能力等级分数的期望μ及标准差σ(精确到0.1);②若总体服从正态分布,以样本估计总体,估计该市这10000名学生中数理学习能力等级在(1.9,4.1)范围内的人数.(3)从这10000名学生中任意抽取5名同学,他们数学与物理单科学习能力等级分数如下表:x(数学学习能力)2345 6y(物理学习能力) 1.5 3 4.5 5 6①请画出上表数据的散点图;②请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程=x+(附参考数据:≈11.4).【解析】(1)样本中,学生为良好的人数为20人.故从样本中任意抽取2名学生,则仅有1名学生为良好的概率为=.(2)①总体数据的期望约为:μ=0.5×0.03+1.5×0.17+2.5×0.30+3.5×0.30+4.5×0.17+5.5×0.03=3.0,标准差σ=()()()()()()2222220.530.031.530.17 2.530.3 3.530.3 4.530.17 5.530.03-⨯+-⨯+-⨯+-⨯+-⨯+-⨯=≈1.1,②由于μ=3,σ=1.1当x ∈(1.9,4.1)时,即x ∈(μ-σ,μ+σ),故数学学习能力等级分数在(1.9,4.1)范围中的概率为0.6826.数学学习能力等级分数在(1.9,4.1)范围中的学生的人数约为6826人. (3)①数据的散点图如图:②设线性回归方程为=x+,则==1.1.=-=-0.4.故回归直线方程为=1.1x-0.4.关闭Word文档返回原板块。
高中数学统计案例综合检测试题及答案-word文档
高中数学统计案例综合检测试题及答案选修2-3第三章统计案例综合检测时间120分钟,满分150分。
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4用水量y 4.5 4 3 2.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15C.5.2 D.5.25[答案] D[解析] x=2.5,y=3.5,∵回归直线方程过定点(x,y),3.5=-0.72.5+a,a=5.25.故选D.2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反[答案] A[解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0.3.有下列说法:①随机误差是引起预报值与真实值之间的误差的原因之一;②残差平方和越小,预报精度越高;③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系.其中真命题的个数是()A.0 B.1C.2 D.3[答案] D4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下:甲X 110 120 125 130 135P 0.1 0.2 0.4 0.1 0.2乙X 100 115 125 130 145P 0.1 0.2 0.4 0.1 0.2现要比较两种钢材哪一种抗拉强度较好,应考察哪项指标() A.期望与方差 B.正态分布C.卡方K2 D.概率[答案] A5.为调查中学生近视情况,测得某校男生150名中有80名近视,女生140名中有70名近视.在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.期望与方差 B.排列与组合C.独立性检验 D.概率[答案] C6.(2009海南宁夏理,3)对变量x,y观测数据(x1,y1)(i =1,2,…,10),得散点图1;对变量u,v有观测数据(u1,v1)(i=1,2,…,10),得散点图2.由这两个散点图可以判断.()A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关[答案] C[解析] 本题主要考查了变量的相关知识,考查学生分析问题和解决问题的能力.用散点图可以判断变量x与y负相关,u与v正相关.7.某地2019年第一季度应聘和招聘人数排行榜前5个行业的情况列表如下:行业名称计算机机械营销物流贸易应聘人数 215830 201950 154676 74570 65280行业名称计算机营销机械建筑化工招聘人数 124620 102935 89115 76516 70436若用同一行业中应聘人数与招聘人数比值的大小来衡量该行业的就业情况,则根据表中数据,就业形势一定是() A.计算机行业好于化工行业B.建筑行业好于物流行业C.机械行业最紧张D.营销行业比贸易行业紧张[答案] B[解析] 建筑行业的比值小于6528076516,物流行业的比值大于7457070436,故建筑好于物流.8.工人月工资y(单位:元)关于劳动生产率x(单位:千元)的回归方程为y^=650+80x,下列说法中正确的个数是()①劳动生产率为1000元时,工资约为730元;②劳动生产率提高1000元时,则工资约提高80元;③劳动生产率提高1000元时,则工资约提高730元;④当月工资为810元时,劳动生产率约为2019元.A.1 B.2C.3 D.4[答案] C[解析] 代入方程计算可判断①②④正确.9.对两个变量y和x进行回归分析,得到一组样本数据:(x1,y1),(x2,y2),…,(xn,yn),则下列说法中不正确的是()A.由样本数据得到的回归方程为y^=b^x+a^必过样本点的中心(x-,y-)B.残差平方和越小的模型,拟合的效果越好C.用相关指数R2来刻画回归效果,R2的值越小,说明模型的拟合效果越好D.若变量y和x之间的相关系数r=-0.9362,则变量y和x之间具有线性相关关系[答案] C[解析] R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好,故选C.10.判断两个分类变量是彼此相关还是相互独立的常用方法中,最为精确的是()A.三维柱形图 B.二维条形图C.等高条形图 D.独立性检验[答案] D[解析] 前三种方法只能直观地看出两个分类变量x与y是否相关,但看不出相关的程度.独立性检验通过计算得出相关的可能性,较为准确.11.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55[答案] B[解析] 相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.12.下面是某市场农产品的调查表.市场供应量表:单价(元/千克) 2 2.4 2.8 3.2 3.6 4供应量(1000千克) 50 60 70 75 80 90市场需求量表:单价(元/千克) 4 3.4 2.9 2.6 2.3 2供应量(1000千克) 50 60 70 75 80 90根据以上信息,市场供需平衡点(即供应量和需求量相等的单价)应在区间()A.(2.3,2.6) B.(2.4,2.6)C.(2.6,2.8) D.(2.8,2.9)[答案] C[解析] 以横轴为单价,纵轴为市场供、需量,在同一坐标系中描点,用近似曲线观察可知选C.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)13.当且仅当r满足________时,数据点(xi,yi)(i=1,2,…,n)在一条直线上.[答案] |r|=1[解析] 当数据点(xi,yi)在一条直线上时,y只受x的影响,即数据点完全线性相关,此时|r|=1.14.已知一个回归直线方程为y^=1.5x+45,x{1,7,5,13,19},则y=__________.[答案] 58.5[解析] 因为x=15(1+7+5+13+19)=9,且y=1.5x+45,所以y=1.59+45=58.5.本题易错之处是根据x的值及y^=1.5x+45求出y的值再求y,由y^=1.5x+45求得的y值不是原始数据,故错误.15.对具有线性相关关系的变量x和y,测得一组数据如下表.若已求得它们的回归直线方程的斜率为6.5,则这条回归直线的方程为________.x 2 4 5 6 8y 30 40 60 50 70[答案] y^=17.5+6.5x[解析] 由数据表得x=5,y=50,所以a^=y-6.5x=17.5,即回归直线方程为y^=17.5+6.5x.16.(2019广东文,12)某市居民2019~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份 2019 2019 2019 2019 2009收入x 11.5 12.1 13 13.3 15支出Y 6.8 8.8 9.8 10 12根据统计资料,居民家庭平均收入的中位数是__________,家庭年平均收入与年平均支出有__________线性相关关系.[答案] 13 正[解析] 中位数的定义的考查,奇数个时按大小顺序排列后中间一个是中位数,而偶数个时须取中间两数的平均数.由统计资料可以看出,当平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分10分)为了调查胃病是否与生活规律有关,调查某地540名40岁以上的人得结果如下:患胃病未患胃病合计生活不规律 60 260 320生活有规律 20 200 220合计 80 460 540根据以上数据回答40岁以上的人患胃病与生活规律有关吗?[解析] k=540(60200-26020)232022080460=24969602590729.638∵9.638>6.63540岁以上的人患胃病与生活是否有规律有关,有99%的把握认为生活不规律的人易患胃病.18.(本题满分12分)一台机器可以按各种不同的速度运转,其生产的物件有一些会有问题,每小时生产有问题物件的多寡,随机器运转的速度而变化,下面表格中的数据是几次试验的结果.速度(转/秒) 每小时生产有问题物件数8 512 814 916 11(1)求出机器速度影响每小时生产有问题物件数的回归直线方程;(2)若实际生产中所允许的每小时最大问题物件数为10,那么机器的速度不得超过多少转/秒?[解析] (1)用x表示机器速度,y表示每小时生产有问题物件数,那么4个样本数据为:(8,5)、(12,8)、(14,9)、(16,11),则x-=12.5,y-=8.25.于是回归直线的斜率为b^=xiyi -4x-y-x2i-4x-2=25.5350.7286,a^=y--b^x-=-0.8575,所以所求的回归直线方程为y=0.7286x-0.8575.(2)根据公式y^=0.7286x-0.8575,要使y10,则就需要0.7286x-0.857510,x14.9019,即机器的旋转速度不能超过14.9019转/秒.19.(本题满分12分)在从烟台大连的某次航运中,海上出现恶劣气候.随机调查男、女乘客在船上晕船的情况如下表所示:晕船不晕船合计男人 32 51 73女人 8 24 32合计 40 75 115根据此资料你是否认为在恶劣气候航行中,男人比女人更容易晕船?[解析] 男人晕船所占比例为3283100%=0.386,女人晕船所占比例为832100%=0.25,虽然0.386远大于0.25,但我们不能用此判断在恶劣气候中航行,男人比女人更容易晕船,而应根据独立性检验进行分析.由公式得:K2=115(3224-518)2833240751.870.因为1.8702.706,所以我们没有充分的证据说晕船跟男女性别有关.20.(本题满分12分)有两个分类变量X与Y,其一组观测的22列联表如下表.其中a,15-a均为大于5的整数,则a取何值时有90%以上的把握认为“X与Y之间有关系”?y1 y2x1 a 20-ax2 15-a 30+a[解析] 查表可知,要使有90%以上的把握认为X与Y之间有关系,则K22.706,而其观测值k=65[a(30+a)-(20-a)(15-a)]220451550 =13(65a-300)2604550=13(13a-60)26090,解k2.706得a7.19或a2.04.又因为a5且15-a5,aZ,所以a=8,9,故当a取8或9时有90%以上的把握认为“X与Y之间有关系”.[点拨] 首先计算K2值,由题意K22.706,求得a的范围,再结合a5且15-a5,aZ,即可求得a的值.21.(本题满分12分)某超市为了了解热茶销售与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对比表如下表:气温x(℃) 26 18 13 10 4 -1杯数y 20 24 34 38 50 64画出散点图并计算相关系数r,判断热茶销售量与气温之间是否具有线性相关关系.[解析] 由表中数据画出散点图如图所示.由表中数据得x=16(26+18+13+10+4-1)11.67,y=16(20+24+34+38+50+64)38.33,i=16xiyi=2620+1824+1334+1038+450-164=1910,i =16x2i=262+182+132+102+42+(-1)2=1286,i=16y2i=202+242+342+382+502+642=10172,所以r-0.97,因为|r|0.970.75,所以热茶销售量与气温之间具有很强的线性相关关系.22.(本题满分14分)在一个文娱网络中,点击观看某个节目的累积人次和播放天数如下表:播放天数 1 2 3 4 5点击观看的累积人次 51 134 213 235 262播放天数 6 7 8 9 10点击观看的累积人次 294 330 378 457 533(1)画出散点图;(2)判断两变量之间是否具有线性相关关系,求回归直线方程是否有意义?[解析] (1)散点图如图所示.(2)由散点图知两变量线性相关,故求回归直线方程有意义.或借助科学计算器,完成下表中的有关计算.i 1 2 3 4 5 6 7 8 9 10xi 1 2 3 4 5 6 7 8 9 10yi 51 134 213 235 262 294 330 378 457 533xiyi 51 268 639 940 1310 1764 2310 3024 4113 5330x=5.5,y=288.7,i=110x2i=385,i=110y2i=1020953,i=110xiyi=19749 利用上表的结果,计算累积人次与播放天数之间的相关系数r=19749-105.5288.7(385-105.52)(1020953-10288.72)0.9840.75.这说明累积人次与播放天数之间存在着线性相关关系,自然求回归直线方程有意义.。
高中数学(人教B版,选修23)第三章 统计案例+课件+同步测试+本章整合+综合素质检测(7份)23 3.1
第三章 3.1一、选择题1.掷一枚硬币,记事件A :“出现正面”,B :“出现反面”,则有( ) A .A 与B 相互独立 B .P (AB )=P (A )·P (B ) C .A 与B 不相互独立 D .P (AB )=14[答案] C[解析] ∵事件A 与事件B 是对立事件,故排除A 、B 、D ,∴应选C.2.在一个2×2列联表中,若由数据计算得χ2=5.653,则两个变量之间有关系的可能性为( ) A .99% B .95% C .90% D .85%[答案] B[解析] ∵χ2=5.653>3.841,∴有95%的把握说两个变量之间有关系.3.在一次独立性检验中,根据计算结果,认为A 与B 无关的可能性不足1%,那么χ2的一个可能取值为( )A .6.635B .5.024C .7.897D .3.841 [答案] C[解析] 由χ2的数值与两个临界值3.841、6.635进行对比.4.调查男女学生在购买食品时是否看出厂日期,与性别有关系时用____最有说服力( ) A .期望 B .方差 C .正态分布 D .独立性检验 [答案] D[解析] 由独立性检验的应用知选D. 5.下面是一个2×2列联表则表中a ,b 处的值分别为( A .94、96 B .52、50 C .52、54 D .54、52 [答案] C[解析] 由题意得⎩⎪⎨⎪⎧a +21=73a +2=b ,∴⎩⎪⎨⎪⎧a =52b =54.故选C. 6.下列说法正确的个数为( )①对事件A 与B 的检验无关时,即两个事件互不影响; ②事件A 与B 关系越密切,则χ2就越大;③χ2的大小是判定事件A 与B 是否相关的唯一根据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. A .1个 B .2个 C .3个 D .4个[答案] A[解析] 由独立性检验知,只有②成立.故选A.7.(2013·福州文博中学高二期末)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:由χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )算得,K 2=110×(40×30-20×20)260×50×60×50≈7.8.附表:A .有99%以上的把握认为“爱好该项运动与性别有关”B .有99%以上的把握认为“爱好该项运动与性别无关”C .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D .在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” [答案] A[解析] 根据独立性检验的定义,由χ2≈7.8>6.635可知,有99%以上把握认为“爱好该项运动与性别有关”.二、填空题8.根据下列数据,χ2=____________.[答案] 1.779[解析] 由公式可得χ2=1.779. 9.已知表中数据(单位:亩)[答案] 有[解析] ∵χ2≈33.185 2>6.635,∴有明显关系. 三、解答题10.(2014·安徽文,17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时)(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据中,有60位女生的每周平均体育运动时间超过4个小时.请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )[解析] (1)300×450015000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.100+0.025)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由(2)知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时,又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表综合列联表可算得K 2=300×(2250)75×225×210×90=10021≈4.762>3.841.所以,有95%的把握认为“该校学生的每周平均体育运动时间与性别有关.”一、选择题1.对于分类变量A 与B 的统计量χ2,下列说法正确的是( ) A .χ2越大,说明“A 与B 有关系”的可信度越小 B .χ2越大,说明“A 与B 无关”的程度越大 C .χ2越小,说明“A 与B 有关系”的可信度越小 D .χ2接近于0,说明“A 与B 无关”的程度越小 [答案] C[解析] 由独立性检验的定义及χ2的意义可知C 正确.2.某零件加工由两道工序完成,第一道工序的废品率为a ,第二道工序的废品率为b ,假定这两道工序是否出废品彼此无关,那么产品的合格率为( )A .ab -a -b +1B .1-a -bC .1-abD .1-2ab[答案] A[解析] P =(1-a )(1-b )=ab -a -b +1.故选A.3.某调查机构调查教师工作压力大小的情况,部分数据如表:) A .0.01 B .0.05 C .0.10 D .0.005[答案] B[解析] χ2=n (ad -bc )2(a +b )(a +c )(c +d )(d +b )=100(53×1-12×34)287×13×65×35≈4.9>3.841,因此,在犯错误的概率不超过0.05的前提下,认为工作压力大与不喜欢教师职业有关系. 二、填空题4.某高校《统计》课程的教师随机调查了选该课程的学生的一些情况,具体数据如下:2≈6.464,因为χ2>3.841,所以可判定选修统计专业与性别有关.那么这种判断出错的可能性为________.[答案] 5%5.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918.p :有95%的把握认为“这种血清能起到预防感冒的作用”; q :若某人未使用该血清,那么他在一年中有95%的可能性得感冒; r :这种血清预防感冒的有效率为95%; s :这种血清预防感冒的有效率为5%.则下列结论中,正确结论的序号是____________.(把你认为正确的命题序号都填上) ①p ∧¬q ; ②¬p ∧q ;③(¬p ∧¬q )∧(r ∨s ); ④(p ∨¬r )∧(¬q ∨s ). [答案] ①④[解析] 由题意,得χ2≈3.918>3.841,所以只有p 正确,即有95%的把握认为“这种血清能起到预防感冒的作用”,所以①、④正确.三、解答题6.为了解决初二平面几何入门难的问题,某校在初中一年级代数教学中加强概念和推理教学,并设有对照班,下表是初中二年级平面几何期中测验成绩统计表的一部分,试分析研究实验结果.[解析] ∵χ2=100×(32×38-18×12)50×50×44×56≈16.234>6.635.故有99%的把握认为“在初一加强概念和推理教学,对提高初二平面几何的测试成绩”有关系. 7.为调查学生对国家大事关心与否是否与性别有关,在学生中进行随机抽样调查,结果如下表,根据统计数据作出合适的判断分析.[解析] 假设H 0:学,则由公式及数据得χ2=400×(182×24-18×176)2358×42×200×200≈0.9577,因为χ≈0.9577<2.706,所以不能拒绝H 0,因此我们没有充分理由说学生是否关心国家大事与性别有关.8.(2014·合肥一六八中高二期中)某学校对手工社、摄影社两个社团招新报名的情况进行调查,得到如下的列联表:(1)(2)已知报名摄影社的6名女生中甲、乙、丙三人来自于同一个班级,其他再无任意两人同班情况.现从此6人中随机抽取2名女生参加某项活动,则被选到两人同班的概率是多少?(3)能否在犯错误的概率不超过0.05的前提下,认为学生对这两个社团的选择与“性别”有关系?注:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).[解析] (1)(2)所求概率为P =C 23C 26=15.(3)χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=60×(12×24-6×18)230×30×18×42=207≈2.857<3.841,所以,不能在犯错误的概率不超过0.05的前提下,认为学生对这两个社团的选择与“性别”有关系.。
高中数学选修2-3 第三章 统计案例 章末检测题
高中数学选修2-3第三章 统计案例 章末检测题(满分150分,时间120分钟)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.分析人的身高与体重的关系,可以用( ) A .残差分析 B .回归分析 C .等高条形图D .独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 【答案】B2.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K 2≈0.99,根据这一数据分析,下列说法正确的是( )A .有99%的人认为栏目优秀B .有99%的人认为栏目是否优秀与改革有关系C .有99%的把握认为电视栏目是否优秀与改革有关系D .没有理由认为电视栏目是否优秀与改革有关系【解析】由于K 2=0.99<3.841,所以没有理由认为电视栏目是否优秀与改革有关系,故选D.【答案】D3.已知一个线性回归方程为y ∧=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y =( ) A .58.5 B .46.5 C .60 D .75【解析】x =1+7+5+13+195=9,因为回归直线方程过点(x ,y ),所以y =1.5×x +45=1.5×9+45=58.5【答案】A4.设有一个回归方程为y ∧=3-5x ,当变量x 增加一个单位时( ) A .y 平均增加3个单位 B .y 平均减少5个单位 C .y 平均增加5个单位D .y 平均减少3个单位【解析】-5是斜率的估计值,说明x 每增加一个单位,y 平均减少5个单位. 【答案】B5.若由一个2×2列联表中的数据计算得K 2=6.630,则判断“这两个分类变量有关系”时,犯错误的最大概率是( )A .0.025B .0.01C .0.005D .0.001【解析】∵P (K 2>5.024)=0.025.又K 2=6.630>5.024,∴犯错误的最大概率为0.025. 【答案】A6.如图5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )A .相关系数r 变大B .残差平方和变小C .相关指数R 2变大D .解释变量x 与预报变量y 的相关性变强【解析】由散点图知,去掉D 后,x 与y 的相关性变强,且为正相关,所以r 变大,R 2变大,残差平方和变小.【答案】B7.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表为:以下数据中,对于同一样本能说明X 与Y 有关的可能性最大的一组为( ) A .A =5,b =4,c =3,d =2 B .A =5,b =3,c =4,d =2 C .A =2,b =3,c =4,d =5 D .A =2,b =3,c =5,d =4【解析】可计算|ad -bc|的值,值越大说明X 与Y 有关的可能性越大. 【答案】D8.变量x 、y 具有线性相关关系,当x 取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 最大取值是10,则x 的最大取值不能超过( )A .14B .15C .16D .17【解析】根据题意y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ∧≈-0.857,b ∧≈0.729,所以线性回归方程为y ∧=0.729x -0.857.当y ∧=10时,得x ≈15.【答案】B9.硕士学位与博士学位的一个随机样本给出了关于所获取学位类别与学生性别的分类数据如表所示:根据以上数据,则( )A .性别与获取学位类别有关B .性别与获取学位类别无关C .性别决定获取学位的类别D .以上都是错误的【解析】由列联表可得:博士:男性占2735≈77%,女性占835≈23%,相差很大,所以性别与获取学位的类别有关,故选A.【答案】A10.在两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2如下,其中拟合效果最好的模型是( )A .模型1的R 2为0.30B .模型2的R 2为0.50C .模型3的R 2为0.75D .模型4的R 2为0.98 【解析】R 2越大,拟合效果越好. 【答案】D11.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】将表中的五组数据分别代入选项验证,可知y =88+12x 最适合.【答案】C12.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么()1021i i y y=-∑的值为( )A .241.06B .2 410.6C .253.08D .2 530.8【解析】R 2=1-∑i =110(y i -y ∧i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110 (y i -y )2,得()1021i i y y=-∑=120.531-0.95=2 410.6.【答案】B二、填空题(本大题共4小题,每小题4分,共16分.请把正确的答案填在题中的横线上)13.在两个变量的回归分析中,R 2=________,R 2的值越________________________________________________________________________,说明残差平方和越________,也就是说模型的拟合效果越________.【答案】1-∑i =1n(y i -y ∧i )2∑i =1n(y i -y )2大 小 好14.已知样本数为11,计算得∑i =111x i =510,∑i =111y i =214,回归方程为y ∧=0.3x +a ∧,则x ≈________,a ∧≈________.(精确到0.01)【解析】由题意,x =111∑i =111x i =51011≈46.36,y =111∑i =111y i =21411,因为y =0.3x +a ∧,所以21411=0.3×51011+a ∧,可求得a ∧≈5.55. 【答案】46.36 5.5515.某单位为了了解用电量y (度)与气温x (°C )之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表,由表中数据得线性回归方程y ∧=b ∧x +a ∧,其中b ∧=-2.现预测当气温为-4°C 时,用电量的度数约为________.【解析】x =14(18+13+10-1)=10,y =14(24+34+38+64)=40,b ∧=-2.又回归方程y ∧=-2x +a ∧过点(10,40),故a ∧=60,所以当x =-4时,y ∧=-2×(-4)+60=68. 【答案】6816.若两个分类变量X 与Y 的列联表为:则“X 与Y 【解析】由列联表数据,可求得随机变量K 2的观测值k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P(K 2≥6.635)≈0.01.所以“x 与y 之间有关系”出错的概率仅为0.01.【答案】0.01三、解答题(本大题共6个小题,共74分.解答时应写出必要的文字说明、证明过程或演算步骤)17.(本小题满分12分)某研究者欲考察某一高考试题的得分情况是否与性别有关系,统计结果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人.试根据这些数据判断这一高考试题的得分情况与性别是否有关系.【解析】根据题中数据得如下列联表:由列联表中的数据得k =900×(290×350-100×160)2450×450×390×510≈163.348>10.828,所以在犯错误的概率不超过0.001的前提下认为“这一高考试题的得分情况与性别有关系.”18.(本小题满分12分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每小时生产的二级品零件的数量随机床运转的速度而变化.下面是试验的结果:(1)(2)求出机床运转的速度x 与每小时生产二级品数量y 的回归直线方程;(3)若实际生产中所允许的二级品不超过10个,那么机床的运转速度不得超过多少转/秒?【解析】(1)散点图如下图所示:(2)易求得x =12.5,y =8.25,∴b ∧=∑i =14x i y i -4x y∑i =14x 2i -4x2≈0.728 6,a ∧=y -b ∧x =-0.857 5, 即所求回归直线的方程为:y ∧=0.728 6x -0.857 5.(3)根据公式,要使y ∧≤10, 只要0.728 6x -0.857 5≤10, 解得x ≤14.901 9,即机床的运转速度不能超过14.901 9转/秒.19.(本小题满分12分)有两个分类变量X 与Y ,其一组观测值如下面的2×2列联表所示:其中,a ,15-a 均为大于50.10的前提下认为“X 与Y 之间有关系”?【解析】要使在犯错误的概率不超过0.10的前提下认为“X 与Y 之间有关系”,需要随机变量K 2的观测值大于2.706.∵a +(20-a )=20, (15-a )+(30+a )=45,a +(15-a )=15,(20-a )+(30+a )=50, a +(20-a )+(15-a )+(30+a )=65,则 K 2=65×[a (30+a )-(20-a )(15-a )]220×45×15×50=13(13a -60)25 400>2.706,解之可得,a >7.19或a <2.04,而由原题知a >5且15-a >5,a ∈Z ,即a =6,7,8,9.故当a =8或9时,可在犯错误的概率不超过0.10的前提下认为X 和Y 之间有关系. 20.(本小题满分12分)下表提供了某厂生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (2)请求出R 2,并说明残差变量对预报变量的影响约占百分之几.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)【解析】(1)∑i =14x i y i =66.5,∑i =14x 2i =32+42+52+62=86,x =4.5,y =3.5b ∧=66.5-4×4.5×3.586-4×4.52=66.5-6386-81=0.7a ∧=y -b ∧x =3.5-0.7×4.5=0.35所求的线性回归方程为y ∧=0.7x +0.35 (2)计算得残差及偏差的数据如下表:从而得∑i =14(y i -y ∧i )2=0.05,∑i =14(y i -y )2=2.5所以R 2=1-∑i =14(y i -y ∧i )2∑i =14(y i -y )2=1-0.052.5=0.98.所以残差变量对预报变量的贡献率约为2%.21.(本小题满分13分)针对时下的“韩剧热”,某校团委对“学生性别和是否喜欢韩剧是否有关”做了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.(1)若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?(2)若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有多少人? 【解析】设男生人数为x ,依题意可得列联表如下:(1)则K 2>3.841, 由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x 2·x 2·x =38x >3.841,解得x >10.24, ∵x 2,x6为整数, ∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有12人;(2)若没有充分的证据显示是否喜欢韩剧和性别有关, 则K 2≤2.706,由K 2=3x 2⎝⎛⎭⎫x 6×x 6-5x 6×x 32x ·x2·x 2·x =38x ≤2.706,解得x ≤7.216, ∵x 2,x6为整数, ∴若没有充分的证据显示是否喜欢韩剧和性别有关,则男生至多有6人.22.(本小题满分13分)某种生物的产卵数与温度有一定的关系,现在收集了7组数据,如下表:【解析】将上表中的数据作成散点图(如图1),可以发现这些点并不是分布在一条直线的附近,而是近似地分布在一个二次函数的图象的附近,因此可用非线性回归模型进行分析,令t =x 2,得到下表:再做出y 和t 的散点图(如图2),发现这些点分布在一条直线的附近,所以y 与t 线性相关,由公式可计算求得:b ∧=∑t i y i -7t y ∑t 2i -7t2≈0.37,a ∧=y -b ∧t =-204.90,于是y ∧=0.37t -204.90,故y 与x 之间的回归方程是y ∧=0.37x 2-204.90,当x =50时,代入可得y ∧=720.1,故由此可以估计温度在50°C 时的产卵数量大约为720个.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中新课标第三章统计案例综合测试题选修2-3
一、选择题
1.下列属于相关现象的是()
A.利息与利率
B.居民收入与储蓄存款
C.电视机产量与苹果产量
D.某种商品的销售额与销售价格
答案:B
2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.2 3.841
K>B.2 3.841
K<
C.2 6.635
K>D.2 6.635
K<
答案:A
3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4
组数据的线性相关性最大()
A.EB.CC.DD.A
答案:A
4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,
不患肺病
患
肺病
合
计
不吸烟7775 42
7
817
吸烟2099 49
2
148
合计9874 91
9
965
A.90%B.95%C.99%D.100%
答案:C
5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:
晚上
白
天
合
计
男婴
2
4
3
1
5
5
女8 23
你认为婴儿的性别与出生时间有关系的把握为( )
A.80% B.90% C.95% D.99%
答案:B
6.已知有线性相关关系的两个变量建立的回归直线方程为$
y a bx =+,方程中的回归系数b ( )
A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0
答案:A
7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( )
A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元
答案:C
8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( )
A.①② B.②③ C.①③ D.①②③
答案:C
9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一
35A.100 B.143 C.200 D.243
答案:B
10.甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下
列联表:
利用独立性检验估计,你认为推断“成绩与班级有关系”错误的概率介于()A.0.3~0.4 B.0.4~0.5 C.0.5~0.6 D.0.6~0.7
答案:B
二、填空题
11
则Y对的回归系数.
答案:0.1229
-
12.对于回归直线方程$ 4.75257
=+,当28
y x
x=时,y的估计值为.
答案:390
13.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则2
K=.
答案:16.373
14.某工厂在2020年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组
则月总成本y对月产量x的回归直线方程为.
答案:$1.2150.975
y x
=+
三、解答题
15.某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的
对于教育机构的研究项目,根据上述数据能得出什么结论.
解:
2
2
392(3916715729)
1.78
19619668324
K
⨯⨯-⨯
=≈
⨯⨯⨯
.
因为1.78 2.706
<,所以我们没有理由说人具有大学专科以上学历(包括大学专科)和对待教育改革态度有关.
16.1907年一项关于16艘轮船的研究中,船的吨位区间位于192吨到3246吨,船员的人数从5人到32人,船员的人数关于船的吨位的回归分析得到如下结果:船员人数=9.1+0.006×吨位.
(1)假定两艘轮船吨位相差1000吨,船员平均人数相差多少?
(2)对于最小的船估计的船员数为多少?对于最大的船估计的船员数是多少?
解:由题意知:(1)船员平均人数之差=0.006×吨位之差=0.006×1000=6,
∴船员平均相差6人;
(2)最小的船估计的船员数为:9.1+0.006×192=9.1+1.152=10.252≈10(人).
最大的船估计的船员数为:9.1+0.006×3246=9.1+19.476=28.576≈28(人).
17.假设一个人从出生到死亡,在每个生日都测量身高,并作出这些数据散点图,则这些点将不会落在一条直线上,但在一段时间内的增长数据有时可以用线性回归来分析.下表是一位母亲给儿子作的成长记录:
周岁0 1 2 3
4 5 6
身高/cm
1
34.2
1
40.8
1
47.6
1
54.2
1
60.9
1
67.6
1
73.0
(1)作出这些数据的散点图;
(2)求出这些数据的回归方程;
(3)对于这个例子,你如何解释回归系数的含义?
(4)用下一年的身高减去当年的身高,计算他每年身高的增长数,并计算他从3~16岁身高的年均增长数.
(5)解释一下回归系数与每年平均增长的身高之间的联系.
解:(1)数据的散点图如下:
(2)用y表示身高,x表示年龄,则数据的回归方程为y=6.317x+71.984;
(3)在该例中,回归系数6.317表示该人在一年中增加的高度;
(4)每年身高的增长数略.3~16岁身高的年均增长数约为6.323cm;
(5)回归系数与每年平均增长的身高之间近似相等.
18.某个服装店经营某种服装,在某周内获纯利y(元),与该周每天销售这种服装件数x 之间的一组数据关系见表:
3 4 5 6 78 9
6 6 6
9
7
3
8
1
8
9
9
9
1
已知
7
2
1
280
i
i
x
=
=
∑,72
1
45309
i
i
y
=
=
∑,
1
3487
i i
i
x y
=
=
∑.
(1)求x y,;
(2)画出散点图;
(3)判断纯利y与每天销售件数x之间是否线性相关,如果线性相关,求出回归方程.
解:(1)
3456789
6
7
x
++++++
==,
66697381899091
79.86
7
y
++++++
=≈;
(2)略;
(3)由散点图知,y与x有线性相关关系,设回归直线方程:$y bx a
=+,
559
3487761337 4.7528073628
b -⨯⨯=
==-⨯,
79.866 4.7551.36a =-⨯=.
∴回归直线方程$
4.7551.36y x =+.。