高二数学统计案例章末检测
高二数学统计案例章末复习答案
参考答案9.2.310.28 11.6612.99.513. 【答案】(1)列联表见解析;(2)有99.9%的把握认为是否喜爱打篮球与性别有关.【解析】(1)根据题意,可得男同学有545259⨯=名, 补充完整的列联表如下:(2)由题可得2K 的观测值245(201555)108913.61310.8282520202580k ⨯⨯-⨯==≈>⨯⨯⨯,所以有99.9%的把握认为是否喜爱打篮球与性别有关.14. 【答案】(1)2ˆˆˆy cx d =+更适宜;(2)22.28.6ˆ23yx =-,109.4万辆. 【解析】(1)根据散点图得,2ˆˆˆycx d =+更适宜作为年销量y 关于年份代码x 的回归方程.(2)依题意得,1491625115w ++++==,51521()()ˆ()851.22.28374iii ii w w y y c w w ==---==≈∑∑, 则22.72 2.2811 2.3ˆˆ6dy cw =-⨯=-=-,所以22.28.6ˆ23y x =-, 令7x =,则 2.2849 2.36109.36ˆ109.4y=⨯-=≈, 故预测2019年我国新能源汽车的年销量为109.4万辆.15.【答案】(1)见解析;(2)0.3.5ˆ2yx =+,西红柿亩产量的增加量约为6.1百千克.【解析】(1)由题可得2456855x ++++==,3444545y ++++==.所以15()()(3)(1)(1)00010316iii x x y y =--=-⨯-+-⨯+⨯+⨯+⨯=∑,====,所以相关系数50.95()()iix x y y r ==≈--=∑,因为0.75r >,所以可用线性回归模型拟合y 与x 的关系.(2)由题可得5152163()()0().32010iii ii x x y y b x x ====--=-=∑∑, 所以450.325ˆ.a=-⨯=,所以回归方程为0.3.5ˆ2y x =+. 当12x =时,0.312 2.5ˆ 6.1y=⨯+=, 所以当液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为6.1百千克.。
人教版数学高二章末检测第一章统计案例
章末检测一、选择题1.对于线性回归方程y ^=b ^x +a ^,下列说法中不正确的是( ) A .直线必经过点(x ,y )B .x 增加1个单位时,y 平均增加b ^个单位 C .样本数据中x =0时,可能有y =a ^D .样本数据中x =0时,一定有y =a ^2.根据如下样本数据:得到的线性回归方程为y =b x +a ,则( ) A.a ^>0,b ^<0 B.a ^>0,b ^>0 C.a ^<0,b ^>0D.0<0,b ^<03.如图是调查某地区男、女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出( )A .性别与喜欢理科无关B .女生中喜欢理科的比例约为80%C .男生比女生喜欢理科的可能性大些D .男生中不喜欢理科的比例约为60%4.某个工业企业生产性固定资产价值与工业增加值数据如下(单位:万元):A .0B .-0.897 3C .1.022 8D .0.991 85.下列是x 与y 之间的一组数据( )则y 关于x 的回归方程y ^=b ^x +a ^,对应的直线必过点( ) A .(32,4)B .(32,2)C .(2,2)D .(1,2)6.为预测某种产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系,现取了8组观察值.计算知∑i =18x i =52,∑i =18y i =228,∑i =18x 2i =478,∑i =18x i y i =1 849,则y 关于x 的回归方程是( )A.y ^=11.47+2.62x B.y ^=-11.47+2.62x C.y ^=2.62+11.47x D.y ^=11.47-2.62x7.如果某地的财政收入x 与支出y 满足线性回归方程y ^=b ^x +a ^+e (单位:亿元).其中,b ^=0.8,a ^=2,|e |≤0.5.若今年该地区财政收入10亿元,则年支出预计不会超过( ) A .9亿元 B .10亿元 C .9.5亿元D .10.5亿元8.甲、乙、丙、丁四位同学各自对A ,B 两变量进行线性相关检验,并用回归分析方法分别求得相关系数r如下表:( ) A .甲 B .乙 C .丙 D .丁9.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”.其中正确命题的个数为(A .0 B .1 C .2 D .310.下表给出5组数据(x ,y ),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )A.第2组 C .第4组 D .第5组二、填空题11.已知下表所示数据的线性回归方程为y ^=4x +242,则实数a =________.答案 26212.在评价建立的线性回归模型刻画身高和体重之间关系的效果时,R 2=________,可以叙述为“身高解释了64%的体重变化,而随机变量贡献了剩余的36%”. 13.若两个分类变量X 与Y 的2×2列联表为:则“X 与Y 14.某数学老师身高176 cm ,他爷爷、父亲和儿子的身高分别是173 cm 、170 cm 和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________ cm. 三、解答题15.要分析学生中考的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽选10名学生,分析他们入学的数学成绩和高一年级期末数学考试成绩,如下表:表中x (1)画出散点图; (2)求线性回归方程;(3)若某学生的入学成绩为80分,试预测他在高一年级期末考试中的数学成绩.16.为了了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级的学生进行了问卷调查得到如下列联表.平均每天喝500 mL以上为常喝,体重超过50 kg为肥胖.已知在30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)现从常喝碳酸饮料且肥胖的学生中(其中有2名女生)抽取2人参加电视节目,则正好抽到1男1女的概率是多少?17.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?18.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本,称出它们的质量(单位:克),质量值落在(495,510]的产品为合格品,否则为不合格品.下图是甲流水线样本的频率分布直方图,乙流水线样本的频数分布表如下:(1)若以频率作为概率,试估计从甲流水线上任取5件产品,其中合格品的件数X的数学期望;(2)从乙流水线样本的不合格品中任取2件,求其中超过合格品重量的件数Y的分布列;(3)由以上统计数据完成下面的2×2列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.,其中n=a+b+c+d.参数公式:K2=(a+b)(c+d)(a+c)(b+d)参数数据:答案精析1.D [线性回归方程是根据样本数据得到的一个近似曲线,故由它得到的值也是一个近似值.]2.A [根据题意,画出散点图.根据散点图,知两个变量为负相关,且回归直线与y 轴的交点在y 轴正半轴,所以a ^>0,b ^<0.]3.C [由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.] 4.D [利用相关系数公式即可求得.]5.A [(32,4)为样本点的中心,一定在回归直线上.]6.A [本题主要考查线性回归方程的计算.由b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x ,直接计算得b ^≈2.62,a ^≈11.47, 所以回归方程为y ^=2.62x +11.47.]7.D [回归方程为y ^=0.8x +2+e ,当x =10时,y =0.8×10+2+e ≤10+0.5=10.5.故选D.] 8.D [由相关系数的意义可知,相关系数的绝对值越接近于1,相关性越强,结合题意可知丁的线性相关性更强.故选D.]9.C [由列联表中数据可求得随机变量K 2的观测值k =992×(700×32-60×200)2760×232×900×92≈7.349>6.635,所以在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关系”,即至少有99%的把握认为“患肝病与嗜酒有关系”.因此②③正确,故选C.]10.B [通过散点图选择,画出散点图如图,应除去第三组,对应点的坐标是(-3,4).故选B.]11.262解析 由题意,得x =4,y =15(1 028+a ),代入y ^=4x +242,可得15(1 028+a )=4×4+242,解得a =262. 12.0.64解析 当R 2=0.64时,说明体重的差异有64%是由身高引起的,所以身高解释了64%的体重变化,而随机变量贡献了剩余的36%. 13.0.01解析 由列联表数据,可求得随机变量K 2的观测值 k =81×(10×16-40×15)225×56×50×31≈7.227>6.635.因为P (K 2≥6.635)≈0.01,所以“x 与y 之间有关系”出错的概率为0.01. 14.185解析 由题意可得父亲和儿子的身高组成了三个坐标(173,170)、(170,176)、(176,182), ∴x =173+170+1763=173,y =170+176+1823=176,∴b ^=∑3i =1 (x i -x )(y i -y )∑3i =1 (x i -x )2=1, ∴a ^=y -b ^ ×x =176-173=3, ∴y ^=x +3,即孙子的身高约为y ^=182+3=185.15.解 (1)作出散点图如图,从散点图可以看出,这两个变量具有线性相关关系.(2)列表如下:可求得x =110×(63+67+…+76)=70,y =110×(65+78+…+75)=76, ∑t =110x 2i =51 474,∑i =110x i y i =55 094.∴b ^=55 094-10×70×7651 474-10×702≈0.765 56.a ^≈76-0.765 56×70≈22.41,故所求的线性回归方程为y ^=22.41+0.765 56x .(3)若学生入学成绩为80分,代入上面线性线性回归方程y ^=22.41+0.765 56x ,可求得y ^≈84(分).故该同学高一期末数学成绩预测为84分.16.解 (1)设常喝碳酸饮料且肥胖的学生有x 人,则x +230=415,解得x =6.(2)由已知数据,得K 2=30×(6×18-2×4)210×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设常喝碳酸饮料的肥胖者男生为A ,B ,C ,D ,女生为E ,F ,则任取2人有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF 共15种.其中1男1女有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,故抽出1男1女的概率P =815.17.解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4. ∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑i =13x i y i =977,∑i =13x 2i =434,∴b ^=∑i =13x i y i -3x y∑i =13x 2i -3x2=977-3×12×27434-3×122=2.5,a ^=y -b ^x =27-2.5×12=-3, ∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.18.解 (1)由题图知甲样本中合格品数为(0.06+0.09+0.03)×5×40=36,故合格品的频率为3640=0.9,据此可估计从甲流水线上任取1件产品,该产品为合格品的概率p =0.9,则X ~(5,0.9),E (X )=5×0.9=4.5.(2)由题表知乙流水线样本中不合格品共10个,超过合格品质量的有4件,则Y 的可能取值为0,1,2,且P (Y =k )=C k 4C 2-k 6C 210(k =0,1,2),于是有P (Y =0)=13,P (Y =1)=815,P (Y =2)=215.所以Y 的分布列为:(3)2×2列联表如下:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=80×(360-120)266×14×40×40≈3.117>2.706,所以有90%的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.。
人教新课标版数学高二-数学选修1-2第一章 统计案例 章末综合检测
(时间:100分钟;满分:120分)一、选择题(本大题共10小题,在每小题给出的四个选项中,只有一项是符合题目要求的)1.以下可用来分析身高与体重间关系的是( ) A .残差图 B .回归分析 C .等高条形图D .独立性检验解析:选B.因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决. 2.已知样本点散落在某一条曲线y =e a+bx附近,作变换z =ln y ,利用线性回归模型来求其中的参数a ,b ,则拟合其变换后的样本点的直线方程为( )A.z ^=b ^x +a ^B.z ^=b ^x +e a ^C.z ^=b ^x +ln a ^D.z ^=x ln b +a ^解析:选A.对方程y =e a +bx 两边取以e 为底的对数即得. 3.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .线性回归直线方程最能代表观测值x ,y 之间的关系D .任何一组观测值都能得到具有代表意义的回归直线方程解析:选D.根据课本相关概念容易判断A 、B 、C 正确.而D 中并非任何一组观测值都能得到具有代表意义的回归直线方程,只是说总体上大多数观测值符合,也可能有个别的观测值差距较大.4.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:选C.显然图中,男生喜欢理科的比例为60%,而女生比例仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,因此,男生比女生喜欢理科的可能性更大一些.5.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据得到“打鼾与患心脏病有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个心脏病患者至少有99人打鼾B.1个人患心脏病,则这个人有99%的概率打鼾C.100个心脏病患者中一定有打鼾的人D.100个心脏病患者中可能一个打鼾的人都没有解析:选D.这是独立性检验,犯错误的概率在不超过0.01的前提下认为“打鼾与患心脏病有关”.这只是一个概率,即打鼾与患心脏病有关的可能性为99%.根据概率的意义答案应选D.6.下列说法正确的是()A.预报变量的值受解释变量的影响,与随机误差无关B.预报变量的值受随机误差的影响,与解释变量无关C.预报变量的值与总偏差平方和有关,与残差无关D.预报变量的值与解释变量和随机误差的总效应有关解析:选D.依据预报变量的特点知与解释变量和随机误差的总效应有关.7.设两个变量x和Y之间具有线性相关关系,它们的相关系数是r,Y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反解析:选A.当斜率b>0时,说明两个变量正相关,∴r>0;当斜率b<0时,说明两个变量负相关,∴r<0,故b与r的符号相同.8.为了考察两个变量x和Y之间的线性相关性,甲、乙两位同学各自独立地做了60次和100次试验,并且利用线性回归的方法,求得回归直线分别为m和n,已知两个人在试验中发现对变量x的观测数据的平均值都是s,对变量Y的观测数据的平均值都是t,那么下列说法正确的是()A.m和n有交点(s,t)B.m和n相交,但交点不一定是(s,t)C.m和n必定平行D.m和n必定垂直解析:选A.回归直线方程过定点(x,y),因为在m和n中x与y的平均值都相等,所以m和n必有交点(s,t).9.变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5),变量U 与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2<r1<0 B.0<r2<r1C.r2<0<r1D.r2=r1解析:选C.由散点图可得:变量Y与X成正相关,变量V与U成负相关,故r1>0,r2<0.10.已知两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若“X与Y有关系”的可信程度为90%,则c等于() A.4 B.5C.6 D.7解析:选B.由a=10,b=21,c+d=35可得n=66,d=35-c,a+b=31,a+c=10+c,b+d=56-c,ad=10(35-c),bc=21c.∵“X与Y”有关系的可信度为90%,则随机变量K2的观测值k>2.706,得66×(350-10c-21c)2>2.706,此时代入检验,得c=5符合题意.31×35×(10+c)(56-c)二、填空题(本小题共5小题,请把正确的答案填在题中横线上)11.若一组观测值(x1,y1),(x2,y2),…,(x n,y n)之间满足y i=a+bx i+e i(i=1,2,…,n),若e i恒为0,则R2为________.解析:若e i 恒为0,则残差平方和∑i =1n(y i -y ^i )2=∑i =1ne 2i =0,而R 2=1-∑i =1n(y i -y ^i )2∑i =1n(y i -y )2=1-0=1.答案:112.某校高二(8)班学生每周用于数学学习的时间x (单位:小时)与数学成绩y (单位:分)构成如下数据(15,79),(23,97),(16,64),(24,92),(12,58).求得的回归直线方程为y ^=2.5x +a ^,则某同学每周学习20小时,估计数学成绩约为________分.解析:x =15×(15+23+16+24+12)=18,y =15×(79+97+64+92+58)=78.把(x ,y )代入y ^=2.5x +a ^, 可求得a ^=33.把x =20代入y ^=2.5x +33得y ^=2.5×20+33=83. 答案:8313.若两个变量的残差平方和是325,∑i =1n(y i -y )2=923,则随机误差对预报变量的贡献率约为________.解析:相关指数R 2表示解释变量对预报变量变化的贡献率,故随机误差对预报变量的贡献率为残差平方和总偏差平方和×100%=325923×100%≈35.2%.答案:35.2%14.某校在高二文理分科时,对学生数学成绩是否优秀和所选科类进行了调查,具体数据如下:根据上述数据,如果判断“科类与数学是否优秀有关系”,那么这种判断出错的概率为________.解析:由于k =50×(10×7-13×20)223×27×30×20≈4.844>3.841,所以我们有95%的把握认为“科类与数学是否优秀有关系”,因此这种判断出错的概率约为0.05.答案:0.0515.若对于变量y 与x 的10组统计数据的回归模型中,相关指数R 2=0.95,又知残差平方和为120.53,那么∑i =110(y i -y )2的值为________.解析:由R 2=1-∑i =110(y i -y ^i )2∑i =110(y i -y )2,得0.95=1-120.53∑i =110(y i -y )2,得∑i =110(y i -y )2=120.531-0.95=2 410.6.答案:2 410.6三、解答题(本大题共5小题,解答时应写出必要的文字说明、证明过程或演算步骤) 16.某地区的人口普查表明,该地区共有男性15 729 245人,其中3 497个是聋哑人,共有女性16 799 031人,其中3 072个是聋哑人,能否在犯错误的概率不超过0.001的前提下推断该地区性别与是否为聋哑人之间是否有关系.解:作列联表:k =32 528 276×(3 497×16 795 959-3 072×15 725 748)215 729 245×16 799 031×6 569×32 521 707≈62.64≥10.828,所以在犯错误的概率不超过0.001的前提下认为“性别与是否为聋哑人”有关.17.已知某商品的价格x(元)与需求量y(件)之间的关系有如下一组数据:x 1416182022y 121075 3(1)画出y关于x(2)求出回归直线方程;(3)计算R2的值,并说明回归模型拟合程度的好坏(参考数据:x=18,y=7.4,∑i=15x2i=1 660,∑i=15y2i=327,∑i=15x i y i=620,∑i=15(y i-y^i)2=0.3,∑i=15(y i-y)2=53.2).解:(1)散点图如下.(2)x=18,y=7.4,∑i=15x2i=1 660,∑i=15y2i=327,∑i=15x i y i=620,所以b^=∑i=15x i y i-5x y∑i=15x2i-5x2=-1.15,a^=y-b^x=28.1.回归直线方程为:y^=-1.15x+28.1,(3)∑i =15(y i -y ^i )2=0.3,∑i =15(y i -y )2=53.2, R 2=1-∑i =15(y i -y ^i )2∑i =15(y i -y )2≈0.994,回归模型拟合效果很好.18.某种书每册的成本费y (元)与印刷册数x (千册)有关,经统计得到数据如下:检验每册书的成本费y 与印刷册数的倒数1x 之间是否具有线性相关关系?如有,求出y对x 的回归方程.解:把1x 置换为z ,则有z =1x ,从而z 与y的数据为 用线性回归方程来拟合.z =110×(1+0.5+0.333+0.2+0.1+0.05+0.033+0.02+0.01+0.005)=0.225 1,y =110×(10.15+5.52+4.08+…+1.15)=3.14, ∑i =110z 2i =12+0.52+0.3332+…+0.012+0.0052≈1.415, ∑i =110y 2i =10.152+5.522+…+1.212+1.152=171.803,∑i =110z i y i =1×10.15+0.5×5.52+…+0.005×1.15=15.221 02,所以b^=∑i=110z i y i-10z y∑i=110z2i-10z2≈8.976,a^=y-b^z=3.14-8.976×0.225 1≈1.120,所以所求的z与y的回归方程为y^=8.976z+1.120.又因为z=1x,所以y^=8.976x+1.120.19.某地区男性身高与体重的数据如下表:身高x/cm60708090100110体重y/kg 6.137.909.9912.1515.0217.50身高x/cm120130140150160170体重y/kg20.9226.8631.1138.8547.2555.05(1)求y与x之间的回归方程;(2)求残差平方和与R2.解:(1)根据上表中数据画出散点图.由图看出,样本点分布在某条指数函数曲线y=c1e c2x的周围,于是令z=ln y.x 60708090100110120130140150160170 z 1.81 2.07 2.30 2.50 2.71 2.86 3.04 3.29 3.44 3.66 3.86 4.01由表中数据可得z与x之间的回归直线方程为z^=0.693+0.020x,则有y ^=e 0.693+0.02x(2)残差平方和:∑i =112e ^2i ≈33.71,相关指数:R 2=1-∑i =112e ^2i∑i =112(y i -y )2=0.988.20.针对时下的“韩剧热”,某校团委对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是男生人数的12,男生喜欢韩剧的人数占男生人数的16,女生喜欢韩剧的人数占女生人数的23.若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?解:设男生人数为x ,依题意可得列联表如下:K 2>3.841, 即K 2=3x 2(x 6×x 6-5x 6×x 3)2x ·x 2·x 2·x =3x 8>3.841,解得x >10.24,∵x 2,x6为整数,∴若在犯错误的概率不超过0.05的前提下,认为是否喜欢韩剧和性别有关,则男生至少有12人.。
苏教版数学高二-苏教数学选修2-3第三章《统计案例》章末检测
章末检测一、填空题1.下列语句表示的事件中的因素不具有相关关系的是________.(填序号)①瑞雪兆丰年; ②名师出高徒; ③吸烟有害健康; ④喜鹊叫喜,乌鸦叫丧. 2.下列结论正确的是________.(填序号)①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.3.独立性检验中,假设H 0:变量X 与变量Y 没有关系,则在H 0成立的情况下,P (χ2≥6.635)≈0.010表示的意义说法正确的序号为________.(填序号) ①变量X 与变量Y 有关系的概率为1%; ②变量X 与变量Y 有关系的概率为99.9%; ③变量X 与变量Y 没有关系的概率为99%; ④变量X 与变量Y 有关系的概率为99%.4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归方程是y ^=-0.7x +a ^,则a ^=________.5.设两个变量x 和y 之间具有线性相关关系,它们的相关系数是r ,y 关于x 的线性回归方程的回归系数为b ^,回归截距是a ^,那么必有________.(填序号) ①b ^与r 的符号相同; ②a ^与r 的符号相同; ③b ^与的符号相反; ④a ^与r 符号相反.6.如右图所示,有5组(x ,y )数据,去掉数据________后,剩下的四组数据的线性相关系数量大.7.在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为________.8.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则在犯错误的概率不超过0.005“无关”).优、良、中差 总计 实验班 48 2 50 对比班 38 12 50 总计86141009. 考古学家通过始祖鸟化石标本发现:其股骨长度x (cm)与肱骨长度y (cm)的线性回归方程为y ^=1.197x -3.660,由此估计,当股骨长度为50 cm 时,肱骨长度的估计值为________ cm.10.下面是一个2×2 y 1 y 2 总计 x 1 a 21 70 x 2 5 c 30 总计bd100则b -d =________.11.某调查者从调查中获知某公司近年来科研费用支出x (万元)与公司所获得利润y (万元)序号 科研费用支出x i利润y i x i y i x 2i 1 5 31 155 25 2 11 40 440 121 3 4 30 120 16 4 5 34 170 25 5 3 25 75 9 6 2 20 40 4 合计301801 000200则利润y 对科研费用支出x 的线性回归方程为____________________.二、解答题12.电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计 男 女 10 55 合计13.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了4次试验,得到数据如下:零件的个数x (个) 2 3 4 5 加工的时间y (小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图; (2)求y 关于x 的线性回归方程y ^=b ^x +a ^; (3)试预测加工10个零件需要的时间. 14.有5名学生的数学和化学成绩如下表所示:学生学科成绩 A B C D E 数学成绩(x ) 88 76 73 66 63 化学成绩(y )7865716461(1)计算线性相关系数,判断y 与x 是否具有相关关系; (2)如果y 与具有相关关系,求线性回归方程;(3)预测如果某学生的数学成绩为79分时,他的化学成绩为多少?15.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子日期 12月1日12月2日12月3日12月4日12月5日温差x (℃) 10 11 13 12 8 发芽数Y (颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?答案1.④ 2.①②④ 3.④ 4.5.15 5.① 6.D 7.1 8.有关 9.56.19 10.8 11.y ^=2x +2012.解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25. “非体育迷”人数为75,则据题意完成2×2列联表:非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计7525100将2×2χ2=100(30×10-45×15)275×25×45×55≈3.030>2.706.所以在犯错误的概率不超过0.10的前提下可以认为“体育迷”与性别有关. 13.解 (1)散点图如图所示:(2)x =2+3+4+54=3.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =2×2.5+3×3+4×4+5×4.5=52.5, ∑4i =1x 2i =4+9+16+25=54, ∴b ^=52.5-4×3.5×3.554-4×3.52=0.7,a ^=3.5-0.7×3.5=1.05, ∴所求线性回归方程为 y ^=0.7x +1.05. (3)当x =10时,y ^ =0.7×10+1.05=8.05,∴预测加工10个零件需要8.05小时. 14.解 (1)x =73.2,y =67.8,∑5i =1x 2i =882+762+732+662+632=27 174,∑5i =1y 2i =782+652+712+642+612=23 167, ∑5i =1x i y i =88×78+76×65+73×71+66×64+63×61=25 054,∴∑5i =1x 2i-5x 2=27 174-5×73.22=382.8, ∑5i =1x i y i -5x y =25 054-5×73.2×67.8=239.2,∑5i =1y 2i -5y 2=23 167-5×67.82=182.8.∴r =239.2382.8×182.8≈0.904 2.从而我们有较大的把握认为两个变量x 与y 之间具有线性相关关系,因而求线性回归方程是有实际意义的. (2)∵b ^=∑5i =1x i y i -5x y∑5i =1x 2i -5x2=239.2382.8≈0.625, a ^=y -b x ≈67.8-0.625×73.2=22.050, ∴线性回归方程为y ^=22.050+0.625x .(3)当x =79时,y ^ =22.050+0.625×79=71.425.这就是说,当某学生的数学成绩为79分时,他的化学成绩约为71分.15.解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4.∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑3i =1x i y i =977, ∑3i =1x 2i =434,∴b ^=∑3i =1x i y i -3x y ∑3i =1x 2i -3x 2=977-3×12×27434-3×122=2.5,a ^=y -b ^x =27-2.5×12=-3, ∴y ^ =2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗; 当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.。
高二数学北师大版选修1-2章末综合测评(一) 统计案例 Word版含答案
章末综合测评(一)统计案例(时间分钟,满分分)一、选择题(本大题共小题,每小题分,共分.在每小题给出的四个选项中,只有一项是符合题目要求的).在下列各量与量的关系中是相关关系的为( )①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电费之间的关系..①②③.③④.④⑤.②③④【解析】①⑤是一种确定性关系,属于函数关系.②③④为相关关系.【答案】.四名同学根据各自的样本数据研究变量,之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①与负相关且=-;②与负相关且=-+;③与正相关且=+;④与正相关且=--.其中一定不正确的结论的序号是( ).①②.②③.③④.①④【解析】与正(或负)相关时,线性回归直线方程=+中,的系数>(或<),故①④错.【答案】.电视机的使用寿命与显像管开关的次数有关.某品牌的电视机的显像管开关了次后还能继续使用的概率是,开关了次后还能继续使用的概率是,则已经开关了次的电视机显像管还能继续使用到次的概率是( )....【解析】记“开关了次后还能继续使用”为事件,记“开关了次后还能继续使用”为事件,根据题意,易得()=,()=,则()=,由条件概率的计算方法,可得()===.【答案】.一位母亲记录了她儿子岁到岁的身高,建立了她儿子身高与年龄的回归模型=+,她用这个模型预测儿子岁时的身高,则下面的叙述正确的是( ) .她儿子岁时的身高一定是.她儿子岁时的身高一定是以上.她儿子岁时的身高在左右.她儿子岁时的身高一定是以下【解析】由回归模型得到的预测值是可能取值的平均值,而不是精确值,故选.【答案】.已知一个线性回归方程为=+,其中的取值依次为,则=( )....【解析】∵=(++++)=,回归直线过样本点的中心(,),∴=×+=.【答案】.将两枚质地均匀的骰子各掷一次,设事件={两个点数互不相同},={出现一个点},则()=( )....【解析】出现点数互不相同的共有×=种,出现一个点共有×=种,∴()==.【答案】.利用独立性检验来考虑两个分类变量和是否有关系时,通过查阅下表来确定断言“和有关系”的可信度,如果>,那么就有把握认为“和有关系”的百分比为( )。
20212021学年高中数学第三章统计案例章末检测新人教A版选修23
第三章统计案例章末检测时间:120分钟满分:150分一、选择题(本大题共12个小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法正确的是( )A.相关关系是一种不肯定的关系,回归分析是对相关关系的分析,因此没有实际意义B.独立性查验对分类变量关系的研究没有100%的把握,所以独立性查验研究的结果在实际中也没有多大的实际意义C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D.独立性查验若是得出的结论有99%的可信度,就意味着这个结论必然是正确的解析:相关关系虽然是一种不肯定关系,可是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽可能减小误差的条件下可以对生产与生活起到必然的指导作用,独立性查验对分类变量的查验也是不肯定的,可是其结果也有必然的实际意义.故选C.答案:C2.对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断( )A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析:图(1)中随x增大y减小,图(2)中随u增大v增大.答案:C3.如图是调查某地域男、女中学生喜欢理科的等高条形图,阴影部份表示喜欢理科的百分比,从图可以看出( )A.性别与喜欢理科无关B.女生中喜欢理科的比例约为80%C.男生比女生喜欢理科的可能性大些D.男生中不喜欢理科的比例约为60%解析:由图可知,女生中喜欢理科的比例约为20%,男生中喜欢理科的比例约为60%,因此男生比女生喜欢理科的可能性大些.答案: C4.通过随机询问110名性别不同的大学生是不是爱好某项运动,取得列联表:男女总计爱好402060不爱好203050总计6050110由K2=n ad-bc2a+b c+d a+c b+d算得K2的观测值k=110×40×30-20×20260×50×60×50≈7.8.附表:P(K2≥k)0.0500.0100.001k 3.841 6.63510.828A.有99%以上的把握以为“爱好该项运动与性别有关”B.有99%以上的把握以为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,以为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,以为“爱好该项运动与性别无关”解析:因为k≈7.8>6.635,所以相关的概率大于1-0.010=0.99,所以选A.答案:A5.下表给出5组数据(x,y),为选出4组数据使其线性相关程度最大,且保留第1组数据(-5,-3),则应去掉( )i 1234 5x i -5 -4 -3 -2 4 y i-3-24-16A.第2组 B .第4组 C .第3组D .第5组解析:通过散点图选择,画出散点图如图.应除去第3组,对应点是(-3,4).故选C.答案:C6.对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程中的截距为( ) A .a =y +b ^x B .a =y +b ^x C .a =y -b ^xD .a =y -b ^x解析:由回归直线方程恒过(x -,y -)定点. 答案:D7.假设有两个分类变量X 和Y ,它们的可能取值别离为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:y 1 y 2 总计x 1 a b a +b x 2c d c +d 总计a +cb +da +b +c +d( ) A .a =9,b =8,c =7,d =6 B .a =9,b =7,c =6,d =8 C .a =8,b =6,c =9,d =7 D .a =6,b =7,c =8,d =9解析:对于同一样本|ad -bc |越小,K 2越小,说明X 与Y 之间的关系越弱,|ad -bc |越大,K 2越大,说明X 与Y 之间的关系越强.答案:B8.在某种新型材料的研制中,实验人员取得了下面一组实验数据:现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是( )A.y =2x -2 B .y =2(x 2-1)C .y =log 2 xD .y =(12)x解析:把x 的值别离代入A 、B 、C 中的函数,得函数值与真实值比较易知B 中的函数最接近. 答案:B9.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,取得统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表2表3表4性别男 14 6 20 女 2 30 32 总计163652A .成绩B .视力C .智商D .阅读量解析:按照K 2=n ad -bc 2a +bc +d a +cb +d,代入题中数据计算得D 选项K 2最大.故选D. 答案:D10.某调查机构调查教师工作压力大小的情况,部份数据如表:喜欢教师职业不喜欢教师职业总计 认为工 作压力大 533487认为工作 压力不大 12 1 13 总计6535100则判断“工作压力大与不喜欢教师职业有关系”,这种推断犯错误的概率不超过( ) A .0.01 B .0.05 C .0.10 D .0.005解析:K 2=n ad -bc 2a +ba +c c +dd +b=100×53×1-12×34287×13×65×35≈4.9>3.841,因此,在犯错误的概率不超过0.05的前提下,以为工作压力大与不喜欢教师职业有关系. 答案:B11.如表及图是某同窗记载的5月1日至5月12日每天某市某种传染病患者治愈者数据及根据这些数据绘制出的散点图.日期 5.1 5.2 5.3 5.4 5.5 5.6 人数 100 109 115 118 121 134 日期 5.7 5.8 5.9 5.10 5.11 5.12 人数141152168175186203下列说法中,正确的有( )①按照此散点图可以判断日期与人数具有线性相关关系; ②按照此散点图可以判断日期与人数具有一次函数关系; ③按照此散点图可以判断日期与人数具有非线性相关关系. A .0个 B .1个 C .2个D .3个解析:只有①正确.故选B. 答案:B12.对具有线性相关关系的变量x , y ,有一组观测数据(x i ,y i )(i =1,2,…,8),其回归直线方程为y ^=13x +a ,且x 1+x 2+…+x 8=2(y 1+y 2+…+y 8)=6,则实数a 等于( )A.116B.18C.14D.12 解析:由x 1+x 2+…+x 8=2(y 1+y 2+…+y 8)=6,得x =34,y =38.由于回归直线方程y ^=13x +a 过样本点(x ,y ),则y =13x +a ,解得a =18.答案:B二、填空题(本大题共4小题,每小题4分,共16分,把答案填在题中横线上)13.对于线性回归方程y ^=a ^+b ^x ,当x =3时,对应的y 的估量值是17,当x =8时,对应的y 的估计值是22,那么,该回归直线方程是________,按照回归直线方程判断当x =________时,y 的估计值是38.解析:首先把两组值代入回归直线方程得⎩⎪⎨⎪⎧3b ^+a ^=17,8b ^+a ^=22⇒⎩⎪⎨⎪⎧b ^=1,a ^=14.所以回归直线方程是y ^=x +14.令x +14=38,可得x =24.即当x =24时,y 的估量值是38. 答案:y ^=x +14 2414.对有关数据的分析可知,每立方米混凝土的水泥用量x (单位:kg)与28天后混凝土的抗压度y (单位:kg/cm 2)之间具有线性相关关系,其线性回归方程为y ^=0.30x +9.99.按照建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm 2,每立方米混凝土的水泥用量最少应为________kg.解析:∵y ^≥89.7,∴0.30x +9.99≥89.7, ∴x ≥265.7,故水泥用量最少应为265.7 kg. 答案:265.715.甲、乙、丙、丁四位同窗各自对A ,B 两个变量的线性相关性做实验,并用回归分析方式别离求得相关系数r 与残差平方和m 如表:甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m106115124103则这四位同窗中,________同窗的实验结果表现A ,B 两个变量有更强的线性相关性. 解析:由题表可知,丁同窗的相关系数最大且残差平方和最小,故丁同窗的实验结果表现A ,B 两变量有更强的线性相关性.答案:丁16. 下列说法正确的有________(填写你以为正确的序号).①线性回归方式就是利用样本点去寻觅一条切近这些样本点的直线的数学方式; ②利用样本的散点图可以直观判断两个变量的关系是不是可用线性关系表示; ③通过线性回归方程y ^=b ^+a ^x 及回归系数b ^,可以估量和预测变量的取值及转变规律. 解析:样本的散点图可以直观判断两个变量是不是线性相关,只有线性相关才能用线性回归的方式找到回归直线,并预测变量的取值及转变规律,故正确的答案是①②③. 答案:①②③三、解答题(本大题共6个小题,共74分,解承诺写出文字说明、证明进程或演算步骤) 17.(12分)x 与y 有五组数据,x 1 2 3 5 10 y105422试分析x 与y 之间是不是具有线性相关关系.如有,求出回归直线方程;若没有,说明理由. 解析:作出散点图,如图所示:由散点图可以看出,x 与y 不具有线性相关关系.18.(12分)有两个分类变量x 与y ,其一组观测值如下面的2×2列联表所示:y 1 y 2x 1 a20-a x 215-a30+a其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下以为x 与y 之间有关系?解析:查表可知,要使在犯错误的概率不超过0.1的前提下以为x 与y 之间有关系,则k ≥2.706,而k =65×[a 30+a -20-a 15-a ]220×45×15×50=65×65a -300220×45×15×50=13×13a -60260×90.由k ≥2.706得a ≥7.19或a ≤2.04.又a >5且15-a >5,a ∈Z ,解得a =8或9,故a 为8或9时,在犯错误的概率不超过0.1的前提下以为x 与y 之间有关系.19.(12分)随机询问某大学40名不同性别的大学生在购买食物时是不是读营养说明,取得性别与读营养说明的列联表男 女 总计 读营养说明 16 8 24 不读营养说明4 12 16 总计202040按照列联表进行独立性查验,可否在犯错误的概率不超过0.01的前提下以为性别与是不是读营养说明之间有关系? 注:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d 为样本容量.解析:由表中数据,得 k =40×16×12-8×4224×16×20×20≈6.67>6.635.因此,能在犯错误的概率不超过0.01的前提下,以为性别与读营养说明有关. 20.(12分)在研究一种新药对小白鼠抱病的防治效果时,取得如表数据.得病 不得病 总计 对照 43 162 205 新药 13 121 134 总计56283339解析:由公式得K 2的观测值k =339×43×121-162×132205×134×56×283≈7.469.由于7.469>6.635,所以咱们有99%的把握以为这种新药对小白鼠抱病的防治效果是有效的. 21.(13分)以下是某地搜集到的新衡宇的销售价钱y 和房屋的面积x 的数据:房屋面积(m 2) 115 110 80 135 105 销售价格(万元)24.821.618.429.222(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线; (3)据(2)的结果估量当衡宇面积为150 m 2时的销售价格. 解析:(1)数据对应的散点图如图所示.(2)x =1551i =∑x i =109,l xx =51i =∑(x i -x )2=1 570,y =23.2,l xy =51i =∑(x i -x )(y i -y )=308.设所求回归直线方程为y ^=b ^x +a ^,则b ^=l xy l xx =3081 570≈0.196 2,a ^=y -b ^x ≈1.814 2.故所求回归直线方程为y ^=0.196 2x +1.814 2. (3)据(2),当x =150 m 2时,销售价格的估计值为 y ^=0.196 2×150+1.814 2=31.244 2(万元).22.(13分)某工厂为了对新研发的一种产品进行合理定价,将该产品按事前拟定的价钱进行试销,取得如表数据:单价x (元) 8 8.2 8.4 8.6 8.8 9 销量y (件)908483807568(1)求回归直线方程y =bx +a ,其中b =-20,a =y -b x ;(2)估计在此后的销售中,销量与单价仍然服从(1)中的关系,且该产品的本钱是4元/件,为使工厂取得最大利润,该产品的单价应定为多少元?(利润=销售收入-本钱) 解析:(1)由于x -=16(x 1+x 2+x 3+x 4+x 5+x 6)=8.5,y -=16(y 1+y 2+y 3+y 4+y 5+y 6)=80.所以a =y --b x -=80+20×8.5=250,从而回归直线方程为y ^=-20x +250. (2)设工厂取得的利润为L 元,依题意得L =x (-20x +250)-4(-20x +250)=-20x 2+330x -1 000 =-20(x -334)2+361.25.当且仅当x =8.25时,L 取得最大值.故当单价定为8.25元时,工厂可取得最大利润.。
高中数学 第三章 统计案例章末检测 新人教A版选修2-3(2021年最新整理)
2016-2017学年高中数学第三章统计案例章末检测新人教A版选修2-3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2016-2017学年高中数学第三章统计案例章末检测新人教A版选修2-3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2016-2017学年高中数学第三章统计案例章末检测新人教A版选修2-3的全部内容。
第三章统计案例一、选择题1.下列语句表示的事件中的因素不具有相关关系的是( )A.瑞雪兆丰年B.名师出高徒C.吸烟有害健康D.喜鹊叫喜,乌鸦叫丧答案D解析“喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选D.2.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④ D.①②③④答案C3.若线性回归方程为错误!=2-3.5x,则变量x增加一个单位,变量y平均()A.减少3。
5个单位B.增加2个单位C.增加3.5个单位D.减少2个单位答案A解析由线性回归方程可知错误!=-3.5,则变量x增加一个单位,错误!减少3.5个单位,即变量y平均减少3.5个单位.4.下表是某厂1~4月份用水量(单位:百吨)的一组数据:由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是错误!=-0.7x +错误!,则错误!等于( )A.10。
5 B.5.15 C.5。
2 D.5.25答案D解析样本点的中心为(2.5,3.5),将其代入线性回归方程可解得错误!=5.25.5.独立性检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(K2≥6。
高中数学 第3章 统计案例章末跟踪测评 新人教A版高二选修2-3数学试题
第三章统计案例章末跟踪测评(时间:120分钟满分:150分)题号一二三总分171819202122得分一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列关于回归分析与独立性检验的说法正确的是( )A.回归分析与独立性检验没什么区别B.回归分析是对两个变量准确关系的分析,而独立性检验是分析两个变量之间的不确定关系C.回归分析研究两个变量之间的相关关系,独立性检验是对两个变量是否具有某种关系的一种检验D.独立性检验可以100%确定两个变量之间是否具有某种关系C解析回归分析是对两个变量之间的相关关系的一种分析,而相关关系是一种不确定的关系,通过回归分析可以确定两个变量之间具有近似关系;而独立性检验是对两个变量之间是否具有某种关系的分析,并且可以分析这两个变量在多大程度上具有这种关系,但不能100%肯定这种关系.故选C项.2.在下列各量与量之间的关系中,是相关关系的是( )①正方体的体积与棱长之间的关系;②一块农田的小麦的产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的收入与支出之间的关系;⑤某家庭用水量与水费之间的关系.A.①②③B.③④C.④⑤D.②③④D解析①⑤属于函数关系.3.观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )D 解析 方法一 在四幅图中,D 项的图中两个深色条的高相差最明显,说明两个分类变量之间的关系最强.故选D 项.方法二 在频率等高条形图中,aa +b 与cc +d相差很大时,我们认为两个分类变量有关系,即等高条形图中x 1,x 2所占比例相差越大,则两个分类变量关系越强.故选D 项.4.甲、乙、丙、丁四位同学各自对A ,B 两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如表所示.甲 乙 丙 丁 r 0.82 0.78 0.69 0.86 m106115124102则哪位同学的试验结果体现A ,B 两变量有更强的线性相关性( ) A .甲 B .乙 C .丙D .丁D 解析 相关系数r 越接近于1,残差平方和m 越小,两变量的线性相关性越强.故选D 项.5.如图所示,有5组(x ,y )数据,为使剩下的4组数据的线性相关性最大,应该去掉的一组数据是( )A .B (2,4) B .C (4,5) C .D (3,10)D .E (10,12)C 解析 因为A ,B ,C ,E 四点分布在一条直线附近且贴近某一直线,点D 离得远,故应去掉的一组数据是D .故选C 项.6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关且y ^=2.347x -6.423;②y 与x 负相关且y ^=-3.476x +5.648;③y 与x 正相关且y ^=5.437x +8.493;④y 与x 正相关且y ^=-4.326x -4.578.其中一定不正确的结论的序号是( ) A .①② B .②③ C .③④D .①④D 解析 根据正负相关性的定义作出判断.由正负相关性的定义知①④一定不正确.7.根据如表所示的样本数据得到的回归方程为y ^=b ^x +a ^.若a ^=7.9,则x 每增加1个单位,y 就( )A .增加1.4C .增加1.2个单位D .减少1.2个单位B 解析 设变量x ,y 的平均值为x ,y , 所以x =15×(3+4+5+6+7)=5,y =15×(4+2.5-0.5+0.5-2)=0.9,所以样本点的中心为(5,0.9), 所以0.9=5×b ^+7.9,所以b ^=-1.4, 所以x 每增加1个单位,y 就减少1.4个单位. 8.变量X 和Y 的列联表如表所示.A .ad -bc 越小,说明X 与Y 关系越弱B .ad -bc 越大,说明X 与Y 关系越强C .(ad -bc )2越大,说明X 与Y 关系越强 D .(ad -bc )2越接近于0,说明X 与Y 关系越强C 解析 由独立性检验的思想可知,当|ad -bc |越小,说明X 与Y 关系越弱;当|ad -bc |越大,说明X 与Y 关系越强.故选C 项.9.已知x 与y 之间的几组数据如表所示.假设根据上表数据所得线性回归直线方程为y =b x +a .若某同学根据上表中前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b ^>b ′,a ^>a ′B .b ^>b ′,a ^<a ′C .b ^<b ′,a ^>a ′D .b ^<b ′,a ^<a ′C 解析 画出散点图,可大致的画出两条直线,如图所示.由两条直线的相对位置关系可判断b ^<b ′,a ^>a ′.故选C 项.10.某考察团对全国十大城市职工人均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562 (单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为( )A .66%B .72.3%C .67.3%D .83%D 解析 7.675=0.66x +1.562⇒x ≈9.26,故估计该城市消费额占人均工资收入的百分比为7.6759.26×100%≈83%.故选D 项.11.为了研究男子的年龄与吸烟的关系,抽查了100个男人,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如表所示.年龄合计 不超过40岁 超过40岁吸烟量不多于20支/天 50 15 65 吸烟量多于20支/天10 25 35 合计6040100A .99.9%B .99%C .95%D .没有理由A 解析 观测值k =100×(50×25-15×10)265×35×60×40≈22.161>10.828,所以我们有99.9%的把握确定吸烟量与年龄有关.12.以下三个命题中:①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②线性回归直线方程y ^=b ^x +a ^恒过样本点的中心(x -,y -),且至少过一个样本点; ③在某项测量中,测量结果ξ服从正态分布N (2,σ2)(σ>0),若ξ在(-∞,1)内取值的概率为0.1,则ξ在(2,3)内取值的概率为0.4.其中真命题的个数为( ) A .0 B .1 C .2D .3B 解析 ①能使所有数据点都在它附近的直线不止一条,而由回归直线的定义知只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,故①是假命题;②线性回归直线方程y ^=b ^x +a ^恒过样本点的中心(x ,y ),但不一定过样本点,故②是假命题;③由于ξ服从正态分布N (2,σ2)(σ>0),则正态分布图象的对称轴为x =2,故ξ在(-∞,2)内取值的概率为0.5,又由ξ在(-∞,1)内取值的概率为0.1,则ξ在(1,2)内取值的概率为0.4,故ξ在(2,3)内取值的概率为0.4,故③是真命题.二、填空题(本大题共4小题,每小题5分,共20分.将正确答案填在题中横线上) 13.对于线性回归方程y ^=a ^+b ^x ,当x =3时,对应的y 的估计值是17,当x =8时,对应的y 的估计值是22,那么,该回归直线方程是________,根据回归直线方程判断当x =________时,y 的估计值是38.解析 把两组值代入回归直线方程得⎩⎪⎨⎪⎧3b ^+a ^=17,8b ^+a ^=22,即⎩⎪⎨⎪⎧b ^=1,a ^=14,所以回归直线方程是y ^=x +14.令x +14=38,可得x =24,即当x =24时,y 的估计值是38.答案 y ^=x +14 2414.根据表中数据,计算K 2的观测值k ≈________(保留两位小数).解析 k =392×(196×196×68×324≈1.78.答案 1.7815.变量x 与y 具有线性相关关系,当x 的取值为16,14,12,8时,通过观测得到y 的值分别为11,9,8,5.若在实际问题中,y 的最大值是10,则x 的最大值不能超过________(结果精确到个位).解析 设y ^=b ^x +a ^,计算得b ^≈0.73,a ^≈-0.88,所以y ^=0.73x -0.88,当y ^=10时,由10=0.73x -0.88得x ≈15.故x 的最大值不能超过15.答案 1516.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下2×2列联表:(请用百分数表示).附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d .解析 K 2=(a +b )(c +d )(a +c )(b +d )=25×25×30×20≈8.333>7.879,所以在犯错误的概率不超过0.5%的前提下认为喜爱打篮球与性别有关.答案 0.5%三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)某单位为了了解用电量y 千瓦·时与气温x ℃之间的关系,随机统计了某4天的用电量与当天的气温,并制作了对照表.由表中数据得线性回归方程y =b x +a 中b ≈-2,预测当气温为-4 ℃时的用电量. 解析 x =10,y =40,回归直线过点(x ,y ), 所以40=-2×10+a ^,所以a ^=60,所以y ^=-2x +60. 令x =-4,得y ^=(-2)×(-4)+60=68.故当气温为-4 ℃时,用电量预计为68千瓦·时.18.(本小题满分12分)某班主任对班级22名学生进行了作业量的调查,数据如下:在喜欢玩电脑游戏的12人中,有10人认为作业多,2人认为作业不多;在不喜欢玩电脑游戏的10人中,有3人认为作业多,7人认为作业不多.(1)根据以上数据建立一个2×2列联表;(2)试问喜欢玩电脑游戏与认为作业多是否有关系?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),n =a +b +c +d ,P (K 2≥6.635)=0.01,P (K 2≥3.841)=0.05.解析 (1)根据题中所给数据,得到列联表如表所示.(2)K 2=12×10×13×9≈6.418,而3.841<6.418<6.635,所以有95%的把握认为喜欢玩电脑游戏与认为作业多有关系.19.(本小题满分12分)某种产品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如表所示的对应数据.(1)(2)试预测广告费支出为10万元时的销售额;(3)在已有的五组数据中任意抽取两组,求至少有一组数据其预测值与实际值之差的绝对值不超过5的概率.参考数据和公式:∑5i =1x 2i =145,∑5i =1y 2i =13 500,∑5i =1x i y i =1 380, b ^=∑ni =1x i y i -n x y ∑n i =1x 2i -n x -2 =∑ni =1 (x i -x )(y i -y )∑ni =1 (x i -x )2,a ^=y -b ^x . 解析 (1)x -=2+4+5+6+85=255=5,y -=30+40+60+50+705=2505=50,又已知∑5i =1x 2i =145,∑5i =1x i y i =1 380,于是可得b ^=∑5i =1x i y i -5x -y -∑5i =1x 2i -5x -2=1 380-5×5×50145-5×5×5=6.5, a ^=y --b ^x -=50-6.5×5=17.5,因此所求回归直线方程为y ^=6.5x +17.5.(2)根据(1)中求得的回归直线方程得,当x =10时,y ^=6.5×10+17.5=82.5,即当广告费支出为10万元时,这种产品的销售收入大约为82.5万元.(3)五组数据的预测值y ^与实际值y 如表所示.x 2 4 5 6 8 y30 40 60 50 70 y ^30.543.55056.569.5所有的基本事件为(30,40),(30,60),(30,50),(30,70),(40,60),(40,50),(40,70),(60,50),(60,70),(50,70),共10个.所抽取的两组数据其预测值与实际值之差的绝对值都超过5的只有(60,50). 所以至少有一组数据其预测值与实际值之差的绝对值不超过5的概率为1-110=910.20.(本小题满分12分)广州某校对某班50名学生进行了中国传统文化阅读量的调查,得到如下列联表(单位:名).认为阅读量多认为阅读量不多总计 喜欢体育运动 18 9 27 不喜欢体育运动8 15 23 总计262450(1)作出等高条形图;(2)能否有97.5%的把握认为喜欢体育运动与认为阅读量多之间有关系?为什么? 解析 (1)作等高条形图如图所示.(2)K 2的观测值k =50×(18×15-8×9)226×24×27×23≈5.059>5.024,因此我们有97.5%的把握认为喜欢体育运动与认为阅读量多之间有关系.21.(本小题满分12分)某公交公司为了方便市民出行、科学规划车辆投放,在一个人员密集流动地段增设一个起点站,为研究车辆发车间隔时间x (单位:分钟)与乘客等候人数y (单位:人)之间的关系,经过调查得到如表所示的数据.间隔时间x 10 11 12 13 14 15 等候人数y2325262928312组数据进行检验,检验方法如下:先用求得的线性回归方程计算间隔时间对应的等候人数y ^,再求y ^与实际等候人数y 的差,若差值的绝对值不超过1,则称所求线性回归方程是“恰当回归方程”.(1)从这6组数据中随机选取4组数据后,求剩下的2组数据的间隔时间之差大于1的概率;(2)若选取的是后面4组数据,求y 关于x 的线性回归方程y ^=b ^x +a ^,并判断此方程是否是“恰当回归方程”;(3)在(2)的条件下,为了使等候的乘客不超过35人,则间隔时间最多可以设置为多少分钟(精确到整数)?解析 (1)设“从这6组数据中随机选取4组数据后,剩下的2组数据不相邻”为事件A ,记这六组数据分别为1,2,3,4,5,6,剩下的两组数据的基本事件有12,13,14,15,16,23,24,25,26,34,35,36,45,46,56,共15种,其中相邻的有12,23,34,45,56,共5种,所以P (A )=1-515=23.(2)后面4组数据是因为x =12+13+14+154=13.5,y =26+29+28+314=28.5,∑i =14x i y i =1 546,∑i =14x 2i =734,所以b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2=1 546-4×13.5×28.5734-4×13.52=1.4, a ^=y -b ^x =28.5-1.4×13.5=9.6,所以y ^=1.4x +9.6.当x =10时,y ^=1.4×10+9.6=23.6,23.6-23=0.6<1;当x =11时,y ^=1.4×11+9.6=25,25-25=0<1,所以求出的线性回归方程是“恰当回归方程”.(3)由1.4x +9.6≤35得x ≤1817,故间隔时间最多可设置为18分钟.22.(本小题满分12分)某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制了频率分布直方图,如图所示.规定80分及以上者晋级成功,否则晋级失败(满分为100分).(1)求图中a 的值;(2)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关;晋级成功 晋级失败合计 男 16女50 合计(3)3人中晋级失败的人数为X ,求X 的分布列与数学期望E (X ).参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .P (K 2≥k 0)0.40 0.25 0.15 0.10 0.05 0.025 k 00.7081.3232.0722.7063.8415.024(2)由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25,所以晋级成功的人数为100×0.25=25,2×2列联表如下:晋级成功 晋级失败 合计 男 16 34 50 女 9 41 50 合计2575100因为K 2=100×(225×75×50×50≈2.613>2.072,所以有超过85%的把握认为“晋级成功”与性别有关.(3)由(2)得,晋级失败的频率为1-0.25=0.75,将频率视为概率,则从本次考试的所有人员中,随机抽取1人进行约谈,该人晋级失败的概率为34,所以随机变量X 服从二项分布,即X ~B ⎝ ⎛⎭⎪⎫3,34,所以P (X =0)=C 03⎝ ⎛⎭⎪⎫340⎝ ⎛⎭⎪⎫143=164,P (X =1)=C 13⎝ ⎛⎭⎪⎫341⎝ ⎛⎭⎪⎫142=964,P (X =2)=C 23⎝ ⎛⎭⎪⎫342⎝ ⎛⎭⎪⎫141=2764,P (X =3)=C 33⎝ ⎛⎭⎪⎫343⎝ ⎛⎭⎪⎫140=2764,所以X 的分布列为..DOC版.所以E(X)=164×0+64×1+64×2+64×3=4或E(X)=3×4=94.。
2018-2019学年高中数学 第三章 统计案例章末综合检测 新人教A版选修2-3
第三章 统计案例章末综合检测(三)(时间:120分钟,满分:150分)一、选择题:本题共12小题,每小题5分,在每小题给出的四个选项中,只有一项是符合题目要求的.1.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是( ) A .吸烟,不吸烟 B .患病,不患病 C .是否吸烟,是否患病D .以上都不对解析:选C.“是否吸烟”是分类变量,它的两个不同取值:吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A ,B 都是一个分类变量所取的两个不同值.故选C.2.某商品销售量y (单位:件)与销售价值x (单位:元/件)负相关,则其回归方程可能是( ) A.y ^=-10x +200 B.y ^=10x +200 C.y ^=-10x -200D.y ^=10x -200解析:选A.由x 与y 负相关,可排除B ,D 两项,而C 项中的y ^=-10x -200<0不符合题意,故选A.3.两个相关变量满足如下关系:根据表格已得回归方程为y =9.5x +8.8,表中有一数据模糊不清,推算该数据是( ) A .37 B .38.5 C .39D .40.5解析:选C.因为x =2+3+4+5+65=4,所以y =9.5×4+8.8=46.8.设模糊不清的数据为a ,则25+a +50+56+64=5y =234,解得a =39.故选C.4.在等高条形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) A.a a +b 与d c +d B.c a +b 与a c +d C.aa +b 与cc +dD.aa +b 与cb +c解析:选C.由等高条形图的解可知aa +b 与cc +d的值相差越大,|ad -bc |就越大,相关性就越强.5.在一次独立性检验中,得出列联表如下:( ) A .200 B .720 C .100D .180解析:选B.由表得K 2的观测值k =(1 180+a )×(200a -180×800)2380×(800+a )×(180+a )×1 000, 当a =200时,k =(1 180+200)×(200×200-180×800)2380×(800+200)×(180+200)×1 000≈103.37>2.706,此时两个变量A 和B 有关联; 当a =720时,k =(1 180+720)×(200×720-180×800)2380×(800+720)×(180+720)×1 000=0,由k ≤2.706知此时没有充分证据显示两个变量A 和B 有关联,则a 的可能值是720. 6.下列关于K 2的说法正确的是( )A .K 2在任何相互独立问题中都可以用来检验有关还是无关 B .K 2的值越大,两个事件的相关性就越大C .K 2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合D .K 2的观测值k 的计算公式为k =n (ad -bc )(a +b )(c +d )(a +c )(b +d )解析:选C.K 2是用来判断两个分类变量是否有关的,故A 错;K 2的值越大,只能说明有更大地把握认为二者有关系,却不能判断相关性的大小,B 错;D 中(ad -bc )应为(ad -bc )2. 7.以下关于线性回归的判断,正确的个数是( )①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数点都线性相关,个别特殊点不影响线性回归,如图中的A ,B ,C 三点; ③已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为11.69;④回归直线方程的意义是它反映了样本整体的变化趋势. A .0 B .1 C .2D .3解析:选D.能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知只有按最小二乘法求得回归系数a ^,b ^得到的直线y ^=b ^x +a ^才是回归直线,所以①不对;②正确;将x =25代入y ^=0.50x -0.81,得y ^=11.69,所以③正确;④正确.故选D.8.假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其2×2列联表如下:( ) A .a =5,b =4,c =3,d =2 B .a =5,b =3,c =4,d =2 C .a =2,b =3,c =4,d =5 D .a =2,b =3,c =5,d =4解析:选D.对于A ,|ad -bc |=|10-12|=2; 对于B ,|ad -bc |=|10-12|=2; 对于C ,|ad -bc |=|10-12|=2; 对于D ,|ad -bc |=|8-15|=7.9.在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( ) A .平均数与方差 B .回归直线方程 C .独立性检验 D .概率解析:选C.根据所学内容以及此题所提供的数据可知,要想回答性别对判断“中国进入了世界体育强国之列”是否有关系时,用独立性检验最有说服力.10.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( ) 表1表3表4A .成绩 C .智商D .阅读量解析:选D.结合各列联表中数据,得K 2的观测值分别为k 1,k 2,k 3,k 4. 因为k 1=52×(6×22-14×10)216×36×32×20=52×8216×36×32×20,k 2=52×(4×20-16×12)216×36×32×20=52×112216×36×32×20,k 3=52×(8×24-12×8)216×36×32×20=52×96216×36×32×20,k 4=52×(14×30-6×2)216×36×32×20=52×408216×36×32×20,则k 4>k 2>k 3>k 1,所以阅读量与性别有关联的可能性最大.11.某学校开展研究性学习活动,某同学获得一组实验数据如下:(1.99,1.5),(3,4.04),(4,7.5),(5.1,12),(6.12,18.01).对于这组数据,现在给出以下拟合曲线,其中拟合程度最好的是( ) A .y =2x -2 B .y =(12)xC .y =log 2xD .y =12(x 2-1)解析:选D.本题若求R 2或残差来分析拟合效果,运算将很烦琐,计算量太大,可以将各组数据代入检验,发现D 最接近.故选D. 12.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( ) A.b ^>b ′,a ^>a ′ B.b ^>b ′,a ^<a ′ C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′解析:选C.法一:b ′=2,a ′=-2,由公式b ^=∑6i =1(x i -x )(y i -y )∑6i =1 (x i -x )2求得, b ^=57,a ^=y --b ^x -=136-57×72=-13, 所以b ^<b ′,a ^>a ′.法二:过(1,0)和(2,2)的直线方程为y =2x -2, 画出六点的散点图,回归直线的大概位置如图所示,显然b ′>b ^,a ^>a ′.二、填空题:本题共4小题,每小题5分.13.下表是关于新生婴儿的性别与出生时间段调查的列联表,那么,A =________,B =________,C =________,D =________.解析:由题意可知,A =9245=53,C =180-92=88. 答案:47 53 88 8214.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的线性回归方程为y ^=0.254x +0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析:由题意知[0.254(x +1)+0.321]-(0.254x +0.321)=0.254. 答案:0.25415.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y (千元)统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为________. 解析:当y ^=7.675时,x =7.675-1.5620.66≈9.262,所以7.6759.262≈0.829≈83%.答案:83%16.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未用血清的人一年中的感冒记录作比较,提出假设H 0:“这种血清不能起到预防感冒的作用”.利用2×2列联表计算得k ≈3.918,经查阅临界值表知P (K 2≥3.841)≈0.05. 对此,四名同学做出了以下判断:p :有95%的把握认为“这种血清能起到预防感冒的作用”.q:若某人未使用该血清,那么他在一年中有95%的可能性得感冒.r:这种血清预防感冒的有效率为95%.s:这种血清预防感冒的有效率为5%.则下列复合命题中正确的是________.(填序号)①p∧(綈q); ②(綈p)∧q;③(綈p∧綈q)∧(r∨s); ④(p∨綈r)∧(綈q∨s).解析:查阅临界值表,知P(K2≥3.841)≈0.05,故有95%的把握认为“这种血清能起到预防感冒的作用”.95%仅是指“血清能起到预防感冒的作用”的可信程度,但也有“在100个使用血清的人中一个患感冒的人也没有”的可能,故p真,其余命题都为假.结合复合命题的真值可知,选①④.答案:①④三、解答题:解答应写出文字说明、证明过程或演算步骤.17.(本小题满分10分)冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示.解:由已知数据得到如下2×2列联表:K2的观测值k=≈13.11,由于13.11>10.828,故有99.9%的把158×224×59×323握认为含杂质的高低与设备改造是有关的.18.(本小题满分12分)2017年某市开展了“寻找身边的好老师”活动,市六中积极行动,认真落实,通过微信关注评选“身边的好老师”,并对选出的五位“好老师”的班主任的工作年限和被关注数量进行了统计,得到如下数据:(1)程y ^=b ^x +a ^,并就此分析:“好老师”的班主任工作年限为15年时被关注的数量; (2)若用y i x i(i =1,2,3,4,5)表示统计数据时被关注数量的“即时均值”(四舍五入到整数),从“即时均值”中任选2组,求这2组数据之和小于8的概率. 解:(1)x =8,y =36,b ^=40+120+320+600+600-5×8×3616+36+64+100+144-5×64=6,a ^=36-48=-12,所以y ^=6x -12,当x =15时,y ^=6×15-12=78百人.(2)这5次统计数据,被关注数量的“即时均值”分别为3,3,5,6,4.从5组“即时均值”任选2组,共有C 25=10种情况,其中2组数据之和小于8为(3,3),(3,4),(3,4)共3种情况,所以这2组数据之和小于8的概率为310.19.(本小题满分12分)某市规定中学生百米成绩达标标准为不超过16秒.现从该市中学生中按照男、女生比例随机抽取了50人,其中有30人达标.将此样本的频率估计为总体的概率.(1)随机调查45名学生,设ξ为达标人数,求ξ的数学期望与方差; (2)如果男、女生采用相同的达标标准,男、女生达标情况如表:根据表中所给的数据,完成0.01的前提下能否认为“体育达标与性别有关”?若有,你能否给出一个更合理的达标方案? 解:由题意可知,随机抽取1人,则此人百米成绩达标的概率为3050=35.(1)由题设可知,ξ~B ⎝⎛⎭⎪⎫45,35,故E (ξ)=45×35=27,D (ξ)=45×35×25=10.8.(2)K 2的观测值k =32×18×30×20≈8.333>6.635,所以在犯错误的概率不超过0.01的前提下认为“体育达标与性别有关”.男、女生要使用不同的达标标准.20.(本小题满分12分)中石化集团通过与安哥拉国家石油公司合作,获得了安哥拉深海油田区块的开采权,集团在某些区块随机初步勘探了部分旧井,取得了地质资料.进入全面勘探时期后,集团按网络点来布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用.勘探初期部分旧井的数据资料见下表:(1)1~6号旧井位置线性分布,借助前5组数据求得回归方程为y =b x +a ,其中b =6.5,求a ^,并估计6号旧井中y 的预报值;(2)现准备勘探新井7(1,25),若通过1,3,5,7号井计算出的b ^′,a ^′的值与(1)中b ^,a ^的值的差均不超过10%,则使用位置最接近的已有旧井6(1,y ),否则在新位置打井,请判断可否使用旧井.(注:其中b ^的计算结果用四6.8即b ^′=6.8,a ^′=19.05, 由(1)知b ^=6.5,a ^=17.5.因为b ^′-b ^b ^≈5%,a ^′-a ^a^≈9%,均不超过10%,因此使用位置最接近的已有旧井6(1,24).21.(本小题满分12分)某高校共有学生15 000人,其中男生10 500人,女生4 500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],估计该校学生每周平均体育运动时间超过4小时的概率;(3)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.解:(1)300×4 50015 000=90,所以应收集90位女生的样本数据.(2)由频率分布直方图得1-2×(0.025+0.100)=0.75,所以该校学生每周平均体育运动时间超过4小时的概率的估计值为0.75.(3)由第二问知,300位学生中有300×0.75=225人的每周平均体育运动时间超过4小时,75人的每周平均体育运动时间不超过4小时.又因为样本数据中有210份是关于男生的,90份是关于女生的,所以每周平均体育运动时间与性别列联表如下:每周平均体育运动时间与性别列联表结合列联表可算得K2的观测值k=75×225×210×90=21≈4.762>3.841.所以,在犯错误的概率不超过0.05的前提下认为“该校学生的每周平均体育运动时间与性别有关”.22.(本小题满分12分)在关于人的脂肪含量(百分比)和年龄(岁)的关系的研究中,研究人员获得了一组数据如下表:(1)(2)建立年龄为解释变量,脂肪含量为预报变量的回归模型,并分析该模型能否较好地刻画两者的关系;(3)求相关指数R2,并说明其含义.解:(1)画出散点图如图所示.由散点图可知样本点呈条状分布,脂肪含量与年龄有比较好的线性相关关系,因此可以用线性回归方程来刻画它们之间的关系. (2)计算得线性回归方程为y ^=0.576x -0.448. 残差e ^i =y i -y ^i ,数据如下 e ^1=-3.3,e ^2=2.696,e ^3=-0.816,e ^4=2.732,e ^5=2.028,e ^6=-1.476,e ^7=-0.152,e ^8=-0.48,e ^9=-0.456,e ^10=-0.408,e ^11=-1.584,e ^12=0.54, e ^13=1.088,e ^14=-0.088.以年龄为x 轴,残差为y 轴画残差图(图略),可知残差点比较均匀地落在水平的带状区域中,说明用上述回归模型拟合数据效果很好.。
人教版高中数学高二选修2-3课下检测第三章《统计案例》章末检测
章末归纳总结1.下列变量之间的关系是函数关系的是( )A .已知二次函数y =ax 2+bx +c ,其中a ,c 是已知常数,取b 为自变量,因变量是这个函数的判别式Δ=b 2-4acB .光照时间和果树亩产量C .降雪量和交通事故发生率D .每亩施用肥料量和粮食产量一次项系数确定,a ,b ,c 都已知,Δ也就唯一确定,因此这两者之间是确定的函数关系.故应选A. A2.在调查中学生近视情况时,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时,用以下哪种方法最有说服力( )A .期望与方差B .排列与组合C .独立性检验D .概率独立性检验检验两个变量的相关性最有说服力. 故应选C. C3.两个相关变量满足如下关系:x 10 15 20 25 30 y1 0031 0051 0101 0111 014A.y ^=0.56x +997.4 B.y ^=0.63x -231.2 C.y ^=50.2x +501.4D.y ^=60.4x +400.7直接利用回归直线方程的系数公式即可. 故应选A. A4.如果根据性别与是否爱好运动的列联表得到K 2≈3.852>3.841,所以判断性别与运动有关,那么这种判断犯错的可能性不超过( )A .2.5%B .0.5%C .1%D .5%K 2=3.852>3.841,∴有95%的把握认为性别与运动有关,故判断错误的可能性不超过5%.故应选D. D5.已知回归直线方程为y ^=0.50x -0.81,则x =25时,y 的估计值为________. 将x =25代入y ^=0.50x -0.81即可. 11.696.在研究某新措施对“非典”的防治效果问题时,得以下数据:由已知K 2=300×(132×36-18×246)2246×54×150×150≈7.317>6.635.故有99%的把握认为新措施对防非典非常有效. 有效7.205份检品分别接种于甲、乙两种培养基上,经过规定的一段时间后,检查培养的效果.结果分为阳性和阴性,资料如下.试分析这两种培养基的培养效果是否有显著差别.由公式得 K 2=205×(36×103-34×32)270×135×137×68=15.984.因为15.984>6.635,所以我们有99%的把握说,这两种培养基的培养效果是有显著差别的.甲培养基的培养效果明显优于乙培养基.8.炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料溶化完毕时,钢水的含碳量x与冶炼时间y(从炼料熔化完毕到出钢的时间)的一列数据,如下表所示:x(0.01%)104108190177147134150191204121 y(min)100200210185155135170205235125(2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?(1)以x轴表示含量,y轴表示冶炼时间,可作散点图如下图所示.从图中可以看出,各点散布在一条直线附近,即它们线性相关.(2)列出下表,并用科学计算器进行计算:i 12345678910 x i104108190177147134150191204121 y i100200210185155135170205235125x i y i10400360003990032745227851809025500391554794015125x=159.8,y=172,∑i=110x2i=265 448,∑i=110y2i=312 350,∑i=110x i y i=287 640设所求的回归直线方程为y=bx+a,其中a,b的值使Q=∑i=110(y i-bx i-a)2的值最小.b =∑i =110x i y i -10x y∑i =110x 2i -10x2≈1.267,a =y -b x ≈-30.51.即所求的回归直线方程为y ^=1.267x -30.51.(3)当x =160时,y ^=1.267×160-30.51≈172 min ,即大约冶炼172 min.。
苏教版数学高二-数学苏教版选修2-3章末检测 第3章 统计案例(B)
第3章 统计案例(B)(时间:120分钟 满分:160分)一、填空题(本大题共14小题,每小题5分,共70分) 1.对于回归分析,下列说法错误的是________.(填序号)①在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定; ②线性相关系数可以是正的,也可以是负的;③回归分析中,如果r 2=1,说明x 与y 之间完全相关; ④样本相关系数r ∈(-1,1).2.现在一个由身高预测体重的回归方程: 体重预测值=4(磅/英寸)×身高-130(磅)其中体重与身高分别以磅和英寸为单位.如果换算成公制(1英寸≈2.5 cm,1磅≈0.45 kg),则回归方程应该是__________________________.3y 与x 的线性回归方程为y =6.5x +17.5,当广告费支出5万元时,随机误差为________. 4.一位母亲记录了儿子3~9岁的身高的数据,她根据这些数据建立的身高y (cm)与年龄x 的回归模型为y ^=7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则叙述正确的是______(填序号).①身高一定是145.83 cm ; ②身高在145.83 cm 左右; ③身高在145.83 cm 以上; ④身高在145.83 cm 以下. 5.某考察团对全国10大城市进行职工人均平均工资x 与居民人均消费y 进行统计调查,y 与x 具有相关关系,回归方程y ^=0.66x +1.562(单位:千元),若某城市居民消费水平为7.765,估计该城市消费额占人均工资收入的百分比为________.6.已知两个变量x 和y 之间有线性相关性,5次试验的观测数据如下表,那么变量y 关于x7.若由一个2×2列联表中的数据计算得χ2=4.013,那么在犯错误的概率不超过________的前提下认为两个事件有关系.8.许多因素都会影响贫穷,教育也许是其中的一个.在研究这两个因素的关系时,收集了某国50个地区的成年人至多受过9年教育的百分比(x )和收入低于官方规定的贫困线的人数占本地区人数的百分比(y )的数据,建立的线性回归方程是y ^=4.6+0.8x .这里,斜率的估计等于0.8说明____________________________________________________________________________________________________________________________________________________________________________________________________________________. 9.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:为了判断主修统计专业是否与性别有关,根据表中数据,得到χ2=50×(13×20-10×7)223×27×20×30≈4.844.因为χ2>3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性约为________.10.某市居民2005~2009年家庭年平均收入x (单位:万元)与年平均支出Y (单位:万元)根据统计资料,居民家庭年平均收入的中位数是______,家庭年平均收入与年平均支出有______线性相关关系.11.若两个分类变量X 和Y则X 与Y 之间有关系的概率约为________.12据表中数据我们可得出的统计分析推断是__________________. 13.由上表中数据计算得χ2=105×(10×30-20×45)55×50×30×75≈6.109,估计有______把握认为“文化程度与月收入有关系”.14.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②线性回归方程y ^ =b ^ x +a ^必过点(x ,y );③曲线上的点与该点的坐标之间具有相关关系; ④在一个2×2列联表中,由计算得K 2=13.079,则其两个变量间有关系的可能性是90%. 其中错误的是________.(填序号)二、解答题(本大题共6小题,共90分)15.(14分)2×2列联表所示:其中a,15-a 均为大于5的整数,则a 取何值时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系?16.(14分)有一台机床可以按各种不同的速度运转,其加工的零件有一些是二级品,每(1)作出散点图;(2)写出回归直线方程.17.(14分)某聋哑研究机构,对聋与哑是否有关系进行抽样调查,在耳聋的657人中有416人哑,而在另外不聋的680人中有249人哑,你能运用这组数据,得到相应结论吗?请运用独立性检验进行判断.求y与x的线性回归方程,并刻画回归的效果.19.(16分)问:辐照保鲜措施对水果保鲜是否有效?20(1)画出散点图; (2)求回归方程;(3)若某名健康儿童的血硒含量为94(1 000 ppm),预测他的发硒含量.第3章 统计案例(B)答案1.④解析 相关系数r 的范围是[-1,1]. 2.体重预测值=0.72×身高-58.5解析 4磅/英寸=4×(0.45 kg/2.5 cm)=0.72(kg/cm), 130磅=130×0.45 kg =58.5 kg. 3.10 4.② 5.83%6.y ^=0.575x -14.9 7.0.05解析 χ2=4.013>3.841.8.一个地区受过9年或更少的教育的百分比每增加1%,则收入低于官方规定的贫困线的人数占本地区人数的百分比将增加0.8%左右9.0.05 10.13 正解析 把2005~2009年家庭年平均收入按从小到大顺序排列为11.5,12.1,13,13.3,15,因此中位数为13(万元),由统计资料可以看出,当年平均收入增多时,年平均支出也增多,因此两者之间具有正线性相关关系.11.0.999解析 χ2=(5+15+40+10)(5×10-40×15)2(5+15)(40+10)(5+40)(15+10)≈18.8>10.828,查表知P (χ2>10.828)≈0.001,∴x 与y 之间有关系的概率约为1-0.001=0.999, 因此有99.9%的把握认为X 与Y 有关系. 12.传染病与饮用不干净水是有关系的 解析 通过独立性检验可知. 13.97.5% 14.③④解析 ①正确.由回归方程的定义及最小二乘法思想,知②正确.③④不正确. 15.解 查表可知,要使在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系, 则k ≥2.706,而k =65×[a (30+a )-(20-a )(15-a )]220×45×15×50=65×(65a -300)220×45×15×50=13×(13a -60)260×90. 由k ≥2.706得a ≥7.19或a ≤2.04. 又a >5且15-a >5,a ∈Z ,即a =8,9.故a 为8或9时,在犯错误的概率不超过0.1的前提下认为x 与y 之间有关系. 16.解 (1)散点图如图所示.(2)y ^=0.728 6x +0.857 5.17.解 哑 不哑 总计 聋 416 241 657 不聋 249 431 680 总计6656721 337根据列联表中数据得到K 2的观测值k =1 337×(416×431-241×249)2657×680×665×672≈95.291>10.828.因此在犯错误的概率不超过0.001的前提下认为聋与哑有关系. 18.解 序号 x i y i x 2i y 2i x i y i 1 0.10 15 0.01 225 1.5 2 0.30 18 0.09 324 5.4 30.40190.163617.64 0.55 21 0.302 5 441 11.55 5 0.70 22.6 0.49 510.76 15.82 6 0.80 23.8 0.64 566.44 19.047 0.95260.902 567624.7合计3.8 145.4 2.595 3 104.2 85.61由上表中数据,得x =3.87≈0.543,y =17×145.4≈20.77,∑i =1x 2i =2.595, 所以b ^=85.61-7×0.543×20.772.595-7×0.5432≈12.55.a ^=20.77-12. 55×0.543≈13.96. 所以线性回归方程为y ^=13.96+12.55x .将数据代入相关指数的计算公式得R 2≈0.997 4(小范围内波动亦可).由此可看出用线性回归模型拟合数据效果很好.19.解 根据题中数据,利用公式, 得χ2=1 000×(251×297-249×203)2454×546×500×500≈9.295,因为9.295>7.879,因此有99.5%的把握认为辐照保鲜措施对水果保鲜有效. 20.解 (1)散点图如下图所示:(2)根据回归方程的截距和斜率的最小二乘估计公式分别求得: b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=8 464-10×75.4×10.858 212-10×75.42≈0.236, a ^=y -b ^x =10.8-0.236×75.4≈-6.99. 故所求回归方程为y ^=0.236x -6.99. (3)当x =94时,y ^ =0.236×94-6.99≈15.2.因此,当地儿童的血硒含量为94(1 000 ppm)时,该儿童的发硒含量约为15.2(1 000 ppm).。
2020-2021学年高二数学下学期统计案例章末检测卷(基础篇)(江苏专用)解析版
2020-2021学年高二数学下学期统计案例章末检测卷(基础篇)一、选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.已知两变量和的一组观测值如下表所示:如果两变量线性相关,且线性回归方程为,则( )A. B.C.D.【答案】D【解析】把代入中,得,故选:D .2.若由一个列联表中的数据计算得2 4.013K =,那么有( )把握认为两个变量有关系.A .B .97.5%C .D .【答案】A【解析】因为由列联表中的数据计算得2 4.013K =,且4.013>3.841, 所以有95%的把握认为这两个变量有关系.故选:A3.已知变量x ,y 的关系可以用模型拟合,设,其变换后得到一组数据下:由上表可得线性回归方程,则c =( ) A . B . C .109 D .【答案】D【解析】由表格数据知:. 由,得417.539a -⨯+=,则. ∴4109z x =-+,由,得ln ln()ln ln ln kxkxz y c e c e c kx ==⋅=+=+,∴ln 109c =,即. 故选:D.4.某同学寒假期间对其30位亲属的饮食习惯进行了一次调查,列出了如下列联表:则可以说其亲属的饮食习惯与年龄有关的把握为( ) 附:参考公式和临界值表A .90%B .95%C .99%D .99.9%【答案】C【解析】由题意,得2230(42168)10 6.63512182010K ⨯-⨯==>⨯⨯⨯所以有的把握认为其亲属的饮食习惯与年龄有关故选:C .5.校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是( )A .B .C .D .ln y a b x =+ 【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图像附近,因此,最适合作为发芽率和温度的回归方程类型的是ln y a b x =+,故选:D .6.2020年2月,全国掀起了“停课不停学”的热潮,各地教师通过网络直播、微课推送等多种方式来指导学生线上学习.为了调查学生对网络课程的热爱程度,研究人员随机调查了相同数量的男、女学生,发现有的男生喜欢网络课程,有的女生不喜欢网络课程,且有的把握但没有的把握认为是否喜欢网络课程与性别有关,则被调查的男、女学生总数量可能为( ) 参考公式及数据:,其中n a b c d =+++.A.130 B.190C.240 D.250【答案】B【解析】依题意,设男、女生的人数各为,建立列联表如下所示:故()2222831010553721x x x xKx x x x=⋅⋅⋅⋅-=,由题可知106.63510.82821x<<,所以,只有B符合题意. 故选:B.7.2020年12月30日,国家药品监督管理局附条件批准国药集团中国生物北京生物制品研究所有限责任公司的新型冠状病毒灭活疫苗(细胞)注册申请.该疫苗是首家获批的国产新冠病毒灭活疫苗,适用于预防由新型冠状病毒感染引起的疾病(19COVID-).年月日,北京市人民政府新闻办公室召开疫情防控第场例行新闻发布会,表示不在岁接种年龄段范围的人员,需要等待进一步临床试验数据.近日专家对该年龄内和该年龄段外的人进行了临床试验,得到如下列联表:附:,其中n a b c d=+++;参照附表,得到的正确结论是()A.在犯错误的概率不超过的前提下,认为“能接种与年龄段无关”B.在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”C.有以上的把握认为“能接种与年龄段无关”D.有以上的把握认为“能接种与年龄段有关”【答案】D【解析】由列联表可得()22110403020207.82260506050K⨯⨯-⨯=≈⨯⨯⨯由所以在犯错误的概率不超过的前提下,认为“能接种与年龄段有关”即有以上的把握认为“能接种与年龄段有关故选:D8.由一组样本数据,,,,得到回归直线方程,那么下面说法不正确的是()A.直线至少经过,,,中的一个点B.直线必经过C.直线的斜率为D.直线的纵截距为【答案】A【解析】线性回归直线不一定经过样本数据中的一个点,这是最能体现这组数据的变化趋势的直线,但并不一定在直线上,故A不正确;线性回归直线一定经过样本中心点,故B正确;根据最小二乘法知C正确;根据线性回归直线的意义知D正确,故选:A.二、选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.9.某机构在研究性别与是否爱好拳击运动的关系中,通过收集数据得到如下2×2列联表经计算得K22100(35281522)6.89550505743⨯⨯-⨯=≈⨯⨯⨯.之后又对被研究者的身高进行了统计,得到男、女身高分别近似服从正态分布N(175,16)和N(164,9),则下列选项中正确的是()A .在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”B .在100个男生中,至少有一个人爱好打拳击C .男生身高的平均数为175,男生身高的标准差为16D .女生身高的平均数为164,女生身高的标准差为3 【答案】AD【解】对于A ,∵K 2≈6.895>6.635,∴在犯错误的概率不超过1%的前提下,认为“爱好拳击运动与性别有关”,正确;对于B ,题干中使用样本估计总体,若单独选一个100人的男生样本,可以没有一个人爱好打拳击,故B 错,对于C ,男生身高服从正态分布N (175,16),,标准差,C 错;对于D ,女生身高服从正态分布N (164,9),,标准差,D 正确; 故选:AD. 10.对两个变量,进行回归分析,得到组样本数据,,,,则下列说法正确的是( ) A .由样本数据得到的回归直线方程必经过样本中心点 B .相关指数越大,残差的平方和越小,其模型的拟合效果越好C .若线性回归方程为,当解释变量每增加个单位时,预报变量平均增加个单位D .相关系数越接近,变量,相关性越强 【答案】ABC【解析】由定义知回归直线方程必经过样本中心点,故A 正确;由相关指数的定义知,越大模型拟合效果越好,由残差的平方和定义知,残差的平方和越小模型的拟合效果越好,故B 正确;C 选项是回归直线方程的应用,故C 正确;相关系数的范围为,由定义知越接近,变量,相关性越强,故D 错误. 故选:ABC 11.以下结论正确的是( )A .根据列联表中的数据计算得出2 6.635K ≥,而()26.6350.01P K ≥≈,则有99%的把握认为两个分类变量有关系B .的值越大,两个事件的相关性就越大C .在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好D .在回归直线中,变量时,变量的值一定是15 【答案】ABC【解析】对于A ,()26.6350.01P K ≥≈,故有99%的把握认为两个分类变量有关系,即A 正确:对于B ,越大,“与有关系”可信程度越大,相关性就越大,即B 正确;对于C ,在回归分析中,相关指数越大,说明残差平方和越小,回归效果越好,即C 正确; 对于D ,当回归直线方程中,当变量等于200时,的值平均是15,不能说一定是15,故D 错误. 故选:ABC .12.年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月2020年月)根据散点图选择和ln y c d x =+两个模型进行拟合,经过数据处理得到的两个回归方程分别为0.9369y =+0.95540.0306ln y x =+,并得到以下一些统计量的值:注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是( ) A .当月在售二手房均价与月份代码呈负相关关系B .由0.9369y =+ 1.0509万元/平方米C .曲线0.9369y =+0.95540.0306ln y x =+都经过点D .模型0.95540.0306ln y x =+回归曲线的拟合效果比模型0.9369y =+ 【答案】BD【解析】对于A ,散点从左下到右上分布,所以当月在售二手房均价y 与月份代码x 呈正相关关系,故A 不正确; 对于B ,令,由,所以可以预测2021年2月在售二手房均价约为1.05091.0509万元/平方米,故B 正确; 对于C ,非线性回归曲线不一定经过 ,故C 错误;对于D ,越大,拟合效果越好,由00.973.923<,故D 正确. 故选:BD三、填空题:本题共4小题,每小题5分,共20分.13.期中考试结束后,某教师随机抽取了本班五位同学的数学成绩进行统计,五位同学平均每天学习数学的时间(分钟)和数学成绩(分)之间的一组数据如下表所示:通过分析,发现数学成绩对学习数学的时间具有线性相关关系,其回归方程0.716y t =+,则表格中的值是__________. 【答案】63【解析】由图表可得,所以0.7701665y =⨯+=, 则,即.故答案为:6314.某词汇研究机构为对某城市人们使用流行语的情况进行调查,随机抽取了200人进行调查统计得下方的列联表.则根据列联表可知( )参考公式:独立性检验统计量,其中n a b c d =+++. 下面的临界值表供参考:有___________的把握认为“经常用流行用语”与“年轻人”有关系 【答案】95%【解析】22200(25152535) 4.167 3.8411604050150X ⨯⨯-⨯==>⨯⨯⨯,根据临界值知有95%的把握认为经常用流行语与年轻人有关系, 故答案为:95%15.为促进就业,提升经济活力,2020年我国多个城市开始松绑“地摊经济”,市自大力发展“地摊经济”以来,夜市也火了起来,下表是市2020年月份代码与夜市的地摊摊位数(单位:万个)的统计数据:若与线性相关,且求得其线性回归方程为,则表中的值为_________ 【答案】360【解析】由题意,根据表格中的数据,可得, 代入,可得230503=380y =+⨯, 又由()12903304404803805t ++++=,解得.故答案为:360. 16.2020年12月31日,国务院联防联控机制发布,国药集团中国生物的新冠病毒灭活疫苗已获国家药监局批准附条件上市.在新冠病毒疫苗研发过程中,需要利用基因编辑小鼠进行动物实验.现随机抽取100只基因编辑小鼠对某种新冠病毒疫苗进行实验,得到如下列联表(部分数据缺失):计算可知,在犯错误的概率最多不超过__________的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”.参考公式及数据:,其中n a b c d =+++.【答案】30 【解析】完善列联表如下:所以,因为, 又,所以在犯错误的概率最多不超过的前提下,可认为“给基因编辑小鼠注射该种疫苗能起到预防新冠病毒感染的效果”. 故答案为:30;四、解答题:本题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤.17.某企业新研发了一种产品,产品的成本由原料成本及非原料成本组成.每件产品的非原料成本y (元)与生产该产品的数量x (千件)有关,经统计得到如下数据:根据以上数据,绘制了散点图.观察散点图,两个变量不具有线性相关关系,现考虑用反比例函数模型和指数函数模型分别对两个变量的关系进行拟合,(反比例函数模型可用转化为线性回归模型;指数函数模型可转化为和x 的线性回归模型ln ln y dx c =+)现已求得用指数函数模型拟合的回归方程为,与x 的相关系数;(1)用反比例函数模型求y 关于x 的回归方程;(2)用相关系数判断上述两个模型哪一个拟合效果更好(精确到0.01),并用其估计产量为10千件时每件产品的非原料成本. 参考数据:,,,,,,822186185.5ii yy =-=∑(其中,参考公式:对于一组数据,其回归直线的斜率和截距的最小二乘法估计分别为,相关系数ni i u v nuvr -=∑【答案】(1);(2)用反比例函数模型拟合效果更好,估计为21元. 【解析】(1)令,则可转化为, 因为,所以, 则,所以所以y 关于x 的回归方程为; (2)y 与的相关系数为812882222118610.9961.40.6188i ii i i i i u yu yr u u y y ===-===≈⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑, 因为,所以用反比例函数模型拟合效果更好, 把代入回归方程:,100112110y =+=(元). 所以当产量为10千件时,每件产品的非原料成本估计为21元.18.已知某班有50位学生,现对该班关于“举办辩论赛”的态度进行调查,,他们综合评价成绩的频数分布以及对“举办辩论赛”的赞成人数如下表:(1)请根据以上统计数据填写下面2×2列联表,并回答:是否有95%的把握认为“综合评价成绩以80分位分界点”对“举办辩论赛”的态度有差异?(2)若采用分层抽样在综合评价成绩在[60,70),[70,80)的学生中随机抽取10人进行追踪调查,并选其中3人担任辩论赛主持人,求担任主持人的3人中至少有1人在[60,70)的概率. 参考公式:,其中n a b c d =+++. 参考数据:【答案】(1)表格见解析,不能;(2). 【解析】(1)做个皮尔逊卡方检验的话,有()2250286412 3.125 3.84132184010K ⨯⨯-⨯==<⨯⨯⨯故此不能推翻零假设,不能认定成绩和态度有关. (2)这样分层抽样,会在里面抽6个,里面抽4个, 设为没有人在[60,70)内的事件,则概率即为()1P P A =-3431029130C C =-=.19.经验表明,在室温下,开水冷至到(温水)饮用对身体更有益.某研究人员每隔测量一次开水温度(如下表),经过后的温度为.现给出以下2个函数模型:①25(,01,0)a y kx k R a x =+∈<<≥;②25(,01,0)xy ka k R a x =+∈<<≥,其中a 为温度衰减比例,计算公式为11251()525i n i i y a i Ny =--=∈-∑. 开水温度变化(1)请选择一个恰当的函数模型描述之间的关系,并求出k ; (2)求a 值(a 保留0.01);(3)在室温下,开水至少大约放置多长时间(单位:,保留整数)才能冷至到对身体有益温度?(参考数据:,)【答案】(1)应该选择②,k 的值为60;(2);(3).【解析】(1)若选择①25(,01,0)ay kx k R a x =+∈<<≥,把代入得2585y =≠矛盾;若选择②25(,01,0)x y ka k R a x =+∈<<≥,把0,85x y ==代入,得.所以选择②25(,01,0)x y ka k R a x =+∈<<≥,其中k 的值为60. (2)(3)由(1)(2)知,x 、y 之间的关系为600.9225x y =⨯+, 因为开水冷至到 (温水)饮用对身体更有益, 所以35600.922540x ≤⨯+≤,有,即, 又,得16.621.5x ≤≤,所以在室温下,开水至少大约放置才能冷至到对身体有益温度.20.在关研究表明,正确佩戴安全头盔,规范使用安全带能够将交通事故死亡风险大幅降低,对保护群众生命安全具有重要作用.2020年4月,“一盔一带”安全守护行动在全国各地开展.行动期间,公安交管部门将加强执法管理,依法查纠摩托车和电动自行车骑乘人员不佩戴安全头盔,汽车驾乘人员不使用安全带的行为,助推养成安全习惯.该行动开展一段时间后,某市针对电动自行车骑乘人员是否佩戴安全头盔问题进行调查,在随机调查的1000名骑行人员中,记录其年龄和是否佩戴头盔情况,得到如下的统计图表:(1)估算该市电动自行车骑乘人员的平均年龄; (2)根据所给的数据,完成下面的列联表:(3)根据(2)中的列联表,判断是否有把握认为遵守佩戴安全头盔与年龄有关? 附:,【答案】(1)39;(2)列联表见解析;(3)没有把握. 【解析】(1)该市电动自行车骑行人员平均年龄为 .(2)(3).故而没有的把握认为遵守佩戴安全头盔与年龄有关.21. 2020年春节前后,一场突如其来的新冠肺炎疫情在武汉出现并很快地传染开来(已有证据表明2019年10月、11月国外已经存在新冠肺炎病毒),人传人,传播快,传播广,病亡率高,对人类生命形成巨大危害.在中华人民共和国,在中共中央、国务院强有力的组织领导下,全国人民万众一心抗击、防控新冠肺炎,疫情早在3月底已经得到了非常好的控制(累计病亡人数3869人).然而,国外因国家体制、思想观念与中国的不同,防控不力,新冠肺炎疫情越来越严重.据美国约翰斯·霍普金斯大学每日下午6时公布的统计数据,选取5月6日至5月10日的美国的新冠肺炎病亡人数如下表(其中t 表示时间变量,日期“5月6日”、“5月7日”对应于“t =6"、“t =7",依次下去),由下表求得累计病亡人数与时间的相关系数r =0.98.(1)在5月6日~10日,美国新冠肺炎病亡人数与时间(日期)是否呈现线性相关性?(2)选择对累计病亡人数四舍五入后个位、十位均为0的近似数,求每日累计病亡人数y 随时间t 变化的线性回归方程;(3)请估计美国5月11日新冠肺炎病亡累计人数,请初步预测病亡人数达到9万的日期. 附:回归方程中斜率和截距最小二乘估计公式分别为【答案】(1)是;(2)ˆ184061920yt =+;(3)82160人,5月16日 【解析】(1)每日累计病亡人数与时间的相关系数0.980.7r ≈>, 所以每日病亡累计人数与时间呈现强线性相关性, (2)5天5个时间的均值.5天5个病亡累计人数的均值2355698510070000100766405y ++++=+⨯=.计算5个时间与其均值的差,计算5个累计病亡人数与其均值的差,制作下表:用公式进行计算: , .所以每日累计病亡人数随时间变化的线性回归方程是ˆ184061920yt =+. (3)日期5月11日对应时间,,所以,估计5月11日累计病亡人数是82160. 令,解得15.26t ≥,病亡人数要达到或超过9万,即,对应于5月16日, 因此预测5月16日美国新冠肺炎病亡人数超过9万人.22.2021年,福建、河北、辽宁、江苏、湖北、湖南、广东、重庆8省市将迎来“”新高考模式.“3”指的是:语文、数学、英语,统一高考;“1”指的是:物理和历史,考生从中选一科;“2”指的是:化学、生物、地理和政治,考生从四种中选两种.为了迎接新高考,某中学调查了高一年级1500名学生的选科倾向,随机抽取了100人统计选考科目人数如下表:(Ⅰ)补全列联表;(Ⅱ)将此样本的频率视为总体的概率,随机调查了本校的3名学生.设这3人中选考历史的人数为,求的分布列及数学期望;(Ⅲ)根据表中数据判断是否有的把握认为“选考物理与性别有关”?请说明理由. 参考附表:参考公式:,其中n a b c d =+++.【答案】(Ⅰ)答案见解析;(Ⅱ)分布列见解析,;(Ⅲ)有,理由见解析. 【解析】(Ⅰ)根据题意补全列联表,如下:(Ⅱ)的所有可能取值为0,1,2,3,随机变量服从二项分布, 由题意,学生选考历史的概率为, 且33,10X B ⎛⎫ ⎪⎝⎭, ,()121337441110101000P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()212337189210101000P X C ⎛⎫⎛⎫===⎪ ⎪⎝⎭⎝⎭, , 的分布列为()31010E X =⨯=. (Ⅲ)由表中数据,计算的观测值()210040201030 4.762 3.84150507030k ⨯⨯-⨯=≈>⨯⨯⨯,参照附表知,有的把握认为“选考物理与性别有关”.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章《统计案例》 章末检测
一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.根据如下样本数据:
x 3 4 5 6 7 8 y
4
2.5
-0.5
0.5
-2
-3
得到的回归直线方程为y =b x +a ,则( )
A.a ^>0,b ^<0
B.a ^>0,b ^>0
C.a ^<0,b ^>0
D.a ^<0,b ^<0
2.已知回归方程y ^=b ^x +a ^,其中a ^
=3,且样本点的中心为(1,2),则回归直线方程为( )
A .y ^=x +3
B .y ^=-2x +3
C .y ^=-x +3
D .y ^
=x -3
3.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单
位: t )和年利润z (单位:千元)的影响.对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋯数据作了初步处理,得到下面的散点图及一些统计量的值.
有下列5个曲线类型:
①;y bx a =+②;y c d =+③;y p qlnx =+④12;y k ek x =⑤122,y c x c =+ 则较适宜作为年销售量y 关于年宣传费x 的回归方程的是( ) A.①② B.②③ C.②④ D.③⑤ 4.下列关于K 2的说法正确的是( )
A .K 2在任何相互独立问题中都可以用来检验有关还是无关
B .K 2的值越大,两个事件的相关性就越大
C .K 2是用来判断两个分类变量是否有关系的,只对于两个分类变量适合
D .K 2的观测值k 的计算公式为k =n (ad -bc )
(a +b )(c +d )(a +c )(b +d )
5.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )
表1
A.成绩B.视力
6.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则实验效果与教学措施( )
A.有关
B.无关
C.关系不明确
D.以上都不正确
7.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所
示:
由上表可得回归直线方程y ^=b x +a 中的b =-6,据此模型预计零售价定为15元时,每天的销售量为( )
A .48个
B .56个
C .60个
D .65个
8.下表给出5组数据(),,x y 为选出4组数据使得线性相关程度最大,且保留第1组数据()5,3,--则应去掉( )
A .第2组数据 B.第3组数据 C.第4组数据 D.第5组数据 9.已知x,y 的值如下表所示:
如果y 与x 呈线性相关且回归直线方程为,2
y bx =+
则b 等于( ) A. 12- B. 12 C. 110
- D. 110
10.某商品销售量y (件)与销售价格x (元/件)负相关,则其回归方程可能是( )
A. 10200ˆy
x =-+ B. 10200ˆy x =+ C. 10200ˆy
x =-- D. 10200ˆy x =- 11.根据下面的2×2列联表得到如下4个判断:
①至少有99.9%②至少有99%的把握认为“患肝病与嗜酒有关”;
③在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒有关”;
④在犯错误的概率不超过0.01的前提下认为“患肝病与嗜酒无关”. 其中正确判断的个数为( ) A .0 B .1 C .2
D .3
12. 在第29届北京奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居金牌榜榜首,由
此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见,有网友为此进行了调查,在参加调查的2 548名男性中有1 560名持反对意见,2 452名女性中有1 200名持反对意见,在运用这些数据说明性别对判断“中国进入了世界体育强国之列”是否有关系时,用什么方法最有说服力( )
A .平均数与方差
B .回归直线方程
C .独立性检验
D .概率 二、填空题(本大题共4个小题,每小题5分,共20分,把答案填在题中横线上)
13. 种植小麦的施肥量()x kg 、与产量()y kg 之间的回归直线方程为2504ˆy x =+,当施肥量为50kg 时,预计小麦产量为__________.
14.以下三个命题:
①若两个变量的线性相关性越强,则它们的相关系数的值越接近于1; ②在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高;
③对分类变量X 与Y 的随机变量2K 的观测值k 来说, k 越小,判断“X 与Y 有关系”的把握越大. 其中假命题的序号为________.
15.在2020年元旦期间,某市物价部门对本市五个商场销售的某商品一天的销售量及其价格进行了调查,五个商场的价格x 元和销售量y 件之间的一组数据如下表所示:
通过分析,发现销售量y 与商品的价格x 具有线性相关关系,则销售量y 关于商品的价格x 的线性回归方程为__________.
参考公式: 1
2
2
1
,ˆˆˆn
i i
i n
i
i x y nxy
b
a
y bx x
nx ==-==--∑∑ 16.下表是降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程y ^
=0.7x +0.35,那么表中m 的值为________.
三、解答题(本大题共6小题,共70分,解答时应写出必要的文字说明证明过程或演算步骤) 17.(本小题满分10分)
x与y有如下五组数据,
试分析x与y
18.(本小题满分12分)
有两个分类变量x与y,其一组观测值如下面的2×2列联表所示:
其中a,15-a均为大于50.1的前提下认为x与y之间有关系?
19.(本小题满分12分)
有甲、乙两个班进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下列联表:
.
已知在全部105人中随机抽取1人为优秀的概率为
7
(1)请完成上面的列联表;
(2)根据列联表的数据,能否在犯错误的概率不超过0.05的前提下认为“成绩与班级有关系”?20.(本小题满分12分)
为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
.
已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为
5
(1)请将2×2列联表补充完整;
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为ξ,求ξ的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
21.(本小题满分12分)
PM2.5是指空气中直径小于或等于 2.5微米的颗粒物(也称可入肺颗粒物).为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某一时间段车流量与PM2.5的数据如下表:
时间 周一 周二 周三 周四 周五 车流量x (万辆) 50 51 54 57 58 PM2.5的浓度y (微克/立方米)
69
70
74
78
79
(1)
(2)根据上表数据,用最小二乘法求出y 关于x 的回归直线方程y ^=b ^x +a ^
;
(3)若周六同一时间的车流量是25万辆,试根据(2)中求出的回归直线方程预测此时PM2.5的浓度为多少(保留整数). 22.(本小题满分12分)
在一段时间内,某种商品价格x(万元)和需求量y(t)之间的一组数据如下表:
价格x 1.4 1.6 1.8 2 2.2 需求量
12
10
7
5
3
(1)画出散点图;
(2)求出y 对x 的线性回归方程,并在(1)的图形上画出它的图象;
(3)如果价格定为1.9万元,预测需求量大约是多少.(结果精确到0.01 t ).。