人教A版高中数学必修三:第二章 统计 分层训练变量间的相关关系试卷含答案
高中数学人教A版必修三 第二章 统计 学业分层测评12 Word版含答案.doc
学业分层测评(十二) 用样本的频率分布估计总体分布(建议用时:45分钟)[学业达标]一、选择题1.下列命题正确的是( )A .频率分布直方图中每个小矩形的面积等于相应组的频数B .频率分布直方图的面积为对应数据的频率C .频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D .用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示频率组距,由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.【答案】 C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:第3组的频率和累积频率为( )A.0.14和0.37B.114和1 27C.0.03和0.06 D.314和637【解析】由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.【答案】 A3.如图2-2-8所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为()图2-2-8A.20B.30C.40 D.50【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.【答案】 B4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图2-2-9所示),则该样本的中位数、众数、极差分别是()图2-2-9A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】 A5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2-2-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是()图2-2-10A.45B.50C.55 D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.【答案】 B二、填空题6.200辆汽车通过某一段公路时的时速的频率分布直方图如图2-2-11所示,时速在[50,60)的汽车大约有______辆.图2-2-11【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】607.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2212所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.图2-2-12【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.【答案】9692乙8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2-2-13所示:图2-2-13(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.【解析】由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.【答案】(1)0.004 4(2)70三、解答题9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 【导学号:28750037】图2-2-14【解】 (1)设A 药观测数据的平均数为-x ,B 药观测数据的平均数为-y .由观测结果可得-x =120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,-y =120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得-x>-y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.10.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2-2-15),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.图2-2-15(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【解】 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为: 17+15+9+32+4+17+15+9+3×100%=88%.[能力提升]1.如图2-2-16是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()图2-2-16A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分【解析】由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.【答案】 A2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2-2-17所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图2-2-17【解析】 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一 由题意知样本容量为20,组距为5. 列表如下:观察各选择项的频率分布直方图知选A.法二由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率也分别相等,比较四个选项知A正确,故选A.组距【答案】 A图2-2-183.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.【解析】当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.【答案】 14.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2-2-19所示)图2-2-19解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?【解】(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.。
高中数学人教A版必修三课时作业第2章统计2.3含答案
课时目标
x i
-y i
-∑i =1
n
x i
-x 2
=
∑i =
课时作业
一、选择题
1.下列关系中,属于负相关的是( ) A .父母的身高与子女身高的关系 B .农作物产量与施肥量的关系 C .吸烟与健康的关系 D .数学成绩与物理成绩的关系 答案:C
解析:吸烟有害健康,因此,吸烟与健康之间的关系属于负相关. 2.下列有关线性回归的说法,不正确的是( )
A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系
B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图
C .回归直线方程最能代表观测值x 、y 之间的关系
D .任何一组观测值都能得到具有代表意义的回归直线方程 答案:D
解析:只有所有的数据点都分布在一条直线附近时,才能得到具有代表意义的回归直线. 3.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图(1);对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图(2).由这两个散点图可以判断( )
A .变量x 与y 正相关,u 与v 正相关
B .变量x 与y 正相关,u 与v 负相关
C .变量x 与y 负相关,u 与v 正相关
D .变量x 与y 负相关,u 与v 负相关 答案:C
可以看出广告费支出与销售额之间的总体趋势成一条直线,
.下面是两个变量的一组数据:
234567。
【专业资料】新版高中数学人教A版必修3习题:第二章统计 2.3 含解析
2.3 变量间的相关关系课时过关·能力提升一、基础巩固1.如图所示的两个变量具有相关关系的是( )A.①②B.①③C.②④D.②③2.若有一个回归方程为y ^=2−1.5x,则变量x 每增加1个单位长度时,变量y( ) A.平均增加1.5个单位长度 B.平均增加2个单位长度 C.平均减少1.5个单位长度 D.平均减少2个单位长度y ^=2−1.5x 是关于x 的减函数,因此y 随x 的增加而减少,即排除选项A,B;由于回归方程y ^=2−1.5x 的一次项系数为−1.5,因此变量x 每增加1个单位长度时,变量y 平均减少1.5个单位长度.3.已知x ,y 的取值如下表:从散点图(图略)可以看出y 与x 线性相关,且回归方程为y ^=0.95x +a ^,则a ^=( ) A.3.25 B.2.6 C.2.2D.0(x,y),由取值表可计算x =0+1+3+44=2,y =2.2+4.3+4.8+6.74=4.5,知回归方程为y ^=0.95x +a ^,又经过点(2,4.5),代入得a ^=2.6.4.设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i=1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x −85.71,则下列结论不正确的是( ) A.y 与x 具有正的线性相关关系 B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kgA,∵x 的系数大于0,∴y 与x 具有正的线性相关关系,故正确;对B,由回归直线必过样本中心点(x,y),故B 正确; 对C,由单调性知正确;对D,体重应约为58.79kg,是估计变量,故D 不正确.5.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y 与x 负相关,且y ^=2.347x −6.423; ②y 与x 负相关,且y ^=−3.476x +5.648; ③y 与x 正相关,且y ^=5.437x +8.493; ④y 与x 正相关,且y ^=−4.326x −4.578. 其中一定不正确的结论的序号是( ) A.①② B.②③C.③④D.①④y 有随x 的增大而增大的趋势,负相关指的是y 有随x 的增大而减小的趋势,故不正确的为①④.6.有下列关系:①炼钢时钢水的含碳量与冶炼时间的关系; ②曲线上的点与该点的坐标之间的关系; ③柑橘的产量与气温之间的关系;④森林的同一种树木,其横断面直径与高度之间的关系. 其中具有相关关系的是 .(填序号)炼钢的过程就是一个降低含碳量进行氧化还原的过程,除了与冶炼时间有关外,还要受冶炼温度等其他因素的影响,故具有相关关系.②曲线上的点与该点的坐标之间的关系是一一对应的,即是一种确定性关系.③柑橘的产量除了受气温影响以外,还要受施肥量以及水分等因素的影响,故具有相关关系.④森林的同一种树木,其横断面直径随高度的增加而增加,但是还受树木的疏松及光照等因素的影响,故具有相关关系.7.某考察团对全国10个城市的职工人均工资水平x (单位:千元)与居民人均消费水平y (单位:千元)进行统计调查,y 与x 具有相关关系,回归方程为y ^=0.66x +1.562.若某城市居民人均工资为9 000元,则其居民人均消费水平约为 千元.x=9千元时,y=0.66×9+1.562=7.502..5028.某商店统计了最近6个月某商品的进价x (单位:元)与售价y (单位:元)的对应数据如下:可知y 与x 具有线性相关关系,则x = ,y = ,∑i=16x i 2= ,∑i=16xiyi = ,回归直线方程为 .,也可以利用计算器求得,x =6.5,y =8,∑i=16x i 2=327,∑i=16xiyi =396,回归直线方程为y ^=1.14x +0.59..5 8 327 396 y ^=1.14x +0.599.随着人们经济收入的不断增长,个人购买家庭轿车已不再是一种时尚.车的使用费用,尤其是随着使用年限的增多,所支出的费用到底会增长多少,一直是购车一族非常关心的问题.某汽车销售公司作了一次抽样调查,并统计得出某款车的使用年限x (单位:年)与所支出的总费用y (单位:万元)有如下的数据资料:若由资料知y 对x 成线性相关关系.试求: (1)线性回归方程y ^=b ^x +a ^的回归系数a ^,b ^; (2)估计使用年限为10年时,车的支出总费用是多少?列表:于是b ^=112.3-5×4×590-5×42=12.310=1.23, a ^=y −b ^x =5−1.23×4=0.08.(2)线性回归方程是y ^=1.23x +0.08,当x=10时,y ^=1.23×10+0.08=12.38,即估计使用10年时,车的支出总费用是12.38万元.二、能力提升1.对变量x ,y 有观测数据(x i ,y i )(i=1,2,…,10),得散点图①.对变量u ,v 有观测数据(u i ,v i )(i=1,2,…,10),得散点图②.由这两个散点图可以判断( )图① 图②A.变量x 与y 正相关,u 与v 正相关B.变量x 与y 正相关,u 与v 负相关C.变量x 与y 负相关,u 与v 正相关D.变量x 与y 负相关,u 与v 负相关①知,散点图在从左上角到右下角的带状区域内,则变量x 与y 负相关;由题图②知,散点图在从左下角到右上角的带状区域内,则变量u 与v 正相关.2.某学生课外活动兴趣小组对两个相关变量收集到5组数据如下表:由最小二乘法求得回归方程为y ^=0.67x +54.9,现发现表中有一个数据模糊不清,请推断该数据的值为( ) A.60 B.62 C.68D.68.3由题意可得x =30,代入回归方程得y =75. 设看不清的数为a , 则62+a+75+81+89=75×5, 所以a=68.3.已知x 与y 之间的几组数据如下表:假设根据上表数据所得回归直线方程为y ^=b ^x +a ^.若某同学根据上表中的最后两组数据(5,2)和(6,0)求得的直线方程为y =b′x +a′,则以下结论正确的是( ) A .b ^>b′,a ^>a′B.b ^>b′,a ^<a′C .b ^<b′,a ^<a′D.b ^<b′,a ^>a′由x =72,y =136,得b ^=33-6×72×13691-6×(72)2=−57, a ^=y −b ^x =136−(-57)×72=143.∵b'=-2,a'=12,∴b ^>b′,a′>a ^,故选B.4.已知某工厂在某年每月产品的总成本y (单位:万元)与该月产量x (单位:万件)之间的回归方程为y ^=1.215x +0.974,计算当x =2时,总成本y 的估计值为 .x=2时,总成本y 的估计值y ^=1.215×2+0.974=3.404..404★5.一般来说,一个人脚越长,他的身高就越高.现对10名成年人的脚长x 与身高y 进行测量,得如下数据(单位:cm):作出散点图后,发现样本点散落在一条直线附近.经计算得到一些数据:x =24.5,y =171.5,∑i=110xiyi =42 595,∑i=110x i 2=6 085,10xy =42 017.5,10x 2=6 002.5.某刑侦人员在某案发现场发现一对脚印,量得每个脚印长26.5 cm,则估计案发嫌疑人的身高为 cm ..56.某种产品的广告费支出x (单位:百万元)与销售额y (单位:百万元)之间有如下对应数据:x24568(1)画出散点图;(2)从散点图中判断销售额与广告费支出有什么样的关系?以x对应的数据为横坐标,以y对应的数据为纵坐标,所作的散点图如图所示:(2)从图中可以发现广告费支出与销售额之间具有相关关系,并且当广告费支出由小变大时,销售额也大多由小变大,图中的数据大致分布在某条直线的附近,即x与y成正相关关系.★7.在7块并排、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得到数据列表如下(单位:kg):(1)画出散点图;(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥量为60 kg时,对水稻的产量予以估计;(4)是否施化肥越多产量越高?画出散点图如图:(2)借助计算器列表如下:计算得:b ^=∑i=17x i y i -7x y ∑i=17x i 2-7x 2≈87175-7×30×399.37000-7×302≈4.75, a ^≈399.3-4.75×30≈257.即得线性回归直线方程为y ^=4.75x +257.(3)当施化肥量为60kg 时,可以估计水稻产量为542kg .(4)由y ^=4.75x +257可知,两个随机变量为正相关,因此产量随施用化肥量的增加而增加.但是从实际问题出发考虑,化肥的施用量应当控制在一定的范围内.。
人教新课标A版高中数学必修3第二章统计2.3变量间的相关关系B卷
人教新课标A版高中数学必修3 第二章统计 2.3变量间的相关关系B卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)下列两个变量之间的关系是相关关系的是()A . 角度和它的余弦值B . 正方形的边长与它的面积C . 电压一定时,电流与电阻D . 日照时间与水稻的亩产量2. (2分)已知呈线性相关关系的变量x,y之间的关系如下表所示,则回归直线一定过点()x0.10.20.30.5y 2.11 2.85 4.0810.15A . (0.1,2.11)B . (0.2,2.85)C . (0.3,4.08)D . (0.275,4.7975)3. (2分)设(x1,y1),(x2,y2),…,(xn,yn),是变量x:和y的n个样本点,直线Z是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是()A . x和y正相关B . y和y的相关系数为直线I的斜率C . x和y的相关系数在-1到O之间D . 当n为偶数时,分布在l两侧的样本点的个数一定相同4. (2分)如图所示,图中有5组数据,去掉()组数据后(填字母代号),剩下的4组数据的线性相关性最大.A . AB . CC . DD . E5. (2分)已知x与y之间的一组数据:x0123y m3 5.57已求得关于y与x的线性回归方程为=2.1x+0.85,则m的值为()A . 1B . 0.85C . 0.7D . 0.56. (2分)设有一个回归方程为,变量x增加一个单位时,则()A . y平均增加2.5个单位B . y平均增加2个单位C . y平均减少2.5个单位D . y平均减少2个单位7. (2分)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计两科成绩得到如图所示的散点图(两坐标轴单位长度相同),用回归直线= x+近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A . 线性相关关系较强,的值为3.25B . 线性相关关系较强,的值为0.83C . 线性相关关系较强,的值为-0.87D . 线性相关关系太弱,无研究价值8. (2分)从统计学的角度看,下列关于变量间的关系说法正确的是()A . 人体的脂肪含量与年龄之间没有相关关系B . 汽车的重量和汽车每消耗1L汽油所行驶的平均路程负相关C . 吸烟量与健康水平正相关D . 气温与热饮销售好不好正相关9. (2分)如图,两个变量具有相关关系的图是()A . (1)(2)B . (1)(3)C . (2)(4)D . (2)(3)10. (2分)两个变量x,y与其线性相关系数r有下列说法(1)若r>0,则x增大时,y也相应增大;(2)若r<0,则x增大时,y也相应增大;(3)若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A . ①B . ②③C . ①③D . ①②③11. (2分)(2019·恩施模拟) 下列说法中正确的个数是()①相关系数用来衡量两个变量之间线性关系的强弱,越接近于1,相关性越弱;②回归直线过样本点中心;③相关指数用来刻画回归的效果,越小,说明模型的拟合效果越不好.A . 0B . 1C . 2D . 312. (2分)下列关于残差图的描述错误的是()A . 残差图的纵坐标只能是残差B . 残差图的横坐标可以是编号、解释变量和预报变量.C . 残差点分布的带状区域的宽度越窄残差平方和越小.D . 残差点分布的带状区域的宽度越窄相关指数越小.13. (2分)以模型y=cekx去拟合一组数据时,为了求出回归方程,设z=lny,其变换后得到线性回归方程z=0.3x+4,则c=()A . 0.3B . e0.3C . 4D . e414. (2分)已知一组观测值具有线性相关关系,若对于,求得,则线性回归方程是()A .B .C .D .15. (2分)设(x1 , y1),(x2 , y2),…,(xn , yn)是变量x,y的n个样本点,直线m是由这些样本点通过最小二乘法得到的线性回归直线,以下结论正确的是()A . x和y的相关系数为直线m的斜率B . x和y的相关系数为任意实数C . 当n为偶数时,分布在m两侧的样本点的个数一定相同D . 直线m过点二、填空题 (共5题;共7分)16. (1分) (2018高二下·乌兰月考) 分类变量X和Y的列表如下,则下列说法判断正确的是________.(填序号)①ad-bc越小,说明X与Y的关系越弱;②ad-bc越大,说明X与Y的关系越强;③(ad-bc)2越大,说明X与Y的关系越强;④(ad-bc)2越接近于0,说明X与Y的关系越强.17. (1分)在残差分析中,残差图的纵坐标为________18. (3分)在下列各图中,其中,每个图的来年改革变量具有相关关系的图是________ (把所有正确序号都填上)19. (1分)变量X与Y相对应的一组数据为:(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,是则r1与r2的大的小关系是________20. (1分) (2015高二上·滨州期末) 已知两个具有线性相关关系的变量x与y的几组数据如下表x3456y m4根据上表数据所得线性回归直线方程为 = x+ ,则m=________.三、解答题 (共5题;共25分)21. (5分) (2018高三上·寿光期末) 为研究某种图书每册的成本费(元)与印刷数(千册)的关系,收集了一些数据并作了初步处理,得到了下面的散点图及一些统计量的值.表中, .(附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为,)(1)根据散点图判断:与哪一个更适宜作为每册成本费(元)与印刷数(千册)的回归方程类型?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立关于的回归方程(回归系数的结果精确到0.01);(3)若每册书定价为10元,则至少应该印刷多少千册才能使销售利润不低于78840元?(假设能够全部售出,结果精确到1)22. (5分)(2018·辽宁模拟) 经调查,3个成年人中就有一个高血压,那么什么是高血压?血压多少是正常的?经国际卫生组织对大量不同年龄的人群进行血压调查,得出随年龄变化,收缩压的正常值变化情况如下表:其中:,,(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(的值精确到0.01)(3)若规定,一个人的收缩压为标准值的0.9~1.06倍,则为血压正常人群;收缩压为标准值的1.06~1.12倍,则为轻度高血压人群;收缩压为标准值的1.12~1.20倍,则为中度高血压人群;收缩压为标准值的1.20倍及以上,则为高度高血压人群.一位收缩压为180mmHg的70岁的老人,属于哪类人群?23. (5分) (2019高二下·吉林月考) 某城市理论预测2014年到2018年人口总数(单位:十万)与年份(用表示)的关系如表所示:(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的回归方程;(3)据此估计2019年该城市人口总数.(参考数据:)参考公式:线性回归方程为,其中.24. (5分)(2018·内江模拟) 某企业有甲、乙两套设备生产同一种产品,为了检测两套设备的生产质量情况,随机从两套设备生产的大量产品中各抽取了50件产品作为样本,检测一项质量指标值,若该项质量指标值落在内,则为合格品,否则为不合格品. 表1是甲套设备的样本的频数分布表,图1是乙套设备的样本的频率分布直方图.表1:甲套设备的样本的频数分布表质量指标值[95,100)[100,105)[105,110)[110,115)[115,120)[120,125]频数15181961图1:乙套设备的样本的频率分布直方图(Ⅰ)将频率视为概率. 若乙套设备生产了5000件产品,则其中的不合格品约有多少件;(Ⅱ)填写下面列联表,并根据列联表判断是否有90%的把握认为该企业生产的这种产品的质量指标值与甲、乙两套设备的选择有关;甲套设备乙套设备合计合格品不合格品合计(Ⅲ)根据表1和图1,对两套设备的优劣进行比较.附:.25. (5分) (2017高二下·龙海期中) 二手车经销商小王对其所经营的某一型号二手汽车的使用年数x(0<x≤10)与销售价格y(单位:万元/辆)进行整理,得到如表的对应数据:使用年数246810售价16139.57 4.5(1)试求y关于x的回归直线方程;(参考公式: = , =y﹣)(2)已知每辆该型号汽车的收购价格为w=0.01x3﹣0.09x2﹣1.45x+17.2万元,根据(1)中所求的回归方程,预测x为何值时,小王销售一辆该型号汽车所获得的利润L(x)最大?(利润=售价﹣收购价)参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共7分) 16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分) 21-1、21-2、21-3、22-1、22-2、22-3、23-1、23-2、23-3、24-1、25-1、25-2、。
2020学年高中数学第二章统计2.3变量间的相关关系练习(含解析)新人教A版必修3(最新整理)
2019-2020学年高中数学第二章统计2.3 变量间的相关关系练习(含解析)新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2019-2020学年高中数学第二章统计2.3 变量间的相关关系练习(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2019-2020学年高中数学第二章统计2.3 变量间的相关关系练习(含解析)新人教A版必修3的全部内容。
第16课时变量间的相关关系知识点一变量之间的相关关系与散点图1.下列关系中,属于相关关系的是________.(填序号)①正方形的边长与面积之间的关系;②农作物的产量与施肥量之间的关系;③自由落体中物体下落的距离(h)与时间(t)的关系;④降雪量与交通事故的发生率之间的关系.答案②④解析在①中,正方形的边长与面积之间的关系是函数关系;在②中,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;在③中,自由落体运动中,物体下落的距离(h)与时间(t)满足h=错误!gt2(g为重力加速度),是函数关系;在④中,降雪量与交通事故的发生率之间具有相关关系.2.某个男孩的年龄与身高的统计数据如下表所示.年龄x/岁123456身高y/cm788798108115120(1)画出散点图;(2)判断y与x是否具有线性相关关系.解(1)散点图如图所示.(2)由图知,所有数据点接近一条直线排列,因此,认为y与x有线性相关关系.知识点二回归直线方程的求解与应用3.由一组样本数据(x1,y1),(x2,y2),…,(x n,y n)得到回归直线方程错误!=错误!x+错误!,那么下面说法不正确的是( )A.直线错误!=错误!x+错误!必经过点(错误!,错误!)B.直线错误!=错误!x+错误!至少经过点(x1,y1),(x2,y2),…,(x n,y n)中的一个点C.直线错误!=错误!x+错误!的斜率为错误!D.直线错误!=错误!x+错误!和各点(x1,y1),(x2,y2),…,(x n,y n)的偏差错误!y i-(错误! x i+错误!)]2是该坐标平面上所有直线与这些点的偏差中偏差最小的直线答案B解析因为错误!=错误!,错误!=错误!-错误!错误!,所以直线错误!=错误!x+错误!,必过定点(错误!,错误!),A,C项显然正确,由回归直线方程的推导知D项也正确,只有B项不能确定直线y^=错误!x+错误!可能经过(x1,y1),(x2,y2),…,(x n,y n)中的许多点,也可能都经过或都不经过.4.对具有线性相关关系的变量x和y,测得一组数据如下表所示.若已求得它们的回归直线的斜率为6.5,这条回归直线的方程为________.答案错误!=6.5x+17.5解析由题意可知错误!=错误!=5,错误!=错误!=50.即样本中心为(5,50).设回归直线方程为错误!=6.5x+错误!,∵回归直线过样本中心(错误!,错误!),∴50=6.5×5+错误!,即错误!=17.5,∴回归直线方程为错误!=6.5x+17.5.5.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的回归方程错误!=错误!x+错误!;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤.(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)解(1)散点图如图所示.(2)错误!i y i=3×2.5+4×3+5×4+6×4.5=66.5,错误!=错误!=4.5,错误!=错误!=3.5,错误!错误!=32+42+52+62=86,错误!=错误!=错误!=0.7,错误!=错误!-错误!错误!=3.5-0.7×4.5=0.35.故回归方程为错误!=0.7x+0.35.(3)根据回归方程的预测,现在生产100吨甲产品的生产能耗为0.7×100+0.35=70.35(吨)标准煤,故能耗减少了90-70.35=19.65(吨)标准煤.易错点对相关关系的概念理解错误6.下列变量之间的关系属于相关关系的是( )A.圆的周长和它的半径之间的关系B.价格不变的条件下,商品销售额与销售量之间的关系C.家庭收入愈多,其消费支出也有增长的趋势D.正方形面积和它的边长之间的关系易错分析两个变量间的相关关系不同于函数关系.所谓函数关系,就是其中一个变量(自变量)的每一个值,唯一确定了另一个变量(因变量)的值;而对于相关关系,两个变量间则没有确定的关系,它们的关系相对来说是随机的.由于混淆了这两者之间的关系,而造成了误选.正解 C 因选项A,B,D中的两个变量间都有唯一确定的关系,因而它们都是函数关系;而选项C中家庭收入会对消费支出产生一定的影响,但高收入未必有高消费,因而选项C中的关系才是相关关系.故选C.一、选择题1.下列两个变量之间的关系不具有相关关系的是( )A.小麦产量与施肥量B.球的体积与表面积C.蛋鸭产蛋个数与饲养天数D.甘蔗的含糖量与生长期的日照天数答案B解析球的体积与表面积之间是函数关系,不是相关关系.2.已知x,y之间的一组数据:x2468y1537则y与x的线性回归方程错误!=错误!x+错误!必过点()A.(20,16) B.(16,20) C.(4,5) D.(5,4)答案D解析x,y的两组数据的平均数分别为5,4.故回归直线必过点(5,4).故选D.3.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(错误!,错误!)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案D解析错误!为正数,所以两变量具有正的线性相关关系,故A正确;B,C显然正确;若该大学某女生身高为170 cm,则可估计其体重在58.79 kg左右.4.工人工资y(元)与劳动生产率x(千元)的相关关系的回归直线方程为错误!=50+80x,下列判断正确的是( )A.劳动生产率为1000元时,工人工资为130元B.劳动生产率提高1000元时,工人工资平均提高80元C.劳动生产率提高1000元时,工人工资平均提高130元D.当月工资为250元时,劳动生产率为2000元答案B解析回归直线斜率为80,所以x每增加1,y平均增加80,即劳动生产率提高1000元时,工人工资平均提高80元.5.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程错误!=错误!x+错误!,其中错误!=0.76,错误!=错误!-错误! x.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元 B.11.8万元C.12.0万元 D.12.2万元答案B解析先求错误!,再利用回归直线方程预测.由题意知,错误!=错误!=10,错误!=错误!=8,∴错误!=8-0.76×10=0.4.∴当x=15时,错误!=0.76×15+0.4=11.8(万元).二、填空题6.正常情况下,年龄在18岁到38岁的人,体重y(kg)对身高x(cm)的回归方程为错误!=0.72x-58.2,张红同学(20岁)身高178 cm,她的体重应该在______ kg左右.答案69.96解析用回归方程对身高为178 cm的人的体重进行预测,当x=178时,错误!=0.72×178-58.2=69.96(kg).7.假设学生在初中的英语成绩和高一英语成绩是线性相关的.现有10名学生的初中英语成绩(x)和高一英语成绩(y)如下:由此得到的回归直线的斜率约为1.22,则回归方程为________.答案错误!=1.22x-14.32解析将错误!=71,错误!=72.3,错误!=1.22,代入错误!=错误!-错误!错误!,得错误!=72.3-1.22×71=-14.32.8.某人对一个地区人均工资x与该地区人均消费y进行统计调查得y与x具有相关关系,且回归直线方程为错误!=0.66x+1.562(单位:千元),若该地区人均消费水平为7.675,估计该地区人均消费额占人均工资收入的百分比约为________.(精确到0.1%)答案82.9%解析由题意7.675=0.66x+1.562,解得x=9.262,该城市人均消费额占人均工资收入的百分比约为7.675÷9.262=82.9%.三、解答题9.某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:(1)求y关于t的线性回归方程;(2)利用(1)中的回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2020年农村居民家庭人均纯收入.解(1)根据数据,可知,错误!=错误!=4,错误!=错误!=4.3,由错误!=错误!,得错误!=0.5,错误!=错误!-错误!错误!=4.3-0.5×4=2.3,所以y关于t的线性回归方程为错误!=0.5t+2.3.(2)因为b=0.5>0,所以2009年至2015年该地区农村居民家庭人均纯收入稳步增长,当t=12时,错误!=0.5×12+2.3=8.3,所以预测该地区2020年农村居民家庭人均纯收入为8300元.10.有人统计了同一个省的6个城市某一年的人均国民生产总值(即人均GDP)和这一年各城市患白血病的儿童数,如下表:(1)画出散点图,并判定这两个变量是否具有线性相关关系;(2)通过计算可知这两个变量的回归方程为错误!=23.25x+102.15,假如一个城市的人均GDP为12万元,那么可以断言,这个城市患白血病的儿童一定超过380人,请问这个断言是否正确?解(1)散点图如下:根据散点图可以看出,在6个点中,虽然第一个点离这条直线较远,但其余5个点大致分布在这条直线的附近,所以这两个变量具有线性相关关系.(2)上述断言是错误的,将x=12代入错误!=23.25x+102.15得错误!=23.25×12+102.15=381.15〉380,但381.15是对该城市人均GDP为12万元的情况下所作的一个估计,该城市患白血病的儿童可能超过380人,也可能低于380人.。
高中数学人教A版必修三 第二章 统计 学业分层测评11 Word版含答案
学业分层测评(十一)分层抽样(建议用时:45分钟)[学业达标]一、选择题1.某地区为了了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽1100的居民家庭进行调查,这种抽样是() A.简单随机抽样B.系统抽样C.分层抽样D.分类抽样【解析】由于居民按行业可分为不同的几类,符合分层抽样的特点.【答案】 C2.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6【解析】抽样比例为40800=120,故各层中依次抽取的人数为160×120=8(人),320×120=16(人),200×120=10(人),120×120=6(人).故选D.【答案】 D3.在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层抽样的方法对球进行抽样,则应抽红球( )A .33个B .20个C .5个D .10个【解析】 设应抽红球x 个,则1001 000=x50,则x =5. 【答案】 C4.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图2-1-1A .200,20B .100,20C .200,10D .100,10【解析】 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.【答案】 A5.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到的抽样方法有()①简单随机抽样;②系统抽样;③分层抽样.A.②③B.①③C.③D.①②③【解析】由三种抽样方法的特点.可知,选D.【答案】 D二、填空题6.某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.【解析】应在丙专业抽取的学生人数是400×40=16.150+150+400+300【答案】167.某校共有2 000名学生,各年级男、女生人数如表所示.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为_____________.【解析】依题意可知三年级学生人数为500,即总体中各年级的人数比例为3∶3∶2,故用分层抽样抽取三年级学生人数为64×28=16.【答案】168.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15三、解答题9.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?【导学号:28750034】【解】 (1)按老年、中年、青年分层抽样, 抽取比例为402 000=150.故老年人,中年人,青年人各抽取4人,12人,24人, (2)按管理、技术开发、营销、生产进行分层,用分层抽样,抽取比例为252 000=180,故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. 10.某市两所高级中学联合在暑假组织全体教师外出旅游,活动分为两条线路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占42.5%,高二教师占47.5%,高三教师占10%.参加华东五市游的教师占参加活动总人数的14,且该组中,高一教师占50%,高二教师占40%,高三教师占10%.为了了解各条线路不同年级的教师对本次活动的满意程度,现用分层抽样的方法从参加活动的全体教师中抽取一个容量为200的样本.试确定:(1)参加长白山之旅的高一教师、高二教师、高三教师分别所占的比例;(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.【解】 (1)设参加华东五市游的人数为x ,参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为a ,b ,c ,则有x ·40%+3xb 4x=47.5%,x ·10%+3xc4x =10%,解得b =50%,c =10%.故a =100%-50%-10%=40%,即参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为40%,50%,10%.(2)参加长白山之旅的高一教师应抽取人数为200×34×40%=60; 抽取的高二教师人数为200×34×50%=75; 抽取的高三教师人数为200×34×10%=15.[能力提升]1.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10【解析】 若设高三学生数为x ,则高一学生数为x2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为 800100=8.【答案】 A2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为()A.60 B.80C.120 D.180【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为13.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收=900(份),则15~16岁回收问卷份数为:x=900-的问卷总数为30013120-180-240=360(份).=120(份),故选∴在15~16岁学生中抽取的问卷份数为360×13C.【答案】 C3.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为________.【解析】总体容量N=36.当样本容量为n 时,系统抽样间隔为36n ∈N *,所以n 是36的约数; 分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n 6、n 3、n2,所以n 应是6的倍数,所以n =6或12或18或36.当样本容量为n +1时,总体中先剔除1人时还有35人,系统抽样间隔为35n +1∈N *,所以n 只能是6.【答案】 64.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?【解】 (1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.因为样本容量=120,总体个数=500+3 000+4 000=7 500,则抽样比:1207 500=2125,所以有500×2125=8,3 000×2125=48,4 000×2125=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:①分层:分为教职员工、初中生、高中生,共三层.②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8、48,64.③各层分别按简单随机抽样或系统抽样的方法抽取样本.④综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3 000个号签,费时费力,因此采用随机数法抽取样本,步骤是:①编号:将3 000份答卷都编上号码:0001,0002,0003, (3000)②在随机数表上随机选取一个起始位置.③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.(3)由于4 000÷64=62.5不是整数,则应先使用简单随机抽样从4 000名学生中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,217,333,395,457,…,3 929.。
人教A版高中数学必修三:第二章 统计 分层训练 用样本的频率分布估计总体分布试卷含答案
分层训练·进阶冲关A组基础练(建议用时20分钟)1.画样本频率分布直方图时,决定组数的正确方法是( C )A.任意确定B.一般分为5~12组C.由决定D.根据经验法则,灵活掌握2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为 ( B )A.4B.8C.12D.163.一个容量为35的样本数据,分组后,组距与频数如下[5,10),5;[10,15), 12;[15,20),7;[20,25),5;[25,30),4;[30,35),2.则样本在区间[20,+∞)上的频率约为( C )A.20%B.69%C.31%D.27%4.如图是某公司10个销售店某月销售某产品数量(单位台)的茎叶图,则数据落在区间[22,30)内的频率为( B )A.0.2B.0.4C.0.5D.0.65.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n的值( B )A.700B.800C.850D.9006.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示A.75B.80C.85D.907.如图是100位居民月平均用水量的频率分布直方图,则月平均用水量为[2,2.5)范围内的居民数有25人.8.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50),得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为6.9.已知样本7 10 14 8 7 12 11 10 8 1013 10 8 11 8 9 12 9 13 12那么这组样本数据落在范围8.5~11.5内的频率为0.4.10.空气质量指数(Air Quality Ind,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为146.(该年为365天)11.某车间20名工人年龄数据如下表(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;【解析】(1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下12.张掖市旅游局为了了解大佛寺景点在大众中的熟知度,随机对15~65岁的人群抽取n人,问题是“大佛寺是几A级旅游景点?”统计结果如下图表.(1)分别求出a,b,x,y 的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人.【解析】(1)由频率表中第4组数据可知,第4组总人数为=25,结合频率分布直方图可知n==100,所以a=100×0.01×10×0.5=5, b=100×0.03×10×0.9=27,x==0.9,y==0.2.(2)因为第2,3,4组回答正确的共有54人,所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为第2组×6=2(人);第3组×6=3(人);第4组×6=1(人).B组提升练(建议用时20分钟)13.AQI是表示空气质量的指数,AQI越小,表明空气质量越好,当AQI不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI的统计数据,图中点A表示4月1日的AQI为201.则下列叙述不正确的是( C )A.这12天中有6天空气质量为“优良”B.这12天中空气质量最好的是4月9日C.这12天的AQI的中位数是90D.从4日到9日,空气质量越越好14.某公司10个销售店某月销售某产品数量(单位台)的茎叶图如下分组成[10,20),[20,30),[30,39]时,所作的频率分布直方图是( B )15.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm的株数为24.16.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为32.17.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.(1)甲、乙两个网站点击量的极差分别是多少? (2)甲网站点击量在[10,40]间的频率是多少? (3)甲、乙两网站哪个更受欢迎?并说明理由.【解析】(1)甲网站的极差为73-8=65,乙网站的极差为71-5=66.(2)=.(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况看,甲网站更受欢迎.18.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表(1)作出这些数据的频率分布直方图;(2)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 【解析】(1)样本数据的频率分布直方图如图所示(2)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.C组培优练(建议用时15分钟)19.下图是2017年第一季度五省GDP情况图,则下列陈述正确的是( B )①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④20.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位小时)如下248 256 232 243 188 268 278 266 289 312 274 296 288 302 295 228 287 217 329 283(1)完成下面的频率分布表,并作出频率分布直方图;(2)【解析】(1)频率分布表及频率分布直方图如下所示(2)由题意可得8×(0.30+0.10+0.05)=3.6(万台),所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.关闭Word文档返回原板块。
高中数学人教A版必修三 第二章 统计 学业分层测评13 Word版含答案
用样本的数字特征估计总体的数字特征一、选择题1.已知一组数据x 1x 2x 3x 4x 5的平均数是x -=2方差是13那么另一组数据3x 1-23x 2-23x 3-23x 4-23x 5-2的平均数和方差分别为( )A .213 B .21 C .413D .43【解析】 平均数为x -′=3x --2=3×2-2=4方差为s ′2=9s 2=9×13=3【答案】 D2.为了解某校高三学生的视力情况随机地抽查了该校100名高三学生的视力情况得到频率分布直方图如图2-2-26所示.由于不慎将部分数据丢失但知道前4组的频数成等比数列后6组的频数成等差数列设最大频率为a 视力在46到50之间的学生数为b 则ab 的值分别为( )图2-2-26A .02778B .02783C .2778D .2783【解析】 由题意45到46之间的频率为00946到47之间的频率为027后6组的频数成等差数列设公差为d 则6×027+15d =1-001-003-009∴d =-005∴b =(027×4+6d )×100=78a =027 【答案】 A 二、填空题6.一个样本数据按从小到大的顺序排列为:131419x 23272831中位数为22则x =________.【解析】 由题意知x +232=22则x =21 【答案】 217.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图2-2-27所示则平均分数较高的是________成绩较为稳定的是________.图2-2-27【解析】 x -甲=70x -乙=68s 2甲=15×(22+12+12+22)=2s 2乙=15×(52+12+12+32)=72【答案】 甲 甲8.已知样本91011xy 的平均数是10标准差为2则xy =________ 【28750040】【解析】 由平均数得9+10+11+x +y =50∴x +y =20又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=(2)2×5=10得x2+y2-20(x+y)=-192(x+y)2-2xy-20(x+y)=-192∴xy=96【答案】96三、解答题9.从高三抽出50名学生参加数学竞赛由成绩得到如图2-2-28的频率分布直方图.图2-2-28由于一些数据丢失试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.【解】(1)由众数的概念可知众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求所以众数应为75由于中位数是所有数据中的中间值故在频率分布直方图中体现的是中位数的左右两边频数应相等即频率也相等从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0004×10+0006×10+002×10=004+006+02=03∴前三个小矩形面积的和为03而第四个小矩形面积为003×10=0303+03>05∴中位数应约位于第四个小矩形内.设其底边为x高为003∴令003x=02得x≈67故中位数应约为70+67=767(2)样本平均值应是频率分布直方图的“重心”即所有数据的平均值取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0004×10)+55×(0006×10)+65×(002×10)+75×(003×10)+85×(0021×10)+95×(0016×10)=7365 10.对甲、乙两名自行车赛手在相同条件下进行了6次测试测得他们的最大速度(单位:m/s)的数据如下:甲273830373531乙332938342836(1)画出茎叶图由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差并判断选谁参加比赛比较合适?【解】(1)画茎叶图如下:中间数为数据的十位数.从茎叶图上看甲、乙的得分情况都是分布均匀的只是乙更好一些.乙发挥比较稳定总体情况比甲好.(2) x -甲=27+38+30+37+35+316=33 x -乙=33+29+38+34+28+366=33 s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈1567s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈1267甲的极差为11乙的极差为10综合比较以上数据可知选乙参加比赛较合适.[能力提升]1.有一笔统计资料共有11个数据如下(不完全以大小排列):24455678911x 已知这组数据的平均数为6则这组数据的方差为( )A .6B . 6C .66D .65【解析】 ∵x -=111(2+4+4+5+5+6+7+8+9+11+x )=111(61+x )=6∴x =5方差为:s 2=42+22+22+12+12+02+12+22+32+52+1211=6611=6 【答案】 A2.将某选手的9个得分去掉1个最高分去掉1个最低分7个剩余分数的平均分为91现场作的9个分数的茎叶图后来有1个数据模糊无法辨认在图2-2-29中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1图2-2-29则7个剩余分数的方差为( )A 1169B .367C .36D .677【解析】 根据茎叶图去掉1个最低分871个最高分99 则17[87+94+90+91+90+(90+x )+91]=91 ∴x =4∴s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=367【答案】 B3.若40个数据的平方和是56平均数是22则这组数据的方差是________标准差是________.【解析】 设这40个数据为x i (i =12…40)平均数为x 则s 2=140×[(x 1-x -)2+(x 2-x -)2+…+(x 40-x -)2]=140[x 21+x 22+…+x 240+40x 2-2x (x 1+x 2+…+x 40)]=140⎣⎢⎡⎦⎥⎤56+40×⎝ ⎛⎭⎪⎫222-2×22×40×22=140×⎝ ⎛⎭⎪⎫56-40×12=09 ∴s =0.9=910=31010 【答案】 09310104.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:[005)4;[051)8;[115)15;[152)22;[225)25;[253)14;[335)6;[354)4;[445)2(1)列出样本的频率分布表;(2)画出频率分布直方图并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t 的标准若超出标准加倍收费当地政府说85%以上的居民不超过这个标准这个解释对吗?为什么?【解】 (1)频率分布表[225)25025[253)14014[335)6006[354)4004[445)2002合计1001(2)频率分布直方图如图:众数:225中位数:202平均数:202(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%即大约有12%的居民月用水量在3t以上88%的居民月用水量在3t 以下因此政府的解释是正确的.。
2019人教A版高中数学必修三练习 第二章统计分层训练进阶冲关2.3变量间的相关关系(含答案)
分层训练·进阶冲关A组基础练(建议用时20分钟)1.下列四个选项中,关于两个变量所具有的相关关系描述正确的是( D )A.圆的面积与半径具有相关关系B.纯净度与净化次数不具有相关关系C.作物的产量与人的耕耘是负相关关系D.学习成绩与学习效率是正相关关系2.某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价x(元/人)负相关,则其回归方程可能是( A )A.=-80x+1 600B.=80x+1 600C.=-80x-1 600D.=80x-1 6003.具有线性相关关系的变量x,y的一组数据如表所示.若根据表中数据得出y与x的回归直线方程为=3x-,则m的值是 ( A )A.4B.C.5.5D.64.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且=2.347x-6.423;②y与x负相关且=-3.476x+5.648;③y与x正相关且=5.437x+8.493;④y与x正相关且=-4.326x-4.578.其中一定不正确的结论的序号是( D )A.①②B.②③C.③④D.①④5.为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程=x+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( A )A.1.795万元B.2.555万元C.1.915万元D.1.945万元6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )A.-1B.0C.D.17.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加0.245万元.8.一位母亲记录了儿子3~9岁的身高,数据略,建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是③.①身高一定是145.83 cm ②身高145.83 cm以上③身高在145.83 cm左右④身高在145.83 cm以下9.已知x与y之间的一组数据:则y与x的线性回归方程=x+必过点(1.5,4).10.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:18由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为68度.11.为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:求回归直线方程=x+.【解析】=176,=75,-===0.4,=-=4.6,所以=0.4x+4.6.12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)求回归直线方程=x+,其中=-20,=-.(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【解析】(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.=×(90+84+83+80+75+68)=80.=+20=80+20×8.5=250,=-20x+250.(2)工厂获得利润z=(x-4)y=-20x2+330x-1 000,由二次函数知识可知当x=时,z max=361.25(元).故该产品的单价应定为8.25元.B组提升练(建议用时20分钟)13.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两个数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两个数据后,重新求得回归直线的斜率为1.4,那么当x=6时,的值为( A )A.9.6B.10C.10.6D.9.414.已知x与y之间的几组数据如表:假设根据上表数据所得线性回归方程为=x+,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( C )A.>b′,>a′B.>b′,<a′C.<b′,>a′D.<b′,<a′15.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程=x+中的≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为46件.16.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n= 10.17.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:(1)在给定的坐标系中画出表中数据的散点图:(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线.(3)试预测加工10个零件需要多少时间?注:=,=-.【解析】(1)散点图如图:(2)由表中数据得:x i y i=52.5,=3.5,=3.5,=54,所以==0.7,所以=-=1.05,所以=0.7x+1.05.回归直线如图中所示.(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时).所以预测加工10个零件需要8.05小时.18.根据“2015年国民经济和社会发展统计公报”中公布的数据,从2011年到2015年,我国的第三产业在GDP中的比重如下:(1)在所给坐标系中作出数据对应的散点图.(2)建立第三产业在GDP中的比重y关于年份代码x的回归方程.(3)按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重.附:回归直线=+x的斜率和截距的最小二乘估计分别为=,=-.【解析】(1)数据对应的散点图如图所示.(2)=3,=47.06,===1.5,=-=42.56,所以回归直线方程为=1.5x+42.56.(3)代入2018年的年份代码x=8,得=1.5×8+42.56=54.56,所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP 中的比重将达到54.56%.C 组 培优练(建议用时15分钟)19.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y 与x 具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为( D )A.66%B.67%C.79%D.84%20.一家商场为了确定营销策略,进行了四次投入促销费用x 和商场实际销售额的试验,得到如下数据.(1)在下面的直角坐标中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性.(2)求出x,y之间的回归直线方程=x+.(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?【解析】(1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.(2)==4,==250,(x i-)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2=4+1+1+4=10,(x i-)(y i-)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.==70,=-=250-70×4=-30.故所求的回归直线方程为=70x-30.(3)令70x-30≥600,即x≥=9(万元),即若该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.关闭Word文档返回原板块。
人教A版高中数学必修三:第二章 统计 分层训练随 机 抽 样试卷含答案
分层训练·进阶冲关A组基础练(建议用时20分钟)1.某校有40个班,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是( C )A.40B.50C.120D.1502.为了解600名学生的视力情况,采用系统抽样的方法,从中抽取容量为20的样本,则需要分成几个小组进行抽取( A )A.20B.30C.40D.503.某客运公司有200辆客车,为了解客车的耗油情况,现采用系统抽样的方法按1∶10的比例抽取一个样本进行检测,将客车依次编号为1,2, (200)则其中抽取的4辆客车的编号可能是 ( C )A.3,23,63,102B.31,61,87,127C.103,133,153,193D.57,68,98,1084.下列抽样中,适合用抽签法的是 ( B )A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验5.某大学数学系共有本科生1 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为 ( B )A.80B.40C.60D.206.高三某班有学生56人, 现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( C )A.13B.17C.19D.217.为了了解1 203名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,现采用选取的号码间隔一样的系统抽样方法确定所选取的样本,则抽样间隔k= 30.8.一个总体分为A,B两层,用分层抽样的方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为120.9.某校高三年级共有30个班,学校心理咨询师为了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取6个班进行调查,若抽到的编号之和为87,则抽到的最小编号为2.10.某学校三个兴趣小组的学生人数分布如下表(每名学生只参加一个小组)(单位人).参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为30.11.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样的方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?【解析】(1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目.所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)应抽取大于40岁的观众×5=×5=3(名).12.某批产品共有1 564件,产品按出厂顺序编号,号码从1到1 564,检测员要从中抽取15件产品做检测,请你给出一个系统抽样方案.【解析】(1)先从1 564件产品中,用简单随机抽样的方法抽出4件产品,将其剔除.(2)将余下的1 560件产品编号1,2,3,…,1 560.(3)取k==104,将总体平均分为15组,每组含104个个体.(4)从第一组,即1号到104号利用简单随机抽样法抽取一个编号s.(5)按编号把s,104+s,208+s,…,1 456+s共15个编号选出,这15个编号所对应的产品组成样本.B组提升练(建议用时20分钟)13.将参加夏令营的600名学生编号为001,002,…,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300住在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600住在第Ⅲ营区,三个营区被抽中的人数依次为( B )A.26,16,8B.25,17,8C.25,16,9D.24,17,914.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,企业统计员制作了如下的统计表格A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是( B )A.80B.800C.90D.90015.已知某种型号的产品共有N件,且40<N<50,现需要利用系统抽样抽取样本进行质量检测,若样本容量为7,则不需要剔除;若样本容量为8,则需要剔除1个个体,则N= 49.16.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为50;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为 1 015小时.17.某中学共有学生2 000名,各年级男、女生人数如下表(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应从高三抽取多少名?【解析】(1)因为=0.19,所以x=380.(2)高三学生人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,则应从高三抽取×48=12(名).18.为了适应新高考改革,尽快推行不分文理科教学,对比目前文理科学生考试情况进行分析,决定从80名文科同学中抽取10人,从300名理科同学中抽取50人进行分析.由于本题涉及文科生和理科生的混合抽取,你能选择合适的方法设计抽样方案吗?试一试.【解析】文科生抽样用抽签法,理科生抽样用随机数表法,抽样过程如下(1)先抽取10名文科同学①将80名文科同学依次编号为1,2,3, (80)②将号码分别写在形状、大小均相同的纸片上,制成号签;③把80个号签放入一个不透明的容器中,搅拌均匀,每次从中不放回地抽取一个号签,连续抽取10次;④与号签上号码相对应的10名同学的考试情况就构成一个容量为10的样本.(2)再抽取50名理科同学①将300名理科同学依次编号为001,002, (300)②从随机数表中任选一数字作为开始数字,任选一方向作为读数方向,比如从随机数表的第4行第1列的数字1开始向右读(如图所示).每次读取三位,凡不在001~300范围内以及重复的数都跳过去,得到号码125,210,142,188,264,…;③这50个号码所对应的同学的考试情况就构成一个容量为50的样本.C组培优练(建议用时15分钟)19.我国古代数学名著《九章算术》有“米谷粒分”题发仓募粮,所募粒中秕不百三则收之(不超过3%),现抽样取米一把,取得235粒米中夹秕n粒,若这批米合格,则n不超过 ( B )A.6粒B.7粒C.8粒D.9粒20.某合资企业有150名职工,要从中随机抽出20人去参观学习.请用抽签法和随机数法进行抽取,并写出过程.(随机数表见课本附表)【解析】方法一(抽签法)先把150名职工编号1,2,3,...,150,把编号分别写在相同的小纸片上,揉成小球,放入一个不透明的袋子中,充分搅拌均匀后,从中逐个不放回地抽取20个小球,这样就抽出了去参观学习的20名职工.方法二(随机数法)第一步,先把150名职工编号001,002,003, (150)第二步,从随机数表中任选一个数,如第10行第4列数0.第三步,从数字0开始向右连续读数,每3个数字为一组,在读取的过程中,把大于150的数和与前面重复的数去掉,这样就得到20个号码如下086,027,079,050,074,146,148,093,077,119,022,025,042,045,128,121, 038,130,125,033.(答案不唯一)关闭Word文档返回原板块。
高中数学人教A版必修三 第二章 统计 学业分层测评13 Word版含答案
学业分层测评(十三)用样本的数字特征估计总体的数字特征(建议用时:45分钟)[学业达标]一、选择题1.(2015·合肥检测)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图2-2-24所示,则( )图2-2-24A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差【解析】 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.【答案】 C2.十八届三中全会指出要改革分配制度,要逐步改变收入不平衡的现象.已知数据x1,x2,x3,…,x n是上海普通职工n(n≥3,n∈N*)个人的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入x n+1,则这n+1个数据中,下列说法正确的是()A.年收入平均数大大增大,中位数一定变大,方差可能不变B.年收入平均数大大增大,中位数可能不变,方差变大C.年收入平均数大大增大,中位数可能不变,方差也不变D.年收入平均数可能不变,中位数可能不变,方差可能不变【解析】插入大的极端值,平均数增加,中位数可能不变,方差也因为数据更加分散而变大.【答案】 B3.如图2-2-25是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,甲、乙两人这几场比赛得分的平均数分别为x-甲,x-乙;标准差分别是s甲,s乙,则有()图2-2-25A.x-甲>x-乙,s甲>s乙B.x-甲>x-乙,s甲<s乙C.x-甲<x-乙,s甲>s乙D.x-甲<x-乙,s甲<s乙【解析】 观察茎叶图可大致比较出平均数与标准差的大小关系,或者通过公式计算比较.【答案】 C4.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x -=2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13 B .2,1 C .4,13D .4,3【解析】 平均数为x -′=3x --2=3×2-2=4,方差为s ′2=9s 2=9×13=3.【答案】 D5.为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如图2-2-26所示.由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a ,视力在4.6到5.0之间的学生数为b ,则a ,b 的值分别为( )图2-2-26A .0.27,78B .0.27,83C .2.7,78D .2.7,83【解析】 由题意,4.5到4.6之间的频率为0.09,4.6到4.7之间的频率为0.27,后6组的频数成等差数列,设公差为d ,则6×0.27+15d =1-0.01-0.03-0.09,∴d =-0.05.∴b =(0.27×4+6d )×100=78,a =0.27. 【答案】 A 二、填空题6.一个样本数据按从小到大的顺序排列为:13,14,19,x ,23,27,28,31,中位数为22,则x =________.【解析】 由题意知x +232=22,则x =21. 【答案】 217.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图2-2-27所示,则平均分数较高的是________,成绩较为稳定的是________.图2-2-27【解析】 x -甲=70,x -乙=68,s 2甲=15×(22+12+12+22)=2,s 2乙=15×(52+12+12+32)=7.2.【答案】甲甲8.已知样本9,10,11,x,y的平均数是10,标准差为2,则xy=________. 【导学号:28750040】【解析】由平均数得9+10+11+x+y=50,∴x+y=20.又由(9-10)2+(10-10)2+(11-10)2+(x-10)2+(y-10)2=(2)2×5=10,得x2+y2-20(x+y)=-192,(x+y)2-2xy-20(x+y)=-192,∴xy=96.【答案】96三、解答题9.从高三抽出50名学生参加数学竞赛,由成绩得到如图2-2-28的频率分布直方图.图2-2-28由于一些数据丢失,试利用频率分布直方图求:(1)这50名学生成绩的众数与中位数;(2)这50名学生的平均成绩.【解】(1)由众数的概念可知,众数是出现次数最多的数.在直方图中高度最高的小长方形的底边中点的横坐标即为所求,所以众数应为75.由于中位数是所有数据中的中间值,故在频率分布直方图中体现的是中位数的左右两边频数应相等,即频率也相等,从而就是小矩形的面积和相等.因此在频率分布直方图中将所有小矩形的面积一分为二的垂直于横轴的直线与横轴交点的横坐标所对应的成绩即为所求.∵0.004×10+0.006×10+0.02×10=0.04+0.06+0.2=0.3,∴前三个小矩形面积的和为0.3.而第四个小矩形面积为0.03×10=0.3,0.3+0.3>0.5,∴中位数应约位于第四个小矩形内.设其底边为x,高为0.03,∴令0.03x=0.2得x≈6.7,故中位数应约为70+6.7=76.7.(2)样本平均值应是频率分布直方图的“重心”,即所有数据的平均值,取每个小矩形底边的中点的横坐标乘以每个小矩形的面积求和即可.∴平均成绩为45×(0.004×10)+55×(0.006×10)+65×(0.02×10)+75×(0.03×10)+85×(0.021×10)+95×(0.016×10)=73.65.10.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?【解】(1)画茎叶图如下:中间数为数据的十位数.从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些.乙发挥比较稳定,总体情况比甲好.(2) x -甲=27+38+30+37+35+316=33. x -乙=33+29+38+34+28+366=33. s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,选乙参加比赛较合适.[能力提升]1.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为( )A .6B . 6C .66D .6.5【解析】 ∵x -=111(2+4+4+5+5+6+7+8+9+11+x )=111(61+x )=6,∴x =5.方差为:s 2=42+22+22+12+12+02+12+22+32+52+1211=6611=6. 【答案】 A2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图2-2-29中以x 表示:89⎪⎪⎪7 74 0 1 0 x 9 1图2-2-29则7个剩余分数的方差为( )A.1169 B .367 C .36D .677【解析】 根据茎叶图,去掉1个最低分87,1个最高分99, 则17[87+94+90+91+90+(90+x )+91]=91, ∴x =4.∴s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=367.【答案】 B3.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________.【解析】 设这40个数据为x i (i =1,2,…,40),平均数为x . 则s 2=140×[(x 1-x -)2+(x 2-x -)2+…+(x 40-x -)2]=140[x 21+x 22+…+x 240+40x 2-2x (x 1+x 2+…+x 40)]=140⎣⎢⎡⎦⎥⎤56+40×⎝ ⎛⎭⎪⎫222-2×22×40×22=140×⎝ ⎛⎭⎪⎫56-40×12 =0.9. ∴s =0.9=910=31010.【答案】 0.9 310104.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5),2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t 的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?【解】(1)频率分布表(2)频率分布直方图如图:众数:2.25,中位数:2.02,平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t以上,88%的居民月用水量在3t以下,因此政府的解释是正确的.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分层训练·进阶冲关
A组基础练(建议用时20分钟)
1.下列四个选项中,关于两个变量所具有的相关关系描述正确的是
( D )
A.圆的面积与半径具有相关关系
B.纯净度与净化次数不具有相关关系
C.作物的产量与人的耕耘是负相关关系
D.学习成绩与学习效率是正相关关系
2.某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价x(元/人)负相关,则其回归方程可能是( A )
A.=-80x+1 600
B.=80x+1 600
C.=-80x-1 600
D.=80x-1 600
3.具有线性相关关系的变量x,y的一组数据如表所示.若根据表中数据得出y 与x的回归直线方程为=3x-,则m的值是( A )
A.4
B.
C.5.5
D.6
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①②
B.②③
C.③④
D.①④
5.为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表
根据上表可得回归直线方程=x+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约为( A )
A.1.795万元
B.2.555万元
C.1.915万元
D.1.945万元
6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的
散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1
B.0
C.
D.1
7.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加0.245万元.
8.一位母亲记录了儿子3~9岁的身高,数据略,建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是
③.
①身高一定是145.83 cm ②身高145.83 cm以上
③身高在145.83 cm左右④身高在145.83 cm以下
9.已知x与y之间的一组数据
则y与x必过点(1.5,4).
10.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表
由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为68度.
11.为了研究男羽毛球运动员的身高x(单位cm)与体重y(单位kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表
【解析】=176,=75,
-
=
=
=0.4,=-=4.6,所以=0.4x+4.6.
12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据
(1)求回归直线方程=x+,其中=-20,=-.
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
【解析】(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.
=×(90+84+83+80+75+68)=80.
=+20=80+20×8.5=250,
=-20x+250.
(2)工厂获得利润z=(x-4)y=-20x2+330x-1 000,
由二次函数知识可知当x=时,z max=361.25(元).
故该产品的单价应定为8.25元.
B组提升练(建议用时20分钟)
13.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两个数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两个数据后,重新求得回归直线的斜率为1.4,那么当x=6时,的值为( A )
A.9.6
B.10
C.10.6
D.9.4
14.已知x与y之间的几组数据如表
数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′
B.>b′,<a′
C.<b′,>a′
D.<b′,<a′
15.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表
温约为6℃,据此估计,该商场下个月毛衣的销售量约为46件.
16.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示
程是=-3.2x+40,且m+n=20,则其中的n= 10.
17.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下
(1)
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线.
(3)试预测加工10个零件需要多少时间?
注=,=-.
【解析】(1)散点图如图
(2)由表中数据得x i y i=52.5,
=3.5,=3.5,=54,所以==0.7,
所以=-=1.05,所以=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时).
所以预测加工10个零件需要8.05小时.
18.根据“2015年国民经济和社会发展统计公报”中公布的数据,从2011年到2015年,我国的第三产业在GDP中的比重如下
(2)建立第三产业在GDP中的比重y关于年份代码x的回归方程.
(3)按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重. 附回归直线=+x的斜率和截距的最小二乘估计分别为
=,=-.
【解析】(1)数据对应的散点图如图所示.
(2)=3,=47.06,===1.5,
=-=42.56,
所以回归直线方程为=1.5x+42.56.
(3)代入2018年的年份代码x=8,得=1.5×8+42.56=54.56,
所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP中的比重将达到54.56%.
C组培优练(建议用时15分钟)
19.某考察团对10个城市的职工人均工资x(千元)与居民人均消费y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额占人均工资收入的百分比为
( D )
A.66%
B.67%
C.79%
D.84%
20.一家商场为了确定营销策略,进行了四次投入促销费用x和商场实际销售额的试验,得到如下数据.
(1)
具有较好的线性相关性.
(2)求出x,y之间的回归直线方程=x+.
(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用? 【解析】(1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.
(2)==4,
==250,
(x i-)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2
=4+1+1+4=10,
(x i-)(y i-)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.
==70,=-=250-70×4=-30.
故所求的回归直线方程为=70x-30.
(3)令70x-30≥600,即x≥=9(万元),即若该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.
关闭Word文档返回原板块。