人教A版高中数学必修三练习:第二章 统计 分层训练 进阶冲关 2.3 变量间的相关关系 Word版含答案
高中数学人教A版必修三 第二章 统计 学业分层测评12 Word版含答案.doc
学业分层测评(十二) 用样本的频率分布估计总体分布(建议用时:45分钟)[学业达标]一、选择题1.下列命题正确的是( )A .频率分布直方图中每个小矩形的面积等于相应组的频数B .频率分布直方图的面积为对应数据的频率C .频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D .用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示频率组距,由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.【答案】 C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:第3组的频率和累积频率为( )A.0.14和0.37B.114和1 27C.0.03和0.06 D.314和637【解析】由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.【答案】 A3.如图2-2-8所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为()图2-2-8A.20B.30C.40 D.50【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.【答案】 B4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图2-2-9所示),则该样本的中位数、众数、极差分别是()图2-2-9A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】 A5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2-2-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是()图2-2-10A.45B.50C.55 D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.【答案】 B二、填空题6.200辆汽车通过某一段公路时的时速的频率分布直方图如图2-2-11所示,时速在[50,60)的汽车大约有______辆.图2-2-11【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】607.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2212所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.图2-2-12【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.【答案】9692乙8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2-2-13所示:图2-2-13(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.【解析】由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.【答案】(1)0.004 4(2)70三、解答题9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B 药的20位患者日平均增加的睡眠时间: 3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.4 1.6 0.5 1.8 0.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好? (2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好? 【导学号:28750037】图2-2-14【解】 (1)设A 药观测数据的平均数为-x ,B 药观测数据的平均数为-y .由观测结果可得-x =120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,-y =120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得-x>-y ,因此可看出A 药的疗效更好. (2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A 药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.10.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2-2-15),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.图2-2-15(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【解】 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为: 17+15+9+32+4+17+15+9+3×100%=88%.[能力提升]1.如图2-2-16是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()图2-2-16A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分【解析】由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.【答案】 A2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2-2-17所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图2-2-17【解析】 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一 由题意知样本容量为20,组距为5. 列表如下:观察各选择项的频率分布直方图知选A.法二由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率也分别相等,比较四个选项知A正确,故选A.组距【答案】 A图2-2-183.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.【解析】当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.【答案】 14.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2-2-19所示)图2-2-19解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?【解】(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.。
2018秋新版高中数学人教A版必修3:第二章统计 2.3
目标导航
Z Z D 知识梳理 HISHISHULI
重难聚焦
典例透析
HONGNANJUJIAO IANLITOUXI
1.相关关系 (1)定义:如果两个变量中一个变量的取值一定时,另一个变量的 取值带有一定的随机性,那么这两个变量之间的关系叫做相关关系. (2)两类特殊的相关关系:如果散点图中点的分布是从左下角到右 上角的区域,那么这两个变量的相关关系称为正相关.如果散点图 中点的分布是从左上角到右下角的区域,那么这两个变量的相关关 系称为负相关. 归纳总结两个变量间的关系分为三类:一类是确定性的函数关系, 如正方形的边长与面积的关系;另一类是变量间确实存在关系,但 又不具备函数关系所要求的确定性,它们的关系是带有随机性的, 这种关系就是相关关系,例如,某位同学的“物理成绩”与“数学成绩” 之间的关系;再一类是不相关,即两个变量间没有任何关系.
x
3
y
2.5
4
5
6
3
4
4.5
(1)请画出上表数据的散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归
方程
^
������
=
^
b������
+
^
������;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根
据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技
分布趋势分析两个变量之间的关系,可直观地判断并得出结论.
2.回归直线的性质
剖析:(1)若(xi,yi)(i=1,2,…,n)为样本数据,则(������, ������)为样本点的中心, 回归直线一定过样本点的中心.
(2)如果样本数据对应的点具有线性相关关系,从回归直线方程来
高中数学(人教版A版必修三)配套课时作业:第二章统计2.1.3Word版含答案
n 是 36 的约数,且 36是 6 的约 n
数,即 n 又是 6 的倍数, n= 6,12,18 或 36,又 n+ 1 是 35 的约数,故 n 只能是 4,6,34,综
合得 n= 6,即样本容量为 6.
13. 选择合适的抽样方法抽样 ,写出抽样过程.
(1)有甲厂生产的 30 个篮球 , 其中一箱 21 个 ,另一箱 9 个, 抽取 3 个. (2)有 30 个篮球 ,其中甲厂生产的有 21 个 , 乙厂生产的有 9 个 ,抽取 10 个.
答案 20
解析 由题意可设 A、B、C 中个体数分别为 5k,3k,2k ,所以 C 中抽取个体数为
2k
5k + 3k+ 2k
×100= 20.
9.某工厂生产 A 、B 、 C、 D 四种不同型号的产品 , 产品数量之比依次为 2∶ 3∶ 5∶ 1.现
用分层抽样方法抽出一个容量为 n 的样本 ,样本中 A 种型号有 16 件,那么此样本的容量
⑤找出和所得号码对应的篮球即可得到样本.
(2)总体由差异明显的两个层次组成,需选用分层抽样法. ①确定抽取个数.因为 3100= 3,所以甲厂生产的应抽取
231= 7(个 ),乙厂生产的应抽取 93=
3(个 ); ②用抽签法分别抽取甲厂生产的篮球 们要抽取的样本.
7 个,乙厂生产的篮球 3 个.这些篮球便组成了我
2.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息
, 并充分考虑保持样本结构与总体结构的一致
性 , 这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时 用分层抽样的方法.
, 往往选
一、选择题 1.某城市有学校 700 所.其中大学 20 所 , 中学 200 所 , 小学 480 所 , 现用分层抽样方 法从中抽取一个容量为 70 的样本 , 进行某项调查 , 则应抽取中学数为 ( )
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)
高中数学必修三第二章《统计》学案2.3.变量间的相关关系(学生专用)(A版)普通高中数学必修3(A版)学案 2.3. 变量间的相关关系2.3.1变量之间的相关关系授课时间:年月日【学习目标】通过收集现实问题中两个有关联变量的数据认识变量间的相关关系。
【重点难点】1. 通过收集现实问题中两个有关联变量的数据直观认识变量间的相关关系。
2. 变量之间相关关系的理解。
【学习过程】一、学习引导在中学校园里,有这样一种说法:“如果你的数学成绩好,那么你的物理学习就不会有什么大问题.”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着某种关系,我们把数学成绩和物理成绩看成是两个变量,那么这两个变量之间的关系是函数关系吗?二、合作交流(教师可做点拨)相关关系的概念:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。
当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。
相关关系是一种非确定性关系。
(分析:两个变量→自变量取值一定→因变量带有随机性→相关关系)三、随堂练习思考1:考察下列问题中两个变量之间的关系:(1)商品销售收入与广告支出经费;(2)粮食产量与施肥量;(3)人体内的脂肪含量与年龄.这些问题中两个变量之间的关系是函数关系吗?思考2:“名师出高徒”可以解释为教师的水平越高,学生的水平就越高,那么学生的学业成绩与教师的教学水平之间的关系是函数关系吗?你能举出类似的描述生活中两个变量之间的这种关系的成语吗?思考3:商品销售收入与广告支出经费之间的关系。
(还与商品质量,居民收入,生活环境等有关)四、能力提升1. 上述两个变量之间的关系是一种非确定性关系,称之为相关关系,那么相关关系的含义如何?2. 对于一个变量,可以控制其数量大小的变量称为可控变量,否则称为随机变量,那么相关关系中的两个变量有哪种类型?3. 相关关系与函数关系的异同点?【小结反思】1. 变量具有不确定性,需要通过收集大量的数据(通过调查或试验)在对数据进行统计分析的基础上,发现其中的规律,才能对它们之间的关系做出正确的判断。
人教新课标A版 高中数学必修3 第二章统计 2.3变量间的相关关系D卷
人教新课标A版高中数学必修3 第二章统计 2.3变量间的相关关系D卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)下列两个变量之间的关系是相关关系的是()A . 角度和它的余弦值B . 正方形的边长与它的面积C . 电压一定时,电流与电阻D . 日照时间与水稻的亩产量2. (2分)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A .B .C .D .5. (2分) (2017高二上·伊春月考) 某公司在销售某种环保材料过程中,记录了每日的销售量(吨)与利润(万元)的对应数据,下表是其中的几组对应数据,由此表中的数据得到了关于的线性回归方程,若每日销售量达到10吨,则每日利润大约是()34562.534 4.5A . 7.2万元B . 7.35万元C . 7.45万元D . 7.5万元6. (2分)下列有关线性回归的说法,不正确的是()A . 变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫作相关关系B . 在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫作散点图C . 回归方程最能代表观测值之间的线性关系D . 任何一组观测值都能得到具有代表意义的回归直线8. (2分)两个变量x,y与其线性相关系数r有下列说法(1)若r>0,则x增大时,y也相应增大;(2)若r<0,则x增大时,y也相应增大;(3)若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上.其中正确的有()A . ①B . ②③C . ①③D . ①②③9. (2分) (2017高二下·乾安期末) 下列关于统计学的说法中,错误的是()A . 回归直线一定过样本中心点B . 残差带越窄,说明选用的模型拟合效果越好C . 在线性回归模型中,相关指数的值趋近于1,表明模型拟合效果越好D . 从独立性检验:有的把握认为吸烟与患肺病有关系时,可解释为100人吸烟,其中就有99人可能患有肺病11. (2分) (2019高二下·福州期中) 已知的值如下表所示:如果与呈线性相关且回归直线方程为,则()x2345y54m7A .B .C .D .12. (2分) (2019高一上·安达期中) 今有一组实验数据如下:分别用下列函数模型来拟合变量与之间的关系,其中拟合效果最好的是()A .B .C .D .13. (2分)某单位为了了解用电量y(度)与气温X(℃)之间的关系,随机统计了某4天的用电量与当天气温,并作了如下的对照表:由表中数据,得回归直线方程 = + ,若 =﹣2,则 =()气温X(℃)181310﹣1用电量y24343864A . 60B . 58C . 62D . 6414. (2分) (2015高二下·会宁期中) 在两个变量y与x的回归模型中,分别选择了四个不同的模型,它的相关指数R2如下,其中拟合效果最好的模型是()A . 模型1的相关指数R2为0.87B . 模型2的相关指数R2为0.97C . 模型3的相关指数R2为0.50D . 模型4的相关指数R2为0.2515. (2分)根据一组样本数据的散点图分析存在线性相关关系,求得其回归方程,则在样本点处的残差为()A . 54.55B . 2.45C . 3.45D . 111.55二、填空题 (共5题;共7分)16. (1分)若由一个2×2列联表中的数据计算得χ2=4.073,那么有________ 的把握认为两变量有关系[已知P(χ2≥3.841)≈0.05,P(χ2≥5.024)≈0.025].19. (1分)某商品在5家商场的售价x(元)和销售量y(件)之间的一组数据如下表所示:价格x(元)99.51010.511销售量y(件)11a865由散点图可知,销售量y与价格x之间有较好的线性相关关系,且回归直线方程是=﹣3.2x+4a,则a=________三、解答题 (共5题;共25分)21. (5分)要分析学生初中升学考试的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩(x)和高一年级期末数学考试成绩(y)(如下表):编号12345678910x63674588817152995876y65785285928973985675(1)画出散点图;(2)判断入学成绩(x)与高一期末考试成绩(y)是否有线性相关关系;(3)如果x与y具有线性相关关系,求出回归直线方程;25. (5分)炼钢是一个氧化降碳的过程,由于钢水含碳量的多少直接影响冶炼时间的长短,因此必须掌握钢水含碳量和冶炼时间的关系.现已测得炉料熔化完毕时钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一组数据,如下表所示:(1)据统计表明,之间具有线性相关关系,请用相关系数r加以说明(,则认为y与x 有较强的线性相关关系,否则认为没有较强的线性相关关系,r精确到0.001);(2)建立y关于x的回归方程(回归系数的结果精确到0.01);(3)根据(2)中的结论,预测钢水含碳量为160个0.01%的冶炼时间.参考公式:回归方程中斜率和截距的最小二乘估计分别为,,相关系数参考数据:,.参考答案一、单选题 (共15题;共30分)1-1、2-1、5-1、6-1、8-1、9-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共7分)16-1、19-1、三、解答题 (共5题;共25分)21-1、21-2、21-3、25-1、25-2、25-3、。
高中数学 第二章 统计 2.1.3 分层抽样练习(含解析)新人教A版必修3(2021年最新整理)
高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3 编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.1.3 分层抽样练习(含解析)新人教A版必修3的全部内容。
2.1。
3 分层抽样一、选择题1.某校现有高一学生210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中随机抽取数名学生进行问卷调查.如果已知从高一学生中抽取的人数为7,那么从高三学生中抽取的人数应为( )A.10 B.9C.8 D.7【答案】A【解析】选A。
错误!×300=10。
2.已知某单位有职工120人,男职工有90人,现采用分层抽样(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )A.30 B.36C.40 D.没法确定【答案】B【解析】抽取比例为错误!=错误!,故样本容量为:错误!×120=36.3.某城区有农民、工人、知识分子家庭共计2000家,其中农民家庭1800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,用到的抽样方法有( )①简单随机抽样②系统抽样③分层抽样A.②③B.①③C.③D.①②③【答案】D【解析】由于各类家庭有明显差异,所以首先应用分层抽样的方法分别从三类家庭中抽出若干户.又由于农民家庭户数较多,那么在农民家庭这一层宜采用系统抽样;而工人、知识分子家庭户数较少,宜采用简单随机抽样.故整个抽样过程要用到①②③三种抽样方法.4.下列抽样方式中,是系统抽样的有()①某单位从老年、中年、青年职工中按2∶5∶3的比例选取职工代表;②搞市场调查,规定在商店门口随机地抽一些人进行询问,直到调查到规定的人数为止;③3D福利彩票的中将号码用摇奖机摇奖;④规定凡购买到的明信片的最后的四位号码是“6637”的人获三等奖;⑤从参加模拟考试的1200名高中生按优、中、差抽取100人分析试题的作答情况.A.1个B.2个C.3个D.4个【答案】A【解析】①⑤有明显的层次,不宜采用系统抽样;对于②,由于事先不知道总体,抽样方法不能保证每个个体等可能地入样,故②不是系统抽样;③是简单随机抽样;④是系统抽样.5.某初级中学有学生270人,其中一年级108人,二、三年级各81人.现要从中抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案.使用分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用简单随机抽样和系统抽样时,将学生统一随机编号为1,2,…,270.如果抽得的号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270。
高中数学 第二章 统计 2.3 变量间的相关关系教材习题点拨 新人教A版必修3(2021年最新整理)
修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计2.3 变量间的相关关系教材习题点拨新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计2.3 变量间的相关关系教材习题点拨新人教A版必修3的全部内容。
版必修3练习11.解:从已经掌握的知识来看,吸烟会损害身体的健康。
但是除了吸烟之外,还有许多其他的随机因素影响身体健康,身体健康是很多因素共同作用的结果。
我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题。
但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的。
点拨:吸烟与健康问题是相关关系问题,可以说吸烟与健康应该是负相关.2.解:从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的其他因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠。
而要证实此结论是否可靠,可以通过试验来进行。
相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同。
点拨:在探索研究的过程中,如果能够从两个变量的观察数据之间发现相关关系是极为有意义的,由此可以进一步研究二者之间是否蕴涵因果关系,从而发现引起这种相关关系的本质原因是什么。
这就要求我们能学会用时间去验证理论。
练习21.解:当x =0时,147.767ˆ=y,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值能够等于实际值y .事实上,e ye a bx y +=++=ˆ,这里e 是随机变量,预报值y ˆ与实际值y 的平均接近程度由随机变量e 的标准差所决定.2。
高中数学人教A版必修三 第二章 统计 学业分层测评11 Word版含答案
学业分层测评(十一)分层抽样(建议用时:45分钟)[学业达标]一、选择题1.某地区为了了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽1100的居民家庭进行调查,这种抽样是() A.简单随机抽样B.系统抽样C.分层抽样D.分类抽样【解析】由于居民按行业可分为不同的几类,符合分层抽样的特点.【答案】 C2.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人,为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6【解析】抽样比例为40800=120,故各层中依次抽取的人数为160×120=8(人),320×120=16(人),200×120=10(人),120×120=6(人).故选D.【答案】 D3.在1 000个球中有红球50个,从中抽取100个进行分析,如果用分层抽样的方法对球进行抽样,则应抽红球( )A .33个B .20个C .5个D .10个【解析】 设应抽红球x 个,则1001 000=x50,则x =5. 【答案】 C4.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )图2-1-1A .200,20B .100,20C .200,10D .100,10【解析】 该地区中小学生总人数为 3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.【答案】 A5.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到的抽样方法有()①简单随机抽样;②系统抽样;③分层抽样.A.②③B.①③C.③D.①②③【解析】由三种抽样方法的特点.可知,选D.【答案】 D二、填空题6.某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.【解析】应在丙专业抽取的学生人数是400×40=16.150+150+400+300【答案】167.某校共有2 000名学生,各年级男、女生人数如表所示.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为_____________.【解析】依题意可知三年级学生人数为500,即总体中各年级的人数比例为3∶3∶2,故用分层抽样抽取三年级学生人数为64×28=16.【答案】168.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.【解析】高二年级学生人数占总数的310,样本容量为50,则50×310=15.【答案】15三、解答题9.某单位有2 000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:(1)若要抽取40人调查身体状况,则应怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?【导学号:28750034】【解】 (1)按老年、中年、青年分层抽样, 抽取比例为402 000=150.故老年人,中年人,青年人各抽取4人,12人,24人, (2)按管理、技术开发、营销、生产进行分层,用分层抽样,抽取比例为252 000=180,故管理,技术开发,营销,生产各抽取2人,4人,6人,13人. 10.某市两所高级中学联合在暑假组织全体教师外出旅游,活动分为两条线路:华东五市游和长白山之旅,且每位教师至多参加了其中的一条线路.在参加活动的教师中,高一教师占42.5%,高二教师占47.5%,高三教师占10%.参加华东五市游的教师占参加活动总人数的14,且该组中,高一教师占50%,高二教师占40%,高三教师占10%.为了了解各条线路不同年级的教师对本次活动的满意程度,现用分层抽样的方法从参加活动的全体教师中抽取一个容量为200的样本.试确定:(1)参加长白山之旅的高一教师、高二教师、高三教师分别所占的比例;(2)参加长白山之旅的高一教师、高二教师、高三教师分别应抽取的人数.【解】 (1)设参加华东五市游的人数为x ,参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为a ,b ,c ,则有x ·40%+3xb 4x=47.5%,x ·10%+3xc4x =10%,解得b =50%,c =10%.故a =100%-50%-10%=40%,即参加长白山之旅的高一教师、高二教师、高三教师所占的比例分别为40%,50%,10%.(2)参加长白山之旅的高一教师应抽取人数为200×34×40%=60; 抽取的高二教师人数为200×34×50%=75; 抽取的高三教师人数为200×34×10%=15.[能力提升]1.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为( )A .8B .11C .16D .10【解析】 若设高三学生数为x ,则高一学生数为x2,高二学生数为x 2+300,所以有x +x 2+x2+300=3 500,解得x =1 600.故高一学生数为800,因此应抽取高一学生数为 800100=8.【答案】 A2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁学生问卷中抽取60份,则在15~16岁学生中抽取的问卷份数为()A.60 B.80C.120 D.180【解析】11~12岁回收180份,其中在11~12岁学生问卷中抽取60份,则抽样比为13.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收=900(份),则15~16岁回收问卷份数为:x=900-的问卷总数为30013120-180-240=360(份).=120(份),故选∴在15~16岁学生中抽取的问卷份数为360×13C.【答案】 C3.某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,如果采用系统抽样和分层抽样方法抽取,不用剔除个体;如果样本容量增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求得样本容量为________.【解析】总体容量N=36.当样本容量为n 时,系统抽样间隔为36n ∈N *,所以n 是36的约数; 分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n 6、n 3、n2,所以n 应是6的倍数,所以n =6或12或18或36.当样本容量为n +1时,总体中先剔除1人时还有35人,系统抽样间隔为35n +1∈N *,所以n 只能是6.【答案】 64.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?【解】 (1)由于这次活动对教职员工、初中生和高中生产生的影响不会相同,所以应当采取分层抽样的方法进行抽样.因为样本容量=120,总体个数=500+3 000+4 000=7 500,则抽样比:1207 500=2125,所以有500×2125=8,3 000×2125=48,4 000×2125=64,所以在教职员工、初中生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:①分层:分为教职员工、初中生、高中生,共三层.②确定每层抽取个体的个数:在教职员工、初中生、高中生中抽取的个体数分别是8、48,64.③各层分别按简单随机抽样或系统抽样的方法抽取样本.④综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简单随机抽样有两种方法:抽签法和随机数法.如果用抽签法,要作3 000个号签,费时费力,因此采用随机数法抽取样本,步骤是:①编号:将3 000份答卷都编上号码:0001,0002,0003, (3000)②在随机数表上随机选取一个起始位置.③规定读数方向:向右连续取数字,以4个数为一组,如果读取的4位数大于3 000,则去掉,如果遇到相同号码则只取一个,这样一直到取满48个号码为止.(3)由于4 000÷64=62.5不是整数,则应先使用简单随机抽样从4 000名学生中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第1部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开始,每隔62个抽取一个,这样得到容量为64的样本:23,85,147,209,217,333,395,457,…,3 929.。
高一数学人教A版必修三练习:第二章统计2.3含解析
(本栏目内容,在学生用书中以独立形式分册装订!)一、选择题(每小题5分,共20分) 1.下列变量是线性相关的是( ) A .人的体重与视力B .圆心角的大小与所对的圆弧长C .收入水平与购买能力D .人的年龄与体重解析: B 为确定性关系;A ,D 不具有线性关系,故选C. 答案: C2. 已知变量x ,y 之间具有线性相关关系,其散点图如图所示,则其回归方程可能为( )A.y ∧=1.5x +2B.y ∧=-1.5x +2C.y ∧=1.5x -2D.y ∧=-1.5x -2解析: 设回归方程为y ∧=b ∧x +a ∧,由散点图可知变量x ,y 之间负相关,回归直线在y轴上的截距为正数,所以b ∧<0,a ∧>0,因此方程可能为y ∧=-1.5x +2.答案: B3.设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线如图所示,则以下结论正确的是( )A .直线l 过点(x ,y )B .回归直线必通过散点图中的多个点C .直线l 的斜率必在(0,1)D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同解析: A 是正确的;回归直线可以不经过散点图中的任何点,故B 错误;回归直线的斜率不确定,故C 错误;分布在l 两侧的样本点的个数不一定相同,故D 错误.答案: A4.一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y =7.19x +73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是( )A .身高一定是145.83 cmB .身高在145.83 cm 以上C .身高在145.83 cm 以下D .身高在145.83 cm 左右解析: 当x =10时,y =145.83 cm ,所以身高在145.83 cm 左右,选D. 答案: D二、填空题(每小题5分,共15分)5.下列说法:①回归方程适用于一切样本和总体; ②回归方程一般都有局限性;③样本取值的范围会影响回归方程的适用范围; ④回归方程得到的预测值是预测变量的精确值. 正确的是________(将你认为正确的序号都填上).解析: 样本或总体具有线性相关关系时,才可求回归方程,而且由回归方程得到的函数值是近似值,而非精确值,因此回归方程有一定的局限性.所以①④错.答案: ②③6.一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x 与身高y 进行测量,得到数据(单位均为cm)如表,作出散点图后,发现散点在一条直线附近,经计算得到一些数据:∑i =110(x i -x )(y i -y )=577.5,∑i =110(x i -x )2=82.5;某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5 cm ,则估计案发嫌疑人的身高为________cm.解析: 回归方程的斜率b ∧=∑i =110(x i -x )(y i -y )∑i =110(x i -x )2=577.582.5=7,x =24.5,y =171.5,截距a ∧=y -b ∧x =0,即回归方程为y ∧=7x ,当x =26.5时,y =185.5.答案: 185.57.下表是某厂1~4月份用水量(单位:百吨)的一组数据,由其散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其回归直线方程是y ∧=-0.7x +a ∧,则a ∧=________.解析: x =14(1+2+3+4)=52,y =14(4.5+4+3+2.5)=72.又∵⎝⎛⎭⎫52,72在y ∧=-0.7x +a ∧上,∴72=-0.7×52+a ∧, 解得a ∧=5.25. 答案: 5.25三、解答题(每小题10分,共20分)8.某个服装店经营某种服装,在某周内获纯利y (元),与该周每天销售这种服装件数x 之间的一组数据关系见表已知∑i =1nx 2i =280,∑i =1n y 2i =45 209,∑i =1nx i y i =3 487.(1)求x ,y ; (2)求回归方程.解析: (1)x =17×(3+4+5+6+7+8+9)=6,y =17×(66+69+73+81+89+90+91)=5597.(2)b ∧=3 487-7×6×5597280-7×36=194,∴a ∧=5597-194×6=71914,∴所求回归方程为y ∧=194x +71914. 9.某研究机构对高三学生的记忆力x 和判断力y 进行统计分析,得下表数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ∧=b ∧x +a ∧; (3)试根据(2)求出的线性回归方程,预测记忆力为9的同学的判断力.(相关公式:b ∧=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ∧=y ∧-b ∧x )解析: (1)如图:(2)∑i =1nx i y i =6×2+8×3+10×5+12×6=158,x =6+8+10+124=9,y =2+3+5+64=4,∑i =1nx 2i =62+82+102+122=344,b ∧=158-4×9×4344-4×92=1420=0.7,a ∧=y -b ∧x =4-0.7×9=-2.3,故线性回归方程为y ∧=0.7x -2.3.(3)由回归直线方程预测,记忆力为9的同学的判断力约为4.。
第2章 2.3 人教A版高中数学必修3学练测(课件+提能达标过关)第2章 统计
B.(1)(3) D.(2)(3)
解析:选 D 图(1)中,所有的点都在曲线上,所以图(1)中的 两个变量具有函数关系;图(2)中,所有的点都分布在一条直线的 附近,所以图(2)中的两个变量具有相关关系;图(3)中,所有的点 都分布在一条曲线的附近,所以图(3)中的两个变量具有相关关 系;图(4)中,所有的点杂乱无章,没有分布在一条曲线的附近, 所以图(4)中的两个变量没有相关关系.故选 D.
解:(1)散点图如图:
(2)由于 x =3+4+4 5+6=4.5, y =2.5+3+4 4+4.5=3.5,
4
xiyi=3×2.5+4×3+5×4+6×4.5=66.5,
i=1
4
x2i =32+42+52+62=86,
i=1
4
xiyi -4 x y
所以^b=i=1
4
=66.58-6-4×4×4.45.×52 3.5=0.7,
4.某化妆品公司 2013~2018 年的年利润 x(单位:百万元) 与年广告支出 y(单位:百万元)的统计资料如下表所示:
年份 2013 2014 2015 2016 2017 2018 利润 x 12.2 14.6 16.2 18.4 20.4 22.3 支出 y 0.62 0.74 0.81 0.89 1.00 1.11
根据统计资料,可知( ) A.利润的中位数是 16.2,x 与 y 有正相关关系 B.利润的中位数是 17.3,x 与 y 有正相关关系 C.利润的中位数是 17.3,x 与 y 有负相关关系 D.利润的中位数是 18.4,x 与 y 有负相关关系 解析:选 B 年利润的 6 个数据的中间两个为 16.2,18.4, 则中位数为 17.3;又 x 增加时,y 也随之增加,因此 x 与 y 成正 相关.故选 B.
第2章 2.3 素养提升 人教A版高中数学必修3学练测(课件+提能达标过关)第2章 统计
(2)令销售利润为 W, 则 W=(x-2.5)(-3.2x+40)=-3.2x2+48x-100,其中 2.5<x<12.5. 当 x=7.5 时,W 取得最大值 80. 所以该配件的销售单价定为 7.5 元时,获得的利润最大.
[答案] 800
【例 3】 为了比较两种治疗失眠症的药(分别称为 A 药,B 药)的疗效,随机选取 20 位患者服用 A 药,20 位患者服用 B 药, 这 40 位患者在服用一段时间后,记录他们日平均增加的睡眠时 间(单位:h).试验的观测结果如下:
服用 A 药的 20 位患者日平均增加的睡眠时间: 0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4
第二章 统 计
2.3 变量间的相关关系 素养提升
核心素养归纳 素养培优提能
核心素养归纳
选择适当的方法用样本估计总体 现实中的总体所包含的个数往往是很多的,因此我们通过获 取样本数据,分析样本的分布和数字特征,进而对总体作出估计.
1.估计总体的分布 (1)将样本的分布用图表的形式给出,对总体的分布进行估 计. (2)对总体的频率、频数的估计常用到频率分布直方图中相关 的知识:
i=1
i=1
[解] (1)因为 x =15×(9+9.5+10+10.5+11)=10, y =15×(11+10+8+6+5)=8,
5
xiyi -5 x · y
i=1
所以^b=
5
=359022-.5-5×5×101×028=-3.2.
x2i -5 x 2
i=1
则^a= y -^b x =8-(-3.2)×10=40, 所以 y 关于 x 的回归方程为^y=-3.2x+40.
第2章 2.1 2.1.3 人教A版高中数学必修3学练测(课件+提能达标过关)第2章 统计
知识点三 分层抽样的设计 7.一个单位有职工 500 人,其中不到 35 岁的有 125 人,35 岁至 49 岁的有 280 人,50 岁以上的有 95 人,为了了解这个单位 职工与身体状况有关的某项指标,要从中抽取 100 名职工作为样 本,职工年龄与这项指标有关,应该怎样抽取?
解:用分层抽样来抽取样本,步骤是: ①分层:按年龄将 500 名职工分成三层:不到 35 岁的职工; 35 岁至 49 岁的职工;50 岁以上的职工. ②确定每层抽取个体的个数,抽样比为150000=15,则在不到 35 岁的职工中抽 125×15=25(人);在 35 岁至 49 岁的职工中抽 280×15 =56(人);在 50 岁以上的职工中抽 95×15=19(人). ③在各层分别按抽签法或随机数表法抽取样本. ④综合每层抽样,组成样本.
A.抽签法 B.随机数表法 C.分层抽样 D.先从老年人中剔除 1 人,再用分层抽样
解析:选 D 总体容量为 28+54+81=163.样本容量为 36, 由于总体由差异明显的三部分组成,考虑用分层抽样.若按 36∶163=取样,无法得到整数解.故考虑先剔除 1 人,抽取比 变为 36∶162=2∶9,则中年人取 54×29=12(人),青年人取 81×29 =18(人),从老年人中剔除 1 人,老年人取 27×29=6(人),组成 容量为 36 的样本.故选 D.
C.60
D.70
解析:选 C 根据分层抽样的定义和方法,一年级本科生人 数所占的比例为4+5+4 5+6=15,故应从一年级本科生中抽取学 生的人数为 300×15=60.故选 C.
5.(2019·惠州高一检测)某市新上了一批便民公共自行车, 有绿色和橙黄色两种颜色,且绿色公共自行车和橙黄色公共自行
最新人教A版高中数学必修三练习:第二章 统计 分层训练 进阶冲关 . 随 机 抽 样试卷含答案
分层训练·进阶冲关A组基础练(建议用时20分钟)1.某校有40个班,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是( C )A.40B.50C.120D.1502.为了解600名学生的视力情况,采用系统抽样的方法,从中抽取容量为20的样本,则需要分成几个小组进行抽取( A )A.20B.30C.40D.503.某客运公司有200辆客车,为了解客车的耗油情况,现采用系统抽样的方法按1∶10的比例抽取一个样本进行检测,将客车依次编号为1,2,…,200,则其中抽取的4辆客车的编号可能是( C )A.3,23,63,102B.31,61,87,127C.103,133,153,193D.57,68,98,1084.下列抽样中,适合用抽签法的是( B )A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验5.某大学数学系共有本科生1 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为( B )A.80B.40C.60D.206.高三某班有学生56人, 现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( C )A.13B.17C.19D.217.为了了解1 203名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,现采用选取的号码间隔一样的系统抽样方法来确定所选取的样本,则抽样间隔k= 30.8.一个总体分为A,B两层,用分层抽样的方法从总体中抽取一个容量为10的样本.已知B层中每个个体被抽到的概率都为,则总体中的个体数为120.9.某校高三年级共有30个班,学校心理咨询师为了解同学们的心理状况,将每个班编号,依次为1到30,现用系统抽样的方法抽取6个班进行调查,若抽到的编号之和为87,则抽到的最小编号为2. 10.某学校三个兴趣小组的学生人数分布如下表(每名学生只参加一个小组)(单位:人).法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为30.11.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(2)用分层抽样的方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?【解析】(1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目.所以,经直观分析,收看新闻节目的观众与年龄是有关的.(2)应抽取大于40岁的观众×5=×5=3(名).12.某批产品共有1 564件,产品按出厂顺序编号,号码从1到1 564,检测员要从中抽取15件产品做检测,请你给出一个系统抽样方案. 【解析】(1)先从1 564件产品中,用简单随机抽样的方法抽出4件产品,将其剔除.(2)将余下的1 560件产品编号:1,2,3,…,1 560.(3)取k==104,将总体平均分为15组,每组含104个个体.(4)从第一组,即1号到104号利用简单随机抽样法抽取一个编号s.(5)按编号把s,104+s,208+s,…,1 456+s共15个编号选出,这15个编号所对应的产品组成样本.B组提升练(建议用时20分钟)13.将参加夏令营的600名学生编号为001,002,…,600,采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300住在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600住在第Ⅲ营区,三个营区被抽中的人数依次为( B )A.26,16,8B.25,17,8C.25,16,9D.24,17,914.某服装加工厂某月生产A,B,C三种产品共4 000件,为了保证产品质量,进行抽样检验,根据分层抽样的结果,企业统计员制作了如下的统计表格:记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是( B )A.80B.800C.90D.90015.已知某种型号的产品共有N件,且40<N<50,现需要利用系统抽样抽取样本进行质量检测,若样本容量为7,则不需要剔除;若样本容量为8,则需要剔除1个个体,则N= 49.16.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取100件做使用寿命的测试,则第一分厂应抽取的件数为50;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该产品的平均使用寿命为 1 015小时.17.某中学共有学生2 000名,各年级男、女生人数如下表:(1)求x的值;(2)现用分层抽样的方法在全校抽取48名学生,问应从高三抽取多少名?【解析】(1)因为=0.19,所以x=380.(2)高三学生人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,则应从高三抽取×48=12(名).18.为了适应新高考改革,尽快推行不分文理科教学,对比目前文理科学生考试情况进行分析,决定从80名文科同学中抽取10人,从300名理科同学中抽取50人进行分析.由于本题涉及文科生和理科生的混合抽取,你能选择合适的方法设计抽样方案吗?试一试.【解析】文科生抽样用抽签法,理科生抽样用随机数表法,抽样过程如下:(1)先抽取10名文科同学:①将80名文科同学依次编号为1,2,3, (80)②将号码分别写在形状、大小均相同的纸片上,制成号签;③把80个号签放入一个不透明的容器中,搅拌均匀,每次从中不放回地抽取一个号签,连续抽取10次;④与号签上号码相对应的10名同学的考试情况就构成一个容量为10的样本.(2)再抽取50名理科同学:①将300名理科同学依次编号为001,002, (300)②从随机数表中任选一数字作为开始数字,任选一方向作为读数方向,比如从随机数表的第4行第1列的数字1开始向右读(如图所示).每次读取三位,凡不在001~300范围内以及重复的数都跳过去,得到号码125,210,142,188,264,…;③这50个号码所对应的同学的考试情况就构成一个容量为50的样本.C组培优练(建议用时15分钟)19.我国古代数学名著《九章算术》有“米谷粒分”题:发仓募粮,所募粒中秕不百三则收之(不超过3%),现抽样取米一把,取得235粒米中夹秕n粒,若这批米合格,则n不超过 ( B )A.6粒B.7粒C.8粒D.9粒20.某合资企业有150名职工,要从中随机抽出20人去参观学习.请用抽签法和随机数法进行抽取,并写出过程.(随机数表见课本附表)【解析】方法一(抽签法):先把150名职工编号:1,2,3,…,150,把编号分别写在相同的小纸片上,揉成小球,放入一个不透明的袋子中,充分搅拌均匀后,从中逐个不放回地抽取20个小球,这样就抽出了去参观学习的20名职工.方法二(随机数法):第一步,先把150名职工编号:001,002,003, (150)第二步,从随机数表中任选一个数,如第10行第4列数0.第三步,从数字0开始向右连续读数,每3个数字为一组,在读取的过程中,把大于150的数和与前面重复的数去掉,这样就得到20个号码如下:086,027,079,050,074,146,148,093,077,119,022,025,042,045,12 8,121,038,130,125,033.(答案不唯一)。
2019人教A版高中数学必修三练习:第二章 统计 分层训练 2.2.2 用样本的数字特征估计总体的数字特征
分层训练·进阶冲关A 组 基础练(建议用时20分钟)1.已知甲,乙两组数据的茎叶图如图所示,若它们的中位数相同,则甲组数据的平均数为 ( A )A.32B.33C.34D.352.设样本数据1,2,…,10的均值和方差分别为1和4,若y i =i +a(a 为非零常数,i=1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为 ( A )A.1+a,4B.1+a,4+aC.1,4D.1,4+a3.如图是一名篮球运动员在最近6场比赛中所得分数的茎叶图,则下列关于该运动员所得分数的说法错误的是( D )A.中位数为14B.众数为13C.平均数为15D.方差为194.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则 ( C )A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差5.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县,B县两个地区附近的PM2.5监测点统计的数据(单位;毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是( A )A.A县B.B县C.A县,B县两个地区相等D.无法确定6.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为me ,平均值为,众数为m,则( D )A.me =m= B.me=m<C.me <m< D.m<me<7.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为.8.某商场对一个月内每天的顾客人数进行统计,得到如图所示的茎叶图,则该样本的众数是45.9.已知一组数据;87,,90,89,93的平均数为90,则该组数据的方差为4.10.如图是甲,乙两位同学在5次数学测试中得分的茎叶图,则成绩较稳定(方差较小)的那一位同学的方差为2.11.某教师为了了解高三一模所教两个班级的数学成绩情况,将两个班的数学成绩(单位;分)绘制成如图所示的茎叶图.(1)分别求出甲,乙两个班级数学成绩的中位数、众数.(2)若规定成绩大于等于115分为优秀,分别求出两个班级数学成绩的优秀率.【解析】(1)由所给的茎叶图知,甲班50名同学的成绩由小到大排序,排在第25,26位的是108,109,出现次数最多的是103,故甲班数学成绩的中位数是108.5,众数是103;乙班48名同学的成绩由小到大排序,排在第24,25位的是106,107,数量最多的是92和101,故乙班数学成绩的中位数是106.5,众数为92和101.(2)由茎叶图中的数据可知,甲班中数学成绩为优秀的人数为20,优秀率为=;乙班中数学成绩为优秀的人数为18,优秀率为=.12.为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m名学生进行体育测试.根据体育测试得到了这m名学生的各项平均成绩(满分100分),按照以下区间分为7组;[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内的有20人.(1)求m的值及中位数n.(2)若该校学生测试平均成绩小于n,则学校应适当增加体育活动时间.根据以上抽样调查数据,该校是否需要增加体育活动时间?【解析】(1)由频率分布直方图知第1组、第2组和第3组的频率分别是0.02,0.02和0.06,则m×(0.02+0.02+0.06)=20,解得m=200.由图知,中位数n位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n-70)=0.5,解得n=74.5.(2)设第i(i=1,2,3,4,5,6,7)组的频率和频数分别为p i 和i ,由图知,p 1=0.02,p 2=0.02,p 3=0.06,p 4=0.22,p 5=0.40,p 6=0.18,p 7=0.10,则由i =200×p i ,可得1=4,2=4,3=12,4=44,5=80,6=36,7=20,故该校学生测试平均成绩是==74<74.5,所以该校应该适当增加体育活动时间.B 组 提升练(建议用时20分钟) 13.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则,y 的值分别为 ( D )A.2,4B.4,4C.5,6D.6,414.一个样本a,3,5,7的平均数是b,且a,b 是方程2-5+4=0的两根,则这个样本的方差是( C ) A.3 B.4 C.5 D.615.某校女子篮球队7名运动员身高(单位;厘米)分布的茎叶图如图,已知记录的平均身高为175 cm,但有一名运动员的身高记录不清楚,其末位数记为,那么的值为 2 .16.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,其余三个数据为9,10,11,那么这组数据的方差s2可能的最大值是32.8.17.一所学校计划举办“国学”系列讲座.由于条件限制,按男、女生比例采取分层抽样的方法,从某班选出10人参加活动.在活动前,对所选的10名同学进行了国学素养测试,这10名同学的性别和测试成绩(百分制) 的茎叶图如图所示.(1)根据这10名同学的测试成绩,估计该班男、女生国学素养测试的平均成绩.(2)比较这10名同学中男生和女生的国学素养测试成绩的方差的大小.(只需直接写出结果)【解析】(1)设这10名同学中男、女生的平均成绩分别为,.则==73.75(分),==76(分).(2)女生国学素养测试成绩的方差大于男生国学素养测试成绩的方差.18.某同学在开学季准备销售一种盒饭进行试创业,在一个开学季内,每售出1盒该盒饭获利润10元,未售出的盒饭,每盒亏损5元.根据历史资料,得到开学季市场需求量的频率分布直方图,如图所示.该同学为这个开学季购进了150盒该盒饭,以(单位;盒,100≤≤200)表示这个开学季内的市场需求量,y(单位;元)表示这个开学季内经销该产品的利润.(1)根据频率分布直方图估计开学季内市场需求量的平均数和众数.(2)将y表示为的函数.(3)根据频率分布直方图估计利润y不少于1 350元的概率(将频率视为概率). 【解析】(1)由频率分布直方图得,开学季内市场需求量的众数的估计值是150盒.需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.012 5×20=0.25,需求量为[180,200]的频率为0.007 5×20=0.15,110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153,故平均数的估计值为153盒.(2)因为每售出1盒该盒饭获利润10元,未售出的盒饭,每盒亏损5元,所以当100≤≤150时,y=10-5(150-)=15-750,当150<≤200时,y=10×150=1 500,所以y=(∈N).(3)因为利润不少于1 350元,所以由15-750≥1 350,得≥140.所以由(1)知利润不少于1 350元的概率P=1-0.1-0.2=0.7.C组培优练(建议用时15分钟)19.如图是民航部门统计的2017年春运期间几个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( D )A.深圳的变化幅度最小,北京的平均价格最高B.深圳和厦门的春运期间往返机票价格同去年相比有所下降C.平均价格从高到低居于前三位的城市为北京、深圳、广州D.平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门20.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下;(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数.(2)根据以上抽样调查数据,将频率视为概率,回答下列问题;①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由. 【解析】(1)由已知,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.使用A款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.。
人教A版高中数学必修三第二章 统计2.3
(2)①散点图如图所示. ②由图知,所有数据点接近一条直线排列,因此,认为 y 与 x 有线性相关关 系.
答案: (1)②④
[归纳升华] 两个变量是否相关的两种判断方法
(1)根据实际经验:借助积累的经验进行分析判断. (2)利用散点图:通过散点图,观察它们的分布是否存在一定的规律,直观 地进行判断.
商店名称
ABCDE
销售额(x)/千万元 3 5 6 7 9
利润额(y)/百万元 2 3 3 4 5
(1)画出销售额和利润额的散点图;
(2)若销售额和利润额具有相关关系,计算利润额 y 对销售额 x 的回归直线
方程.
解析: (1)散点图如下:
(2)由题中数据可得 x =15(3+5+6+7+9)=6, y =15(2+3+3+4+5)=157.
[归纳升华] 回归分析的三个步骤
(1)进行相关性检验,若两变量无线性相关关系,则所求的线性回归方程毫 无意义.
(2)求回归直线方程,其关键是正确地求得a∧,b∧. (3)根据直线方程进行预测.
3.假设关于某设备的使用年限 x(年)和所支出的维修费用 y(万元),有如下 的统计资料:
使用年限 x 2 3 4 5 6 维修费用 y 2.2 3.8 5.5 6.5 7.0 由资料可知 y 与 x 具有相关关系. (1)求回归方程∧y=b∧x+a∧的回归系数a∧,b∧; (2)估计使用年限为 10 年时维修费用是多少.
►If I had not been born Napoleon, I would have liked to have been born Alexander. 如果今天我不是拿破仑的话,我想成为亚历山大。
►Never underestimate your power to change yourself! 永远不要低估你改变自我的能力!
最新人教A版高中数学必修三练习:第二章 统计 分层训练 进阶冲关 .. 用样本的频率分布估计总体分布试卷
分层训练·进阶冲关A组基础练(建议用时20分钟)1.画样本频率分布直方图时,决定组数的正确方法是( C )A.任意确定B.一般分为5~12组C.由决定D.根据经验法则,灵活掌握2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( B )A.4B.8C.12D.163.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5;[10,15),12;[15,20),7;[20,25),5;[25,30),4;[30,35),2.则样本在区间[20,+∞)上的频率约为( C )A.20%B.69%C.31%D.27%4.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为 ( B )A.0.2B.0.4C.0.5D.0.65.为了解学生“阳光体育”活动的情况,随机统计了n名学生的“阳光体育”活动时间(单位:分钟),所得数据都在区间[10,110]内,其频率分布直方图如图所示.已知活动时间在[10,35)内的频数为80,则n 的值( B )A.700B.800C.850D.9006.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:A.75B.80C.85D.907.如图是100位居民月平均用水量的频率分布直方图,则月平均用水量为[2,2.5)范围内的居民数有 25 人.8.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50),得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为 6 .9.已知样本:7 10 14 8 7 12 11 10 8 1013 10 8 11 8 9 12 9 13 12那么这组样本数据落在范围8.5~11.5内的频率为0.4.10.空气质量指数(Air Quality Ind,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为146.(该年为365天)11.某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图; 【解析】(1)这20名工人年龄的众数为30;这20名工人年龄的极差为40-19=21.(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:12.张掖市旅游局为了了解大佛寺景点在大众中的熟知度,随机对15~65岁的人群抽取n人,问题是“大佛寺是几A级旅游景点?”统计结果如下图表.(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人.【解析】(1)由频率表中第4组数据可知,第4组总人数为=25,结合频率分布直方图可知n==100,所以a=100×0.01×10×0.5=5, b=100×0.03×10×0.9=27,x==0.9,y==0.2.(2)因为第2,3,4组回答正确的共有54人,所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为第2组:×6=2(人);第3组:×6=3(人);第4组:×6=1(人).B组提升练(建议用时20分钟)13.AQI是表示空气质量的指数,AQI越小,表明空气质量越好,当AQI 不大于100时称空气质量为“优良”.如图是某地4月1日到12日AQI的统计数据,图中点A表示4月1日的AQI为201.则下列叙述不正确的是( C )A.这12天中有6天空气质量为“优良”B.这12天中空气质量最好的是4月9日C.这12天的AQI的中位数是90D.从4日到9日,空气质量越来越好14.某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如下:分组成[10,20),[20,30),[30,39]时,所作的频率分布直方图是( B )15.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm的株数为24.16.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的,且样本容量为160,则中间一组的频数为32.17.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8∶00~10∶00间各自的点击量,得如图所示的茎叶图,根据茎叶图回答下列问题.(1)甲、乙两个网站点击量的极差分别是多少?(2)甲网站点击量在[10,40]间的频率是多少?(3)甲、乙两网站哪个更受欢迎?并说明理由.【解析】(1)甲网站的极差为73-8=65,乙网站的极差为71-5=66.(2)=.(3)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.18.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:(2)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?【解析】(1)样本数据的频率分布直方图如图所示:(2)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.C组培优练(建议用时15分钟)19.下图是2017年第一季度五省GDP情况图,则下列陈述正确的是( B )①2017年第一季度GDP总量和增速均居同一位的省只有1个;②与去年同期相比,2017年第一季度五个省的GDP总量均实现了增长;③去年同期的GDP总量前三位是D省、B省、A省;④2016年同期A省的GDP总量也是第三位.A.①②B.②③④C.②④D.①③④20.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312 274 296 288 302 295 228 287 217 329 283(1)完成下面的频率分布表,并作出频率分布直方图;时.【解析】(1)频率分布表及频率分布直方图如下所示:(2)由题意可得8×(0.30+0.10+0.05)=3.6(万台),所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.- 11 -。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分层训练·进阶冲关
A组基础练(建议用时20分钟)
1.下列四个选项中,关于两个变量所具有的相关关系描述正确的是
( D )
A.圆的面积与半径具有相关关系
B.纯净度与净化次数不具有相关关系
C.作物的产量与人的耕耘是负相关关系
D.学习成绩与学习效率是正相关关系
2.某旅行社为迎节日搞活动旅游,经市场调查,某旅游线路销量y(人)与旅游单价x(元/人)负相关,则其回归方程可能是( A )
A.=-80x+1 600
B.=80x+1 600
C.=-80x-1 600
D.=80x-1 600
3.具有线性相关关系的变量x,y的一组数据如表所示.若根据表中数据得出y与x的回归直线方程为=3x-,则m的值是( A )
A.4
B.
C.5.5
D.6
4.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
①y与x负相关且=2.347x-6.423;
②y与x负相关且=-3.476x+5.648;
③y与x正相关且=5.437x+8.493;
④y与x正相关且=-4.326x-4.578.
其中一定不正确的结论的序号是( D )
A.①②
B.②③
C.③④
D.①④
5.为了解某社区居民购买水果和牛奶的年支出费用与购买食品的年支出费用的关系,随机调查了该社区5户家庭,得到如下统计数据表:
根据上表可得回归直线方程=x+,其中=0.59,=-,据此估计,该社区一户购买食品的年支出费用为3.00万元的家庭购买水果和牛奶的年支出费用约
为( A )
A.1.795万元
B.2.555万元
C.1.915万元
D.1.945万元
6.在一组样本数据(x1,y1),(x2,y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相
等)的散点图中,若所有样本点(x i,y i)(i=1,2,…,n)都在直线y=x+1上,则这组样本数据的样本相关系数为( D )
A.-1
B.0
C.
D.1
7.经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的回归直线方程:=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加
0.245万元.
8.一位母亲记录了儿子3~9岁的身高,数据略,建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是
③.
①身高一定是145.83 cm ②身高145.83 cm以上
③身高在145.83 cm左右④身高在145.83 cm以下
9.已知x与y之间的一组数据:
则y与x的线性回归方程=x+必过点(1.5,4).
10.某单位为了了解用电量y度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:
由表中数据得线性回归方程=x+中=-2,预测当气温为-4 ℃时,用电量的度数约为68度.
11.为了研究男羽毛球运动员的身高x(单位:cm)与体重y(单位:kg)的关系,通过随机抽样的方法,抽取5名运动员测得他们的身高与体重关系如下表:
求回归直线方程=x+.
【解析】=176,=75,
-
=
=
=0.4,=-=4.6,所以=0.4x+4.6.
12.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:
(1)求回归直线方程=x+,其中=-20,=-.
(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)
【解析】(1)=×(8+8.2+8.4+8.6+8.8+9)=8.5.
=×(90+84+83+80+75+68)=80.
=+20=80+20×8.5=250,
=-20x+250.
(2)工厂获得利润z=(x-4)y=-20x2+330x-1 000,
由二次函数知识可知当x=时,z max=361.25(元).
故该产品的单价应定为8.25元.
B组提升练(建议用时20分钟)
13.已知由一组样本数据确定的回归直线方程为=1.5x+1,且=2,发现有两个数据(2.6,2.8)与(1.4,5.2)误差较大,去掉这两个数据后,重新求得回归直线的斜率为1.4,那么当x=6时,的值为 ( A )
A.9.6
B.10
C.10.6
D.9.4
14.已知x与y之间的几组数据如表:
假设根据上表数据所得线性回归方程为=x+,若某同学根据上表中的
前两组数据(1,0)和(2,2)求得的直线方程为y′=b′x+a′,则以下结论正确的是( C )
A.>b′,>a′
B.>b′,<a′
C.<b′,>a′
D.<b′,<a′
15.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:
由表中数据算出线性回归方程=x+中的≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为46件.
16.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n= 10.
17.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:
(1)在给定的坐标系中画出表中数据的散点图:
(2)求出y关于x的线性回归方程=x+,并在坐标系中画出回归直线.
(3)试预测加工10个零件需要多少时间?
注:=,=-.
【解析】(1)散点图如图:
(2)由表中数据得:x i y i=52.5,
=3.5,=3.5,=54,所以==0.7,
所以=-=1.05,所以=0.7x+1.05.
回归直线如图中所示.
(3)将x=10代入回归直线方程,得=0.7×10+1.05=8.05(小时).
所以预测加工10个零件需要8.05小时.
18.根据“2015年国民经济和社会发展统计公报”中公布的数据,从2011年到2015年,我国的第三产业在GDP中的比重如下:
(1)在所给坐标系中作出数据对应的散点图.
(2)建立第三产业在GDP中的比重y关于年份代码x的回归方程.
(3)按照当前的变化趋势,预测2018年我国第三产业在GDP中的比重. 附:回归直线=+x的斜率和截距的最小二乘估计分别为
=,=-.
【解析】(1)数据对应的散点图如图所示.
(2)=3,=47.06,===1.5,
=-=42.56,
所以回归直线方程为=1.5x+42.56.
(3)代入2018年的年份代码x=8,得=1.5×8+42.56=54.56,
所以按照当时的变化趋势,预计到2018年,我国第三产业在GDP中的比重将达到54.56%.
C组培优练(建议用时15分钟)
19.某考察团对10个城市的职工人均工资x(千元)与居民人均消费
y(千元)进行调查统计,得出y与x具有线性相关关系,且回归方程为
=0.6x+1.2.若某城市职工人均工资为5千元,估计该城市人均消费额
占人均工资收入的百分比为
( D )
A.66%
B.67%
C.79%
D.84%
20.一家商场为了确定营销策略,进行了四次投入促销费用x和商场实际销售额的试验,得到如下数据.
(1)在下面的直角坐标中,画出上述数据的散点图,并据此判断两个变量是否具有较好的线性相关性.
(2)求出x,y之间的回归直线方程=x+.
(3)若该商场计划营销额不低于600万元,则至少要投入多少万元的促销费用?
【解析】(1)散点图如图所示,从图上可以看出两个变量具有较好的线性相关性.
(2)==4,
==250,
(x i-)2=(2-4)2+(3-4)2+(5-4)2+(6-4)2
=4+1+1+4=10,
(x i-)(y i-)=(-2)×(-150)+(-1)×(-50)+1×50+2×150=700.
==70,
=
-=250-70×4=-30.
故所求的回归直线方程为=70x-30.
(3)令70x-30≥600,即x ≥=9(万元),即若该商场计划营销额不低于600万元,则至少要投入9万元的促销费用.
关闭Word文档返回原板块
高中数学。