2017-2018学年高中数学 复习课(二)统计教学案 苏教版必修3

合集下载

高中数学第2章统计2.3总体特征数的估计2.3.1平均数及其估计教学案苏教版必修3(2021学年)

高中数学第2章统计2.3总体特征数的估计2.3.1平均数及其估计教学案苏教版必修3(2021学年)

2017-2018学年高中数学第2章统计 2.3 总体特征数的估计 2.3.1 平均数及其估计教学案苏教版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第2章统计 2.3 总体特征数的估计 2.3.1 平均数及其估计教学案苏教版必修3)的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第2章统计2.3 总体特征数的估计 2.3.1 平均数及其估计教学案苏教版必修3的全部内容。

2.3.1 平均数及其估计预习课本P65~68,思考并完成1.什么叫一组数据的平均数?2.平均数有哪些计算方法?错误!1.平均数的概念一组数据的总和除以数据的个数所得的商就是这组数据的平均数(或均值),一般记为:错误!=错误!.[点睛](1)平均数反映了一组数据的集中趋势,它是一组数据的“重心”,是度量一组数据波动大小的基准.(2)用样本平均数可估计总体平均数.(3)用平均数可以比较两组数据的总体情况,如成绩、产量等.2.平均数的计算(1)定义法:已知x1,x2,x3,…,x n为某样本的n个数据,则这n个数据的平均数为错误!=\f(x1+x2+x3+…+x n,n)。

(2)利用平均数性质:如果x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,…,mxn +a的平均数是m错误!+a.(3)加减常数法:数据x1,x2,…,xn都比较大或比较小,且x1,x2,…,xn在固定常数a 附近波动,将原数据变化为x1±a,x2±a,…,x n±a,新数据的平均数为错误!′,则所求原数据的平均数为错误!′±a。

2017-2018学年高中数学 第2章 统计 2.2 总体分布的估计教学案 苏教版必修3

2017-2018学年高中数学 第2章 统计 2.2 总体分布的估计教学案 苏教版必修3

2.2 总体分布的估计某制造商为2013年全运会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96问题1:上述20个数据中最大值与最小值分别是多少,它们相差多少? 提示:最大值为40.03,最小值为39.95,其差为0.08.问题2:将上述数据分组统计,分组情况为[39.95,39.97),[39.97,39.99),[39.99,40.01),[40.01,40.03],求各组个数.提示:各组数据的个数为2,4,10,4. 问题3:试求出各组数据所占的比例? 提示:分别为0.10,0.20,0.50,0.20.问题4:能否用一个直观图来表示问题2中各组数据的分布情况? 提示:可以.1.频率分布表(1)定义:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.(2)绘制的步骤:①求全距,决定组数和组距,组距=全距组数.②分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间. ③登记频数,计算频率,列出频率分布表. 2.频率分布直方图(1)定义:我们用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图. (2)绘制步骤: ①先制作频率分布表.②建立直角坐标系:把横轴分成若干段,每一段对应一个组的组距,并标上一些关键点. ③画矩形:在横轴上,以连结相邻两点的线段为底,以纵轴上频率组距为高作矩形,这样得一系列矩形,就构成了频率分布直方图.3.频率分布折线图(1)定义:把频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.(2)总体分布密度曲线:频率折线图的优点是它反映了数据的变化趋势,如果将样本容量取得足够大,分组的组距取得足够小,则相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线.1.在频率分布表中,除最后一个区间是闭区间,其他区间均为左闭右开区间,这样做的目的是为了不重不漏,避免丢失样本数据.2.在频率分布直方图中,各个小矩形的面积之和为1.3.频率分布直方图直观地显示了数据分布信息,从而为分析估计总体提供了依据. 4.频率分布折线图反映了数据的变化趋势,可用来对数据进行估计和预测.[例1] 从某校参加 2016年全国高中数学联赛预赛的600名同学中,等可能抽取若干名同学,将他们的成绩制成频率分布表,下面给出了此表中部分数据.(1)根据表中已知数据,依次写出在①、②、③处的数值; (2)补全在区间[70,140]上的频率分布直方图;(3)若成绩不低于110分的同学能参加决赛,那么可以估计该校大约有多少学生能参加决赛?[思路点拨] 根据频率分布表作出频率分布直方图. [精解详析] (1)50 0.04 0.10. (2)如图:(3)成绩不低于110分的同学能参加决赛的频率为0.08+0.04+0.02=0.14,所以估计该校能参加决赛的人数大约为600×0.14=84. [一点通] 1.在列频率分布表时,全距、组距、组数有如下关系: (1)若全距组距为整数,则全距组距=组数.(2)若全距组距不为整数,则全距组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.1. 从全校参加科技知识竞赛的学生试卷中,抽取一个样本,考察竞赛的成绩分布.将样本分成5组,绘成频率分布直方图(如图),图中从左到右各小组的小长方形的高的比是1∶3∶6∶4∶2,最右边一组的频数是6.请结合频率分布直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表.解:(1)由于各组的组距相等,所以各组的频率与各小长方形的高成正比且各组频率的和等于1,那么各组的频率分别为116,316,616,416,216.设该样本容量为n,则6n=216,所以样本容量为n=48.49;(3)求样本数据不足0的频率.解:(1)频率分布表如下:(2)频率分布直方图如图所示:(3)样本数据不足0的频率为7+11+15+40200=0.365.[例2] (12分)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,绘制出频率分布直方图(如图所示),第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [思路点拨] (1)利用频率等于对应小长方形面积来确定;(2)满足条件的频率之和即为达标率.[精解详析] (1)由题中可知第二小组[100,110)对应的频率组距为0.008,而组距为10, 故频率为0.008×10=0.08,分)设样本容量为为n ,则12n=0.08,∴n =分)(2)根据频率分布直方图,次数在110以上共有四组. 估计该校全体高一学生的达标率为:1-0.04-0.08=分)[一点通] 1.频率分布直方图的性质:(1)因为小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3.观察新生婴儿的体重(单位:g),其频率分布直方图如下图所示,则新生婴儿体重在[2 700,3 000)内的频率为________.解析:由图可知当新生婴儿体重在[2 700,3 000),而组距为300,所以频率为0.001×300=0.3.答案:0.34.为了了解某校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为12,则报考飞行员的学生人数是________.解析:依题意,设第2小组的频率为2x ,则有6x =1-(0.037+0.013)×5,得2x =0.25,即第2小组的频率为0.25,因此报考飞行员的学生人数是120.25=48.答案:485.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间对某地居民调查了10 000人,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人做进一步调查,则在[2.5,3](小时)时间段内应抽出的人数是________.解析:抽出的100人中平均每天看电视的时间在[2.5,3](小时)时间内的频率是0.5×0.5=0.25,所以这10 000人中平均每天看电视的时间在[2.5,3](小时)时间内的人数是10 000×0.25=2 500,抽样比是10010 000=1100,则在[2.5,3](小时)时间段内应抽出的人数是2 500×1100=25.答案:251.频率分布表和频率分布直方图都是用来描述样本数据情况的,是相同数据的两种不同的表达方式.2.频率分布表在数量表示上比较确切,但不够直观、形象,用它来分析数据分布的总体趋势不太方便,而频率分布直方图能够表示大量数据,非常直观、形象地表明分布的规律,使我们能够看到在分布表中看不清楚的数据模式.但是直方图会丢失一些信息,如原始数据不能在图中表示出来.课下能力提升(十一)一、填空题1.如图是容量为100的样本的频率分布直方图,试根据图形中的数据填空.(1)样本数据在范围[6,10)内的频率为________;(2)样本数据落在范围[10,14)内的频数为________.解析:(1)样本数据在[6,10)内频率为0.08×4=0.32.(2)在[10,14)内的频数为0.09×4×100=36.答案:(1)0.32 (2)362.为了调查某厂工人生产某种产品的能力,随机抽查了20名工人某天生产该产品的数量,产品数量的分组区间为[45,55),[55,65),[65,75),[75,85),[85,95],由此得到频率分布直方图如下图,则这20名工人中一天生产该产品数量在[55,75)的人数是________.解析:由题意得,这20名工人中一天生产该产品数量在[55,75)的人数是20×[(0.040200人在一天,C,D四处数________.解析:设A 处的数据为x ,则C 处的数据为x -4, 则x +x -4+8+52+20+4=200,x =60, 则B 处数据为60200=0.3.答案:0.35.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________. 解析:设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h +0.07+0.06+0.02)=1,h =0.04.志愿者年龄在[25,35)的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)的人数约为0.55×800=440.答案:0.04 440 二、解答题6.某工厂对一批产品进行了抽样检测,右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106).已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是多少?解:产品净重小于100克的频率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则36n=0.300,所以n =120,净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.750,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.7.根据空气质量指数API(为整数)的不同,可将空气质量分级如下表:(50,100],(100,150],(150,200],(200,250],(250,300]进行分组,得到频率分布直方图如图.(1)求频率分布直方图中x 的值;(2)计算一年中空气质量为良和轻微污染的总天数. (77128, 31 825+2365+71 825+31 825+=73×5) 解:(1)由图可知+89 125)×50=1-1239 125×50,解得x =11918 250;219天.从这个水库中多个不同位置捕捞出100(如图所(1)求出各组相应的频率;(2)估计数据落在[1.15,1.30]中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中还有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.解:(1)由频率分布直方图和频率=组距×(频率组距)可得下表(2)0.30+0.15+0.02=中的概率约为0.47.(3)由分层抽样中每个个体被抽到的概率相同知:设水库中鱼的总条数为N ,则120N =6100,即N =2 000,故水库中鱼的总条数约为2 000条.第2课时 茎叶图2016年CBA 新赛季,山东队某队员在该赛季各场比赛的得分情况如下:15,21,20,19,23,26,25,20问题1:利用这些数据能否直接判断出该运动员发挥水平?提示:可以,但会存在偏差.问题2:能否利用频率分布直方图来分析这些数据?提示:由于样本数据较少,一般不用直方图.问题3:由于数据较少,可否有更快捷的作图方式来分析数据?提示:有.1.茎叶图的制作方法(1)画“茎”:“茎”表示两位数的十位数字,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,再画上竖线作为分界线.(2)添“叶”:“叶”画在分界线的另一侧表示两位数的个位数字,共茎的叶一般按从小到大(或从大到小)的顺序同行列出.2.茎叶图刻画数据的优缺点(1)茎叶图刻画数据的优点:①所有的信息都可以从茎叶图中得到.②茎叶图便于记录和表示.(2)茎叶图刻画数据的缺点:当样本数据很多时,茎叶图的效果就不是很好了.1.茎叶图画茎时可以画成纵向的,也可画成横向的.2.茎叶图表示数据时也可以表示三位数据,此时茎表示前两位,叶表示最后一位.3.茎叶图主要是针对样本数据不多或数据位数较少时,便于快速记录分析;样本数据较多或数据位数较多时,不方便使用.[例1] 某中学甲、乙两名同学最近几次的数学考试成绩情况如下:甲的得分:95,81,75,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.[思路点拨] 确定茎与叶,作出茎叶图,并判断比较.[精解详析] 甲、乙两人数学成绩的茎叶图,如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,大多集中在80~100之间,中位数是98分;甲同学的得分情况除一个特殊得分外,也大致对称,多集中在70~90之间,中位数是88分,但分数分布相对于乙来说,趋向于低分阶段.因此,乙同学发挥比较稳定,总体得分情况比甲同学好.[一点通] 绘制茎叶图关键是分清茎和叶,一般地说数据是两位数的,十位上数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要合理的选择茎和叶.1.某次运动会甲、乙两名射击运动员射击成绩如下:(单位:环)甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8 乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1 用茎叶图表示甲、乙二人成绩.解:中间数字表示成绩的整环数,旁边数字表示小数点后的数字.2.某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示.(2)进行分析,得出什么结论?解:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,而报纸上每个句子的字数集中在20~40之间,可看出电脑杂志上每个句子的平均字数比报纸上的少,说明它作为科普读物需要通俗易懂、简明.[例2] (12分)为缓解车堵现象,解决车堵问题,北京市交通局调查了甲、乙两个交通站的车流量,在2016年5月随机选取了14天,统计每天上午7:30~9:00间各自的车流量(单位:百辆)得到如图所示的茎叶图,根据茎叶图回答以下问题.(1)甲、乙两个交通站的车流量的中位数分别是多少?(2)甲、乙两个交通站哪个站更繁忙?说明理由.[思路点拨] 根据茎叶图中的数据分析并作出判断.[精解详析] (1)(4分) 乙交通站的车流量的中位数为36+372= (8分) (2)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙. (12分)[一点通] 对于茎叶图要首先分清楚茎叶所表示的意义及叶的排放规律,它也直观地表3.本例中条件不变,试计算甲、乙两交通站的车流量在[10,40]之间的频率.4天,6天,4.从甲、乙两个品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下: 甲品种:271 273 280 285 285 287 292294 295 301 303 303 307 308 310 314319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312313 315 315 316 318 318 320 322 322324 327 329 331 333 336 337 343 356由以上数据设计了茎叶图如图所示根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①________________________________________________________________________;②________________________________________________________________________.解析:由茎叶图可以看出甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中(大部分集中在312~337之间),还可以看出乙的平均长度应大于310,而甲的平均长度要小于310等,通过分析可以得到答案.答案:①甲棉花纤维的长度比较分散,乙棉花纤维的长度比较集中②甲棉花纤维的长度的平均值小于乙棉花纤维长度的平均值(答案不唯一)茎叶图能够展示数据的分布情况,它的茎是指中间的一列数,叶是从茎的旁边生长出来的数.用茎叶图表示数据有两个最大优点:一是原始数据没有丢失,二是便于记录和表示.课下能力提升(十二)一、填空题1.在茎叶图中比40大的数据有________个.解析:由茎叶图中知比40大的有47、48、49,共3个.答案:32.在下面的茎叶图中茎表示数据的整数部分,叶表示数据的小数部分,则比数7.5小的有________个.解析:比7.5小的有6.1,6.2,6.3,7.2,7.3,7.4,共6个.答案:63.数据123,127,131,151,157,135,129,138,147,152,134,121,142,143的茎叶图中,茎应取________.解析:在茎叶图中叶应是数据中的最后一位,从而茎就确定了.答案:12、13、14、154.在如图所示的茎叶图中落在[20,40]上的频数为________.解析:由茎叶图中给出了12个数据,其中在[20,40]上有8个.答案:85.某中学高一(1)甲、乙两同学在高一学年度的考试成绩如下:从茎叶图中可得出________同学成绩比较好.解析:由图中数据可知甲同学的成绩多在80分以上,而乙相对差一些.答案:甲二、解答题6.某中学高二(1)班甲、乙两名同学自上高中以来每次数学考试成绩情况如下(单位:分):甲的得分:81,75,91,86,89,71,65,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101;画出甲乙两人数学成绩的茎叶图,请根据茎叶图对两个人的成绩情况进行比较.解:甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图可以看出,乙同学的得分集中在98分附近,数据分布是大致对称的;甲同学的得分集中在86分附近,分数数据分布也是大致对称的,但较分散.所以乙同学发挥比较稳定,得分情况好于甲.7.50辆汽车经过某一段公路的时速记录如图所示:将其分成7组并要求:(1)列出样本的频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述结果,估计汽车时速在哪组的几率最大?解:(1)由茎叶图知,数据最大值为33,最小值为13,分为7组,组距为3,则频率分布表为:(2)频率分布直方图及频率分布折线图如图所示:(3)汽车时速在[21.5,24.5)内的几率最大,为0.22.8.茎叶图是某班在一次测验时的成绩,伪代码用来同时统计女生、男生及全班成绩的平均分.试回答下列问题:(1)在伪代码中,“k=0”的含义是什么?横线①处应填什么?(2)执行伪代码,输出S,T,A的值分别是多少?(3)请分析该班男女生的学习情况.解:(1)全班32名学生中,有15名女生,17名男生,在伪代码中,根据“S←S/15,T ←T/17”可推知,“k=1”和“k=0”分别代表男生和女生;S,T,A分别代表女生、男生及全班成绩的平均分;横线①处应填“(S+T)/32”.(2)女生、男生以及全班成绩的平均分分别为S=78,T=77,A≈77.47.(3)15名女生成绩的平均分为78,17名男生成绩的平均分为77.从中可以看出女生成绩比较集中.整体水平稍高于男生;男生中的高分段比女生高,低分段比女生多.相比较男生两极分化比较严重.。

高中数学第2章统计2.4线性回归方程教学案苏教版必修3(1)(2021学年)

高中数学第2章统计2.4线性回归方程教学案苏教版必修3(1)(2021学年)

2017-2018学年高中数学第2章统计 2.4线性回归方程教学案苏教版必修3(1)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2017-2018学年高中数学第2章统计 2.4线性回归方程教学案苏教版必修3(1))的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。

本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2017-2018学年高中数学第2章统计 2.4 线性回归方程教学案苏教版必修3(1)的全部内容。

2.4 错误!预习课本P74~75,思考并完成以1.变量间有哪些常见关系?2.什么叫散点图?怎样作出散点图?3。

什么叫线性回归方程?错误!1.变量间的常见关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.[点睛]函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,如试验田的施肥量x与水稻的产量y.当自变量x每取一确定值时,因变量y的取值带有一定的随机性,即还受其他环境因素的影响.2。

散点图(1)概念:将样本中n个数据点(xi,yi)(i=1,2,…,n)描在平面直角坐标系中,用来表示两个变量的一组数据的图形叫做散点图.(2)作法:建立平面直角坐标系,用横坐标表示一个变量,用纵坐标表示另一个变量,将给出的数据所表示的点在坐标系内描出,即可得到散点图.[点睛]对于散点图要注意以下几点.①若所有的样本点都落在某一函数曲线上,则变量间具有函数关系.②若所有的样本点都落在某一函数曲线附近,则变量间就具有相关关系.③若散点图中的点的分布没有什么规律,则这两变量之间不具有相关关系,它们之间是相互独立的.3.线性相关关系能用直线错误!=bx+a近似表示的相关关系叫线性相关关系.4.线性回归方程(1)概念:设有n对观察数据如下:当a,b使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(y n-bxn-a)2取得最小值时,就称方程错误!=bx+a为拟合这n对数据的线性回归方程,该方程所表示的直线称为回归直线.(2)用回归直线进行数据拟合的一般步骤①作出散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,用公式错误!求出a,b,并写出线性回归方程.错误!1.下列各组变量是相关关系的是________.(1)电压U与电流I;(2)圆面积S与半径R;(3)粮食产量与施肥量;(4)广告费支出与商品销售额.解析:(1)(2)中两个变量间是函数关系,(3)(5)中两个变量之间有关系,但不能用函数表达,是相关关系.答案:(3)(4)2.5名学生的化学和生物成绩如下表所示:判断化学和生物成绩之间是否具有相关关系________(填“具有”“不具有").答案:具有[典例]在下列各个量与量的关系中:①正方体的表面积与棱长之间的关系;②某同学的数学成绩和物理成绩之间的关系;③家庭的收入与支出之间的关系;④某户家庭用电量与水费之间的关系.其中是相关关系的为________________.[解析] ①正方体的表面积与棱长之间的关系是确定的函数关系;④某户家庭用电量与水费之间无任何关系.②③中,都是非确定的关系,但自变量取值一定时,因变量的取值带有一定的随机性.[答案]②③判断两个变量是否具有相关关系,主要有两种方法:一是根据相关关系的定义进行判断,看这两个变量是否具有不确定性.二是利用散点图,看散点图中的点是否都落在某一函数曲线附近.[活学活用]关于人体的脂肪含量(百分比)与年龄关系的研究中,得到如下一组数据:年龄2327394145495053脂肪9。

高中数学 第二章 统计教学案2苏教版必修3

高中数学 第二章 统计教学案2苏教版必修3
统计
教学目标:
1、掌握统计的基础知识;
2、能利用相关知识 解决简单的问题。
教学重难点:统计的应用
教学过程
集体备课部分(学生活动部分)
自学评价:
1.用系统抽样的方法从某校400名学生中抽取容量为20的一个样本,将400名学生随机编为1﹣400号,按编号顺序平均分为20各组(1﹣20号,21﹣40号,…381﹣4 00号),若第1组中用抽签的方法确定抽出的号码为12,则第14组抽取的号码为.
2. 某地区为了解岁的 老人的日平均睡眠时间(单位:),随机选择了50位老人进行调查,下表是这50位老人睡眠时间的频率分布表:
序号
分组
(睡眠时间)
组中值()
频数
(人数)
频率()
1
6
2
10
3
20
4
10
5
4
在上述统计数据的分析中这50位老人的睡眠平均值为
互动探究:
例1.
已知等差数列{an}的公差为d,若a1,a2,a3,a4,a5的方差为8,则d的值为.
(1)估计这所学校高三年级全体 男生身高在180cm以上(含180cm)的人数 ;
(2)若从身高属于第六组和第八组的所有男生中随机抽取 两人,记他们的身高分别为x,y,求满足“|x﹣y|≤5”的事件的概率.
个性备课部分
当堂检测
某校甲、乙两个班级各有5名编号为1,2 ,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:
学生
1号
2号Βιβλιοθήκη 3号4号5号甲班
6
7
7
8
7
乙班
6
7
6
7
9
则以上 两组数据的方差中较小的一个为★.

苏教版高中高二数学必修3《统计》教案及教学反思

苏教版高中高二数学必修3《统计》教案及教学反思

苏教版高中高二数学必修3《统计》教案及教学反思一、教学目标通过本节课的学习和思考,让学生了解并掌握以下知识:1.了解概率统计是什么,以及它在我们日常生活中的应用;2.掌握二项分布的概念、性质和应用,能够利用二项分布进行实际问题的解决;3.掌握泊松分布的基本知识和特点,能够根据实际情况选择不同的分布模型;4.能够利用中心极限定理解决实际问题和对数据进行分析。

二、教学内容1. 概率统计(1)概念概率统计是概率论和统计学的组合,它主要研究随机现象的规律和规律的应用问题。

(2)应用在我们的生活和工作中,概率统计有着非常重要的应用。

例如:天气预报、金融风险分析、质量控制、医学诊断等等。

2. 二项分布(1)概念二项分布是把n个相同的独立的伯努利试验重复进行,且每次试验只有两个结果时的概率分布。

(2)性质二项分布具有以下性质:•试验次数n确定时,二项分布仅由成功概率p确定;•二项分布是离散分布,其取值只能是非负整数;•二项分布是对称的当且仅当p=0.5.(3)应用二项分布的应用非常广泛,例如:球类比赛的胜负、某种产品的合格率、股票价格上涨或下跌的概率等。

3. 泊松分布(1)概念泊松分布是一种离散分布,它适用于表示单位时间或空间内某事件发生次数的概率分布。

(2)特点泊松分布的特点:•事件出现次数的概率与时间长度成正比,与时间长度无关;•事件的发生是独立的,且在一段时间内发生的次数是有限的;•很多的小概率事件会造成一个大概率事件。

(3)应用泊松分布广泛应用于解决人群中非病因的死亡率、单位时间内某机器失效的次数、电话交换机接到电话的数量等问题。

4. 中心极限定理(1)概念中心极限定理是数理统计学的基本定理,它表明在适当的条件下,大量独立随机变量之和的分布趋近于正态分布。

(2)应用中心极限定理常被应用于测量样本的均值和方差,通过对均值和方差的估计抽取出随机变量,从而推断总体的均值和方差。

三、教学方法本节课的教学采用多媒体辅助教学的方式,老师通过讲授理论知识,观看视频,模拟实验等多种形式将重点难点知识点讲透彻,深入学生的思想中。

2017-2018学年苏教版高中数学必修3全册课导学案含答案

2017-2018学年苏教版高中数学必修3全册课导学案含答案

2017-2018学年数学苏教版必修3全册导学案目录1.1算法的含义导学案练习1.2.1顺序结构导学案练习1.2.2选择结构导学案练习1.2.3循环结构导学案练习1.3基本算法语句导学案练习1.4 算法案例(2)导学案练习1.4算法案例(1)导学案练习1.4算法案例(3)导学案练习2.1抽样方法(一)导学案练习2.1抽样方法(三)导学案练习2.1抽样方法(二)导学案练习2.2总体分布的估计(一)导学案练习2.2总体分布的估计(二)导学案练习2.3总体特征数的估计(一)导学案练习2.3总体特征数的估计(二)导学案练习2.4线性回归方程(一)导学案练习 2.4线性回归方程(二)导学案练习 3.1.1 随机现象导学案练习3.1.2 随机事件的概率导学案练习 3.2 古典概型(一)导学案练习 3.2 古典概型(二)导学案练习3.3 几何概型(一)导学案练习3.3 几何概型(二)导学案练习3.4 互斥事件及其发生的概率(一)导学案练习3.4 互斥事件及其发生的概率(二)导学案练习第一章算法初步1.1算法的含义【新知导读】1.什么是算法?试从日常生活中找3个例子,描述它们的算法.2.我们从小学到初中再到高中所学过的许多数学公式是算法吗?【范例点睛】例1.早上从起床到出门需要洗脸刷牙(5min)、刷水壶(2min)、烧水(8min)、泡面(3min)、吃饭(10min)、听广播(8min)几个步骤.从下列选项中选出较好的一种算法A.第一步洗脸刷牙、第二步刷水壶、第三步烧水、第四步泡面、第五步吃饭、第六步听广播.B.第一步刷水壶、第二步烧水同时洗脸刷牙、第三步泡面、第四步吃饭、第五步听广播C第一步刷水壶、第二步烧水同时洗脸刷牙、第三步泡面、第四步吃饭同时听广播.D.第一步吃饭同时听广播、第二步泡面、第三步烧水同时洗脸刷牙、第四步刷水壶.思路点拨:从四个答案所给出的步骤是否合理、最少需要花费多少时间入手,进行判断.易错辨析:选择A很大程度上是受人们的通常的习惯所影响,即起床后首先应该洗脸刷牙再做其他的事情.方法点评:作为完成过程的算法来说,要讲究一个优劣之分,也即完成这个过程用时最少的是一个好算法,所以.应选C.例2.一位商人有9枚银元,其中有1枚略轻的是假银元.你能用天平(不用砝码)将假银元找出来吗?思路点拨:最容易想到的解决这个问题的一种方法是:把9枚银元按顺序排成一列,先称前2枚,若不平衡,则可找出假银元;若平衡,则2枚银元是真的,再依次与剩下的银元比较,就能找出假银元.这种算法最少要称1次,最多要称7次,是不是还有更好的办法,使得称量次数少一些?我们可以采用下面的方法:1.把银元分成3组,每组3枚.2.先将两组分别放在天平的两边.如果天平不平衡,那么假银元就在轻的那一组;如果天平平衡,则假银元就在未称的第3组里.3.取出含假银元的那一组,从中任取两枚银元放在天平的两边,如果左右不平衡,则轻的那一边就是假银元;如果天平两边平衡,则未称的那一枚就是假银元.方法点评:经分析发现,这种算法只需称量2次,这种做法要明显好于前一种做法.从以上两个问题中可以看出,同一个问题可能存在着多种算法,其中一些可能要比另一些好.在实际问题和算法理论中,找出好的算法是一项重要的工作. 【课外链接】1.设计一个算法,求840与1764的最大公因数.思路点拨:该算法是在对自然数进行素因数分解的基础上设计的.解答这个问题需要按以下思路进行.首先,对两个数分别进行素因数分解:75328403⨯⨯⨯=, 2227321764⨯⨯=.其次,确定两数的公共素因数:7,3,2.接着,确定公共素因数的指数:对于公共素因数22,2是1764的因数,32是840的因数,因此22是这两个数的公因数,这样就确定了公共素因数2的指数为2.同样,可以确定出公因数3和7的指数均为1.这样,就确定了840与1764的最大公因数为847322=⨯⨯【随堂演练】1.算法是指 ( ) A .为解决问题而编写的计算机程序 B.为解决问题而采取的方法和步骤 C .为解决问题而需要采用的计算机程序 C.为解决问题而采用的计算方法 2.看下面的四段话,其中不是解决问题的算法的是( ) (A )从济南到北京旅游,先坐火车,再坐飞机抵达(B )解一元一次方程的步骤是去分母、去括号、移项、合并同类项、系数化为1 (C )方程x 2-1=0有两个实根(D )求1+2+3+4+5的值,先计算1+2=3,再求3+3=6,6+4=10,10+5=15,最终结果为153.方程⎩⎨⎧=+=+1043732y x y x 的解集是_______________4.买一个茶杯1.5元,现要写出计算买n 个茶杯所需要的钱数的一个算法,则这个算法中必须要用到的一个表达式为_______________ 5.设计算法,判断97是否为素数.6.设计算法,求1356和2400的最小公倍数.7.有两个瓶子A 和B ,分别盛放醋和酱油,要求将它们互换(即A 瓶原来盛醋,现改盛酱油;B 瓶则相反)8.设计算法,将三个数按从大到小的顺序排列.9.有13个球看上去一模一样,但其中一个质量不同(它比其他12个略重),现在有一个天平(没有砝码),要求给出一种操作方法,把这个球找出来.参考答案 1.1算法的含义【新知导读】1.对一类问题的机械的、统一的求解方法称为算法 2.是 【随堂演练】1.B 2.C 3.⎩⎨⎧==12y x 4.1.5n5.S1 对两个数分别进行素因数分解:1356=22×3×113 2400=25×3×52S2 确定两数的所有素因数:2,3,5,113S3 确定素因数的指数:2的指数为5,3的指数为1,5的指数为2, 113的指数为1 S4 输出结果[1356,2400]=25×3×52×113. 6. S1 引入第三个空瓶即C 瓶; S2 将A 瓶中的醋装入C 瓶中; S3 将B 瓶中的酱油装入A 瓶中; S4 将C 瓶中的醋装入B 瓶中; S5 交换结束。

高中数学 第2章 统计章末复习课学案 苏教版必修3-苏教版高一必修3数学学案

高中数学 第2章 统计章末复习课学案 苏教版必修3-苏教版高一必修3数学学案

第2章统计章末复习课网络构建核心归纳1.关于抽样方法(1)用随机数表法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”凑齐位数.(2)两种抽样方法的异同点类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽到的可能性相同从总体中逐个抽取总体中的个体数较少分层抽样将总体分成几层,按各层个体数之比抽取各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.关于用样本估计总体(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)平均数反映了样本数据的平均水平,而标准差反映了样本数据的波动程度.要点一抽样方法的运用1.抽样方法有:简单随机抽样、分层抽样.2.两种抽样方法比较【例1】 某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为________.解析 由从高一年级学生中抽出20人知抽样比为20400=120,所以从高二年级学生中抽取的人数为360×120=18,所以从高三年级学生中抽取的人数为55-20-18=17. 答案 17【训练1】 某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n 人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n =( ) A.660 B.720 C.780D.800解析 由已知条件,抽样比为13780=160,从而35600+780+n =160,解得n =720.答案 B要点二 用样本的频率分布估计总体分布此类问题通常要对样本数据进行列表、作图处理.这类问题采用的图表主要有:条形图、直方图、频率折线图、扇形图等.它们的主要优点是直观,能够清楚表示总体的分布走势. 【例2】 某制造商生产一批直径为40 mm 的乒乓球,现随机抽样检查20个,测得每个球的直径(单位:mm ,保留两位小数)如下:40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.0140.02 39.98 40.00 39.99 40.00 39.96 (1)完成下面的频率分布表,并画出频率分布直方图;分组 频数 频率 频率组距 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]合计(2)假定乒乓球的直径误差不超过0.02 mm 为合格品,若这批乒乓球的总数为 10 000个,试根据抽样检查结果估计这批产品的合格个数. 解 (1)频率分布表和频率分布直方图如图分组 频数 频率 频率组距 [39.95,39.97) 2 0.10 5 [39.97,39.99) 4 0.20 10 [39.99,40.01) 10 0.50 25 [40.01,40.03]4 0.20 10 合计201.0050(2)∵抽样的20个产品中在[39.98,40.02]范围内有17个, ∴产品合格率为1720×100%=85%.∴10 000×85%=8 500(个).故根据抽样检查结果,可以估计这批产品的合格数为8 500个.【训练2】 有一个容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18; [21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比. 解 (1)样本的频率分布表如下:分组 频数 频率 累积频率 [12.5,15.5) 6 0.06 0.06 [15.5,18.5) 16 0.16 0.22 [18.5,21.5) 18 0.18 0.40 [21.5,24.5) 22 0.22 0.62 [24.5,27.5) 20 0.20 0.82 [27.5,30.5) 10 0.10 0.92 [30.5,33.5] 8 0.08 1.00 合 计1001.00(2)频率分布直方图如图.(3)小于30的数据约占90%.要点三 用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个数据的平均数;平均数就是所有样本数据的平均值,用x -表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式是s =1n[x 1-x-2+x 2-x-2+…+x n -x-2].【例3】 汽车行业是碳排放量比较大的行业之一,若规定CO 2排放量超过130 g/km 的M 1型新车将受到惩罚(视为排放量超标),某检测单位对甲、乙两品牌M 1型新车分别抽取5辆进行CO 2排放量检测,记录如下(单位:g/km):经测算发现,乙品牌车CO 2排放量的平均值为乙=120 g/km. 若乙品牌车比甲品牌车的CO 2排放量的稳定性要好,求x 的取值范围. 解 ∵x -甲=80+110+120+140+1505=120,∴x -甲=x -乙=120,由x -乙=100+120+x +y +1605=120,得x +y =220.5s 2甲=(80-120)2+(110-120)2+(120-120)2+(140-120)2+(150-120)2=3 000, 5s 2乙=(100-120)2+(120-120)2+(x -120)2+(y -120)2+(160-120)2=2 000+(x -120)2+(y -120)2.由乙品牌车比甲品牌车的CO 2排放量的稳定性好,得5s 2乙<5s 2甲,即2 000+(x -120)2+(y -120)2<3 000.又∵x +y =220,∴x 2-220x +11 700<0, 解得90<x <130,即x 的取值范围为{x |90<x <130}.【训练3】 某校高一(1),(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表所示:(1)高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里可算是上游了”.(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议. 解 (1)由中位数可知85分排在25名之后,从名次上讲,85分不能算是上游.(2)高一(1)班成绩的中位数是87分,说明高于87分的人占一半,而平均数为79分,标准差又很大,说明低分也很多,两极分化严重,建议加强对学习困难者的帮助.高一(2)班成绩的中位数和平均数都是79分,标准差又小,说明学生成绩之间的差别较小,学习很差的学生少,但学习优异的学生也很少,建议采取措施提高优秀率.。

2017-2018学年高中数学第2章统计2.4线性回归方程教学案苏教版必修3

2017-2018学年高中数学第2章统计2.4线性回归方程教学案苏教版必修3

2.4 线性回归方程房地产涨价一直是受关注的民生问题之一,以下是某房地产开发商在2013年前两季度销售的新楼盘中的销售价格y(单位:万元)与房屋面积x(单位:m2)的数据.问题1:在平面直角坐标系中,以x为横坐标,y为纵坐标作出表示以上数据的点.提示:问题2:从上图中发现x,y有何关系?是函数关系吗?提示:从图中发现x逐渐增大时,y逐渐增大,但有个别情况.不是函数关系.1.变量间的常见关系(1)函数关系:变量之间的关系可以用函数表示,是一种确定性关系.(2)相关关系:变量之间有一定的联系,但不能完全用函数来表达.2.散点图从一个统计数表中,为了更清楚地看出变量x与变量y是否有相关关系,常将x的取值作为横坐标,将y的相应取值作为纵坐标,将表中数据构成的数对所表示的点在坐标系内标出,我们称这样的图形叫做散点图.某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:问题1:判断气温与杯数是否有相关关系? 提示:作散点图可知具有相关关系.问题2:若某天的气温是-5℃,能否根据这些数据预测小卖部卖出热茶的大体杯数? 提示:可以.根据散点图作出一条直线,求出直线方程后可预测.1.线性相关关系:能用直线y ^=bx +a 近似表示的相关关系. 2.线性回归方程: 设有n 对观察数据如下:当a ,b 使Q =(y 1-bx 122n n a )2取得最小值时,就称方程y ^=bx+a 为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.3.用回归直线进行数据拟合的一般步骤: (1)作出散点图,判断散点是否在一条直线附近. (2)如果散点在一条直线附近,用公式⎩⎪⎨⎪⎧b =∑i =1nx i y i -n x y ∑i =1nx 2i-n x2=∑i =1nx i -xy i -y∑i =1nx i -x2a =y -b x求出a ,b ,并写出线性回归方程.1.函数关系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系,如试验田的施肥量x 与水稻的产量y .当自变量x 每取一确定值时,因变量y 的取值带有一定的随机性,即还受其他环境因素的影响.2.用最小平方法求回归直线的方程的前提是先判断所给数据具有线性相关关系(可用散点图判断).否则求出的线性回归方程是无意义的.[例1] 关于人体的脂肪含量(百分比)与年龄关系的研究中,得到如下一组数据:(1)将上表中的数据制成散点图;(2)你能从散点图中发现年龄与脂肪含量近似成什么关系吗?(3)若成线性相关关系,请你画一条直线近似地表示这种线性关系.[思路点拨] 作出散点图判断相关关系.[精解详析] (1)以年龄作为x轴,脂肪含量为y轴,可得相应散点图,如图所示.(2)从散点图可以发现,年龄与脂肪含量之间具有线性相关关系,且是正相关的.(3)画出的一条直线如上图.[一点通]判断变量间有无线性相关关系,一种常用的简便可行的方法就是绘制散点图,如果发现点的分布从整体上看大致在一条直线附近,那么这两个变量是线性相关的.1.根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系________.(填“是”或“否”)解析:从散点图看,形状呈团状,无任何规律,故不具有线性相关关系.答案:否2.5名学生的数学成绩和化学成绩如下表:解:以x 轴表示数学成绩,y 轴表示化学成绩,可得相应的散点图如右图所示.由散点图可知,两者之间具有线性相关关系且是正相关.[例2] (12分)假设关于某设备的使用年限x 和所支出的维修费用y (单位:万元)有如下的统计资料:若由资料知y (1)线性回归方程y ^=bx +a 的系数a ,b ; (2)使用年限为10年时,试估计维修费用是多少.[思路点拨] 根据公式求b ,代入a =y -b x 求a 并判断.[精解详析] (1)∵x =4,y =5,∑i =15x 2i =90,∑i =15x i y i =112.3,∴b =∑i =15x i y i -5x y∑i =15x 2i -5x 2=112.3-5×4×590-5×42=1.23. (6分)a =y -b x =5-1.23×4=0.08.(8分)(2)线性回归方程是y ^=1.23x +0.08,当x =10时,y ^=1.23×10+0.08=12.38, 所以估计使用10年时维修费用是12.38万元. (12分)[一点通]1.求线性回归方程的一般步骤是:(1)画出散点图,判断是否具有相关关系.(2)计算x ,y ,∑i =1nx 2i ,∑i =1nx i y i .(3)代入公式计算b 、a 的值. (4)写出线性回归方程.2.利用回归直线可以预测,若回归直线方程为y ^=bx +a ,则x =x 0处的估计值为y ^=bx 0+a .(注意:估计值并不一定是真实值.)3.本例条件不变,试探究:(1)所求的回归直线必过(x ,y )点吗?(2)若设备的使用年限x 每增加一年,则所支出的维修费用y 如何变化? 解:(1)由线性回归方程 y ^=1.23x +0.08,又x =4,y =5,验证知必过(x ,y )点.(2)由线性回归方程知,使用年限每增加一年维修费用就提高1.23万元.4.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得线性回归方程y ^=bx +a 中b =-2,预测当气温为-4℃时,用电量的度数约为________.解析:x =10,y =40,回归方程过点(x ,y ), ∴40=-2×10+a ,∴a =60. ∴y =-2x +60.令x =-4,∴y ^=(-2)×(-4)+60=68. 答案:685.以下是江苏省某城镇收集到的新房屋的销售价格y 和房屋的大小x 的数据:(1)(2)求回归方程;(3)估算一下96 m 2的房价. 解:(1)散点图如图所示.(2)n =5,∑i =15x i =545,x =109,∑i =15y i =116,y =23.2,∑i =15x 2i =60 975,∑i =15x i y i =12 952.b =5i =1x i y i -5x y5i =1x 2i -5x2=12 952-5×109×23.260 975-5×1092=154785≈0.196 2,a =y -b x =23.2-154785×109≈1.816 6. ∴回归直线方程为y ^=0.196 2x +1.816 6. (3)当x=96时,y ^≈20.7.因此,96 m 2的新房屋大约为20.7万元.用线性回归方程估计总体的一般步骤:(1)作出散点图,判断散点是否在一条直线附近;(2)如果散点在一条直线附近,用公式求出a 、b ,并写出线性回归方程; (3)根据线性回归方程对总体进行估计.课下能力提升(十四)一、填空题1.已知x ,y 之间的一组数据为:则回归直线y ^=bx +a 必过点________.解析:x =32,y =4,∴y ^=bx +a 必过点(32,4).答案:(32,4)2.对某台机器购置后的运营年限x (x =1,2,3…)与当年利润y 的统计分析知具备线性相关关系,回归方程为y =10.47-1.3x ,估计该台机器使用________年最合算.解析:只要预计利润不为负数,使用该机器就算合算,即y ≥0,所以10.47-1.3x ≥0,解得x ≤8.05,所以该台机器使用8年最合算.答案:83.已知某工厂在2013年每月产品的总成本y (万元)与月产量x (万件)之间有线性相关关系,回归方程为y ^=1.215x +0.974,若月产量增加4万件时,则估计成本增加________万元.解析:由y ^1=1.215x 1+0.974, y ^2=1.215(x 1+4)+0.974,得y ^2-y ^1=1.215×4=4.86(万元). 答案:4.864.下表是广告费用与销售额之间的一组数据:销售额y (千元)与广告费用x (千元)之间有线性相关关系,回归方程为y ^=2.3x +a (a 为常数),现要使销售额达到6万元,估计广告费用约为________千元.解析:x =7,y =41.6,则a =y -2.3x =41.6-2.3×7=25.5. 当y =6万元=60千元时,60=2.3x +25.5,解得x =15(千元). 答案:155.下表提供了某厂节能降耗技术改造后,在生产A 产品过程中记录的产量x (单位:吨)与相应的生产能耗y (单位:×103kJ)几组对应的数据:根据上表提供的数据,求出y 关于x 的线性回归方程y =0.7x +0.35,那么表中t 的值为________.解析:由y =0.7x +0.35,得2.5+t +4+4.54=0.7×3+4+5+64+0.35,故11+t4=3.5,即t =3. 答案:3 二、解答题6.一台机器由于使用时间较长,生产的零件有一些会有缺损,按不同转速生产出来的零件有缺损的统计数据如下表所示.(1)(2)如果y 与x 线性相关,求出回归直线方程. 解:(1)如下图.(2)由(1)知y 和x 线性相关.设回归直线方程为y ^=bx +a . 由题意,得x =12.5,y =8.25,4i =1x 2i =660,4i =1x i y i =438.所以b =438-4×12.5×8.25660-4×12.52≈0.73,a ≈8.25-0.73×12.5≈-0.88, 所以y ^=0.73x -0.88.7.某企业的某种产品产量与单位成本数据如下:(1)(2)指出产量每增加1 000件时,单位成本下降多少?(3)假定产量为6 000件时,单位成本是多少?单位成本为70元时,产量应为多少件? 解:(1)设x 表示每月产量(单位:千件),y 表示单位成本(单位:元),作散点图.由散点图可知y 与x 间具有线性相关关系, 设线性回归方程为:y ^=bx +a .∵b =∑i =16x i y i -6x y∑i =16x 2i -6x 2≈-1.82,a =y -b x ≈77.37,∴线性回归方程为y ^=-1.82x +77.37.(2)由线性回归方程知,产量每增加1 000件,单位成本下降1.82元. (3)当x =6时,y =-1.82×6+77.37=66.45, 故当产量为6 000件时,单位成本为66.45元. 当y =70时,x ≈4.049.故当单位成本为70元时,产量约为4 049件.8.一台机器由于使用时间较长,但还可以用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少随机器运转的速度而变化,下表为抽样试验结果.(1)(2)如果y 与x 有线性相关关系,求线性回归方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?解:(1)画出散点图,如图.(2)x =12.5,y =8.25,∑i =14x i y i =438,∑i =14x 2i =660,所以b =∑i =14x i y i -4x y∑i =14x 2i -4x 2=438-4×12.5×8.25660-4×12.52≈0.728 6, a =y -b x ≈8.25-0.728 6×12.5=-0.857 5.所以线性回归方程为y ^=0.728 6x -0.857 5. (3)要使y ^≤10,则0.728 6x -0.857 5≤10,x ≤14.901 9.所以机器的转速应控制在15 rad/s 以下.。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

复习课(二) 统计抽样方法高考对抽样方法的考查主要是基础题,难度不大.系统抽样和分层抽样是考查的热点,考查形式以填空题为主.[考点精要]1.简单随机抽样(1)特征:①一个一个不放回的抽取.②每个个体被抽到可能性相等.(2)常用方法:①抽签法.②随机数表法.2.系统抽样(1)适用环境:当总体中个数较多时,可用系统抽样.(2)操作步骤:将总体平均分成几个部分,再按照一定方法从每个部分抽取一个个体作为样本.3.分层抽样(1)适用范围:当总体由差异明显的几个部分组成时可用分层抽样.(2)操作步骤:将总体中的个体按不同特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样.[典例](1)(山东高考改编)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9,抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为________.(2)(江苏高考)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.(3)已知某地区中小学生人数和近视情况分别如图1和图2所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为______.[解析] (1)抽取号码的间隔为96032=30,抽取的号码依次为9,39,69,…,939,落入区间[451,750]的有459,489,…,729共10人,即做B 卷的有10人.(2)设应从高二年级抽取x 名学生,则x 50=310,∴x =15.(3)该地区中小学生人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取高中生近视眼人数为2 000×2%×50%=20. [答案] (1)10 (2)15 (3)200,20 [类题通法](1)系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除.(2)分层抽样中,易忽视每层抽取的个体的比例是相同的.[题组训练]1.为了解1 000名学生的学习情况,采用系统抽样的方法从中抽取容量为40的样本,则分段的间隔为________.解析:根据系统抽样的特点可知,分段间隔为1 00040=25.答案:252.某高校甲、乙、丙、丁四个专业分别有150,150,400,300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.解析:抽样比为40150+150+400+300=4100.因此丙专业应抽取4100×400=16(人).答案:163.(北京高考)某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为______.解析:设该样本中老年教师人数为x ,则有x 900=3201 600,故x =180.答案:180高考对各种统计图表的考查主要是基础题,频率分布条形图和直方图是考查的热点,但也要注意关注茎叶图。

江苏考卷在这一部分的考查形式主要是填空题,解决这部分考题,关键要掌握各类图表构成的要件及意义.[考点精要]1.频率分布表的特点(1)表中所有频数之和等于样本容量. (2)表中所有频率之和为1. (3)各小组的频率=各小组的频数样本容量.2.频率分布直方图特点(1)纵轴上的点表示频率除以组距.(2)每一个小矩形面积等于这一小组的频率. (3)所有小矩形面积之和为1. 3.茎叶图(1)所有信息都可以从图中得到. (2)同一组数据中的相同数据要一一列出.[典例] (1)对一批产品的长度(单位:毫米)进行抽样检测, 如图为检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上为一等品, 在区间[15,20)和[25,30)上为二等品, 在区间[10,15)和[30,35]上为三等品. 用频率估计概率, 现从该批产品中随机抽取1件, 则其为二等品的概率是____________.统计图表的识读(2)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为________.(3)(全国卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图.给出下列结论①逐年比较,2008年减少二氧化硫排放量的效果最显著;②2007年我国治理二氧化硫排放显现成效;③2006年以来我国二氧化硫年排放量呈减少趋势.其中正确结论的序号为________.[解析](1)由频率分布直方图的性质可知,样本数据在区间[25,30)上的频率为1-50.25+0.04×5=0.45,故任取1件为22,22,27,29共4个,[答案](1)0.45(2)0.4(3)①②③[类题通法](1)解决该类问题时,应正确理解图表中各个量的意义,通过图表掌握信息是解决该类问题的关键.(2)各种统计图表的构成要熟悉;条形图和直方图不要混淆.[题组训练]1.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)由(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,得x=0.004 4.(2)数据落在[100,250)内的频率可求得为0.7,∴月用电量在[100,250)内的户数为100×0.7=70.答案:(1)0.004 4(2)702.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.解析:周长在[80,90)的频率为0.015×10=0.15,周长在[90,100)的频率为0.025×10=0.25,故符合要求的树木有(0.15+0.25)×60=24.答案:243.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,则购物的人数在[30,35)上的班数有________个.解析:在[30,35)中有30,33,34共3个. 答案:3样本的数字特征也是各类考试的重点内容之一:其中方差及平均数是考查的热点,但也要适当关注众数、中位数等.江苏考卷这一部分内容都考基础题,难度不大,考查形式以填空题为主,处理时首先要熟记相关公式及相关特征数的作用,其次要注意运算的准确性.(2)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则以上两组数据的方差中较小的一个为s 2=______.样本的数字特征(3)(安徽高考)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.[解析] (1)由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.(2)由题意知:x -甲=15(6+7+7+8+7)=7,x -乙=15(6+7+6+7+9)=7,s 2甲=15[(6-7)2+(8-7)2]=25,s 2乙=15[(6-7)2+(6-7)2+(9-7)2]=65,∵25<65,∴s 2=25. (3)由样本数据x 1,x 2,…,x 10的标准差s =8,得s 2=64,故数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.[答案] (1)20 (2)25(3)16[题组训练]1.(广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.解析:由条件知x =x 1+x 2+…+x n n=5, 则所求均值x 0=2x 1+1+2x 2+1+…+2x n +1n =2(x 1+x 2+…+x n )+n n =2x +1=2×5+1=11.答案:112.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该数据的方差s 2=________.解析:x =15(10+6+8+5+6)=7,∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165.答案:1653.从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲乙两组数据的平均数分别为x 甲,x 乙,中位数分别为m 甲,m 乙,则x 甲________x 乙,m 甲________m 乙(填“>”“<”).解析:可求x甲=34516,x 乙=45716,∴x 甲<x 乙,又可求m 甲=20,m 乙=29,∴m 甲<m 乙. 答案:< <1.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为________.解析:由系统抽样的特点知,从号码003开始每间隔60050=12人抽出1个, 设抽出的第n 个号码为a n ,则a n =3+12(n -1),n ∈N *, 由a n ≤300知n ≤25; 由a n ≤495知n ≤42,所以第一营区被抽取的人数为25,第二营区被抽取的人数为42-25=17,第三营区被抽取的人数为50-42=8.答案:25,17,82.课题组进行城市空气质量调查,按地域把24个城市分成甲、乙、丙三组,对应的城市数分别为4,12,8,若用分层抽样抽取6个城市,则丙组中应抽取的城市数为________.解析:抽样比为624=14,∴丙组中应抽取城市数为8×14=2.答案:23.从总体中抽取的样本数据共有m 个a ,n 个b ,p 个c ,则总体的平均数x 的估计值为________.解析:因为总体平均数x 的估计值就是样本平均数,故x =ma +nb +pcm +n +p .答案:ma +nb +pcm +n +p4.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,若甲运动员的中位数为a ,乙运动员的众数为b ,则a -b =________.解析:由茎叶图可知,a =19,b =11,∴a -b =8.答案:85.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是______________.解析:由茎叶图知中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.答案:46,45,566.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.解析:低于60分的频率是(0.005+0.01)×20=0.3,所以该班学生人数是150.3=50.答案:507.已知一组数据按从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,则这组数据的平均数和方差分别为________,________.解析:∵中位数为5,∴5=4+x2,∴x =6.x =-1+0+4+6+7+146=5,s 2=16∑i =16 (x i -x )2=16[(5+1)2+(5-0)2+(5-4)2+(5-6)2+(5-7)2+(5-14)2]=2423.答案:5 24238.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二________.50,所以第三组人数为50×0.36=18,有疗82,84,84,86,86,86,88,88,88,88.若B 样本数据A ,B 两样本的下列数字特征对应相同的是________(填序号).①众数 ②平均数 ③中位数 ④标准差解析:对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.答案:④10.由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)解析:设x1≤x2≤x3≤x4,根据已知条件得到x1+x2+x3+x4=8,且x2+x3=4,所以x1+x4=4,又因为14[(x1-2)2+(x2-2)2+(x3-2)2+(x4-2)2]=1,所以(x1-2)2+(x2-2)2=2,又因为x1,x2,x3,x4是正整数,所以(x1-2)2=(x2-2)2=1,所以x1=1,x2=1,x3=3,x4=3.答案:1,1,3,311.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.解:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88.则高一学生的达标率约为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.12.甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和(1)算得的结果,对两人的训练成绩作出评价.解:(1)由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13, x 乙=13+14+12+12+145=13, s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.13.某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解:(1)设分数在[70,80)内的频率为x ,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x =1,可得x =0.3,所以频率分布直方图如图所示.(2)平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).14.某种产品的广告支出x 与销售额y (单位:百万元)之间有如下的对应关系(1)假定y 与x (2)若实际销售额不少于60百万元,则广告支出应该不少于多少?解:(1)x =15(2+4+5+6+8)=5, y =15(30+40+60+50+70)=50, 5i =1x 2i =22+42+52+62+82=145. 5i =1x i y i =2×30+4×40+5×60+6×50+8×70=1 380. ∴b =5i =1x i y i -5x y 5i =1x 2i -5x 2=1 380-5×5×50145-5×52=6.5, a =y -bx -=50-6.5×5=17.5,∴线性回归方程为y ^=6.5x +17.5.(2)由线性回归方程得y ^≥60,即6.5x +17.5≥60,∴x ≥8513≈6.54, ∴广告费用支出应不少于6.54百万元.。

相关文档
最新文档