第二章 统计 章末复习课
2024_2025学年高中数学第二章统计章末复习检测卷课时作业含解析新人教A版必修3
章末复习检测卷(二) 统计(本栏目内容,在学生用书中以独立形式分册装订)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.从某年级500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是() A.500名学生是总体B.每个被抽查的学生是样本C.抽取的60名学生的体重是一个样本D.抽取的60名学生是样本容量解析:答案:2.某考察团对全国10大城市进行职工人均工资水平x(元)与居民人均消费水平y(元)统计调查,y与x具有相关关系,线性回来方程为y=0.66x+1562,若某城市居民人均消费水平为7675元,估计该城市人均消费额占人均工资收入的百分比约为()A.83% B.72%C.67% D.66%解析:将y=7675代入回来方程,可计算得x≈9262,所以该城市人均消费额占人均工资收入的百分比约为7675÷9262≈0.83,即约为83%.答案: A3.对于数据3,3,2,3,6,3,10,3,6,3,2,有以下结论:①这组数据的众数是3.②这组数据的众数与中位数的数值不等.③这组数据的中位数与平均数的数值相等.④这组数据的平均数与众数的数值相等.其中正确的结论有()A.1个B.2个C.3个D.4个解析: 由题意知,众数与中位数都是3,平均数为4.只有①正确,故选A. 答案: A4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回来方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析: ∵商品销售量y (件)与销售价格x (元/件)负相关, ∴b <0,解除B ,D.又∵x =0时,y >0,∴故选A. 答案: A5.“互联网+”时代,全民阅读的内涵已然多元化,提倡读书成为一种生活方式.某校为了解中学学生的阅读状况,从该校1 600名高一学生中,采纳分层抽样方法抽取一个容量为200的样本进行调查.若抽到的男生比女生多10人,则该校高一男生共有( )A .760人B .840人C .860人D .940人解析: 本题考查分层抽样.设所抽取的男生、女生分别有x 人、y 人,则⎩⎪⎨⎪⎧x +y =200,x -y =10解得⎩⎪⎨⎪⎧x =105,y =95所以该校高一男生共有105200×1 600=840(人),故选B.答案: B6.(2024·山东日照一中期中考试)对某商店四月内每天的顾客人数进行统计,所得数据的茎叶图如图所示,则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析: 由茎叶图,可知中位数为45+472=46,众数为45,极差为68-12=56.答案: A7.为探讨某药品的疗效,选取若干名志愿者进行临床试验,全部志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的依次分别编号为第一组,其次组,…,第五组.如图是依据试验数据制成的频率分布直方图.已知第一组与其次组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .1B .8C .12D .18解析: 由图知,样本总数为N =200.16+0.24=50.设第三组中有疗效的人数为x ,则6+x50=0.36,解得x =12.答案: C8.假如在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回来直线方程是( )A .y =x +1.9B .y =1.04x +1.9C .y =0.95x +1.04D .y =1.05x -0.9解析: x =14(1+2+3+4)=2.5,y =14(3+3.8+5.2+6)=4.5.因为回来方程过点(x ,y ),代入验证知,应选B.答案: B9.若样本数据x 1,x 2,…,x 2 018的标准差为3,则数据4x 1-1,4x 2-1,…,4x 2 018-1的方差为( )A .11B .12C .143D .144解析: 本题考查数据方差的求解.因为样本数据x 1,x 2,…,x 2 018的标准差为3,所以方差为9,所以数据4x 1-1,4x 2-1,…,4x 2 018-1的方差为42×9=144,故选D.答案: D10.某学校随机抽取20个班,调查各班中有网上购物经验的人数,所得数据的茎叶图如下图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析: 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一:由题意知样本容量为20,组距为5. 列表如下:分组频数频率 频率组距 [0,5) 1 120 0.01 [5,10) 1 120 0.01 [10,15) 4 15 0.04 [15,20) 2 110 0.02 [20,25) 4 15 0.04 [25,30) 3 320 0.03 [30,35)33200.03[35,40] 2 110 0.02 合计201视察各选择项的频率分布直方图知选A.法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等.比较四个选项知A 正确,故选A.答案: A二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上) 11.有A ,B ,C 三种零件,分别为a 个、300个、200个,采纳分层抽样法抽取一个容量为45的样本,A 种零件被抽取20个,则a =________.解析: 依据题意得45a +300+200=20a ,解得a =400.答案: 40012.如图是依据某中学为地震灾区捐款的状况而制作的统计图,已知该校共有学生3 000人,由统计图可得该校共捐款________元.解析: 由扇形统计图可知,该中学高一、高二、高三分别有学生960人、990人、1 050人,由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、 10元,所以共捐款15×960+13×990+10×1 050=37 770(元).答案: 37 77013.某校开展“爱我母校,爱我家乡”摄影竞赛,9位评委为某参赛作品给出的分数的茎叶图如图,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发觉有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应当是________.解析: 平均分为91分,∴总分应为637分.由于须要去掉一个最高分和一个最低分,故须要分类探讨:①若x ≤4,则89+89+92+93+92+91+90+x =637,∴x =1;②若x >4,则89+89+92+93+92+91+94=640≠637,不符合题意.故填1. 答案: 114.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这56号打6小时篮球的投篮命中率为________.解析: 平均命中率y =15×(0.4+0.5+0.6+0.6+0.4)=0.5,而x =3,∑i =15x i y i =7.6,∑i =15x2i =55,由公式得b ∧=0.01,a ∧=y -b ∧x =0.5-0.01×3=0.47,∴y ∧=0.01x +0.47.令x =6,得y∧=0.53.答案: 0.5 0.53三、解答题(本大题共4小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)15.(本小题满分12分)已知一组数据按从小到大的依次排列为-1,0,4,x,7,14,中位数为5,求这组数据的平均数与方差.解析: 由于数据-1,0,4,x,7,14的中位数为5,所以4+x2=5,x =6.设这组数据的平均数为x ,方差为s 2,由题意得 x =16×(-1+0+4+6+7+14)=5,s 2=16×[(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=743. 16.(本小题满分12分)为了让学生了解更多有关“一带一路”的信息,某中学实行了一次“丝绸之路学问竞赛”,共有800名学生参与了这次竞赛.为了解本次竞赛成果状况,从中抽取了部分学生的成果(得分均为整数,满分为100分)进行统计.请你依据尚未完成的频率分布表,解答下列问题:分组频数频率60.5~70.50.1670.5~80.51080.5~90.5180.3690.5~100.5合计(1)若用系统抽样的方法抽取50个样本,现将全部学生的成果随机地编号为000,001,002,…,799,试写出其次组第一名学生成果的编号;(2)填充频率分布表中的空格(将答案干脆填在表格内),并作出频率分布直方图;(3)若成果在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约有多少名?解析:(1)依据系统抽样法则,要从总体中抽取50个样本,需将总体分为50组,则每组的学生数为800÷50=16,故其次组第一名学生成果的编号为016.(2)频率分布表如下表所示,频率分布直方图如图所示.分组频数频率60.5~70.580.1670.5~80.5100.2080.5~90.5180.3690.5~100.5140.28合计50 1(3)在被抽到的学生成果中在85.5~95.5分的个数是9+7=16,占样本的比例是1650=0.32,即获得二等奖的概率约为32%,所以获得二等奖的学生约有800×32%=256(名).17.(本小题满分12分)为了让学生了解环保学问,增加环保意识,某中学实行了一次环保学问竞赛,共有900名学生参与了这次竞赛.为了了解本次竞赛的成果状况,从中抽取了部分学生的成果(得分为正整数,满分为100分)进行统计.请你依据下面尚未完成的频率分布表和频率分布直方图(下图),解答下列问题:组号 分组 频数 频率 1 [50,60) 4 0.08 2 [60,70) 8 0.16 3 [70,80) 10 0.20 4 [80,90) 16 0.32 5 [90,100]合计(1)填充频率分布表中的空格;(2)不详细计算频率组距,补全频率分布直方图;(3)估计这900名学生竞赛的平均成果(同一组中的数据用该组区间的中点值作代表). 解析: (1)40.08=50,即样本容量为50.第5组的频数为50-4-8-10-16=12, 从而第5组的频率为1250=0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(2)依据小长方形的高与频数成正比,设第一个小长方形的高为h 1,其次个小长方形的高为h 2,第五个小长方形的高为h 5.由等量关系得h 1h 2=12,h 1h 5=13,补全的频率分布直方图如图所示.(3)50名学生竞赛的平均成果为x =4×55+8×65+10×75+16×85+12×9550=79.8≈80(分).利用样本估计总体的思想可得这900名学生竞赛的平均成果约为80分.18.(本小题满分14分)某部门为了了解用电量y (单位:千瓦时)与气温x (单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,因某天统计的用电量数据丢失,用t 表示,如下表:(1)(2)若用电量与气温之间具有较好的线性相关关系,回来直线方程为y ∧=-2x +b ∧,且预料气温为-4 ℃时,用电量为2t 千瓦时.求t ,b 的值.解析: (1)x =14(18+13+10-1)=10,s =14[(18-10)2+(13-10)2+(10-10)2+(-1-10)2]=1942. (2)y =14(24+t +38+64)=t +1264,∴t +1264=-2×10+b ,即4b -t =206.①又2t =-2×(-4)+b ,即2t -b =8.② 由①②得,t =34,b =60.。
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)
总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
高中数学 第二章 统计模块复习课检测 新人教B版必修3-新人教B版高一必修3数学试题
第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
高中数学必修第二章统计复习课件新人教
C. ①用系统抽样法,②用分层抽样法
D. ①用分层抽样法,②用系统抽样法
金例4太. 阳题为教育—了网—解ww1w高.jtyj一年级系5统00品抽名质来样同自专(学业 信等的赖源距视于诚抽力信样情)况,试用系统抽 样从中抽取50名同学进行检查。
编号
S1:把500人从1到500编号;
义乌国际小商品博览会”上宣布正式对外发布。
• “义乌·中国小商品指数”是E依v据a统lu计at指io数n与o统nl计y.评价理论,采用多层双
ted向进在w加行权综it终合合h成处A极指理s数,p的编用o制以s分方e全法.析S面,选l反i中d择映e一s,义系列f乌o一反小r映.切商义N乌品E知小价T商识格品3批.和5都发市市C是场场li运e景历行n气状t史活况P的跃r;o指程f标il,e 5.2 度在的综抽C合象o指p数的yr,i意g主h要义t由2小0下商0品4,价-格2一指0数1切和1小A科商s品p学市o场s都景e气是P指数ty数及L若学t干d单.;独监测
简单随机抽E样valuation only. Aspose.Slides f随or机.N数E表T法3.5
总体个数较少
Client Profile
5.2
概 率 抽
Co第 单py随一ri机段gh抽用t 样简200系4-统20抽11样Aspose
Pty Ltd.
总体个数较多
每一层用简 单随机抽样
分层抽样
各部分差异明显
浙江省义乌中学
金太阳教育网
品质来自专业 信赖源于诚信
Evaluation only. ted with Aspose.Slides for .NET 3.5 Client Profile 5.2
人教b版数学必修三:第2章《统计》章末复习导学案(含答案)
章末复习课知识概览对点讲练知识点一三种抽样方法的选择例1选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.(3)有甲厂生产的300个篮球,抽取10个.(4)有甲厂生产的300个篮球,抽取30个.点评弄清三种抽样方法的实质和适用范围,是灵活选用抽样方法的前提和基础.若用分层抽样,应先确定各层的抽取个数,然后在各层中用系统抽样或简单随机抽样进行抽取.变式迁移1某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是() A.4 B.5 C.6 D.7知识点二用样本估计总体例2有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比.点评频率分布直方图可直观看出在各个区间内机会的差异,可对总体情况作出估计.变式迁移2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力,得到频率分布直方图,如下图,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a,b的值分别为()A.0.27,78 B.0.27,83 C.2.7,78 D.2.7,83例3甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm2):变式迁移3随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图所示.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.知识点三回归直线方程及应用例4在7块并排、形状大小相同的实验田上进行施化肥量对水稻产量影响的试验,得数据列表(1)(2)求水稻产量y与施化肥量x之间的回归直线方程;(3)当施化肥50 kg时,对水稻的产量予以估计.点评(1)回归分析是寻找相关关系中非确定性关系的某种确定性;(2)求回归直线方程,关键在于正确地求出系数a ^,b ^,由于a ^,b ^的计算量大,计算时要仔细,避免计算失误.变式迁移4 某个服装店经营某种服装,在某周内获纯利y (元)与该周每天销售这种服装件数x已知:∑7i =1x 2i =280,∑i =1y 2i =45 309,∑i =1x i y i =3 487,且y 与x 有线性相关关系.(1)求x ,y ;(2)求纯利y 与每天销售件数x 之间的回归直线方程.课时作业一、选择题1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,7,13,17,23,27,…,93,97的产品进行检验,则这样的抽样方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .以上都不对2.下列说法:①一组数据不可能有两个众数;②一组数据的方差不可能是负数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率,其中错误的个数有( )A .0B .1C .2D .33.现有60瓶牛奶制品,编号从1至60,若从中抽取6瓶进行检验,用系统抽样方法确定所抽的编号为( )A .3,13,23,33,43,53B .2,14,26,38,42,56C .5,8,31,36,48,54D .5,10,15,20,25,304.数学老师对某同学在参加高考前的5次数学模拟考试成绩进行统计分析,判断该同学的数学成绩是否稳定,于是老师需要知道该同学这5次成绩的( )A .平均数或中位数B .方差或标准差C .众数或频率D .频数或众数5.由一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )得到的回归直线方程为y ^=b ^x +a ^,那么下列说法不正确的是( )A .直线y ^ =b ^ x +a ^ 必经过点(x ,y )B .直线y ^=b ^x +a ^至少经过点(x 1,y 1),(x 2,y 2),…,(x n ,y n )中的一个点 C .直线y ^=b ^x +a ^的斜率为∑ni =1x i y i -n x y∑n i =1x 2i -n x 2D .直线y ^=b ^x +a ^和各点(x 1,y 1),(x 2,y 2),…,(x n ,y n )的偏差∑ni =1[y i -(bx i +a )]2是该坐标平面上所有直线与这些点的偏差中最小的 二、填空题6.某校有教师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从所有师生中抽取一个容量为n 的样本,已知从女学生中抽取的人数为80人,则n 的值为________.7.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图所示,则平均分数较高的是________,成绩较为稳定的是________.8.某中学期中考试后,对成绩进行分析,从某班中选出5名学生的总成绩和外语成绩如下表:三、解答题9.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:甲 27,38,30,37,35,31; 乙 33,29,38,34,28,36.根据以上数据,试判断他们谁更优秀. 10.随机选取15家销售公司,由营业报告中查出其上年度的广告费(占总费用的百分比)及盈利额(1)画出散点图;(2)如果变量x 与y 之间具有线性相关关系,求出回归直线方程; (3)已知某销售公司的广告费为其总费用的1.7%,试估计其盈利额占销售总额的百分比.章末复习课对点讲练例1 解 (1)总体容量较小,用抽签法. ①将30个篮球编号,号码为00,01, (29)②将以上30个编号分别写在一张小纸条上,揉成小球,制成号签; ③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码; ⑤找出和所得号码对应的篮球.(2)总体由差异明显的两个层次组成,需选用分层抽样法. ①确定抽取个数. 3010=3,所以甲厂生产的应抽取213=7(个), 乙厂生产的应抽取93=3(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(3)总体容量较大,样本容量较小,宜用随机数表法.①将300个篮球用随机方式编号,编号为000,001,…,299; ②在随机数表中随机的确定一个数作为开始,如第8行第11列的数“2”开始.任选一个方向作为读数方向,比如向右读;③从数“2”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大宜用系统抽样法.①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含30030=10(个)个体;②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;③将编号为002,012,022,…,292的个体抽出,组成样本. 变式迁移1 C [抽取的植物油类种数:1040+10+30+20×20=2,抽取的果蔬类食品种数:2040+10+30+20×20=4,故抽取的植物油类与果蔬类食品种数之和是6.] 例2 解 (1)(2)(3)小于30的数据约占90%.变式迁移2 A [100人分为10组,第1组1人,第2组3人,第三组9人,第四组27人,故a =0.27;后六组共87人,故b =78.]例3 甲解析 方法一 x 甲=15×(9.8+9.9+10.1+10+10.2)=10,x 乙=15×(9.4+10.3+10.8+9.7+9.8)=10,即甲、乙两种冬小麦的平均单位面积产量的均值都等于10,其方差分别为s 2甲=15×(0.04+0.01+0.01+0+0.04)=0.02,s 2乙=15×(0.36+0.09+0.64+0.09+0.04) =0.244,即s 2甲<s 2乙,表明甲种小麦的产量比较稳定.方法二 (通过特殊的数据作出合理的推测)表中乙品种在第一年的产量为9.4,在第三年的产量为10.8,其波动比甲品种大得多,所以甲种冬小麦的产量比较稳定.变式迁移3 解 (1)由茎叶图可知:甲班身高集中于160~179之间,而乙班身高集中于170~180之间,因此乙班平均身高高于甲班.(2)x =158+162+163+168+168+170+171+179+179+18210=170.甲班的样本方差s 2=110×[(158-170)2+(162-170)2+(163-170)2+(168-170)2+(168-170)2+(170-170)2+(171-170)2+(179-170)2+(179-170)2+(182-170)2]=57.2.例4 解 (1)画出散点图如下图:由图可见是线性相关的.x =30,y ≈399.3,∑i =17x i y i =87 175.∑i =17x 2i =7 000.计算得:b ^=87 175-7×30×399.37 000-7×302≈4.75,a ^ =399.3-4.75×30=256.8.即得回归直线方程y ^=256.8+4.75x.(3)施化肥50 kg 时,可以估计水稻产量约为494.3 kg .变式迁移4 解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597≈79.86.(2)设回归直线方程为y ^=b ^x +a ^,因为∑7i =1x 2i =280,∑7i =1y 2i =45 309,∑7i =1x i y i =3 487,x =6,y =5597,所以b ^=3 487-7×6×5597280-7×36=13328=4.75,a ^=5597-6×4.75≈51.36.所以回归直线方程为y ^=4.75x +51.36. 课时作业 1.B 2.B 3.A 4.B 5.B 6.192解析 801 000=n2 400,n =192.7.甲 甲解析 甲的平均分为x =68+69+70+71+725=70,乙的平均分为y =68;甲的方差为s 21=(68-70)2+(69-70)2+(70-70)2+(71-70)2+(72-70)25=2.乙的方差为s 22=7.2,故甲的平均分高于乙,甲的成绩比乙稳定.8.y ^=14.7+0.132x9.解 x 甲=16×(27+38+30+37+35+31)=1986=33.s 2甲=16×[(27-33)2+(38-33)2+…+(31-33)2] =16×94≈15.7. x 乙=16×(33+29+38+34+28+36)=1986=33,s 2乙=16×[(33-33)2+(29-33)2+…+(36-33)2] =16×76≈12.7 ∴x 甲=x 乙,s 2甲>s 2乙,说明甲乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.10.解 (1)散点图如图所示.(2)回归直线方程是y ^=1.414 68x +0.821 23.(3)当x =1.7时,由回归直线方程得y =3.23,即可估算其盈利额占销售总额的3.23%.。
高一数学必修3--第二章:统计复习课导学案
第二章:统计复习课学习目标1.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.二.知识梳理本章知识共分为三部分:1.随机抽样:三种方法------简单随机抽样、系统抽样、分层抽样2.用样本估计总体:两种方法------用样本的频率a:分布估计总体分布、用样本的数字特征估计总体的数字特征.①用样本的频率分布估计总体分布:频率分布直方图的特征.画茎叶图的步骤.②用样本的数字特征估计总体的数字特征:利用频率分布直方图估计众数、中位数、平均数.b:标准差,方差.3.变量间的相关关系:①变量之间的相关关系:a、确定性的函数关系.b、带有随机性的变量间的相关关系.②两个变量的线性相关:a、散点图的概念.b、正相关与负相关的概念.c、线性相关关系.d、线性回归方程.※ 典型例题1.在一次有奖明信片的100 000个有机会中奖的号码(编号00000—99999)中,邮政部门按照随机抽取的方式确定后两位是23的作为中奖号码,这是运用了________抽样方法.2.某单位有500名职工,其中不到35岁的有125人,35岁~49岁的有280人,50岁以上的有95人.为了了解该单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,应该用___________抽样法.3.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法是( )A.①用简单随机抽样法,②用系统抽样法B.①用分层抽样法,②用简单随机抽样法C.①用系统抽样法,②用分层抽样法D.①用分层抽样法,②用系统抽样法4.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆舒畅行检验,这三种型号的轿车依次应抽取______________辆.5.有一个样本容量为50的样本数据分布如下,[)5.15,5.12 3; [)5.18,5.15 8;[)5.21,5.18 9; [)5.24,5.21 11;[)5.27,5.2410; [)5.30,5.27 6;[)5.33,5.30 3.估计小于30的数据大约占有 ( ) A.9400 B.600 C.8800 D.1200※ 动手试试1.从甲、乙两班分别任意抽出10名学生进行英语口语测验,其测验成绩的方差分别为S12= 13.2,S22=26.26,则( ).A .甲班10名学生的成绩比乙班10名学生的成绩整齐B .乙班10名学生的成绩比甲班10名学生的成绩整齐C .甲、乙两班10名学生的成绩一样整齐D .不能比较甲、乙两班10名学生成绩的整齐程度7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( ).A .3.5B .-3C .3D .-0.58.如果一组数中每个数减去同一个非零常数,则这一组数的( ).A .平均数不变,方差不变B .平均数改变,方差改变C.平均数不变,方差改变D.平均数改变,方差不变三、总结提升※ 学习小结本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。
第二章 章末复习课简单的幂函数
研一研·题型解法、解题更高效
章末复习课
3.函数奇偶性与单调性的差异
本 课 栏 目 开 关
函数的奇偶性是相对于函数的定义域来说的,这一点与研 究函数的单调性不同,从这个意义上说,函数的单调性是 函数的“局部”性质,而奇偶性是函数的“整体”性质, 只有对函数定义域内的每一个 x 值, 都有 f(-x)=-f(x)[或 f(-x)=f(x)],才能说 f(x)是奇函数(或偶函数).
章末复习课
(2)解
本 课 栏 目 开 关
当 x≥0 时,f(x)=x2-2x-1=(x-1)2-2,
当 x<0 时,f(x)=x2+2x-1=(x+1)2 -2,
即
x-12-20≤x≤3 f(x)= 2 x+1 -2 -3≤x<0
根据二次函数的作图方法,可得函数图像如图.
研一研·题型解法、解题更高效
章末复习课
(3)解
函数 f(x)的单调区间为
[-3,-1),[-1,0),[0,1),[1,3].
本 课 栏 目 开 关
f(x)在区间[-3,-1)和[0,1)上为减函数, 在[-1,0),[1,3]上为增函数.
(4)解 当 x≥0 时, 函数 f(x)=(x-1)2-2 的最小值为
章末复习课
题型四
本 课 栏 目 开 关
函数性质的综合运用
函数性质的研究包括函数的单调性、 奇偶性、 对称性, 从命题形式上看,抽象函数、具体函数都有,其中函 数单调性的判断与证明、求单调区间、利用函数单调 性求参数的取值范围是高考的重点,利用函数的奇偶 性、对称性研究函数的图像是难点.
研一研·题型解法、解题更高效
章末复习课
本 课 栏 目 开 关
画一画·知识网络、结构更完善
高中数学 第二章 统计 2.3.1-2.3.2 变量之间的相关关系 两个变量的线性相关课件 新人教
A .1 B .1 C .1 D .1 1 6 8 4 2
35
【思路导引】利用回归直线方程必过样本点的中心求解.
【解析】选B.依题意可知样本点的中心为 ( 3 , ,3 )
48
则3
8
= 1×
3
+3
4
,a 解得
=a .
1 8Βιβλιοθήκη 36【拓展延伸】相关关系的强弱
(1)若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),称r=
6
(2)你能举例说明你对正相关与负相关的理解吗? 提示:随自变量的变大(或变小),因变量也随之变大(或变小),这种带有随机性 的相关关系,我们称为正相关.例如,人年龄由小变大时,体内脂肪含量也由少 变多. 随自变量的变大(或变小),因变量却随之变小(或变大),这种带有随机性的相关 关系,我们称为负相关.例如,汽车越重,每消耗1 L汽油所行驶的平均路程就 越短.
n
n
x i2,
xi y,i
i1
i1
30
(5)代入公式计算
b ,a,公式为
n
x iyi n x y
b
i1
n
x
2 i
n
x
2
i1
,
a y b x .
(6)写出回归直线方程 = x+ .
yb a
31
【跟踪训练】 已知变量x,y有如下对应数据:
x1234 y1345
(1)作出散点图. (2)用最小二乘法求关于x,y的回归直线方程.
42
【思路导引】(1)以产量为横坐标,以生产能耗对应的测量值为纵坐标, 在平面直角坐标系内画散点图. (2)应用计算公式求得线性相关系数 bˆ , aˆ 的值. (3)实际上就是求当x=100时,对应的 yˆ 的值.
《统计学原理》期末复习资料
08年春期成人教育专科《统计学原理》期末复习指导2008年6月修订第一部份课程考核说明1.考核目的通过本次考试,了解学生对本课程基本内容的掌握程度,重点和难点内容的掌握程度,以及运用统计学的基本知识、基本理论和基本方法来分析解决统计现象和统计分析的技能,同时还考察学生在平时的学习中是否注意了理解和记忆相结合,理解和运用相结合。
2.考核方式本课程期末考试形式为闭卷笔试,考试时间为90分钟。
3.适用范围、教材本复习指导适用于重庆电大成人教育专科经济类各专业的必修课程,以及电子商务专业、工商管理专业(计算机信息管理方向)、物流管理专业的选修课程《统计学原理》。
本课程考试命题依据是的教材采用黄良文、陈仁恩主编,中央电大出版社出版的《统计学原理》(2006年6月第4版)。
4.命题依据本课程的命题依据是《统计学原理》课程的教学大纲、教材、实施意见。
5.考试要求考试主要是考核学生对基本理论、基本指标、基本方法的理解和应用能力。
在能力层次上,从了解、掌握、重点掌握三个角度来要求。
了解是要求考生对本课程的基本知识和相关知识有所了解;掌握是要求考生对基本理论和基本方法不仅要知道是什么,还要知道为什么;重点掌握是要求考生能综合运用所学的基本理论和统计分析方法。
6.考试题型及结构考题类型及分数比重大致为:判断题(占10%左右)、单项选择题(占20%左右)、多项选择题(占10%左右)、简答题(占15%左右)、计算题(占50%左右)。
7.其它说明考试时,要求考生携带有统计功能的计算器。
第二部份期末复习重点范围第一章:总论一、重点掌握1.品质标志和数量标志有什么区别?2.简述统计标志与统计指标的区别。
3.什么是数量指标和质量指标?两者有何关系?4.统计总体、总体单位、标志、标志表现、变量、指标等统计学中的几个基本概念、种类及相互关系。
二、一般掌握1.统计的研究对象。
2.统计的涵义及其关系。
3.统计的研究方法。
4.国家统计的职能。
2017-2018学年第章统计章末复习教案
第二章章末复习教学目标:结合具体的实际问题情境,理解随机抽样的必要性和重要性。
学会用简单随机抽样方法从总体中抽取样本;通过对实际问题的分析,了解分层抽样和系统抽样方法。
教学重点:1.结合具体的实际问题情境,理解随机抽样的必要性和重要性。
学会用简单随机抽样方法从总体中抽取样本;通过对实际问题的分析,了解分层抽样和系统抽样方法。
2.体会分布的意义和作用,学会列频率分布表,画频率分布直方图,频率折线图,茎叶图,体会它们各自的特点。
会计算数据标准差。
体会用样本估计总体的思想,体会统计思维与确定性思维的差异。
3.利用散点图直观认识变量间的相关关系。
能根据给出的线性回归方程的系数公式建立线性回归方程。
教学难点:1.简单随机抽样,分层抽样和系统抽样的准确应用2.会列频率分布表,画频率分布直方图,频率折线图,茎叶图3.计算数据的标准差和方差4.根据给出的线性回归方程的系数公式建立线性回归方程教学过程:1.本章知识结构框图2.例题讲解例1.某年级共有1800名学生参加期末考试,为了了解学生的成绩,按照1:50抽取一个样本,用系统抽样的方法进行抽样,写出过程。
例2.两名跳远运动员在10次测试中的成绩分别如下(单位:m):甲:5.58 5.93 6.07 5.91 5.99 6.13 5.89 6.05 6.00 6.19乙:6.11 6.08 5.83 5.92 5.84 5.81 6.18 6.17 5.85 6.21分别计算两个样本的标准差,并根据计算结果估计哪位运动员的成绩比较稳定。
例3.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次实验,收集数据如下:(1)画出散点图(2)求回归方程(3)关于加工零件的个数与加工时间,能得出什么结论?。
统计章末复习课 课件
解 (1)列出样本频率分布表: 分组
[122,126) [126,130) [130,134) [134,138) [138,142) [142,146) [146,150) [150,154) [154,158]
合计
频数 5 8 10 22 33 20 11 6 5 120
频率 0.04 0.07 0.08 0.18 0.28 0.17 0.09 0.05 0.04 1.00
性相同
时采用简 按各层个体数之
单随机抽
比抽取
样
总体中的 个体数较少Fra bibliotek总体由差 异明显的 几部分组
成
2.关于用样本估计总体
(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处 理,作频率分布表与频率分布直方图时要注意其方法步骤. (2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是茎叶图中的数 据可以随时记录,随时添加,便于记录和表示. (3)平均数反映了样本数据的平均水平,而标准差反映了样本数据的波动程度.
(2)画出频率分布直方图,如图所示.
(3)因为样本中身高低于 134 cm 的人数的频率为5+182+0 10=12230≈ 0.19. 所以估计身高低于 134 cm 的人数约占总人数的 19%.
要点三 用样本的数字特征估计总体的数字特征 为了从整体上更好地把握总体的规律,我们还可以通过样本数据的
3.变量间的相关关系
(1)除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的 两个变量之间的关系——相关关系,对于一元线性相关关系,通过建立回归方程就可 以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图, 写出回归方程.
统计章末复习课 课件
规则 3:平均环数与命中 10 环次数相结合,平均环数高者胜.若 平均环数相等,则再看命中 10 环次数,命中 10 环次数多者胜,则乙 胜.
以上规则都是以平均环数为第一标准,如果比赛规则是看命中 7 环以上或 10 环的次数,那么就不需要先看平均环数了.
样本的数字特征可分为两大类,一类反映样本数据的集中趋势, 包括样本平均数、众数、中位数;另一类反映样本数据的波动大小, 包括样本方差及标准差.通常,我们用样本的数字特征估计总体的数 字特征.有关样本平均数及方差的计算和应用是高考考查的热点.
用样本的频率分布估计总体分布 通常要对样本数据进行列表、作图处理.这类问题采取的图表主 要有:条形图、直方图、茎叶图、频率分布折线图、扇形图等.它们 的主要优点是直观,能够清楚表示总体的分布走势.除茎叶图外,其 他几种图表法的缺点是原始数据信息有丢失.
用样本的数字特征估计总体的数字特征 【例 2】 在射击比赛中,甲、乙两名运动员分在同一小组,给 出了他们命中的环数如下表: 甲967627798 9 乙 2 4 6 8 7 8 9 7 9 10 赛后甲、乙两名运动员都说自己是胜者,如果你是裁判,你将给 出怎样的评判? 思路点拨:规则不同,评判结果有所不同.
思路点拨:根据频率分布直方图求出样本中数学成绩在[140,150] 内的频率,可估计总体中成绩在[140,150]内的人数.
800 [由样本的频率分布直方图知数学成绩在[140,150]内的频 率是相应小矩形的面积,即 0.008×10=0.08,因此这 10 000 名考生 中数学成绩在[140,150]内的约有 10 000×0.08=800(人).]
统计
章末复习课
用样本的频率分布估计总体分布
【例 1】 某地教育部门为了调查学生在数学考试中的有关信息, 从上次考试的 10 000 名考生中用分层抽样的方法抽取 500 人,并根 据这 500 人的数学成绩画出样本的频率分布直方图(如图),则这 10 000 名考生的数学成绩在[140,150]内的约有________人.
第2章 统 计章末复习课
章末复习课【画一画知识网络、结构更完善】【填要点、记疑点】 1.抽样方法(1)当总体容量较小,样本容量也较小时,可采用抽签法. (2)当总体容量较大,样本容量较小时,可用随机数法. (3)当总体容量较大,样本容量也较大时,可用系统抽样法. (4)当总体由差异明显的几部分组成时,常用分层抽样. 2.用样本估计总体用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频率分布表与频率分布直方图.当样本只有两组数据且样本容量比较小时,用茎叶图刻画数据比较方便. 3.样本的数字特征样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包括众数、中位数和平均数;另一类是反映样本波动大小的,包括方差及标准差. 4.变量间的相关关系(1) 两个变量之间的相关关系的研究,通常先作变量的散点图,根据散点图判断这两个变量最接近于哪种确定性关系(函数关系). (2)求回归直线方程的步骤:①先把数据制成表,从表中计算出x ,y,∑ni =1x 2i ,∑ni =1x i y i ;②计算回归系数a ^,b ^.公式为⎩⎨⎧b ^=∑ni =1x i y i-n x y ∑n i =1x 2i-n x 2,a ^=y -b ^x .③写出回归直线方程y ^=b ^x +a ^. 【探题型、提能力】 题型一 抽样方法的应用应用抽样方法抽取样本时,应注意以下几点:(1)用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =Nn ,如果总体容量N 不能被样本容量n 整除,先用简单随机抽样法剔除多余个体,抽样间隔为k =[N n ].([N n ]表示取Nn的整数部分)例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,干事20人,上级机关为了了解机关人员对政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取? 解 用分层抽样抽取.∵20∶100=1∶5,∴105=2,705=14,205=4,即从副处级以上干部中抽取2人,一般干部中抽取14人,干事中抽取4人. 因副处级以上干部与干事人数都较少,他们分别按1~10编号和1~20编号,然后采用抽签法分别抽取2人和4人,对一般干部采用00,01,…,69编号,然后用随机数法抽取14人.跟踪训练1 某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( )A .6B .8C .10D .12答案 B解析 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则3040=6n,得n =8.题型二 用样本的频率分布估计总体分布利用样本的频率分布表和频率分布直方图对总体情况作出估计,有时也利用频率分布折线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都能带来方便.例2 有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18; [21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10; [30.5,33.5),8.(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)估计数据小于30的数据约占多大百分比. 解 (1)样本的频率分布表如下:(2)频率分布直方图如下图.(3)小于30的数据约占90%.跟踪训练2为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如下图,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54 C.48 D.27答案 B解析[4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.∴a=(0.22+0.32)×100=54.题型三用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个数;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则是处于中间位置的数;如果数据的个数是偶数,则是中间两个数据的平均数.平均数就是所有样本数据的平均值,用x表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].有时也用标准差的平方s2——方差来代替标准差,实质一样.例3甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x 甲=16(99+100+98+100+100+103)=100, x乙=16(99+100+102+99+100+100)=100. s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.跟踪训练3 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:解 甲的平均成绩为x甲=74,乙的平均成绩为x 乙=73.所以甲的平均成绩好.甲的方差是s 2甲=15(142+62+42+162+42)=104,乙的方差是s 2乙=15×(72+132+32+72+22)=56.因为s 2甲>s 2乙,所以乙的各门功课发展较平衡.题型四 回归方程的应用分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线方程叫做回归方程.例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ^=b ^x +a ^; (3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5) 解 (1)散点图如下图所示:(2)x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5,∑4i =1x i y i =3×2.5+4×3+5×4+6×4.5=66.5,∑4i =1x 2i =32+42+52+62=86, ∴b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35.∴所求的回归方程为y ^=0.7x +0.35. (3)现在生产100吨甲产品用煤y ^=0.7×100+0.35=70.35,∴90-70.35=19.65. ∴生产能耗比技改前降低约19.65吨标准煤.跟踪训练4 2014年元旦前夕,某市统计局统计了该市2013年10户家庭的年收入和年饮食支出的统计资料如下表:(2)若某家庭年收入为9万元,预测其年饮食支出. (参考数据:∑10i =1x i y i =117.7,∑10i =1x 2i =406) 解 (1)依题意可计算得:x =6,y =1.83,x 2=36,x y =10.98,又∵∑10i =1x i y i =117.7,∑10i =1x 2i=406, ∴b =∑10i =1x i y i -10x y∑10i =1x 2i -10x 2≈0.17,a =y -b x =0.81,∴y ^=0.17x +0.81.∴所求的回归方程为y ^=0.17x +0.81.(2)当x =9时,y ^=0.17×9+0.81=2.34(万元).可估计大多数年收入为9万元的家庭每年饮食支出约为2.34万元.【呈重点、现规律】。
统计章末复习课课件
^
y=0.7×100+0.35=70.35,∴90-70.35=19.65.
∴预测生产100吨甲产品的生产能耗比技改前降低19.65吨标准煤.
(2)画出频率分布直方图; 解 频率分多大百分比. 解 小于30的数据占0.06+0.16+0.18+0.22+0.20+0.10=0.92=92%.
类型三 用样本的数字特征估计总体的数字特征
例3 甲、乙两机床同时加工直径为100 cm的零件,为检验质量,各从中 抽取6件测量,数据为 甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;
x
3
4
5
6
y
2.5
3
4
4.5
(1)请画出上表数据的散点图;
解 散点图如图所示:
^^
(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归方程y=b x
^
+a ;
(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的 回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?
(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 两台机床所加工零件的直径的平均数相同, 又 s甲2 >s乙2 , 所以乙机床加工零件的质量更稳定.
类型四 回归方程的应用
例4 下表提供了某厂节能降耗技术改进后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.
类型一 抽样方法的应用 例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干 部70人,干事20人,上级机关为了了解机关人员对政府机构改革意见, 要从中抽取一个容量为20的样本,试确定用何种方法抽取,如何抽取?
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
章末复习课课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23,…,93的产品进行检验,则这样的抽样方法是()A.简单随机抽样B.系统抽样C.分层抽样D.以上都不对2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()A.7 B.15C.25 D.353.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和924.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.1 B.2C.3 D.45.如果数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为()A.x和s B.2x+3和4s2C.2x+3和s2D.2x+3和4s2+12s+96.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.一、选择题1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是()A.50名运动员是总体B.每个运动员是个体C.抽取的50名运动员是样本D.样本容量是502.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是()A.指定各班团支部书记、班长为代表B.全校选举出76人C.高三选举出20人,高二选举出24人,高一选举出32人D.高三20人,高二24人,高一32人均在各年级随机抽取3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n 的值是()A.640 B.320C.240 D.1604.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为()A.0.001 B.0.01C.0.003 D.0.35.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.92,2 B.92,2.8C.93,2 D.93,2.86.下列图形中具有相关关系的两个变量是()7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k 的个位数字相同,若m=8,则在第8组中抽取的号码是________.8.一个样本容量是100的频率分布如图:(1)样本落在[60,70)内的频率为________;(2)样本落在[70,80)内的频数为________;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:假设得到的关于x和y之间的回归直线方程是y=b x+a,那么该直线必过的定点是________.三、解答题10.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:、乙谁的平均成绩较好?谁的各门功课发展较平衡?11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算的,且对于给定的x,y为正态变量,其方差与x无关.(1)(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1 000℃时,黄酮延长性的情况.12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)能力提升13.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:(1)分别求这些运动员成绩的众数、中位数、平均数(保留3个有效数字);(2)分析这些数据的含义.14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:((1)请完成该频率分布表,并画出相对应的频率分布直方图和频率分布折线图;(2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?答案:章末复习课双基演练 1.B2.B [设样本容量为n ,则350750=7n,∴n =15.]3.A4.D [∵x +y +10+11+95=10,15[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x +y =20,(x -10)2+(y -10)2=8,解得x =12,y =8或x =8,y =12, ∴|x -y|=4.]5.B [因x 1+x 2+…+x n =n x , 所以2x 1+3+2x 2+3+…+2x n +3n=2(x 1+x 2+…+x n )+3n n =2n x n+3=2x +3.又(x 1-x )2+(x 2-x )2+…+(x n -x )2=ns 2,所以[2x 1+3-(2x +3)]2+[2x 2+3-(2x +3)]2+…+[2x n +3-(2x +3)]2=4[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4ns 2. 所以方差为4s 2.] 6.30解析 纤维长度小于20 mm 的频率约为 p =5×0.01+5×0.01+5×0.04=0.3, ∴100×0.30=30. 作业设计1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]3.B [由40n=0.125,得n =320.]4.D [频率=频率组距组距,由图易知:频率组距=0.001,组距=3 000-2 700=300,∴频率=0.001×300=0.3]5.B [去掉95和89后,剩下5个数据的平均值x =90+90+93+94+935=92,方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]6.D [A 和B 符合函数关系,即对x 的每一个值,y 都有唯一确定的值与之对应;从C 、D 散点图来看,D 的散点都在某一条直线附近波动,因此两变量具有相关关系.] 7.76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组的个位数字为6, 十位数字为8-1=7,故抽取的号码为76.8.(1)0.2 (2)30 (3)0.016解析 (1)由频率组距×组距=频率,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30;(3)由频率组距=高,得小矩形的高是0.016.9.(6.5,8)解析 x =16(3+5+2+8+9+12)=6.5,y =16(4+6+3+9+12+14)=8.由a ^=y -b ^x 得y =b ^x +a ^,所以y =b ^ x +a ^恒过(x ,y ),即过定点(6.5,8).10.解 x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73,s 2甲=152+62+42+162+42)=104,s 2乙=152+132+32+72+22)=56,∵x 甲>x 乙,s 2甲>s 2乙;∴甲的平均成绩较好,乙的各门功课发展较平衡. 11.解 (1)散点图如下.(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关.b ^ =∑6i =1x i y i -6x y ∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86,a ^=y -b ^x =57-0.058 86×550=24.627. 因此所求的回归直线方程为y ^=0.058 86x +24.627.(4)将x =1 000代入回归方程得y =0.058 86×1 000+24.627=83.487, 即退水温度是1 000℃时, 黄酮延长性大约是83.487%.12.解 (1)各小组的频率之和为 1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05.∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.∴落在59.5~69.5的第二小组的小长方形的高=频率组距=0.4010=0.04.则补全的直方图如图所示.(2)设九年级两个班参赛的学生人数为x 人. ∵第二小组的频数为40人,频率为0.40, ∴40x=0.40,解得x =100(人). 所以九年级两个班参赛的学生人数为100人.(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5,即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数x =117(1.50×2+1.60×3+…+1.90×1)≈1.69(m )因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m .(2)众数是1.75说明了跳1.75 m 的人数最多;中位数是1.70 m 说明了1.70 m 以下和1.70 m 以上的成绩个数相等;平均数是1.69 m 说明了所有参赛运动员平均成绩是1.69 m . 14.解 (1)频率分布表与相应的频率分布直方图和频率分布折线图如下:合计1001(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+0.5-(0.12+0.24)0.2=4.5+0.7=5.2.(3)该乡每户平均月均用水量估计为(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14. 上级支援该乡的月调水量应为5.14×1 200=6 168. 答 上级支援该乡的月调水量是6 168吨.。