高考数学一轮复习 第九章 算法初步、统计、统计案例 第3讲 用样本估计总体课件

合集下载

高考数学一轮复习 第九章 算法初步、统计、统计案例 9.4 用样本估计总体课件 理

高考数学一轮复习 第九章 算法初步、统计、统计案例 9.4 用样本估计总体课件 理

月份 收入x 支出Y
1月份 12.3 5.63
2月份 14.5 5.75
3月份 15.0 5.82
4月份 17.0 5.89
5月份 19.8 6.11
6月份 20.6 6.18
• 根据统计资料,则( ) • A.月收入的中位数是15,x与Y有正线性相关关系 • B.月收入的中位数是17,x与Y有负线性相关关系 • C.月收入的中位数是16,x与Y有正线性相关关系 • D.月收入的中位数是16,x与Y有负线性相关关系
• 【答案】 (1)D (2)B
• 反思归纳 相关关系的直观判断方法就是作 出散点图,若散点图呈带状且区域较窄,说 明两个变量有一定的线性相关性,若呈曲线 型也是有相关性,若呈图形区域且分布较乱 则不具有相关性。
• 【变式训练】 (2016·长沙模拟)某公司在2015年上半年的收入x(单位:万元) 与月支出Y(单位:万元)的统计资料如表所示:
7
ti--t yi--y
(2)由-y =9.732≈1.331
i=1
及(1)得b^=
7
ti--t 2
2.89 = 28 ≈0.103,
i=1
a^=-y -b^-t ≈1.331-0.103×4≈0.92。 所以,y 关于 t 的回归方程为^y=0.92+0.10t。 将 2016 年对应的 t=9 代入回归方程得
第九章 算法初步、统计、统计案例
第四节 变量间的相关关系与统计案例
微知识 小题练 微考点 大课堂 微考场 新提升
•☆☆☆2017考纲考题考情☆☆☆
考纲要求
真题举例
命题角度
1.会作两个相关变量的数据的散点
图,会利用散点图认识变量间的相 2016,全国卷Ⅲ,18,12

高考数学大一轮复习第九章算法初步、统计与统计案例9.3用样本估计总体课件文

高考数学大一轮复习第九章算法初步、统计与统计案例9.3用样本估计总体课件文

【解析】
60×(0.015+0.025)×10=24.
【答案】

(3)(2015· 新课标全国卷Ⅱ)某公司为了解用户对其产品的 满意度,从A,B两地区分别随机调查了40个用户,根据用户 对产品的满意度评分,得到A地区用户满意度评分的频率分布 直方图和B地区用户满意度评分的频数分布表.
B地区用户满意度评分的频数分布表 满意度评分分组 [50,60) 频数 2 [60,70) 8 [70,80) 14 [80,90) [90,100] 10 6
突破考点 02
茎叶图
(题点多变型——一题多变)
茎是指中间的一列数,叶是从茎的旁边生长出来的数. 在样本数据较少时,用茎叶图表示数据的效果较好. 提醒:茎叶图的绘制需注意: (1)“叶”的位置只有一个数字,而“茎”的位置的数字 位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是 “叶”的位置上的数据.
1-0.25+0.2+0.15+0.08+0.02 【解析】 ①a= =3. 0.1 ②∵10 000×[1-(0.15+0.25)]=6 000, ∴消费金额在区间[0.5,0.9]内的购物者的人数为6 000.
【答案】 ①3 ②6 000
(2)(2014· 江苏卷)为了了解一片经济林的生长情况,随机 抽测了其中60株树木的底部周长(单位:cm),所得数据均在 区间[80,130]上,其频率分布直方图如图所示,则在抽测的60 株树木中,有________株树木的底部周长小于100 cm.
【调研2】
(1)(2013· 重庆卷)以下茎叶图记录了甲、乙两
组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8, 则x,y的值分别为( A.2,5 C.5,8 ) B.5,5 D.8,8

高考数学一轮复习 第9章 算法初步、统计与统计案例 第3节 用样本估计总体教师用书 文 新人教A版

高考数学一轮复习 第9章 算法初步、统计与统计案例 第3节 用样本估计总体教师用书 文 新人教A版

第三节 用样本估计总体———————————————————————————————— [考纲传真] 1.了解分布的意义与作用,能根据概率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.频率分布直方图 (1)频率分布表的画法:第一步:求极差,决定组数和组距,组距=极差组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.(2)频率分布直方图:反映样本频率分布的直方图(如图9­3­1).图9­3­1横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本落在该组内的频率.2.茎叶图统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.样本的数字特征1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势. (2)错误.方差越大,这组数据越离散. (3)正确.小矩形的面积=组距×频率组距=频率.(4)错误.茎相同的数据,叶可不用按从小到大的顺序写,相同的数据叶要重复记录,故(4)错误.[答案] (1)√ (2)× (3)√ (4)×2.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图9­3­2所示,则这组数据的中位数和平均数分别是( )图9­3­2A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.]3.(2017·南昌二模)如图9­3­3所示是一样本的频率分布直方图.若样本容量为100,则样本数据在[15,20)内的频数是( )图9­3­3A .50B .40C .30D .14C [因为[15,20]对应的小矩形的面积为1-0.04×5-0.1×5=0.3,所以样本落在[15,20]的频数为0.3×100=30,故选C.]4.(2016·江苏高考)已知一组数据 4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]5.(2017·山东淄博模拟)某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图9­3­4,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.图9­3­42 [170+17×(1+2+x +4+5+10+11)=175,则17×(33+x )=5,即33+x =35,解得x =2.](1)(2015·广东高考)已知样本数据x 1,x 2,…,x n 的均值x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的均值为________.(2)某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ).其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.①若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差.并比较甲、乙两组的研发水平;②若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. (1)11[由条件知x =x 1+x 2+…+x nn=5,则所求均值x=2x 1+1+2x 2+1+…+2x n +1n=x 1+x 2+…+x n +nn=2x +1=2×5+1=11.](2)①甲组研发新产品的成绩为 1,1,1,0,0,1,1,1,0,1,0,1,1,0,1, 其平均数为x 甲=1015=23.3分方差s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1, 其平均数为x 乙=915=35.方差s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625.因为x 甲>x 乙,s 2甲<s 2乙, 所以甲组的研发水平优于乙组.6分 ②记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的概率为715.用频率估计概率,即得所求概率为P (E )=715.12分[规律方法] 1.平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行均值与方差的计算,关键是正确运用公式.2.可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种做出评价或选择.[变式训练1] (2017·郑州模拟)为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图9­3­5所示的茎叶图.考虑以下结论:图9­3­5①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的序号为 ( ) A .①③ B .①④ C .②③D .②④B [甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+315=29;方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=3.6;标准差为s 甲= 3.6.乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+325=30;方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2;标准差为s 乙= 2.∴x 甲<x 乙,s 甲>s 乙.]50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.[解](1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.3分50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.5分(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.8分(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.12分[规律方法] 1.茎叶图的优点是保留了原始数据,便于记录及表示,能反映数据在各段上的分布情况.2.(1)作样本的茎叶图时,先要根据数据特点确定茎、叶,再作茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排列,便于数据的处理.(2)根据茎叶图中数据的数字特征进行分析判断,考查识图能力、判断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征,准确提炼信息.[变式训练2] (2017·雅礼中学质检)已知甲、乙两组数据如茎叶图9­3­6所示,若两组数据的中位数相同,平均数也相同,那么m+n=________.【导学号:31222364】图9­3­611[∵两组数据的中位数相同,∴m =2+42=3.又∵两组数据的平均数也相同, ∴27+33+393=20+n +32+34+384,∴n =8, 因此m +n =11.]☞角度1 利用分布直方图求频率、频数(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图9­3­7所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )图9­3­7A .56B .60C .120D .140D [由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.] ☞角度2 用频率分布直方图估计总体(2016·四川高考)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图9­3­8所示的频率分布直方图.图9­3­8(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.5分(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.8分(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.10分由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.12分[规律方法] 1.准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,易误认为纵轴上的数据是各组的频率.2.(1)例3-2中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键.(2)利用样本的频率分布估计总体分布.[思想与方法]1.用样本估计总体是统计的基本思想.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.(3)茎叶图、频率分布表和频率分布直方图都是用图表直观描述样本数据的分布规律的.[易错与防范]1.使用茎叶图时,要弄清茎叶图的数字特点,切莫混淆茎与叶的含义.2.利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.3.直方图与条形图不要搞混.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.课时分层训练(五十六) 用样本估计总体A 组 基础达标 (建议用时:30分钟)一、选择题1.重庆市2016年各月的平均气温(℃)数据的茎叶图如图9­3­9,则这组数据的中位数是( )图9­3­9A .19B .20C .21.5D .23B [由茎叶图可知这组数据由小到大依次为8,9,12,15,18,20,20,23,23,28,31,32,所以中位数为20+202=20.]2.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1 534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 ( )A .134石B .169石C .338石D .1 365石B [254粒和1 543石中夹谷的百分比含量是大致相同的,可据此估计这批米内夹谷的数量.设1 534石米内夹谷x 石,则由题意知x 1 534=28254,解得x ≈169.故这批米内夹谷约为169石.]3.某班的全体学生参加英语测试,成绩的频率分布直方图如图9­3­10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )图9­3­10A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9­3­11中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )图9­3­11A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个D[对于选项A,由题图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.]5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8 B.15C.16 D.32C [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.]二、填空题6.如图9­3­12所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众数为84,则x +y =________.【导学号:31222365】图9­3­1210 [x 甲=75+82+84++x +90+936=85,x =6.又∵乙同学的成绩众数为84,∴y =4. ∴x +y =10.]7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图9­3­13所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.【导学号:31222366】图9­3­1324 [底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.] 8.(2017·郑州调研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:2 [易知x 甲=90,x 乙=90.则s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4.s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.]三、解答题9.(2017·郑州调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图9­3­14所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.【导学号:31222367】图9­3­14(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.[解] (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10,3分∴m =3,n =8.5分(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,8分s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,10分∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.12分10.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:图9­3­15(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w =3时,估计该市居民该月的人均水费.[解] (1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.3分所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%. 依题意,w 至少定为3.5分(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元).12分B 组 能力提升 (建议用时:15分钟)1.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:【导学号:31222368】图9­3­16则7个剩余分数的方差为( ) A.1169B.367 C .36D.677B [由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17[(87-91)2+(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2]=17(16+9+1+0+1+9+0)=367.]2.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图9­3­17所示.图9­3­17(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.(1)3(2)6 000[(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.]3.(2017·广州模拟)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图9­3­18.图9­3­18(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解](1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x =0.007 5,∴直方图中x 的值为0.007 5.4分 (2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a ,则(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,解得a =224,即中位数为224.8分(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽样比为1125+15+10+5=15,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).12分。

高考数学(理)总复习备考指导课件:第九章 算法初步、统计与统计案例 第3节 用样本估计总体

高考数学(理)总复习备考指导课件:第九章 算法初步、统计与统计案例 第3节 用样本估计总体

【例 1】 (2012·广东高考)某班 100 名学生期中考试语文 · 明
基 础
成绩的频率分布直方图如图 9-3-4 所示,其中成绩分组区
考 情
间是:[50,60),[60,70),[70,80),[80,90),[90,100].





·






图 9-3-4
菜单
高三一轮总复习理科数学 ·(安徽专用)
=50.

例 探
【答案】 B


·






菜单
高三一轮总复习理科数学 ·(安徽专用)








· 固
4.(2013·湖北高考)某学员在一次射击测试中射靶
10 次,
· 明


础 命中环数如下:

7,8,7,9,5,4,9,10,7,4.

则:(1)平均命中环数为________;

探 究
(2)命中环数的标准差为________.



菜单
高三一轮总复习理科数学 ·(安徽专用)
自 主
2.(人教 A 版教材习题改编)若某校高一年级 8 个班参加
高 考


实 ·
合唱比赛的得分如茎叶图 9-3-1 所示,则这组数据的中位
验 ·

基 数和平均数分别是( 和 91.5
B.91.5 和 92

C.91 和 91.5
高三一轮总复习理科数学 ·(安徽专用)

高考新坐标(教师用书)届高考数学总复习第九章算法初步、统计与统计案例【含答案】

高考新坐标(教师用书)届高考数学总复习第九章算法初步、统计与统计案例【含答案】

第九章算法初步、统计与统计案例第一节算法与程序框图[考纲传真]1.了解算法的含义,了解算法的思想. 2.理解程序框图的三种基本逻辑结构:顺序、条件、循环. 3.理解几种基本算法语句——输入语句、输出语句、赋值语句、条件语句、循环语句的含义.1.算法(1)算法通常是指按照一定规则解决某一类问题的明确和有限的步骤.(2)应用:算法通常可以编成计算机程序,让计算机执行并解决问题.2.程序框图定义:程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形.3.三种基本逻辑结构及相应语句1.(夯基释疑)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)程序框图中的图形符号可以由个人来确定.( )(2)一个程序框图一定包含顺序结构,但不一定包含条件结构和循环结构.( ) (3)5=x 是赋值语句.( )(4)输入语句可以同时给多个变量赋值.( )[解析] 图形符号不能个人确定,(1)不正确;赋值语句只能给变量赋值,(3)不正确. [答案] (1)× (2)√ (3)× (4)√2.(教材改编)根据给出的程序框图,计算f(-1)+f(2)=( )图9­1­1A .0B .1C .2D .4[解析] 输入-1,满足x≤0,所以f(-1)=4×(-1)=-4;输入2,不满足x≤0,所以f(2)=22=4,即f(-1)+f(2)=0.[答案]A3.运行如图所示的程序,可得A的输出值为( )A=20A=A*2-30PRINT AENDA.30 B.20 C.10 D.-10[解析]A=20×2-30=10.[答案]C4.(2014·天津高考)阅读下边的框图,运行相应的程序,输出S的值为________.图9­1­2[解析]S=0,n=3,S=0+(-2)3=-8,n=3-1=2≤1不成立;故S=-8+(-2)2=-4,n=2-1=1≤1成立.故输出S的值为-4.[答案]-45.(2014·福建高考改编)阅读如图9­1­3所示的程序框图,运行相应的程序,输出的n的值为________.图9­1­3[解析]当n=1时,21>12;当n=2时,22>22不成立,结束循环.因此输出n=2.[答案] 2考向1程序框图的基本结构与应用【典例1】(1)执行下面的程序框图,如果输入的t∈[-1,3],则输出的s属于( ) A.[-3,4] B.[-5,2]C.[-4,3] D.[-2,5]图9­1­4图9­1­5(2)(2014·浙江高考)若某程序框图如图9­1­5所示,当输入50时,则该程序运行后输出的结果是________.[解析] (1)由程序框图知s =⎩⎪⎨⎪⎧3t ,(t<1),4t -t 2,(t≥1),①当-1≤t<1时,-3≤s<3;②当1≤t≤3时,s =-(t -2)2+4.∴3≤s≤4. 由①②知,s 的取值范围属于[-3,4]. (2)第一次循环,S =1,i =2; 第二次循环,S =4,i =3;第三次循环,S =2×4+3=11,i =4; 第四次循环,S =2×11+4=26,i =5;第五次循环,S =2×26+5=57,i =6,此时S>50,退出循环. 所以输出的结果i =6. [答案] (1)A (2)6 【规律方法】1.对条件结构,无论判断框中的条件是否成立,都只能执行两个分支中的一个,不能同时执行两个分支.2.利用循环结构表示算法,第一要确定是利用当型还是直到型循环结构;第二准确表示累计变量;第三要注意从哪一步开始循环.弄清进入或终止的循环条件、循环次数是做题的关键.【变式训练1】 (1)如图9­1­6所示的程序框图,运行相应的程序.若输入x 的值为1,则输出S 的值为________.图9­1­6(2)(2014·陕西高考)根据下边框图,对大于2的整数N,输出的数列的通项公式是( )图9­1­7A.a n=2n B.a n=2(n-1) C.a n=2n D.a n=2n-1[解析](1)第1次运行:x=1,S=0+13=1<50;第2次运行:x=2,S=1+23=9<50;第3次运行:x=4,S=9+43=73>50,满足S≥50,跳出循环.输出S=73.(2)由程序框图可知第一次运行:i=1,a1=2,S=2;第二次运行:i=2,a2=4,S=4;第三次运行:i=3.a3=8,S=8;第四次运行:i=4,a4=16,S=16.故选C.[答案](1)73 (2)C考向2程序框图的识别与完善(高频考点)命题视角程序框图的识别与完善是高考命题的热点,主要以客观题的形式呈现.主要命题角度:(1)根据程序框图确定输出结果;(2)补充程序框图中判断框或执行框;(3)依据程序框图及运行结果求输入变量的初始值等.【典例2】 (1)如图9­1­8所示是计算某年级500名学生期末考试(满分为100分)及格率q 的程序框图,则图中空白框内应填入________.图9­1­8 图9­1­9(2)(2014·重庆高考)执行如图9­1­9所示的程序框图,若输出k 的值为6,则判断框内可填入的条件是( )A .s>12B .s>35C .s>710D .s>45[思路点拨] (1)根据程序框图的功能,应确定及格率q 与及格人数M 之间的关系;(2)依次执行程序框图,根据输出结果确定判断框内的控制条件.[解析] (1)由判断框输出可知,M 表示及格人数,N 表示不及格人数, ∴及格率q =M M +N ,因此执行框为“q=M M +N”.(2)第一次循环:s =1×910=910,k =8,s =910应满足条件;第二次循环:s =910×89=810,k =7,s =810应满足条件,排除选项D ;第三次循环:s =810×78=710,k =6,故这时程序不再满足条件,结束循环,因此判断框中的条件为s>710.[答案] (1)q =MM +N(2)C 【通关锦囊】1.(1)第1题的关键在于理解程序框图的功能;(2)第2题要明确何时进入或退出循环体,以及累乘变量的变化.2.解答此类题目:(1)要明确程序框图的顺序结构,条件结构和循环结构;(2)理解程序框图的功能;(3)要按框图中的条件运行程序,按照题目的要求完成解答.【变式训练2】 (2015·潍坊质检)执行如图9­1­10所示的程序框图,若输出的S 是2 047,则判断框内应填写()图9­1­10A .n ≤9?B .n ≤10?C .n ≥10?D .n ≥11?[解析] 由程序框图的功能知,题目的实质是数列{2n}(n∈N )求和. ∵{2n }的首项为20=1,公比为2.∴当n =9时,S =1+2+22+…+29=1-2101-2=1 023.当n =10时,S =1+2+22+…+210=1-2111-2=2 047.此时输出S =2 047,跳出循环,所以判断框的条件为n ≤9. [答案] A考向3 基本算法语句【典例3】 根据下列算法语句,当输入x 为60时,输出y 的值为( )A .25B .30C .31D .61[解析] 由题意,得y =⎩⎪⎨⎪⎧0.5x ,x ≤50,25+0.6(x -50),x>50.当x =60时,y =25+0.6×(60-50)=31. ∴输出y 的值为31. [答案] C ,【规律方法】1.本题主要考查条件语句,输入与输出语句,要注意赋值语句一般格式中的“=”不同于等式中的“=”,其实质是计算“=”右边表达式的值,并将该值赋给“=”左边的变量.2.解决此类问题关键要理解各语句的含义,以及基本算法语句与算法结构的对应关系. 【变式训练3】 运行下面的程序时,WHILE 循环语句的执行次数是( )A .3B .4C .18D .19[解析] 0<20,1<20,2×2<20,5×5>20,程序结束, 故WHILE 循环语句共执行了3次. [答案] A掌握1条规律 每个算法结构都含有顺序结构,循环结构中必定包含一个条件结构,用于确定何时终止循环体.循环结构和条件结构都含有顺序结构.注意1个区别 当型循环与直到型循环的区别:直到型循环是“先循环,后判断,条件满足时终止循环”;当型循环是“先判断,后循环,条件满足时执行循环”;两者的判断框内的条件表述在解决同一问题时是不同的,它们恰好相反.勿忘2点注意 1.赋值号左边只能是变量(不是表达式),在一个赋值语句中只能给一个变量赋值. 2.利用循环结构表示算法,要明确是利用当型循环结构,还是直到型循环结构.要注意:(1)选择好累计变量;(2)弄清在哪一步开始循环,满足什么条件不再执行循环体.易错辨析之10程序框图中“变量”的含义理解不清致误(2014·课标全国卷Ⅰ)执行下面的程序框图,若输入的a ,b ,k 分别为1,2,3,则输出的M =( )图9­1­11A .203 B .72 C .165 D .158[错解] n =1,M =1+12=32,a =2,b =32;n =2,M =2+23=83,a =32,b =83;n =3,M =32+38=158,a =83,b =158;n =4,M =83+815=4815=165,a =158,b =165,此时不满足条件,跳出循环,输出M =165.[答案] C 【智慧心语】错因分析:(1)循环变量n 与累加变量M 计算不对立,或混淆当型循环,误认为直到型循环结构,导致错解.(2)对循环体中各执行框的含义不清,错误赋值,错选A 或B .防范措施:(1)要分清是当型循环结构还是直到型循环结构;要理解循环结构中各变量的具体含义以及变化规律.具体求解时,把每次循环中各个变量的值对应起来,并要清楚的写下来,再根据条件判断是否结束循环.(2)在处理含有循环结构的算法问题时,关键是确定循环的次数,循环中有哪些变量,且每一次循环之后的变量S 、k 值都要被新的S 、k 值所替换.[正解] 第一次执行循环后:M =1+12=32,a =2,b =32,n =2;第二次执行循环后:M =2+23=83,a =32,b =83,n =3.第三次执行循环后:M =32+38=158,a =83,b =158,n =4.这时n =4,跳出循环.输出M 的值158.[答案] D【类题通关】 (2014·北京高考)当m =7,n =3时,执行如图9­1­12所示的程序框图,输出的S 值为( )图9­1­12A.7 B.42 C.210 D.840[解析]程序框图的执行过程如下:m=7,n=3时,m-n+1=5,k=m=7,S=1,S=1×7=7;k=k-1=6>5,S=6×7=42;k=k-1=5=5,S=5×42=210;k=k-1=4<5,输出S=210.故选C.[答案]C课后限时自测[A级基础达标练]一、选择题1.(2014·课标全国卷Ⅱ)执行如图9­1­13所示的程序框图,如果输入的x,t均为2,则输出的S=( )图9­1­13A .4B .5C .6D .7[解析] x =2,t =2,M =1,S =3,k =1. k ≤t ,M =11×2=2,S =2+3=5,k =2;k ≤t ,M =22×2=2,S =2+5=7,k =3;3>2,不满足条件,输出S =7. [答案] D2.(2014·湖南高考)执行如图9­1­14所示的程序框图,如果输入的t∈[-2,2],则输出的S 属于( )图9­1­14A .[-6,-2]B .[-5,-1]C .[-4,5]D .[-3,6][解析] 由程序框图知,当0≤t≤2时,输出S =t -3,此时S∈[-3,-1];当-2≤t<0时,执行t =2t 2+1后1<t≤9,执行1<t≤9时,输出S =t -3,此时S∈(-2,6].因此输出S 的值属于[-3,6].[答案] D3.某程序框图如图9­1­15所示,若输出的结果S=57,则判断框内应填入的条件是( )图9­1­15A.k>4? B.k>5? C.k>6? D.k>7?[解析]由程序框图可知,k=1时,S=1;k=2时,S=2×1+2=4;k=3时,S=2×4+3=11;k=4时,S=2×11+4=26;k=5时,S=2×26+5=57.[答案]A4.阅读如图9­1­16所示的程序框图,运行相应的程序,则输出S的值为( )图9­1­16A.8 B.18 C.26 D.80[解析]执行一次循环S=2,n=2;执行第二次循环:S=2+32-31=8,n=3;执行第3次循环:S=8+33-32=26,n=4;满足n≥4,故输出S=26.[答案]C5.(2014·安徽高考)如图9­1­17所示,程序框图(算法流程图)的输出结果是( )图9­1­17A.34 B.55 C.78 D.89[解析]当输入x=1,y=1,执行z=x+y及z≤50,x=y,y=z后,x,y,z的值依次对应如下:x=1,y=1,z=2;x=1,y=2,z=3;x=2,y=3,z=5;x=3,y=5,z=8;x=5,y=8,z=13;x=8,y=13,z=21;x=13,y=21,z=34;x=21,y=34,z=55.由于55≤50不成立,故输出55.故选B.[答案]B二、填空题6.运行下列的程序,当输入a,b分别为2,3时,最后输出的m的值为________.[解析]∵a=2,b=3,满足a<b,∴应把b值赋给m,∴m的值为3.[答案] 37.(2014·山东高考)执行如图9­1­18所示的程序框图,若输入的x的值为1,则输出的n的值为________.图9­1­18[解析]按照程序框图逐一执行.由x2-4x+3≤0,解得1≤x≤3.当x=1时,满足1≤x≤3,所以x=1+1=2,n=0+1=1;当x=2时,满足1≤x≤3,所以x=2+1=3,n=1+1=2;当x=3时,满足1≤x≤3, 所以x=3+1=4,n=2+1=3;当x=4时,不满足1≤x≤3,所以输出n=3.[答案] 38.(2015·临沂模拟)图9­1­19(1)是某高三学生进入高中三年来的数学考试成绩茎叶图,第1次到第14次的考试成绩依次记为A1,A2,…,A14.图(2)是统计茎叶图中成绩在一定范围内考试次数的一个算法流程图.那么算法流程图输出的结果是________.(1) (2)图9­1­19[解析]从算法流程图可知,该图表示统计成绩大于或等于90分的考试次数.由茎叶图可知输出的结果为10.[答案]10三、解答题9.某篮球队6名主力队员在最近三场比赛中投进的三分球个数如表格所示:图9­1­20统计该6名队员在最近三场比赛中投进的三分球总数的程序框图如图9­1­20所示.(1)试在判断框内填上条件;(2)求输出的s的值.[解](1)依题意,程序框图是统计6名队员投进的三分球的总数.∴判断框内应填条件“i≤6?”.(2)6名队员投进的三分球数分别为a1,a2,a3,a4,a5,a6.故输出的s=a1+a2+…+a6.10.三月植树节,林业管理部门在植树前,为了保证树苗的质量,都会对树苗进行检测.现从甲,乙两种树苗中各抽测了10株树苗,量出它们的高度如下:(单位:厘米) 甲:37,21,31,20,29,19,32,23,25,33;乙:10,30,47,27,46,14,26,10,44,46.(1)画出两组数据的茎叶图,并根据茎叶图对甲,乙两种树苗的高度作比较,写出两个统计结论.(2)设抽测的10株甲种树苗高度平均值为x -,将这10株树苗的高度依次输入,按程序框图(如图9­1­21)进行运算,问输出的S 大小为多少?并说明S 的统计学意义.图9­1­21[解] (1)茎叶图如下:统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度; ②甲种树苗比乙种树苗长得整齐;③甲种树苗的中位数为27,乙种树苗的中位数为28.5;④甲种树苗的高度基本上是对称的,而且大多数集中在均值附近.(任写两条即可) (2)x -=27,S =35;S 表示10株甲种树苗高度的方差,是描述树苗高度离散程度的量.S 值越小,表示长得越整齐,S 值越大,表示长得越参差不齐.[B 级 能力提升练]1.(2015·济南质检)已知函数f(x)=ax 3+12x 2在x =-1处取得极大值,记g(x)=1f ′(x ).程序框图如图9­1­22所示,若输出的结果S>2 0142 015,则判断框中可以填入的关于n 的判断条件是( )图9­1­22A .n ≤ 2 014?B .n ≤2 015?C .n>2 014?D .n>2 015?[解析] 由题意得f′(x)=3ax 2+x ,由f′(-1)=0得a =13,∴f ′(x)=x 2+x ,即g(x)=1x 2+x =1x (x +1)=1x -1x +1. 由程序框图可知S =0+g(1)+g(2)+…+g(n)=1-1n +1, 由1-1n +1>2 0142 015,得n>2 014. 因此条件应为n≤2 015? [答案] B2.执行如图9­1­23所示的程序框图,若输入n 的值为4,则输出s 的值为________.图9­1­23[解析] 第一步运算结果:s =1,i =2(i≤4成立);第二步运算结果:s =2,i =3(i≤4成立);第三步运算结果:s =4,i =4(i≤4成立);第四步运算结果:s =7,i =5(i≤4不成立),程序结束,故输出s 的值为7.[答案] 73.已知数列{a n }的各项均为正数,观察程序框图如图9­1­24所示,若k =5,k =10时,分别有S =511和S =1021,试求数列{a n }的通项公式.图9­1­24[解] 由程序框图可知,数列{a n }是等差数列,首项为a 1,公差为d. S i =1a 1a 2+1a 2a 3+…+1a i a i +1=1d (1a 1-1a 2+1a 2-1a 3+…+1a i -1a i +1) =1d ⎝ ⎛⎭⎪⎫1a 1-1a i +1. 当k =5时,S =⎝ ⎛⎭⎪⎫1a 1-1a 61d =5a 1a 6=511.∴a 1a 6=11,即a 1(a 1+5d)=11;①当k =10时,S =⎝ ⎛⎭⎪⎫1a 1-1a 111d =10a 1a 11=1021,∴a 1a 11=21,即a 1(a 1+10d)=21,② 由①②联立,得a 1=1,d =2, 因此a n =a 1+(n -1)d =2n -1.第二节 随机抽样[考纲传真]1.理解随机抽样的必要性和重要性. 2.会用简单随机抽样方法从总体中抽取样本. 3.了解分层抽样和系统抽样方法.1.简单随机抽样(1)设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)常用简单随机抽样的方法:抽签法和随机数表法. 2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本. (1)先将总体的N 个个体编号.(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当Nn 不是整数时,随机从总体中剔除余数.(3)在第1段用简单随机抽样确定第一个个体编号l(l≤k). (4)按照一定的规则抽取样本, 3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2)应用范围:总体是由差异明显的几个部分组成时.1.(夯基释疑)判断下列结论的正误.(正确的打“√”,错误的打“×”) (1)简单随机抽样是从总体中逐个不放回的抽取抽样.( ) (2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ) (3)系统抽样在起始部分抽样时采用简单随机抽样.( )(4)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( )[解析] 由简单随机抽样,系统抽样,分层抽样的意义,知(1)与(3)正确,(2)与(4)不正确.[答案] (1)√ (2)× (3)√ (4)×2.(2014·广东高考)为了解1 000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A .50B .40C .25D .20[解析] 根据系统抽样的特点可知分段间隔为1 00040=25,故选C .[答案] C3.(2015·青岛调研)为了解某地区的中小学生的视力情况,拟从该地区的中小学生中抽取部分学生进行调查,事先已了解到该地区小学,初中,高中三个学段学生的视力情况有较大差异,而男女视力情况差异不大.在下面的抽样方法中,最合理的抽样方法是( )A .简单随机抽样B .按性别分层抽样C .按学段分层抽样D .系统抽样[解析] 由于三个学段学生的视力情况差别较大,故需按学段分层抽样. [答案] C4.(2014·湖南高考)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3[解析] 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. [答案] D5.某学校高一,高二,高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.[解析] 设应从高二年级抽取x 名学生,则x∶50=3∶10.解得x =15. [答案] 15考向1简单随机抽样【典例1】(1)下列抽取样本的方式属于简单随机抽样的个数为( )①盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.②从20件玩具中一次性抽取3件进行质量检验.③某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛.A.0 B.1 C.2 D.3(2)(2013·江西高考)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08 B.07 C.02 D.01[解析](1)①②③中都不是简单随机抽样,这是因为:①是放回抽样,②中是“一次性”抽取,而不是“逐个”抽取,③中“指定个子最高的5名同学”,不存在随机性,不是等可能抽样.(2)由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.[答案](1)A(2)D【规律方法】1.简单随机抽样是从含有N(有限)个个体的总体中,逐个不放回地抽取样本,且每次抽取时总体内的各个个体被抽到的机会都相等.2.(1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是号签是否易搅匀,一般地,当总体容量和样本容量都较小时可用抽签法.(2)随机数表法适用于总体中个体数较多的情形:随机数表法的操作要点:编号,选起始数,读数,获取样本.【变式训练1】下列抽样试验中,适合用抽签法的有________.①从某厂生产的5 000件产品中抽取600件进行质量检测; ②从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验; ③从甲,乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检测; ④从某厂生产的5 000件产品中抽取10件进行质量检测. [解析] ①,④中总体的个体数较大,不适用抽签法.对于③中,甲,乙两厂的产品质量可能差别较大,不一定能够达到搅拌均匀的条件,不适宜用抽签法.②中为同厂的产品,且样本容量较小,可用抽签法. [答案] ②考向2 系统抽样及其应用【典例2】 (1)(2015·淄博调研)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第1组中用抽签的方法确定的号码是________.(2)(2013·陕西高考)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( )A .11B .12C .13D .14[解析] (1)设第1组抽取的号码为b ,由系统抽样则第n 组抽取的号码为8(n -1)+b , ∴8×(16-1)+b =126,∴b =6, 故第1组抽取的号码为6.(2)抽样间隔为84042=20.设在1,2,…,20中抽取号码x 0(x 0∈[1,20]),在[481,720]之间抽取的号码记为20k +x 0,则481≤20k+x 0≤720,k ∈N *.∴24120≤k +x 020≤36.∵x 020∈⎣⎢⎡⎦⎥⎤120,1,∴k =24,25,26,…,35, ∴k 值共有35-24+1=12(个),即所求人数为12. [答案] (1)6 (2)B 【规律方法】1.如果总体容量N 能被样本容量n 整除,则抽样间隔为k =Nn,否则,可随机地从总体中剔除余数,然后按系统抽样的方法抽样.特别注意,每个个体被抽到的机会均是n N.2.系统抽样中依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.【变式训练2】 (2015·威海质检)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .15[解析] 由系统抽样知:抽取号码的间隔为96032=30,∵第一组抽取的号码为9,∴抽取的第n 个号码为a n ,则a n =9+30(n -1), 由451≤a n ≤750,得151115≤n ≤25710,注意到n ∈N *,∴落入区间[451,750]的号码共10个, 因此做问卷B 的有10人. [答案] C考向3 分层抽样及应用(高频考点)命题视角 分层抽样是抽样方法考查的重点,主要以客观题的形式呈现,命题的主要角度:(1)求各层的个体容量;(2)根据某层的容量求总体容量;(3)分层抽样的简单应用.【典例3】 (1)(2015·日照联考)某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( )A .9B .10C .12D .13(2)(2014·湖北高考)甲、乙两套设备生产的同类型产品共4 800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.[思路点拨] (1)利用抽样比为定值,列方程求解;(2)利用分层抽样,先求出总体中甲设备生产的产品数量,再计算乙设备生产的产品数量.[解析] (1)依题意得360=n120+80+60,故n =13.(2)由题设,抽样比为804 800=160.设甲设备生产的产品为x 件, 则x60=50,∴x =3 000. 故乙设备生产的产品总数为4 800-3 000=1 800. [答案] (1)D (2)1 800 【通关锦囊】1.分层抽样中分多少层,如何分层要视具体情况而定,总的原则是:层内样本的差异要小,两层之间的样本差异要大,且互不重叠.2.为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n∶N.分层抽样的有关计算,转化为按比例列方程或算式求解.【变式训练3】 (1)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.(2)(2014·重庆高考)某中学有高中生3 500人,初中生1 500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250[解析] (1)抽样比为280560+420=280980=27,所以样本中男生人数为560×27=160.(2)法一:由题意可得70n -70=3 5001 500,解得n =100.法二:由题意,抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.[答案] (1)160 (2)A掌握2条规律 1.三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n ,总体容量为N ,每个个体被抽到的概率是nN. 2.系统抽样抽取的个体编号从小到大成等差数列.熟记3个范围 1.简单随机抽样:总体容量较少,尤其是样本容量较少. 2.系统抽样:适用于元素个数很多且均衡的总体. 3.分层抽样:适用于总体由差异明显的几部分组成的情形.勿忘3点注意 1.简单随机抽样中,易忽视样本是从总体中逐个抽取,是不放回抽样,且每个个体被抽到的概率相等. 2.系统抽样中,易忽视抽取的样本数也就是分段的段数,当Nn 不是整数时,注意剔除,剔除的个体是随机的. 3.分层抽样中,易忽视每层抽取的个体的比例是相同的.易错辨析之11 图表信息求解的误区(2014·广东高考改编)已知某地区中小学生人数和近视情况分别如图9­2­1①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.图9­2­1[错解] 由图①知,样本容量为(2 000+3 500+4 500)×2%=200, 根据图②知,高中学生的近视人数为200×50%=100. 或根据图②知,高中近视人数为50人. 【智慧心语】错因分析:(1)误把样本容量200认为高中学生的样本数量,或将条形图中近视率误为近视人数.(2)不能从图表中提取有效信息,有的考生无从入手,或者未抓住分层抽样的特点:“各层抽取的个体数依各层个体之比来分配”而无法正确完成高中近视人数的计算求值.防范措施:(1)加强识图能力的培养,如本题中纵轴表示的近视率分别为10%,30%,50%.(2)理解分层抽样的概念,首先分层抽样是等概率抽样,因此,各层的抽样比应相等,可以利用这个等比关系计算求值.[正解] 易知,样本容量为(3 500+4 500+2 000)×2%=200.又样本中高中学生共有2 000×2%=40人.利用图②知,高中学生的近视率为50%.因此所抽样本中高中学生的近视人数为40×50%=20人.[答案]200 20【类题通关】从某小学随机抽样100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图9­2­2所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.图9­2­2[解析]∵0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,∴a=0.030.设身高在[120,130),[130,140),[140,150]内的三组学生各有x,y,z人,则x100=0.030×10,y100=0.020×10,z100=0.01×10.∴x=30,y=20,z=10.由分层抽样的意义,抽样比为1830+20+10=30%.因此从身高在[140,150]内的学生中选取10×30%=3(人).[答案](1)0.030 (2)3课后限时自测[A 级 基础达标练]一、选择题1.(2014·四川高考)在“世界读书日”前夕,为了了解某地5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A .总体B .个体C .样本的容量D .从总体中抽取的一个样本[解析] 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.[答案] A2.从2 007名学生中选取50名学生参加全国数学联赛,若采用下面的方法选取:先用简单随机抽样从2 007人中剔除7人,剩下的2 000人再按系统抽样的方法抽取,则每人入选的概率( )A .不全相等B .均不相等C .都相等,且为502 007D .都相等,且为140[解析] 从N 个个体中抽取M 个个体,每个个体被抽到的概率均为MN .[答案] C3.某学校有男,女学生各500名,为了解男,女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法[解析] 由于是调查男,女学生在学习兴趣与业余爱好方面是否存在差异,因此用分层抽样法.[答案] D4.(2015·潍坊一模)高三某班有学生56人,现将所有同学随机编号,用系统抽样的方。

高考数学一轮复习第九章 第三讲用样本估计总体学案含解析新人教版

高考数学一轮复习第九章 第三讲用样本估计总体学案含解析新人教版

第三讲 用样本估计总体知识梳理·双基自测知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =__x 1+x 2+…+x n n __,反映了一组数据的平均水平.(4)标准差: s =__1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度. (5)方差:s 2=__1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.归纳拓展(1)若一组数据x i (i =1,2,…,n )的平均数为x -,方差为s 2,则数据组ax i +b (i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为(C)A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为(B)A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02=0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165)0.100笫2组[165,170)①第3组[170,175)20②第4组[175,180)200.200第5组[180,185)100.100合计100 1.00 (ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·湖北恩施州质检)为了解人们对环保知识的认知情况,某调查机构对A地区随机选取n个居民进行了环保知识问卷调查(满分为100分),并根据问卷成绩(不低于60分记为及格)绘制成如图所示的频率分布直方图(分为[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]六组),若问卷成绩最后三组频数之和为360,则下列结论正确的是__②③④__.①n=480②问卷成绩在[70,80)内的频率为0.3③a=0.030④以样本估计总体,若对A 地区5 000人进行问卷调查,则约有1 250人不及格 [解析] (1)(ⅰ)第1组的频数为100×0.100=10, 所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)(理)记“第4组至少有一名选手被考官A 面试”为事件A ,则P (A )=C 12C 13+C 22C 25=710. ⎝⎛⎭⎫或P (A )=1-P (A -)=1-C 23C 25=710(文)设第3组的2位选手为A 1,A 2,第4组的2位选手为B 1,B 2,第5组的1位选手为C 1,则从这五位选手中抽取两位选手有(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,C 1),(B 1,B 2),(B 1,C 1),(B 2,C 1),共10种情况.其中第4组的2位选手B 1,B 2,中至少有一位入选的有(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(B 1,B 2),(B 1,C 1),(B 2,C 1),共有7种情况,所以第4组至少有一名选手被考官A 面试的概率为710.(2)由(0.010+0.015+0.015+a+0.025+0.005)×10=1,得a=0.030,n=360=600.故①不正确,③正确;成绩在[70,80)内的频率为10a=0.3,故②10(a+0.025+0.005)正确;若对A地区5 000人进行问卷调查,则约有5 000×(0.1+0.15)=1 250人不及格,故④正确.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是(C)A .12B .13C .14D .15[解析] (1)根据频率分布直方图知:(2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (2021·四川省乐山市调研)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法不正确...的是( C ) a b 6 4 4 23 8 64 143.1 3.2 3.3 3.42 3 7 1 1 1 1 2 5 7A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:3.23+3.312=3.27,故D正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为(A)甲组乙组62 5x4567917y8A.3,5C.3,7 D.5,7[解析]甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.考点三,样本数字特征——多维探究角度1样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是(B)A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为__367__. [解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=(a 1-5)2+(a 2-5)2+…+(a 7-5)2+(5-5)28=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )7 8 9 8 4 6 7 7 91 4 8 8 9 9A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2 C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四,折线图——师生共研例4 (2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是( A )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选A .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x-乙,则下列结论正确的个数为( B )①每次考试甲的成绩都比乙的成绩高 ②甲的成绩比乙稳定 ③x -甲一定大于x -乙④甲的成绩的极差大于乙的成绩的极差 A .1 B .2 C .3D .4[解析] 第二次考试甲的成绩比乙低,①错;由图可知甲的成绩比乙的成绩波动小,②正确,④错;甲的平均成绩显然比乙的平均成绩高,③正确;故选B .名师讲坛·素养提升高考与频率分布直方图例5 (理)(2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数6920105(2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.(文)(2021·河南新乡模拟)甲、乙两人想参加某项竞赛,根据以往20次的测试,将样本数据分成[50,60),[60,70),[70,80),[80,90),[90,100]五组,并整理得到如下频率分布直方图:已知甲测试成绩的中位数是75.(1)求x ,y 的值,并分别求出甲、乙两人测试成绩的平均数(假设同一组中的每个数据可用该组区间中点值代替);(2)从甲、乙两人测试成绩不足60分的试卷中随机抽取3份,求恰有2份来自乙的概率. [解析] (理)(1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P (X =0)=C 33C 36=120,P (X =1)=C 13C 23C 36=920,P (X =2)=C 23C 13C 36=920,P (X =3)=C 33C 36=120,所以分布列为: X123P 120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.(文)(1)∵甲测试成绩的中位数为75,∴0.01×10+y×10+0.04×(75-70)=0.5,解得y=0.02,∴0.01×10+y×10+0.04×10+x×10+0.005×10=1,解得x=0.025.同学甲的平均分为55×0.01×10+65×0.02×10+75×0.04×10+85×0.025×10+95×0.005×10=74.5.同学乙的平均分为55×0.015×10+65×0.025×10+75×0.03×10+85×0.02×10+95×0.01×10=73.5.(2)甲测试成绩不足60分的试卷数为20×0.01×10=2,设为A,B.乙测试成绩不足60分的试卷数为20×0.015×10=3,设为a,b,c.从中抽3份的情况有(A,B,a),(A,B,b),(A,B,c),(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),(a,b,c),共10种情况.满足条件的有(A,a,b),(A,a,c),(A,b,c),(B,a,b),(B,a,c),(B,b,c),共6种情况,故恰有2份来自乙的概率为610=35.名师点拨](1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系.(2)准确理解频率分布直方图的数据特点是解题关键.〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。

高三数学一轮总复习-第九章 算法、统计、统计案例 9.2 用样本估计总体课件

高三数学一轮总复习-第九章 算法、统计、统计案例 9.2 用样本估计总体课件
大家好
1
第九章 算法、统计、统计案例
第二节 用样本估计总体
课前学案 基础诊断
课堂学案 考点通关
高考模拟 备考套餐
课前学案 基础诊断
夯基固本 基础自测
1.在如图所示的茎叶图表示的数据中,众数和中位数分别是( )
A.23与26 C.24与30
B.31与26 D.26与30
解析:观察茎叶图可知,这组数据的众数是31,中位数是26。 答案:B
答案:D
3.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率 分布直方图。由图中数据可知身高在[120,130]内的学生人数为( )
A.20 C.30
B.25 D.35
解析:由题意知a×10+0.35+0.2+0.1+0.05=1,则a=0.03,故学生人数为 0.3×100=30。
解析:甲数据集中于前半段,而乙数据集中于后半段,所以 x 甲< x 乙;m甲= 18+2 22=20,m乙=27+2 31=29,所以m甲<m乙,所以选B。
答案:B
通关特训3 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射
击了5次,成绩如下表(单位:环):

10
8
999

10
10
7
9
9
如果甲、乙两人中只有1人入选,则入选的最佳人选应是__________。
2.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2; [20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上 的数据的频率是( )
A.0.05 B.0.25 C.0.5 D.0.7

高考数学大一轮总复习第九章算法初步统计统计案例93用样本估计总体课件新人教B版

高考数学大一轮总复习第九章算法初步统计统计案例93用样本估计总体课件新人教B版

4.由茎叶图可以清晰地看到数据的分布情况,这一点同频率 分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中 能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录 和表示.其缺点是当样本容量较大时,作图较烦琐.
1.(方向 1)某校对高二(1)班的数学期末考试成绩进行了统 计,发现该班学生的分数都在 90 到 140 之间,其频率分布直方 图如下图所示.若分数在 130~140 的人数为 2,则分数在 100~ 120 的人数为( B )
解析:对于 A:由整个互联网行业从业者年龄分布的饼状图 可知,互联网行业从业者中 90 后占了 56%,所以 A 正确;对于 B:由两个统计图知,互联网行业从事技术岗位的 90 后人数占 总人数的 56%×39.6%=22.176%,已经超过了 20%,所以整个 互联网行业从事技术岗位的人数肯定会超过总人数的 20%,所 以 B 正确;对于 C:由两个统计图知,互联网行业从事运营岗 位的人数 90 后占总人数的 56%×17%=9.52%,超过了 80 前互 联网行业从业者人数,所以 C 正确;对于 D:由两个统计图知 互联网行业 80 后的人数占 41%,但没有 80 后的岗位分布图, 因此无法判断互联网行业中从事技术岗位的人数 90 后与 80 后谁 多谁少,故 D 错误,选 D.
02 考点探究 明晰规律
课堂升华 强技提能
考点一 统计图表的应用
命题方向 1 频率分布直方图的应用 【例 1】 (2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体
内的残留程度,进行如下试验:将 200 只小鼠随机分成 A,B 两 组,每组 100 只,其中 A 组小鼠给服甲离子溶液,B 组小鼠给服 乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经 过一段时间后用某种科学方法测算出残留在小鼠体内离子的百 分比.根据试验数据分别得到如下直方图:

2020届高考数学一轮总复习第九章算法初步、统计、统计案例第三节用样本估计总体课件理新人教A版

2020届高考数学一轮总复习第九章算法初步、统计、统计案例第三节用样本估计总体课件理新人教A版

如平均数,标准差),并做出合理的解 2017·全国 析
释.
卷Ⅱ,T18 2.数学运
4.会用样本的频率分布估计总体分布, 2017·全国 算
会用样本的基本数字特征估计总体的基 卷Ⅲ,T3
本数字特征,理解用样本估计总体的思
想.
5.会用随机抽样的基本方法和样本估计
总体的思想解决一些简单的实际问题.
1.统计图表 (1)频率分布直方图的画法步骤. ①求极差(即一组数据中最__大__值__与最__小__值__的差); ②决定_组__距__与_组__数__; ③将数据_分__组__; ④列_频__率__分__布__表__; ⑤画_频__率__分__布__直__方__图__.
2.样本的数字特征 (1)众数:一组数据中_出__现__次__数__最__多___的那个数据, 叫做这组数据的众数.
(2)中位数:把 n 个数据按大小顺序排列,处于_最__中__间_ 位置的一个数据(或最中间两个数据的平均数)叫做这组 数据的中位数.
a1+a2+…+an (3)平均数:把_______n______称为 a1,a2,…,an 这 n 个数的平均数.
内的居民数有________人.
解析:(1)频数=32×0.25=8.故选 B. (2)由频率分布直方图可知,月均用水量为[2,2.5)范 围内的居民所占频率为 0.50×0.50=0.25,所以月均用水 量为[2,2.5)范围内的居民数为 100×0.25=25. 答案:(1)B (2)25
3.典题体验 (1)(2017·全国卷Ⅰ)为评估一种农作物的种植效果, 选了 n 块地作试验田.这 n 块地的亩产量(单位:kg)分别 为 x1,x2,…,xn,下面给出的指标中可以用来评估这种 农作物亩产量稳定程度的是( ) A.x1,x2,…,xn 的平均数 B.x1,x2,…,xn 的标准差 C.x1,x2,…,xn 的最大值 D.x1,x2,…,xn 的中位数

高考数学一轮复习 第九章 算法初步、统计、统计案例 第三节 用样本估计总体学案 理(含解析)新人教A

高考数学一轮复习 第九章 算法初步、统计、统计案例 第三节 用样本估计总体学案 理(含解析)新人教A

第三节 用样本估计总体2019考纲考题考情1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。

①求极差(即一组数据中最大值与最小值的差)。

②决定组距与组数。

③将数据分组。

④列频率分布表。

⑤画频率分布直方图。

(2)频率分布折线图和总体密度曲线。

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。

②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。

(3)茎叶图。

茎是指中间的一列数,叶是从茎的旁边生长出来的数。

2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。

(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。

(3)平均数:x -=x 1+x 2+…+x nn,反映了一组数据的平均水平。

(4)标准差:是样本数据到平均数的一种平均距离,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]。

(5)方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数)。

1.频率分布直方图中各小矩形的面积之和为1。

2.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数。

(2)中位数左边和右边的小长方形的面积和是相等的。

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。

3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a 。

(2)数据x 1,x 2,…,x n 的方差为s 2。

2017年高考数学人教版理科一轮复习课件:第9章 算法初步、统计、统计案例 3 用样本估计总体

2017年高考数学人教版理科一轮复习课件:第9章 算法初步、统计、统计案例 3 用样本估计总体

考点二 茎叶图 【典例 2】(2016·长治模拟)对某商店一个月内每天的顾客人数进行 统计,得到样本的茎叶图(如图所示).则该样本的中位数、众数、极差 分别是( ) A.47,45,56 B.46,45,53 C.46,45,56 D.45,47,53
解析:由茎叶图可知,中位数为45+2 47=46,众数为 45,极差为 68-12=56。
第七页,编辑于星期六:二点 四十七分。
4.甲、乙两名同学在 5 次体育测试中的成绩统计的茎叶图如下图 所示,若甲、乙两人的平均成绩分别为 X 甲、X 乙,则下列结论正确的 是( )
A.X 甲<X 乙;乙比甲成绩稳定 B.X 甲>X 乙;甲比乙成绩稳定 C.X 甲>X 乙;乙比甲成绩稳定 D.X 甲<X 乙;甲比乙成绩稳定
第二页,编辑于星期六:二点 四十七分。
考情分析 1.主要以选择题、填空题的形式考查平均数、方差的计算以及茎 叶图与频率分布直方图的简单应用 2.在解答题中经常把频率分布直方图与概率相结合命题,属于中 低档题
第三页,编辑于星期六:二点 四十七分。
[小题热身] 1.思考辨析(正确的打“√”,错误的打“×”) (1)一组数据的平均数一定大于这组数据中的每个数据。( × ) (2)平均数、众数与中位数都可以描述数据的集中趋势。( √ ) (3)一组数据的方差越大,说明这组数据的波动越大。( √ ) (4)频率分布直方图中,小矩形的面积越大,表示样本数据落在该 区间内的频率越高。( √ ) (5)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记 一次。( × )
第六页,编辑于星期六:二点 四十七分。
3.已知一个样本中的数据为 1,2,3,4,5,那么该样本的标准差为 ()
A.1 B. 2 C. 3 D.2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
A.8万元 B.10万元 C.12万元 D.15万元
[解析] 由频率分布直方图知,9 时至 10 时的销售额的频率为 0.1,故销售 总额为03.1=30 万元.又 11 时至 12 时的销售额的频率为 0.4,故销售额为 0.4×30 =12 万元.故选 C.
4.(2018·江苏高考)已知5位裁判给某运动员打出的分数的茎叶图如图所 示,那么这5位裁判打出的分数的平均数为_____9_0_____.
第九章
算法初步、统计、统计案例
第三讲 用样本估计总体
1
知识梳理双基自测
2
考点突破互动探究Biblioteka 3名师讲坛素养提升
知识梳理双基自测
1.用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图 频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例 大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情 况. 绘制频率分布直方图的步骤为: ①___求__极__差_____;②_决__定__组__距__与__组__数___;③___将__数__据__分__组___; ④_列__频__率__分__布__表____;⑤__画__频__率__分__布__直__方__图_.
(2)频率分布折线图 顺次连接频率分布直方图中_各__小__长__方__形__上__端__的__中__点__,就得到频率分布折线 图. (3)总体密度曲线 总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细 的信息. 2.茎叶图 (1)茎叶图中茎是指___中__间______的一列数,叶是从茎的____旁__边_____生长出 来的数. (2)茎叶图的优点是可以___保__留______原始数据,而且可以_随__时___记录,这对 数据的记录和表示都能带来方便.
种植收入 第三产业收入 其他收入 养殖收入
建设前 0.6a
经济收入
0.06a
0.04a 0.3a
建设后 经济收入
0.74a
0.56a
0.1a
0.6a
根据上表可知 B、C、D 均正确,A 不正确,故选 A.
2.(2019·吉林长春)已知某班级部分同学一次测验的成绩统计如图,则其中 位数和众数分别为( B )
A.95,94 B.92,86 C.99,86 D.95,91 [解析] 由茎叶图可知,此组数据由小到大排列依次 76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数, 出现次数最多的为众数,故众数为86,故选B.
3.(2019·湖北夷陵中学)某商场在国庆黄金周的促销活动中,对10月1日9时 至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售 额为3万元,则11时至12时的销售额为( C )
8 9 9 9 0 1 1
[解析] 本题考查茎叶图、平均数. 5 位裁判打出的分数分别为 89,89,90,91,91. 则这 5 位裁判打出的分数的平均数为15×(89+89+90+91+91)=90.
5.某部门计划对某路段进行限速,为调查限速60 km/h是否合理,对通过 该路段的300辆汽车的车速进行检测,将所得数据按[40,50),[50,60),[60,70), [70,80)分组,绘制成如图所示的频率分布直方图,则这300辆汽车中车速低于限 速的汽车有___1_8_0_______辆.
频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长 方形的面积乘以小长方形底边中点的横坐标之和.
1.(2018·课标全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增 加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了 该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是( ) A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 [答案] A
[解析] 设建设前经济收入为 a,则建设后经济收入为 2a,由题图可得下表:
3.样本的数字特征 (1)众数:一组数据中出现次数最多的数. (2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数; 若有偶数个数,则中间两数的平均数是中位数. (3)平均数: x =__x_1+__x_2_+_n_…__+__x_n__,反映了一组数据的平均水平. (4)标准差: s=___1n_[__x_1-___x_2_+___x_2-___x__2+__…__+___x_n-___x_,2] 反映了样本数据的离散程度. (5)方差:s2=__1n_[_(_x1_-__x__)2_+__(_x2_-__x__)2_+__…__+__(_x_n-___x_)2_]____,反映了样本数据 的离散程度.
[解析] 根据题图可知组矩为10,则车速在 [40,50)、[50,60)的频率分别是0.25、0.35,因此车 速 低 于 限 速 的 汽 车 共 有 (0.25 + 0.35)×300 = 180(辆).
考点突破互动探究
考点1 频率分布直方图——师生共研
例 1 (2019·唐山模拟)供电部门对某社区1000位居民2017年12月份人 均用电情况进行统计后,按人均用电量分为[0,10),[10,20),(20,30),[30,40), [40,50]五组,整理得到如下的频率分布直方图,则下列说法错误的是( C )
A.12 月份人均用电量人数最多的一组有 400 人 B.12 月份人均用电量不低于 20 度的有 500 人 C.12 月份人均用电量为 25 度 D.在这 1000 位居民中任选 1 位协助收费,选到 的居民用电量在[30,40)一组的概率为110
[ 解析] 根据频率分布直方图知,12 月份人均用电量人数最多的一组是 [10,20),有 1000×0.04×10=400 人,A 正确:12 月份人均用电量不低于 20 度 的频率是(0.03+0.01+0.01)×10=0.5,有 1000×0.5=500 人,∴B 正确;
相关文档
最新文档