2021高考数学一轮复习统考第10章统计、统计案例第2讲用样本估计总体学案北师大版
高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文
ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开
2021届高考数学一轮必备 10.2《用样本估量整体》考情分析学案(1)
用样本估量整体考情分析统计的大体思想方式确实是用样本估量整体,而用样本估量整体是高考考查的重点,频率散布直方图,频率散布表,茎叶图在高考中都有考查,专门是频率散布直方图、方差(标准差)是高考的热点。
基础知识1. 作频率散布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差) (2)决定组距与组数; (3)将数据分组 (4)列频率散布表 (5)画频率散布直方图. 2. 频率散布折线图和整体密度曲线(1)频率散布折线图:连接频率散布直方图中各小长方形上端的中点,就取得频率散布折线图;(2)整体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会愈来愈接近于一条滑腻曲线,即整体密度曲线. 3. 众数、中位数、平均数(1)在一组数据中,显现次数最多的数据叫做这组数据的众数.(2)将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.(3)若是有n 个数12,,n x x x ,那么12nx x x n+++叫做这n 个数的平均数.(4)利用频率散布直方图估量样本的数字特点(1)中位数:在频率散布直方图中,中位数左侧和右边的直方图的面积相等,由此能够估量中位数的值.(2)平均数:平均数的估量值等于频率散布直方图中每一个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)众数:在频率散布直方图中,众数是最高的矩形的中点的横坐标. 4、茎叶图的优势用茎叶图表示数据有两个突出的优势:一是在统计图上没有原始信息的损失,所有的数据信息都能够从茎叶图中取得; 二是茎叶图能够在竞赛时随时记录,方便记录与表示. 五、标准差设样本的元素为1x ,2x ,…,n x ,样本的平均数为 ,(1)样本方差222212()()()n x x x x x x s n-+-++-=(2)标准差22212()()()n x x x x x x s n-+-++-=注意事项1.(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,因此,任何一个样本数据的改变都会引发平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据显现的频率,其大小只与这组数据中的部份数据有关.当一组数据中有很多数据多次重复显现时,其众数往往更能反映问题.④某些数据的变更对中位数可能没有阻碍.中位数可能出此刻所给数据中,也可能不在所给数据中.当一组数据中的个别数据变更较大时,可用中位数描述其集中趋势. (2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度那么越小,因为方差与原始数据的单位不同,且平方后可能夸大了误差的程度,因此尽管方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一样多采纳标准差.2.利用频率散布直方图估量样本的数字特点:(1)中位数:在频率散布直方图中,中位数左侧和右边的直方图的面积相等,由此能够估量中位数值.(2)平均数:平均数的估量值等于每一个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.题型一频率散布直方图的绘制与应用【例1】某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受处惩罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率散布直方图,那么从图中能够看出被惩罚的汽车大约有( ) A.30辆C.60辆D.80辆答案:B解析:由题图可知,车速大于或等于70 km/h的汽车的频率为×10=,那么将被惩罚的汽车大约有200×=40(辆).【训练1】有一个容量为200的样本,其频率散布直方图如下图.依照样本的频率散布直方图估量,样本数据落在区间[10,12)内的频数为( ).A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-+++×2=,因此数据落在此区间的频数为200×=36.答案B题型二茎叶图的应用【例2】对某商店一个月内天天的顾客人数进行了统计,取得样本的茎叶图(如下图),那么该样本中的中位数、众数、极不同离是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53答案:A解析:此题要紧考查茎叶图数据的读取和数据特点的简单计算,由所给的茎叶图可知所给出的数据共有30个,其中45显现3次为众数,处于中间位置的两数为45和47,那么中位数为46;极差为68-12=56.应选A.【变式2】在一项大西瓜品种的实验中,共收成甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如下图,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________;(2)__________________________________________.解析从那个茎叶图能够看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳固,整体情形比乙好.答案(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳固题型三用样本的数字特点估量整体的数字特点【例3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们别离射击了5次,成绩如下表(单位:环):甲108999乙1010799若是甲、乙两人中只有1人入选,那么入选的最正确人选应是________.答案:甲解析:x甲=x乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25, s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳固,故填甲.【变式3】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们别离射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799若是甲、乙两人中只有1人入选,那么入选的最正确人选应是________. 解析x 甲=x 乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳固,故填甲. 答案 甲 重难点冲破【例4】以下茎叶图记录了甲、乙两组各四名同窗的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)若是X =8,求乙组同窗植树棵数的平均数和方差;(2)若是X =9,别离从甲、乙两组中随机选取一名同窗,求这两名同窗的植树总棵数为19的概率. (注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)[解析] (1)当X =8时,由茎叶图可知,乙组同窗的植树棵数是:8,8,9,10,因此平均数为 x =8+8+9+104=354.方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542 =1116.(2)记甲组四名同窗为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同窗为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.别离从甲、乙两组中随机选取一名同窗,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),用C 表示:“选出的两名同窗的植树总棵数为19”这一事件,那么C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.巩固提高1.样本中共有五个个体,其值别离为a,0,1,2,3.假设该样本的平均值为1,那么样本方差为( )A. 65B. 65 C.2D. 2答案:D 解析:∵a +0+1+2+35=1,得a =-1,∴s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.应选D.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图,假设得分值的中位数为m e ,众数为m 0,平均值为x ,那么( )A. m e =m 0=xB. m e =m 0<xC. m e <m 0<xD. m 0<m e <x答案:D解析:由图可知,30名学生的得分情形依次为:2个人得3分,3个人得4分,10个人得5分,6个人得6分,3个人得7分,2个人得8分,2个人得9分,2个人得10分.中位数为第15,16个数(别离为5,6)的平均数,即m e=,5显现次数最多,故m0=5,x=2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10≈.于是得m300<m e <x .3.一组数据中的每一个数据都乘以2,再都减去80,得一组新数据,假设求得新数据的平均数是,方差是,那么原先数据的平均数和方不同离是 ( )A. ,B. ,C. ,D. ,答案:A解析:记原数据依次为x 1,x 2,x 3,…,x n ,那么新数据依次为2x 1-80,2x 2-80,2x 3-80,…,2x n -80,且2x 1+x 2+…+x n -80n n =,因此有x 1+x 2+…+x nn=错误!=,结合各选项知正确选项为A.4.在某次测量中取得的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.假设B 样本数据恰好是A 样本数据每一个都加2后所得数据,那么A ,B 两样本的以下数字特点对应相同的是( )A .众数B .平均数C .中位数D .标准差答案:D解析:此题考查众数、平均数、中位数及标准差的概念,考查推理论证能力,容易题. 当每一个样本数据加上2后,众数、平均数、中位数都会发生转变,不变的是数据的波动情形,即标准差不变.5.某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出假设干名学生,并将其成绩绘制成频率散布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80), [80,90),[90,100],已知样本中成绩小于70分的个数是36,那么样本中成绩在[60,90)内的学生人数为________.答案:90人解析:依照给定的频率直方图可得,小于70分的人数占有的频率为+×10=,因此样本整体为错误!=120人,那么成绩在[60, 90)内的学生人数为120×++=90.。
高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件文新人教A
[点石成金] 1.频率分布直方图的解题要点 解决频率分布直方图的问题,关键在于找出图中数据之间的 联系.这些数据中,直接的有组距、 频率 组距,间接的有频率、小长方形的面积,合理使用这些数据,
频率 再结合两个等量关系:小长方形面积=组距×组距=频率,小长 方形面积之和等于 1,即频率之和等于 1,就可以解决直方图的 有关问题.
(2)某公司为了了解用户对其产品的满意度,从 A,B 两地区 分别随机调查了 40 个用户,根据用户对产品的满意度评分,得 到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度 评分的频数分布表.
A 地区用户满意度评分的频率分布直方图
B 地区用户满意度评分的频数分布表 满意 度评 [50,6 [60,7 [70,8 [80,9 [90,1 分分 0) 0) 0) 0) 00] 组 频数 2 8 14 10 6
1 的概率约是__3________.
解析:由条件可知,落在[31.5,43.5)内的数据有 12+7+3= 22(个),故所求概率约为2626=13.
频率分布直方图:中位数与众数的区别;平均值
某次月考后,从所有考生中随机抽取 50 名考生的数学成绩
进行统计,得到频率分布直方图如图所示,则该次考试数学成绩 2
的中位数的估计值是____7_1_3____.
解析:由频率分布直方图,可知中位数位于 70 到 80 之间,
0.002+0.006+0.012+0.024=0.044,01.05-0.044=0.006,所以由
00..000366×10=53,得中位数的估计值为
2 713.
[典题 1] (1)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3,0.9]内,其频率分布直方图如图所示.
2021届高考数学一轮复习第10章统计与统计案例第2节用样本估计总体课时跟踪检测理含解析.doc
第十章 统计与统计案例第二节 用样本估计总体A 级·基础过关|固根基|1.(2019年全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差解析:选A 记9个原始评分分别为a ,b ,c ,d ,e ,f ,g ,h ,i (按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A .2.(2019届济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( )A .x -=4,s 2<2B .x -=4,s 2>2C .x ->4,s 2<2D .x ->4,s 2>2解析:选A 设原来的7个数分别为x 1,x 2,…,x 7,加入一个新数据4之后的平均数为7×4+48=4,则这8个数的方差s 2=(x 1-4)2+(x 2-4)2+…+(x 7-4)2+(4-4)28=7×2+(4-4)28<2,所以x -=4,s 2<2. 3.(2019届武汉调研)某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式有:A .结伴步行,B .自行乘车,C .家人接送,D .其他方式.将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,知本次抽查的学生中结伴步行(A)上学的人数是( )A .30B .40C .42D .48解析:选A 由条形统计图知,B :自行乘车上学的有42人,C :家人接送上学的有30人,D :其他方式上学的有18人,采用B ,C ,D 三种方式上学的共90人,设A :结伴步行上学的有x 人,由扇形统计图知,A :结伴步行上学与B :自行乘车上学的学生占60%,所以x +42x +90=60100,解得x =30,故选A . 4.如图是某位同学近5次数学测试成绩(单位:分)的茎叶图,其中有一次测试成绩记录不清楚,其末位数记为x ,若该同学这5次数学测试成绩的中位数是122分,则该同学这5次数学测试成绩的平均数不可能是( )A .123.4分B .123.6分C .123.8分D .124分解析:选D 因为该同学这5次数学测试成绩的中位数是122分,所以x 的所有可能取值为0,1,2.当x =0时,平均数为123.4分;当x =1时,平均数为123.6分;当x =2时,平均数为123.8分.故选D .5.为了了解现在互联网行业的就业情况,某高校教授组织学生对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图(如图1)和90后从事互联网行业者岗位分布图(如图2),则下列结论中不一定正确的是(注:80后是指在1980~1989年(包含1980年与1989年)出生,90后是指在1990~1999年(包含1990年与1999年)出生,80前是指在1979年及以前出生)( )A .互联网行业从业人员中80后的人数不超过一半B .互联网行业中90后从事技术岗位的人数超过所有年龄从业者总人数的20%C .互联网行业中90后从事市场岗位的人数少于所有年龄从业者总人数的10%D .互联网行业中从事职能岗位的人数90后比80后多解析:选D 对于A 选项,由饼状图可知80后人数占了41%,故A 正确;对于B 选项,90后从事技术岗位的人数所占比例为39.6%,由饼状图知90后人数占了56%,所以56%×39.6%=22.176%>20%,故B 正确;对于C 选项,90后从事市场岗位的人数所占比例为13.2%,由饼状图知90后人数占了56%,所以56%×13.2%=7.392%<10%,故C 正确;对于D 选项,因为80后从事职能岗位的人数所占比例不清楚,所以无法判断,故D 错误.故选D .6.(2020届成都摸底)如图是某赛季甲、乙两名篮球运动员9场比赛所得分数的茎叶图,则下列说法错误的是( )A .甲所得分数的极差为22B .乙所得分数的中位数为18C .两人所得分数的众数相等D .甲所得分数的平均数低于乙所得分数的平均数解析:选D 由茎叶图知,甲所得分数的极差为33-11=22,故A 正确;乙所得分数的中位数为18,故B 正确;甲、乙两人所得分数的众数都是22,故C 正确;甲所得分数的平均数为11+15+17+20+22+22+24+32+339=1969,乙所得分数的平均数为8+11+12+16+18+20+22+22+319=1609,故D 错误.故选D . 7.(2019年全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.解析:经停该站高铁列车所有车次的平均正点率的估计值为10×0.97+20×0.98+10×0.9910+20+10=0.98. 答案:0.988.(2019年江苏卷)已知一组数据6,7,8,8,9,10,则该组数据的方差是________.解析:数据6,7,8,8,9,10的平均数是6+7+8+8+9+106=8,所以方差是16×[(6-8)2+(7-8)2+2×(8-8)2+(9-8)2+(10-8)2]=53.答案:53 9.如图是某篮球运动员在5场比赛中得分的茎叶图,则这5场比赛得分的方差为________.解析:这5场比赛的平均得分为(19+21+23+25+27)÷5=23,所以得分的方差为15×[(19-23)2+(21-23)2+(23-23)2+(25-23)2+(27-23)2]=8.答案:810.某工厂为了解某车间生产的每件产品的净重(单位:克)情况,从中随机抽测了200件产品的净重,所得数据均在区间[96,106]内,将所得数据按[96,98),[98,100),[100,102),[102,104),[104,106]分成五组,其频率分布直方图如图所示,且五个小矩形的高构成一个等差数列,则在抽测的200件产品中,净重在区间[98,102)内的产品件数是________.解析:由题意可知,0.050,a ,b ,c ,d 构成等差数列,设公差为t .由小矩形的面积之和为1可得(0.050+a +b +c +d )×2=1,即0.050+a +b +c +d =0.5,所以5×0.050+5×42×t =0.5,解得t =0.025.所以b =0.050+0.025×2=0.100,d =0.050+0.025×4=0.150.所以净重在区间[98,102)内的频率为(b +d )×2=(0.100+0.150)×2=0.5,则净重在区间[98,102)内的产品件数为200×0.5=100.答案:10011.(2019届石家庄高三一模)小明在石家庄市某物流公司找到了一份派送员的工作,该公司给出了甲、乙两种日薪薪酬方案,其中甲方案:底薪100元,每派送一单奖励1元;乙方案:底薪140元,每日派送的前55单没有奖励,超过55单的部分每单奖励12元.(1)请分别求出甲、乙两种薪酬方案中日薪y (单位:元)与派送单数n 的函数关系式;(2)根据该公司100天所有派送员的派送记录,发现每名派送员的日平均派送单数与天数满足下表:日平均派送单数 52 54 56 58 60天数20 30 20 20 10①设一名派送员的日薪为x (单位:元),根据以上数据,试分别求出甲、乙两种方案中日薪x 的平均数及方差;②结合①中的数据,根据统计的知识,帮助小明分析,他选择哪种薪酬方案比较合适,并说明你的理由.(参数数据:0.62=0.36,1.42=1.96,2.62=6.76,3.42=11.56,3.62=12.96,4.62=21.16,15.62=243.36,20.42=416.16,44.42=1 971.36)解:(1)由题意知,甲方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =100+n ,n ∈N ;乙方案中派送员的日薪y (单位:元)与派送单数n 的函数关系式为y =⎩⎪⎨⎪⎧140(n ≤55,n ∈N ),12n -520(n >55,n ∈N ). (2)①由(1)及表格可知,甲方案中,日薪为152元的有20天,日薪为154元的有30天,日薪为156元的有20天,日薪为158元的有20天,日薪为160元的有10天,则x -甲=1100×(152×20+154×30+156×20+158×20+160×10)=155.4,s 2甲=1100×[20×(152-155.4)2+30×(154-155.4)2+20×(156-155.4)2+20×(158-155.4)2+10×(160-155.4)2]=6.44,乙方案中,日薪为140元的有50天,日薪为152元的有20天,日薪为176元的有20天,日薪为200元的有10天,则x -乙=1100×(140×50+152×20+176×20+200×10)=155.6, s 2乙=1100×[50×(140-155.6)2+20×(152-155.6)2+20×(176-155.6)2+10×(200-155.6)2]=404.64.②由①可知,x -甲<x -乙,但两者相差不大,且s 2甲远小于s 2乙,即甲方案中日薪的波动相对较小,所以小明选择甲方案比较合适.B 级·素养提升|练能力|12.(2020届广州四校联考)如图是2019年第一季度A ,B ,C ,D ,E 五省GDP 情况图,则下列叙述中不正确的是( )A.2019年第一季度GDP增速由高到低排位第5的是A省B.与2018年同期相比,各省2019年第一季度的GDP总量实现了增长C.2018年同期C省的GDP总量不超过4 000亿元D.2019年第一季度GDP总量和增速由高到低排位均居同一位的省只有1个解析:选D由折线图可知A、B正确;4 067.4÷(1+6.6%)≈3 816<4 000,故C正确;2019年第一季度GDP的总量和增速由高到低排位均居同一位的省有B省均第一,C省均第四,共有2个,故D错误.故选D.13.(2020届惠州调研)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20],(20,22.5],(22.5,25],(25,27.5],(27.5,30].根据频率分布直方图,在这320名学生中,每周的自习时间不超过22.5小时的人数是()A.68 B.72C.76 D.80解析:选B根据题图知,在这320名学生中,每周的自习时间不超过22.5小时的人数是(0.07+0.02)×2.5×320=72,故选B.14.第23届冬季奥林匹克运动会于2018年2月9日~25日在韩国平昌郡举行,简称“平昌冬奥会”.某媒体随机采访了某市20名关注“平昌冬奥会”的市民,其年龄数据绘制成如图所示的茎叶图,由于其中部分数据缺失,故打算根据频率分布直方图中的数据估计被采访的市民的平均年龄.(1)完成频率分布直方图;(2)根据(1)中的频率分布直方图估计被采访的市民的平均年龄x (同一组中的数据用该组区间的中点值作代表);(3)根据茎叶图计算出被采访的市民的平均年龄为y ,并假设a ∈{n ∈Z |0≤n ≤9},且a 取得每一个可能值的机会相等,在(2)的条件下.求P (y >x ).解:(1)由题意知,频率分布直方图如图所示:(2)由题意知,x =25×0.1+35×0.15+45×0.3+55×0.25+65×0.2=48,即估计被采访的市民的平均年龄为48岁.(3)y =20×2+30×3+40×6+50×5+60×4+98+a 20=958+a 20, 故P (y >x )=P ⎝⎛⎭⎫958+a 20>48=P (a >2)=0.7.。
高考数学一轮复习第十篇统计统计案例第2讲 用样本估计总体教案理试题
第2讲用样本估计总体创作人:历恰面日期:2020年1月1日【2021年高考会这样考】1.考察样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、HY差)的计算.主要以选择题、填空题为主.2.考察以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).【复习指导】1.由于高考对统计考察的覆盖面广,几乎对所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握.复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的根底知识,适度的题量练习.2.高考对频率分布直方图或者茎叶图与概率相结合的题目考察日益频繁.因此,复习时要加强这方面的训练,弄清图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好根底.根底梳理1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组. ④列频率分布表. ⑤画频率分布直方图.(3)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 3.茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到; 二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. 4.样本方差与HY 差设样本的元素为x 1,x 2,…,x n ,样本的平均数为x , (1)样本方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)样本HY 差:s =1n[x 1-x2+x 2-x2+…+x n -x2].两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描绘一组数据集中趋势的量,平均数是最重要的量. ②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考察各数据出现的频率,其大小只与这组数据中的局部数据有关.当一组数据中有不少数据屡次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出如今所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描绘其集中趋势.(2)HY差与方差的异同HY差、方差描绘了一组数据围绕平均数波动的大小.HY差、方差越大,数据的离散程度就越大;HY差、方差越小,数据的离散程度那么越小,因为方差与原始数据的单位不同,且平方后可能夸张了偏向的程度,所以虽然方差与HY差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用HY差.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.双基自测1.(人教A版教材习题改编)某工厂消费滚珠,从某批产品中随机抽取8粒,量得直径分别为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,那么估计该厂消费的滚珠直径的平均数为( ).A.14.8 mm B.14.9 mmC.15.0 mm D.15.1 mm解析平均数x=18(14.7+14.6+15.1+15.0+14.8+15.1+15.0+14.9)=14.9 (mm).答案 B2.(2021·月考)一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70] 频数1213241516137那么样本数据落在(10,40]上的频率为( ).解析由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52.答案 C3.(人教A版教材习题改编)10名工人某天消费同一零件,消费的件数分别是15,17,14,10,15,19,17,16,14,12,那么这一天10名工人消费的零件的中位数是( ).A.14 B.16 C.15 D.1715+15=15.2答案 C4.某雷达测速区规定:凡车速大于或者等于70 km/h的汽车视为“超速〞,并将受到处分,如图是某路段的一个检测点对200辆汽车的车速进展检测所得结果的频率分布直方图,那么从图中可以看出被处分的汽车大约有( ).A.30辆 B.40辆 C.60辆 D.80辆解析由题图可知,车速大于或者等于70 km/h的汽车的频率为0.02×10=0.2,那么将被处分的汽车大约有200×0.2=40(辆).答案 B5.(2021·)某教师从星期一到星期五收到的信件数分别为10,6,8,5,6,那么该组数据的方差s2=________.解析 平均数x =10+6+8+5+65=7.∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=15×(9+1+1+4+1)=3.2.答案 3.2考向一 频率分布直方图的绘制与应用 【例1】►某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如下图的频率分布直方图,观察图形的信息,答复以下问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.[审题视点] 利用各小长方形的面积和等于1求[70,80)内的频率. 解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如下图.(2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.【训练1】(2021·)有一个容量为200的样本,其频率分布直方图如下图.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( ).A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-(0.19+0.15+0.05+0.02)×2=0.18,所以数据落在此区间的频数为200×0.18=36.答案 B考向二茎叶图的应用【例2】►如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,那么一定有( ).A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关[审题视点] 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.应选B.答案 B由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进展相关的计算或者者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者者是方差的计算等.【训练2】在一项大西瓜品种的实验中,一共收获甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如下图,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________; (2)__________________________________________.解析 从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除了一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好.答案 (1)甲种大西瓜的平均重量大于乙种大西瓜 (2)甲种大西瓜的产量比乙种大西瓜稳定考向三 用样本的数字特征估计总体的数字特征【例3】►甲乙二人参加某体育工程训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价. [审题视点] (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价. 解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s 2甲>s 2乙可知乙的成绩较稳定.从折线图看,甲的成绩根本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断进步,而乙的成绩那么无明显进步.平均数与方差都是重要的数字特征,是对总体的一种简明的描绘,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描绘其集中趋势,方差和HY 差描绘其波动大小.【训练3】 甲、乙两名射击运发动参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9 乙1010799假如甲、乙两人中只有1人入选,那么入选的最正确人选应是________.解析 x 甲=x 乙=9环,s 2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定,故填甲.答案 甲标准解答19——怎样解答茎叶图与概率的综合性问题【问题研究】 茎叶图是一个将数据分成主、次两局部,把主要局部当做茎、次要局部当作叶表达数据的一个图,它是一种常用的统计图.因此考题常将茎叶图作为载体来考察平均数、方差以及概率问题.【解决方案】 首先对茎叶图中的数据全面分析,然后再根据茎叶图的数据解决其它问题. 【例如】►(此题满分是12分)(2021·)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)假如X =8,求乙组同学植树棵数的平均数和方差;(2)假如X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)第(1)问直接套入公式求值;第(2)问利用古典概型的知识解决.[解答示范] (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为x =8+8+9+104=354.(2分) 方差为s 2=14⎣⎢⎡⎦⎥⎤⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫8-3542+⎝⎛⎭⎪⎫9-3542+⎝⎛⎭⎪⎫10-3542 =1116.(5分) (2)记甲组四名同学为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),(9分)用C 表示:“选出的两名同学的植树总棵数为19〞这一事件,那么C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.(12分)茎叶图一般记录两组的数据,它最直观、最明晰,但利用茎叶图解决概率问题时创作人:历恰面日期:2020年1月1日对重复出现的数据要重复记录,不能遗漏.创作人:历恰面日期:2020年1月1日。
高三数学一轮复习第十篇统计与统计案例第2节用样本估计总体理
反映了各个样本数据聚集
标准差是样本数据到平均数的一种平均 于样本平均数周围的程
标 距离,即 s= 准
度.标准差越小,表明各个 样本数据在样本平均数周
差
1 n
[( x1
x)2
( x2
x)2
...
( xn
x)2 ]
围越集中;标准差越大,表 明各个样本数据在样本平
均数的两边越分散
标准差的平方,即 方 差 s2= 1 [(x1- x )2+(x2- x )2+…+(xn- x )2]
优缺点
用茎叶图表示数据的优点是(1)所有的信息都可以从茎叶图 中得到;(2)便于记录和读取,能够展示数据的分布情况.缺 点是当样本数据较多或数据位数较多时,茎叶图就显得不太 方便
4.样本的数字特征
数字 特征 众数
中位数
定义
在一组数据中出现 次数最多的数据 将一组数据按大小 顺序依次排列,处在 最中间位置的一个 数据(或最中间两个 数据的平均数)
第2节 用样本估计总体
最新考纲 1.了解分布的意义和作用,能根据列 频率分布表,会画频率分布直方图、 频率折线图、茎叶图,体会它们各自 的特点. 2.理解样本数据标准差的意义和作 用,会计算数据标准差. 3.能从样本数据中提取基本的数字 特征(如平均数、标准差),并做出合
理的解释. 4.会用样本的频率分布估计总体分 布,会用样本的基本数字特征估计总 体的基本数字特征,理解用样本估计 总体的思想. 5.会用随机抽样的基本方法和样本 估计总体的思想解决一些简单的实 际问题.
夯基自测
1.在样本频率分布直方图中,共有 11 个小长方形,若中间一个小长方形的面 积等于其他 10 个小长方形面积和的 1 ,且样本容量为 160,则中间一组的频
2021版新高考数学一轮复习课件:第10章 统计、统计案例(共3个课时)
可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合
适的抽样方法是____________.
分层抽样
• [解析] 因为不同年龄段客户对其服务的评价有较大差异,所以根据三 种抽样方法的特点可知最合适的抽样方法是分层抽样.
• 5.(2019·课标全国Ⅰ)某学校为了解1 000名新生的身体素质,将这些
• 知识点四 分层抽样
• 一般地,在抽样时将总体分成互不交叉的层,然后按一照定的比例 ______________,从各层独立地抽取一定数量的个体,将各层取出的 个体合在一起作为样本,这种抽样方法叫做分层抽样.
• 分层抽样的应用范围:当总体是由______________________组成时,
往往选用分层抽样的方法.
第十章 统计、统计案例
第一讲 随机抽样
1 知识梳理 • 双基自测 2 考点突破 • 互动探究 3 名师讲坛 • 素养提升
知识梳理 • 双基自测
• 知识点一 总体、个体、样本、样本容量的概念
• 统计中所考察对象的全体构成的集合看做总体,构成总体的每个元素 作样为本个 中体 个, 体从 的总___体__中_一_抽_部叫取分做的个样_体_本___容_量___._____所组成的集合叫做样本,
()
• A.33,34,33 B.25,56,19
B
• C.30,40,30 D.30,50,20
• [解析] 因为125 280 95=25 56 19,所以抽取人数分别为 25,56,19.
• 3取.一(P个59容T2)量某为班4共的有样5本2人,,已现知根3号据,学2生9号的,学4号2号,学用生系在统样抽本样中的,方那法么,样抽
本中还有一个学生的学号是
()
高中数学 高三一轮 第十章统计、统计案例及算法初步 10.2用样本估计总体【教案】
1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等.2.数据的数字特征(1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x=错误!(x1+x2+…+x n).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(2)样本方差、标准差标准差s=错误!,其中x n是样本数据的第n项,n是样本容量,错误!是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1。
(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较.【思考辨析】判断下面结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √)(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( ×)(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √)(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( ×)(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)1.(2015·陕西)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93 B.123C.137 D.167答案C解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137。
2021高考一轮总复习课件(北师大版):第十章 统计、统计案例-2.ppt
走向高考 ·高考一轮总复习 ·北师大版 ·数学
课前自主导学
第十章 第二节
走向高考 ·高考一轮总复习 ·北师大版 ·数学
知识梳理 1.茎叶图的优点 当样本数据较少时,茎叶图表示数据的效果较好,一是 统计图上没有________的损失,二是方便______与______, 但茎叶图只便于表示两位有效数字的数据.
第十章 第二节
走向高考 ·高考一轮总复习 ·北师大版 ·数学
[答案] 1.原始数据 记录 表示
2.较多
中间
x1+x2+…+xn n
3.平均距离ຫໍສະໝຸດ 1n[x1- x 2+x2- x 2+…+xn- x 2]
1n[(x1- x )2+(x2- x )2+…+(xn- x )2] 4.频率与组距的比值 小长方形的面积 等于 1
第十章 第二节
走向高考 ·高考一轮总复习 ·北师大版 ·数学
3.如图是某校举行的运动会上,七位评委为某体操项目 打出的分数的茎叶统计图,去掉一个最高分和一个最低分后, 所剩数据的平均数和方差分别为( )
第十章 第二节
走向高考 ·高考一轮总复习 ·北师大版 ·数学
2.众数、中位数、平均数 (1)在一组数据中,出现次数______的数据叫作这组数据 的众数. (2)将一组数据按大小依次排列,把处在______位置的一 个数据(或中间两个数据的平均数)叫作这组数据的中位数. (3)如果有 n 个数 x1,x2,…,xn,那么 x =________叫作 这 n 个数的平均数.
高考目标导航
3 课堂典例讲练
课前自主导学
4 课后强化作业
第十章 第二节
走向高考 ·高考一轮总复习 ·北师大版 ·数学
高考目标导航
(山东专用)2021版高考数学一轮复习第十章统计、统计案例第二讲用样本估计总体学案(含解析)
第二讲 用样本估计总体ZHI SHI SHU LI SHUANG JI ZI CE知识梳理·双基自测知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①__求极差__;②__决定组距与组数__;③__将数据分组__;④__列频率分布表__;⑤__画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中__各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指__中间__的一列数,叶是从茎的__旁边__生长出来的数.(2)茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =__x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差:s =__1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=__1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的,均为12.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.(多选题)下列结论中正确的是( ABD )A .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势B .从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了C .茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次D .在频率分布直方图中,最高的小长方形底边中点的横坐标是众数 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有__25__人.[解析] 100×(0.5×0.5)=25(人). 题组三 考题再现4.(2020·安徽六校教育研究会素质测试)甲、乙两名同学在6次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这6次考试的平均成绩分别用x 甲,x 乙,表示,则下列结论正确的是( C )A .x 甲>x 乙,且甲成绩比乙成绩稳定B .x 甲>x 乙,且乙成绩比甲成绩稳定C .x 甲<x 乙,且甲成绩比乙成绩稳定D .x 甲<x 乙,且乙成绩比甲成绩稳定[解析] x 甲=80+-5-3+2+3+5+106=82,x 乙=80+-8-4+1+6+11+126=83,所以x 甲<x 乙,因为甲数据比较集中,所以成绩比较稳定.5.(2019·湖南师大附中模拟)学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n 的值为( A )A.100 B.1 000 C.90 D.900[解析] 支出在[50,60)元的频率为1-(0.1+0.24+0.36)=0.3.∴样本容量n=300.3=100.KAO DIAN TU PO HU DONG TAN JIU考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2019·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165)0.100笫2组[165,170)①第3组[170,175)20②第4组[175,180)200.200第5组[180,185)100.100合计100 1.00(ⅰ)(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2020·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析] (1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40,从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200.频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P (A )=C 12C 13+C 22C 25=710. (或P (A )=1-P (A -)=1-C 23C 25=710)(2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601; (ⅱ)由频率分布直方图,可得损失超过4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P (X =0)=C 212C 215=2235,P (X =1)=C 112C 13C 215=1235,P (X =2)=C 23C 215=135.所以X 的分布列为:数学期望为E (X )=0×2235+1×35+2×35=5.名师点拨 ☞应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(2020·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为__220__.[解析] 根据频率分布直方图知:(2a+0.04+0.03+0.02)×10=1⇒a=0.005;计算出数学成绩不低于100分的频率为:(0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.考点二茎叶图——师生共研例 2 (多选题)(2020·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A.x a<x bB.a的方差大于b的方差C.b品种的众数为3.31D.a品种的中位数为3.27[解析] 由茎叶图得:b品种所含β-胡萝卜素普遍高于a品种,∴x a<x b,故A正确;a品种的数据波动比b品种的数据波动大,∴a的方差大于b的方差,故B正确;b品种的众数为3.31与3.41,故C错误;a品种的数据的中位数为:3.23+3.312=3.27,故D正确.名师点拨☞茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x与y的值分别为( A )A.3,5 B.5,5C.3,7 D.5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.考点三样本数字特征——多维探究角度1 样本数字特征与频率分布直方图例3 如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A.12.5,12.5 B.12.5,13C.13,12.5 D.13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x,则(x-10)×0.1=0.5-0.2,解得x=13.角度2 样本数字特征与茎叶图例4 将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为__367__. [解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算例5 (2019·山东济南模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( A )A .x =4,s 2<2 B .x =4,s 2>2 C .x >4,s 2<2D .x >4,s 2>2[解析] ∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x =28+48=4,又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+4-428=74<2,故选A . 名师点拨 ☞平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)(2019·固原模拟)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为__155__,平均数为__156.8__.(2)(角度2)(2020·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)(2019·湖南衡阳模拟)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s ′2,则x -′,s ′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例6 (多选题)(2019·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨 ☞折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .MING SHI JIANG TAN SU YANG TI SHENG名师讲坛·素养提升高考中统计图表、频率分布直方图的应用例7 (1)(2018·全国Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( A )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半(2)(2019·湖南省衡阳市联考)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125) 频数62638228②估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);③根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?[解析] (1)设新农村建设前,农村的经济收入为a ,则新农村建设后,农村的经济收入为2a .新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后 新农村建设后变化情况结论 种植收入 60%a 37%×2a =74%a 增加 A 错 其他收入 4%a 5%×2a =10%a 增加了一倍以上 B 对 养殖收入 30%a 30%×2a =60%a 增加了一倍 C 对 养殖收入+第三产业收入 (30%+6%)a=36%a (30%+28%)×2a =116%a超过经济收入2a 的一半D 对(2)①②质量指标值的样本平均数为 x -=80×6+90×26+100×38+110×22+120×8100=100,质量指标值的样本方差为s 2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104所以,这种产品质量指标的平均数估计值为100,方差的估计值为104. ③依题意38+22+8100=68%<80%,所以该企业生产的这种产品不符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.名师点拨 ☞(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析] (1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.[答案] (1)a=0.35,b=0.10 (2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.。
2021届高考数学一轮复习第十章统计与统计案例第二节用样本估计总体学案理含解析.doc
第二节用样本估计总体[最新考纲][考情分析][核心素养] 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(平均数、标准差),并给出合理解释.4.会用样本的频率分布估计总体的分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.频率分布直方图、茎叶图及其应用,将是2021年高考考查的热点,题型将是选择题或填空题,分值为5分,也可能与概率结合一起在解答题中出现.1.数据分析2.数学运算‖知识梳理‖1.作频率分布直方图的步骤(1)求极差(1最大值与2最小值的差);(2)3组距与4组数;(3)5分组;(4)6频率分布表;(5)7频率分布直方图.2.频率分布折线图和总体密度曲线(1)8中点,就得到频率分布折线图.(2)9所分的组数增加,10组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,示都能带来方便.4.样本的数字特征 (1)众数、中位数、平均数①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]. ②方差:标准差的平方s 2,s 2=1n [(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x i (i =1,2,3,…,n )是样本数据,n 是样本容量,x -是样本平均数.►常用结论平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.‖基础自测‖一、疑误辨析1.判断下列结论是否正确(请在括号中打“√”或“×”). (1)在频率分布直方图中,小矩形的高表示频率.( ) (2)频率分布直方图中各个长方形的面积之和为1.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( ) (4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (5)一组数据的方差越大,说明这组数据的波动越大.( ) 答案:(1)× (2)√ (3)× (4)√ (5)√ 二、走进教材2.(必修3P 100A 2(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A .4B .8C .12D .16答案:B3.(必修3P 70示例改编)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案:A 三、易错自纠4.10名工人某天生产同一零件,生产的零件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a 解析:选D 依题意,这些数据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a =14.7,b =15,c =17,所以c >b >a .5.(2019届郑州质检)已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中m ,n 的比值mn=________.解析:由茎叶图可知,甲的数据为27,30+m ,39,乙的数据为20+n ,32,34,38.由此可知,乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数为33,所以乙的平均数也是33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:386.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到如图所示的频率分布直方图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:48考点 统计图表的应用问题|题组突破|1.(2019届东北三省四市一模)“科技引领,布局未来”,科技研发是企业发展的驱动力量.2007年至2018年,某企业连续12年累计研发投入达4 100亿元.我们将研发投入与经营收入的比值记为研发投入占营收比.这12年间的研发投入(单位:十亿元)用如图所示的条形图表示,研发投入占营收比用图中的折线图表示,根据折线图和条形图,下列结论错误的是( )A.2012年至2013年研发投入占营收比增量相比2017年至2018年增量大B.2013年至2014年研发投入增量相比2015年至2016年增量小C.该企业连续12年研发投入逐年增加D.该企业连续12年来研发投入占营收比逐年增加解析:选D对于A,2012年至2013年研发投入占营收比增量为13.5%-11.5%=2%,2017年至2018年研发投入占营收比增量为14.9%-14.6%=0.3%,A正确;对于B,2013年至2014年研发投入增量为32-30=2(十亿元),2015年至2016年研发投入增量为60-41=19(十亿元),B正确;对于C,由题图易知该企业连续12年研发投入逐年增加,C正确;对于D,由题图知2008年至2009年研发投入占营收比是减少的,D错误.故选D.2.(2019届广西桂林市、百色市、崇左市联考)在如图所示的一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为()A.1 B.2C.3 D.4解析:选B由题图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,所以被污染的数字为2.3.(2020届四川五校联考)如图为截止到2019年3月末,我国外汇储备近1年的变化折线图,由此得到以下说法,其中叙述正确的是()A.近1年来,我国外汇储备月增长量最大的月份是2019年3月B.2018年4月至10月,我国外汇储备连续下降C.2018年底,我国外汇储备降至近年来最低D.截止到2019年3月末,我国外汇储备连续五个月上升解析:选D选项A,由图知,我国外汇储备月增长量最大的月份是2019年1月,A错误;选项B,2018年4月至10月,我国外汇储备有升有降,B错误;选项C,由图无法说明2018年底,我国外汇储备降至近年来最低,C错误;选项D,我国外汇储备自2018年11月起连续上升,2019年3月为第五个月,D正确.故选D.►名师点津统计图的分析策略:(1)注意统计图中的点、线的变化规律;(2)抓住特殊的数据,明确它们所表示的意义,特别是最大数据与最小数据;(3)涉及两个或两个以上的统计图时,它们之间往往存在某种关系;(4)如果涉及数轴,一定要明确数轴表示的意义.考点一频率分布直方图应用【例1】(2019年全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、物质的量浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5%”,根据直方图得到P (C )的估计值为0.70.(1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解] (1)由已知得0.70=a +0.20+0.15,故a =0.35. b =1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05. 乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00. ►名师点津1.由频率分布直方图进行相关计算时,需掌握的2个关系式 (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. 2.利用频率分布直方图估计样本的数字特征的方法(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.|跟踪训练|1.某网络营销部门随机抽查了某市200名网友在2018年11月11日的网购金额,所得数据如下表:网购金额(单位:千元)人数 频率 (0,1] 16 0.08 (1,2] 24 0.12 (2,3] x p (3,4] y q (4,5] 16 0.08 (5,6] 14 0.07 总计2001.00已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中抽取5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?解:(1)根据题意有⎩⎪⎨⎪⎧16+24+x +y +16+14=200,16+24+x y +16+14=32,即⎩⎪⎨⎪⎧x +y =130,40+x 30+y =32,解得⎩⎪⎨⎪⎧x =80,y =50, ∴p =80200=0.40,q =50200=0.25.补全频率分布直方图如图所示:(2)根据题意,抽取网购金额在(1,2]内的人数为 2424+16×5=3,抽取网购金额在(4,5]内的人数为1624+16×5=2.故此2人来自不同群体的概率P =C 13C 12C 25=35.考点二 样本的数字特征【例2】 (2019年全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值代表).(精确到0.01)附:74≈8.602.[解] (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为14+7100=0.21.产值负增长的企业频率为2100=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)y -=1100×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s 2=1100 i =15n i (y i -y -)2 =1100×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6, 则s =0.029 6=0.02×74≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17. ►名师点津(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.|跟踪训练|2.(2019届江西八校联考)规定一个学生数学成绩优秀的标志为连续5次数学考试成绩(满分150分)均不低于120分.现有甲、乙、丙三位学生连续5次数学考试成绩的记录数据(记录数据都是正整数)情况:①甲学生:5个数据的中位数为127,众数为120;②乙学生:5个数据的中位数为125,总体均值为127;③丙学生:5个数据中有一个数据是135,总体均值为128,总体方差为19.8.则可以断定数学成绩优秀的学生为()A.甲、丙B.乙、丙C.甲、乙D.甲、乙、丙解析:选A因为甲学生的5个数据的中位数为127,所以5个数据中有2个数据大于127,又5个数据的众数是120,所以有2个数据为120,所以甲学生的5个数据均不小于120,所以甲学生数学成绩优秀.丙学生的5个数据中的一个数据为135,设另外4个数据分别是a,b,c,d,因为5个数据的总体均值为128,总体方差为19.8,所以(a-128)2+(b-128)2+(c-128)2+(d-128)2+(135-128)2=19.8,所以(a-5128)2+(b-128)2+(c-128)2+(d-128)2=50①,假设a,b,c,d中存在小于120的数据,不妨设a<120,则(a-128)2>64,显然①式不成立,所以假设错误,即a,b,c,d均不小于120,所以丙学生的5个数据均不小于120,所以丙学生数学成绩优秀.根据乙学生的记录数据不能得出连续5次数学考试成绩均不低于120分,即不能断定乙学生数学成绩优秀.故选A.考点频率分布直方图与概率的交汇应用问题【例】(2019届长春模拟)某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:数学成[0,30)[30,60)[60,90)[90,120)[120,150]绩分组人数6090300x 160的方法抽取100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分.(同一组中的数据用该组区间的中点值作代表)[解] (1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =1001000=110. (2)由题意得x =1 000-(60+90+300+160)=390,故估计该中学达到优秀线的人数为160+390×120-110120-90=290. (3)由(1)及题表可得频率分布直方图如图所示.该学校本次考试数学平均分x -=11 000×(60×15+90×45+300×75+390×105+160×135)=90(分).所以估计该学校本次考试的数学平均分为90分.►名师点津以随机抽样获取样本为基础,首先画频率分布表、频率分布直方图,然后应用这些图表计算频率、频数和数字特征.|跟踪训练|(2019·长沙、南昌第一次联考)“2018弘扬中华优秀传统文化经验交流大会”于2018年11月26日在深圳举行,会议同期举行了“深圳市中华优秀传统文化公益讲堂”启动仪式.从2019年1月起到12月,深圳市文化和健康发展促进会将连续举办52场中华优秀传统文化公益讲堂,邀请多位名家名师现场开讲.某学校的文学社团为响应这次活动,举行了国学文化大赛,统计的比赛成绩(单位:分)的数据如频率分布直方图所示,已知成绩在[80,90)内的有50人.(1)求a 的值及参加比赛的总人数;(2)若成绩在80分及以上的学生将获得荣誉证书,则能否认为参加比赛的学生超过40%获得荣誉证书?(3)如果从成绩在[80,90)和[90,100]内的学生中按分层抽样的方法选取5人参加决赛,并最终选取其中的2人参加与友好学校的友谊赛,求最终选取的2人成绩在[80,90)和[90,100]内各1人的概率.解:(1)由题意得(0.01+a+0.02+0.03)×10=1,解得a=0.04.因为成绩在[80,90)内的有50人且成绩在[80,90)内的频率为0.02×10=0.2,故参加比赛的总人数为500.2=250.(2)因为成绩在80分及以上的频率为(0.02+0.03)×10=0.5>40%,故能认为参加比赛的学生超过40%获得荣誉证书.(3)由频率分布直方图知,成绩在[80,90)和[90,100]内的学生的人数比为2∶3,故选取的5人成绩在[80,90)和[90,100]内的学生人数分别是2和3.设成绩在[80,90)内的2名学生分别为A1,A2,成绩在[90,100]内的3名学生分别为B1,B2,B3,则最终选取的2人的所有情况为A1A2,A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,B1B2,B1B3,B2B3,共10种,而满足成绩在[80,90)和[90,100]内各1人的情况有A1B1,A1B2,A1B3,A2B1,A2B2,A2B3,共6种,故所求概率P=610=3 5.。
2021版新高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件新人教B版
2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息. 在使 用茎叶图时,一定要注意看清楚所有的样本数据,弄清楚这个图中的数字特点, 不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.
考点二 频率分布直方图 【典例】(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女 学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分 数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图频率分布直 方图:
3.茎叶图 (1)统计中一种被用来表示数据的图叫做茎叶图,茎是指_中__间__的一列数,叶是从 _茎__的旁边生长出来的数. (2)茎叶图的优点是不但可以保留_所__有__信__息__,而且可以_随__时__记__录__,这对数据的记 录和表示都能带来方便.
(3)茎叶图的画法: 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按_大__小__次序排成一列,写在左(右)侧; 第三步:将各个数据的叶依次写在其茎的右(左)侧.
A.x1,x2,…,xn的平均数
B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值
D.x1,x2,…,xn的中位数
【解析】选B.评估这种农作物亩产量稳定程度的指标是标准差.
3.(必修3P63练习AT1改编)如图所示是一样本的频率分布直方图.若样本容量为 100,则样本数据在[15,20]内的频数是________.
4.样本的数字特征
(1)众数、中位数、平均数
数字特征
概念
优点与缺点
众数
一组数据中重复出现次数 _最__多__的数
众数通常用于描述变量的值出现次数 最多的数.但显然它对其他数据信息的 忽视使它无法客观地反映总体特征
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第2讲 用样本估计总体基础知识整合1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤①求极差(即一组数据中01最大值与02最小值的差). ②决定03组距与04组数. ③将数据05分组. ④列06频率分布表. ⑤画07频率分布直方图. (2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的08中点,就得到频率分布折线图.②总体密度曲线:随着09样本容量的增加,作图时10所分的组数增加,11组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图茎是指12中间的一列数,叶是从茎的13旁边生长出来的数. 2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x -=14x 1+x 2+…+x n n,反映了一组数据的平均水平.(4)标准差:是样本数据到平均数的一种平均距离,s = 151n[x 1-x-2+x 2-x-2+…+x n -x-2].(5)方差:s 2=161n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数).1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.标准差与方差的特点反映了各个样本数据聚集于样本平均数周围的程度.标准差(方差)越小,表明各个样本数据在样本平均数周围越集中;标准差(方差)越大,表明各个样本数据在样本平均数的两边越分散.3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,则: ①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数答案 B解析 因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.2.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:用电量/度 120 140 160 180 200 户数23582A .180,170B .160,180C .160,170D .180,160答案 A解析 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.3.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的25,且样本容量为140,则中间一组的频数为( )A .28B .40C .56D .60答案 B解析 设中间一个小长方形的面积为x ,其他8个长方形的面积为52x ,因此x +52x =1,所以x =27.所以中间一组的频数为140×27=40.故选B.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A .中位数B .平均数C .方差D .极差 答案 A解析 中位数是将9个数据从小到大或从大到小排列后,处于中间位置的数据,因而去掉1个最高分和1个最低分,不变的是中位数,平均数、方差、极差均受影响.故选A.5.(2019·江苏高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是________. 答案 53解析 这组数据的平均数为8,故方差为s 2=16×[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=53.6.(2019·全国卷Ⅱ)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案 0.98解析 因为平均正点率 x -=10×0.97+20×0.98+10×0.9910+20+10=0.98,所以经停该站高铁列车所有车次的平均正点率的估计值为0.98.核心考向突破考向一频率分布直方图及应用例1 (1)(2019·秦皇岛模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则11时至12时的销售额为( )A.8万元B.10万元C.12万元D.15万元答案 C解析由频率分布直方图,知9时至10时的销售额的频率为0.1,故销售总额为30.1=30万元.又11时至12时的销售额的频率为0.4,故销售额为0.4×30=12万元.故选C.(2)某高校随机抽取20个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],所作的频率分布直方图是( )答案 A解析 以5为组距将数据分组为[0,5),[5,10),…,[30,35),[35,40],各组的频数依次为1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项A.1.频率、频数、样本容量的计算方法 (1)频率组距×组距=频率. (2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数. 2.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是不是1来检验该表是否正确. (2)频率分布直方图的纵坐标是频率组距,而不是频率.(3)频率分布直方图中各小矩形的高的比就是相应各组的频率之比.[即时训练] 1.(2019·贵州黔东南州联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图,其中年龄在[30,40)岁的有2500人,年龄在[20,30)岁的有1200人,则m 的值为( )A .0.013B .0.13C .0.012D .0.12答案 C解析 由题意,得年龄在[30,40)岁的频率为0.025×10=0.25,则赞成高校招生改革的市民有25000.25=10000人,又因为年龄在[20,30)岁的有1200人,则m =12001000010=0.012.故选C.2.为了解某校高三学生联考的数学成绩情况,从该校参加联考学生的数学成绩中抽取一个样本,并分成五组,绘成如图所示的频率分布直方图,已知第一组至第五组的频率之比为1∶2∶8∶6∶3,第五组的频数为6,则样本容量为________.答案 40解析 因为第一组至第五组的频率之比为1∶2∶8∶6∶3,所以可设第一组至第五组的频率分别为k,2k,8k,6k,3k ,又频率之和为1,所以k +2k +8k +6k +3k =1,解得k =120=0.05,所以第五组的频率为3×0.05=0.15,又第五组的频数为6,所以样本容量为60.15=40.考向二茎叶图的应用例2 (1)(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )A.3,5 B.5,5C.3,7 D.5,7答案 A解析甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x=3.故选A.(2)(2019·郑州质量预测)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是( )A.甲B.乙C.甲、乙相等D.无法确定答案 A解析从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地浓度的方差较小.茎叶图的绘制及应用(1)制作茎叶图的一般方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大顺序由上到下列出.(2)估计数字特征,给定两组数据的茎叶图,“重心”下移者平均数较大,数据集中者方差较小.[即时训练] 3.(2020·唐山五校联考)某校开展摄影比赛,9位评委为参赛作品A给出的分数如图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( )A.1 B.2C.3 D.4答案 A解析当x≥4时,89+89+92+93+92+91+947=6407≠91.当x<4时,89+89+92+93+90+x+92+917=91,所以x=1,故选A.精准设计考向,多角度探究突破考向三数字特征的应用角度1样本的数字特征与直方图例3 (2019·益阳模拟)为了了解某校九年级1600名学生的体能情况,随机抽查了部分学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为26.25B.该校九年级学生1分钟仰卧起坐的次数的众数为27.5C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32答案 D解析由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故D错误.角度2样本的数字特征与茎叶图例4为比较甲、乙两地某月14时的气温状况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③ D .②④答案 B解析 由茎叶图,得x -甲=26+28+29+31+315=29,∴x -甲<x -乙,s 甲>s 乙,故选B.众数、中位数、平均数、方差的意义及常用结论(1)平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x -2],或写成s 2=1n(x 21+x 22+…+x 2n )-x -2,即方差等于原始数据平方的平均数减去平均数的平方.[即时训练] 4.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的平均长度为________mm.答案 22.75解析 根据频率分布直方图,估计这批产品的平均长度为(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)×5=22.75 mm.5.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:甲 27 38 30 37 35 31 乙332938342836(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、方差、极差,并判断选谁参加比赛比较合适?解 (1)画茎叶图如下(中间数为数据的十位数).(2)x -甲=27+38+30+37+35+316=33.x -乙=33+29+38+34+28+366=33.s 2甲=16×[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67.s 2乙=16×[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67.甲的极差为11,乙的极差为10.综合比较以上数据可知,甲、乙平均数相同,但乙的极差、方差相对更小,成绩更稳定,故选乙参加比赛较合适.(2019·湖北黄冈模拟)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________. 答案 (1)0.0044 (2)70解析 (1)由频率分布直方图,得用电量落在区间[200,250)内的频率为1-(0.0024+0.0036+0.0060+0.0024+0.0012)×50=0.22,于是x =0.2250=0.0044.(2)∵用电量落在区间[100,250)内的频率为(0.0036+0.0060+0.0044)×50=0.7,∴所求户数为100×0.7=70.答题启示正确理解频率分布直方图(1)纵轴表示频率组距,即小长方形的高=频率组距;(2)小长方形的面积=组距×频率组距=频率; (3)数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1. 解本题时,易把频率0.22误认为是x 的值而出错,x 的值应由频率0.22除以组距50求得.对点训练某电子商务公司对10000名网络购物者上一年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3 (2)6000解析(1)由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.(2)消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.。