2021年新高考数学总复习第68讲:用样本估计总体
用样本的数字特征估计总体-高考数学复习
1. (多选)如图是某班50名学生期中考试数学成绩的频率分布直方
图,其中成绩分组区间是[40,50),
[50,60),[60,70),[70,80),
[80,90),[90,100],则下列说
法正确的是(
)
A. 图中的 x 的值为0.018
B. 该班50 名学生期中考试数学成绩的众数是75
C. 该班50 名学生期中考试数学成绩的中位数是72
目录
1
C O N T E N T S
2
3
知识 逐点夯实
考点 分类突破
课时 跟踪检测
PART
1
知识 逐点夯实
课前自修
必备知识 系统梳理 基础重落实
目录
高中总复习·数学
1. 总体百分位数的估计
(1)百分位数
定义
意义
百 一组数据的第 p 百分位数是这样一个值,
分 它使得这组数据中 至少
有 p %的数据小
为 ,第二层抽取 n 个,即 y 1, y 2,…, yn ,平均数为 ,则
x 1, x 2,…, xm , y 1, y 2,…, yn 的平均数 =
+
+
.
+
(2)中位数:将一组数据按大小依次排列,处于
最中间 位置
的一个数据(或最中间两个数据的平均数)叫做这组数据的
目录
高中总复习·数学
2. 平均数、方差的公式推广
若数据 x 1 , x 2 ,…, x n 的平均数为 ത ,方差为 s 2 ,那么 mx 1 +
a , mx 2 + a , mx 3 + a ,…, mx n + a 的平均数是 m ത + a ,方
人教版高中数学高考一轮复习--用样本估计总体(课件)
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2
高中数学知识点精讲精析 用样本估计总体
1.6 用样本估计总体用样本估计总体(两种):1.一种是:用样本的频率分布估计总体的分布。
2.另一种是:用样本的数字特征(平均数标准差等)估计总体的数字特征。
例1 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为 A.0.6 h B.0.9 h C.1.0 h D.1.5 h 解析:505.020)5.11(1025⨯++⨯+⨯=0.9.例2 把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.分析:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数.解:由已知知前七组的累积频数为0.79×100=79, 故后三组共有的频数为21,依题意qq a --⋅1)1(31=21,a 1(1+q +q 2)=21(整解方程)∵q>2, ∴1+q +q 2>7 .∴a 1=1,q =4.∴后三组频数最高的一组的频数为16. 答案:16点评:此题分析只按第二种思路给出了解答。
例3 某班学生在一次数学考试中成绩分布如下表:那么分数在[100,110)中的频率和分数不满110分的累积频率分别是_____、_______(精确到0.01).解析:由频率计算方法知:总人数=45. 分数在[100,110)中的频率为458=0.178≈0.18. 分数不满110分的累积频率为458652+++=4521≈0.47.答案:0.18 0.47例4 对某电子元件进行寿命追踪调查,情况如下: (1)列出频率分布表;(2)画出频率分布直方图和累积频率分布图; (3)估计电子元件寿命在100~400 h 以内的概率; (4)估计电子元件寿命在400 h 以上的概率.分析:通过本题可掌握总体分布估计的各种方法和步骤. 解:(1)频率分布表如下:(2)频率分布直方图如下:(3)由累积频率分布图可以看出,寿命在100~400 h 内的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100~400 h 内的概率为0.65.(4)由频率分布表可知,寿命在400 h 以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h 以上的概率为0.35.点评:画频率分布条形图、直方图时要注意纵、横坐标轴的意义.例5 1936年,美国进行总统选举,竞选的是民主党的罗斯福和共和党的兰登·罗斯福是在任的总统.美国权威的《文学摘要》杂志社,为了预测总统候选人谁能当选,采用了大规模的模拟选举,他们以电话簿上的地址和俱乐部成员名单上的地址发出1000万封信,收到回信200万封,在调查史上,样本容量这么大是少见的,杂志社花费了大量的人力和物力,他们相信自己的调查统计结果,即兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统. 这个调查使《文学摘要》杂志社威信扫地,不久只得关门停刊. 试分析这次调查失败的原因.解:失败的原因:抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取,1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.1929~1933年的世界经济危机,使美国经济遭到沉重打击,“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,但广大的美国人民却从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.例6.1895年,在伦敦有106块男性头盖骨被挖掘出土,经考证,头盖骨的主人死于1665年~1666年之间的大瘟疫,人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm ):hh请你估计在1665年~1666年之间,英国男性头盖骨宽度的分布情况。
高中数学用样本估计总体
总体中所有个体值与总体平均数之差的平方的平均数,是衡量数据分散程度的量 。总体方差是参数,而样本方差是统计量。
样本比例和总体比例
样本比例
样本中某事件发生的次数与样本容量 的比值,用于估计总体比例。计算公 式为 $frac{a}{n}$,其中 $a$ 是事 件发生的次数,$n$ 是样本容量。
高中数学用样本估计总体
汇报人: 202X-01-02
contents
目录
• 样本和总体 • 用样本估计总体 • 样本估计总体的误差 • 用样本估计总体的应用 • 案例分析
01
样本和总体
样本和总体的定义
总体
研究对象的全体集合,表示为N。
样本
从总体中随机抽取的一部分个体,表示为n。
样本和总体的关系
05
案例分析
案例一:某品牌电视的市场占有率
总结词
通过调查某地区一定数量的家庭或零售商,了解他们购买电视的品牌偏好,从而估算该品牌电视在该 地区的整体市场占有率。
详细描述
选取一定数量的家庭或零售商作为样本,通过问卷调查或访谈的方式了解他们购买电视的品牌偏好。 然后,根据样本数据计算该品牌电视的市场占有率,并使用合适的统计方法对结果进行估计和误差分 析。
总体比例
总体中某事件发生的次数与总体容量 的比值。在统计学中,总体比例通常 作为参数来估计。
03
样本估计总体的误差
抽样误差和非抽样误差
抽样误差
由于从总体中随机抽取样本而产 生的误差,这种误差可以通过增 加样本量和提高样本代表性来减 小。
非抽样误差
由于调查过程中的非随机因素, 如测量误差、记录误差等而产生 的误差,这种误差难以控制和消 除。
案例二:某班级的数学成绩分布
2024版高考数学总复习:用样本估计总体课件
4.样本的数字特征
1
(x
+x
+…+x
)
1
2
n
如果有n个数据x1,x2,…,xn,那么平均数为=________________,
ҧ
标准差为s=
1
1 − ҧ
2
+ 2 − ҧ
2
+ ⋯ + − ҧ
2
1
2+(x -)
2+…+(x -)
2]
[(x
-
)
ҧ
ҧ
ҧ
1
2
n
方差为s2=____________________________________.
2
3
4
5
D
解析:由频率分布直方图知,评分在区间[82,86)内的影视作品
的频率为(86-82)×0.05=0.2,故评分在区间[82,86)内的影视作品
数量是400×0.2=80.
1
2
3
4
5
5.已知样本量为200,在样本的频率分布直方图中,共有n个小长方
形.若中间一个小长方形的面积等于其余(n-1)个小长方形面积和
第二步:决定组数和组距,组距=______;
组数
分组
第三步:将数据_____,通常对组内数值所在区间取左闭右开区间,
最后一组取闭区间;
第四步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图).
频率
组距
横轴表示样本数据,纵轴表示______,每个小长方形的面积表示样
,
(1)若数据x1 ,x2 ,…,xn 的平均数为 ,则mx
高考数学专题复习:用样本估计总体数字特征
高考数学专题复习:用样本估计总体数字特征一、单选题1.已知一组数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,那么另一组数据121x -,221x -,321x -,421x -,521x -,621x -的方差是( )A .13B .23C .43D .832.已知样本9,x ,10,y ,11的平均数是10,标准差是2,则xy 的值为( ) A .96B .97C .91D .873.给定一组数据:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,则这组数据的第25百分位数是( ) A .3.0B .3.2C .4.4D .5.34.若样本1x ,2x ,…n x ,的平均数.方差分别为x 、2s ,则样本135x +,235x +,35n x +,的平均数.方差分别为( ) A .x 、2s B .35x +、2s C .35x +、29sD .35x +、()235s +5.某学校有男生400人,女生600人.为调查该校全体学生每天睡眠时间,采用分层抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为( ). A .0.45B .0.62C .0.7D .0.766.下表是校篮球队某队员若干场比赛的得分数据.则该队员得分的40百分位数是( ) A .5B .6C .7D .87.四名同学各掷骰子5次,记录每次骰子出现的点数并分别对每位同学掷得的点数进行统计处理,在四名同学以下的统计结果中,可以判断出该同学所掷骰子一定没有出现点数1的是( )A .平均数为4,中位数为5B .平均数为5,方差为2.4C .中位数为4,众数为5D .中位数为4,方差为2.88.已知一组数据如下:1,2,5,6,11,则该组数据的方差为( ) A .12.4B .12.3C .12.2D .12.19.已知一组数据的平均数是3,方差是4,且这组数据的平方和是这组数据和的平方的19,则这组数据的个数是( ) A .10B .13C .15D .1610.小明和小红5次考试数学成绩统计如下:则成绩较为稳定的那个同学成绩的方差为( ) A .110B .108C .22D .411.已知一组数据的频率分布直方图如图所示,则估计该组数据的平均数为( )A .64B .65C .66D .6712.已知一组数据为85,87,88,90,92,则这组数据的第60百分位数为( ) A .87 B .87.5 C .89 D .91二、填空题13.数据35124a a a a a ,,,,的方差22222123450.8)20(s a a a a a =++-++,则样本数据121a +,221a +,345212121a a a +++,,的平均数为________. 14.甲、乙两名学生的六次数学测验成绩(百分制)的茎叶图如图所示.①甲同学成绩的中位数小于乙同学成绩的中位数; ②甲同学的平均分比乙同学的平均分高; ③甲同学的平均分比乙同学的平均分低; ④甲同学成绩的方差小于乙同学成绩的方差. 上面说法正确的是________.15.在某中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽样,若不知道样本数据,只知道抽取了男生30人,其身高平均数170x =,抽取了女生20人,其身高平均数160y =.据此估计高一年级全体学生身高的值为________.16.已知样本数据1x ,2x ,3x ,4x ,5x 的方差为2,则样本数据132x -,232x -,332x -,432x -,532x -的方差为________. 三、解答题17.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中x 的值; (2)求月平均用电量的中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?18.某校对高一期中数学考试成绩(单位:分)进行分析,随机抽取100名学生,将分数按照[30,50),[50,70),[70,90),[90,110),[110,130),[130,150]分成6组,制成了如图所示的频率分布直方图:(1)估计该校高一期中数学考试成绩的均值;(2)估计该校高一期中数学考试成绩的第80百分位数.19.某种产品的质量以其质量指标值m 衡量,并按照质量指标值m 划分等级如下:现在从某企业生产的这种产品中随机抽取了200件作为样本,检验其质量指标值m ,得到的频率分布直方图如图所示(每组只含最小值,不含最大值).(1)求第75百分位数(精确到0.1);(2)在样本中,按照产品等级用比例分配的分层随机抽样的方法抽取8件产品,则这8件产品中,一等品的件数是多少;(3)将频率视为概率,已知该企业的这种产品中每件一等品的利润是10元,每件二等品和三等品的利润都是6元,试估计该企业销售600件这种产品,所获利润是多少元.20.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[)90,100.50,60,[)80,90,[]60,70,[)70,80,[)(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分,众数,中位数.参考答案1.C 【分析】利用方差的性质求解. 【详解】因为数据1x ,2x ,3x ,4x ,5x ,6x 的方差是13,由方差的性质知,数据121x -,221x -,321x -,421x -,521x -,621x -的方差是214233⨯=.故选:C. 2.C 【分析】由平均数得20x y +=,由标准差得()()22101018x y -+-=,联立可得xy . 【详解】 依题意得91011105x y++++=,则20x y +=①.()()()()()()()222222221129101010111010102101055x y x y ⎡⎤⎡⎤=-+-+-+-+-=+-+-⎣⎦⎣⎦,则()()22101018x y -+-=②.由①②得22218x y +=,所以()()2224002189122x y x y xy +-+-===. 故选:C. 3.B 【分析】根据1025% 2.5⨯=,判断该组数据的第25百分位数即可. 【详解】这组数据是从小到大排序的,共10个数,而1025% 2.5⨯=,所以这组数据的第25百分位数是第3个数据,即3.2. 故选:B. 4.C【分析】由样本数据由i x 变为35i x +,结合平均数、方差的性质,即求新样本中的平均数、方差. 【详解】由题意,12...n x x x x n-+++=,2211()n i i s x x n -==-∑,∴样本135x +,235x +,35n x +的平均数135x x --=+,而2219s s =. 故选:C 5.D 【分析】利用均值的计算公式以及方差的计算公式,准确运算,即可求解. 【详解】由题意,总体的均值为4006007.577.210001000⨯+⨯=, 根据分层抽样的性质,可得总体的方差为:22400600[1(7.57.2)][0.5(7.27)]0.4360.4240.7610001000⨯+-+⨯+-=+=. 故选:D. 6.C 【分析】按所给数据求出各得分的频率,然后根据百分位数定义计算. 【详解】由所给数据,总数为212311111++++++=, 得分3,6,7,10,11,13,30的频率分别为2123111,,,,,,11111111111111, 前3个得分频率和为540%11>,前2个得分的频率和为340%11<,因此40百分位数应该是第三个频率211对应的得分为7分. 故选:C . 7.B 【分析】依据数字特征的定义,依次对选项验证即可. 【详解】解:对于选项A ,1,2,5,6,6符合条件,故A 错,对于选项B ,若平均数为5且出现点数1,则只能为1,6,6,6,6,此时方差为22(15)4(65)45-+⨯-=,故B 对,对于选项C ,1,2,4,5,5符合条件,故C 错, 对于选项D ,1,4,4,5,6,平均数为()11445645++++=,方差()()()2221145464 2.85⎡⎤-+-+-=⎣⎦,符合条件,故D 错, 故选:B . 8.A 【分析】先求出平均数,再根据平均数计算即可求得方差. 【详解】 ()112561155x =++++=,()()()()()2222221621525556511512.455s ⎡⎤=-+-+-+-+-==⎣⎦ 故选:A 9.B 【分析】设这组数据分别为12,,.,n x x x ⋯,根据平均数公式及方差公式即可得的12.3n x x x n ++⋯+=,()()()2221233.34n x x x n -+-+⋯+-=,从而得到22212.n x x x ++⋯+,再依题意得到方程,解得即可; 【详解】解:设这组数据分别为12,,.,n x x x ⋯,则12.3n x x x n ++⋯+=,()()()2221233.34,n x x x n -+-+⋯+-=所以()()()2222221212.6.33.34,n n x x x x x x n ++⋯+-++⋯++++⋯+=所以()22212.1894,n x x x n n n ++⋯+-+=从而22212.13n x x x n ++⋯+=.因为这组数据的平方和是这组数据和的平方的19,所以()2211339n n n ⨯==,解得13n =或0n =(舍去). 故选:B 10.D 【分析】依次求得两位同学的成绩的平均数,再根据结果求得两位同学成绩的方差即可得出结果. 【详解】小明数学成绩的平均值为11(107111110109113)1105x =++++=,所以成绩的方差为22122221(107110)(111110)(110110)(109110)(113110)45s ⎡⎤=-+-+-+-+-=⎣⎦ 小红数学成绩的平均值为21(99110111108112)1085x =++++=,所以成绩的方差为22222221(99108)(110108)(111108)(108108)(112108)225s ⎡⎤=-+-+-+-+-=⎣⎦. 因为2212s s <,所以小明同学的成绩更稳定,方差为21=4s .故选:D 11.D 【分析】根据频率分布直方图的平均数的计算公式,准确计算,即可求解. 【详解】根据频率分布直方图的平均数的计算公式,可得:(550.03650.04750.015850.01950.005)1067x =⨯+⨯+⨯+⨯+⨯⨯=. 故选:D. 12.C 【分析】根据一组数的百分位数的定义直接计算即可. 【详解】该组数据从小到大排序为85,87,88,90,92,共5个数据,而560%3⨯=, 所以这组数据的第60百分位数为8890892+=. 故选:C.13.9或7- 【分析】设样本数据35124a a a a a ,,,,的平均数为a ,推出2580a =,解得4a =±,由此即可求出结果. 【详解】 由题意知,222222123450.2(80)s a a a a a =++++-,设样本数据35124a a a a a ,,,,的平均数为a ,则222222123450.2[()()()()()]s a a a a a a a a a a =-+-+-+-+-22222212345123450.2[2()5]a a a a a a a a a a a a =++++-+++++ 222222123450.2(5)a a a a a a =++++-,所以2580a =,解得4a =±,又12345222221a a a a a ++1,+1,+1,+1,的平均数为21a +, 当4a =时,21=9a +; 当4a =-时,21=-7a +. 故答案为:9或-7 14.①③④ 【分析】根据茎叶图中的数据,对题目中的命题进行分析、判断正误即可. 【详解】解:根据茎叶图中数据知,对于①,甲同学成绩的中位数是1(8082)812⨯+=,乙同学成绩的中位数是1(8788)87.52⨯+=,所以甲的中位数小于乙的中位数,①正确;对于②,甲同学的平均分为1(727680828690)816⨯+++++=, 乙同学的平均分为1(697887889296)856⨯+++++=, 所以甲同学的平均分比乙同学的平均分低,②错误; 对于③,甲同学的平均分比乙同学的平均分低,③正确;对于④,计算甲的方差为2222221107[(9)(5)(1)159]63⨯-+-+-+++=, 乙的方差为2222221244[(16)(7)23711]63⨯-+-++++=, 所以甲的方差小于乙的方差,④正确.所以正确的命题序号是①③④.故答案为:①③④.15.166【分析】根据平均数的计算公式即可求出结果.【详解】 估计高一年级全体学生身高的值为301702016016650⨯+⨯=, 故答案为:16616.18【分析】利用方差的性质求解即可.【详解】样本数据1x ,2x ,3x ,4x ,5x 的方差为22S =, 所以样本数据132x -,232x -,332x -,432x -,532x -的方差为:23218⨯=.故答案为:1817.(1)0.0075;(2)中位数是224;(3)5户.【分析】(1)根据小矩形的面积之和等于1即可求x 的值;(2)根据中位数左右两侧小矩形面积等于0.5可得中位数;(3)先计算每个区间抽取的户数,再计算抽样比例,即可求解.【详解】(1)由直方图的性质得()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 解得:0.0075x =;(2)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+-=,解得:224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户, 抽样比为112515105+++=15, 所以月平均用电量在[)220,240的用户抽取12555⨯=户. 18.(1)93分;(2)115分.【分析】(1)由每组数据中点值乘以频率相加可得均值;(2)计算出110分以下的频率和为0.75,因此80%分位数在[)110130,,还需频率0.05,区间[)110130,的频率是0.2,还需通过计算可得结论. 【详解】解:(1)数学成绩在:[)3050,频率0.0050200.1⨯=, [)5070,频率0.0050200.1⨯=, [)7090,频率0.0075200.15⨯=, [)90110,频率0.0200200.4⨯=, [)110130,频率0.0100200.2⨯=, []130150,频率0.0025200.05⨯=,样本均值为:400.1600.1800.151000.41200.21400.0593⨯+⨯+⨯+⨯+⨯+⨯=,可以估计样本数据中数学成绩均值为93分,据此可以估计该校高一下学期期中数学考试成绩估计93分.(2)由(1)知样本数据中数学考试成绩在110分以下所占比例为0.10.10.150.40.75+++=在130分以下所占比例为0.750.20.95+=因此,80%分位数一定位于[)110130,内,由 0.80.75110201150.950.75-+⨯=-, 可以估计样本数据的第80百分位数约为115分,据此可以估计该校高一下学期期中数学考试成绩第80百分位数约为115分19.(1)109.8;(2)3;(3)4500(元).【分析】(1)先利用频率分布直方图的性质求出0.030x =,由第75百分位数在图中表现为该数的左侧频率为0.75,根据这一点可求第75百分位数;(2)先根据频率分布直方图以及等级划分规则算出三种等级的频率,从而得样本中各等级的件数,再利用分层随机抽样的按比例抽取求解;(3)根据(2)中算出的频率求利润的估计值.【详解】(1)由题得,()0.00250.00900.01000.02000.02600.0025101x ++++++⨯=,解得0.030x =.又[65,105)的频率为0.625,[105,115)的频率为0.26,所以第75百分位数在[105,115)内第75百分位数为0.750.62510510109.80.26-+⨯≈. (2)由频率分布直方图以及等级划分规则可知,样本中三等品、二等品、一等品的频率分别为(0.00250.0100)100.125+⨯=,(0.02000.0300)100.5+⨯=,(0.02600.00900.0025)100.375++⨯=.所以在200件样本中,三等品、二等品、一等品的件数分别为25,100,75,所以按照产品等级用比例分配分层随机抽样的方法抽取8件产品, 则应抽取的一等品的件数分别为7583200⨯=. (3)由(2)知,从该企业的这种产品中任取一件是一等品的概率为0.375,是二等品或三等品的概率为0.625.故该企业销售600件这种产品,所获利润约为6000.375106000.62564500⨯⨯+⨯⨯=(元) 20.(1)0.005;(2)平均分为73,众数为65,中位数为2153. 【分析】(1)根据概率之和等于1,即所以小矩形的面积之和等于1,即可求解;(2)根据平均分,众数,中位数的概念结合频率分布直方图即可求出平均分,众数,中位数.【详解】解:(1)由频率分布直方图可得:()1020.020.030.041a ⨯+++=,∴0.005a =.(2)平均分550.00510650.0410750.0310850.0210950.0051073⨯⨯+⨯⨯+⨯⨯⨯⨯+⨯⨯=+(分) 众数为60702+=65分. 中位数为()0.50.005100.0410215700.033-⨯+⨯+=(分).。
用样本估计总体课件-2025届高三数学一轮复习
统计与成对数据的统计分析之
用样本估计总体
1.总体百分位数的估计
(1)百分位数
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少
有%的数据小于或等于这个值,且至少有 − %的数据大于或等于
这个值.
(2)百分位数的意义
反映该组数中小于或等于该百分位数的分布特点.
胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为
, = , , ⋯ , .试验结果如下:
试验序号
1
2
3
4
5
6
7
8
9
10
伸缩率
545
533
551
522
575
544
541
568
596
548
伸缩率
536
527
543
530
560
533
522
550
576
536
记 = − = , , ⋯ , ,记 , ,⋯ , 的样本平均数为,样本
考点二 总体集中趋势的估计
例2 (多选)(2024·山东济南模拟)某学校发起了“畅读经典,欢度新年”活
动,根据统计数据可知,该校共有1 200名学生,所有学生每天读书时间
均在 到 之间,他们的日阅读时间的频率分布直方图如图
所示.则下列结论正确的是(
)
A.该校学生日阅读时间的众数约为70
⋅ [ +
+
+
+
,样本的方差为
+
− ].
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形底边的中点对应的横坐标;
2024年高考数学一轮复习(新高考版)《用样本估计总体》课件ppt
思考辨析
判断下列结论是否正确(请在括号中打“√”或“×”)
(1)对一组数据来说,平均数和中位数总是非常接近.( × ) (2)方差与标准差具有相同的单位.( × )
(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,
方差不变.( √ )
(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.
题型三 总体离散程度的估计
例3 (2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新 设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产 了10件产品,得到各件产品该项指标数据如下.
旧设备 9.8 10.3 10.0 10.2 9.9 9.8 10.0 10.1 10.2 9.7 新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5 旧设备和新设备生产产品的该项指标的样本平均数分别记为 x 和 y ,样 本方差分别记为 s21和 s22. (1)求 x , y ,s21,s22;
∴x=190. 故a=0.025 0,众数为190,中位数为190.
(2)若树苗高度在185 cm及以上是可以移栽的合格树苗.从样本中用比例分 配的分层随机抽样方法抽取20株树苗作进一步研究,不合格树苗、合格 树苗分别应抽取多少株?
由题意可知,合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0) ×10=0.65,不合格树苗所占频 率为1-0.65=0.35, 所以不合格树苗抽取20×0.35= 7(株),合格树苗抽取20×0.65= 13(株), 故不合格树苗、合格树苗应分别 抽取7株和13株.
数为
A.102
√ B.103
C.109.5 D.116
高考数学专题复习:用样本估计总体
高考数学专题复习:用样本估计总体一、单选题1.某班50名学生在一次百米测试中,成绩全部不小于13秒且小于19秒,将测试结果按如下方式分成六组:第一组,成绩大于等于13秒且小于14秒;第二组,成绩大于等于14秒且小于15秒;…;第六组,成绩大于等于18秒且小于19秒,如图是按上述分组方法得到的频率分布直方图,设成绩小于17秒的学生人数占全班总人数的百分比为x,成绩大于等于15秒且小于17秒的学生人数为y,则从频率分布直方图中可分析出x和y的值分别是()A.90%,35 B.90%,45C.10%,35 D.10%,452.某同学郑一粒均匀的骰子5次,记录每次骰子出现的点数,若其中至少出现了1次点数6,则这组数据不可能得出的统计结果是()A.平均数为3,中位数为2 B.中位数为3,众数为2C.平均数为2,方差为3 D.中位数为3,方差为2.83.某中学有10个学生社团,每个社团的人数分别是70,60,60,50,60,40,40,30,30,10,则这组数据的平均数,众数,中位数的和为()A.165 B.160 C.150 D.1704.四名同学各掷一枚骰子5次,分别记录每次骰子出现的点数.根据下面四名同学的统计结果,可以判断出一定没有出现点数6的是()A.平均数为2,方差为2.4 B.中位数为3,众数为2C.平均数为3,中位数为2 D.中位数为3,方差为2.85.某市2020年各月的平均气温(℃)数据的茎叶图如下,则这组数据的中位数是()A .21B .22C .22.5D .236.为了从甲、乙两人中选一人参加数学竞赛,老师将二人最近的6次数学测试的分数进行统计,甲、乙两人的得分情况如茎叶图所示,若甲、乙两人的平均成绩分别是 ,x x 甲乙,则下列说法正确的是( )A . x x >甲乙,乙比甲成绩稳定,应选乙参加比赛B . x x >甲乙,甲比乙成绩稳定,应选甲参加比赛C . x x <甲乙,甲比乙成绩稳定,应选甲参加比赛D . x x <甲乙,乙比甲成绩稳定,应选乙参加比赛7.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为2s ,则( )A .242,x s ==B .24,2x s =>C .24,2x s =<D .24,2x s ><8.某校高一年级一名学生七次月考数学成绩(满分100分)分别为78,82,84,84,86,89,96,则这名学生七次月考数学成绩的第80百分位数为( ) A .82B .84C .89D .969.某校高一甲、乙两个班分别有男生24名、15名,现用比例分配的分层随机抽样方法从两班男生中抽取样本量为13的样本,对两个班男生的平均身高进行评估.已知甲班、乙班男生身高的样本平均数分别为175cm 、177.6cm ,以所抽取样本的平均身高作为两个班男生的平均身高,则两个班男生的平均身高为( )A .176cmB .176.3cmC .176.6cmD .176.9cm10.设一组样本数据12,,n x x x 的平均值为2,则数据1229,29,,29n x x x ++⋅⋅⋅+的平均值为( ) A .11B .12C .13D .1411.某同学掷骰子4次,并记录了每次骰子出现的点数,得出平均数为2,方差为12的统计结果,则下列点数中一定不出现的是( ) A .1B .2C .3D .512.某单位共有A 、B 、C 三个部门,三部门人员平均年龄分别为38岁、24岁、42岁,又已知A 和B 两部门人员平均年龄为30岁,B 和C 两部门人员平均年龄为34岁,则该单位全体人员的平均年龄为( ) A .34岁 B .35岁C .36岁D .37岁二、填空题13.一组数6,5,4,3,3,3,2,2,2,1的80%分位数为________.14.学校进行30秒跳绳测试,某小组8名同学的跳绳个数如下面的茎叶图所示,则该组数据的方差为________.15.某企业生产甲、乙两种产品,现从一批产品中随机抽取两种产品各5件进行检测,检测量结果如下:由于表格被污损,数据a ,b 看不清,统计员只记得甲、乙两种产品检测数据的平均数和方差都相等,则ab =________.16.已知样本数据1x ,2x ,⋯,2020x 的平均数与方差分别是m 和n ,若2(1i i y x i =-+=,2,⋯,2020),且样本数据的1y ,2y ,⋯,2020y 平均数与方差分别是n 和m ,则222122020x x x ++⋯+=________.三、解答题17.高一年级期末考试成绩各分数段[)0,90,[)90,105,[)105,120,[)120,135,[]135,150的频率分布如下图.(Ⅰ)计算高一年级所有同学成绩的中位数;(Ⅱ)用各分数段的中间值代替各分数段的平均值,并且删去[)0,90,[]135,150两个分数段,试估计高一年级期末考试成绩的平均值;(Ⅲ)若高一年级有1000人,把成绩从低到高编号,用系统抽样的方法从中抽取一个容量为20的样本,其中一个个体的编号为63,请写出抽样在[)105,120之间的个体的编号.18.20名学生某次数学考试成绩(单位:分)的频率分布直方图如图.(1)求频率分布直方图中a 的值;(2)估计总体中成绩落在[)50,60中的学生人数;(3)根据频率分布直方图估计20名学生数学考试成绩的众数,中位数;19.甲、乙两位同学要参加数学竞赛,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,绘制成茎叶图如下(单位:分).(1)分别写出甲、乙两位同学6次预赛成绩的众数、中位数;(2)计算甲、乙两位同学6次预赛成绩的平均数与方差,并判断谁的成绩更稳定.20.现有某城市100户居民的月平均用电量(单位:度)的数据,根据这些数据,以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示.(1)确定直方图中x 的值,并求月平均用电量的众数和中位数;(2)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层随机抽样的方法抽取11户居民,则月平均用电量在[)220,240内的用户中应抽取多少户?21.下表为30位学生参加语文竞赛的成绩,并由小到大排列.(1)求第一、二、三四分位数;(2)求第10百分位数;(3)求第95百分位数.22.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)求直方图中x的值;(2)①求在这些用户中,用电量在区间[100,250)内的居民数;②如果按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,那么用电量在[150,200)内的居民数应抽取多少?参考答案1.A 【分析】频率分布直方图中,小矩形的高等于每一组的频率/组距,它们与频数成正比,小矩形的面积等于这一组的频率.建立相应的关系式,即可求得. 【详解】解:从频率分布直方图上可以看出1(0.060.04)0.9x =-+=,50(0.360.34)35y =⨯+=,故选:A . 2.C 【分析】对于选项ABD ,举出满足条件且出现点数为6的例子,对于选项C ,由于至少出现一个点数6,结合平均数为2,计算方差即可判断作答. 【详解】对于A ,中位数为2的5个点数是1,1,2,5,6,平均数为1125635++++=,选项A 可能出现;对于B ,中位数为3,众数为2的5个点数是2,2,3,4,6或2,2,3,5,6均符合要求,即选项B 可能出现;对于C ,因平均数为2,且至少出现了1次点数6,则方差221(62) 3.25s >-=,即方差不可能为3,选项C 不可能出现;对于D ,中位数为3的5个点数是1,2,3,3,6,平均数为1233635++++=,方差2222221[(13)(23)(33)(33)(63)] 2.85s =-+-+-+-+-=,选项D 可能出现.故选:C 3.C 【分析】将数字从小到大(或从大到小)排列,得到众数和中位数,再算出平均数,即可得到答案. 【详解】人数分别是10,30,30,40,40,50,60,60,60,70,则众数为60,中位数为4050452+=,平均数为103030404050606060704510+++++++++=,∴平均数,众数,中位数的和为:60+45+45=150. 故选:C. 4.A 【分析】选项A ,利用反证法说明一定含6,选项BCD 中依次举例说明可能含有6即可. 【详解】对于A ,若平均数为2,且出现点数6,则方差221(62) 3.2 2.45S >-=>,所以当平均数为2,方差为2.4时,一定不会出现点数6,所以A 可以判断;对于B ,当掷骰子出现的结果为2,2,3,4,6时,满足中位数为3,众数为2,可以出现点6,所以B 不能判断;对于C ,当掷骰子出现的结果为1,1,2,5,6时,满足平均数为3,中位数为2,可以出现点6,所以C 不能判断;对于D ,当掷骰子出现的结果为1,2,3,3,6时,满足中位数为3,则平均数为1(12336)35x =++++=,方差为2222221[(13)(23)(33)(33)(63)] 2.85S =-+-+-+-+-=,所以可以出现点6,所以D 不能判断. 故选:A. 5.B 【分析】由茎叶图得到数据最中间的两个数是21和23,即得解. 【详解】由茎叶图可知,数据最中间的两个数是21和23, 所以数据的中位数为21+23=222. 故选:B 6.D 【分析】根据茎叶图中的数据计算平均数得的平均数是82,乙的平均数是87,再根据茎叶图分析甲与乙的稳定性即可得答案. 【详解】由茎叶图可知,甲的平均数是727879858692826+++++=,乙的平均数是788687879193876+++++=,所以乙的平均数大于甲的平均数,即 x x <甲乙, 从茎叶图可以看出乙的成绩比较稳定,应选乙参加比赛. 故选:D. 7.C 【分析】由已知条件,根据平均数和方差的计算公式进行求解即可. 【详解】 根据题意有47448x ⨯+==, 而()22724428s ⨯+-=<.故选:C. 8.C 【分析】利用百分位数的定义分析求解即可. 【详解】解:因为780% 5.6⨯=,所以这名学生七次月考数学成绩的第80百分位数为89. 故选:C. 9.A 【分析】由题知13个的样本中,甲班男生有8人,乙班男生有5人,进而得两个班男生的平均身高为()11758177.6517613⨯+⨯=. 【详解】解:根据题意,抽出来的13个的样本中,甲班男生有241382415⨯=+人,乙班男生有151352415⨯=+人,所以根据题意得两个班男生的平均身高为()11758177.6517613⨯+⨯= 故选:A 10.C 【分析】利用平均数公式求解即可. 【详解】 因为122nx x x n+++=,所以12292929n x x x n++++++,()122913n x x x n+++=+=,故选:C. 11.D 【分析】利用方差的公式检验四个选项的正误即可得正确选项. 【详解】当有一个数是5,则()25291442-=>,所以5一定不出现;当有一个数是3时,()23211442-=<,所以3可能出现; 当有一个数是2时,()2221042-=<,所以2可能出现; 当有一个数是1时,()21211442-=<,所以1可能出现;故选:D. 12.B 【分析】设A 、B 、C 三个部门的人数分别为,,a b c ,根据已知条件列出方程组可求出34a b =,54c b =,然后再根据平均数的计算公式,即可求出该单位全体人员的平均年龄.【详解】设A 、B 、C 三个部门的人数分别为,,a b c ,由题意得382430244234a b a b b c b c+⎧=⎪⎪+⎨+⎪=⎪+⎩,所以3454a b c b ⎧=⎪⎪⎨⎪=⎪⎩, 所以该单位全体人员的平均年龄为3538244238244244353544b b b a bc a b c b b b ⨯++⨯++==++++. 故选:B13.4.5【分析】将数据按从小到大的顺序排列,第8和第9个数的平均数即可.【详解】一组数6,5,4,3,3,3,2,2,2,1按从小到大的顺序排列,可得1,2,2,2,3,3,3,4,5,6,共10个,由1080%8⨯=,所以该组数据的80%分位数为45 4.52+=, 故答案为:4.5.14.17.5【分析】先求出该组数据的平均数,再由方差公式即可求出.【详解】 由图可知,该组数据的平均数为4144454750515254488+++++++=, 所以方差为()()()()2222222217431234617.58⎡⎤⨯-+-+-+-++++=⎣⎦. 故答案为:17.5.15.72【分析】求出均值可得17a b +=,再由方差相等可得()()22881a b -+-=,解方程组即可求解.【详解】77+7.5+9+9.56+8.5+8.5+=8=55a x xb ++==甲乙,可得17a b += ①, ()()()()()22222878787.58989.5 5.5D =-+-+-+-+-=甲 ,则()()()()()2222286888.588.58 5.5D a b =-+-+-+-+-=乙,可得()()22881a b -+-= ②, 由①②可得89,98a a b b ==⎧⎧⎨⎨==⎩⎩,所以72ab = , 故答案为:72 .16.4040【分析】由样本数据的平均数、方差的性质列方程组求出1m =,1n =,从而2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=,由此能求出222122020x x x ++⋯+的值. 【详解】由题意得:2m n m n -+=⎧⎨=⎩, 解得1m =,1n =, ∴2221220201[(1)(1)(1)]12020x x x -+-+⋅⋅⋅+-=, 22212202012202020202()2020x x x x x x ∴++⋯++-++⋅⋅⋅+=,2221220201220202()220204040x x x x x x ∴++⋯+=++⋅⋅⋅+=⨯=.故答案为:4040.17.(Ⅰ)110分;(Ⅱ)111.5分;(Ⅲ)413,463,513,563,613,663.【分析】(1)根据中位数的概念即可求解;(Ⅱ)结合加权平均数的计算公式即可求出结果;(Ⅲ)由系统抽样中等间隔即可求出结果.【详解】(1)由题图可知[)0,90和[)90,105分数段内的人数占总人数的40%,故中位数在[)105,120分数段内从低到高13处,则中位数为1105151103+⨯=(分). (Ⅱ)[)90,105,[)105,120,[)120,135三个分数段的中间值分别为97.5,112.5,127.5,人数比为25%:30%:20%5:6:4=,则估计高一年级期末考试成绩的平均值为97.55112.56127.54111.5564⨯+⨯+⨯=++(分). (Ⅲ)由题图可得[)0,90分数段内有150人,[)90,105分数段内有250人,[)105,120分数段内有300人,则[)105,120分数段内的编号是从401到700,由题意,两个相邻样本的编号差为10005020=,则在分数段[)105,120内抽取的个体的编号为413,463,513,563,613,663. 18.(1)0.005a =;(2)2人;(3)众数为75,中位数为5407. 【分析】(1)由频率和为1可求出a 的值;(2)先求出成绩落在[)50,60的频率,从而可求出频数;(3)由图可知众数在第3组,从而可得众数为7080752+=,由于前2组的频率和小于0.5,前3组的频率和大于0.5,所以中位数在第3组,列方程可求得结果【详解】(1)()23762101a a a a a ++++⨯=,解得0.005a =.(2)由频率分布直方图得成绩落在[)50,60中的频率为2100.1a ⨯=,∴估计总体中成绩落在[)50,60中的学生人数为:200.12⨯=人.(3)根据频率分布直方图估计20名学生数学考试成绩的众数为:7080752+=, 由于前2组的频率和10(0.010.015)0.250.5⨯+=<,前3组的频率和10(0.010.0150.035)0.60.5⨯++=>,所以中位数在第3组,设中位数为x ,则()()0.010.015100.035700.5x +⨯+-= 解得5407x =,所以中位数为540719.(1)甲同学6次预赛成绩的众数为82分,中位数为82分,乙同学6次预赛成绩的众数为85分,中位数为81.5分;(2)甲同学预赛的平均成绩82分;乙同学预赛的平均成绩81分,甲同学预赛成绩的方差为313;乙同学预赛成绩的方差为13;甲同学成绩更稳定. 【分析】(1)甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85,进而可得答案;(2)根据茎叶图,计算即可得平均数与方差,再根据数字特征的意义即可得答案.【详解】(1)由茎叶图可知,甲同学的6次预赛成绩分别为:78,79,82,82,83,88;乙同学的6次预赛成绩分别为:76,77,80,83,85,85;所以,甲同学6次预赛成绩的众数为82分,中位数为8282822+=(分),乙同学6次预赛成绩的众数为85分,中位数为808381.52+=(分) (2)甲同学预赛的平均成绩121223880826x --++++=+=分 乙同学预赛的平均成绩243035580816x --++++=+=分, 甲同学预赛成绩的方差为22222221131(7882)(7982)(8282)(8282)(8382)(8882)63s ⎡⎤=-+-+-+-+-+-=⎣⎦ 乙同学预赛成绩的方差为222222221(7681)(7781)(8081)(8381)(8581)(8581)136s ⎡⎤=-+-+-+-+-+-=⎣⎦ 由2221s s >,所以,甲同学成绩更稳定20.(1)0.0075x =,众数为230度,中位数224度;(2)5户.【分析】(1)由频率和为1列方程可求出x 的值,由[)220,240对应的频数最大,可求出众数,由前3组的频率和小于0.5,前4组的频率和大于0.5,所以中位数在第4组,设中位数为t 度,则0.50.45220200.25t -=+⨯; (2)利用分层抽样的比进行求解即可【详解】(1)因为()0.0020.00250.0050.00950.0110.0125201x ++++++⨯=,所以0.0075x =; 由频率分布直方图可知:[)220,240对应的频数最大,所以众数为230度;因为前三组频率之和为()0.0020.00950.011200.450.5++⨯=<,第四组频率为0.0125200.25⨯=,且0.450.250.70.5+=>,所以中位数在第四组数据中,设中位数为t 度, 所以0.50.45220202240.25t -=+⨯=. (2)因为[)220,240,[)240,260,[)260,280,[]280,300的频率之比为()()()()0.012520:0.007520:0.00520:0.0025205:3:2:1⨯⨯⨯⨯=,所以月平均用电量在[)220,240内的用户中应抽取:51155321⨯=+++户, 答:月平均用电量在[)220,240内的用户中应抽取5户.21.(1)第一四分位数为65,第二四分位数为75.5,第三四分位数为85;(2)56.5;(3)99.【分析】(1)由30×25%,30×50%,30×75%分别确定第一、二、三四分位数的位置即可; (2)由30×10%确定第10百分位数的位置; (3)由30×95%确定第95百分位数的位置 【详解】解:(1)30×25%=7.5,取第8项数据,所以第一四分位数为65,30×50%=15,取第15、16项数据的平均数,所以第二四分位数为75762+=75.5;30×75%=22.5,取第23项数据,所以第三四分位数为85.(2)30×10%=3,取第3、4项数据的平均数,所以第10百分位数为55582+=56.5. (3)30×95%=28.5,取第29项数据,所以第95百分位数为99. 22.(1)x =0.0044;(2)①70户;②3(户).【分析】(1)由频率分布直方图,列出方程,能求出直方图中x 的值.(2)①先求出用电量在[100,250)内的频率为0.7,由此能求出在这些用户中,用电量在区间[100,250)内的居民数.②用电量在[150,200)内的户数为30户,由此利用分层抽样的性质能求出用电量在[150,200)内的居民数应该抽取的户数.【详解】(1)由频率分布直方图得:(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得直方图中x=0.0044.(2)①用电量在[100,250)内的频率为:(0.0036+0.0060+0.0044)×50=0.7,∴在这些用户中,用电量在区间[100,250)内的居民数为100×0.7=70户.②用电量在[150,200)内的户数为0.0060×50×100=30(户),按分层抽样方法,在这些用户中按1:10的比例抽取用户进一步调查,用电量在[150,200)内的居民数应该抽取:130310⨯=(户).。
用样本估计总体 经典课件(最新)
高中数学课件
【解】 (1)A 轮胎行驶的最远里程的平均数为 96+112+97+108+8 100+103+86+98=100, 中位数为100+ 2 98=99; B 轮胎行驶的最远里程的平均数为 108+101+94+1058+96+93+97+106=100, 中位数为101+ 2 97=99.
高中数学课件
【反思·升华】 (1)茎叶图的识别与绘制需注意: ①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一. ②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. (2)能从茎叶图中提取有效的数据信息,如:数据分布的对称性、集中程度、中位数、 平均数等,对两组数据进行推断,获得结论,进而对方案决策提供较为科学合理的解释. (3)茎叶图的优点是原有信息不会抹掉,能够展示数据分布情况,但当样本数据较多 或数据位数较多时,茎叶图就显得不太方便了.
高中数学课件
[强化训练 2.1] 如图 11 所示的茎叶图记录了甲、乙两组各五名学生在一次英语听力 测试中的成绩(单位:分).已知甲组数据的中位数为 15,乙组数据的平均数为 16.8,则 x, y 的值分别为( )
A.2,5 C.5,8
B.5,5 D.8,8
图 11
高中数学课件
解析:因为甲组数据的中位数为 15,所以由茎叶图可得 x=5.由乙组数据的平均数为 16.8,得9+15+(10+5 y)+18+24=16.8,解得 y=8,故选 C.
答案:C
高中数学课件
[强化训练 2.2] (2018 年高考·江苏卷)已知 5 位裁判给某运动员打出的分数的茎叶图 如图 12 所示,那么这 5 位裁判打出的分数的平均数为________.
图 12 分析:先由茎叶图得数据,再根据平均数公式求平均数.
高三数学一轮复习讲义(用样本估计总体)学生
课题:用样本估计总体知识点一、频率分布直方图1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的特征数估计总体的特征数.(2)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线 (1)频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2)总体密度曲线随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.统计中称之为总体分布的密度曲线,它能够更加精细的反映出总体在各个范围内取值的百分比.3.作频率分布直方图的步骤:(1)作出频率分布表:①求极差(即一组数据中最大值与最小值得差)②决定组距和组数:绘制频数分布表和频数分布直方图时要将一批数据分组,•组距和组数的确定没有固定的标准,通常数据越多,所分的组数也越多,当数据在100个以内时,•根据数据的多少常分成5─12组.一般地,所分的小组里含最小值,不含最大值,•即数据x 满足a ≤x<b(2)建立直角坐标系:X 轴为组距;Y 轴为频率/组距4.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.【典型例题】【例1】(2023·全国·高三专题练习)某校1000名学生参加数学竞赛,随机抽取了20名学生的考试成绩(单位:分),成绩的频率分布直方图如图所示,则下列说法正确的是( ) A .频率分布直方图中aB .估计这20名学生数学考试成绩的第60百分位数为80C .估计这20名学生数学考试成绩的众数为80D .估计总体中成绩落在[50,60)内的学生人数为110【例2】(2022·天津滨海新·模拟预测)某品牌家电公司从其全部200名销售员工中随机抽出50名调查销售情况,销售额都在区间[5,25](单位:百万元)内,将其分成5组:[5,9),[9,13,[13,17),[17,21),[21,25],并整理得到如下的频率分布直方图,下列说法正确的是( ) A .频率分布直方图中aB .估计全部销售员工销售额的中位数为15C .估计全部销售员工中销售额在区间[9,13内有64人D .估计全部销售员工销售额的第75百分位数为17【例3】(2022·全国·模拟预测)(多选)某城市地铁交通建设项目已经基本完成,为了解市民对该项目的满意度,分别从不同地铁站点随机抽取1000名市民对该项目进行评分,统计发现评分均在[]40,100内,把评分分成[)40,50,[)50,60,[)60,70,[)70,80,[)80,90,[]90,100六组,并绘制成频率分布直方图(如图所示).则下列判断正确的是( ) A .图中aB .该次满意度评分的平均分为85C .该次满意度评分的众数为85D .大约有34%的市民满意度评分在[)60,80内【例4】从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a ,b 的值;【举一反三】1.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a =_________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.2.(2022·全国·高三专题练习)某区政府组织了以“不忘初心,牢记使命”为主题的教育活动,为统计全区党员干部一周参与主题教育活动的时间,从全区的党员干部中随机抽取n 名,获得了他们一周参与主题教育活动时间(单位:h )的频率分布直方图如图所示,已知参与主题教育活动时间在(]12,16内的人数为92. (1)求n 的值;(2)以每组数据所在区间的中点值作为本组的代表,估算这些党员干部参与主题教育活动时间的中位数(中位数精确到0.01).(3)如果计划对参与主题教育活动时间在(]16,24内的党员干部给予奖励,且在(]16,20,(]20,24内的分别评为二等奖和一等奖,那么按照分层抽样的方法从获得一、二等奖的党员干部中选取5人参加社区义务宣讲活动,再从这5人中随机抽取2人作为主宣讲人,求这2人均是二等奖的概率.知识点二、茎叶图茎叶图:定义是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数画法对于样本数据较少,且分布较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶.样本数据为小数时做类似处理.对于样本数据较少,且分布较为集中的两组数据,关键是找到两组数据共有的茎优缺点用茎叶图表示数据的优点是:(1)所有的信息都可以从茎叶图中得到;(2)便于记录和读取,能够展示数据的分布情况.缺点是:当样本数据较多或数据位数较多时,茎叶图就显得不太方便【典型例题】【例1】为了比较两种治疗失眠症的药(分别称为A 药,B 药)的疗效,随机地选取20位患者服用A 药,20位患者服用B 药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h ),试验的观测结果如下:服用A 药的20位患者日平均增加的睡眠时间: 服用B 药的20位患者日平均增加的睡眠时间: (1)作出茎叶图;(2)从茎叶图看,哪种药的疗效更好?A 药B 药 0. 1. 2.3.【例2】某中学高三年级从甲、乙两个班级各选出8名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生成绩的平均分是86,乙班学生成绩的中位数是83,则x y +的值为( ) A .9 B .10 C .11 D .13【举一反三】1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)如图I 所示;若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为( )A 、3B 、4C 、5D 、6 2.某车间20名工人年龄数据如下表:年龄(岁) 工人数(人)19 1 28 3 29 3 30 5 31 4 32 3 40 1 合计20知识三、用样本的数字特征估计总体的数字特征1.用样本的特征数估计总体的特征数 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数:样本数据的算术平均数,即12n 1(x +x +...+x )x n=. 在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 样本方差2222121[()()...()]n s x x x x x x n=-+-++- 标准差222121[()()...()]n s x x x x x x n=-+-++-其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.2.标准差是反映总体波动大小的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差.3.在频率直方图中,众数是最高的小长方形的底边的中点横坐标的值;中位数是所有小长方形的面积相等的分界线;平均数是各小长方形底边中点的横坐标与对应频率的积的和.4.平均数与方差都是重要的特征数,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,掌握公式不难求出,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【典型例题】【例1】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ) A .46,45,56 B .46,45,53 C .47,45,56 D .45,47,53【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.请说明理由;(3)估计居民月均用水量的中位数.【举一反三】1.某市高三学生数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为_____.2.(2022·新疆克拉玛依·三模(文))第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a 的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.【课堂巩固】1.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) A .众数 B .平均数 C .中位数 D .标准差2.某班学生一次数学考试成绩频率分布直方图如图所示,数据分组依次为]150,130[),130,110[),110,90[),90,70[,若成绩大于等于90分的人数为36,则成绩在)130,110[的人数为()A.12B.9C.15D.183.为了研究某药物的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.184.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为.【课后练习】正确率:__________1.某学校高一、高二、高三年级的学生人数之比为4:3:3,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则从高二年级抽取的学生人数为()A.15 B.20 C.25 D.302.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析。
2021届江西省高考理科数学总复习第68讲:用样本估计总体
2021届江西省高考理科数学总复习第68讲:用样本估计总体[最新考纲] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.常用统计图表(1)作频率分布直方图的步骤:①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(2)频率分布直方图:反映样本频率分布的直方图(如图)横轴表示样本数据,纵轴表示频率组距,每个小矩形的面积表示样本数据落在该组内的频率.各小矩形的面积和为1.(3)频率分布折线图和总体密度曲线①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(4)茎叶图的画法步骤:第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的右(左)侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把x =x 1+x 2+…+x n n称为x 1,x 2,…,x n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是s s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].[常用结论] 1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.一、思考辨析(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[答案] (1)√ (2)× (3)√ (4)×二、教材改编1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )A .4B .8C .12D .16B [设频数为n ,则n 32=0.25,∴n =32×14=8.]2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92A [∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5, 平均数x =87+89+90+91+92+93+94+968=91.5.] 3.甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为x -甲,x -乙,则下列判断正确的是( )。
高考数学复习考点知识讲解课件69 随机抽样、用样本估计总体
5.能从样本数据中提取基本的数字特征(如平均数、标准差),并做
出合理的解释.
6.会用样本的频率分布估计总体分布,会用样本的基本数字特征估
计总体的基本数字特征,理解用样本估计总体的思想.
7.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的
实际问题.
·考向预测·
考情分析:简单随机抽样、系统抽样、分层抽样在高考中极少单独
考查,有时与概率问题相结合出现在题目的已知条件中;频率分布直
方图、茎叶图等统计图表属于高考的常考内容,题型多为选择题,有
时也与概率相结合出现在解答题中.
学科素养:通过随机抽样、统计图表、数字特征考查数据分析、数
学运算的核心素养.
(1)简单随机抽样是一种不放回抽样.( √ )
(2)在抽签法中,先抽的人抽中的可能性较大.( × )
(3)一组数据的方差越大,说明这组数据的波动越大.( √ )
(4)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该
区间内的频率越大.( √ )
(5)频率分布表和频率分布直方图是一组数据频率分布的两种形式,
32 56 78 08 43 67 89 53 55 77 34 89 94 83 75
22 53 55 78 32 43 77 89 23 45
若从表中第5行第6列开始向右依次读取3个数据,则抽到的第5名员工的
编号是(
)
A.007 B.253 C.328 D.736
答案:A
3.[2023·蚌埠模拟]某市小学,初中,高中在校学生人数分别为7.5
解析:∵x1,x2,x3,…,xn的平均数为5,
x +x +x +⋯+xn
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第 1 页 共 7 页
2021年新高考数学总复习第68讲:用样本估计总体
1.(2020·云川贵百校联考)某课外小组的同学们从社会实践活动中调查了20户家庭某月的用电量,如下表所示:
用电量/度 120 140 160 180 200 户数
2
3
5
8
2
则这20A .180,170 B .160,180 C .160,170 D .180,160
答案 A
解析 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B 、C ;
将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.
2.在样本频率分布直方图中,共有9个小长方形,若中间一个小长方形的面积等于其他8个长方形的面积和的2
5,且样本容量为140,则中间一组的频数为( )
A .28
B .40
C .56
D .60
答案 B
解析 设中间一个小长方形面积为x ,其他8个长方形面积为52x ,因此x +52x =1,∴x =2
7.
所以中间一组的频数为140×2
7
=40.故选B.
3.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( ) A .46,45,56 B .46,45,53 C .47,45,56 D .45,47,53
答案 A
解析 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+47
2=46,众数
是45,极差为68-12=56.故选A.
4.(2020·武昌调研)某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均数为91,如图所示,该选手的7个得分的茎叶图有一个数据模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为( )。