2023年高考数学(理科)一轮复习——用样本估计总体
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第十章 算法初步、统计与统计案例
索引
考试要求
1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、 频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据 标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样 本的频率分布估计总体的频率分布,会用样本的基本数字特征估计 总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽 样的基本方法和样本估计总体的思想解决一些简单的实际问题.
B地区用户满意度评分的频率分布直方图
图②
索引
解 作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度 评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比 较集中,而A地区用户满意度评分比较分散.
索引
(2)根据用户满意度评分,将用户和满意度分为三个等级:
∴这 100 名参赛者得分的中位数为 60+0.50-.30.4×10≈63.3,故 C 错误.
索引
考点二 统计图表及应用 角度1 扇形图
例2 (2022·郑州模拟)某高中为了解学生课外知识的积累情况,随机抽取200名同 学参加课外知识测试,测试共5题道,每答对一题得20分,答错得0分.已知每 名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”; CB表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大.
a1+a2+…+an (3)平均数:把_________n_________称为a1,a2,…,an这n个数的平均数. (4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均数为-x,则这组数据 的标准差和方差分别是
s= n1[(x1-x-)2+(x2-x-)2+…+(xn--x)2], s2=n1[(x1--x)2+(x2-x-)2+…+(xn-x-)2].
索引
6.(易错题)若数据 x1,x2,x3,…,xn 的平均数-x=5,方差 s2=2,则数据 3x1
+1,3x2+1,3x3+1,…,3xn+1 的平均数和方差分别为_1_6_,___1_8_.
解析 ∵x1,x2,x3,…,xn的平均数为5, ∴3x1+1,3x2+1,3x3+1,…,3xn+1的平均数是3×5+1=16, ∵x1,x2,x3,…,xn的方差为2, ∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是91+2 92=91.5, 平均数-x=87+89+90+91+8 92+93+94+96=91.5.
索引
4.(易错题)已知一组数据的频率分布直方图如图,则众数是____6_5___,平均数 是____6_7___.
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化 B.这半年来,网民对该关键词相关的信息关注度不断减弱 C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差 D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值
解析 由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显 著,排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋 势不显著,排除B;由统计图可知,2019年10月该关键词的搜索指数波动较 大,11月的波动较小,所以2019年10月的方差大于11月的方差,排除C;由统 计图可知,2019年12月该关键词的搜索指数大多高于10 000,该月平均值大 于10 000,2020年1月该关键词的搜索指数大多低于10 000,该月平均值小于 10 000,选D.
索引
诊断自测
1.思考辨析(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的方差越大,说明这组数据越集中.( × )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率
越大.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,
解析 因为最高小长方形中点的横坐标为65,所以众数为65; 平 均 数-x= (55×0.030 + 65×0.040 + 75×0.015 + 85×0.010 + 95×0.005)×10 =67.
索引
5.(2021·新高考全国Ⅱ卷改编)下列统计量中,能度量样本x1,x2,…,xn的离散 程度的所有正确编号有__①___③___.
索引
感悟提升
1.频率分布直方图的性质. 频率
(1)小长方形的面积=组距×组距=频率; (2)各小长方形的面积之和等于 1;
频率 (3)小长方形的高=组矩. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
索引
训练1 (2021·江西省重点中学联考)江西省重点中学协作体于2021年进行了一次 校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在
索引
角度3 茎叶图
例4 (2022·西安模拟)中国数学奥林匹克由中国数学会主办,是全国中学生级别 最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹 克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,
则该集训队考试成绩的众数与中位数分别为( B )
A.85,75 C.74,76
得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是
(D )
A.20
B.40
C.64
D.80
解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为 400×0.05×4=80.
索引
3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中
位数和平均数分别是( A)
[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是( C )
A.得分在[40,60)之间的共有40人 B.从这100名参赛者中随机选取1人,其 得分在[60,80)的概率为0.5 C.这100名参赛者得分的中位数为65 D.可求得a=0.005
索引
解析 对于A,得分在[40,60)之间的有100×[1-(0.030+0.020+0.010)×10] =40(人),故A正确; 对于B,从这100名参赛者中随机选取1人,其得分在[60,80)的概率为(0.030 +0.020)×10=0.5,故B正确; 对于D,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故D正确; 对于C,得分在[40,60)的频率为(0.005+0.035)×10=0.4, 得分在[60,70)的频率为0.030×10=0.3,
①样本x1,x2,…,xn的标准差 ②样本x1,x2,…,xn的中位数 ③样本x1,x2,…,xn的极差 ④样本x1,x2,…,xn的平均数 解析 由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度; 由平均数的定义可知,平均数考查的是数据的集中趋势.故①③正确.
索引
(2)频率分布直方图:反映样本频率分布的直方图(如图)
频率 横轴表示样本数据,纵轴表示__组__距__,每个小矩形的面积表示样本落在该组 内的__频__率__.
索引
2.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从 茎的旁边生长出来的数.
索引
3.样本的数字特征 (1)众数:一组数据中__出__现__次___数__最__多__的那个数据,叫做这组数据的众数. (2)中位数:把n个数据按大小顺序排列,处于___最__中__间__位置的一个数据(或最 中间两个数据的平均数)叫做这组数据的中位数.
索引
考点突破 题型剖析
KAODIANTUPOTIXINGPOUXI
考点一 频率分布直方图
例1 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个 用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分 布直方图和B地区用户满意度评分的频数分布表. A地区用户满意度评分的频率分布直方图
内容 索引
知识诊断 基础夯实
考点突破 题型剖析
分层训练 巩固提升
知识诊断 基础夯实
ZHISHIZHENDUANJICHUHANGSHI
知识梳理 1.频率分布直方图
(1)频率分布表的画法: 极差
第一步:求_极__差___,决定组数和组距,组距=__组__数__; 第二步:__分__组__,通常对组内数值所在区间取左闭右开区间,最后一组取闭 区间; 第三步:登记频数,计算频率,列出频率分布表.
测试成绩百分比分布图如图所示,则下列说法正确的是( C )
A.该次课外知识测试及格率为90% B.该次课外知识测试得满分的同学有30名 C.该次测试成绩的中位数大于测试成绩的平均数 D.若该校共有3 000名学生,则课外知识测试成绩能 得优秀的同学大约有1 440名
索引
解析 由题图可知及格率为1-8%=92%,故A错误. 该次课外知识测试得满分同学占的百分比为1-8%-32%-48%=12%,则 得满分的同学有12%×200=24(名),故B错误. 中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分, 故C正确. 3 000×(48%+12%)=1 800(名),故D错误.
相同的数据可Байду номын сангаас只记一次.( × )
解析 (2)错误.方差越大,这组数据越离散. (4)错误.在茎叶图中,相同的数据叶要重复记录,故(4)错误.
索引
2.(2021·天津卷)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,
将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理
索引
角度2 折线图
例3 (2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的 次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数 越多,对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这 半年来某个关键词的搜索指数变化的统计图.
索引
根据该统计图判断,下列结论正确的是( D )
索引
常用结论
1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方 形的面积乘以小长方形底边中点的横坐标之和.
索引
2.平均数、方差的公式推广 (1)若数据 x1,x2,…,xn 的平均数为x-,那么 mx1+a,mx2+a,mx3+a,…, mxn+a 的平均数是 mx-+a. (2)数据 x1,x2,…,xn 的方差为 s2. ①数据 x1+a,x2+a,…,xn+a 的方差也为 s2; ②数据 ax1,ax2,…,axn 的方差为 a2s2.
B.85,76
D.75,77
索引
解析 由茎叶图知,出现的数据最多的是85,故众数为85; 由于数据总数为 14 个,故中位数为排序后第七个和第八个数据的平均数,即 75+2 77=76,故选 B.
图①
索引
B地区用户满意度评分的频数分布表
满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较
两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);
索引
考试要求
1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、 频率分布折线图、茎叶图,体会它们各自的特点;2.理解样本数据 标准差的意义和作用,会计算数据标准差;3.能从样本数据中提取 基本的数字特征(如平均数、标准差),并作出合理的解释;4.会用样 本的频率分布估计总体的频率分布,会用样本的基本数字特征估计 总体的基本数字特征,理解用样本估计总体的思想;5.会用随机抽 样的基本方法和样本估计总体的思想解决一些简单的实际问题.
B地区用户满意度评分的频率分布直方图
图②
索引
解 作出频率分布直方图如图:
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度 评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比 较集中,而A地区用户满意度评分比较分散.
索引
(2)根据用户满意度评分,将用户和满意度分为三个等级:
∴这 100 名参赛者得分的中位数为 60+0.50-.30.4×10≈63.3,故 C 错误.
索引
考点二 统计图表及应用 角度1 扇形图
例2 (2022·郑州模拟)某高中为了解学生课外知识的积累情况,随机抽取200名同 学参加课外知识测试,测试共5题道,每答对一题得20分,答错得0分.已知每 名同学至少能答对2道题,得分不少于60分记为及格,不少于80分记为优秀,
满意度评分 低于70分 70分到89分 不低于90分
满意度等级 不满意
满意
非常满意
估计哪个地区用户的满意度等级为不满意的概率大?说明理由.
解 A地区用户的满意度等级为不满意的概率大. 记CA表示事件:“A地区用户的满意度等级为不满意”; CB表示事件:“B地区用户的满意度等级为不满意”. 由直方图得P(CA)的估计值为(0.01+0.02+0.03)×10=0.6, P(CB)的估计值为(0.005+0.02)×10=0.25. 所以A地区用户的满意度等级为不满意的概率大.
a1+a2+…+an (3)平均数:把_________n_________称为a1,a2,…,an这n个数的平均数. (4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均数为-x,则这组数据 的标准差和方差分别是
s= n1[(x1-x-)2+(x2-x-)2+…+(xn--x)2], s2=n1[(x1--x)2+(x2-x-)2+…+(xn-x-)2].
索引
6.(易错题)若数据 x1,x2,x3,…,xn 的平均数-x=5,方差 s2=2,则数据 3x1
+1,3x2+1,3x3+1,…,3xn+1 的平均数和方差分别为_1_6_,___1_8_.
解析 ∵x1,x2,x3,…,xn的平均数为5, ∴3x1+1,3x2+1,3x3+1,…,3xn+1的平均数是3×5+1=16, ∵x1,x2,x3,…,xn的方差为2, ∴3x1+1,3x2+1,3x3+1,…,3xn+1的方差是32×2=18.
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
解析 这组数据由小到大排列为87,89,90,91,92,93,94,96, ∴中位数是91+2 92=91.5, 平均数-x=87+89+90+91+8 92+93+94+96=91.5.
索引
4.(易错题)已知一组数据的频率分布直方图如图,则众数是____6_5___,平均数 是____6_7___.
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化 B.这半年来,网民对该关键词相关的信息关注度不断减弱 C.从该关键词的搜索指数来看,2019年10月的方差小于11月的方差 D.从该关键词的搜索指数来看,2019年12月的平均值大于2020年1月的平均值
解析 由统计图可知,这半年来,该关键词的搜索指数变化的周期性并不显 著,排除A;由统计图可知,这半年来,该关键词的搜索指数的整体减弱趋 势不显著,排除B;由统计图可知,2019年10月该关键词的搜索指数波动较 大,11月的波动较小,所以2019年10月的方差大于11月的方差,排除C;由统 计图可知,2019年12月该关键词的搜索指数大多高于10 000,该月平均值大 于10 000,2020年1月该关键词的搜索指数大多低于10 000,该月平均值小于 10 000,选D.
索引
诊断自测
1.思考辨析(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的方差越大,说明这组数据越集中.( × )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率
越大.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,
解析 因为最高小长方形中点的横坐标为65,所以众数为65; 平 均 数-x= (55×0.030 + 65×0.040 + 75×0.015 + 85×0.010 + 95×0.005)×10 =67.
索引
5.(2021·新高考全国Ⅱ卷改编)下列统计量中,能度量样本x1,x2,…,xn的离散 程度的所有正确编号有__①___③___.
索引
感悟提升
1.频率分布直方图的性质. 频率
(1)小长方形的面积=组距×组距=频率; (2)各小长方形的面积之和等于 1;
频率 (3)小长方形的高=组矩. 2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
索引
训练1 (2021·江西省重点中学联考)江西省重点中学协作体于2021年进行了一次 校际数学竞赛,共有100名同学参赛,经过评判,这100名参赛者的得分都在
索引
角度3 茎叶图
例4 (2022·西安模拟)中国数学奥林匹克由中国数学会主办,是全国中学生级别 最高、规模最大、最具影响力的数学竞赛.某重点高中为参加中国数学奥林匹 克做准备,对该校数学集训队进行一次选拔赛,所得分数的茎叶图如图所示,
则该集训队考试成绩的众数与中位数分别为( B )
A.85,75 C.74,76
得到如下的频率分布直方图,则评分在区间[82,86)内的影视作品数量是
(D )
A.20
B.40
C.64
D.80
解析 由频率分布直方图可知,评分在区间[82,86)内的影视作品数量为 400×0.05×4=80.
索引
3.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中
位数和平均数分别是( A)
[40,90]之间,其得分的频率分布直方图如图,则下列结论错误的是( C )
A.得分在[40,60)之间的共有40人 B.从这100名参赛者中随机选取1人,其 得分在[60,80)的概率为0.5 C.这100名参赛者得分的中位数为65 D.可求得a=0.005
索引
解析 对于A,得分在[40,60)之间的有100×[1-(0.030+0.020+0.010)×10] =40(人),故A正确; 对于B,从这100名参赛者中随机选取1人,其得分在[60,80)的概率为(0.030 +0.020)×10=0.5,故B正确; 对于D,由(a+0.035+0.030+0.020+0.010)×10=1,解得a=0.005,故D正确; 对于C,得分在[40,60)的频率为(0.005+0.035)×10=0.4, 得分在[60,70)的频率为0.030×10=0.3,
①样本x1,x2,…,xn的标准差 ②样本x1,x2,…,xn的中位数 ③样本x1,x2,…,xn的极差 ④样本x1,x2,…,xn的平均数 解析 由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度; 由平均数的定义可知,平均数考查的是数据的集中趋势.故①③正确.
索引
(2)频率分布直方图:反映样本频率分布的直方图(如图)
频率 横轴表示样本数据,纵轴表示__组__距__,每个小矩形的面积表示样本落在该组 内的__频__率__.
索引
2.茎叶图 统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从 茎的旁边生长出来的数.
索引
3.样本的数字特征 (1)众数:一组数据中__出__现__次___数__最__多__的那个数据,叫做这组数据的众数. (2)中位数:把n个数据按大小顺序排列,处于___最__中__间__位置的一个数据(或最 中间两个数据的平均数)叫做这组数据的中位数.
索引
考点突破 题型剖析
KAODIANTUPOTIXINGPOUXI
考点一 频率分布直方图
例1 某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个 用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分 布直方图和B地区用户满意度评分的频数分布表. A地区用户满意度评分的频率分布直方图
内容 索引
知识诊断 基础夯实
考点突破 题型剖析
分层训练 巩固提升
知识诊断 基础夯实
ZHISHIZHENDUANJICHUHANGSHI
知识梳理 1.频率分布直方图
(1)频率分布表的画法: 极差
第一步:求_极__差___,决定组数和组距,组距=__组__数__; 第二步:__分__组__,通常对组内数值所在区间取左闭右开区间,最后一组取闭 区间; 第三步:登记频数,计算频率,列出频率分布表.
测试成绩百分比分布图如图所示,则下列说法正确的是( C )
A.该次课外知识测试及格率为90% B.该次课外知识测试得满分的同学有30名 C.该次测试成绩的中位数大于测试成绩的平均数 D.若该校共有3 000名学生,则课外知识测试成绩能 得优秀的同学大约有1 440名
索引
解析 由题图可知及格率为1-8%=92%,故A错误. 该次课外知识测试得满分同学占的百分比为1-8%-32%-48%=12%,则 得满分的同学有12%×200=24(名),故B错误. 中位数为80分,平均数为40×8%+60×32%+80×48%+100×12%=72.8分, 故C正确. 3 000×(48%+12%)=1 800(名),故D错误.
相同的数据可Байду номын сангаас只记一次.( × )
解析 (2)错误.方差越大,这组数据越离散. (4)错误.在茎叶图中,相同的数据叶要重复记录,故(4)错误.
索引
2.(2021·天津卷)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,
将所得400个评分数据分为8组:[66,70),[70,74),…,[94,98],并整理
索引
角度2 折线图
例3 (2021·昆明诊断)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的 次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数 越多,对该关键词相关的信息关注度也越高.如图是2019年9月到2020年2月这 半年来某个关键词的搜索指数变化的统计图.
索引
根据该统计图判断,下列结论正确的是( D )
索引
常用结论
1.频率分布直方图与众数、中位数、平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方 形的面积乘以小长方形底边中点的横坐标之和.
索引
2.平均数、方差的公式推广 (1)若数据 x1,x2,…,xn 的平均数为x-,那么 mx1+a,mx2+a,mx3+a,…, mxn+a 的平均数是 mx-+a. (2)数据 x1,x2,…,xn 的方差为 s2. ①数据 x1+a,x2+a,…,xn+a 的方差也为 s2; ②数据 ax1,ax2,…,axn 的方差为 a2s2.
B.85,76
D.75,77
索引
解析 由茎叶图知,出现的数据最多的是85,故众数为85; 由于数据总数为 14 个,故中位数为排序后第七个和第八个数据的平均数,即 75+2 77=76,故选 B.
图①
索引
B地区用户满意度评分的频数分布表
满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100]
频数
2
8
14
10
6
(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较
两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);