高考必备-2020年高考数学一轮复习对点提分专题9.2 用样本估计总体及统计图表 (文理科通用)(学生版)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九篇 统计
专题9.02 用样本估计总体及统计图表
【考试要求】
1.能根据实际问题的特点,选择恰当的统计图表对数据进行可视化描述,体会合理使用统计图表的重要性;
2.能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义;
3.能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义;
4.了解样本估计总体的取值规律;
5.能用样本估计百分位数,理解百分位数的统计含义. 【知识梳理】 1.频率分布直方图 (1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=极差
组数

第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. (2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示频率
组距,每个小矩形的面积表示样本落在该组内的频率.
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把a 1+a 2+…+a n
n
称为a 1,a 2,…,a n 这n 个数的平均数.
(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -
,则这组数据的标准差和方差分别是 s =1n
[(x 1-x -)2+(x 2-x -)2
+…+(x n -x -
)2], s 2=
1n
[(x 1-x -)2+(x 2-x -)2
+…+(x n -x -
)2]. 4.百分位数
如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.可表示为:一组n 个观测值按数值大小排列.如,处于p %位置的值称第p 百分位数. 【微点提醒】
1.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x 1,x 2,…,x n 的平均数为x -
,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是mx -
+a . (2)数据x 1,x 2,…,x n 的方差为s 2.
①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2. 3.中位数相当于第50百分位数.
【疑误辨析】
1.判断下列结论正误(在括号内打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (2)一组数据的方差越大,说明这组数据越集中.( )
(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.( )
【教材衍化】
2.(必修3P1002(1)改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A.4
B.8
C.12
D.16
3.(必修3P70示例改编)若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是()
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
【真题体验】
4.(2018·全国Ⅰ卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如图所示的饼图:
则下面结论中不正确的是()
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
5.(2019·新余二模)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()
A.是否倾向选择生育二胎与户籍有关
B.是否倾向选择生育二胎与性别无关
C.倾向选择生育二胎的人员中,男性人数与女性人数相同
D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数
6.(2019·上海黄浦区质检)已知样本容量为200,在样本的频率分布直方图中,共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积和的1
3,则该组的频数为________.
【考点聚焦】
考点一 频率分布直方图
【例1】 (2019·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x ;
(2)求抽取的x 人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
【规律方法】 1.频率分布直方图的性质. (1)小长方形的面积=组距×
频率
组距
=频率; (2)各小长方形的面积之和等于1;
(3)小长方形的高=频率组矩,所有小长方形的高的和为1
组距.
2.要理解并记准频率分布直方图与众数、中位数及平均数的关系.
【训练1】 某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频率分布表. A 地区用户满意度评分的频率分布直方图
图①
B 地区用户满意度评分的频率分布表
满意度评分分组 [50,60)
[60,70)
[70,80) [80,90) [90,100]
频数
2
8
14
10
6
(1)及分散程度(不要求计算出具体值,给出结论即可); B 地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户和满意度分为三个等级: 满意度评分 低于70分 70分到89分
不低于90分 满意度等级
不满意
满意
非常满意
考点二 样本的数字特征
【例2】 (1)(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A.x 1,x 2,…,x n 的平均数 B.x 1,x 2,…,x n 的标准差 C.x 1,x 2,…,x n 的最大值
D.x 1,x 2,…,x n 的中位数
(2)(2019·聊城模拟)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为
x -
,方差为s 2,则( )
A.x -
=4,s 2<2
B.x -
=4,s 2>2
C.x -
>4,s 2<2
D.x -
>4,s 2>2
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
【训练2】抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
【反思与感悟】
1.用样本估计总体是统计的基本思想.
用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.
2.(1)众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
(2)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大.
3.频率分布表和频率分布直方图都可直观描述样本数据的分布规律.
【易错防范】
直方图与条形图不要搞混
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
【核心素养提升】
【数据分析】——百分位数的统计含义
1.数据分析是指针对研究对象获取数据,运用数学方法对数据进行整理、分析和推断,形成关于研究对象知识的素养.数据分析过程主要包括:收集数据,整理数据,提取信息,构建模型,进行推断,获得结论.
2.数据分析是研究随机现象的重要数学技术,是大数据时代数学应用的主要方法,也是“互联网+”相关领域的主要数学方法,数据分析已经深入到科技术、工程和现代社会生活的各个方面.
3.数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论,概括和形成知识.
4.百分位数是统计学述语,百分位数用于描述一组数据某一百分位置的水平,多个百分位数结合应用,可
全面描述一组观察值的分布特征;百分位数还可用于确定非正态分布资料的医学参考值范围.但应用百分位数时,样本含量要足够大,否则不宜取太靠近两端的百分位数.
【案例】阶梯电价的设计(此材料见2017版课程标准P130)
【情境】为了实现绿色发展,避免浪费能源,某市政府计划对居民用电采用阶梯收费的方法.为此,相关部门在该市随机调查了200户居民六月份的用电量(单位:kW·h),以了解这个城市家庭用电量的情况.数据如下:
10710178992081277422331131
214 135 89 66 60 115 189 135 146 127
203 97 96 62 65 111 56 151 106 8
162 91 67 93 212 159 61 63 178 194
194 216 101 98 139 78 110 192 105 96
22 50 138 251 120 112 100 201 98 84
137 203 260 134 156 61 70 100 72 164
174 131 93 100 163 80 76 95 152 182
88 247 191 70 130 49 114 110 163 202
265 18 94 146 149 147 177 339 57 109
107 182 101 148 274 289 82 213 165 224
142 61 108 137 90 254 201 83 253 113
130 82 170 110 108 63 250 237 120 84
154 288 170 123 172 319 62 133 130 127
107 71 96 140 77 106 132 106 135 132
167 82 258 542 51 107 69 98 72 48
109 134 250 42 320 113 180 144 116 530
200 174 135 160 462 139 133 304 191 283
121 132 118 134 124 178 206 626 120 274
141 80 187 88 324 136 498 169 77 57
根据以上数据,应当如何确定阶梯电价中的电量临界值,才能使得电价更为合理?
【评析】分位数是用于衡量数据的位置的量度,但它所衡量的,不一定是中心位置.百分位数提供了有关各数据项如何在最小值与最大值之间分布的信息.对于无大量重复的数据,第p百分位数将它分为两个部分.大约有p%的数据项的值比第p百分位数小;而大约有(100-p)%的数据项的值比第p百分位数大.对第p百分位数,严格的定义如下:
第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值.
【案例应用1】对于考试成绩的统计,如果您的成绩处在95的百分位数上,则意味着95%的参加考试者得到了和您一样的考分或还要低的考分,而不是您答对了95%的试题.也许您只答对了20%,即使如此,您取得的成绩也与95%的参加考试者一样好,或者比95%的参加考试者更好.
【案例应用2】假设想为退休存够钱.可创建一个包括所有不确定变量的模型,如投资年回报率、通货膨胀、退休时的开支等,得到概率分布的结果如下图所示,如果选择平均值,钱不够的概率就会有50%.所以选第90百分位数所对应的投资数,这样钱不够的概率将只有10%.
【分层训练】
【基础巩固题组】(建议用时:40分钟)
一、选择题
1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()
A.45
B.50
C.55
D.60
2.甲、乙、丙、丁四人参加某运动会射击项目的选拔赛,四人的平均成绩和方差如下表所示:
甲 乙 丙 丁 平均环数x -
8.3 8.8 8.8 8.7 方差s 2
3.5
3.6
2.2
5.4
( ) A.甲 B.乙
C.丙
D.丁
3.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
A.甲的成绩的平均数小于乙的成绩的平均数
B.甲的成绩的中位数等于乙的成绩的中位数
C.甲的成绩的方差小于乙的成绩的方差
D.甲的成绩的极差小于乙的成绩的极差
4.(2019·茂名联考)甲组数据为:5,12,16,21,25,37,乙组数据为:1,6,14,18,38,39,则甲、乙的平均数、极差及中位数相同的是( ) A.极差 B.平均数 C.中位数
D.都不相同
二、填空题
5.某校女子篮球队7名运动员身高(单位:cm)的数据分别为:171,172,17x ,174,175,180,181,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.
6.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:
(1)[25,30)年龄组对应小矩形的高度为________;
(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)的人数为________.
7.已知样本数据x 1,x 2,…,x n 的平均数x -
=5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________.
三、解答题
8.某校2019届高三文(1)班在一次数学测验中,全班N 名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生有14人.
(1)求总人数N和分数在120~125的人数n;
(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数各是多少?
9.(2017·北京卷)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:
(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
【能力提升题组】(建议用时:20分钟)
10.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x (个)为每天商品的销量,y (元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率是( )
A.19
B.110
C.15
D.18
11.(2019·北京海淀区模拟)已知样本x 1,x 2,…,x n 的平均数为x ;样本y 1,y 2,…,y m 的平均数为y (x ≠y ),
若样本x 1,x 2,…,x n ,y 1,y 2,…,y m 的平均数z =ax +(1-a )y ,其中0<a <12
,则n ,m (n ,m ∈N *)的大小关系为( )
A.n =m
B.n ≥m
C.n <m
D.n >m
12.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.
13.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:
质量指标值
[75,85)[85,95)[95,105)[105,115)[115,125] 分组
频数62638228
(1)
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?。

相关文档
最新文档