高考数学二轮复习-统计与统计案例知识点总结
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计与统计案例
1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.
2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题.
1.随机抽样
(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.
(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表
(1)频率分布直方图 ①小长方形的面积=组距×
频率
组距
=频率; ②各小长方形的面积之和等于1;
③小长方形的高=频率组距,所有小长方形的高的和为1
组距.
(2)茎叶图
在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数
(2)方差:s 2=n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2
].
标准差:
s =
1n
[ x 1-x 2+ x 2-x 2+…+ x n -x 2
].
4.变量的相关性与最小二乘法
(1)相关关系的概念、正相关和负相关、相关系数.
(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q
= i =1
n
(y i -a -bx i )2
最小时,得到线性回归方程y ^
=b ^
x +a ^
的方法叫做最小二乘法.
5.独立性检验
对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:
则K 2
=n a +b c +d a +c b +d
(其中n =a +b +c +d 为样本容量).
考点一 抽样方法
例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机
编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为
( )
A .7
B .9
C .10
D .15
答案 C
解析 由系统抽样的特点知:抽取号码的间隔为
960
32
=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.
在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分
成几个组,则分段间隔即为N
n
(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,
都等于样本容量和总体容量的比值.
(1)(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为
( )
(2)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.
答案(1)D (2)37 20
解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.
(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,即第n组抽取的号码为5n-3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200×0.5=100,
则应抽取的人数为40
200
×100=20人.
考点二用样本估计总体
例2 (1)(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是
( )
(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:
答案(1)A (2)2
解析(1)由于频率分布直方图的组距为5,去掉C、D,又[0,5),[5,10)两组各一人,
去掉B ,应选A.
(2)x 甲=1
5
(87+91+90+89+93)=90,
x 乙=1
5
(89+90+91+88+92)=90,
s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2
]=4,
s 2乙=15
[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2
]=2.
(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.
(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.
在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:
(1)求参赛总人数和频率分布直方图中[80,90)之间的矩形的高,并完成直方图; (2)若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90,100]之间的概率.
解 (1)由茎叶图知,分数在[50,60)之间的频数为2. 由频率分布直方图知,分数在[50,60)之间的频率为 0.008×10=0.08.
所以参赛总人数为20.08
=25(人).
分数在[80,90)之间的人数为25-2-7-10-2=4(人), 分数在[80,90)之间的频率为
4
25
=0.16, 得频率分布直方图中[80,90)间矩形的高为0.16
10=0.016.
完成直方图,如图.
(2)将[80,90)之间的4个分数编号为1,2,3,4;[90,100]之间的2个分数编号为5和6. 则在[80,100]之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),