高考数学二轮复习-统计与统计案例知识点总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计与统计案例

1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.

2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题.

1.随机抽样

(1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多.

(3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表

(1)频率分布直方图 ①小长方形的面积=组距×

频率

组距

=频率; ②各小长方形的面积之和等于1;

③小长方形的高=频率组距,所有小长方形的高的和为1

组距.

(2)茎叶图

在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征

(1)众数、中位数、平均数

(2)方差:s 2=n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2

].

标准差:

s =

1n

[ x 1-x 2+ x 2-x 2+…+ x n -x 2

].

4.变量的相关性与最小二乘法

(1)相关关系的概念、正相关和负相关、相关系数.

(2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q

= i =1

n

(y i -a -bx i )2

最小时,得到线性回归方程y ^

=b ^

x +a ^

的方法叫做最小二乘法.

5.独立性检验

对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:

则K 2

=n a +b c +d a +c b +d

(其中n =a +b +c +d 为样本容量).

考点一 抽样方法

例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机

编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为

( )

A .7

B .9

C .10

D .15

答案 C

解析 由系统抽样的特点知:抽取号码的间隔为

960

32

=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.

在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分

成几个组,则分段间隔即为N

n

(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

都等于样本容量和总体容量的比值.

(1)(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为

( )

(2)某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.

答案(1)D (2)37 20

解析(1)从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.

(2)由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,即第n组抽取的号码为5n-3,所以第8组抽出的号码为37;40岁以下年龄段的职工数为200×0.5=100,

则应抽取的人数为40

200

×100=20人.

考点二用样本估计总体

例2 (1)(2013·四川)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是

( )

(2)(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:

答案(1)A (2)2

解析(1)由于频率分布直方图的组距为5,去掉C、D,又[0,5),[5,10)两组各一人,

去掉B ,应选A.

(2)x 甲=1

5

(87+91+90+89+93)=90,

x 乙=1

5

(89+90+91+88+92)=90,

s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2

]=4,

s 2乙=15

[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2

]=2.

(1)反映样本数据分布的主要方式有:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

在“2012魅力新安江”青少年才艺表演评比活动中,参赛选手成绩的茎叶图和频率分布直方图都受到不同程度的破坏,可见部分如图,据此回答以下问题:

(1)求参赛总人数和频率分布直方图中[80,90)之间的矩形的高,并完成直方图; (2)若要从分数在[80,100]之间任取两份进行分析,在抽取的结果中,求至少有一份分数在[90,100]之间的概率.

解 (1)由茎叶图知,分数在[50,60)之间的频数为2. 由频率分布直方图知,分数在[50,60)之间的频率为 0.008×10=0.08.

所以参赛总人数为20.08

=25(人).

分数在[80,90)之间的人数为25-2-7-10-2=4(人), 分数在[80,90)之间的频率为

4

25

=0.16, 得频率分布直方图中[80,90)间矩形的高为0.16

10=0.016.

完成直方图,如图.

(2)将[80,90)之间的4个分数编号为1,2,3,4;[90,100]之间的2个分数编号为5和6. 则在[80,100]之间任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),

相关文档
最新文档