高考总动员高考数学大一轮复习 第9章 统计与统计案例学案 文 新人教版-新人教版高三全册数学学案

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第九章 统计与统计案例
第一节 随机抽样 [基础知识深耕]
一、简单随机抽样
1.设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
2.简单随机抽样的常用方法
最常用的简单随机抽样有抽签法和随机数法:
(1)抽签法:把总体中的N 个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n 次,就得到一个容量为n 的样本.
(2)随机数法:利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫做随机数法. 二、系统抽样
假设要从容量为N 的总体中抽取容量为n 的样本. 1.先将总体的N 个个体编号.
2.确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =N n ,当N n
不是整数时,随机从总体中剔除余数,再取k =⎣⎢⎡⎦
⎥⎤N n . 3.在第1段用简单随机抽样确定第一个个体编号l (l ≤k ).
4.按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ),依次进行下去,直到获取整个样本.
这种抽样方法是一种系统抽样. 三、分层抽样
1.定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
2.应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样. 【方法技巧】 分层抽样中的比例关系 (1)抽样比=样本容量个体总量=各层样本容量
各层个体数量

(2)层1的数量∶层2的数量∶层3的数量=样本1的容量∶样本2的容量∶样本3的容量.
[基础能力提升]
1.给出下列命题正确的是( )
①简单随机抽样是一种不放回抽样;
②简单随机抽样每个个体被抽到的机会不一样,与先后有关;
③系统抽样在起始部分抽样时采用简单随机抽样;
④要从1 002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平;
⑤分层抽样中,每个个体被抽到的可能性与层数及分层有关.
A.①②③④⑤B.①②④⑤
C.①③④⑤D.①③
【解析】简单随机抽样是不放回地、等可能抽样,故②④⑤错误.
【答案】 D
2.将参加英语口语测试的1 000名学生编号为000,001,002,…,999,从中抽取一个容量为50的样本,按系统抽样的方法分为50组,如果第一组编号为000,001,002,…,019,且第一组随机抽取的编号为015,则抽取的第35个编号为( ) A.700 B.669
C.695 D.676
【解析】第35个编号为15+(35-1)×20=695.
【答案】 C
3.要完成下列两项调查:
①从某社区125户高收入家庭,280户中等收入家庭,95户低收入家庭中选出100户调查社会购买力的某项指标;
②从某中学的15名艺术特长生中选出3人调查学习负担情况.宜采用的抽样方法依次为( )
A.①简单随机抽样法,②系统抽样法
B.①分层抽样法,②简单随机抽样法
C.①系统抽样法,②分层抽样法
D.①②都用分层抽样法
【解析】①中由于收入差别较大,宜于用分层抽样,
②中个数较少,宜于用简单随机抽样.
【答案】 B
4.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A 型产品有16件,那么此样本容量n=________.
【解析】依题意A、B、C三种不同型号样本个数之比为2∶3∶5,∴样本中B型产品有24件,C型产品有40件,∴n=16+24+40=80.
【答案】80
三种抽样方法的区别与联系
类别共同点各自特点相互联系适用范围
简单随
机抽样
①抽样过程中每个个
体被抽到的可能性相
等;②每次抽出个体
后不再放回,即不放
回抽样从总体
中逐个
抽取
最基本的抽样方

总体中
的个体
数较少
系统抽样将总体均分成几部分,按事先
确定的规则在各部分抽取
在起始部分抽样
时采用简单随机
抽样
总体中的个体数
较多
分层抽样将总体分成几层,按比例分层
进行抽取
在每一层抽样时
采用简单随机抽
样或系统抽样
总体由差异明显
的几部分组成第二节用样本估计总体
[基础知识深耕]
一、用样本的频率分布估计总体分布
1.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差. (2)确定组距与组数. (3)将数据分组.
(4)列频率分布表.落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.计算各小组的频率,列出频率分布表.
(5)画频率分布直方图.依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积=组距×频率
组距
=频率.
这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于1. 2.频率分布折线图和总体密度曲线
(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 用茎叶图刻画数据有两个优点: a .所有的信息都可以从图中得到;
b .茎叶图便于数据的记录和表示,能够展示数据的分布情况. 但当样本数据较多或数据位数较多时,茎叶图就显得不太方便. 二、用样本的数字特征估计总体的数字特征 1.众数、中位数、平均数
定义
特点
众数
在一组数据中出现次数最多的数据
体现了样本数据的最大集中点,不受极端值的影响,而且不
唯一
中位数
将一组数据按大小顺序依次排列,处在最中间位置的一个数
据(或最中间两个数据的平均数)
中位数不受极端值的影响,仅利用了排在中间数据的信息,
只有一个
平均数
样本数据x 1,x 2,…,x n 的算术平均数x =
x 1+x 2+…+x n
n
与每一个样本数据有关,只有一个
2.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:
s =
1n
[
x 1-x
2
+x 2-x
2
+…+x n -x
2
].
(3)方差:s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2
](x n 是样本数据,n 是样本容量,x 是样本平均数).
【拓展延伸】 平均数、方差的公式推广
(1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a.
(2)数据x1,x2,…,x n的方差为s2.
①数据x1+a,x2+a,…,x n+a的方差也为s2;
②数据ax1,ax2,…,ax n的方差为a2s2.
[基础能力提升]
1.给出下列命题,正确的是( )
①在频率分布直方图中,小矩形的高表示频率;
②频率分布直方图中各个长方形的面积之和为1;
③茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次;
④在频率分布直方图中,最高的小长方形底边中点的横坐标是众数;
⑤在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.
A.①②③④⑤B.①②
C.②③④D.②④
【解析】只有②④正确,①③⑤均错误.
【答案】 D
2.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图9­2­1中可以看出被处罚的汽车大约有( )
A.30辆B.40辆 C.60辆D.80辆
图9­2­1
【解析】由题图可知,车速大于或等于70 km/h的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆).【答案】 B
3.若某校高一年级8个班参加合唱比赛的得分如茎叶图9­2­2所示,则这组数据的中位数
图9­2­2
和平均数分别是( )
A.91.5和91.5
B.91.5和92
C.91和91.5
D.92和92
【解析】 这组数据由小到大排列为87,89,90,91,92,93,94,96. ∴中位数是91+92
2
=91.5.
平均数x =87+89+90+91+92+93+94+96
8=91.5.
【答案】 A
4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2
=________. 【解析】 x =10+6+8+5+6
5
=7,
s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=165
=3.2.
【答案】 3.2
1.两点注意
(1)频率分布直方图与条形统计图不同.
(2)①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量,与每个样本数据有关,这是中位数、众数所不具有的性质.
②标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大. 2.三个特征
利用频率分布直方图估计样本的数字特征:
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值. (2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和. (3)众数:最高的矩形的中点的横坐标.
第三节 变量间的相关关系、统计案例
[基础知识深耕]
一、相关关系与回归方程 1.相关关系的分类
(1)正相关:从散点图上看,点散布在从左下角到右上角的区域内. (2)负相关:从散点图上看,点散布在从左上角到右下角的区域内. 2.线性相关关系
从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程
(1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x +a ^,则b ^

∑n
i =1
x i -x y i -y
∑n
i =1
x i -x 2

∑n
i =1x i y i -n x y
∑n
i =1x 2i -n x
2
,a ^=y -b ^x ,其中,b ^是回归方程的回归系数,a ^
是在y 轴上的截距,(x ,y )是样
本点的中心.
4.样本相关系数
r =
∑n
i =1
x i -x
y i -y
∑n
i =1
x i -x
2
∑n
i =1
y i -y
2
,用它来衡量两个变量间的线性相关关系.
(1)当r >0时,表明两个变量正相关; (2)当r <0时,表明两个变量负相关;
(3)r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系.
二、独立性检验 1.2×2列联表
假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表)为:
y 1 y 2 总计
x 1 a b a +b x 2
c d c +d 总计
a +c
b +d
a +
b +
c +d
2.K 2
统计量
K 2

n ad -bc 2
a +b
c +
d a +c
b +d
(其中n =a +b +c +d 为样本容量).
[基础能力提升]
1.已知x ,y 的取值如表所示:
如果y 与x 呈线性相关,且回归方程为y ^=b ^x +72,则b ^
等于( )
A .-12 B.12 C .-110 D.110
【解析】 ∵x =
2+3+43=3,y =5+4+6
3
=5. ∴5=3b ^+72,∴b ^=1
2.
【答案】 B
2.两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的R 2
如下,其中拟合效果最好的模型是( )
A.模型1
【解析】 ∵0.98>0.80>0.50>0.25, ∴模型1最好. 【答案】 A
3.下面是2×2列联表:
则表中a ,b 的值分别为( ) A .94,72 B .52,50 C .52,74
D .74,52
【解析】 ∵a +21=73,∴a =52. 又a +22=b ,∴b =74. 【答案】 C
4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K 2
的观测值k =27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(填“有关”或“无关”).
【解析】 ∵k =27.63>6.635,
∴有99%的把握认为“打鼾与患心脏病有关”.
【答案】有关
1.一个区别——相关关系与函数关系
函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点注意——回归分析与独立性检验的有效性
(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.
(2)根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.
(3)独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.。

相关文档
最新文档