统计二轮复习教案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学案
一.随机抽样
(一)总体、个体、样本
把所考察对象的某一数值指标的全体构成的集合看成总体,构成总体的每一个元素为个体.从总体中随机抽取若干个个体构成的集合叫做总体的一个样本. (二)抽样方法 1.简单随机抽样
(1)定义:设一个总体含有N 个个体,从中不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时,总体内的各个个体被抽到的机会都相等,称这种抽样方法为简单随机抽样. (2)简单随机抽样的特点如下:
①它要求被抽取样本的总体中个体数有限.②它是从总体中逐个地进行抽取.
③它是一种不放回抽样.④它每一次抽取时,总体中的各个个体有相同的可能性被抽到. (3)常用的简单随机抽样方法 ①抽签法
先将总体中的所有N 个个体编号,并把号码写在形状、大小相同的号签上,然后将这些号签放在同一个容器里,搅拌均匀.抽签时,每次从中抽出1个号签,连续抽取n 次,就得到一个容量为n 的样本.
抽签法的优点是简单易行.缺点是当总体的容量非常大时,费时、费力又不方便.况且,如果号签搅拌得不均匀,可能导致抽样的不公平. ②随机数表法
a .随机数表:随机数表是由0,1,2,…,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.
b .用随机数表抽样的步骤:第一步:将总体中的个体编号.为了保证抽取样本有很好的代表性,编号时位数要相同.
第二步:选定开始的数字.为了保证所选定数字的随机性,应在面对随机数表之前就指出开始数字的纵横位置.
第三步:获取样本号码.随机确定一个读数方向,读数的方向可以向右,也可以向左、向上、向下等,重复的号码跳过. 2.系统抽样
(1)定义:当总体元素个数很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样,也称作等距抽样.
(2)系统抽样的步骤:
①编号.采用随机的方式将总体中的个体编号.②分段.先确定分段的间隔k .当N
n (N 为总
体中的个体数,n 为样本容量)是整数时,k =N n ;当N
n
不是整数时,通过从总体中随机剔除
一些个体使剩下的总体中个体总数N ′能被n 整除,这时k =N ′
n .③确定起始个体编号.在
第1段用简单随机抽样确定起始的个体编号S .④按照事先确定的规则抽取样本.通常是将S 加上间隔k ,得到第2个个体编号S +k ,再将(S +k )加上k ,得到第3个个体编号S +2k ,这样继续下去,获得容量为n 的样本.其样本编号依次是:S ,S +k ,S +2k ,…,S +(n -1)k .
3.分层抽样
(1)定义:当总体由有明显差别的几部分组成时,按某种特征在抽样时将总体中的各个个体分成互不交叉的层,然后按照各层在总体中所占的比例,从各层独立地抽取一定数量的个体合在一起作为样本,这种抽样的方法叫做分层抽样.分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体中所占比例抽取.分层抽样要求对总体的内容有一定的了解,明确分层的界限和数目,分层要恰当.各层抽取时采用简单随机抽样或系统抽样. (2)分层抽样的步骤
①分层;②按比例确定每层抽取个体的个数;③各层抽样(方法可以不同);④汇合成样本. (3)分层抽样的优点
分层抽样充分利用了己知信息,充分考虑了保持样本结构与总体结构的一致性.使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用.
练1.(2010·安徽文,14)某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普遍家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是____________.
练2.将一个总体为100的个体编号为0,1,2,3…,99,并依次将其分为10个小组,组号
为0,1,…,9,要用系统抽样的方法抽取一个容量为10的样本,规定如果在第0组(号码为0~9)随机抽取的号码为2,则所抽取的10个号码为 .
练3.[2010年高考湖北卷]将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为 ( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9
练4.一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本
的频率分布直方图(如下图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在(2500,3000)(元)月收入段应抽出的人数为( )
A .25
B .30
C .35
D .40
二.用样本估计总体
1.编制频率分布直方图的步骤如下:
①求极差:极差是一组数据的最大值与最小值的差.
②决定组距和组数:当样本容量不超过100时,常分成5~12组.组距=极差
组数.
③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可以将样本数据多取一位小数分组;
④列频率分布表:登记频数,计算频率,列出频率分布表.
将样本数据分成若干小组,每个小组内的样本个数称作频数,频数与样本容量的比值叫做这一小组的频率.频率反映数据在每组所占比例的大小.
⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的频率
组距,这样得出一系列的矩形,每个矩形的面积恰好是该组上的
频率.这些矩形就构成了频率分布直方图.
在频率分布直方图中,纵轴表示“频率/组距”,数据落在各小组内的频率用小矩形的面积表示,各小矩形的面积总和等于1. 2.频率分布折线图
(1)把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图. (2)总体密度曲线