统计(知识点汇总)大全
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章统计(知识点汇总)
2.1随机抽样
1、总体、个体、样本、总体容量、样本容量
我们把研究对象的全体叫做总体,把每个研究对象叫做个体,把从总体中随机抽取若干个个体构成的集合叫做总体的一个样本,把总体中的个体总数叫做总体容量,把样本中的个体总数叫做样本容量。
2、随机抽样
抽样时保持每一个个体都可能被抽到,每一个个体被抽到的机会是相等的,满足这样条件的抽样时随机抽样。
3、简单随机抽样
(1)定义:一般地,设一个总体有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,则这种抽样方法叫做简单随机抽样.
(2)简单随机抽样的主要特点
①总体的个体数有限;
②样本的抽取是逐个进行的,每次只抽取一个个体;
③抽取的样本不放回,样本中无重复个体;
④每个个体被抽到的机会都相等,抽样具有公平性.
(3)简单随机抽样常用的方法:
①抽签法;②随机数表法;③计算机模拟法;④使用统计软件直接抽取。
(4)抽签法的操作步骤:
第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.
第二步,将号签放在一个容器中,并搅拌均匀
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.(5)抽签法的优点和缺点:
优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.
缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大;误差相比其它抽样也比较大。
(6)利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本抽样步骤:
第一步,将总体中的所有个体编号.
第二步,在随机数表中任选一个数作为起始数.
第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n 的样本.
4、系统抽样
(1)定义:一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.
(2)由系统抽样的定义可知系统抽样有以下特征:
①当总体容量N较大时,采用系统抽样。
②将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,
系统抽样又称等距抽样,间隔一般为n
N k
. ③预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号s ,在此编号的基础上加上分段间隔的整倍数即为抽样编号 (3)系统抽样的一般步骤 一般地,用系统抽样从含有N 个个体的总体中抽取一个容量为n 的样本,其操作步骤是:
第一步,将总体的N 个个体编号.
第二步,确定分段间隔k ,对编号进行分段.
第三步,在第1段用简单随机抽样确定起始个体编号s.
第四步,按照一定的规则抽取样本.其样本编号依次是s ,s+k ,s+2k ,s+3k …s+(n-1)k 。
(4)注意剔除:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,应先从总体中随机剔除5个个体,再均衡分成60部分. 5、分层抽样
(1)定义:若总体由差异明显的几部分组成,抽样时,先将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,再将各层取出的个体合在一起作为样本,这样的抽样叫做分层抽样. 所以分层抽样又称类型抽样.
(2)应用分层抽样应遵循以下要求: ①分层:将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。
②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。 (3)分层抽样的一般操作步骤是:
第一步,计算样本容量与总体的个体数之比.
第二步,将总体分成互不交叉的层,按比例确定各层要抽取的个体数. 第三步,用简单随机抽样或系统抽样在各层中抽取相应数量的个体. 第四步,将各层抽取的个体合在一起,就得到所取样本 (4)分层抽样的优点: 分层抽样时,每个个体被抽到的机会是均等的,由于分层抽样充分利用了已知信息,充分考虑了保持样本结构与总体结构的一致性,使样本具有较好的代表性,而且在各层抽样时,可以根据具体情况采取不同的抽样方法,因此分层抽样在实践中有着非常广泛的应用。
6、简单随机抽样、系统抽样和分层抽样三种抽样的比较
2.2用样本估计总体 我们把样本抽取后,要对样本进行分析来研究总体的分布情况,对样本进行分析常采取两种方式:⑴编制频率分布直方图; ⑵做频率分布折线图. 1、编制频率分布直方图的步骤:
①求极差:样本中的最大值与最小值的差; ②决定组距与组数:组距
极差
组数
; ③将数据分组:通常对组内数值所在区间取左闭右开区间,最后一组取闭区间,也可将样本数据多取一位小数分组;
④列频率分布表:登记频数,计算频率,列出频率分布表;将样本数据分成若干小组,每个小组内的样本个数称为频数,频数与样本容量的比值叫做这一小组的频率,频率反映数据在每组所占比例的大小;
⑤绘制频率分布直方图:把横轴分成若干段,每一段对应一个组距,然后以线段为底作一矩形,它的高等于该组的
组距
频率
,这样得出一系列的矩形,每个矩形的面积恰好是该组上的频率,这些矩形就构成了频率分布直方图。 注意:根据频率分布表做频率分布直方图应注意两点: ①纵轴的意义:
组距
频率
; ②横轴的意义:样本内容(每个矩形下面是组距);
共同方法适应范围
相互联系
抽样特征
特点
类别
简单随机抽样系统抽样
分层抽样
抽样过程中每个个体被抽取的概率相等
将总体分成均衡几部分,按规则关联抽取将总体分成几层,按比例分层抽取
用简单随机抽样抽取起始号码
总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成
从总体中逐个不放回抽取用简单随机抽样或系统抽样对各层抽样