统计学原理第六章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章抽样估计
学习要点:学习本章要求掌握抽样推断的基本概念和一般原理,抽样误差的形成、计算抽样误差及如何估计总体的平均指标和成数指标。
§1、抽样推断的一般问题
§2、抽样误差
§3、抽样估计的方法
§4、抽样组织设计
§1、抽样推断的一般问题
一、抽样推断的概念:
1、抽样推断是按照随机原则从总体中抽取一部分总体单位作为样本单位,组成样本总体,并以样本的数量特征对总体的数量特征做出具有一定可靠程度的估计和推断的统计分析方法。
2、抽样推断原因:
实际工作中许多现象不可能对总体的所有单位进行调查只能组织抽样调查。
3、抽样推断的特点:
•抽样推断是用样本指标值来估计总体指标值
•抽样的随机原则是抽样推断的前提。
•抽样推断的误差可以事先计算并加以控制。
总之,抽样推断的中心问题是如何根据已知的部分资料来推断未知的总体情况。
例如:根据对我国1%人口的抽查调查,汇总出全国总人口及其结构的主要数据;根据少数职工家庭生活情况的调查资料,推算全国职工生活的实际水平等。
4、抽样推断的作用
在统计实践中,主要表现为以下几个方面
(1)调查具有破坏性场合
(2)对无限总体或总体规模非常大的场合进行调查。
(3)不必要进行全面调查但又需要知道总体全面情况。
(4)用于对全面调查的结果进行核查和修正。
(5)用于资料时效性要求很强的场合。
二、抽样推断的内容:
1、参数估计:依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
参数估计包括的内容:确定估计值、确定估计的优良标准并加以判别,求估计值和被估计参数之间的误差范围,计算在一定误差范围内多作推断的可靠程度等。
2、假设检验:
先对总体的状况作某种假设,然后再根据抽样推断的原理,根据样本观察资料对所作假设进行检验,来判断这种假设的真伪,以决定我们行动的取舍。
二、抽样推断中的基本概念
1、总体和样本
•总体定义:总体也称为全及总体,指所要认识的研究对象全体。
它是由所研究范围内具有某种共同性质的全体单位所组成的
集合体。
•总体的单位数通常都是很大的,甚至无限的,用N表示。
•样本又称子样,它是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。
•样本的单位数是有限的,数目较小,用n表示。
•作为推断对象的总体是确定的,而且是唯一的。
•全及指标:根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标。
•全及指标是总体变量的函数,其数值是由总体各单位的标志值或标志属性决定的。一个全及指标的指标值是确定的、唯一的,称为参数。
•样本容量是指一个样本所包含的单位数。
①、大样本:样本单位数不少于30个
②、小样本:样本单位数不及30个
•样本个数:又称样本可能数目,是指从一个总体中可能抽取的样本个数。
4、重复抽样和不重复抽样
•重复抽样也称回置抽样,从N个单位中,抽取n个,共有Nn 个样本
•不重复抽样也称不回置抽样,从N个单位中,抽取n个,共有
N(N-1)(N-2)……(N-n+1)个
§2、抽样误差
一、抽样误差的意义:
1、抽样误差是指按随机原则抽样时,由于调查范围的非全面性和抽样的随机性而产生的样本指标与总体指标之间的误差。它是随机抽样调查所特有的一种偶然性的代表性误差。在随机误差调查中,抽样误差是不可克服、不可避免的、但可以通过一定的方法加以估计和控制。
2、抽样误差的性质:
(1)抽样误差属于随机误差
在抽样调查过程中,主要产生两种统计误差:登记性误差和代表性误差
抽样误差是抽样平均误差,而不是抽样实际误差。
抽样平均误差是指所有可能出现的样本指标的标准差。
影响抽样误差大小的因素:
•总体各单位标志值的差异程度。(差异程度越大,抽样误差越大)
•样本的单位数(样本单位数越多,抽样误差越小)
•抽样方法(重复抽样的误差比不重复抽样的误差要大些)
•抽样调查的组织形式(简单随机抽样、类型抽样、等距抽样、整群抽样)
二、抽样平均误差
1、抽样平均误差是根据随机原理抽样时,所有可能出现的样本平均
数的标准差。
抽样平均误差反映了样本指标和全及指标的平均离差程度。
2、作用:首先表现在它能够说明样本指标代表性的大小,抽样平均误差大,说明样本指标对全及指标的代表性低,反之,则高。
三、抽样极限误差
1、在做抽样估计时,应根据所研究现象的变异程度和分析任务的要求确定可允许的误差范围,在这个范围内的数字都算有效,这种可允许的误差范围称为抽样极限误差。
2、抽样极限误差等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。
§3、抽样估计的方法
一、总体参数的点估计
1、参数点估计的特点:根据总体指标的结构形式设计样本指标(称统计量)作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。
2、公式:以样本的平均数作为总体平均数的估计值。
以样本的成数p作为总体成数P的估计值。
3、成为优良估计的标准
•无偏性:即以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身。
抽样平均数的平均数等于总体平均数。
抽样成数的平均数等于总体成数。
•一致性:要求当样本的单位数充分大时,抽样指标也充分地靠近总体指标。
•有效性:以抽样指标估计总体指标要求作为优良估计量的方差比其他估计量的方差小。
4、总体参数点估计的特点:
•优点:简便、易行、原理直观
•缺点:这中估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。
•优点:简便、易行、原理直观
•缺点:这中估计没有表明抽样估计的误差,更没有指出误差在一定范围内的概率保证程度有多大。
1、抽样估计置信度就是表明抽样指标和总体指标的误差,不超过一定范围的概率保证程度。
2、概率是指在随机事件进行大量实验中,某种时间出现的可能性大小,它可以用某种事件出现的频率表示。
就是指抽样误差不超过一定范围的概率大小,用字母F(t)表示。
当t=1时,F(t)=68.27%
当t=2时, F(t)=95.45%
当t=3时, F(t)=99.73%
四、总体参数的区间估计
总体参数区间估计是根据给定的概率保证程度的需求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的