统计学提纲第五章总结

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学提纲第五章总结

————————————————————————————————作者:————————————————————————————————日期:

第五章抽样推断

第一节抽样推断的相关基本概念

一、抽样调查

(一)什么是抽样调查

抽样调查是按随机原则从总体中选取部分单位进行观察,用所获得的样本数据推算总体数量特征的一种非全面调查。

(二)抽样调查的特点:

1.按随机原则去抽取调查单位。

随机原则也就是机会均等的原则,每个单位被抽中的机会相等。其目的是保证抽出的样本是随机样本。

2.以样本数据估计总体参数或检验总体的某种假设。抽样调查虽仅是直接调查被抽取的那一部分样本,但其目的是着眼于研究总体的数量特征。

3.抽样误差可以事先计算并加以控制。

(三)抽样调查的适用范围:

1.能够解决全面调查无法或难以解决的问题;

2.对能取得全面资料,但不必进行全面调查的情况。

3.可以补充和订正全面调查的结果;

4.可用于对总体的某种假设进行检验,为行动决策提供依据。

(四)抽样调查的基本形式

基本形式有简单随机抽样、类型随机抽样、等距抽样、整群抽样。

1.简单随机抽样

按随机原则直接从总体中抽选样本单位进行调查。这里,不论是重复抽样还是不重复抽样,每个单位都有相等的中选机会。

2.类型随机抽样(分层抽样)

先将总体单位按某一标志分类,然后按随机原则直接从各类中抽取一定的样本单位进行调查。

3.等距抽样(机械抽样或系统抽样)

它是先将总体单位按某一标志进行排列,再按照一定的间隔抽取样本单位进行调查。

4.整群抽样(集团抽样)

整群抽样是先将总体单位按某一标志进行分群,再按随机原则从各群中抽取部分群,对抽中的群的所有单位进行调查是抽样组织方式。

二、抽样推断的概念及主要内容

(一)抽样推断是在抽样调查的基础上,以样本实际数据计算的样本指标推算总体相应数量特征的一种统计分析方法。

(二)抽样推断的主要内容为:参数估计和假设检验

三、抽样的有关基本概念

(一)全及总体和样本总体

1.全及总体简称总体,又称母体,它是指所要认识的研究对象的全体。也就是具有某种共同性质的许多单位的集合体。

2.样本总体简称样本,又称子样,是从全及总体中抽取,代表全

及总体的那部分单位的集合体。

全及总体是我们所要研究的对象,而样本总体则是我们所要观察和采集数据的对象,两者是有区别。

(二)样本容量和样本个数

1.样本容量是指样本所包含的单位数。

2.样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。 重复抽样时:; 不重复抽样时:

对于一次抽样调查,全及总体是唯一确定的,而一个全及总体可能抽出很多个样本总体;样本的个数和样本的容量有关,也和抽样的方法有关。 (三)参数和统计量

1.根据全及总体各个单位的标志值或标志属性计算的,反映总体某一数量特征的综合指标称为全及指标,也称为总体参数,简称参数。 2.由样本总体各单位标志值或标志属性计算的,反映样本数量特征,并用以估计全及指标的综合指标称为样本指标,或称为抽样指标、统计量。统计量有:

样本平均数n

x x ∑= 抽样成数p x =

样本方差:()

n

x x ∑-=

2

2

σ

pq p p =-=)1(2

σ

样本标准差:

()

n

x x ∑-=

2

σ[注意:()1

2

-=

∑-n S x x ]

σ

1(

p

=)

pq

-

p=

对于一个问题,全及总体是唯一确定的,而一个总体有多少样本;总体指标值是唯一确定的;而统计量是样本变量的函数,也就是样本统计量就有多种取值。

(四)重复抽样和不重复抽样

重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后放回,再从总体中重新抽取,一直抽取n次。

不重复抽样:从有N个单位的总体中,每次随机抽取1个单位,登记其标志表现后不放回,再从总体中重新抽取,一直抽取n次。

第二节抽样误差

一、误差

调查资料的检查是指对资料的准确性、完整性、及时性检查

(一)登记性误差

凡是由于错误判断事实、错误登记事实或错误计算而发生的误差,登记性误差在全面调查与非全面调查中都可能存在。它分为1.偶然登记性误差;2.系统登记性误差其特点是具有明显的倾向性和一贯性。

(二)代表性误差

在没有登记性误差的条件下,由于用样本指标代表总体指标而产生的误差,它分为:

1.偏差凡是由于违反随机原则抽样而产生的代表性误差,又称为系统性代表误差、非偶然性代表误差。

2.抽样误差 是指由于随机抽样的偶然因素,使样本的结构不足以代表总体各单位的结构,而引起抽样指标和总体指标之间的误差,也称为随机误差、偶然性代表误差。

抽样误差既不包括登记误差,也不包括系统性代表误差。 影响抽样误差的因素有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。 二、抽样平均误差。

抽样平均误差是反映抽样误差一般水平的指标,它反映了抽样指标与总体指标的平均离差程度,即样本指标与总体指标的标准差。通常用抽样平均数的标准差来衡量

M

X x x ∑-=

2

)(μ M

P p p

∑-=

2

)(μ

i x X 为第i 个样本的平均数;

为总体平均数; M 为样本个数

i p P 为第i 个样本的成数;

为总体成数;

M 为样本个数

抽样平均误差的作用首先表现在它能够说明样本指标代表性的大小。平均误差大,说明样本指标对总体指标的代表性低;反之,则说明代表性高。

抽样平均数的平均数=总体平均数。 抽样平均误差的计算: (一)简单随机抽样条件下:

1、重复抽样: n

n

σ

σ

μ=

=2

2、不重复抽样:)

1

(

2--=

N n

N n

σμ

当总体单位数N 很大时,)1(2N n n

-

=σμ

当N 很大且很小时,n

σ

μ=

其中,σ为总体标准差,n 为样本单位数,在总体标准差未知,

相关文档
最新文档