抽样推断的一般问题抽样误差
统计学 任务一八 抽样推断
31
抽样平均误差
㈢影响抽样误差的主要因素
1.样本容量n。样本容量大小与抽样误差成反比。当 n=N,无抽样误差。此表明,若条件许可应尽量扩容。
2.总体各单位标志变异程度。如总体标准差σ或总体方 差 。标志变异程度大小与抽样误差成正比。当σ=0, 无抽样误差2 。
3.抽样组织形式。类型抽样和等距抽样的抽样误差较小, 整群抽样误差较大。实践中,可利用抽样误差的大小 来检验组织方式的有效性。
差的影响(对抽中群作全面调查,无抽样误差)。 因此群的划分,要尽量缩小群间的差异,加大群 内的差异。 由于样本单位过分集中在少数样本群,同样条件 下抽样误差较大。欲不扩大误差,则需要增加一 些样本群。
21
抽样组织形式
㈣等距抽样——机械抽样
等距抽样是先将总体单位按某一标志顺序排队,再按固 定顺序和相等距离(间隔k)抽取样本单位。
13
◎抽样方法
2.不重复抽样(不回置抽样)从总体中每次抽 取一个单位进行观察,登记后不再放回总体中, 依此直至抽取n 个单位。
不重复抽样的特点:
⑴ n次抽取实质上等于一次同时抽取n个单位; ⑵ n次抽取相互不独立(对下次抽取有影响); ⑶每个总体单位在各次被抽中的概率不同,即1~n次分
别是1/N,1/N-1,1/N-2,…,1/N-n+1,但在每次抽 取时机会仍然均等; ⑷每个总体单位不会被重复抽中。
○
(n-1)k nk
22
分任务二 抽样误差
抽样误差的概念 抽样平均误差 抽样极限误差与概率度
一.抽样误差的概念
抽样误差是一种调查误差。如前所述:
调 登记性误差 普遍存在可以防止
查
误
系统性误差
差 代表性误差
统计学—抽样推断
解:已知样本的合格率= 3006 0.98 300
重复抽样: P (1 P )0 .9 8 (1 0 .9)8 0 .00 8 0 .80 % 0
p
n
300
不重复抽样:
P(1P)(1n) 0.980.02(1 300)0.80% 6
p
n
N
300 60,000
21
第六章 抽样推断
STAT
(二)分层(类型)抽样形式下
样本成数近似服从于以总体成数为P,方差为P(1-P)/n的正态12 分布。
第六章 抽样推断
STAT
第二节、抽样误差的计算
一、抽样误差的概念
登记性误差
调查误差 代表性误差
系统性误差
实际抽样误差
抽样误差 抽样平均误差
代表性误差是指 由于样本的结构不能完全代表总体的结构 所引起的误差。
系统性误差是指由于抽样调查违反随机原则引起的误差;
p
n N 1
nN
注:(1)可用样本成数方差代替总体成数方差;
(2)可用样本成数 p^ 代替总体成数P;
(3)有若干个P值时,取最接近0.5的P值;
(4)无P值时,取P=0.5 (此时方差最大)
20
第六章 抽样推断
STAT
例:一批食品罐头60,000桶,随机抽查300桶,发现有6桶不合 格,求合格率的抽样平均误差。
统计上讲的抽样一般都是指概率抽样。 二、抽样推断的特点
1、是非全面调查 与普查的区别;
2、按随机原则抽取样本 与典型调查和重点调查的区别; 3、根据样本指标推断总体指标 与重点调查的区别; 4、抽样误差可以事先计算与控制 与典型调查的区别。
3
第六章 抽样推断
《统计学原理》第5章:抽样推断
σ
n )
抽样推断的基本原理
抽样推断的优良标准
设θ 为待估计的总体参数, θ为样本统计量,则 θ的优良标 准为: 1若 E(θ ) =θ ,则称 θ为 θ 的无偏估计量(无偏性)
更有效的估计量(有效性) 2若σθ1 < σθ2,则称θ1为比θ2
3若 越大σθ 越小,则称 θ 为θ 的一致估计量(一 致性)
即中选成分相同但中选顺序不同的视为同一样本
抽样推断的一般问题
抽样组织方式
简单随机抽样 类型抽样 整群抽样 等距抽样 多阶段抽样 多重抽样
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示. 考虑顺序的不重复抽样 考虑顺序的重复抽样 不考虑顺序的不重复抽样 不考虑顺序的重复抽样
抽样推断的一般问题
全及总体指标:参数 (未知量) 统计推断 样本总体指标:统计量 (已知量)
抽样推断的一般问题
抽样推断的特点 按随机原则抽取样本 运用概率论的理论和方法,用样本指标来推断 总体指标。 推断的误差可以事先计算和控制。
抽样推断的一般问题
抽样推断的应用 无法或 很难进行全面调查而又需要了解 其全面情况时 某些可以采用全面调查的社会经济现象, 也可采用抽样推断。 可用于生产过程的质量控制 进行假设检验
抽样推断的基本原理
抽样推断的优良标准——有效性 中位数的抽样分布
9 8 7 6 5 4 3 2 1 0 -1 45 50 55 60 65 70 75
平均数的抽样 分布
E(x) =
E ( me ) =
e
σx <σm
抽样推断的基本原理
《统计学》第七章抽样推断第二节 抽样误差
经济、管理类 基础课程
统计学
二、抽样误差的影响因素
差异越大,抽 样误差越大
单位数越多, 抽样误差越小
1.总体各单位标志值的差异程度; 2.样本的单位数; 3.抽样的方法; 4.抽样调查的组织形式。
重复抽样的抽 样误差比不重 复抽样的大 6-4 简单随机抽样 的抽样误差最 大
三、抽样平均误差
或
p p P
如果抽样极限误差用抽样平均误差来 衡量,则有: x t x 或 p t p
9
式中, N为总体单位数; n为样本容量;σP2 为总体成数方 差一般情况下是末知,可用样本成数方差替代σp2 。
8
四、抽样极限误差
抽样极限误差是指用绝对值形式表示的样本指 标与总体指标偏差可允许的最大范围。即:
x x X
即,抽样极限误差是 抽样平均误差的多少 式中, x样本平均指标 ;X 为总体平均指标 倍。我们把倍数 t称 p为样本成数;P 为总体成数 。 为抽样误差的概率度
2
n ( 1- ) 当N 很大时,可近似表示为: = n N
6
1. 重复抽样的条件下
平均数的抽样平均误差 : x
n
式中,n为样本容量; 为总体标准 。
成数的抽样平均误差 : p
p
n
式中,n为样本容量; 为总体成数标准差 P 一般情况下是末知,可用样本成数标准差替代 p。
P(1 P)
7
2. 不重复抽样的条件下
平均数的抽样平均误差 : x 当N很大时近似为 x
2 ( N n)
n( N 1)
;
2
《国民经济统计学概论》_第六章_抽样推断
总体分组: 2 (X X )2 F F
总体成数的方差为 P(1 - P)
2.统计量,又称样本指标,反映样本特 征的统计指标
(1)样本平均数( x ),样本各 单位数量标志值的平均数
未分组: x x
n
分组: x xf f
(2)样本成数(p) 是指样本中具有某一相同标志表现的单
要有四个:
(1)总体平均数( X )
总体各单位数量标志值的平均数
X
总体未分组情况下:X N
总体分组情况下:
XF
X
F
(2)总体成数(P)
是指总体中具有某一相同标志表现的单 位数占全部总体单位数的比重
多为交替指标
总体中具有相同标志表现的单位数用N1 表示
P N1 N
(3)总体方差和标准差 总体方差(σ2)
特点: 1.抽样方式组织简便,便于实施 2.在已知总体某些有关信息的情况下,
采用等距抽样能保证样本单位在总体中 均匀的分布,从而提高了样本对总体的 代表性,有利于降低抽样误差。
无关标志排队 有关标志排队
(三)类型抽样 首先把总体按某一标志分成若干个类型
组,使各组组内标志值比较接近,然后 分别在各组内按随机原则抽取样本单位。 特点:在于把分组法和随机抽样原则结 合起来。
i2ni
n
抽样成数的平均误差:
重置抽样:
p
P(1 P) n
不重置抽样:
第四节 抽样的组织形式及抽样方 案设计
一、抽样的组织形式 (一)简单随机抽样 从总体全部单位中直接按随机原则抽取
样本单位,使每个总体单位都有同等机 会被抽中
最基本形式
(1)直接抽选法 直接从调查对象中随机抽选。
抽样推断 习题及答案
第六章抽样推断习题答案一、名词解释用规范性的语言解释统计学中的名词。
1. 随机原则:是指在抽样时排出主观上有意识地抽取调查单位,每个单位以相同概率被取到,从而增强样本对总体的代表性。
2. 统计量:是反映样本特征的综合指标,随样本不同而取不同的值,具有随机性。
3. 随机变量:是指变量的值无法预先确定仅以一定的可能性取值的量。
4. 样本容量:是指样本中的总体单位数量。
5. 中心极限定理:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。
6. 抽样平均误差:是反应抽样误差一般水平的指标,它的实质含义是指抽样平均数的标准差。
7. 区间估计:通过从总体中抽取的样本,根据一定的可行度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计。
8. 简单随机抽样:也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
二、判断改错对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。
1. 抽样推断中,如果获取的样本数据准确,那么,由此推断的总体参数也一定准确。
(×)不一定2. 极限误差越大,则抽样估计的可靠性就越小。
(×)越大3. 抽样平均误差的大小与样本容量的大小成正比关系。
(×)反比4. 在一般的抽样推断中,抽样平均误差小于极限误差。
(×)不一定5. 重复抽样条件下的抽样平均误差,一定比不重复抽样条件下的抽样平均误差大。
(×)在其他条件相同的情况下6. 在不重复抽样的情况下,若调查的单位数为全及总体的10%,则所计算的抽样平均误差比重复抽样计算的抽样误差少10%。
抽样理论抽样误差与样本量的计算公式
抽样理论抽样误差与样本量的计算公式在统计学中,抽样是我们用来从整体中获取样本数据的一种方法。
然而,由于我们无法对整体进行完全调查,所以我们需要根据一部分样本数据来推断总体特征。
抽样误差是指由于样本抽取的随机性所引起的对总体特征的估计误差。
本文将介绍抽样理论中常用的抽样误差公式,并说明样本量的计算方法。
1. 抽样误差公式抽样误差是统计推断中的重要概念,它用来衡量样本数据对总体数据的估计精度。
抽样误差可以通过以下公式计算:抽样误差 = 抽样估计值 - 真实值抽样估计值是根据样本数据计算得出的统计量,例如均值、比例等。
真实值是指总体数据的真实数值。
在实际应用中,常用的抽样误差公式有标准误差公式和置信区间公式。
1.1 标准误差公式标准误差是样本统计量的抽样分布标准差。
如果我们假设样本数据满足正态分布,那么标准误差可以通过以下公式计算:标准误差 = 样本统计量的标准差 / 样本容量的平方根其中,样本统计量的标准差是指该统计量在抽样分布中的标准差,样本容量是指样本的大小。
例如,我们要估计某商品在全国范围内的销售量,并从中抽取了100个销售点的销售数据。
我们计算得出样本均值为2000,样本均值的标准差为100。
那么根据标准误差公式,我们可以计算出标准误差为:标准误差= 100 / √100 = 10这意味着我们对总体销售量的估计值平均偏差不超过10个单位。
1.2 置信区间公式置信区间是对总体特征的估计范围。
当我们进行统计推断时,我们通常希望给出一个置信水平,表示我们对估计值的信心程度。
置信区间可以通过以下公式计算:置信区间 = 抽样估计值 ±临界值 ×标准误差其中,临界值是根据所选置信水平和样本容量在统计表中查找得出的。
举例来说,我们希望估计某政党在全国范围内的支持率,并从中抽取了1000个选民的调查数据。
我们计算得出样本支持率为0.6,临界值为1.96(置信水平为95%)。
假设样本比例的标准误差为0.02,那么根据置信区间公式,我们可以计算出置信区间为:置信区间 = 0.6 ± 1.96 × 0.02 = 0.56 ~ 0.64这意味着我们以95%的置信水平估计,该政党的支持率在0.56到0.64之间。
统计推断抽样误差大小评估及控制方法
统计推断抽样误差大小评估及控制方法统计推断是统计学中一项重要的技术,可以帮助我们从样本数据中推断总体的特征。
然而,在实际应用中,由于抽样误差的存在,我们需要对样本数据的可靠性进行评估,并采取相应的控制方法来减小抽样误差的大小。
本文将围绕这一主题展开,介绍统计推断抽样误差的评估和控制方法。
一、抽样误差的定义和影响因素抽样误差是指由于从总体中选取一部分样本,而使样本统计量与总体参数之间的差异。
抽样误差的大小直接影响到我们对总体特征的推断能力。
它的大小受到以下几个因素的影响:1. 样本容量:样本容量越大,抽样误差越小。
通常来说,当样本容量大于30时,中心极限定理可以保证样本的均值近似服从正态分布,从而减小了抽样误差的大小。
2. 总体的变异程度:总体变异越大,抽样误差越小。
如果总体中的个体差异较大,则从中抽取的样本更有可能代表整个总体。
3. 抽样方法:合理的抽样方法能够减小抽样误差的产生。
如简单随机抽样、分层抽样、整群抽样等,都可以在一定程度上降低抽样误差的大小。
二、抽样误差的评估方法为了确定抽样误差的大小,我们需要进行抽样误差的评估。
常用的抽样误差评估方法有以下几种:1. 置信区间:通过计算样本统计量的置信区间,可以确定总体参数的估计范围。
置信区间越窄,抽样误差越小。
2. 边界值计算:边界值是指满足给定置信度和抽样误差的最大样本容量。
通过计算边界值,可以对抽样误差进行评估。
3. 抽样误差率:抽样误差率是指样本统计量和总体参数之间的相对差异。
通过计算抽样误差率,可以评估抽样误差的大小。
三、抽样误差的控制方法为了减小抽样误差的大小,我们可以采取以下几种控制方法:1. 增加样本容量:样本容量的增加可以有效减小抽样误差的大小。
当样本容量足够大时,样本统计量的分布将更加接近总体参数的分布。
2. 优化抽样方法:选择合适的抽样方法可以降低抽样误差的大小。
例如,分层抽样可以根据总体的重要特征来确定抽样的分层,从而提高样本的代表性。
抽样估计
人生得意须尽欢,莫使金樽空对月。0 1:45:29 01:45:2 901:45 11/17/2 020 1:45:29 AM
做一枚螺丝钉,那里需要那里上。20. 11.1701 :45:290 1:45No v-2017 -Nov-2 0
日复一日的努力只为成就美好的明天 。01:45:2901:4 5:2901:45Tues day , November 17, 2020
2
x ( R r ),
x r R 1
2
P(Rr) P r R 1
2
2 x
(xi x)
R
,
2 P
(
pi
R
p)2
注:整群抽样是对中选 群进行全面调查,所以 只存在群间抽样误差不 存在群内抽样误差
抽样方案的检查:
主要有(1)准确性检查(以方案所要求的 允许误差范围为标准)
(2)代表性检查(方案中的样本指
二、抽样推断的内容
(一)参数估计。特点是不知道总体的数 量特征,依据所获得的样本观察资料,对所研究 现象总体的水平、规模等数量特征进行估计
(二)假设检验。特点是对总体的变化情 况不了解,不妨对总体的状况作某种假设,然后 再根据抽样推断的原理,根据样本观察资料对所 作假设进行检验,来判断着种假设的 真伪,以决 定行动的取舍。
l估计值
x x
l估计值的误差范围
t
x
x
注意:t=1 F(t)-68.27%
t=2 F(t)=95.45% t=3 F(t)=99.73% 需要熟记
区间估计:
x x X x x
p p P p p
区间估计的步骤:
(x
t ) X
(p
t ) p
《统计学原理》第5章:抽样推断
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.
统计推断抽样误差大小的定量评估方法
统计推断抽样误差大小的定量评估方法在统计学中,抽样是一种常用的方法,用于从总体中获取一部分样本数据,并通过对样本数据进行统计分析,推断总体特征。
然而,在实践中,由于样本的选取是随机的,会存在一定的抽样误差,即样本结果与总体真实值之间的差异。
为了准确评估抽样误差的大小,统计学中提出了一些定量评估方法,本文将对其中的几种常见方法进行介绍。
一、标准误(Standard Error)标准误是衡量样本均值或比例估计值与总体均值或比例真值偏差的一种度量方法。
它反映了样本均值或比例的稳定性,标准误越小,说明样本均值或比例估计值与总体真值越接近。
计算标准误的公式如下:标准误 = 标准差/ √样本容量其中,标准差是样本数据的离散程度的度量,样本容量是样本数据的数量。
二、置信区间(Confidence Interval)置信区间是一种通过样本数据对总体特征进行估计并给出估计结果的不确定范围的方法。
在统计推断中,我们通常会给出一个置信水平,如95%,表示我们对样本估计结果的可信度为95%。
置信区间的宽度可以用来评估抽样误差的大小,宽度越大表示抽样误差越大。
计算置信区间的公式如下:置信区间 = 估计值 ±极限误差其中,估计值是样本数据的统计量,比如均值或比例,极限误差是通过查找标准正态分布表得到的。
三、样本容量计算(Sample Size Calculation)样本容量计算是为了满足指定的抽样误差要求而确定样本容量的方法。
在实际应用中,我们往往需要控制抽样误差的大小,以保证样本结果的可靠性和稳定性。
样本容量计算需要考虑置信水平、置信区间宽度和总体标准差等因素。
计算样本容量的公式如下:样本容量 = ((Z-score * 标准差) / 误差)^2其中,Z-score是置信水平对应的标准正态分布的分位数,标准差是总体标准差的估计值,误差是期望的抽样误差。
四、假设检验(Hypothesis Testing)假设检验是一种通过比较样本数据与总体假设值之间的差异来评估抽样误差的方法。
管理统计学之抽样推断
2021/7/21
管理统计学讲义 游士兵
例5、某产品的耐用时间为1000小时,现 随机抽取10件新工艺条件下的产品作测 试,测得平均耐用时间为1077小时,标 准差为51.97小时,能否认为新工艺条 件下产生的产品明显不同于老产品?
2021/7/21
管理统计学讲义 游士兵
2021/7/21
管理统计学讲义 游士兵
(3)计算举例
例1:某企业生产一批产品20000件,今 随机抽样100件作耐用时间试验,结果 表明:每件样本的平均寿命为3600小 时,所抽样本的标准差为150小时,求 抽样误差。
2021/7/21
管理统计学讲义 游士兵
例2:随机抽取500名某国私人对外投资 者,发现对外投资额在5000万元以上 的人数有80人,求抽样误差。
2021/7/21
管理统计学讲义 游士兵
例3、某公司引进一自动包装线包装大米, 合同规定设计规格为每袋大米10公斤, 标准差为0.6公斤,生产调试后随机抽 取100袋大米平均重量为9.8公斤。问可 靠程度为95%下,该生产线的设计规格 是否符合要求?
2021/7/21
管理统计学讲义 游士兵
例4、取8台新型发动机进行测试,其结 果是使用柴油每公升的运转时间分别为 28、27、31、29、30、27、30、27分 钟。根据设计要求,平均每公升运转应 在30分钟以上。问根据实验结果,在 显著性水平为5%和总体标准差不明确 的条件下,能否说明这种发动机符合设 计要求?
例3:一批食品随机抽查50箱,发现一箱 不合格,求合格率的抽样误差。
2021/7/21
管理统计学讲义 游士兵
三、点估计和区间估计
1、点估计 点估计是直接用样本指标推断总体
指标的一种方法。 点估计的特点是只考虑了样本指标,
抽样方案有哪些类型的问题
抽样方案有哪些类型的问题抽样方案有哪些类型的问题摘要:抽样是研究过程中常用的一种方法,通过从总体中选取一部分样本进行观察和分析,以推断出总体的特征。
然而,在设计和实施抽样方案时会遇到一些问题。
本文将介绍抽样方案中常见的问题类型,并提供相应的解决方案。
1. 抽样误差问题抽样误差是指样本的统计特征与总体的真实特征之间的差异。
在抽样过程中,由于样本的随机性和有限性,抽样误差是无法避免的。
为了减小抽样误差,可以采取以下措施:- 增加样本容量:样本容量越大,抽样误差越小。
- 优化抽样方法:选择合适的抽样方法,保证样本的随机性。
- 控制变量:对于可能产生较大抽样误差的变量,进行控制或分层抽样。
2. 抽样偏倚问题抽样偏倚是指样本中某些特征相对于总体的过高或过低表现。
抽样偏倚可能导致对总体特征的错误推断。
为了减小抽样偏倚,可以采取以下措施:- 多元抽样:根据总体的特征选择不同的抽样方法,以避免特定特征的偏倚。
- 配对抽样:将样本分为一对对,保证每对样本的特征相似。
3. 抽样代表性问题抽样代表性是指样本能否真实地反映总体的特征。
抽样过程中,如果样本选择不当或样本的特征与总体的特征存在差异,就会出现抽样代表性问题。
为了保证抽样代表性,可以采取以下措施:- 随机抽样:保证抽样过程具有随机性,避免主观干扰。
- 概率抽样:根据总体特征的概率选择样本,增加样本的代表性。
- 多阶段抽样:将总体分为若干层次,按比例从各层次抽取样本,确保每个层次都有代表性。
4. 抽样效率问题抽样效率是指在一定样本容量下,抽样方案所能获取的有效信息数量。
为了提高抽样效率,可以采取以下措施:- 制定合理的样本容量:根据研究目的和预期效果确定样本容量。
- 选择合适的抽样方法:根据研究对象和资源限制选择适合的抽样方法。
- 使用先验信息:利用已有信息,对样本进行合理的选择和筛选。
5. 抽样策略问题抽样策略是指在抽样过程中制定的一系列决策和步骤。
抽样策略的合理性直接影响到抽样方案的质量和可靠性。
抽样推断的一般问题
抽取n个单位组成样本,只考虑样本各 单位的成分如何,而不考虑各单位的 中选顺序。
3. 把抽选方式和是否考虑样本中各单位 的顺序结合起来的四种情况及其样本 可能数目(M):
1)考虑顺序的重复抽样 M ANn N n
2)考虑顺序的不重复抽样 M BNn N! (N n)! 3)不考虑顺序的重复抽样
M DNn (N n 1)! n!(N 1)!
4)不考虑顺序的不重复抽样
M
C
n N
N!
n!( N
n)!
四、抽样调查的数理基础
1. 大数定律及其重要意义 大数定律:又称大数法则,是说明大量
的随机现象的平均结果具有稳定性质的 法则。说明如果被研究的总体数量特征 是由大量的相互独立的随机变量形成的, 而且每个变量对总体的影响都相对地小、 那么对大量随机变量加以综合平均的结 果,变量的个别影响相互抵消,而显现 出他们共同作用的倾向,使总体数量特 征具有稳定性。
统计学
抽样推断的一般问题
一、总体与样本
1.全及总体:也称母体,简称总体,指 所要认识的研究对象全体。它是由所 研究范围内具有某种共同性质的全体 单位所组成的集合体。
2.样本总体:又称子样,是从总体中抽 取出来,作为代表这一总体的那部分 单位组成的集合体。
二、参数和统计量
1. 参数:反映总体某种属性的综合指标。
统计量
抽样方法
均值
方差
抽样误差
(1)从无限总
体抽 样和有限 E(x) x
总体放回抽样
2
(x x)2 n
x
n
(2)从有限总 体不放回抽样
E(x) x
2 (x x)2
抽样误的名词解释
抽样误的名词解释抽样误是指在统计学中,在进行抽样调查或实验时,由于样本的选择和样本容量的限制,所导致的对总体特征的估计或实验结论的失准。
这种误差包括抽样误差和非抽样误差两个方面。
抽样误差是由于抽取样本时,从总体中选择的样本与总体本身存在的差异而引起的误差。
这种误差与样本的大小、抽样方法、样本的选择过程等有关。
抽样误差是统计推断中普遍存在的误差,其大小与样本的大小和抽样方法的选择密切相关。
一般来说,样本越大,抽样误差越小,反之亦然。
此外,合理选择抽样方法和确保样本的代表性也是减小抽样误差的关键步骤。
抽样误差的存在对于统计学的研究和应用影响深远,在数据分析和决策制定中必须予以充分考虑。
非抽样误差指的是在统计推断中除了抽样引起的误差之外的其他各种类型误差。
这包括非抽样误差,测量误差以及与实验设计和数据收集过程相关的误差。
非抽样误差的存在使得样本数据在一定程度上不能完全反映总体的真实情况。
非抽样误差的来源复杂多样,可能包括人为误差、仪器误差、测量误差、数据录入和存储误差等。
非抽样误差的减小需要在实验设计和数据收集过程中采取适当的控制和纠正措施,并且对数据进行有效的校验和检验。
抽样误在统计学的应用中具有重要的意义。
它可以用来评估样本的可靠性,指导抽样方法的选择以及对总体特征进行准确估计。
抽样误差是进行统计推断时必须考虑的一个重要因素,它在决策制定、市场调查、社会调查等领域有着广泛的应用。
在科学研究、商业决策和政策制定中,准确估计和评估抽样误差对于推断的可靠性和决策的准确性具有至关重要的作用。
总之,抽样误是统计学中的一个重要概念,它对于统计推断和决策制定具有重要意义。
抽样误差和非抽样误差是造成统计推断失真和数据分析不准确的两个主要来源。
在进行抽样调查、实验设计和数据分析时,必须注意采取适当的措施减小抽样误和非抽样误的影响。
只有在充分了解和理解抽样误的概念、类型和影响的基础上,才能够做出准确的统计推断和合理的决策。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
抽样平均误差是抽样平均数或抽样成数的标准差,反映了抽样指标与总体指标的平均误差程度。
例如:假设总体包含1、2、3、4、5,五个数字。
则:总体平均数为 =(1+2+3+4+5)/5=3
现在,采用重复抽样从中抽出两个,组成一个样本。可能组成的样本数目:25个。
如:(1+3)/2=2、(1+4)/2=2.5、(2+4)/2=3、(3+5)/2=4…
二、抽样推断的内容
参数估计:参数估计是依据所获得的样本观察资料,对所研究现象总体的水平、结构、规模等数量特征进行估计。
假设检验:假设检验是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否可信的一种统计分析方法。
三、有关抽样的基本概念
(一)总体和样本
总体:又称全及总体。指所要认识的研究对象全体。总体单位总数用“N”表示。
上式可变形为:Δ=tμ(极限误差是t倍的抽样平均误差)
例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果
平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?
解:已知:N=2000n=400σx=300 =4800
则:
计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。
②抽样平均数的标准差仅为总体标准差的
③可通过调整样本单位数来控制抽样平均误差。
例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?
解:抽样单位数增加2倍,即为原来的3倍
则:
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
抽样单位数增加0.5倍,即为原来的1.5倍
则:
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
采用不重复抽样: 其中:
公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与总体单位数的多少有关。
例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?
解:已知:n=100
则:
即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。
第一节抽样推断的一般问题
一、抽样推断的概念和特点
概念:抽样推断是按随机原则从全部研究对象中抽取部分单位进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。
特点:它是由部分推断整体的一种认识方法。
抽样推断建立在随机取样的基础上。
抽样推断运用概率估计的方法。
抽样推断的误差可以事先计算并加以控制。
样本:又称子样。是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位总数用“n”表示。
(二)参数和统计量
参数:反映总体数量特征的全及指标。
参数(只有两种表现)
研究总体中的数量标志:总体平均数 、总体标准差
研究总体中的品质标志:总体成数 、成数标准差
统计量:根据样本数据计算的综合指标。
AA
AB
AC
AD
BA
AB
BC
BD
CA
CB
CC
CD
DA
DB
DC
DD
第二节抽样误差
一、抽样误差的含义
由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。
二、影响抽样误差大小的因素
1、总体各单位标志值的差异程度
2、样本的单位数
3、抽样方法
4、抽样调查的组织形式
实际上,利用上述两个公式是计算不出抽样平均误差的。想一想,为什么?
抽样平均数平均误差的计算方法
采用重复抽样: 其中:
此公式说明,抽样平均误差与总体标准差成正比,与样本容量成反比。(当总体标准差未知时,可用样本标准差代替)(教材P180例题)
通过例题可说明以下几点:
①样本平均数的平均数等于总体平均数。
计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。
抽样平均数极限误差:
≤ ≤
抽样成数极限误差:Δp=|p-P|
p-Δp≤P≤p+Δp
五、抽样误差的概率度
含义:抽样误差的概率度是测量抽样估计可靠程度的一个参数。用符号“t”表示。
公式表示:t=Δ/μ(t是极限误差与抽样平均误差的比值)
多数样本指标与总体指标都有误差,误差有大、有小,有正、有负,抽样平均误差就是将所有的误差综合起来,再求其平均数,所以抽样平均误差是反映抽样误差一般水平的指标。
抽样平均误差的计算公式
抽样平均数的平均误差:
抽样成数平均误差:
(以上两个公式实际上就是第四章讲的标准差。但反映的是样本指标与总体指标的平均离差程度)
例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品300n1=6
则:样本合格率
计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。
四、抽样极限误差
含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。
第五章抽样估计
教学目的与要求:抽样估计是抽样调查的继续,它提供了一套利用抽样资料来估计总体数量特征的方法。通过本章的学习,要理解和掌握抽样估计的概念、特点,抽样误差的含义、计算方法,抽样估计的置信度,推断总体参数的方法,能结合实际资料进行抽样估计。
本章主要内容:抽样推断的一般问题、抽样误差、抽样估计的方法、抽样组织设计
不重复抽样:又称不回置抽样。可能组成的样本数目N(N-1)(N-2)……(N-n+1)
例如:从A、B、C、D四个单位中,抽出两个单位构成一个样本,问可能组成的样本数目是多少?
重复抽样:Nn=42=16(个样本)
AA
AB
AC
AD
BA
AA
AC
AD
CA
CB
CC
CD
DA
DB
DC
DD
不重复抽样:N(N-1)(N-2)…….4×3=12(个样本)
研究数量标志:样本平均数 =∑x/n、 =∑xf/∑f
样本标准差
研究品质标志:样本成数p=n1/n、成数标准差
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
重复抽样:又称回置抽样。可能组成的样本数目:Nn
抽样成数平均误差的计算方法
采用重复抽样: 其中:
采用不重复抽样: 其中:
例题三:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?
解:已知:n=400n1=80
则:样本成数
即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。