第七章抽样推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
x
2
n
s n n
样本平均数 34 36 38 40 42 44 46 48 50 合计
频数 1 2 3 4 5 4 3 2 1 25
xf E x x f
42 X
2
x
x X f
2
n
f
4
x
32 4 2
抽样平均误差总结
x
分层抽样小于纯随机抽样 纯随机抽样小于整群抽样。
抽样误差的种类
1、抽样实际误差 2、抽样平均误差 3、抽样极限误差
抽样实际误差
x X
pP
抽样实际误差:是指根据一个实际抽取出来的样 本所计算出来的样本统计量与总体参数之间存 在的实际偏差
为什么说:抽样实际误差只是存在于理论上, 在实际工作中是不可能知道的?
2
1057
183 p 91.5% 200
⒉求灯泡使用时间抽样平均误差: 在重复抽样下,抽样平均误差: 53.63 3.79小时 n 200
x
在不重复抽样下,抽样平均误 差
n N 1 3.75小时
x
2 N n
53.63
样本个数M:又称样本可能数目,指从一个总体中所可能抽 取的样本的个数。
(二)总体指标与样本指标 1.总体指标 总体指标(总体参数),是反映总体数量特征的统计指标, 确定且唯一。 包括: 总体平均数、总体成数、总体方差和总体标准差
2、样本指标 样本指标(统计量),是根据样本数据计算的样本指标。数 值决定于样本各单位的标志值,不是唯一的,是个随机变 量。 包括: 样本平均数、样本成数、样本方差和样本标准差。
10000 200 200 10000 1
2
⒊求灯泡合格率的抽样平均误差: 在重复抽样下,抽样平均误差:
p
p1 p n
0.915 0.085 1.97% 200
在重复抽样下,抽样平均误差
p 1 p N n x n N 1 1.95%
2、抽样估计的特点
(1)逻辑上运用归纳推理,而不是演绎推理。 (2)方法上运用不确定的概率估计法,不是运用 确定的数学分析法。 (3)抽样估计存在抽样误差,允许的误差范围越 大,则概率保证程度也越大。
二、参数估计的方法: (一)点估计 点估计的含义:直接以样本统计量作为相应总体 参数的估计量(即令抽样极限误差等于零)。
0.915 0.085 10000 200 200 10000 1
下一页 返回本节首页
上一页
抽样极限误差的由来:
抽样平均误差是对所有抽样实际误差的平均,只代表平均水平 而在实际过程中,为了控制抽样推断的效果,通常会设定一 个可接受的误差水平。该误差水平即为抽样极限误差(可容 忍的抽样误差---对其实际误差水平进行控制)。 含义:抽样极限误差是指用绝对值形式表示的样本指标与总体 指标之间离差的可能范围。抽样极限误差就是在一定的概率 保证下,用统计量去估计总体参数时的最大允许误差.
n PN
D
A B C E
E
A B C D
考虑顺序时:样本个数M
B C D E
N! 5! 20 (N - n)! 3!
D
A
B
C D E
C
D E
n CN
E E
不考虑顺序时:样本个数M
N! 5! 10 (N - n)!n! 3!2!
第二节 抽样误差
统计误差按产生的来源分类,有系统性误差和代表性误差。 一、抽样误差的概念 抽样误差是指由于抽样的随机性引起的样本指标值与被推 断的总体指标值之间的误差。
M
实际运用的计算公式: (重复抽样)
x
2
n
s n n
例1:某班组5个工人的日工 资为34、38、42、46、50元。
X 42
2 32
现用重复抽样的方法从5人中随机 抽2个构成样本。 共有25个样本。如右图。
样本 34,34 34,38 34,42 34,46 34,50 38,34 38,38 38,42 38,46 38,50 42,34 42,38 42,42 42,46 42,50
é ² ³ é µ Æ Å Ý ¸ ö Ê ý (¸ ö ) 2 4 11 71 84 18 7 3 200
é Ö × Ð Ö µ 875 925 975 1025 1075 1125 1175 1225
⒈求灯泡平均使用时间、标准差和灯泡合格 率(样本)
x
xf
f x x 53.63 n
重复抽样(放回)
例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5, n=2 A A A A A B B B B B C C A C B C E C D C D D D D D E E E E E
考虑顺序时:样本个数M N n 52 25
A B C D E B C D E
A
t F t
常用的置信度与置信概率
t F(t)
1
1.96 2 3 4
68.27%
95% 95.45% 99.73% 99.99%
例题:
某灯泡厂生产大量某种型号的灯泡,现采用抽样调查方法抽取500 只灯泡,对其进行质量检验。检查结果如表所示。 试计算平均耐用时间的抽样平均误差
耐用时间(小时 )
含义:也叫做“无放回抽样”、“不回置抽样”,是从全及总体中抽取第一个 样本单位,记录该单位有关标志表现后,这个样本单位,不再放回全及总体 中参加下一次抽选的方法。
特点:
(1)、每个单位最多只有一次被抽中的机会。 (2)、随着抽中单位的不断增多,剩下的单位被抽中的机会不断增大。 (3)、不重复抽样的误差小于重复抽样的误差。
。
总体
样本 抽取
参数
2
x xf x 、 x n f
p n1 n0 n1
2
s
2
推断 平均数 标准差、方差
x x
n 1
X P
统计量
x s、s 2 p
s
2
、
x x
f
2
f
1
成数
(三)抽样方法 1、重复抽样 含义:每次从总体中抽取的样本单位,经检验之后又重新放回总体, 参加下次抽样 特点是总体中每个样本单位被抽中的概率是相等的。 2、不重复抽样
三、抽样平均误差
抽样平均误差是反映抽样误差一般水平的统计指标,是最有可能出
现的样本指标(样本平均数或样本成数)的标准差,是所有样本指标和 总体指标间抽样实际误差的平均数。 抽样平均数的平均误差: 抽样成数的平均误差: p 理论上的计算公式: x
x
x
M i 1
i
X
2
样本平 均数 X 34 36 38 40 42 36 38 40 42 44 38 40 42 44 46
样本 46,34 46,38 46,42 46,46 46,50 50,34 50,38 50,42 50,46 50,50
来自百度文库
样本平 均数 X 40 42 44 46 48 42 44 46 48 50
X x P p 2 2 s
X X
n 1
2
点估计完全正确的概率几乎为0。 因此,我们更多的是考虑用样本统计量去估计总体 参数的范围 区间估计。
xf x f
926.4, 55.2
样本标准差
由概率保证程度0.9973,查表得概率度t=3 计算抽样极限误差
x
55.2 x n 500 2.47
t x 3 2.47 7.4
⑵p=0.4%
p
p1 p n
0.004 0.996 0.28% 500
例:
Æ Å µ Ý Ê ¹ Ó Ã Ê Ù Ã ü × Ê Á Ï
¹ Ã Ê Ó Ê ±ä ¼ (Ð ¡ Ê ±) 900Ò Ô Ï Â 900~950 950~1000 1000~1050 1050~1100 1100~1150 1150~1200 1200Ò Ô É Ï Ï Æ º ¼
求样本平均数和样本成数的抽样平均误差。
抽样误差是指在遵循了随机原则的条件下,不包括登记误 差和系统性误差在内的,用样本指标代表总体指标而产生 的不可避免的误差 系统性误差:可避免,难以计算难以控制。 抽样误差:不可避免但可控制
二、影响抽样误差的因素 ①抽样单位的数目 ②总体被研究标志的变异程度 ③抽样方法的选择 ④抽样组织方式不同
x 2
n
p
n
p 2
n p1 p n
重复抽样
不重复抽样
x
2 N n
n N 1
p
p1 p N n n N 1
注:现实中,平均数的标准差和成数的标准差都是针对总体而言的,都是未知的。 常用样本平均数代替总体平均数,用样本成数代替总体成数。
B
C
C D E
D D E
E
不考虑顺序时:样本个数M C
n N n 1
6! N n 1! 15 N 1!n! 4!2!
E
不重复抽样: 例如从A、B、C、D、E五个字母中随机抽取两个作为样本。N=5,n=2
A A B C D E B
C D E C
A B
D E
四、抽样涉及的基本概念有: (一)总体与样本 (二)总体指标和样本指标 (三)抽样方法
(一) 总体和样本
1.总体:指所要研究对象的全体,由许多客观存在的具有 某种共同性质的单位构成。 总体单位数用 N 表示。 2.样本:是从总体中按随机原则抽选出来的部分,由抽选 的单位构成。 样本单位数用 n 表示。 3.总体是唯一确定的,样本是不确定的、可变的、随机的 一般n大于30为大样本,小于30为小样本。
x
p
抽样平均误差是反映抽样误差一般水平的指标; 抽样极限误差是反映抽样误差的最大范围的指标.
四、抽样极限误差
x X x
p P p
p t p
x t x
样本指标和总体指标的误差 不超过一定范围的 概率保证程度
抽样极限误差的大小决定抽样推断的置信度(置信概率) t 抽样极限误差是t倍 t t--概率度 的抽样平均误差
组中值x (小时 )
灯泡数量 f(只 )
850以下
850-900 900-950
825
875 925
35
127 185 103 42 8
950-1000 975 1000-1050 1025 1050以上 1075 0.9973) 试求:⑴抽样极限误差(概率保证程度
⑵检查500个灯泡中不合格产品占0.4%,试在0.6827概率保证下,计算 抽样极限误差 合计 500
统计抽样法
本章重点: 1、抽样误差的计算及控制 2、总体平均数的区间估计 3、总体成数的区间估计 4、必要样本容量的确定 5、不同抽样组织方式之间的区别
统计抽样法理论
一、统计抽样法的构成 (一)抽样调查:科学获取样本数据的方法
抽样调查是非全面调查,它是按照随机原则从调查对(总体)中抽取 一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值 作出具有一定可靠性的的估计和推断的一种统计调查方法。
(二)抽样推断:根据样本的实际资料计算样本指标,在 一定的概率保证程度下,推断总体相应数量特征的一种统 计方法。是根据样本数据对总体数据进行估计或对总体假 设进行验证的方法。 包括: 1、参数估计 2、假设检验
二、抽样推断的特点 1、由部分推断总体 2、建立在随机原则的基础上,使样本具有代表性 3、运用概率估计法 可靠程度 4、抽样误差可以事先计算并加以控制 三、抽样推断的运用 1、无法进行或没必要进行全面调查时,使用抽样法 可以对总体有较好的认识。 2、使用抽样法对全面调查的结果加以补充或修正。 3、抽样法可用于对产品质量进行实时控制。 4、抽样法可以对假设进行检验,降低实验成本
概率保证程度为0.6827时,t=1
p
1 p 0.28%
第三节 抽样估计
一、抽样估计的概念和特点 1、抽样估计的概念
抽样估计(Sampling estimation)又称参数估计。 它是在抽样调查的基础上所进行的数据推测,即用抽样调 查所得到的一部分单位的数量特征来估计和推算总体的数 量特征。 抽样估计的方法: 点估计和区间估计