统计7抽样推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

则: 300 15(小时)
x
n
400
x
2 1 n
n N
3002 1 400 13.42(小时) 400 2000
计算结果表明:根据部分产品推断全部产品的平均使用寿命 时,采用不重复抽样比重复抽样的平均误差要小。
2019/11/7
13
(三)样本容量和样本个数
样本容量:一个样本包含的单位数。用 “n”表示。 一般要求 n ≥30大样本
样本个数:从一个全及总体中可能抽取的样本数目。
(四)重复抽样和不重复抽样
重复抽样:又称回置抽样。
考虑顺序时,可能组成的样本数目: N n
不考虑顺序时,可能组成的样本数目:
Cn N n1
不重复抽样:又称不回置抽样。
Xi

E
n i1
Xi

x

lim

P

n i1
Xi

n

x

n
n
D Xi i1
n n



1
x t2
e 2 dt (x)
2
2019/11/7
扬州大学管理学院
20
本定理的证明在20世纪20年代由林德伯格和莱 维给出,因证明较复杂,在此从略。
由于随机抽样的偶然因素使样本各单位的结构 不足以代表总体各单位的结构,而引起抽样指标和 全及指标之间的绝对离差为抽样误差。
2019/11/7
扬州大学管理学院
23
(二)影响抽样误差大小的因素
1、总体各单位标志值的变异程度 2、样本的单位数 3、抽样方法 4、抽样推断的组织形式
2019/11/7
扬州大学管理学院
2019/11/7
扬州大学管理学院
19
(林德伯格—莱维(Lindeberg-Lévy)中心极限 定理)
设{X n}是一相互独立同分布随机变量序列, EX i , DX i 2 , 0 2 , i 1, 2,
则对任意的实数,总有
lim


P

n i1
全及总体单位数(N)一般很大。
2019/11/7
扬州大学管理学院
9
样本(Sample) :
又称子样。是从全及总体中随机抽取出来 的,做为代表这一总体的部分单位组成的集 合体。样本单位总数用“n”表示。
样本选取的基本原则: 代表性:样本的每个分量都与总体有相同 的分布 独立性:样本的每个分量都是相互独立的
n
③可通过调整样本单位数来控制抽样平均误差。
2019/11/7
扬州大学管理学院
26
例题:假定抽样单位数增加 2 倍、0.5 倍时,抽样平均误差怎样变化?
解:抽样单位数增加 2 倍,即为原来的 3 倍
则: 1 0.577
x 3n 3
即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。
扬州大学管理学院
15
N
n N
C1N
C1N

C
1 N



C
1 N

NN
N N
Cn N n1

(N n 1)! n!(N 1)!
PNn

C
1 N
C1N 1
C1N 2



C
1 N
n1

N
(N
1) ( N

2) ( N

n
1)
C
n N
扬州大学管理学院
29
抽样成数平均误差的计算公式
采用重复抽样:
p
p1 p
n
采用不重复抽样: p
p1
p 1
n

n N
例题三: 某校随机抽选400名学生,发现戴眼镜的学 生有80人。根据样本资料推断全部学生中戴 眼镜的学生所占比重时,抽样误差为多大?
例题四:一批食品罐头共60000桶,随机抽查300桶, 发现有6桶不合格,求合格品率的抽样平均 误差?
2019/11/7
扬州大学管理学院
11
(二)参 数 和 统 计 量
参数: 指反映总体数量特征的综合指标。
参数
研究总体中 的数量标志
研究总体中 的品质标志
总体平均数
∑X X= N
∑XF X= ∑F
总体方差
σ
2=
Σ(X-X)2 N
σ
2=Байду номын сангаас
Σ(X-X)2F ΣF
总体成数
N1 P=
N
成数方差 σ 2 = P(1-P)
第七章 抽样推断
第一节 抽样推断的意义 第二节 抽样误差 第三节 抽样推断的方法 第四节 抽样调查的组织方式
2019/11/7
扬州大学管理学院
1
第一节 抽样推断的意义
一、抽样推断的概念和特点
1、概念: 抽样推断是按随机原则从全部研究对
象中抽取部分单位(样本)进行观察,并根据 样本的实际数据对总体的数量特征作出具 有一定可靠程度的估计和判断。
4
第一节 抽样推断的意义
3、特点: (1)它是由部分推断整体的一种认识方法。 (2)抽样推断建立在随机取样的基础上。
(3)抽样推断运用概率估计的方法。 (4)抽样推断的抽样误差是不可避免的, 但可以事先计算并加以控制。
2019/11/7
扬州大学管理学院
5
二、统计推断内容
1.统计学:
描述统计学:研究如何全面收集被研究客观事 物的数据资料并进行简缩处理,描述其群体特征 和数量规律性。
推断统计学:研究如何有效地收集和使用被 研究客观事物的不完整并且带有随机干扰的数据 资料,以对其群体特征和数量规律性给出尽可能 精确、可靠的推断性结论。
2019/11/7
扬州大学管理学院
6
2.推断统计 参数估计:由对部分进行观测取得的
数据对研究对象整体的数量特征取值给出 估计方法。
假设检验:由对部分进行观测取得的 数据对研究对象的数量规律性是否具有某 种指定特征进行检验。
考虑顺序时,可能组成的样本数目: PNn
不考虑顺序时,可能组成的样本数目:
C
n N
2019/11/7
扬州大学管理学院
14
抽样方法
重复抽样
1
是否考虑顺序 考虑顺序
3
2
不重复抽样
4
不考虑顺序
1考虑顺序的重复抽样; 2不考虑顺序的重复抽样; 3考虑顺序的不重复抽样; 4不考虑顺序的不重复抽样。
2019/11/7
18
2、抽样推断的理论基础:中心极限定理 人们已经知道,在自然界和生产实践中遇到的
大量随机变量都服从或近似服从正态分布,正因 如此,正态分布占有特别重要的地位。那么,如 何判断一个随机变量服从正态分布显得尤为重要。 如经过长期的观测,人们已经知道,很多工程测 量中产生的误差X都是服从正态分布的随机变量。 在什么条件下,lnim PYn x (x) , 这是十八世纪 以来概率论研究的中心课题,因而,从二十世纪 二十年代开始,习惯上把研究随机变量和的分布 收敛到正态分布的这类定理称为中心极限定理 (Central Limit Theorems)
样本容量有关,而且与抽样方法有关。
例题一:随机抽选某校学生100人,调查他们的体 重。得到他们的平均体重为58公斤,标 准差为10公斤。问抽样推断的平均误差 是多少?
例题二:某厂生产一种新型灯泡共2000只,随机 抽出400只作耐用时间试验,测试结果 平均使用寿命为4800小时,样本标准差 为300小时,求抽样推断的平均误差?
抽样单位数增加 0.5倍,即为原来的 1.5倍
则: 1 0.8165
x 1.5n 1.5
即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。
2019/11/7
扬州大学管理学院
27
采用不重复抽样: x
2 1 n
n N
公式表明:抽样平均误差不仅与总体变异程度、
2019/11/7
扬州大学管理学院
12
统计量:
研究数 量标志
研究品 质标志
2019/11/7
根据样本数据计算的综合指标。
样本平均数
样本标准差 样本成数 p
x
=
∑x n
x
=
∑xf ∑f
sx
2
xx n
sx
n =n
x

2
x
f
f
成数标准差 sp p1 p
扬州大学管理学院
24
二、抽样平均误差
1、概念:抽样平均误差是抽样平均数或抽样成数的 标准差。反映了抽样平均数与总体平均数 抽样成数与总体成数的平均误差程度。
2、计算方法:
抽样平均数 的平均误差

2
xi X
x
M
抽样成数 平均误差
p
pi P2
M
(以上两个公式实际上就是第四章讲的标准差。 但反映的是样本指标与总体指标的平均离差程度)
2019/11/7
扬州大学管理学院
2
第一节 抽样推断的意义
2、意义:
(1)有些现象是无法进行全面调查的,为 了测算全面资料,必须采用抽样调查的方法。 例如,对无限总体不能采用全面调查。另外, 有些产品的质量检查具有破坏性,不可能进 行全面调查,只能采用抽样调查。
(2)从理论上讲,有些现象虽然可以进行 全面调查,但实际上没有必要或很难办到, 也要采用抽样调查。
2019/11/7
扬州大学管理学院
7
统计推断的过程
总体
2019/11/7
样 本
扬州大学管理学院
样本统计量 如:样本的平均 数、比例、方差
8
三、有关抽样的基本概念
(一)全及总体和样本总体
全及总体(Population)是所要研究的 对象,又称母体,简称总体,它是 指所要认识的,具有某种共同性质 的许多单位的集合体。

PNn n!

N(N
1)( N
2)(N n!
n 1)

N! n!(N n)!
2019/11/7
扬州大学管理学院
16
四、抽样推断的理论基础 1、抽样推断的理论基础:大数(定律)法则
大数定律即关于大量的随机现象具有稳定 性质的法则。它说明如果被研究的总体是由大 量的相互独立的随机因素所构成,而且因素对 总体的影响都相对地小,那么对这些大量因素 加以综合平均的结果,因素的个别影响将相互 抵消,而呈现出它们共同作用的倾向,使总体 具有稳定的性质。
2019/11/7
扬州大学管理学院
10
随着样本容量的增大,样本对总体 的代表性越来越高,并且当样本单位数 足够多时,样本平均数愈接近总体平均 数。
对于一次抽样调查,全及总体是唯 一确定的,样本总体不是这样,样本是 不确定的,一个全及总体可能抽出很多 个样本总体,样本的个数和样本的容量 有关,也和抽样的方法有关。
2019/11/7
扬州大学管理学院
28
例题一解: 已知: n 100 , x 58, s 10
则: 10 1(公斤)
x
n
100
即:当根据样本学生的平均体重估计全部学生的平均 体重时,抽样平均误差为1公斤。
例题二解: 已知: N 2000 , n 400, x 4800 , s 300
2019/11/7
扬州大学管理学院
17
大数定律证明,如果随机变量总体存在着有 限的平均数和方差,则对于充分大的抽样单 位为n,可以以几乎趋近于1的概率,来期望 平均数与总体平均数的绝对离差为任意小, 即对于任意的正数a有:
式中: 为抽样平均数; 为总体平均数;n为 抽样单位数。
2019/11/7
扬州大学管理学院
2019/11/7
扬州大学管理学院
30
例 题 三 解:
已知: n 400 n1 80
2019/11/7
扬州大学管理学院
3
第一节 抽样推断的意义
(3)抽样调查的结果可以对全面调查的结 果进行检查和修正。
(4)抽样调查可以用于工业生产过程的质 量控制。 (5)利用抽样调查原理,可以对某些总体 的假设进行检验,来判别这种假设的真伪, 依决定行动的取舍。
2019/11/7
扬州大学管理学院
一、抽样误差 二、抽样平均误差 三、抽样极限误差 四、抽样误差的概率度
2019/11/7
扬州大学管理学院
22
第二节 抽 样 误 差
一、抽样误差的含义 (一) 统计误差有两种: 1、登记性误差:由于调查整理过程中登记错误 和计算不准而产生的。 2、代表性误差:由于用样本资料代表总体资料 而产生的,全面调查中不存在这种误差,其中由 于不按照随机原则抽样造成的误差为系统性误差,
由定理可知,当n充分大时,
n
X i n 近似
i 1
~ N (0, 1)
n
n
近似
Xi ~ N (n, n 2 )
i 1
1
n
n
Xi
i1
近似
~
N(,
2
) n
由于它对{X n} 的分布形式没有要求,因而得到 广泛使用。
2019/11/7
扬州大学管理学院
21
第二节抽样误差
2019/11/7
扬州大学管理学院
25
抽样平均数平均误差的计算公式:
采用重复抽样:

x
n
此公式说明,抽样平均误差与总体标准差成正比, 与样本容量开方成反比。(当总体标准差未知时, 可用样本标准差代替)
通过计算可说明以下几点: ①样本平均数的平均数等于总体平均数。
②抽样平均数的标准差仅为总体标准差的 1
相关文档
最新文档