第六章 抽样推断

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

m
i
抽样方差
s =
2
å
n
( xi - x ) n
i= 1

s2=
å
m
( xi - x ) 2 fi
i= 1
å
å
fi
抽样标准差
s=
å
n
( xi - x ) n
2

å
s=
m
( xi - x ) 2 f i fi
i= 1
i= 1
10
属性总体的抽样指标
抽样成数 抽样平均数
n1 p n n0 n n1 q 1 p n n
i
- X)
2
样本可能数目
返回本节首页
17
二、抽样平均误差的计算
(一)抽样平均数的抽样平均误差 1、重复抽样: x
2、不重复抽样:
x 2 N n
n N 1
n
2
n 1 n N
:总体标准差。
n :样本单位数。 N :总体单位数。 注:(大样本时, 可以用样本标准差来代替)
31
(二)
x 、 p 与 p
、 x 的关系:
在统计学当中,常作如下处理:
x t x p t p
即:抽样极限误差常表示成抽样平均误差的倍数 t 称为 误差系数, 或 概率度。
32
(三)t = ? ( t 与 β 的关系)

t 越大, β 越大
F (t )
查表: P338页
第六章 抽样推断
本章内容
第一节 第二节 第三节 第四节 第六节 抽样推断的含义 抽样推断的基本概念 抽样平均误差 总体指标的推断 必要抽样单位数的确定
1
第一节
1、概念:
百度文库
抽样推断的含义
抽样推断是在抽样调查的基础上,按照随机 原则从总体中抽取一部分单位进行调查,并用调 查所得的指标数值来推断总体的指标数值一种统 计方法。
(一)全及指标(参数): 1、概念:根据全及总体各单位标志值 计算的、反映总体某种特征的指标。 2、种类:
①变量总体的全及指标 ②属性总体的全及指标
6
变量总体的全及指标
总体平均数
X
X
i 1
N
i

N
2
X F X F
i 1 i i
M
i
总体方差
s =
2
å
N
(Xi - X ) N
i= 1

s2=
其中:
总体标准差
s = P(1- P) = PQ
8
二、全及指标和抽样指标
(二)抽样指标(统计量): 1、概念:根据样本各单位标志值计算 的、反映样本特征的指标。 2、种类:
①变量总体的抽样指标 ②属性总体的抽样指标
9
变量总体的抽样指标
抽样平均数
x
x
i 1
n
i

n
2
x f x f
i 1 i i
返回本节首页
12
n BN N n
四、抽样方法(考虑抽取先后顺序)
1、不重复抽样: 从 N 个单位中每次抽取 1个,抽取后 不放回,一直到抽够 n 个单位。
样本数目
N! A = N ( N - 1)( N - 2)( N - n + 1) = ( N - n)!
n N
2、重复抽样: 从 N 个单位中每次抽取1个,抽取后将 其登记下来,再放回,一直到抽够n个单位。
那么,对于任一次抽样结果,
x- X p- P
x 和 p 称为:
x p
抽样极限误差
26
一、抽样极限误差
(一)概念: 置信度
在给定的概率保证程度 下,总体指标和 抽样指标之间误差的最大范围。具体的:
抽样平均数的抽样极限误差 x
x X
x
抽样成数的抽样极限误差 p
p P p
19
三、影响抽样平均误差的因素
1、样本单位数的多少。
抽样单位数越多,抽样平均误差越小。
2、总体各单位标志的变异程度。
总体标志变异程度越大,抽样平均误差越大。
3、抽样调查组织方式和抽样方法。
返回本节首页
20
例1 :某灯泡厂对10000个产品进行使用寿命检验,随 机抽取2%的样本进行测试,所得的资料如下:
3
一、全及总体和抽样总体
(一)全及总体 ⒈概念:总体,指所要认识的对象的全体。 ⒉全及总体的分类
属性总体(是非总体)
变量总体
⒊总体单位数:N
4
一、全及总体和抽样总体
(二)抽样总体 简称样本,是从全及总体中随机抽取出 来,作为代表这一总体的那部分单位组成的 集合体。 样本单位数:n
返回
5
二、全及指标和抽样指标
t
x
2 95 190 小时

950000 100 1 95 小时 100 2000




置信区间: x , x 45000 190,45000 190 4481045190小时 , x x 下一页
27
一、抽样极限误差
(二)总体的估计区间
若在置信度β下,抽样极限误差为Δ ,则: 1、抽样平均数的范围
x x X x x 2、抽样成数的范围
p p P p p
这便是总体的估计区间,又称:置信区间。
28
例1:要估计一批产品的合格率,从 1000 件 产品中抽取 200 件,其中有 10 件不合格品, 如果在90%的把握度下确定抽样极限误差为 2%,试估计产品合格率的范围。
返回
15
第三节
抽样平均误差
一、抽样平均误差的概念
二、抽样平均误差的计算 三、影响抽样平均误差的因素
返回本章首页
16
一、抽样平均误差的概念
抽样误差:样本指标与总体指标之间的离差。 例如: xi - X 、 pi - P 抽样平均误差:样本指标和总体指标的平均 离差。表示为: x 和 p
m=
x
å (x
21
(1)求灯泡平均使用时间、标准差和 灯泡合格率(样本) xi fi 1057 小时 x fi

xi x f
i
2
fi
53.63 小时
183 p 91.5% 200
22
(2)求灯泡使用时间抽样平均误差 x :
在重复抽样下:
x

n

53.63 200
3.792小时
在不重复抽样下:
x

N n n N 1
2
2
53.63 10000 200 3.754 小时 200 10000 1
23
(2)计算灯泡的合格率和合格率的抽样平均误差。 求灯泡合格率的抽样平均误差 p :
某电扇厂对其生产的2000台电扇进行使用 寿命检查,随机抽取100台(不重复抽样)检 验,平均使用寿命4.5万小时,方差为950000 小时2。 要求:以95.45%的可靠性估计这批电扇 平均使用寿命的可能范围。
平均误差: 极限误差:
x x

2
n 1 n N
样本成数 p = 190/200=95%
p P p
p p P p p
95% - 2% #P
95% + 2%
返回本节首页
29
93% #P
97%
二、抽样极限误差的计算
(一)引论:
思考:在置信度β(概率保证程度)下,有:
x X
问:
x 或

p P p
x ?
n 样本数目 BN = N n
返回本节首页
13
第五节
抽样组织设计
1、简单随机抽样:对总体不作任何处理,不进行任 何分类,从总体的全部单位中随机抽取样本单位。 2、类型抽样:先对总体各单位按照一定的标志分类, 然后从每类中随机抽取。 3、机械抽样:对研究的总体按一定的顺序排列,每 隔一定的间隔抽取的一种方法。 4、整群抽样:将总体划分为若干群,然后从总体中 随机选取若干群,对中选的群的所有单位进行一一 调查。 5、多阶段抽样:抽样过程分成几个阶段
在重复抽样下:
p
p 1 p n
0.915 0.085 1.972% 200
在不重复抽样下:


x

p 1 p N n n N 1
0.915 0.085 10000 200 1.952 % 200 10000 1 返回本节首页
n1:总体中具有某种属性的单位数目。 n0:总体中不具有某种属性的单位数目。 n0 n1 n
其中:
抽样标准差
s = p(1- p) = pq
返回本节首页
11
三、样本容量和样本可能数目
1、样本容量:指一个样本所包含的单位 数,记作: n 。 :大样本。 n 30 :小样本。 n 30 2、样本可能数目:又称样本个数,是指从 一个总体中可能抽取多少个样本。
p ?
30


(二)
D x 、 p 与 x
、mp 的关系:


对某一大学男生群体进行模拟抽样(总体平均体重 58千克);对每一种可能样本进行调查计算得: mx x 若允许的抽样极限误差与抽样平均误差相同时,推 断总体的平均体重是 x ± 1mx,推断的可靠程度为 0.6872。 若允许的抽样极限误差是抽样平均误差的2倍时, 推断总体的平均体重是 x ± 2m ,推断的可靠程度 x 为0.9545。 若允许的抽样极限误差是抽样平均误差的3倍时, 推断总体的平均体重是 x ± 3m ,推断的可靠程度 x 为0.9973。
å
M
( X i - X )2 Fi
i= 1
å
Fi
总体标准差
s=
å
N
(Xi - X ) N
2

å
s=
M
( X i - X ) 2 Fi
i= 1
i= 1
å
Fi
7
属性总体的全及指标
总体成数 总体平均数
N1 P N
N0 N N1 Q 1 P N N
N1:总体中具有某种属性的单位数目。 N 0:总体中不具有某种属性的单位数目。 N 0 N1 N
返回本章首页
14
类型抽样举例
假设某学校教师总数为 500 名,要求从中抽 取 50 名教师进行调查。 ①先将这些教师分类,如:按职称分类, 其中:助教 100 名,讲师 250名,副教授 100名,教授 50 名。 ②按照比例来抽取。即:助教中抽取 10名, 讲师中抽取 25 名,副教授中抽取 10 名, 教授中抽取 5 名。 这样一种方式就是类型抽样。

可以证明: F (t ) 是标准正态分布函数。
33
和 p ,x ①在 β= 0.8064 时, ? x ②在 β= 0.9371 时, p ? 例 2:已知
③在
x
95.45% 的概率保证程度下, 的变 X 化范围?
x 1.3 x
p 1.86 p
34
x 2 x X x 2 x
使用时间(小时) 抽样灯泡数(个) 使用时间(小时) 抽样灯泡数(个)
900以下
900—950 950—1000 1000—1050
2
4 11 71
1050—1100
1100—1150 1150—1200 1200以上
84
18 7 3
合计
200
按照质量规定,灯泡使用寿命在1000小时以上为合格 品。要求(1)计算样本灯泡的平均使用时间、标准差 和平均使用时间的抽样平均误差;(2)计算样本灯泡 的合格率和合格率的抽样平均误差。(包括重复抽样 与不重复抽两种情形)
三、置信区间的确定
步骤: 1、计算抽样极限误差
①计算抽样平均误差
② 求 t(由 F (t ) ,查表) ③写出抽样极限误差 t
x t x

p t p
2、估计总体指标的置信区间
x x X x x
p p P p p
36


从一批产品中随机抽取 500 件(允许重复) 进行质量检查,发现不合格产品有 35件。要 求:以 95% 的可靠性估计该产品不合格率的 区间。
18
二、抽样平均误差的计算
(二)抽样成数的抽样平均误差
1、重复抽样: p 2、不重复抽样:
p
P (1 P ) N n ( ) n N 1
P (1 P ) n
P:总体成数。 n :样本单位数。 N :总体单位数。 注:(大样本时,P 可以用样本成数p来代替)
返回本节首页
24
第四节 总体指标的推断
一、抽样极限误差 二、抽样极限误差的计算
三、置信区间的确定
返回本章首页
25
一、抽样极限误差
思考:抽样调查中 抽样误差 解决思路:
x
推断
X 或p
推断
P
x X
? 或
p P ?
在 95% 的把握下,将最大抽样误差限定在: x 或 D p
即:Max xi - X = D x Max pi - P = D p
2、特点:
①只抽取总体中一部分单位进行调查 ②抽取部分单位要遵循随机原则 ③用一部分单位的指标值去推断总体的指标值 ④抽样误差可以计算,并且可以控制 返回本章首页
2
第二节
抽样推断的基本概念
一、全及总体和抽样总体 二、全及指标和抽样指标 三、样本容量和样本可能数目 四、抽样方法 五、抽样的组织设计
返回本章首页
相关文档
最新文档