第五章 抽样分布与参数估计

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

上一页
下一页
返回本节首页
2、抽样估计的特点
(1)用样本指标值推断总体的指标值 (2)样本的抽取要遵循随机原则
(3)抽样推断在方法上运用不确定的概率估计法
(4)抽样误差不可避免,但可以计算,并可以控 制。
上一页
下一页
返回本节首页

抽样估计在方法上运用的是不确定的概率估计法, 而不是确定的数学分析法。 抽样估计虽然也是利用样本数据来推断总体数据, 但是 因为样本数据和总体数据之间并不存在严格对 应的自变量和因变量的关系,因此不可能运用数学 函数关系建立一定的数学模型,用样本指标做自变 量,来推算因变量 — 总体指标。 抽样估计在实际中是先抽取一个样本,计算其相应 的指标值,然后要解决的问题是用样本指标来代替 相应的总体指标,其可靠程度(即概率)有多大, 这就是概率估计。
2
下一页
返回本节首页
29
二、抽样平均误差的涵义
是所有实际离差的平均数, 或:抽样平均数(样本指标)的标准差。 公式:

x
k i 1
i
X k
上一页
2
下一页
返回本节首页
某总体有三个数据:
序号 1 2 3 4 5 6 7 8
2、3、4,现从中按
放回抽样方法抽出两
个单位组成样本,结
果如下:
上一页


下一页
返回本节首页
二、有关抽样的基本概念
(一)全及总体和样本总体 (二)总体参数和样本统计量 (三)样本容量和样本个数 (四)放回抽样和不放回抽样
上一页
下一页
返回本章首页
(一)全及总体和抽样总体

1、全及总体(总体)
(1)定义:研究对象的全体。用 N 表示。
(2)分类:两种
变量总体:按数量标志分组而成。
15.3%
第5章 抽样分布 45
灯泡使用寿命资料
从10000件产中 随机抽取200件进 行质量检查: 假如耐用时数在 1000小时以下为 不合格。
使用时间 ( 小时 ) 抽查灯泡个数 (个 ) 900 以下 900~950 950~1000 1000~1050 1050~1100 1100~1150 1150~1200 1200 以上 合计 2 4 11 71 84 18 7 3 200
求抽样平均误差。
样本变量 ⑴ ⑵ 2 2 2 3 3 3 4 4
2 3 4 2 3 4 2 3
9
上一页 下一页 返回本节首页
4
4
第一步:先求 出各个样本的 平均数 x
i
序号 样本变量 样本 ⑴ ⑵ 平均数 1 2 2 2 2 2 3 2.5 3 2 4 3 4 3 2 2.5 5 3 3 3 6 3 4 3.5 7 4 2 3 8 4 3 3.5



DA、DB、DC、DD
不放回抽样: AB、AC、AD BA、BC、BD CA、CB、CD DA、DB、DC
(样本个数为42个)
(样本个数位4×3个)
下一页 返回本节首页
上一页
第二节 抽样误差
一、抽样误差的概念 二、抽样平均误差的涵义 三、抽样平均误差的具体计算方法 四、影响抽样平均误差的因素
㈠变量总体:抽样平均数的抽样平均误差
1、在重复抽样下:
x

2
n


n
上一页
在σ未知,可用样本 标准差 s 代替。
下一页 返回本节首页
2、在不重复抽样下:

x


n 1 n N
2
σ未知时也可用样本的标准差 s 代替.
上一页 下一页 返回本节首页
说明:
公式中的系数
n 1 N
第五章
抽样分布与参数估计(抽样推断)
本章内容
第一节 抽样估计的基本概念
第二节 抽样误差
第三节 总体指标推断(抽样估计)
第四节 抽样设计(抽样组织方式)
下一页 返回目录
第一节
抽样估计的基本概念
一、抽样估计的意义
二、有关抽样的基本概念
上一页
下一页
返回本章首页
一、抽样估计的意义
1、定义: 按照随机原则从总体中抽取一部分单位作 为样本,根据样本指标值对总体指标值做 出具有一定可靠程度的估计与推断。
抽样误差是随机误差。

C、抽样误差又分为:
实际误差和抽样平均误差。
第5章 抽样分布
上一页
下一页
返回本节首页
26
实际误差:
是指每一个样本平均数( x i )和总体 平均数( X )之间的离差,有 k 个, 如:
x X , x
1
2
X ..... xk X
上一页
下一页
返回本节首页
求:样本平均数(灯泡的平均耐用时数)和样 本成数(灯泡的合格率)的抽样平均误差。
1、首先根据样本资料求出灯泡平均使用时间的 标准差和灯泡合格率
样本的

x x f
2
f
53.63 小时
样本的
183 p 91.5% 200 上一页 下一页
返回本节首页
2 、求灯泡平均使用时间(抽样平均数) 抽样平均误差:
x xf x n f
2 2 2
x x x x s n f
f
变量样本的标准差
第5章 抽样分布
s
上一页
下一页
返回本节首页
16
(2)属性样本 第一,属性样本的平均数:
n1 p xp n
n0 q n
又称样本成数 不拥有某种属性的单位数在 样本中占的比重
属性总体:按品质标志分组,且只有两种表现。
上一页
下一页
返回本节首页
属性总体举例

产品按是否合格分: 分类 数量(件)


合格
不合格
990
10

合计
1000
上一页 下一页 返回本节首页
2、样本总体(简称样本)
(1)定义:从总体中按照随机原则抽取的部 分单位。用 n 表示。 有大样本和小样本之分, n 超过30为大样本, n 小于30为小样本 (2)分类:变量样本和属性样本
上一页
第5章 抽样分布
下一页
返回本节首页
11
(1)变量总体
第一,总体平均数:
X XF X N F
第二,总体方差或标准差
标准差:

X X
N
2

X X F F
2
标准差的平方即为方差
第5章 抽样分布

2
下一页 返回本节首页
12
上一页
(2)属性总体 第一,属性总体的平均数 P
第5章 抽样分布
39

重复抽样:
x


200 9.18(元) n 475
2
2
不重复抽样:
x
第5章 抽样分布

n 200 475 (1 ) (1 ) 8.94(元) n N 475 9500
40
2
2
(二)属性总体:抽样成数的抽样平均误差

重复抽样:
μ

p

pq n
上一页 下一页 返回本节首页
第二,属性样本的方差和标准差
方差: 标准差:
s pq p(1 p)
2 p
s
p
pq
p(1 p)
也可以用 σ 表示
第5章 抽样分布
上一页
下一页
返回本节首页
18
注意:在有些书上,样本标准差用s表示
s
x x
2
n 1
在计算器上,有σ和s按钮,σ代表总体标准差, S代表样本标准差。
上一页
下一页
返回本节首页
(三)样本个数和样本容量

1、样本个数:样本可能数目。指从一个 总体中可能抽取的样本个数。用 k 表示 2、样本容量:一个样本中所包含的单位 数,用 n 表示。
上一页 下一页 返回本节首页
20

第5章 抽样分布
(四)放回抽样和不放回抽样
1、放回抽样(重复抽样):从N个单位中每次抽取1 个,抽取后将其号码记下,再放回,一直抽取n个 单位组成一个样本。 每个单位被抽中的概率均为 1/ N
i
X k
Leabharlann Baidu
2
数理统计证明:样本平均数的平均数就等 于总体平均数。即:
x x
i
i
k
X
返回本节首页
34
第5章 抽样分布
上一页
下一页
三、
的具体计算方法
变量总体的:抽样平均数的抽样平均误差
属性总体的:抽样成数的抽样平均误差
每一种又分为重复抽样和不重复抽样的
p
x
上一页
下一页
返回本节首页
上一页 下一页 返回本节首页
(二)总体参数和样本统计量
参数: 唯一的、确定、未知的量 统计量:多样的、可变的、已知的
上一页
下一页
返回本节首页
1、总体参数
根据全及总体各单位标志值或标志属性计算的、 反映总体数量特征的指标。
(1)对于变量总体,有:
变量总体的平均数,方差或标准差 (2)对于属性总体,有: 属性总体的平均数,方差或标准差。
在重复抽样下,抽样平均误差:
x

n

53.63 200
3.79小时
上一页
下一页
返回本节首页
在不重复抽样下,抽样平均误差:

x


n (1- ) n N
2
53.632 200 (1) 200 10000
=3.75小时
3 、求灯泡合格率的(抽样成数)抽样平 均误差:
原本为
N n N 1
当N较大时,两者结果几乎相同。
n 计算时,要使用 1 N
第5章 抽样分布 38

某县城对9500户家庭进行年收入调查, 任抽取475户做样本,调查资料为:每户 年平均收入为2600元,各户年收入的均 方差为200元,试计算抽样平均误差。
上一页
下一页
返回本章首页
一、抽样误差的概念
1、抽样误差:
指样本指标与被估计的总体指标之间的 绝对离差。可表示为 :
xX
p-P
这种误差是抽样调查所固有的、 不可避免的,所以又称随机误差
上一页 下一页 返回本节首页
2、抽样误差的种类

A、误差分:登记性误差和代表性误差 B、代表性误差又分为:
系统误差和随机误差,
重复抽样下抽样平均误差:
p
第5章 抽样分布
44
从10000件产品中用不重复抽样的方法随 机抽取200件进行质量检查,发现不合格 品有10件,试计算产品合格率的抽样平 均误差.
解:因为 P=1-10/200=95%
μ
p

p(1 p) n 0.95(1 0.95) 200 1 1 n 200 N 10000
废品率的成数 :p=4/300=1.3%
废品率的抽样平均误差:
p
p(1 p) 0.013 0.987 2.1% n 300
第5章 抽样分布
43
(2)合格品率的成数 p=296/300=98.7%
合格品率的抽样平均误差:
p
p(1 p) 0.987 0.013 2.1% n 300
上一页
下一页
返回本节首页
2、不放回抽样(不重复抽样)
从N个单位中每次抽取1个,抽取后不放回, 一直抽取n个单位组成一个样本。 每个单位被抽中的概率依次为:
1/ N、1/(N-1)、1/(N-2)…
上一页
第5章 抽样分布
下一页
返回本节首页
22

如有4个数据:A、B、C、D,从中抽取样本容量为2的样 本 放回抽样:AA、AB、AC、AD BA、BB、BC、BD CA、CB、CC、CD
N1 P Xp N
P 又称为成数,拥有某 种属性的单位数在总体 中所占的比重。
N0 Q N
Q代表不拥有某种属性的单位 数在总体中所占的比重。
上一页
下一页
返回本节首页

第二,属性总体的方差或标准差
方差:
标准差:

σ
2
p
PQ P (1- P)

σ
PQ P ( 1 P ) p
上一页
第5章 抽样分布
9
返回本节首页
4
4
4
下一页
32
第二步,计算各个样本平均数 (即2、2.5、 3、2.5、3、3.5、3、3.5、4 )的标准差, 即为抽样平均误差,即
x x i i x 0.577 k
上一页 下一页 返回本节首页
2

x
k i 1
上一页
第5章 抽样分布
下一页
返回本节首页
14
2、样本统计量
据根样本各单位标志值或标志属性计算的、 反映样本数量特性的指标。 (1)对于变量样本,有: 变量样本的平均数、方差或标准差 (2)对于属性样本,有: 属性样本的平均数、方差或标准差。
上一页 下一页 返回本节首页
(1)变量样本
变量样本的平均数 变量样本的方差
K 个实际离差可写成:
x1 X x2 X x3 X ......... xk X
第5章 抽样分布
对这 k 个实际离差求平均, 即为抽样平均误差。
上一页
下一页
返回本节首页
28
抽样平均误差:是所有实际离差的平均数。 用公式表示:

第5章 抽样分布
x
k i 1
i
X k
上一页
p(1 p) n
不重复抽样:
μ
p

pq n 1 n N
p(1 p) n 1 n N

例如: 对某产品进行质量检查,随机重复抽取 300件,发现有废品4件,试计算:
(1)废品率的抽样平均误差
(2)合格品率的抽样平均误差
第5章 抽样分布
42
解(1):
相关文档
最新文档