第六章统计推断
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-7-1
Δ
x
x
27
x x x xx
第五章 抽样推断
2.3 区间估计
2. 概率的确定:
只要样本平均数 x 在以总体 平均数 为中心、以 Δ 为半径的 X 区间内,则总体平均数 就会落 X 在以样本平均数 为中心、以 Δ x 为半径的区间内。
2014-7-1 第五章 抽样推断 28
第六章
统计 推 断
第一节 统计推断及其特点
第二节 参数估计 第三节 假设检验
第一节
统计推断及其特点
1.1 统计推断的特点 1.2 总体参数和样本统计量 1.3 统计推断的基本条件
1.4 统计推断的误差
1.1 统计推断及其特点
统计推断(抽样推断)
— 按随机原则从总体中抽取部分单位构成 样本,在一定的可靠程度下,根据样本的数 量特征对总体的数量特征加以推断的方法。 统计推断的方法:
Δ
x
x
Δ
x
2014-7-1
第五章 抽样推断
36
2.3 区间估计
2. 给 定 , 已 知 X , 总 体 平 均 数 的 估 计 :
步骤 (1) (2)
内
容
抽样,计算 x 区 间 的 中 心
计 算 抽 样 平 均 误 差 : X
n
计算 Z 查表 (Z ) 2(Z ) 1 F (Z )
2.2 点估计
优良估计量的三个标准:
2.一致性:
样 本 总体 P ε 1 lim n 统计量 参数
xX ε
第五章 抽样推断
lim P
n
2014-7-1
1
19
2.2 点估计
优良估计量的三个标准:
σ x
σX n
x
X
X
2014-7-1
极限误差标准化的意义:
x ~ N X , μ2 Z~N ( 0, 1 )
S
Δ Δ
Z μ
X
X
X
Z
百度文库0 Z
2014-7-1
第五章 抽样推断
14
第二节
参数估计
2.1 参数估计概述 2.2 点估计 2.3 区间估计
2.4 样本容量的确定
2.1 参数估计概述
参数估计就是以样本统计量来估计总 体参数。 参数估计要求:
1.4 统计推断的误差
统计误差的分类
登记性误差
可消除
统 计 误 差
代表性误差
系统误差
可消除
抽样误差
可控制
2014-7-1
第五章 抽样推断
8
1.4 统计推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2014-7-1 第五章 抽样推断 9
Δ
x
x
第五章 抽样推断 31
2.3 区间估计
1
给定F Z ,求, 进行区间估计
X : F Z 1
Z
Δ
x
x
Δ
x
2014-7-1
第五章 抽样推断
32
2.3 区间估计
1. 给 定 F Z , 已 知 X , 总 体 平 均 数 的 估 计 :
生平均每天参加体育锻炼的时间。
2014-7-1 第五章 抽样推断 41
2.3 区间估计
已 知 :n 25 F Z 95% x 25 分 钟 S x 8 分 钟
【 解 】 =
Sx n
8 25
1.6分 钟
由 F t 95% t 0 .05 2 25 1 2.064
x X x
2014-7-1
; p P p
第五章 抽样推断
12
1.4 统计推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标
准单位对极限误差的度量值。由Z 确定的概
率保证程度F(Z)—置信度。
2014-7-1 第五章 抽样推断 13
1.4 统计推断的误差
民每天看电视的平均时间的置信区间。
(要求估计误差不超过27分钟)
2014-7-1 第五章 抽样推断 38
2.3 区间估计
已知: X 1.5 小 时 n 100 27分 钟 0.45小 时 x 4 小 时
【 解 】 =
X
n
1 .5 100
总体变化不大,采用过去总体指标数值做
代替;
用样本标准差σ(x) 或样本成数 对于成数,可取
p 替代;
P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2014-7-1 11
第五章 抽样推断
1.4 统计推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示, 可简称为极限误差或允许误差。
2
P
p p1 p
22
第五章 抽样推断
2.2 点估计
样本方差
符号 公式
2 x
S 2 x
2
x x
n
x x
n 1
2
反映样本的 作用 离散程度
2014-7-1 第五章 抽样推断
推断总体
23
2.2 点估计
总体参数的点估计:
缺点: 优点: 原则:总体参数估计值就取统
2.3 区间估计
P x X x 1 α
x x
X
x
x 的分布
S
Δ
X
2014-7-1
x
Δ
P X x X 1
其中, α为风险度
第五章 抽样推断 29
2.3 区间估计
极限误差的标准化: x ~N X ,
2
Z~N 0 , 1
Z
x X
S
Δ Δ
S
X
Z
X
X
Z
0
Z
和 Z
30
2014-7-1
第五章 抽样推断
2.3 区间估计
二 总体平均数的区间估计:
X : F Z 1
F Z , Z F Z Z
Δ
x
2014-7-1
(置信度是 95%)
2014-7-1 第五章 抽样推断 34
2.3 区间估计
已知: X 1.5 小 时 n 100 F Z 95% x 4 小 时
【 解 】 =
X
n
1 .5 100
0.15小 时
由 F Z 95% (Z ) 0.975 Z 1.96
1.4 统计推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,
它反映样本平均数(样本成数)与总体
平均数(总体成数)之间的平均差异程
度。
x
2014-7-1
X
n
p
P 1 P n
10
第五章 抽样推断
1.4 统计推断的误差
总体标准差σ(X)和成数P的确定:
(4)
根 据 x 和 : X : x ,x
第五章 抽样推断
37
2014-7-1
2.3 区间估计
【例 5-3】某地区电视台委托调查公司估计 该地区居民平均每日看电视时间。调查公司随 机抽取了100名居民进行调查,样本数据显示 平均每人每天看电视时间为 4 小时。如果已知 总体的标准差σ = 1.5 小时。试求该地区内居
1. 精确性—适当的极限误差范围;
2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2014-7-1 第五章 抽样推断 16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。 常用的点估计量有:
ˆ x X
0.15小 时
0.45 Z 3 0.15
F 3 2(3) 1 99.74%
X : 4 0.45, 4 0.45 3.55, 4.45小 时
2014-7-1 第五章 抽样推断 39
2.3 区间估计
3.总体方差未知,总体平均数的估计
总体方差未知,可用样本标准差 S 代替总 体标准差σ,计算抽样平均误差μ。
p p 1 p
第五章 抽样推断 6
1.3 统计推断的基本条件
统计推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2014-7-1 第五章 抽样推断 7
第五章 抽样推断
2014-7-1
33
2.3 区间估计
【例 5-2】某地区电视台委托调查公司估计 该地区居民平均每日看电视时间。调查公司随 机抽取了100名居民进行调查,样本数据显示 平均每人每天看电视时间为 4 小时。如果已知 总体的标准差σ = 1.5 小时。试求该地区内居
民每天看电视的平均时间的置信区间。
4
1.2 总体参数和样本统计量
总体参数与样本统计量的比较 总体参数
含义 性质 特点 常见 目的
2014-7-1
样本统计量
样本的指标 不唯一、随机变量 易求
总体的指标 唯一、常量 未知
X、P、 X
x、p、S x
利用样本统计量推断总体参数
第五章 抽样推断 5
1.2 总体参数和样本统计量
总体参数和样本统计量的计算公式
总体参数
X1 X 2 X N X N
样本统计量
x1 x2 xn x n
P N1 N
p n1 n
2
X
X X
N
S x
x-x
n1
2
P P 1 P
2014-7-1
Z 1.96 0.15 0.29小 时
X : 4 0.29, 4 0.29 3.71, 4.29小 时
2014-7-1 第五章 抽样推断 35
2.3 区间估计
2
给定,求F Z , 进行区间估计
Z
X : F Z 1
t
x X x X ~ t 2 n 1 分 布 Sx n
t
2014-7-1
X : x ,x
第五章 抽样推断
40
2.3 区间估计
【例 5-4】 从某校学生中随机抽取 25人,调查到他们平均每天参加体育
锻炼的时间为25分钟,标准差为8分
钟。试以95%的置信水平估计该校学
2014-7-1 第五章 抽样推断 25
2.3 区间估计
1. 区间的确定:
Δ
1. 区间的中心
x
Δ
x
x
p — 统计量的值,如: x 、 2. 区间的半径 Δ — 允许(极限)误差。
2014-7-1 第五章 抽样推断 26
2.3 区间估计
2. 概率的确定:
x- X
x 的分布
Δ
X
x x x
步骤 (1) (2)
内
容
抽样,计算 x 区 间 的 中 心
计 算 抽 样 平 均 误 差 : X
查表
n
根据 F Z 2(Z ) 1 Z
(4) (5)
Z —估 计 区 间 半 径 计算极限误差:
写 出 估 计 区 间X : x ,x
—总体参数的估计
—总体参数的假设检验。
2014-7-1 第五章 抽样推断 3
1.1 统计推断及其特点 统计推断的特点
1. 统计推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。
4. 可对全面调查的结果进行检验和修正。
2014-7-1
第五章 抽样推断
2014-7-1
2 ( x x )
ˆ p ˆ 2 S2 P
n1
第五章 抽样推断
17
2.2 点估计
优良估计量的三个标准: 1.无偏性:
E (统计量) = 总体参数
样本平均数— E x x X
样本成数— E p p P
2014-7-1 第五章 抽样推断 18
第五章 抽样推断
20
2.2 点估计
优良估计量的三个标准:
3. 有效性:
σ
2
优良估计量 σ 其他估计量
2
σ
2
x σ
2
c
21
2014-7-1
第五章 抽样推断
2.2 点估计 总体参数
X
P
优良估计量
x
p
2
X
S
2
x x x
n1
2
2
2014-7-1
计量的值 1. 简单明了; 无法提供误差情况; 1.
ˆ p 估计的可靠程度无 P x X 能提供具体估计值。 作用: 区间估计的基础。 从知晓。
2. 2.
2014-7-1 第五章 抽样推断 24
2.3 区间估计
一 区间估计的含义:
总体参数
θ
ˆ 1
概率 P=1-α=?
ˆ 1
区间大小 — 估计的精确性; 概率高低 — 估计的准确性。
Δ
x
x
27
x x x xx
第五章 抽样推断
2.3 区间估计
2. 概率的确定:
只要样本平均数 x 在以总体 平均数 为中心、以 Δ 为半径的 X 区间内,则总体平均数 就会落 X 在以样本平均数 为中心、以 Δ x 为半径的区间内。
2014-7-1 第五章 抽样推断 28
第六章
统计 推 断
第一节 统计推断及其特点
第二节 参数估计 第三节 假设检验
第一节
统计推断及其特点
1.1 统计推断的特点 1.2 总体参数和样本统计量 1.3 统计推断的基本条件
1.4 统计推断的误差
1.1 统计推断及其特点
统计推断(抽样推断)
— 按随机原则从总体中抽取部分单位构成 样本,在一定的可靠程度下,根据样本的数 量特征对总体的数量特征加以推断的方法。 统计推断的方法:
Δ
x
x
Δ
x
2014-7-1
第五章 抽样推断
36
2.3 区间估计
2. 给 定 , 已 知 X , 总 体 平 均 数 的 估 计 :
步骤 (1) (2)
内
容
抽样,计算 x 区 间 的 中 心
计 算 抽 样 平 均 误 差 : X
n
计算 Z 查表 (Z ) 2(Z ) 1 F (Z )
2.2 点估计
优良估计量的三个标准:
2.一致性:
样 本 总体 P ε 1 lim n 统计量 参数
xX ε
第五章 抽样推断
lim P
n
2014-7-1
1
19
2.2 点估计
优良估计量的三个标准:
σ x
σX n
x
X
X
2014-7-1
极限误差标准化的意义:
x ~ N X , μ2 Z~N ( 0, 1 )
S
Δ Δ
Z μ
X
X
X
Z
百度文库0 Z
2014-7-1
第五章 抽样推断
14
第二节
参数估计
2.1 参数估计概述 2.2 点估计 2.3 区间估计
2.4 样本容量的确定
2.1 参数估计概述
参数估计就是以样本统计量来估计总 体参数。 参数估计要求:
1.4 统计推断的误差
统计误差的分类
登记性误差
可消除
统 计 误 差
代表性误差
系统误差
可消除
抽样误差
可控制
2014-7-1
第五章 抽样推断
8
1.4 统计推断的误差
抽样误差
1. 抽样实际误差:
对某一样本而言,由随机因素引起的 样本统计量与总体参数在数量上的差异 就是抽样实际误差。
xX
2014-7-1 第五章 抽样推断 9
Δ
x
x
第五章 抽样推断 31
2.3 区间估计
1
给定F Z ,求, 进行区间估计
X : F Z 1
Z
Δ
x
x
Δ
x
2014-7-1
第五章 抽样推断
32
2.3 区间估计
1. 给 定 F Z , 已 知 X , 总 体 平 均 数 的 估 计 :
生平均每天参加体育锻炼的时间。
2014-7-1 第五章 抽样推断 41
2.3 区间估计
已 知 :n 25 F Z 95% x 25 分 钟 S x 8 分 钟
【 解 】 =
Sx n
8 25
1.6分 钟
由 F t 95% t 0 .05 2 25 1 2.064
x X x
2014-7-1
; p P p
第五章 抽样推断
12
1.4 统计推断的误差
Δ和μ的关系:
Z
Z
Z —概率度,Z 表示以抽样平均误差为标
准单位对极限误差的度量值。由Z 确定的概
率保证程度F(Z)—置信度。
2014-7-1 第五章 抽样推断 13
1.4 统计推断的误差
民每天看电视的平均时间的置信区间。
(要求估计误差不超过27分钟)
2014-7-1 第五章 抽样推断 38
2.3 区间估计
已知: X 1.5 小 时 n 100 27分 钟 0.45小 时 x 4 小 时
【 解 】 =
X
n
1 .5 100
总体变化不大,采用过去总体指标数值做
代替;
用样本标准差σ(x) 或样本成数 对于成数,可取
p 替代;
P = 0.5;如果有多个 P 值,
取其最接近 0.5 的P 做替代。
2014-7-1 11
第五章 抽样推断
1.4 统计推断的误差
3. 抽样极限(允许)误差
是样本统计量与被估计的总体参数之 绝对离差的最大允许值,常用Δ表示, 可简称为极限误差或允许误差。
2
P
p p1 p
22
第五章 抽样推断
2.2 点估计
样本方差
符号 公式
2 x
S 2 x
2
x x
n
x x
n 1
2
反映样本的 作用 离散程度
2014-7-1 第五章 抽样推断
推断总体
23
2.2 点估计
总体参数的点估计:
缺点: 优点: 原则:总体参数估计值就取统
2.3 区间估计
P x X x 1 α
x x
X
x
x 的分布
S
Δ
X
2014-7-1
x
Δ
P X x X 1
其中, α为风险度
第五章 抽样推断 29
2.3 区间估计
极限误差的标准化: x ~N X ,
2
Z~N 0 , 1
Z
x X
S
Δ Δ
S
X
Z
X
X
Z
0
Z
和 Z
30
2014-7-1
第五章 抽样推断
2.3 区间估计
二 总体平均数的区间估计:
X : F Z 1
F Z , Z F Z Z
Δ
x
2014-7-1
(置信度是 95%)
2014-7-1 第五章 抽样推断 34
2.3 区间估计
已知: X 1.5 小 时 n 100 F Z 95% x 4 小 时
【 解 】 =
X
n
1 .5 100
0.15小 时
由 F Z 95% (Z ) 0.975 Z 1.96
1.4 统计推断的误差
2. 抽样平均(标准)误差:
抽样平均误差是抽样平均数的标准差,
它反映样本平均数(样本成数)与总体
平均数(总体成数)之间的平均差异程
度。
x
2014-7-1
X
n
p
P 1 P n
10
第五章 抽样推断
1.4 统计推断的误差
总体标准差σ(X)和成数P的确定:
(4)
根 据 x 和 : X : x ,x
第五章 抽样推断
37
2014-7-1
2.3 区间估计
【例 5-3】某地区电视台委托调查公司估计 该地区居民平均每日看电视时间。调查公司随 机抽取了100名居民进行调查,样本数据显示 平均每人每天看电视时间为 4 小时。如果已知 总体的标准差σ = 1.5 小时。试求该地区内居
1. 精确性—适当的极限误差范围;
2. 可靠性—估计结果正确的概率。
参数估计—点估计和区间估计。
2014-7-1 第五章 抽样推断 16
2.2 点估计
点估计就是根据总体参数与样本统计 量之间的内在联系,直接以样本统计量 作为相应总体参数的估计值,点估计又 称为定值估计。 常用的点估计量有:
ˆ x X
0.15小 时
0.45 Z 3 0.15
F 3 2(3) 1 99.74%
X : 4 0.45, 4 0.45 3.55, 4.45小 时
2014-7-1 第五章 抽样推断 39
2.3 区间估计
3.总体方差未知,总体平均数的估计
总体方差未知,可用样本标准差 S 代替总 体标准差σ,计算抽样平均误差μ。
p p 1 p
第五章 抽样推断 6
1.3 统计推断的基本条件
统计推断的基本条件
1. 选择统计量—优良估计量。 2. 合适的允许误差—精确性。 3. 可接受的置信度—可靠性。
精确性和可靠性是一对矛盾。要根据问 题的性质和研究的需要在二者间权衡。
2014-7-1 第五章 抽样推断 7
第五章 抽样推断
2014-7-1
33
2.3 区间估计
【例 5-2】某地区电视台委托调查公司估计 该地区居民平均每日看电视时间。调查公司随 机抽取了100名居民进行调查,样本数据显示 平均每人每天看电视时间为 4 小时。如果已知 总体的标准差σ = 1.5 小时。试求该地区内居
民每天看电视的平均时间的置信区间。
4
1.2 总体参数和样本统计量
总体参数与样本统计量的比较 总体参数
含义 性质 特点 常见 目的
2014-7-1
样本统计量
样本的指标 不唯一、随机变量 易求
总体的指标 唯一、常量 未知
X、P、 X
x、p、S x
利用样本统计量推断总体参数
第五章 抽样推断 5
1.2 总体参数和样本统计量
总体参数和样本统计量的计算公式
总体参数
X1 X 2 X N X N
样本统计量
x1 x2 xn x n
P N1 N
p n1 n
2
X
X X
N
S x
x-x
n1
2
P P 1 P
2014-7-1
Z 1.96 0.15 0.29小 时
X : 4 0.29, 4 0.29 3.71, 4.29小 时
2014-7-1 第五章 抽样推断 35
2.3 区间估计
2
给定,求F Z , 进行区间估计
Z
X : F Z 1
t
x X x X ~ t 2 n 1 分 布 Sx n
t
2014-7-1
X : x ,x
第五章 抽样推断
40
2.3 区间估计
【例 5-4】 从某校学生中随机抽取 25人,调查到他们平均每天参加体育
锻炼的时间为25分钟,标准差为8分
钟。试以95%的置信水平估计该校学
2014-7-1 第五章 抽样推断 25
2.3 区间估计
1. 区间的确定:
Δ
1. 区间的中心
x
Δ
x
x
p — 统计量的值,如: x 、 2. 区间的半径 Δ — 允许(极限)误差。
2014-7-1 第五章 抽样推断 26
2.3 区间估计
2. 概率的确定:
x- X
x 的分布
Δ
X
x x x
步骤 (1) (2)
内
容
抽样,计算 x 区 间 的 中 心
计 算 抽 样 平 均 误 差 : X
查表
n
根据 F Z 2(Z ) 1 Z
(4) (5)
Z —估 计 区 间 半 径 计算极限误差:
写 出 估 计 区 间X : x ,x
—总体参数的估计
—总体参数的假设检验。
2014-7-1 第五章 抽样推断 3
1.1 统计推断及其特点 统计推断的特点
1. 统计推断必须遵循随机原则。 2. 对抽样误差可以事先加以计算和控制。 3. 具有经济性、时效性,应用广泛的特点。
4. 可对全面调查的结果进行检验和修正。
2014-7-1
第五章 抽样推断
2014-7-1
2 ( x x )
ˆ p ˆ 2 S2 P
n1
第五章 抽样推断
17
2.2 点估计
优良估计量的三个标准: 1.无偏性:
E (统计量) = 总体参数
样本平均数— E x x X
样本成数— E p p P
2014-7-1 第五章 抽样推断 18
第五章 抽样推断
20
2.2 点估计
优良估计量的三个标准:
3. 有效性:
σ
2
优良估计量 σ 其他估计量
2
σ
2
x σ
2
c
21
2014-7-1
第五章 抽样推断
2.2 点估计 总体参数
X
P
优良估计量
x
p
2
X
S
2
x x x
n1
2
2
2014-7-1
计量的值 1. 简单明了; 无法提供误差情况; 1.
ˆ p 估计的可靠程度无 P x X 能提供具体估计值。 作用: 区间估计的基础。 从知晓。
2. 2.
2014-7-1 第五章 抽样推断 24
2.3 区间估计
一 区间估计的含义:
总体参数
θ
ˆ 1
概率 P=1-α=?
ˆ 1
区间大小 — 估计的精确性; 概率高低 — 估计的准确性。