统计学第五章参数估计与假设检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
成数P=Ni/N
成数
Pˆ n / n i
所有可能的样本的成数( Pˆ1, Pˆ2 , Pˆn )所形成的分
布,称为样本成数的抽样分布。
•无限总体
均值:
E(Pˆ) E(ni / n) P
方wenku.baidu.com:
2 Pˆ
Pq
/
n
有限总体放回抽样?
•有限总体不放回抽样
均值:
E(Pˆ) E(ni / n) P
方差:
当n/N≤5% 时,有限总 体不放回抽 样等同于放 回抽样
统计量与抽样分布
•统计量:即样本指标。
样本均值 X X i n
如:
样本成数
ˆ P
ni
n
样本方差
S
2
n
1 1
(
X
i
X
)2
•抽样分布:某一统计量所有可能的样本的取值形成 的分布。
性质
0≤P(Xi)1 ∑P(Xi)=1
数字特征
均值E(X) 方差E[x-E(x)]2
将X变换为Z变量,即标准化
于是乎
P(98.8 X 100.9)
P( ) 98.899.8
x 99.8 100.999.8
5.48/ 12 5.48/ 12 5.48/ 12
(0.7) (0.63)
0.758 0.7357 1 0.4937
样本成数(即比例)的抽样分布(简称成数的分布) 抽样
E(x) x
2 x
2
n
(
N N
n 1
)
校正系数
从正态总体中抽样得到的均值的分布也服从正态分布。 从非正态总体中抽样得到的均值的分布呢?
中心极限定理:无论总体为何种分布,只要样本n足够大 (n≥30),均值标准化为(z)变量,必定服从标准正态分 布,均值则服从正态分布,即:
X ~ N(0,1), X ~ N(, 2 / n)或 X ~ N[, 2 ( N n)]
n
Z 2 2
2
/ X2
有限总体 不放回
正态总体,方差未知 总体均值
μ 非正态总体,n≥30
有限总体,n≥30(不放 回抽样)
X Z / n
2
X t (n1)S / n 2
X Z / n
2
X Z
2
n
N n N 1
总体成数的置信区间
待估计参 数θ
已知条件
无限总体, np和nq都大于5
总体成数 p 有限总体, np和nq都大于5
第五章 参数估计与假设检验
1 抽样分布 2 参数估计
3 假设检验的基本原理 4 几种常见的假设检验
总体参数
推断估计
抽样分布
参数估计
统计量
随机原则
假设检验
检验 推断统计:利用样本统计量对总体某些性质或数量 特征进行推断。
抽样分布
简单随机抽样和简单随机样本的性质
不放回 放回
放回 不放 回
独 立 性 和 同 一 性 同一性
P(1<U<2) 1
•解不等式 1<U<2 ˆL ˆU
评价准则:
置信度
随机区间
ˆˆ
( L ,U )
包含 的概率
(即可靠程度)越 大越好。
精确度
随机区间
ˆˆ
( L ,U )
的平均长度
ˆˆ
E(U , L )
(误差范围)越 小越好
总体均值的置信区间
待估计参 数θ
已知条件
置信区间
正态总体,方差已知
/ n
n N 1
结论:
1、无论是放回或不放回抽样,样本均值的数学期 望总是等于总体的均值;
2、样本均值的标准差即抽样误差,总是按一定比 例小于总体标准差,而且不放回抽样的抽样误差 比放回抽样误差小;
3、扩大样本容量,样本均值的标准差减小;
4、当总体为非正态分布时,样本均值的抽样分布 随着样本容量的扩大而趋近于正态分布。
2 Pˆ
Pq n
(
N N
n) 1
例:已知办公室人员所填写的表格中5%有笔误,检 查一个由475份表格组成的简单随机样本,问有笔误 的表格的成数在0.03和0.075之间的概率?
解:近似认为 pˆ 服从正态分布,均值=0.05,
方差=0.0001。
于是乎:
P(0.03 pˆ 0.075)
P( ) 0.030.05 0.01
pˆ 0.05 0.01
0.0750.05 0.01
(2.5) (2)
0.9938 0.9772 1 0.971
一个样本方差的抽样分布 从一个正态总体中抽样所得到的样本方差的分布
抽样
X ~ N(, 2)
n,S2
则 (n 1)S 2 / 2 ~ 2 (n 1)
当 n 30, 2分布趋近于正态分布 若X ~ 2 (n 1) 则 Z 2 2 2(n 1) ?
参数估计
•点估计 以样本指标直接估计总体参数。
评价准则:
无偏性
估计量 的数学期望等于总体参数,即 Eˆ
该估计量称为无偏估计。
有效性
ˆ
ˆ
ˆ
当为 的无偏估计时,方差 E( )2 越小,
无偏估计越有效。
一致性
对于无限总体,如果对任意>0
ˆ
,Lim n
P(|n
|
)
0
则称
ˆ
是
的一致估计。
充分性
一个统计量如能完全地包含未知参数信息 ,即为充分统计量,用该统计量估计时,称为 充分估计量。
置信区间
Pˆ Z
pˆ qˆ n
2
Pˆ Z
2
pˆ qˆ N n n N 1
总体方差的置信区间
待估计参 数θ
已知条件
置信区间
总体方差
正态总体
(n
1)S
2
2
2
,
(n 1)S
2 1 2
2
样本容量的确定
•估计总体均值μ时
P( X X ) 1
假定 X 服从正态分布。
无限总体
X
Z
2
n
•区间估计
定义
设θ是总体的未知参数, ˆL ˆL(x1, x2,xn), ˆU ˆU (x1, x2,xn) 是两个统计量,对于给定的α
(0< α <1),如果满足P(ˆL<<ˆU ) 1 ,则称
(ˆL,ˆU ) 是θ的置信度为1- α的置信区间。
步骤:
•构造一个合适的函数U,该函数与未知参数θ有关, 与其他未知参数无关,且U分布已知; •对给定的α,求一个λ1,一个λ2,使
例:某类产品的抗拉强度服从正态分布,平均值为 99.8公斤/平方厘米,标准差为5.48公斤/平方厘米,从 这个总体中抽出一个容量为12的样本,问这一样本的 平均值介于98.8公斤/平方厘米和100.9公斤/平方厘米 之间的概率?
解: X ~ N (99.8,5.482 ), X ~ N (99.8,5.482 /12)
样本均值的抽样分布(简称均值的分布) 抽样
均值μ=∑Xi/N
均值 X xi
n
样本均值是样本的函数,故样本均值是一个统计量, 统计量是一个随机变量,它的概率分布称为样本均值 的抽样分布。
•无限总体
均值:
方差:
E(x) x
2 x
2
n
有限总体放回抽样?
•有限总体不放回抽样
均值:
方差:
N n N 1