统计学课件第七章_PPT幻灯片
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
点估计 (point estimate)
1、用样本的估计量直接作为总体参数的估计值
▪ 例如:用样本均值直接作为总体均值的估计 ▪ 例如:用样本的方差直接作为总体方差的估计
2、没有给出估计值接近总体参数程度的信息
区间估计
区间估计是按预先给定的概率(1)所确定的包含未知总体 参数的一个范围。该范围称为参数的可信区间或置信区间 (confidence interval, CI);
抽样估计的过程
总体
样
样本统计量
本
例如:样本均
值、比例
参数估计的一般问题
参数估计:用样本统计量估计去估计参数
估计量:用来估计总体参数的统计量。 估计值:根据样本计算出来的估计量的数值。
参数估计的方法
点估计: 区间估计:
随机误差
实际误差
某一样本的估计值与总体参数之间的实际离差。
抽样误差(抽样平均误差) x
3. 用一个具体的样本所构造的区间是一个特定的区 间,我们无法知道这个样本所产生的区间是否包 含总体参数的真值
我们只能是希望这个区间是大量包含总体参数真值的 区间中的一个,但它也可能是少数几个不包含参数真 值的区间中的一个
总体参数以一定的概率落在这一区间的表述是错误的
置信区间与置信水平
均值的抽样分布
Pi 6.25 12.5 6.25 12.5 25 12.5 6.25 12.5 6.25 100
例如:不重复
x 样本平均数( i)
45 55
样本平均数的个数(个) 2
2
60 65 75 合计
4
2
2
12
频率(%)
16.67 16.67 33.32 16.67 16.67 100.00
P { 5 x 5 6 } 1 5 .6 6 3 7 .3 3 1 2 .6 6 6 7 .6 % 6 7
P { 5 6 5 0 x X 6 6 5} 0 1.6 6 7 3.3 3 1 2.6 6 7 6.6 6 % 7 P { 5 x X 5 } 6.6 6 % 7
P{xX5}6.6% 7
抽样极限误差 △
P{xXx}1
P { X x } 1
x
x
P { x X x } 1
所有可能的样本指标(估计值)与总体(参数) 之间平均的差异。即所有可能的样本指标的标准差
抽样的极限误差 △
一定概率条件下的抽样误差的可能范围
抽样平均误差理论公式
()
()2
M
(x)
(xX)2 (p) (pP)2
M
M
样本均值的抽样分布
1. 样本均值的数学期望(无偏性)
E(x)
2. 样本均值的方差
成功
失败
射击
命中
不中
考试
及格
不及格
产品
合格
不合格
选举
同意
不同意
比例
(proportion)
1. 总体(或样本)中具有某种属性的单位与全部单 位总数之比
不同性别的人与全部人数之比
合格品(或不合格品) 与全部产品总数之比
2. 总体比例可表示为
N1 或1N0
N
N
3. 样本比例可表示为
4.
pn1 或1pn0
x
x
极限误差
Pˆ 1
总体均值 X = E(x) 设总体的标准差为
x 由中心极限定理得 服从正态分布
x~
2
N(X, )
n
由中心极限定理 (xX) ~N(0,1)
/ n
xX
P(
z) 1
/ n
P(xXz/ n)1
xX z/ n 得到极限误差
x
z /
n
抽样估计的基本方法
点估计 区间估计
x
/2
1 –
/2
x
x
(1 - ) 区间包含了 的区间未包含
抽样估计
从总体中抽取 x1,样 x2,.本 ..x,n,
得到样本x均 值 xi
nn
2
(xi x)
S2 i1
n 1
用样本均值 x 估计总体均值 X
抽样估计误差为
xXz
n
总体比例(成功率)的估计
有些社会随机现象中只有两个结果:成功与失败
n
n
样本比例的抽样分布
1. 当样本容量很大时,样本比例的抽样分布 可用正态分布近似
2. 推断总体比例的理论基础
置信下限
置信上限
区间估计的图示
xz2x
x
- 2.58x
x
-1.65 x
+1.65x +2.58x
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
置信水平
(confidence level)
1. 将构造置信区间的步骤重复很多次,置信 区间包含总体参数真值的次数所占的比例 称为置信水平
区间估计 (interval estimate)
1. 在点估计的基础上,给出总体参数估计的一个区间范围,该 区间由样本统计量加减抽样极限误差而得到的
2. 根据样本统计量的抽样分布能够对样本统计量与总体参数的 接近程度给出一个概率度量
比如,某班级平均分数在75~85之间,置信水平是95%
置信区间
样本统计量 (点估计)
预先给定的概率(1)称为可信度或置信度(confidence level),常取95%或99%。 可 信 区 间 通 常 由 两 个 数 值 即 可 信 限 / 置 信 限 (confidence limit, CL)构成。其中较小的值称可信下限(lower limit, L) ,较大的值称可信上限(upper limit, U),一般表示为LU。
重复抽样
2 x
2
n
抽样平均误差的实际公式
(由中心极限定理)
重复抽样条件下:
抽样平均数的抽样平均误差
பைடு நூலகம்
x
n
抽样成数抽样平均误差
p
n
p(1p) n
不重复抽样条件下:
抽样平均数的抽样平均误差
x
抽样成数抽样平均误差
2
n
(1 )
n
N
p
P(1P)(1n)
n
N
抽样极限误差 △
通过例题引出抽样极限误差的计算方法
例:设有4名学生,他们的体重分别为 40,50,70,80现在随机从其中抽取 2名
X X4 0 5 0 7 0 8 0 6(k 0 )g
N
4
2
(XX)2 (40 6)02(50 6)02.. .(80 6)02
250
N
4
2 2501.5 81
例如:重复
x i 40 45 50 55 60 65 70 75 80
2. 表示为 (1 - 为是总体参数未在区间内的比例
3. 常用的置信水平值有 99%, 95%, 90%
相应的 为0.01,0.05,0.10
置信区间
(confidence interval)
1. 由样本统计量所构造的总体参数的估计区间称为 置信区间
2. 统计学家在某种程度上确信这个区间会包含真正 的总体参数,所以给它取名为置信区间