第七章参数估计-第七章
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
区间估计:在一定可信度 (Confidence level) 下 ,同时考虑抽样误差
统计学中的统计推断包括两个重要的方面:一是利 用样本统计量的信息对相应总体参数值做出推断
,如用样本均数估计总体均数,用样本标准差S估
计总体标准差等,称之为点估计。另一个是利用 样本统计量来推断我们是否接受一个事先的假设 ,称之为假设检验。本章只讨论参数估计,假设 检验将在下一章中讨论。而参数估计又分为点估 计与区间估计。
0.2236 0.1581 0.0913
均数
450 400 350 300
n30 ;SX 0.0920220500 150 100 50 0
频数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
均数
均数
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
2.当一定时,n越大,就越小;n越小,就越大。故影响 抽样误差大小的主要因素是样本含量。作为总体参数(常数) 通常是未知的,因而,在实际工作中常用样本标准差S来估计 。
抽样实验小结
均数的均数围绕总体均数上下波动。
s 均数的标准差即标准误
与总体标准差
sX
相差一个常数的倍数,即 s s/ n
X
样本均数的标准误(Standard Error)
3个抽样实验结果图示
例7-1 假设正常男子红细胞计数服 从的正态分布总体,从该总体中重 复进行100次抽样,每个样本的含量 为10,结果见表7-1。(书本P105)
由表7-1可见,从同一总体中随机抽取样本 含量n=10的若干样本,各样本算得的样本 均数并不等于相应的总体均数,且各样本 均数也不完全相同。这种由于随机抽样而 造成的来自同一总体的样本均数之间及样 本均数与相应的总体均数之间的差异,称 之为均数的抽样误差。
=样本标准差/ 样本含=量 S n
计算(例7-1,例7-2)
从正态总体N(,s2)中抽取样本,获得均数的分
布仍近似呈正态分布N(,s2/n) 。
二、总体均数的估计
(一) 总体均数的点估计(point estimation)与区间估计
参数的估计
点估计:由样本统计量 X、S、p
直接估计 总体参数 、 s、
3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19
0
0
50
50
100
100
150
150
200
200
频数 频数
250
250
n10 ;SX0.1580
n5;SX 0.2212345000 300
400 350 300
450
450
1)可信区间的涵义 从总体中作随机抽样,对于含量为n的每个样本而言 ,都可以算得一个区间。以95%的可信区间为例,意 味着在同一总体中作100次重复抽样,可得100个可信 区间,平均有95个可信区间包含总体均数(估计正确 ),只有5个可信区间不包含总体均数(估计不正确 ),或对于某一个区间而言,它包含总体均数的可能 性为95%,而不包含总体均数的可能性仅为5%。因 此在实际应用中,以这种方法估计总体均数犯错误的 概率仅为5%。
统计上通常将统计量(如样本均数、 样本率p等)的标准差称为标准误 (standard error,SE)。所以,样本均
sX
数的标准差 又称为样本均数的标准 误,是反映样本均数抽样误差大小的指 标。
特点: 1.总体标准误的大小与总体标准差成正比,与样本含量
的平方根成反比。即当样本含量n一定时,标准差越大,即样 本的个体差异越大,标准误就越大,样本均数的抽样误差就越 大;标准差越小,标准误就越小,即样本均数抽样误差就越小 。
1.点估计 总体均数的点估计(point estimation)就是用样本均数来直接 地估计总体均数,这种方法比较简 单,由于没有考虑到抽样误差,只 适合大样本资料的统计推断。
2.区间估计 总体均数的区间估 计(interval estimation)是利用样 本信息给出一个区间,并同时给 出重复试验时该区间包含总体均 数的概率。
)
(1 ) s 未 知 : 按 t 分 布 。 双 侧 1 可 信 区 间 则 为 :
X t S 2 , X < X t S 2 , X
( X t S 2 , X , X t S 2 , X )
单 侧 1 可 信 区 间 则 为 :
X t , S X 或
X t , S X
第七章
参数估计
一、抽样试验
从正态分布总体N(5.00,0.502)中,每次随机抽 取样本含量n=5,并计算其均数与标准差;重复抽取
1000次,获得1000份样本;计算1000份样本的均数与 标准差,并对1000份样本的均数作直方图。
按上述方法再做样本含量n=10、样本含量n=30
的抽样实验;源自文库较计算结果。
由于样本均数与相应的总体均数之间存在着 差异,由数理统计推理可知:从正态总体中 随机抽取样本含量为n的样本,每抽取一个 样本可计算一个样本均数,重复100次抽样可 得到100个样本均数。
这些样本均数服从均数为 ,方差为s
的正态分布.其中为样本均数的总体
标准差,计算公式为s:s / n
X
s
为了与反映个体差异的标准差(或 )相区别,样本均数的标准差s X 用 表示。
抽样试验(n=5)
抽样试验(n=10)
抽样试验(n=30)
1000份样本抽样计算结果
总体的 总体标 均数的 均数 准差s 均数
n=5 5.00 0.50 4.99
n=10 5.00 0.50 5.00
n=30 5.00 0.50 5.00
均数标准差
Sn
0.2212
0.1580
0.0920
sn
2)可信区间具有两个要素
(1)准确度(accuracy),即可信区间包含的概率 的大小,一般而言概率越大越好。 (2)精密度(precision),反映区间的长度,区间 的长度越窄,估计的精密度越好,反之越差。
3)可信区间的计算
(1)总体标准差 未知时 :
s
用样本标准差S 作为的估计值计
算标准误,按t分布原理。(例7-4