第六章参数估计基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第六章 参数估计基础
参数估计:统计学中通过抽样来估计总体参数。

样本均数的抽样分布和抽样误差:从同一总体中反复多次随机抽取样本含量相同的个体,由于个体差异与偶然性的影响,样本统计量之间以及样本统计量与总体参数之间的差异,称为抽样误差。这种由抽样造成的均数之间的差异称为均数的抽样误差,频率之间以及频率与概率之间的差异称为频率的抽样误差。
特点:在服从正态分布的总体中进行随机抽样,样本均数Xbar仍服从正态分布;从非正态分布总体抽样,只要样本量足够大(n>=30),样本均数的分布也近似于正态分布。在抽样研究中,抽样误差是不可避免的。用来描述抽样误差大小的指标称为标准误。
均数标准误常用符号σXbar表示,也称为样本均数的标准差。它反映了样本均数之间,样本均数与总体均数之间的离散程度,也反映了样本均数抽样误差的大小。
计算:σXbar=σ/√n.在实际应用中,总体标准差σ常常未知,需要用样本标准差S来估计。此时,均数标准误的估计值为SXbar=S/√n.由此式可见,若增加样本含量n可减小样本均数的抽样误差。
主要应用:1估计总体均数的置信区间。 2均数的假设检验。

样本频率的抽样分布和抽样误差:频率的标准误用符号σp表示,它反映了样本频率之间以及样本频率与总体概率之间的离散程度,也反映了样本频率抽样误差的大小。
计算:σp=√(π(1-π)/n)。在实际应用中,总体概率π常常未知,需要用样本频率p来估计。因此频率标准误的估计值为Sp=√(p(1-p)/n-1)约等于 √(p(1-p)/n)。由此式可见,增加样本含量n可减小样本频率的抽样误差。
主要应用:1估计总体概率的置信区间 2频率指标的假设检验。

t分布:t=(Xbar-μ)/SXbar=(Xbar-μ)/(S/√n)服从自由度ν=n-1的t分布。
t分布是总体均数的区间估计及假设检验的理论基础。

t分布的图形与特征:
t分布与标准正态分布相比,其分布密度有如下特征:
1)单峰分布,以0为中心,左右对称。
2)ν越小,t值越分散,曲线的峰部越矮,尾部越高。
3)随着ν逐渐增大,分布逐渐接近标准正态分布;当ν→∞时,t分布趋近标准正态分布,故标准正态分布是t分布的特例。

按t分布的规律,密度曲线下面积分布规律为:
单侧:P(t<=-tα,ν)=P(t>=tα,ν)=α.
双侧:P(t<=-tα/2,ν)+P(t>=tα/2,ν)=α.

总体均数及总体概率的估计:参数估计是指用样本指标(统计量)估计总体指标(参数)。参数估计有点估计与区间估计两种。
1.点估计:直接用随机样本的样本均数Xbar作为总体均数μ的估计值或用样本频率p作为总体概率π的估计

值的方法称为点估计。这是一种没有考虑抽样误差的简单估计方法。
2.区间估计:用已知样本统计量和标准误确定总体参数所在范围的方法称为区间估计。所估计的总体参数的范围通常称为参数的置信区间,,是一个开区间,这一估计可相信的程度称为置信度或置信水平。若标准差不变,置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。

置信区间的计算:
1.正态分布总体均数的置信区间:总体均数的置信区间的基本公式是Xbar+-tα/2,ν * SXbar.样本量较大时,可以是Xbar+-Zα/2,ν * SXbar或Xbar+-Zα/2,ν * σXbar(若总体标准差已知)。
实际工作中,估计总体均数参考值范围时,要注意与参考值范围区别。

2.二项分布总体概率的置信区间:根据样本含量n和样本频率p的大小,可采用查表法和正态近似法。重点掌握正态近似法。
查表法:对于小样本资料(n<=50),特别是当p非常接近0或1时,可通过查表来直接确定总体概率π的95%或99%置信区间。但表中仅列出了x<=n/2的部分,当n>=n/2时,应以n-X代替X查表,再用100%-查得的数值,即为所求的置信区间。
正态近似法:当n足够大时,且样本频率p不太接近0或1时,p的抽样分布接近正态分布,此时,总体概率的置信区间为p+-Zα/2 * Sp.

1总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?
从正态分布的总体中随机抽样,样本均数呈正态分布;从非正态分布的总体中随机抽样,样本量n较小时,样本均数的分布仍呈非正态分布,当样本量n足够大时,样本均数的分布近似正态哦分布。

2样本均数的标准误的意义是什么?与原变量的标准差有何区别与联系?
样本均数的标准误可以反映样本均数之间以及样本均数与总体均数之间的离散程度以及抽样误差的大小。区别:前者是均数变异的指标,后者是表示观察值变异的指标。联系:当样本量n一定时,标准误随标准差的大小而变化。

3与标准正态分布相比较,t分布的特点是什么?
t分布与标准正态分布相比,其分布密度有如下特征:
1)单峰分布,以0为中心,左右对称。
2)ν越小,t值越分散,曲线的峰部越矮,尾部越高。
3)随着ν逐渐增大,分布逐渐接近标准正态分布;当ν→∞时,t分布趋近标准正态分布,故标准正态分布是t分布的特例。

4用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间,哪一个估计的精确度更好?为什么?
95%置信区间的精确度更好。因为置信度由95%提高到99%,置信区间便由窄变宽,估计的精度下降。

5满足什么条件时可以采用正态近似法估计总体概率的置信区间?
当n足够大

时,且样本频率p不太接近0或1时,如np和n(1-p)均大于5时,可以采用正态近似法估计总体概率的置信区间。

相关文档
最新文档