抽样分布t分布中心极限定理点估计矩估计最大似然法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

抽样分布t分布中⼼极限定理点估计矩估计最⼤似然法
⽣物统计与实验设计-统计学基础-2&区间估计-1
正态分布参数:均值和⽅差
其中,选择1d是因为好算;通常,95%区分⼤概率事件和⼩概率事件,
当总体是正态分布时,可以利⽤常⽤抽样分布估计出样本参数:
抽样分布是样本估计量是样本的⼀个函数,在统计学中称作统计量(这就是说,统计量由样本值计算得到),因此抽样分布也是指统计量的分布。

以下是当总体满⾜正态分布时,样本均值也满⾜正态分布(抽样分布是样本均值的分布,此处是正态分布)样本均值的均值与⽅差和总体参数之间的关系:
如上式,若得到⼀次实验的样本,样本容量就是n,计算所有样本会得到⼀次实验的样本均值,多次实验会得到多次实验的样本均值,假如有600次实验则会得到600个样本均值,再对这600个样本均值进⾏计算,计算出样本均值的均值和⽅差,这个样本均值的均值和⽅差与总体参数满⾜上式,根据上式关系即可估算出总体均值和总体⽅差。

当总体不是正态分布,可利⽤中⼼极限定理估计出总体参数:
中⼼极限定理:n⾜够⼤则认为样本呈正态分布,因此其样本均数也呈正态分布。

如今,为了精确计算样本均数,存在三种常见的抽样分布(抽样分布是指统计量的分布,以上例为例,就是样本均值的分布),这⾥的计算是为了得到右边的参数部分。

最为常⽤的是t分布,它的特点是对于样本含量没有要求:
化简之后是下式:
t分布的期望和⽅差如下:
由以上期望和⽅差可知,t分布只与⾃由度有关系,与其他⽆关。

使⽤t分布作为抽样分布⽽不使⽤正态分布的理由是:对于⼤样本,当n⾜够⼤时,t分布和标准正态分布的曲线⼏乎重合;对于⼩样本,此时⾃由度为n-1,并不等同于正态分布(其实若样本容量⽐较⼩⽐如25,样本均值分布很⼤可能不是正态分布),⽽t分布在此时因为⾃由度的控制,使得曲线并⾮正态分布,⽐较符合客观事实,所以可以控制系统误差,⽐标准正态分布更准确。

若不使⽤t分布,则可以先使⽤特定数(⽐如30为界限,此处具体值依据具体问题)判断是⼤样本或是⼩样本,再选择分布:
当总体分布为正态分布,则样本指标的分布也采⽤正态分布,即⽤Z分布来进⾏统计推断。

当总体分布为⼆项分布(n很⼤,P有很⼩),即当np⼩于等于5 时,则样本指标的分布采⽤泊松分布来进⾏统计推断。

反之,当np⼤于等于5时,可⽤正态分布近似代替⼆项分布,则样本指标的分布采⽤正态分布来进⾏统计推断。

当⼩样本时:
以上是通过多个样本得到多个多个统计量再计算均值的⽅式,后⾯推出了⼀个样本便估计参数的⽅法。

⽬标是估计出尖值,即估计量:
参数估计可以使⽤点估计和区间估计,点估计完成了参数估计的从⽆到有,区间估计完成了参数估计的精细化:
矩估计:提出了⽤原点矩的⽅法建⽴样本矩与总体矩的关系
右边是总体矩左边是样本矩:eg,⼀阶样本矩等于参数均值。

所以矩估计的思路是:将总体(含有未知参数的式⼦,该式⼦就是由之前学过的不同分布推导或者通⽤求积分得到)和样本(含有统计量的式⼦,⼀般就是数值⼀个个加或做完处理后⼀个个加,⾮常初级)联系起来的桥梁是矩估计
特点:⽆论总体是出于何种分布(总体矩的表达形式有所不同),最终估计出来的总体参数(仅均值和⽅差)的表达式完全⼀致。

最⼤似然估计是⽤⼀组样本估计出总体参数的另⼀种⽅法,它的过程是⾸先建⽴似然函数,该似然函数是在通过样本得知总体分布之后,结合样本数n,建⽴在n个样本同时满⾜某分布之上,得到它们的联合概率密度,取对数(此步骤是为了简化计算,若有其他可化简的⽅法皆可,它并不参与最⼤似然的思想)最后对似然函数求最⼤值(即若估计⼀个参数求⼀阶导,和估计两个参数求⼀阶导和⼆阶导)。

通过⽐较矩估计的和最⼤似然估计的参数,可以得知这⼀统计量和矩估计量估计出的量是不⼀定是⼀样的(但对于总体是正态分布时,估计出的参数是⼀样的)
经验:先最⼤似然,再矩估计
在通过以上⽅式估计参数之后,通过加⼊估计参数的评判标准,判断何种参数最为可靠:
⽆偏性:估计的参数满⾜抽样分布,主要看与集中趋势的⽐较:若估计的参数是位于所有估计的参数中的集中区域,则认为给估计的参数是⽆偏的,否则就是有偏的,有偏常常是系统性错误造成的。

相关文档
最新文档