样本方差的证明
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
样本方差为何除以n-1?
方差的概念从小学就开始建立了。对于一个随机变量,分别表示其数学期望和
方差,从中随机抽取n个样本,是样本均值,
是样本方差。那么为什么样本方差是除以而不是n
呢?
这里涉及到一个无偏估计的概念,是随机变量,同样也是随机变量,其中是对总体的一个估计,如果的期望分别等于的话,就说这种
估计是无偏的。容易证明,但是
的证明就不是那么显而易见了,下面我证明给大家看。记为的方差和期望。
证毕~~
这样看,x1,x2,...xn是n个可以自由变化的样本,互不影响。
而x1-xbar, x2-xbar,...xn-xbar是否也是n个自由变化的呢?不是……因为这n个统计量受到一个约束条件的影响就是之和等于0。如果我们记yi=xi-xbar,也就是说y1+y2+...yn=0,
这样我们可以任意变动其中n-1值,比如取定了y1,y2,...y(n-1),那么yn就不能任意变化,yn=-(y1+y2+y(n-1))。
这个只是从自由变化的角度直观解释,实际上证明分布比较烦琐……
比如说让十跟人任意取十个数,很容易理解可以随便取.十个都是自由的.
如果我加一个条件,十个人取十个数,但是这是个书加起来必须得零.
第一个人可以随便取,第二个人也可以,第九个也可以,都是自由的,
但是第十个人不能随便自由取,只能取特定的数,才能保证这十个数的
和是零.所以加了一个条件就丢了一个自由度
自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数称为该统计量的自由度。当平均数的值和其中n-1个数据的值已知时,另一个数据的值就不能自由变化了,因此样本方差无偏估计的自由度为n-1。