应用文-数理统计学自由度研究及应用

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数理统计学自由度研究及应用

'数理

学自由度研究及

1 数理统计学自由度研究与分析

数理统计学教程中的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,自由度通常记为df。数理统计上的这个定义一般可以从五个方面来理解:

首先,研究者通过调查样本数据,并运用科学计算得出“统计量”,被调查客观主体所具备的属性为之“参数”。在数理统计学上,认为本文由

联盟

收集整理二者属于无偏估计,所以是相等的,但是在实际应用中,因为其抽样的偏差,会客观的导致二者不等同,对于出现的这种情况,作为研究者是无法知晓的。因此在理论假设条件下,“统计量”和“参数”共同被看作是现实的、固定的。

其次,从以上我们可以知道,既然在理论层面上,“统计量”是确定的,那么在实际应用层面上,计算“统计量”的那组参数就不应当是完全自由的。因为自由度概念当中“自由”一词就是相对这个“确定、固定”条件而设立的。同时也就是说“统计量”的固定、确定性限制了相关参数的自由性,为此,它必须支持“统计量等于总体参数”这一假设理论,这才是“自由度”所存在的根本。

其三,在现实生活中,有很多统计量的计算公式中里拥有自由度,但他们的表现形式大有不同,虽然他们都是计算标准差,可是当总体标准差的自由度是q的时候,样本标准差的自由度表现为q-1,甚至是q-2、q-3。是什么样的原因导致这样的事实存在呢。其实在数理统计模型中,自由度是指在样本中能够自由变动的变量的个数,当有约束条件时,自由度减少自由度计算公式:自由度(df)=样本个数(n)-样本数据受约束条件的个数(k),即df=n-k(df自由度,n样本个数,k约束条件个数),q-1是一般情况下的计算方法,更准确的讲应该为q-k,q表示“需要处理”的数量,k表示实际计算的参数的数量。如需要计算2个参数,则数据里只有q-2个数据可以自由变化。

第四,自由度的所属。自由度产生于这样的背景下:运用一组数据来求“统计量”,离开“一组数据”就不可能有“统计量”。所以,“自由度”应该是“统计量”和“一组数据”所共同拥有的。

第五,统计学上的自由度包括在估计总体平均个数的情形下,由于样本个数q是相互独立的,从其中抽出任何一个数不会导致其他任何数据发生变化,所以其自由度值为q。这样在估计总体的方差的时候,使用的是离差平方和。只要个数q-1的离差平方和固定不变了,方差也就确定了;其原因是在均值固定后,倘若得到其中q-1个数的值,第q个数的值也就能够顺利得出。这里,均值就相当于一个限制条件,由于它的存在,估计总体方差的自由度为q-1。

2 数理统计自由度的应用

2.1 样本方差的自由度

在我们日常学习用的教科书中,列出样本方差的计算公式时大部分没有提及分子q-1(q 为样本容量)就是自由度,也很少清楚的解释说明除以q-1而不是q的具体原因。假设一个容量为20的样本,如果没有其他关于该样本的信息或约束的话,任意从总体中抽取的20个观察值都可以形成这样的样本。也就是说,这20个观察值可以任意地被从总体中抽取的其他观察值所取代。当我们想要计算样本方差时,必须先算出样本均值,设=35。此时,这20个观察值就不能任意地被总体中抽取的其他观察值所取代了。因为q=700,20个观察值的总和必须等于700。这样一来,样本中只有19个观察值可以随意改变,因为如果任意19个观察值确定了,第20个观察值也被这19个值确定了。因此在计算样本方差时自由度等

于19。有效样本容量被减少为q-1,在此基础上,我们可以很好地理解为什么作为均方差的样本方差计算时,要用自由度来平均而非用q平均。这也说明了如果从样本数据中估计了一个总体参数,自由度就会减少一个。因为样本方差的自由度为q-1,所以在比较两个独立总体的均值大小的t检验中,合并方差的自由度等于+-2=(-1)+(-1);在比较两个独立总体的方差大小的F检验中,F统计量的自由度为(-1,-1),其中,分别为两个样本的容量。

2.2 方差分析和回归中的自由度

在计算均方的时候,我们必须用自由度来去除平方和,因为其代表的是有效样本容量。那么我们假设在方差分析中共有J个观察值,将方差平方和SST除以总自由度J-1就可得到总方差。对于K个组间平方和,其中和分别为第i个处理的样本容量和样本均值。当SSTR 被计算出来时,就能被SSTR和其他K-1个值决定。所以计算组间的均方差时自由度为K-1。因为残差平方和SSE等于K个处理的组内离差平方和,所以残差的均方差有个自由度,这里运用了自由度的可加性。值得注意的是,总自由度,它被分解成组间均方差的自由度与残差均方差的自由度的和。类似地,自由度也出现在多元回归分析的相关内容中。假设k为解释变量(包括常数项)的个数,调整,和分别用各自的有效样就可以确定整张表的信息内容。也就是说列联表有个自由度。可以想象,一张r行c列的列联表,在各行和与列和给定的情况下,我们只要填上任意行列的频数,表中其他的频数也会随之确定下来,样本容量来平均。

3 结语

数理统计中的自由度对于整个统计学而言是一个很重要的概念,它在抽样分布和假设检验中的作用尤其突出。统计量的自由度和检验该统计量是否显著的表现临界值之间的对应关系,从而为判断是否显著提供了一定的标准。全面地认识理解数理统计中自由度的含义和应用方向,对理解和在实际中应用数理统计学具有至关重要的作用。'

相关文档
最新文档