第八章 方差分析与相关分析

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章方差分析与相关分析

一.方差分析1.基本概念

方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。

方差分析,又称为ANOVA(Analysis Of Variance)分析。

方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。

考察下列例子:

某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单

观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。如果不显著,则这种

2.方差分析原理

计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。

●●建立原假设“H0:各组平均数相等”

●●构造统计量“F=组间方差/组内方差”

●●在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为

(n-r)。

●●F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。

●●查表,若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。

根据方差计算的原理,生成方差分析表如下:

其中:

组间离差平方和 SSA (Sum of Squares for factor A) =39.084

误差项离差平方和 SSE (Sum of Squares for Error) =76.8455

总离差平方和 SST (Sum of Squares for Total)=115.9295

P-value值为0.000466,小于0.05,所以拒绝原假设。

3.双因素方差分析

观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。

此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。

计算方差分析表如下:

其中:

行差异(地区因素)对于销售无显著影响;

列差异(包装因素)对于销售有显著影响。

误差项SSE=SST-SSA-SSB

二.相关分析

1.基本概念

相关关系:变量间非确定性的相互关联关系。表现为延着一条曲线两侧的一排点。

函数关系:变量间确定性的相互关联关系。表现为曲线上的点。

相关系数:Coefficient of correlation

观察下列数据:人均国民收入与人均消费金额之间存在着线性相关关系。

2.相关关系的检验:

相关系数接近1的程度除受相关性影响外,还受数据量n的影响。在n=2时,相关系数确定为1。在相关程度相同的情况下,N越大,相关系数越小。

因此,在计算相关系数时,需要进行相关系数的检验,当r>临界值时,方可判断变量间存在相关关系。

相关系数只反映变量间的线性相关关系,当变量存在非线性的相关关系时,相关系数无法进行反映。

相关系数衡量两个定距以上样本的相关关系,但对于定序尺度,无法进行计算。

等级相关用于两个定序尺度测量的样本间相关程度的测定。

将两个样本按观察数据的顺序进行配对,分别计算每个数据的秩,将两组样本的秩分别记录为U和V。

如果两个测度完全一致,则U与V的差异应当为0。

计算D=U-V的平方和,该值越大,表明相关性越差。

如下计算斯皮尔曼等级相关系数(Spearman coefficient of rank correlation)考虑一个两评委对歌手打分的问题,分别按歌手得分的顺序计算U和V,

相关文档
最新文档