双因素方差分析的类型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
学习目标
1.解释方差分析的概念 2.解释方差分析的基本思想和原理 3.掌握单因素方差分析的方法及应用 4.掌握双因素方差分析的方法及应用
第一节 方差分析的基本问题
一、方差分析的内容 二、方差分析的原理 三、F分布
一、方差分析的内容
(一)方差分析中的常用术语 1、因素(Factor) 2、水平(Level) 3、单元(Cell) 4、元素(Element) 5、均衡(Balance) 6、交互作用(Interaction) (二)用方差分析来检验假设有三个假定
3、单元(Cell)
单元指因素水平之间的组合。如销售方式一 下有五种不同的销售业绩,就是五个单元。 方差分析要求的方差齐就是指的各个单元间 的方差齐性。
4、元素(Element)
元素指用于测量因变量的最小单位。一个单 元里可以只有一个元素,也可以有多个元素。
5、均衡(Balance)
如果一个试验设计中任一因素各水平在所有 单元格中出现的次数相同,且每个单元格内 的元素数相同,则称该试验是为均衡,否则, 就被称为不均衡。不均衡试验中获得的数据 在分析时较为复杂。
2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近
四个样本的均值越接近,推断四个总体均值相等
的证据也就越充分
样本均值越不同,推断总体均值不同的证据就越
充分
方差分析中基本假定
如果原假设成立,即H0: m1 = m2 = m3 = m4
四个行业被投诉次数的均值都相等 意味着每个样本都来自均值为m、差为2的同一正
组间方差
F=
组内方差
第二节 单因素方差分析
一、建立假设 二、计算水平均值 三、计算离差平方和 四、计算平均平方 五、方差分析表 六、统计决策 七、应用实例
一、建立假设
方差分析的第一步是建立假设。以饮料颜色对销售 量的影响为例,针对我们关心的问题提出原假设和 备择假设。
k
SSA (xj x)2 nj(xj x)2
(bossom)
j1
构造检验的统计量
(三个平方和的关系)
总离差平方和(SST)、误差项离差平方和
(SSE)、水平项离差平方和 (SSA) 之间的 关系
k
ni
k
k
xij x 2 ni xi x 2
ni
xij x 2
i1 j1
i 1
式中:xij为第j种水平下的第I个观察值; nj第j种水平的观察值个数。 计算总均值的一般表达式为:
总均值:是所有观察值的总和除以观察值的总数。
k nj
X j1 i1 xij (注:各个样本容量相等)
n
三、计算离差平方和
1、总离差平方和SST(Sum of Squares for Total)
ቤተ መጻሕፍቲ ባይዱ
k nj
SST
(xij x)2
j1 i1
2、误差项离差平方和(组内)
SSE(Sum of Squares For Error)
k nj
SSE [ (xij x j )2] j1 i1
3、水平项离差平方和(组间)
SSA或SSb (Sum of Squares for factor A)或
H0:μ1=μ2=μ3=μ4 颜色对销售量没有影响 H1:μ1,μ2,μ3,μ4 不全相等,颜色对销售量有影
响。 注意:拒绝原假设,只表明至少有两个总体的均值
不相等,并不意味着所有的均值都不相等。
二、计算水平均值
令 xj 表示第j种水平的样本均值,则
nj
x j =
xij / nj
(二)用方差分析来检验假设有三个假定
1、各个水平的观察数据必须服从正态分布: 在水平Ai下的数据是来自正态总体的一个样 本,i=1,2…,r。
2、方差相同或者叫方差齐性:r个正态总体 的方差相等,即。
3、随机性:所有数据都相互独立。
方差分析中的基本假定
1. 在上述假定条件下,判断行业对投诉次数是否 有显著影响,实际上也就是检验具有同方差的 四个正态总体的均值是否相等
1、因素(Factor)
因素是指所要研究的变量,它可能对因变量 产生影响。一个是因素,因素是一个独立的 变量,是方差分析研究的对象。要分析不同 销售方式对销售量是否有影响,所以,销售 量是因变量,而销售方式是可能影响销售量 的因素。
2、水平(Level)
因素中的内容称为水平。水平指因素的具体 表现,如销售的四种方式就是因素的不同取 值等级。有时水平是人为划分的,比如质量 被评定为好、中、差。
6、交互作用(Interaction)
如果一个因素的效应大小在另一个因素不同 水平下明显不同,则称为两因素间存在交互 作用。当存在交互作用时,单纯研究某个因 素的作用是没有意义的,必须分另一个因素 的不同水平研究该因素的作用大小。如果所 有单元格内都至多只有一个元素,则交互作 用无法测出。
若方差分析只针对一个因素进行,称为单因 素方差分析。如果同时针对多个因素进行, 称为多因素分析。在多因素方差分析中,双 因素方差分析里最常见的。
如果n个总体的均值相等,然希望三个样本的均值 比较接近,事实上,n个样本的均值愈接近,就愈 有证据得出结论:总体均值相等,反之,若n个样 本均值的差异愈大,就得出结论,总体均值不相等。
样本均值变动性小→支持H0,样本均值变动性大→ 支持H1。
三、F分布
水平间方差(组间方差)和水平内方差(组 内方差)之比是一个统计量,数理统计证明, 这个统计量服从F分布。
态总体
f(X)
X
m1 m2 m3 m4
方差分析中基本假定
若备择假设成立,即H1: mi (i=1,2,3,4)不全 相等
至少有一个总体的均值是不同的
四个样本分别来自均值不同的四个正态总体
f(X)
X
m3 m1 m2 m4
二、方差分析的原理
方差分析的目的是要检验各个水平的均值μ1, μ2……μr 是否相等,实现这个目的的手段是通过方 差的比较。
1.解释方差分析的概念 2.解释方差分析的基本思想和原理 3.掌握单因素方差分析的方法及应用 4.掌握双因素方差分析的方法及应用
第一节 方差分析的基本问题
一、方差分析的内容 二、方差分析的原理 三、F分布
一、方差分析的内容
(一)方差分析中的常用术语 1、因素(Factor) 2、水平(Level) 3、单元(Cell) 4、元素(Element) 5、均衡(Balance) 6、交互作用(Interaction) (二)用方差分析来检验假设有三个假定
3、单元(Cell)
单元指因素水平之间的组合。如销售方式一 下有五种不同的销售业绩,就是五个单元。 方差分析要求的方差齐就是指的各个单元间 的方差齐性。
4、元素(Element)
元素指用于测量因变量的最小单位。一个单 元里可以只有一个元素,也可以有多个元素。
5、均衡(Balance)
如果一个试验设计中任一因素各水平在所有 单元格中出现的次数相同,且每个单元格内 的元素数相同,则称该试验是为均衡,否则, 就被称为不均衡。不均衡试验中获得的数据 在分析时较为复杂。
2. 如果四个总体的均值相等,可以期望四个样本 的均值也会很接近
四个样本的均值越接近,推断四个总体均值相等
的证据也就越充分
样本均值越不同,推断总体均值不同的证据就越
充分
方差分析中基本假定
如果原假设成立,即H0: m1 = m2 = m3 = m4
四个行业被投诉次数的均值都相等 意味着每个样本都来自均值为m、差为2的同一正
组间方差
F=
组内方差
第二节 单因素方差分析
一、建立假设 二、计算水平均值 三、计算离差平方和 四、计算平均平方 五、方差分析表 六、统计决策 七、应用实例
一、建立假设
方差分析的第一步是建立假设。以饮料颜色对销售 量的影响为例,针对我们关心的问题提出原假设和 备择假设。
k
SSA (xj x)2 nj(xj x)2
(bossom)
j1
构造检验的统计量
(三个平方和的关系)
总离差平方和(SST)、误差项离差平方和
(SSE)、水平项离差平方和 (SSA) 之间的 关系
k
ni
k
k
xij x 2 ni xi x 2
ni
xij x 2
i1 j1
i 1
式中:xij为第j种水平下的第I个观察值; nj第j种水平的观察值个数。 计算总均值的一般表达式为:
总均值:是所有观察值的总和除以观察值的总数。
k nj
X j1 i1 xij (注:各个样本容量相等)
n
三、计算离差平方和
1、总离差平方和SST(Sum of Squares for Total)
ቤተ መጻሕፍቲ ባይዱ
k nj
SST
(xij x)2
j1 i1
2、误差项离差平方和(组内)
SSE(Sum of Squares For Error)
k nj
SSE [ (xij x j )2] j1 i1
3、水平项离差平方和(组间)
SSA或SSb (Sum of Squares for factor A)或
H0:μ1=μ2=μ3=μ4 颜色对销售量没有影响 H1:μ1,μ2,μ3,μ4 不全相等,颜色对销售量有影
响。 注意:拒绝原假设,只表明至少有两个总体的均值
不相等,并不意味着所有的均值都不相等。
二、计算水平均值
令 xj 表示第j种水平的样本均值,则
nj
x j =
xij / nj
(二)用方差分析来检验假设有三个假定
1、各个水平的观察数据必须服从正态分布: 在水平Ai下的数据是来自正态总体的一个样 本,i=1,2…,r。
2、方差相同或者叫方差齐性:r个正态总体 的方差相等,即。
3、随机性:所有数据都相互独立。
方差分析中的基本假定
1. 在上述假定条件下,判断行业对投诉次数是否 有显著影响,实际上也就是检验具有同方差的 四个正态总体的均值是否相等
1、因素(Factor)
因素是指所要研究的变量,它可能对因变量 产生影响。一个是因素,因素是一个独立的 变量,是方差分析研究的对象。要分析不同 销售方式对销售量是否有影响,所以,销售 量是因变量,而销售方式是可能影响销售量 的因素。
2、水平(Level)
因素中的内容称为水平。水平指因素的具体 表现,如销售的四种方式就是因素的不同取 值等级。有时水平是人为划分的,比如质量 被评定为好、中、差。
6、交互作用(Interaction)
如果一个因素的效应大小在另一个因素不同 水平下明显不同,则称为两因素间存在交互 作用。当存在交互作用时,单纯研究某个因 素的作用是没有意义的,必须分另一个因素 的不同水平研究该因素的作用大小。如果所 有单元格内都至多只有一个元素,则交互作 用无法测出。
若方差分析只针对一个因素进行,称为单因 素方差分析。如果同时针对多个因素进行, 称为多因素分析。在多因素方差分析中,双 因素方差分析里最常见的。
如果n个总体的均值相等,然希望三个样本的均值 比较接近,事实上,n个样本的均值愈接近,就愈 有证据得出结论:总体均值相等,反之,若n个样 本均值的差异愈大,就得出结论,总体均值不相等。
样本均值变动性小→支持H0,样本均值变动性大→ 支持H1。
三、F分布
水平间方差(组间方差)和水平内方差(组 内方差)之比是一个统计量,数理统计证明, 这个统计量服从F分布。
态总体
f(X)
X
m1 m2 m3 m4
方差分析中基本假定
若备择假设成立,即H1: mi (i=1,2,3,4)不全 相等
至少有一个总体的均值是不同的
四个样本分别来自均值不同的四个正态总体
f(X)
X
m3 m1 m2 m4
二、方差分析的原理
方差分析的目的是要检验各个水平的均值μ1, μ2……μr 是否相等,实现这个目的的手段是通过方 差的比较。