统计学第7章 方差分析与试验设计(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
STATISTICS
提出假设
对品牌因素提出的假设为
• •
• •
7 - 17
H0: m1=m2=m3=m4
(品牌对销售量没有影响)
H1: mi (i =1,2, … , 4) 不全相等 (品牌对销售量有影响)
对地区因素提出的假设为
H0: m1=m2=m3=m4=m5
H1: mj (j =1,2,…,5) 不全相等
统计学
STATISTICS
7.4 双因素方差分析
一、双因素方差分析及其类型 二、无交互作用的双因素方差分析 三、有交互作用的双因素方差分析
统计学
STATISTICS
一、双因素方差分析及其类型
统计学
STATISTICS
双因素方差分析
1. 2.
分析两个因素(行因素Row和列因素Column)对试验结果的 影响。 如果两个因素对试验结果的影响是相互独立的,分别判断 行因素和列因素对试验数据的影响,这时的双因素方差分 析称为无交互作用的双因素方差分析或无重复双因素方差 分析。 如果除了两个因素对试验数据的单独影响外,两个因素的 搭配还会对结果产生一种新的影响,这时的双因素方差分 析称为有交互作用的双因素方差分析或可重复双因素方差 分析 。
(查表可得到)进行比较,作出对原假设H0 的决策:
若FC > Fa ,则拒绝原假设H0 ,表明均值之间有显
著差异,即所检验的列因素对观察值有显著影响。
7 - 14
统计学
STATISTICS
无交互作用的双因素方差分析 方差分析表
7 - 15
统计学
STATISTICS
【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌(品 牌因素)和销售地区(地区因素)对销售量是否有影响,对每种品 牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩 电的销售量是否有显著影响?(a=0.05)
总误差平方和
SST xij x
k r i 1 j 1
k r
2
行因素误差平方和
列因素误差平方和 随机误差项平方和
百度文库7-8
SSR xi. x r xi. x
2 k i 1 j 1 r k i 1
2
SSC x. j x k x. j x
统计学
STATISTICS
计算检验统计量 (F)
检验行因素的统计量: MSR FR ~ F k 1, (k 1)( r 1) MSE 检验列因素的统计量; MSC FC ~ F r 1, (k 1)( r 1) MSE
7 - 12
统计学
STATISTICS
7-3
3.
统计学
STATISTICS
双因素方差分析数据结构
7-4
统计学
STATISTICS
二、无交互作用的双因素 方差分析
统计学
STATISTICS
分析步骤
第一步:提出假设
对行因素提出的假设为:
• •
H0: m1 = m2 = … = mi = …= mk (mi为第i个水平的均值)
H1: mi (i =1,2, … , k) 不全相等
(注:m为每一样本的行数)
统计学
STATISTICS
【例】城市道路交通管理部门为研究不同的路段和不同的时间 段对行车时间的影响,让一名交通警察分别在两个路段和高峰期 与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时 间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的 交互作用对行车时间的影响。
(地区对销售量没有影响)
(地区对销售量有影响)
统计学
STATISTICS
差异源 行(品牌) 列(地区) 误差 总和
SS 13004.6 2011.7 2872.7 17889
df 3 4 12 19
MS
F
P-value
F crit 3.2592
4334.85 18.1078 9.46E-05 3.4903 502.925 2.10085 0.14367 239.392
7 - 10
统计学
STATISTICS
计算均方(MS)
行因素的均方,记为MSR,计算公式为:
SSR MSR k 1
列因素的均方,记为MSC ,计算公式为:
随机误差项的均方,记为MSE ,计算公式为;
7 - 11
SSC MSC r 1
SSE MSE (k 1)( r 1)
k
r
ij
r x. j是列因素的第j个水平下的各观察值的均值:
x. j
(i 1,2,, k )
x
i 1
ij
x 是全部 kr 个样本数据的总平均值:
7-7
k
( j 1,2,, r )
x
x
i 1 j 1
k
r
ij
kr
统计学
STATISTICS
计算误差平方和(SS)
7 - 21
统计学
STATISTICS
误差平方和的计算
SST ( xijl x ) 2
i 1 j 1 l 1 k r m
1. 总平方和: 2. 行变量平方和: 3. 列变量平方和:
SSR rm ( xi. x ) 2
i 1
k
SSC km ( x. j x ) 2
对列因素提出的假设为:
• •
7-6
H0: m1 = m2 = … = mj = …= mr (mj为第j个水平的均值) H1: mj (j =1,2,…,r) 不全相等
统计学
STATISTICS
第二步:构造检验的统计量
x i .是行因素的第i个水平下各观察值的平均值:
xi .
x
j 1
F分布与拒绝域
拒绝H0 不能拒绝H0 0
a
F
Fa(n1 , n2)
7 - 13
n1 , n2分别为第一、二自由度
统计学
STATISTICS
第三步:统计决策
将统计量的值F与给定的显著性水平 a 的临界值Fa
若FR>Fa ,则拒绝原假设H0 ,表明均值之间的差异
是显著的,即所检验的行因素对观察值有显著影响。
STATISTICS
设: x ijl为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 。 x i . 为行因素的第i个水平的样本均值 。 x. j 为列因素的第j个水平的样本均值。 x ij 对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值 。 x 为全部n个观察值的总均值 。
7 - 24
统计学
STATISTICS
有交互作用的双因素分析
7 - 25
结
束
结论: FR=18.10777>Fa=3.4903,拒绝原假设H0,说明彩电 的品牌对销售量有显著影响。 FC=2.100846< Fa=3.2592,不能拒绝原假设H0,说 明销售地区对彩电的销售量没有显著影响。 7 - 18
统计学
STATISTICS
三、有交互作用的双因素 方差分析
统计学
不同品牌的彩电在各地区的销售量数据
品牌因素
品牌1 品牌2 品牌3 7 - 16 品牌4
地区因素 地区1 365 345 358 288 地区2 350 368 323 280 地区3 343 363 353 298 地区4 340 330 343 260 地区5 323 333 308 298
统计学
2 r j 1 i 1 r j 2
2
SSE xij xi. x. j x
k i 1 j 1
统计学
STATISTICS
总离差平方和(SST)、水平项离差平方和 (SSR和
SSC) 、误差项离差平方和(SSE) 之间的关系:
x
k r i 1 j 1 k r i 1 j 1
ij
x
2
xi. x x. j x xij xi. x. j x
2 k r 2 k r i 1 j 1 i 1 j 1
SST = SSR +SSC +SSE
7-9
统计学
STATISTICS
计算均方(MS) 误差平方和除以相应的自由度。 三个平方和的自由度分别是: • 总离差平方和SST的自由度为 kr-1; • 行因素的离差平方和SSR的自由度为 k-1; • 列因素的离差平方和SSC的自由度为 r-1; • 随机误差平方和 SSE 的自由度为 (k-1)×(r-1)。
j 1
k r
r
4. 交互作用平方和: SSRC m ( xij xi. x. j x ) 2
i 1 j 1
5. 误差项平方和:
7 - 22
SSE SST SSR SSC SSRC
统计学
STATISTICS
有交互作用的双因素方差分析 方差分析表的结构
7 - 23
STATISTICS
【例】城市道路交通管理部门为研究不同的路段和不同的时间 段对行车时间的影响,让一名交通警察分别在两个路段和高峰期 与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时 间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的 交互作用对行车时间的影响。
7 - 20
统计学
提出假设
对品牌因素提出的假设为
• •
• •
7 - 17
H0: m1=m2=m3=m4
(品牌对销售量没有影响)
H1: mi (i =1,2, … , 4) 不全相等 (品牌对销售量有影响)
对地区因素提出的假设为
H0: m1=m2=m3=m4=m5
H1: mj (j =1,2,…,5) 不全相等
统计学
STATISTICS
7.4 双因素方差分析
一、双因素方差分析及其类型 二、无交互作用的双因素方差分析 三、有交互作用的双因素方差分析
统计学
STATISTICS
一、双因素方差分析及其类型
统计学
STATISTICS
双因素方差分析
1. 2.
分析两个因素(行因素Row和列因素Column)对试验结果的 影响。 如果两个因素对试验结果的影响是相互独立的,分别判断 行因素和列因素对试验数据的影响,这时的双因素方差分 析称为无交互作用的双因素方差分析或无重复双因素方差 分析。 如果除了两个因素对试验数据的单独影响外,两个因素的 搭配还会对结果产生一种新的影响,这时的双因素方差分 析称为有交互作用的双因素方差分析或可重复双因素方差 分析 。
(查表可得到)进行比较,作出对原假设H0 的决策:
若FC > Fa ,则拒绝原假设H0 ,表明均值之间有显
著差异,即所检验的列因素对观察值有显著影响。
7 - 14
统计学
STATISTICS
无交互作用的双因素方差分析 方差分析表
7 - 15
统计学
STATISTICS
【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌(品 牌因素)和销售地区(地区因素)对销售量是否有影响,对每种品 牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩 电的销售量是否有显著影响?(a=0.05)
总误差平方和
SST xij x
k r i 1 j 1
k r
2
行因素误差平方和
列因素误差平方和 随机误差项平方和
百度文库7-8
SSR xi. x r xi. x
2 k i 1 j 1 r k i 1
2
SSC x. j x k x. j x
统计学
STATISTICS
计算检验统计量 (F)
检验行因素的统计量: MSR FR ~ F k 1, (k 1)( r 1) MSE 检验列因素的统计量; MSC FC ~ F r 1, (k 1)( r 1) MSE
7 - 12
统计学
STATISTICS
7-3
3.
统计学
STATISTICS
双因素方差分析数据结构
7-4
统计学
STATISTICS
二、无交互作用的双因素 方差分析
统计学
STATISTICS
分析步骤
第一步:提出假设
对行因素提出的假设为:
• •
H0: m1 = m2 = … = mi = …= mk (mi为第i个水平的均值)
H1: mi (i =1,2, … , k) 不全相等
(注:m为每一样本的行数)
统计学
STATISTICS
【例】城市道路交通管理部门为研究不同的路段和不同的时间 段对行车时间的影响,让一名交通警察分别在两个路段和高峰期 与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时 间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的 交互作用对行车时间的影响。
(地区对销售量没有影响)
(地区对销售量有影响)
统计学
STATISTICS
差异源 行(品牌) 列(地区) 误差 总和
SS 13004.6 2011.7 2872.7 17889
df 3 4 12 19
MS
F
P-value
F crit 3.2592
4334.85 18.1078 9.46E-05 3.4903 502.925 2.10085 0.14367 239.392
7 - 10
统计学
STATISTICS
计算均方(MS)
行因素的均方,记为MSR,计算公式为:
SSR MSR k 1
列因素的均方,记为MSC ,计算公式为:
随机误差项的均方,记为MSE ,计算公式为;
7 - 11
SSC MSC r 1
SSE MSE (k 1)( r 1)
k
r
ij
r x. j是列因素的第j个水平下的各观察值的均值:
x. j
(i 1,2,, k )
x
i 1
ij
x 是全部 kr 个样本数据的总平均值:
7-7
k
( j 1,2,, r )
x
x
i 1 j 1
k
r
ij
kr
统计学
STATISTICS
计算误差平方和(SS)
7 - 21
统计学
STATISTICS
误差平方和的计算
SST ( xijl x ) 2
i 1 j 1 l 1 k r m
1. 总平方和: 2. 行变量平方和: 3. 列变量平方和:
SSR rm ( xi. x ) 2
i 1
k
SSC km ( x. j x ) 2
对列因素提出的假设为:
• •
7-6
H0: m1 = m2 = … = mj = …= mr (mj为第j个水平的均值) H1: mj (j =1,2,…,r) 不全相等
统计学
STATISTICS
第二步:构造检验的统计量
x i .是行因素的第i个水平下各观察值的平均值:
xi .
x
j 1
F分布与拒绝域
拒绝H0 不能拒绝H0 0
a
F
Fa(n1 , n2)
7 - 13
n1 , n2分别为第一、二自由度
统计学
STATISTICS
第三步:统计决策
将统计量的值F与给定的显著性水平 a 的临界值Fa
若FR>Fa ,则拒绝原假设H0 ,表明均值之间的差异
是显著的,即所检验的行因素对观察值有显著影响。
STATISTICS
设: x ijl为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 。 x i . 为行因素的第i个水平的样本均值 。 x. j 为列因素的第j个水平的样本均值。 x ij 对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值 。 x 为全部n个观察值的总均值 。
7 - 24
统计学
STATISTICS
有交互作用的双因素分析
7 - 25
结
束
结论: FR=18.10777>Fa=3.4903,拒绝原假设H0,说明彩电 的品牌对销售量有显著影响。 FC=2.100846< Fa=3.2592,不能拒绝原假设H0,说 明销售地区对彩电的销售量没有显著影响。 7 - 18
统计学
STATISTICS
三、有交互作用的双因素 方差分析
统计学
不同品牌的彩电在各地区的销售量数据
品牌因素
品牌1 品牌2 品牌3 7 - 16 品牌4
地区因素 地区1 365 345 358 288 地区2 350 368 323 280 地区3 343 363 353 298 地区4 340 330 343 260 地区5 323 333 308 298
统计学
2 r j 1 i 1 r j 2
2
SSE xij xi. x. j x
k i 1 j 1
统计学
STATISTICS
总离差平方和(SST)、水平项离差平方和 (SSR和
SSC) 、误差项离差平方和(SSE) 之间的关系:
x
k r i 1 j 1 k r i 1 j 1
ij
x
2
xi. x x. j x xij xi. x. j x
2 k r 2 k r i 1 j 1 i 1 j 1
SST = SSR +SSC +SSE
7-9
统计学
STATISTICS
计算均方(MS) 误差平方和除以相应的自由度。 三个平方和的自由度分别是: • 总离差平方和SST的自由度为 kr-1; • 行因素的离差平方和SSR的自由度为 k-1; • 列因素的离差平方和SSC的自由度为 r-1; • 随机误差平方和 SSE 的自由度为 (k-1)×(r-1)。
j 1
k r
r
4. 交互作用平方和: SSRC m ( xij xi. x. j x ) 2
i 1 j 1
5. 误差项平方和:
7 - 22
SSE SST SSR SSC SSRC
统计学
STATISTICS
有交互作用的双因素方差分析 方差分析表的结构
7 - 23
STATISTICS
【例】城市道路交通管理部门为研究不同的路段和不同的时间 段对行车时间的影响,让一名交通警察分别在两个路段和高峰期 与非高峰期亲自驾车进行试验,通过试验取得共获得20个行车时 间(分钟)的数据,如下表。试分析路段、时段以及路段和时段的 交互作用对行车时间的影响。
7 - 20
统计学