第八章方差分析与回归分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
精心整理
第八章方差分析与回归分析
§1单因素试验的方差分析
试验指标:研究对象的某种特征。 例各人的收入。
因素:与试验指标相关的条件。
例各人的学历,专业,工作经历等与工资有关的特征。
因素水平:因素所在的状态
例学历是因素,而高中,大学,研究生等,就是学历因素水平;数学,物理等就是专业的水平。
问题假设
1,,r A ;
2。各个总体的抽样过程是独立的。3)~i X 1原假设22,,,r μσ进行参数估计。注
121
0r
i
k δ
==∑各类样本均值
水平i A 的样本均值:1
1
i
n i ij
j i
X X
n ==
∑;
水平总样本均值:11111i n r r
ij i i i j i X X n X n n =====∑∑∑,1
r
i i n n ==∑;
偏差平方和与效应 组间偏差平方和:
2
221
1
()r
r
A i i i i i i S n X X n X nX ===-=-∑∑;(衡量由不同水平产生的差异)
组内偏差平方和:
2
2
211
1
1
()()i
i
n n r
r
E ij i ij i i i j i j S X X X n X =====-=-∑∑∑∑;
(衡量由随机因素在同一水平上产生的差异) 总偏差平方和:
2
2
211
1
()i
n r
r
T ij i ij i j i S X X n X nX ====-=-∑∑∑;
(综合衡量因素,水平之间,随机因素的差异) 定理1(总偏差平方和分解定理)T A E S S S =+。
即11
11
)()i
n r
i i j i j X X ====+-∑∑∑∑注定理2(E ES n =证1
)E i ES ===∑定理3
1)/E S 2)如还有,
2/~A S σ证1~(ij X N 1,
,i n ,且独立,所以由第五章定理2
1()~(i
n ij ij i i i i j X X X X n μμχσ=⎛⎫⎛⎫----= ⎪ ⎪⎪ ⎪⎭⎝⎭∑∑利用2
χ可加性,即得2
2
21
/~()()E i i S n r n r σχχ=-=-,且i X 与E S 独立。
注意到1
1r
i i i X n X n ==∑,因此X 也与E S 独立,从而A S 也与E S 独立。
注这里只需方差假设相同,不需要假设均值相同。 2)
~(0,1)ij i
X N μσ
-,且独立,同样利用第五章定理2,
22,,1(
)~(1)ij i
i j i i j
i j X X n n μμχσ
σ
'''''----∑∑。
但在假设成立时,222,,,1
1(
)()ij i
i j i ij i j i j i j
X X X X n μμσ
σσ'''''---
=-∑∑∑,即得结论。且X 与T S 独立。 同时,2
22
1()()/~(1)r
i A i X X S r μμσχσ=⎛⎫---=- ⎪⎝⎭
∑。
注此处结论证明利用了i n 都相等,即利用:1,11
r k ij k i j
X X r n ==∑∑。但上述结论在组样本容量不同时,
直接利用正交变换仍可类似证明。
从统计角度看,如果假设0H 成立,那么
211
1
E A ES ES n r r σ==--,而在假设不成立时,11A ES r -定理1总体i X 2,
,,)r μσμδ+,其中所以i δ2
22
12
,()ln (,,
,,)ln(2)22ij i r i j
x n L μδμδδσπσσ--=--∑, 约束条件:
0i i
i
n δ
=∑。
求其最大值点得:
2
12
,()
ln (,,,,)202ij i r i j
x L μδμδδσμ
σ--∂
==∂∑
,
即:,0ij i i i j
i
x n n μδ--=∑∑;或,0nx n μ-=。
2
12
1
1()
[ln (,,,,)]2
02i
r
ij i r i i i i j n i
x L k n kn μδμδδσδδσ
=≤≤--∂
+=+=∂∑∑
,
(k 是拉格朗日乘子)
即20i i i i i i n x n n k n μδσ---=;或,20i i x k μδσ---=;
2212
2
4
,1ln (,,,,)()022r ij
i i j
n L x
μδδσμδσ
σ
σ
∂=-
+
--=∂∑,
即221()ij i
x σμδ=
--∑,或,22
221{22}ij i i i i i
x nx n x
n n σμδμδ=--++∑∑∑, μ--
i x x -。所以2ˆi
σ+∑同时,ˆˆ()2i i i i i i i i
i
x n x x n x δδ=--∑∑ 22()i i i i i
i i i
i
i
n n x x x n x nx =-=--=-+∑∑∑, 因此
}n
=
2第i
即可得到置信区间:
/2/2(((i i X t n r X t n r αα--+-。
但,必须注意,对整个问题而言,置信水平不再是1α-。记事件
/2/2{(((i i i i E X t n r X t n r ααμ=∈--+-。
则()1i P E α=-。但()1()1i i i
i
P E P E r α=-≥-。