应用多元统计分析课后习题答案详解北大高惠璇(第四章部分习题解答)

合集下载

应用多元统计分析课后习题答案高惠璇第四章部分习题解答

4
第四章回归分析
令
L(a0 , 2 ) 2 2 L(a0 , ) 2 [( y1 a0 ) ( y2 a0 ) 3( y3 3a0 ) 0 a0 2
可得
令 ln L(a ˆ0 , 2 ) 3 1 2 ˆ [( y a ) ] 0 1 0 2 2 2 2 2 2( ) drf 可得 ˆ 2 1 2 ˆ0 ) 2 ( y2 a ˆ0 ) 2 ( y3 3a ˆ0 ) 2 ˆ0 ( y1 a
1
经验证:① B-A是对称幂等阵; ② rank(B-A)=tr(B-A)=2-1=1;
25 80 35 1 256 112 330 49
8
第四章回归分析
③ A(B-A)=O3×3 .由第三章§3.1的结论6知
Y AY与Y ( B A)Y相互独立;也就是 ˆ ˆ 与 ˆ 相互独立.
ˆi y ˆ ) ( yi y )( y i 1
n n n i 1 i 1 2
R
2
2 2 ˆ ˆ ( y y ) ( y y ) i i

2 ˆi y ) ( y i 1
n n n i 1 i 1
2
2 2 ˆ ˆ ( y y ) ( y y ) i i
(因 1n C张成的空间 , 这里有H1n 1n )
n n i 1 i 1
(2) 因 ( yi y )( y ˆi y ˆ ) ( yi y ˆi y ˆ i y )( y ˆi y )
ˆ i )( y ˆi y ) ( y ˆi y )2 ( yi y

(完整word版)应用多元统计分析习题解答主成分分析

主成分分析6.1 试述主成分分析的基本思想。

答：我们处理的问题多是多指标变量问题，由于多个变量之间往往存在着一定程度的相关性，人们希望能通过线性组合的方式从这些指标中尽可能快的提取信息。

当第一个组合不能提取止。

这就是主成分分析的基本思想。

6.2 主成分分析的作用体现在何处？答：一般说来，在主成分分析适用的场合，用较少的主成分就可以得到较多的信息量。

以各个主成分为分量，就得到一个更低维的随机向量；主成分分析的作用就是在降低数据“维数”6.3 简述主成分分析中累积贡献率的具体含义。

答：主成分分析把p 个原始变量12,,,p X X X 的总方差()tr Σ分解成了p 个相互独立的变量p 个主成分的，忽略一些带有较小方差的主成分将不会给总方差带来太大的影响。

这里我们()m p <个主成分，则称11pmm kkk k ψλλ===∑∑ 为主成分1,,m Y Y 的累计贡献率，累计贡献率表明1,,m Y Y 综合12,,,p X X X 的能力。

通常取m ，使得累计贡献率达到一个较高的百分数（如85％以上）。

答：这个说法是正确的。

即原变量方差之和等于新的变量的方差之和6.5 试述根据协差阵进行主成分分析和根据相关阵进行主成分分析的区别。

答：从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。

从协方差矩阵出发的，其结果受变量单位的影响。

主成分倾向于多归纳方差大的变量的信息，对于方差小的变量就可能体现得不够，也存在“大数吃小数”的问题。

实际表明，这种差异有时很大。

我6.6 已知X =()’的协差阵为试进行主成分分析。

解：=0计算得当时，同理，计算得时，易知相互正交单位化向量得，,综上所述，第一主成分为第二主成分为第三主成分为6.7 设X=()’的协方差阵(p为, 0<p<1证明：为最大特征根，其对应的主成分为。

证明：==,为最大特征根当时，=所以，6.8利用主成分分析法，综合评价六个工业行业的经济效益指标。

应用多元统计分析习题解答_判别分析

应用多元统计分析习题解答_判别分析第四章判别分析4.1 简述欧几里得距离与马氏距离的区别和联系。

答：设p维欧几里得空间中的两点X=和Y=。

则欧几里得距离为。

欧几里得距离的局限有①在多元数据分析中，其度量不合理。

②会受到实际问题中量纲的影响。

设X,Y是来自均值向量为，协方差为的总体G中的p维样本。

则马氏距离为D(X,Y)=。

当即单位阵时，D(X,Y)==即欧几里得距离。

因此，在一定程度上，欧几里得距离是马氏距离的特殊情况，马氏距离是欧几里得距离的推广。

4.2 试述判别分析的实质。

答：判别分析就是希望利用已经测得的变量数据，找出一种判别函数，使得这一函数具有某种最优性质，能把属于不同类别的样本点尽可能地区别开来。

设R1，R2，…，Rk是p维空间R p 的k个子集，如果它们互不相交，且它们的和集为，则称为的一个划分。

判别分析问题实质上就是在某种意义上，以最优的性质对p 维空间构造一个“划分”，这个“划分”就构成了一个判别规则。

4.3 简述距离判别法的基本思想和方法。

答：距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。

其基本思想都是分别计算样本与各个总体的距离（马氏距离），将距离近的判别为一类。

①两个总体的距离判别问题设有协方差矩阵∑相等的两个总体G 1和G 2，其均值分别是μ1和μ 2，对于一个新的样品X ，要判断它来自哪个总体。

计算新样品X 到两个总体的马氏距离D 2（X ，G 1）和D 2（X ，G 2），则X，D 2（X ，G 1）D 2（X ，G 2）X，D 2（X ，G 1）> D 2（X ，G 2，具体分析，2212(,)(,)D G D G -X X111122111111111222*********()()()()2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2()22()2()---''=-++-'+⎛⎫=--- ⎪⎝⎭''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ记()()W '=-X αX μ 则判别规则为X，W(X)X，W(X)<0②多个总体的判别问题。

应用多元统计分析课后答案 .doc

2.1.试叙述多元联合分布和边际分布之间的关系。

解：多元联合分布讨论多个随机变量联合到一起的概率分布状况，12(,,)p X X X X '=L 的联合分布密度函数是一个p 维的函数，而边际分布讨论是12(,,)p X X X X '=L 的子向量的概率分布，其概率密度函数的维数小于p 。

2.2设二维随机向量12()X X '服从二元正态分布，写出其联合分布。

解：设12()X X '的均值向量为()12μμ'=μ，协方差矩阵为21122212σσσσ⎛⎫ ⎪⎝⎭，则其联合分布密度函数为1/21222112112222122121()exp ()()2f σσσσσσσσ--⎧⎫⎛⎫⎛⎫⎪⎪'=---⎨⎬ ⎪⎪⎝⎭⎝⎭⎪⎪⎩⎭x x μx μ。

2.3已知随机向量12()X X '的联合密度函数为121212222[()()()()2()()](,)()()d c x a b a x c x a x c f x x b a d c --+-----=--其中1ax b ≤≤，2c x d ≤≤。

求（1）随机变量1X 和2X 的边缘密度函数、均值和方差；（2）随机变量1X 和2X 的协方差和相关系数；（3）判断1X 和2X 是否相互独立。

（1）解：随机变量1X 和2X 的边缘密度函数、均值和方差；112121222[()()()()2()()]()()()dx cd c x a b a x c x a x c f x dx b a d c --+-----=--⎰12212222222()()2[()()2()()]()()()()dd c c d c x a x b a x c x a x c dx b a d c b a d c -------=+----⎰ 121222202()()2[()2()]()()()()dd c c d c x a x b a t x a t dt b a d c b a d c ------=+----⎰ 2212122222()()[()2()]1()()()()d cdc d c x a x b a t x a t b a d c b a d c b a------=+=----- 所以由于1X 服从均匀分布，则均值为2b a+，方差为()212b a -。

应用多元统计分析北大版第四章

b=(C′C)-1C′Y = BY 是β的最小二乘估计(其中B= (C′C)-1C′).
参数向量β的最小二乘估计β=^b正好是m+1阶的线性方程组
C′Cβ=C′Y 的解.常称以上方程组为正规方程.
预测向量为 Y^=C b=HY,
其中H= C(C′C)-1C′称为“帽子”矩阵。
13
北大数学学院
第四章 §4.1 经典多元线性回归

c(1) c(2)
,
1 xn1 xnm
n
c(n)
则
C

c(1) c(2)
,

c(n)
n
Q( ) [ yt (0 1xt1 m xtm )]2 [ yt c(t) ]2
于显著性水平α)，依统计思想，小概率事件在一次实践中一般不会发生。如果
发生小概率事件，将否定前提假定H0.
29
第四章 §4.1 经典多元线性北大回数学归学院
正规方程的等价形式及U的计算公式
回归模型(4.1.1)可以改写为
(4.1.7)
它与原模型(4.1.1)没有本质差别，只不过是
模型(4.1.7)的特点是对观测数据 (yt, xt1, xt2,. . , xtm ) (t=1,2,…,n) 做了中心化处理.下面将说明在(4.1.7)下得到的正规方程的形式.
而R称为复相关系数。 22
第四章 §4.1 经典多元线北性大数回学学归院
回归方程的显著性检验—定理4.1.3
定理4.1.3 在模型(4.1.3)下有
23
第四章 §4.1 经典多元线北性大数回学学归院
回归方程的显著性检验

应用多元统计分析课后题答案

c) c)2
2( x1

a)( x2

c)]
其中 a x1 b ， c x2 d 。求（1）随机变量 X1 和 X 2 的边缘密度函数、均值和方差；（2）随机变量 X1 和 X 2 的协方差和相关系数；（3）判断 X1 和 X 2 是否相互独立。
（1）解：随机变量 X1 和 X 2 的边缘密度函数、均值和方差；
12

2 2

1/
2
exp

1 2
(x

μ)

12 21
12

2 2
1
(x

μ)

。
2.3 已知随机向量 ( X1 X 2 ) 的联合密度函数为
f
( x1 ,
x2 )

2[(d

c)( x1

a)
(b a)(x2 (b a)2 (d

μ)

1 n 1
n i 1
E(Xi
-
μ)(
X i
-
μ)

nE(X

μ)(X

μ)

Σ
。
故 S 为 Σ 的无偏估计。 n 1
2.9.设 X(1) , X(2) , ..., X(n) 是从多元正态分布 X ~ N p (μ, Σ) 抽出的一个简单随机样本，试求 S
c) 2(x1 a)(x2 a)2(d c)2

c)]
dx2
2(d c)(x1 a)x2 d dc 2[(b a)t 2(x1 a)t] dt
(b a)2 (d c)2

应用多元统计分析课后习题答案高惠璇第四章部分习题解答市公开课获奖课件省名师示范课获奖课件

0
2
)
3 2
(ˆ
2
)
3 2
ˆ 2 ˆ 0 2
3
2
V
3 2
下列来讨论与V等价旳统计量分布:
ˆ 2
1 3
( y1
aˆ)2
( y2
2aˆ
bˆ)2
( y3
aˆ
2bˆ)2
1 3
( y1
yˆ1 ) 2
( y2
yˆ2 )2
( y3
yˆ3 )2
1 3
(Y
Xˆ )(Y
Xˆ )
1Y 3
(I3
X
(
X
X
)1
Q(β)=(Y-Cβ) '(Y-Cβ) . 试证明β^＝(C'C)-1C'Y是在下列四种意义下达最小：
(1) trQ(β^)≤trQ(β) (2) Q(β^)≤Q(β) (3) |Q(β^)|≤|Q(β)|
(4) ch1(Q(β^))≤ch1(Q(β))，其中ch1(A)表达A
旳最大特征值. 以上β是(m+1)×p旳任意矩阵.
[(
y1
aˆ0
)2
]
0
可得
ˆ
2
1 3
( y1
aˆ0 )2
( y2
aˆ0 )2
( y3
3aˆ0 )2
drf
ˆ
2 0
似然比统计量旳分子为
L(aˆ0
,ˆ
2 0
)
(2
)
3 2
(ˆ 0 2
)
3 2
exp[
3 2
].
5
第四章回归分析
似然比统计量为
L(aˆ0 ,ˆ02 ) L(aˆ,bˆ,ˆ 2 )

多元统计分析课后习题解答第四章

• 题目：简述主成分分析的步骤。答案：主成分分析是一种降维技术，其步骤包括标准化原始数据、计算样本相关系数矩阵、计算特征值和特征向量、选择主成分并解释其意义等。通过主成分分析，可以将多个变量简化为少数几个综合变量，便于分析和解释。 • 答案：主成分分析是一种降维技术，其步骤包括标准化原始数据、计算样本相关系数矩阵、计算特征值和特征向量、选择主成分并解释其意义等。通过主成分分析，可以将多个变量简化为少数几个综合变量，便于分析和解释。
习题解析
• 题目：简述多元统计分析的基本思想答案：多元统计分析是通过对多个变量进行综合分析，揭示数据之间的内在关系和规律，进而解决实际问题的方法。其基本思想包括多变量综合分析、多变量分类分析、多变量预测分析等。
• 答案：多元统计分析是通过对多个变量进行综合分析，揭示数据之间的内在关系和规律，进而解决实际问题的方法。其基本思想包括多变量综合分析、多变量分类分析、多变量预测分析等。
汇报人：XX
多元统计分析的方法和技术广泛应用于各个领域，如心理学、经济学、医学等。
多元统计分析的基本步骤包括数据收集、数据探索、模型选择、模型拟合和模型评估等。
多元统计分析的基本思想
综合多个变量进行全面分析，以揭示数据之间的内在联系和规律强调变量之间的交互作用和协同效应，以实现更准确的预测和推断通过对数据的降维处理，简化复杂数据集，提取关键信息
• 题目：解释因子分析的基本思想。答案：因子分析是一种探索性统计分析方法，其基本思想是通过寻找隐藏在多个变量背后的共同因子来解释变量之间的相互关系。通过因子分析，可以揭示数据的基本结构，简化数据的复杂性，并加深对数据内在规律的认识。 • 答案：因子分析是一种探索性统计分析方法，其基本思想是通过寻找隐藏在多个变量背后的共同因子来解释变量之间的相互关系。通过因子分析，可以揭示数据的基本结构，简化数据的复杂性，并加深对数据内在规律的认识。

应用多元统计分析课后习题答案详解北大高惠璇(第二章部分习题解答)

则2
x12

2x1x2

x22

y12

y22
(2)第二次配方.由于
xx12

y2 y1

y2
14
第二章多元正态分布及参数的估计
2x12 x22 2x1x2 22x1 14x2 65
y12 y22 22y2 14( y1 y2 ) 65
y12 14y1 49 y22 8y2 16
15
第二章多元正态分布及参数的估计
(3) 随机向量
Y

YY12

~
N2

7 4
,
I2

(4) 由于
X

X X
1 2

0 1
11
Y1 Y2

CY

0 1
11 74

34

比较上下式相应的系数,可得:

1 2
2 2

1 2

2
1

2 1
1
1 2 1

2 1
1
2
1/

21
2 2
2
2
2 1
21 22 21 21

22 14
12
2 2

22
2 1
21 212
注意:由D(X)≥0,可知 (Σ1-Σ2) ≥0.
8
第二章多元正态分布及参数的估计
2-11 已知X=(X1,X2)′的密度函数为
f

应用多元统计分析课后习题解答详解北大高惠璇(第二章部分习题解答)

2 2
X 2 ~ N (3,2).
10
第二章多元正态分布及参数的估计
12 Cov( X1, X 2 ) E[( X1 E( X1))( X 2 E( X 2 )]
E[( X1 4)( X 2 3)]
(x1 4)(x2 3) f (x1, x2 )dx1dx2
令uu21
x1 x2
X
X X
(1) (2)
~
N2 p
(1) (2)
,
1 2
2 1
,
其中μ(i) (i＝1，2)为p维向量,Σi (i＝1，2)为p阶矩阵，
(1) 试证明X(1) +X(2)和X(1) -X(2) 相互独立.
(2) 试求X(1) +X(2) 和X(1) -X(2) 的分布.
解 :(1) 令
Y
2
x12
22
x1
65
x12
14
x1
49)
1 2
(
x2
x1
7)2
e e dx2
2
1 e
1 2
(
x12
8
x1
16)
2
1
2
e dx
1 2
(
x2
x1
7
)
2
2
1 e
1 2
(
x1
4
)
2
2
X1 ~ N(4,1).
类似地有
f2 (x2 ) f (x1, x2 )dx1
1
e
1 4
(
x2
3)2
4
第二章多元正态分布及参数的估计
(2) 因
Y
X1 X1

应用多元统计分析课后答案_暴强整理40页

第二章2.1 试述多元联合分布和边缘分布之间的关系。

设，是p维随机向量，称由它的q（<p）个分量组成的子向量，的分布为的边缘分布，相对地把的分布称为联合分布。

当的分布函数为F，时，的分布函数即边缘分布函数为F，=P()= F，当X有分布密度f（，）则也有分布密度，即边缘密度函数为：f（，）=（，）2.2 设随机向量服从二元正态分布，写出其联合分布密度函数和各自的边缘密度函数。

联合分布密度函数，0 , 其他==（）所以指数部分变为令t== exp[] exp[] ，=0 ，其他同理，exp[] ，=0 ，其他2.3 已知随机向量的联合分布密度函数为,其中, 。

求：（1）随机变量各自的边缘密度函数、均值与方差。

解：==同理，==同理可得()22dc x E +=同理可得()()1222d c x D -=（2）随机变量的协方差和相关系数。

E(==E(==E(==E(=D(E(D(E(Cov E(E(=.===（3）判断是否独立。

不相互独立。

2.4设随机向量，服从正态分布，已知其协差阵为对角阵，证明的分量是相互独立的随机变量。

Σ= ΣΣΣΣ与不相关又，服从正态分布与相互独立。

（，，，，，） 2.5解：依据题意，X=E(X)=D(X)=注：利用 11p n n ⨯'=1X X , S 1()n n n n''=-11X I X 其中 1001n ⎡⎤⎢⎥=⎢⎥⎢⎥⎣⎦I 在SPSS 中求样本均值向量的操作步骤如下：1. 选择菜单项Analyze →Descriptive Statistics →Descriptives ，打开Descriptives 对话框。

将待估计的四个变量移入右边的Variables 列表框中，如图2.1。

图2.1 Descriptives 对话框2. 单击Options 按钮，打开Options 子对话框。

在对话框中选择Mean 复选框，即计算样本均值向量，如图2.2所示。

高惠璇多元统计分析习题答案

第四章4-1 设⎪⎩⎪⎨⎧++=+-=+=,2,2,332211εεεb a y b a y a y ).,0(~323321I N σεεεε⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=（1）试求参数b a ,的最小二乘估计；（2）试导出检验b a H =:0的似然比统计量，并指出当假设成立时，这个统计量是分布是什么？解：（1）由题意可知.,,,211201321321⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-=εεεεβ b a y y y Y C 则⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡-==--321'1''1'211201************)(ˆy y y Y C C C β.ˆˆ)2(51)2(6132321⎥⎦⎤⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡+-++ba y y y y y（2）由题意知，检验b a H =:0的似然比统计量为2322ˆ⎪⎪⎭⎫ ⎝⎛=σσλ 其中，])ˆ2ˆ()ˆˆ2()ˆ[(31ˆ2322212b a y b a y a y --++-+-=σ。

当0H 成立时，设0a b a ==，则⎪⎩⎪⎨⎧+=+=+=,3,,303202101εεεa y a y a y ,311⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=C 可得,ˆ)3y (111311311311)(ˆ0321321'1''1'ay y y y y Y C C C =++=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎪⎪⎪⎪⎭⎫ ⎝⎛⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡==--β ],)ˆ3()ˆ()ˆ[(31ˆ20320220120a y a y ay -+-+-=σ因此，当假设0H 成立时，与似然比统计量λ等价的F 统计量及其分布为).1,1(~ˆˆˆ2202F F σσσ-=4-3 设Y 与321,,x x x 有相关关系，其8组观测数据见表4.5.表 4.5 观测数据序号 1x2x3xY1 38 47.5 23 66.02 41 21.3 17 43.0 3 34 36.5 21 36.0 4 35 18.0 14 23.0 5 31 29.5 11 27.06 34 14.2 9 14.07 29 21.0 4 12.0 83210.087.6（1）设εββββ++++=3322110x x x Y ，试求回归方程及决定系数2R 和均方误差2s 。

应用多元统计分析课后习题答案详解北大高惠璇部分习题解答

解：检验三个尺寸(变量)是否符合这一规律的问题
可提成假设检验问题.因为
1 : 2 : 3 6 : 4 :1 C 0
其中
C
1 0
0 1
6 4
23
,
注意:
第24页/共46页
1 3
6 , 且 2 4
1
3 1
12
63 43
00.
24
第三章多元正态总体参数的检验
或
C
2 1
3 0
0 6
~
Nr (0, 11),
X (2) ( )
~
N pr (0, 22 ),
记
X
n p
xij
X (1) | X (2) , nr n( pr)
则
W
X
X
X (1)X (1) X (2)X (1)
X X
(1) X (2) X
(2) (2)
WW1211
W12 W22
,
即 W11 X (1)X (1), W22 X (2)X (2)
样本，样本均值为X，样本离差阵为A.记μ＝(μ1,…,μp)′.为检验
H0:μ1=μ2=…=μp ,H1:μ1,μ2,…,μp至少有一对不相等.令
C 11
1 0
0 1
0 0
,
1 0 0 1( p1)p
则上面的假设等价于H0：Cμ=0p-1,H1：Cμ≠ 0p-1
试求检验H0 的似然比统计量和分布.
Tx2 n(n 1)(X ) Ax1( X )
~ T 2 ( p, n 1).
令 Y(i) CX (i) d (i 1,..., n)
其中C是pp非退化常数矩阵，d是p1常向量。

应用多元统计分析课后答案_暴强整理

第二章2.1 试述多元联合分布和边缘分布之间的关系。

设X =(X 1,X 2，⋯X p )′是p 维随机向量，称由它的q （<p ）个分量组成的子向量X(i)=(X i1,X i2，⋯X iq )′的分布为X 的边缘分布，相对地把X 的分布称为联合分布。

当X 的分布函数为F (x 1,x 2，⋯x p )时，X (1)的分布函数即边缘分布函数为F (x 1,x 2，⋯x p )=P(X 1≤x 1,⋯X q ≤x q ,X q+1≤∞,⋯X p ≤∞) = F (x 1,x 2，⋯x q ,∞,⋯∞)当X 有分布密度f （x 1,x 2，⋯x p ）则X (1)也有分布密度，即边缘密度函数为：f （x 1,x 2，⋯x q ）=∫⋯+∞−∞∫f （x 1,x 2，⋯x p ）dx q+1⋯d +∞−∞x p 2.2 设随机向量X =(X 1,X 2)′服从二元正态分布，写出其联合分布密度函数和X 1,X 2各自的边缘密度函数。

联合分布密度函数12πσ1σ2(1−ρ2)1/2exp{−12(1−ρ2)[(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+f (x 1,x 2)=(x 2−μ2)2σ22]} ， x 1>0,x 2>00 , 其他(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22=(x 1−μ1)2σ12−2ρ(x 1−μ1)(x 2−μ2)σ1σ2+(x 2−μ2)2σ22+ρ2(x 1−μ1)2σ12−ρ2(x 1−μ1)2σ12=[ρ(x 1−μ1)σ1−(x 2−μ2)σ2]2+（1−ρ2）(x 1−μ1)2σ12所以指数部分变为−12{[11√1−ρ2σ1−22√1−ρ2σ2]2+(x 1−μ1)2σ12}令t=22√1−ρ2σ2−11√1−ρ2σ1 ∴dt =√1−ρ2σ22∴f (x 1)=∫f (x 1,x 2)+∞−∞dx 2=12πσ1σ2(1−ρ2)1/2exp{−(x 1−μ1)22σ12∫exp(+∞−∞−12t 2√1−ρ22dt =√2πσexp[−(x 1−μ1)22σ12] √2πσexp[−(x 1−μ1)22σ12] ， x 1>0f (x 1)=0 ，其他同理， √2πσ2exp[−(x 2−μ2)22σ22] ， x 2>0f (x 2)=0 ，其他2.3 已知随机向量X =(X 1,X 2)′的联合分布密度函数为f (x 1,x 2)=2[(d−c )(x 1−a )+(b−a )(x 2−c )−2(x 1−a)(x 2−c)(b−a)2(d−c)2,其中,a ≤x 1≤b,c ≤x 2≤d 。

应用多元统计分析课后习题答案高惠璇

3 解三:两次配方法
2 1 2 2 2 (1)第一次配方: 2 x12 2 x1 x2 x2 ( x1 x2 ) 2 x12
2 1 x1 2 1 1 1 1 1 因2 x 2 x1 x2 x ( x1 , x2 ) , 而 BB, 1 1 x2 1 1 1 0 1 0 y1 1 1 x1 x1 x2 2 2 2 2 令y , 则 2 x 2 x x x y y 1 1 2 2 1 2 y x x 1 0 2 1 2
类似地有

1 2 2 ( 2 x1 22 x1 65 x1 14 x1 49 ) 2
f 2 ( x2 )
X 2 ~ N (3,2).

f (x , x )dx
1 2 1
1 2 2
e
1 ( x2 3) 2 4
10
第二章
多元正态分布及参数的估计
1 e 2
1 2 ( 2 x1 22 x1 65) 2

e
1 2 ( x2 2 x2 ( x1 7 ) ( x1 7 ) 2 ) 2
dx2 e
1 ( x1 7 ) 2 2
9
第二章
多元正态分布及参数的估计
1 ( x2 x1 7 ) 2 2
1 e e dx2 2 1 2 1 ( x 8 x 16 ) ( x2 x1 7 ) 2 1 1 1 1 2 e 2 e dx2 2 2 1 ( x1 4 ) 2 1 e 2 X1 ~ N (4,1). 2
u1 x1 4 令 u2 x2 3

多元统计分析应用第四章课后习题

第四章判别分析习题4.8（1）根据数据建立贝叶斯判别函数，并根据此判别函数对原样本进行回判。

（2）现有一新品牌的饮料在该超市试销，其销售价格为3.0，顾客对其口味评分为8，信任度评分平均为5，试预测该饮料的销售情况。

将数据导入SPSS，分析得到以下结果：1.典型判别函数的特征函数的特征值表表1-1 特征值表表1-1所示是典型判别函数的特征值表，只有两个判别函数，所以特征值只有2个。

函数1的特征值为17.791，函数2的特征值为0.720，判别函数的特征值越大，说明函数越具有区别判断力。

函数1方差的累积贡献率高达96.1%，且典型相关系数为0.973，而函数2方差的贡献率仅为3.9%，典型相关系数为0.647。

由此，说明函数1的区别判断力比函数2的强，函数1更具有区别判断力。

2.Wilks检验结果表1-2 Wilks 的Lambda上表中判别函数1和判别函数2的Wilks’Lambda值为0.031，判别函数2的Wilks’Lambda值为0.581。

“1到2”表示两个判别函数的平均数在三个类间的差异情况，P值=0.002<0.05表示差异达到显著水平“2”表示在排除了第一个判别函数后，第二个判别函数在三个组别间的差异情况，P值=0.197>0.05表示判别函数2未达到显著水平。

3.建立贝叶斯判别函数表1-3 贝叶斯判别法函数系数上表为贝叶斯判别函数的系数矩阵，用数学表达式表示各类的贝叶斯判别函数为：第一组：F1=-81.843-11.689X1+12.97X2+16.761X3第二组：F2=-94.536-10.707X1+13.361X2+17.086X3第三组：F3=-17.499-2.194X1+4.960X2+6.447X3将新品牌饮料样品的自变量值分别代入上述三个贝叶斯判别函数，得到三个函数值为：F1=65.271，F2=65.661，F3=47.884比较三个值，可以看出F2=65.661最大，据此得出新品牌饮料样品应该属于第二组，即该饮料的销售情况为平销。

多元统计分析第四章至第九章课后题数据

4.8 某超市经销十种品牌饮料，其中四种畅销，三种平销，三种滞销。

下表是这十种品牌饮料的销售价格（元）和顾客对各种饮料的口味评分、信任度评分的平均数。

销售情况产品序号销售价格口味评分信任度评分畅销1 2.2 5 8 2 2.5 6 73 3 3 94 3.2 8 6 平销5 2.8 76 6 3.5 87 7 4.89 8 滞销8 1.7 3 4 9 2.2 4 2 102.7 4 3（1）根据数据建立贝叶斯判别函数，并根据此判别函数对原样本进行回判。

（2）现有一新品牌的饮料在该超市试销，其销售价格为3.0，顾客对其口味的评分平均为8，信任评分平均为5，试预测该饮料的销售情况。

4.9 银行的贷款部门需要判别每个客户的信用好坏（是否为履行还贷责任），以决定是否给予贷款。

可以根据贷款申请人的年龄（1X ）、受教育程度（2X ）、现在所从事工作的年数（3X ）、未变更住址的年数（4X ）、收入（5X ）、负债收入比例（6X ）、信用卡债务（7X ）、其他债务（8X ）等来判断其信用情况。

下表是从银行的客户资料中抽取的部分数据，（1）根据样本资料分别用距离判别法、贝叶斯判别法和费希尔判别法建立判别函数和判别规则。

（2）某客户的如上情况资料为（53,1,918,50,11.20,2.02,3.58），对其进行信用好坏的评。

目前信用好坏客户序号X1 X2 X3 X4 X5 X6 X7 X8 已履行还贷责任1 23 1 72 31 6.6 0.34 1.71 2 34 1 173 59 8 1.81 2.91 3 42 2 7 23 41 4.6 0.94 0.94 4 39 1 195 48 13.1 1.93 4.36 5 35 1 9 1 34 5 0.4 1.3 未履行还贷责任6 37 1 1 3 24 15.1 1.8 1.82 7 29 1 13 1 42 7.4 1.46 1.65 8 32 2 11 6 75 23.3 7.76 9.72 9 28 2 2 3 23 6.4 0.19 1.29 1026 1 4 3 27 10.5 2.47 0.365.8 下表是15个上市公司2001年的一些主要财物指标，使用系统聚类法和K 均值法分别对这些公司进行聚类，并对结果进行比较分析。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

)
4
第四章回归分析
令
∂L(a0 , σ 2 ) 2 2 = L(a0 , σ ) − 2 [−( y1 − a0 ) − ( y2 − a0 ) − 3( y3 − 3a0 ) = 0 ∂a0 2σ
可得
令 ∂ ln L(a0 , σ 2 ) ˆ 3 1 ˆ0 ) 2 + L] = 0 =− 2 + [( y1 − a 2 2 2 ∂σ 2σ 2(σ ) drf 可得 ˆ 2 1 ˆ ˆ ˆ ˆ σ = [( y1 − a0 ) 2 + ( y2 − a0 ) 2 + ( y3 − 3a0 ) 2 ] = σ 02
[ 3
]
1 ˆ1 ) 2 + ( y2 − y2 ) 2 + ( y3 − y3 ) 2 ˆ ˆ = ( y1 − y 3 1 ˆ )′(Y − Xβ ) = 1 Y ′( I − X ( X ′X ) −1 X ′)Y ˆ = (Y − Xβ 3 3 3 1 = Y ′AY , 且 rank ( A ) = tr ( A ) = 3 − 2 = 1 3
解:用矩阵表示以上模型用矩阵表示以上模型: 用矩阵表示以上模型
y1 1 0 ε 1 def a Y = y2 = 2 − 1 b + ε 2 = Xβ + ε 1 2 ε y3 3
−1
则
i =1 i =1
14
第四章回归分析
上式第一项为: 上式第一项为
ˆ ˆ ˆ ˆ ( yi − yi )( yi − y ) = (Y − Y )′(Y − y1n ) ∑
i =1 n
ˆ ˆ ˆ ˆ ˆ ˆ = (Y − Cβ )′(Cβ − y1n ) = Y ′Cβ − β ′C ′Cβ − y (Y − Y )′1n ˆ ˆ = Y ′Cβ − (′C ′Y )Cβ − 0 = 0
ˆ ˆ ∑ ( yi − y )( yi − y ) i =1
n n n 2 i =1 i =1 2
R2 =
ˆi − y )2 ∑ ( yi − y ) × ∑ ( y ˆ
=
2 ˆ ∑ ( yi − y ) i =1
n n n 2 i =1 i =1
2
ˆi − y )2 ∑ ( yi − y ) × ∑ ( y ˆ
σ
~ χ (1)
2
[
]
7
第四章回归分析
1 1 ˆ0 )′(Y − Za0 ) = Y ′( I 3 − Z ( Z ′Z ) −1 Z ′)Y ˆ = (Y − Za 3 3 1 = Y ′BY 3
2 0 2
Байду номын сангаас
1 考虑 σ − σ = Y ′( B − A)Y ˆ ˆ 3 −1
B − A = X ( X ′X ) X ′ − Z ( Z ′Z ) Z ′
,
15
第四章回归分析 n
所以
R =
2
ˆi − y )2 ∑(y
∑(y
i =1
i =1 n
i
− y)
2
U = . l yy
(3) 残差平方和为残差平方和Q为
ˆ Q( β ) = l yy − U = l yy − l yy R 2 = (1 − R )l yy = (1 − R )∑ ( yi − y ) .
[
]
ˆ, σ 2 ) = (2π ) (σ 2 ) ˆ ˆ L ( a, b ˆ
L ( a0 , σ ) =
2
−
3 2
−
3 2
成立时,样本的似然函数为当H0：a=b=a0成立时样本的似然函数为
3 exp[− ]. 2
(
1 2 2 2 exp − 2 [( y1 − a0 ) + ( y2 − a0 ) + ( y3 − 3a0 ) ] 3 2σ 2πσ 2 1
2 2 2 i =1 n
16
第四章回归分析
在多对多的多元线性回归模型中， 4-7 在多对多的多元线性回归模型中，给定 Yn×p,Xn×m,且rank( )= ,C=(1n|X).则 rank(X)= )=m,C=(1 ).则 ). ×
Y ′AY与Y ′( B − A)Y相互独立; 也就是 ˆ ˆ ˆ σ − σ 与σ 相互独立.
2 0 2 2
由第三章§3.1的结论知(H0：a=b成立时的结论4知成立时) 由第三章§ 的结论成立时
Y ′( B − A)Y
2
σ σ ˆ2 ˆ 3(σ 0 − σ 2 ) Y ′( B − A)Y 2 = ∴ ~ χ (1) 2 2 σ σ
i =1 n
( yi − y ) 2 ; ∑
i =1 n
n
ˆ = （）残差平方和Q（β） (1 − R 2 )∑ ( yi − y ) 2 . 3
i =1
13
第四章回归分析
ˆ 证明:(1)估计向量为 Y = Cβ = C (C ′C ) −1 C ′Y = HY 估计向量为 ˆ 证明 1 n 1 ˆ 1 1 ˆ ˆ y = ∑ yi = 1′n Y = 1′n HY = ( H 1n )′Y n i =1 n n n 1 = 1′n Y = y. n
3 2 −2
ˆ (σ )
2
−
3 2
3 σ2 ˆ = 2 =V 2 σ ˆ0
3 2
以下来讨论与V等价的统计量分布以下来讨论与等价的统计量分布: 等价的统计量分布 1 2 ˆ ˆ ˆ ˆ ˆ ˆ σ = ( y1 − a) 2 + ( y2 − 2a + b) 2 + ( y3 − a − 2b) 2
3 似然比统计量的分子为
2
1 ˆ a0 = ( y1 + y2 + 3 y3 ) 11
ˆ ˆ ˆ L(a0 , σ 0 ) = (2π ) (σ 0 )
−
3 2
3 − 2 2
3 exp[− ]. 2
5
第四章回归分析
似然比统计量为
2
ˆ ˆ L(a0 , σ 0 ) (σ 0 ) ˆ λ= = 2 ˆ ˆ ˆ L ( a, b, σ )
否定域为
{λ ≤ λα } ⇐⇒ {V ≤ Vα } ⇐⇒ {ξ ≥ fα }
10
第四章回归分析
4-2 在多元线性回归模型在多元线性回归模型(4.1.3)中(p=1)，试求出参数中，向量β和的最大似然估计. 向量和σ2的最大似然估计
模型(4.1.3)为 Y = Cβ + ε 解:模型模型为样本的似然函数为
ε ~ N (0, σ 2 I ), n n
− n 2
1 L( β , σ ) = (2π ) (σ ) exp − 2 (Y − Cβ )′(Y − Cβ ) 2σ n n − − 1 2 2 2 2 ln L( β , σ ) = ln(2π ) + ln(σ ) − 2 (Y − Cβ )′(Y − Cβ ) 2σ n n − − 1 2 2 2 = ln(2π ) + ln(σ ) − 2 (Y ′Y − 2Y ′Cβ − β ′C ′Cβ ) 2σ
2
~ χ (1, δ ),因δ =
2
1
( Za0 )′( B − A) Za0 = 0
9
第四章回归分析
所以
Y ′AY = ~ F (1,1) ξ= 2 2 ˆ ˆ σ0 −σ Y ′( B − A)Y ˆ σ
2
3 2
ˆ2 σ V ξ 因λ = V , V = 2 , 故ξ = 或V = , ˆ σ0 1−V −V 1+ ξ
1 0 1 2 1 y1 ˆ y ˆ = a = ( X ′X ) −1 X ′Y = 1 2 1 2 − 1 β ˆ 0 − 1 2 0 − 1 2 2 1 2 y b 3
2
第四章回归分析
1 ( y + 2 y 2 + y3 ) −1 y1 + 2 y2 + y3 6 1 = 6 0 0 5 = 1 − y 2 + 2 y3 ( − y 2 + 2 y3 ) 5 (2) 试导出检验 0：a=b的似然比统计量，并指出当假试导出检验H 的似然比统计量，的似然比统计量设成立时，这个统计量的分布是什么? 设成立时，这个统计量的分布是什么
(因1n ∈ C张成的空间, 这里有H 1n = 1n )
n n i =1 i =1 n n
(2) 因 ∑ ( yi − y )( yi − y ) = ∑ ( yi − yi + yi − y )( yi − y ) ˆ ˆ ˆ ˆ ˆ
ˆ ˆ ˆ = ∑ ( yi − yi )( yi − y ) + ∑ ( yi − y ) 2
−1
1 25 80 − 35 = 256 − 112 330 49
经验证:① 是对称幂等阵; 经验证 ① B-A是对称幂等阵是对称幂等阵 ② rank(B-A)=tr(B-A)=2-1=1;
8
第四章回归分析
由第三章§ 的结论的结论6知 ③ A(B-A)=O3×3 .由第三章§3.1的结论知 × 由第三章
)
3
3 1 ∂ ln L 2 令 ˆ =− 2 + [( y1 − a) + L] = 0 2 2 2 ∂σ 2σ 2(σ )
1 ˆ 可得 σ = ( y1 − a) 2 + ( y2 − 2a + b) 2 + ( y3 − a − 2b) 2 ˆ ˆ ˆ ˆ ˆ 3 似然比统计量的分母为