数理统计课后答案-第七章

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

)
2 ⎡ ⎛ x − x ⎞2 x −μ x −μ ⎛ ⎞ ⎤ ⎢⎜ 1 2 ⎟ − 2 ρ ( 1 1 )( 2 2 ) + ⎜ x 2 − μ2 ⎟ ⎥ ⎜ ⎟ ⎜ ⎟ ⎢⎝ δ1 ⎠ δ1δ 2 ⎝ δ2 ⎠ ⎥ ⎣ ⎦
( 2π )
3 2
δ δ
1
2 2 1 2
(1 − ρ )
2
e
1 ⎛x − μ ⎞ − ⎜ 1 1⎟ 2 ⎝ x 2 − μ2 ⎠
系统聚类的结果用谱系图表示如下 ******HIERARCHICAL CLUSTER Dendrogram using Average Linkage (Between Groups) Rescaled Distance Cluster Combine CASE Label 10 15 1 13 11 14 6 7 0 5 10 15 20 25 ANALYSIS******
T
⎡δ 2 ⎢ 1 ⎢ ⎣ ρδ1δ 2
ρδ1δ 2 ⎤ ⎛ x1 − μ1 ⎞ ⎥ ⎜x − μ ⎟ 2 δ2 ⎥ ⎦ ⎝ 2 2⎠
−1
=
1
( 2π ) 2 Σ 2
3
e

T 1 (x − μ ) Σ−1 (x − μ ) 2
(2)二维正态总体,样本均值仍服从正态分布,而
EX = ⎜
⎛E X1 ⎞ ⎛μ ⎞ ⎟ = ⎜ 1⎟ = μ ⎜μ ⎟ ⎜E X ⎟ ⎝ 2⎠ ⎝ 2⎠
(4) 甲乙两同学的考试成绩的马氏距离表达式:
d( X (T1 ) , X (T2 ) ) = ( X ( 1 ) − X ( 2 ) )T S −1( X ( 1 ) − X ( 2 ) ) ⎡125 = [10,5,15] ⎢ ⎢37.5 12.5 ⎢ ⎣118.75 37.5
甲乙两同学考试成绩的欧氏距离为:
Extraction Method: Principal Component Analysis.
Component Matrix(a)
Component 1 VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008 VAR00009 .606 .622 .854 .756 .272 -.876 .595 -.841 -.221 2 -.072 -.303 -.045 -.236 .827 -.299 .451 .183 .686 3 -.316 .663 .193 -.410 -.341 .102 .258 -.058 .433
Extraction Method: Principal Component Analysis.
Total Variance Explained Initial Eigenvalues Component 1 2 3 4 Total 4.006 1.635 1.128 .955 % of Variance 44.516 18.167 12.532 10.607 Cumulative % 44.516 62.683 75.215 85.822 Extraction Sums of Squared Loadings Total 4.006 1.635 1.128 % of Variance 44.516 18.167 12.532 Cumulative % 44.516 62.683 75.215
⎤ ⎥ ⎥ 117.1875⎥ ⎦
-1
⎡10 ⎤ ⎢5⎥ ⎢ ⎥ ⎢ ⎣15⎥ ⎦
d( X (T1 ) , X (T2 ) ) = ( X ( 1 ) − X ( 2 ) )T ( X ( 1 ) − X ( 2 ) )
⎡10 ⎤ ⎥ = [10,5,15] ⎢ ⎢ 5 ⎥ = 100 + 25 + 225 ≈ 18.7083 ⎢ ⎣15⎥ ⎦
习题七
⎡δ12 ⎡ μ1 ⎤ 7.1 设 (ξ ,η ) ~ N μ1 ,δ ; μ2 ,δ ; ρ ,令 μ = ⎢ ⎥ ,Σ = ⎢ ⎢ μ2 ⎦ ⎥ ⎢ ⎣ ⎣ ρδ1δ 2
(
2 1
2 2
)
ρδ1δ 2 ⎤ δ 22 ⎦ ⎥
⎥ , 于是二维
正态分布 N
( μ ,δ ; μ ,δ ; ρ ) 可表示为 N ( μ ,Σ ) .
Extraction Method: Principal Component Analysis. a 3 components extracted.
7.5 试借助统计分析工具对 7.3 节中关于蠓的分类一例中的数据进行判别分析. 解 利用统计分析软件 SPSS 的操作结果截图如下 先建立 SPSS 数据文件
故 X ~ N ⎜ μ,
⎛ ⎝
⎞ Σ⎟ . n ⎠ 1
7.2 随机抽取某班级四名同学的数学、物理和化学三门课程的期中考试成绩,结果如下: 数学 甲 已 丙 丁 70 60 80 90 物理 75 70 75 80 化学 65 50 70 80
(1)写出样本数据阵 X ; (2)求出样本均值 X ,样本协方差阵 S ,样本相关阵 R ;
1
− μ1
)(
(
⎞ − μ2 ⎟ ⎟ 2 ⎟ X 2 − μ2 ⎠
2
) (X
)
)
⎛ D X1 = ⎜ ⎜ ⎜ cov X 1 ,X 2 ⎝
(
)
cov X 1 ,X 2 ⎞ 1 ⎛ δ 2 1 ⎟= ⎟ n ⎜ ⎜ ⎟ DX2 ⎝ ρδ1δ 2 ⎠
(
)
ρδ1δ 2 ⎞ δ
2 2
1 ⎟= Σ ⎟ n ⎠
⎡(70-75)/30 ⎤ ⎡ −1 / 6 ⎤ ⎡ −1.6667 ⎤ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ −1 / 2 ⎥ −0.5 ⎥ (60-75)/30 ⎥ , (3) 数学成绩的极差标准化 x % = ⎢ = ⎢ = ⎢ ⎢(80-75)/30 ⎥ ⎢1/6 ⎥ ⎢ 1.6667 ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎥ ⎣(90-75)/30 ⎦ ⎣ 1/2 ⎦ ⎣ 0.5 ⎦ ⎡(75-75)/4.0825 ⎤ ⎡ ⎤ 0 ⎢ ⎥ ⎢ ⎥ −1.2247 ⎥ (70-75)/4.0825 ⎥ ⎢ ⎢ %= ; 物理成绩 y 标准差标准化 y = ⎢(75-75)/4.0825 ⎥ ⎢ ⎥ 0 ⎢ ⎥ ⎢ ⎥ ⎣(80-75)/4.0825 ⎦ ⎣ 1.2247 ⎦
(1)试借助统计分析软件对 9 种饮料进行系统聚类. (2)借助统计分析工具对数进行主成分分析. (3) 根据 (1) 中分为三个类的聚类结果, 判别一个未知类别的样品 38.5,3.7,7.7,7.2 属于其中哪一个类. 解 (1)系统聚类
⎤ ⎥ ⎥, 117.1875 ⎥ ⎦ ⎤ ⎥ ⎥; 1⎥ ⎦
⎡125 ⎢ (2) 样本协方差阵(对称矩阵)为: S = ⎢37.5 12.5 ⎢ ⎣118.75 37.5
⎡1 ⎢ 样本相关阵(对称矩阵)为: R = ⎢0.948683298 1 ⎢ ⎣0.981155781 0.979795897
1 X%T X% . 百度文库 −1

1 X%T X% 的第 i 行第 j 列元素为 X%T 的第 i 行与 X% 的第 j 列对应元素相乘再相加的 n −1
1 % 的第 i 列与第 j 列对应元素乘积之和的 1 倍。用公式表示即为 倍。即 X n −1 n −1
n n x ki − x i x kj − x j 1 1 %ki x %kj = x ∑ ∑ n − 1 k =1 n − 1 k =1 si sj
=
n 1 ∑ n − 1 k =1
x ki − x i
1 n −1 − xi
x kj − x j
− xi
∑ (x ki k
n
=1
)
2
n 1 x − xj ∑ n − 1 k =1 kj
(
)
2
=
k =1 n
∑ (x ki
n
) (x
n
kj
− xj
) )
2
∑ (x ki k
=1
− xi
)
2
∑ (x kj k
(
) 为正态总体 (ξ,η ) 的样本,证明样本均值
2 1 2 2
X ~ N 2 ⎜ μ, Σ ⎟ . ⎝ n ⎠
(1)证 因

1

(ξ ,η ) ~ N ( μ ,δ ; μ ,δ ; ρ ) ,故
1 2
P ( x 1 ,x 2 ) =
=
1 2πδ1δ 2 1 − ρ 1
2

e
2 1− ρ 2
(
1
DX = E X − EX
(
)( (
X − EX
)
T
= E X − μ
(
)( (
X − μ
)
T
2 ⎛ − μ X ⎛ X 1 − μ1 ⎞ 1 1 ⎜ ⎟ X 1 − μ1 X 2 − μ2 = E ⎜ = E ⎜ ⎜X − μ ⎟ ⎜ X 1 − μ1 X 2 − μ2 ⎝ 2 2⎠ ⎝
)
(
)
(X )
7.7 据调查市场上销售的 9 种饮料的热量,咖啡因含量,钠含量及价格的数据如下: 饮料编号 1 2 3 4 5 6 7 8 9 热量 207.2 36.8 72.2 36.7 121.7 89.1 146.7 57.6 95.9 咖啡因含量 3.3 5.9 7.3 0.4 4.1 4 4.3 2.2 0 钠含量 15.5 12.9 8.2 10.5 9.2 10.2 9.7 13.6 8.5 价格 2.8 3.3 2.4 4 3.5 3.3 1.8 2.1 1.3
=1
− xj
上式正是样本数据阵 X 的第 i 列与第 j 列的样本相关系数,故
R =
1 X%T X% . n −1
7.4 试借助统计分析工具(SPSS,SAS,R) ,对 7.2 节的例 3 进行主成分分析. 解 利用统计分析软件 SPSS 的操作结果截图如下
Communalities Initial VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 VAR00008 VAR00009 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 Extraction .472 .917 .769 .795 .874 .867 .624 .745 .706
% ,把物理成绩 y 标准差标准化 y %; (3)分别把数学成绩 x 极差标准化为 x
(4)写出甲乙两同学的考试成绩的马氏距离表达式,并求出甲乙两同学考试成绩的欧氏距 离.
解 (1) 样本数据阵为:
⎡70 ⎢ 60 X = ⎢ ⎢80 ⎢ ⎣90
75 70 75 80
65 ⎤ ⎥ 50 ⎥ ; 70 ⎥ ⎥ 80 ⎦
根据上述分析结果知,若采用总的样本协方差阵的方法的判别结果为: 第 16,17,18 号样品是 第一类(为 af),他们为第一类的后验概率分别为 0.85302,0.72139,0.82846
7.6 试借助统计分析工具验算 7.4 节中 2002 年足球世界杯 16 强的系统聚类的结果. 解 首先建立 SPSS 数据文件
7.3 设对 m 维随机变量进行 n 次观测得到的样本数据阵为 X ,X = 标准化之后的样本数据阵即
.
(x )
ij n × m
,令 X% 为标准差
%ij ) ,其中x %ij = X% = ( x n ×m
试证明样本相关阵 R =
x ij -x j (i = 1,2,...,n; j = 1,2,...,m ) , sj
òòòòòòòòòòò÷ òø òôòòòø ò÷ òòòòò÷ òòòòòûòòòòòø òòòòò÷ òòòòòòòòòòò÷ ùòòòòòòòòòòò÷
ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòø ó ó ó ó ó ùòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòòò÷ ó ó
1 2 1 2 2 2
2
(1)试证明 ξ ,η 的联合密度函数 p x 1 ,x 2 可表示为
(
)
(
)
p ( x 1 ,x 2 ) =
1
( 2π )
T
2 2
Σ
1 2
e

T 1 (x − μ ) Σ−1 (x − μ ) 2
,其中 x = ( x 1 ,x 2 )
T
(2)设 X (1) ,X (2) ,...,X (n )
Num +---------+---------+---------+---------+---------+ 10 15 1 13 11 14 6 7
òø òú òôòø ò÷ ó òø ó òôòôòòòòòòòø ò÷ ó òòò÷ ùòòòòòø ó ó
12 4 16 8 2 5 9 3
12 4 16 8 2 5 9 3
相关文档
最新文档