多元第五章答案
第五章-多元函数微分学习题参考答案
第五章-多元函数微分学习题参考答案第五章多元函数微分学习题练习5.11.在空间直⾓坐标系下,下列⽅程的图形是什么形状? (1) )(4222椭圆抛物⾯z y x =+ (2)圆锥⾯)(4222z y x =+(3) 椭球⾯)(19164222=++z y x (4) 圆柱⾯)(122=+z x 2.求下列函数的定义域: (1)y x z --=解:??≥-≥0y x y即??≥≥≥y x x y 200 ∴函数的定义域为{}y x y x y x ≥≥≥2,0,0|),((2) z =解:0≥-y x{}0|),(≥-∴y x y x 函数的定义域为3. ()y x f ,对于函数=yx yx +-,证明不存在),(lim 0y x f x →分析:由⼆元函数极限定义,我们只须找到沿不同路径0(0,0)p p →时,所得极限值不同即可。
证明:①(,)0,0)(0,0)p x y x x y p ≠=0当沿轴(此时趋于时,(,)(,0)1,lim (,)1x y f x y f x f x y →→===②当0(,)(0)00p x y y kx k p =≠沿直线趋于(,)时, 0011(,)lim (,)1(0)11x y x kx k kf x y f x y k x kx k k→→---=1.求下列函数的偏导数①;,,33yz x z xy y x z -=求解:23323,3xy x yz y y x x z -=??-=?? ②;,,)ln(yzx z xy z =求解:[]1211ln()2z xy y x xy -?=??=?[]1211ln()2z xy x y xy -== ③222ln(),,z z z x x y x x y=+?求解:1ln()z x y x x x y=+++ 2222)(2)(1))(ln()(y x y x y x x y x y x y x x y x x x z x x z ++=+-+++=+++??==??2221()(ln())()()z z x x yx y x y y x y x y x y x y x y ==++=-=?++++ ④;,3z y x ue u xyz=求解;22,()xyz xyz xyz xyz u u yze ze yzxze z xyz e x x y==+=+? 3222()(())(12)()xyz xyz xyzu u z xyz e xyz e z xyz xye x y z z x y z==+=+++???=)31()21(222222z y x xyz e z y x xyz xyz e xyz xyz ++=+++y x f y xy ?-?+=→?)1,2()1,2(lim,),(02则解:①22(1)200(2,1)(2,1)0lim lim ()0y y y f y f e e y y +??→?→+?--=??未定式22(1)04(1)10lim 1y y e y +??→?+??-= = 42e ②22201(2,1)(2,1)lim(2,1)24xy y x y y f y f f e xye y=?→=+?-'==?=?3.设23ln(1),111x y z ux y z u u u '''=+++++在点(,,)处求解:2311x u x y z '=+++ 2321yyu x y z '=+++ 22331z z u x y z '=+++ (1,1,1) 1233()|4442x y z u u u '''∴++=++= 4.设2,20xy z zz e xy x y=+=求证: 证明:2xy y z e y e x y-?=?=?Q 22331(2)2x xy y z e x xy e y y-?=??-=-?Q22222323122(2)22x x x xy y y y z z x y xy e ye x xy e y xy e x y y---??∴+=+??-=-?+?? = 0证毕练习5.31.求下列函数的全微分(1) 求z xy =在点(2,3)处当时的全增量与全微分与2.01.0-=?=?y x 解:全增量12.068.21.2)3,2()2.03,1.02(-=-?=--+=?f f zx y dz z dx z dy ydx xdy ''=+=+(2,3)0.10.230.12(0.2)0.1dx dy dz==-=?+?-=-(2)求时的全微分当2,1),1ln(22==++=y x y x z解:22222211z z x y dz dx dy dx dy x y x y x y ??=+=+??++++ dy dx dy dx dz323141144112)2,1(+=+++++=(3),u xy yz zx du =++求解:u u udu dx dy dz x y z=2.计算下列各式的近似值(分析运⽤公式010000000()(,)(,)(,)x y f x x y y f x y f x y x f x y y ''+?+?≈+?+?)(1)03.2)1.10(解:令03.0,2,1.0,10,),(00=?==?==y y x x x y x f y 取2.03(10.1)=00000000(,)(,)(,)(,)x y f x x y y f x y f x y x f x y y ''+?+?≈+?+?01.0ln 1.010)2,10()2,10(12?+?+=-x x yx y y9.10810ln 32100≈++= (2) )198.003.1ln(43-+解:令)1ln(),(43-+=y x y x f 取 02.0,1,03.0,100-=?==?=y y x x 原式(10.03,10.02)f =+-23(1,1)11)|(0.03)x -≈+-+34(1,1)1|(0.02)y -+-= 0+005.002.04103.031=?-(3) 0046tan 29sin解:令y x y x f tan sin ),(= 取 00,,,61804180x x y y ππ==-=?=则原式=)1804,1806(ππππ+-f(,)(,)()(,)646418064180x y f f f ππππππππ''≈+-+ =2(,)(,)646411cos tan |()sin sec |2180180x y x y ππππππ?+-+?= 0.5023练习5.41. 求下列函数的导数或偏导数。
应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)
所以样品x=2.5判归 1. 判归G 因0.5218>0.3798>0.0984,所以样品 所以样品 判归
8
第五章 判别分析
5 − 3 设总体Gi 的均值为µ ( i ) (i = 1,2),同协差阵Σ. 1 ′µ (1) + a′µ ( 2 ) ), (其中a = Σ −1 ( µ (1) − µ ( 2) )), 记µ = (a 2 试证明(1)E(a′X | G1 ) > µ ; (2)E(a′X | G2 ) < µ . 1 (1) 1 (1) (2) ′X | G1) − µ = a′µ − (a′µ + a′µ ) = (a′µ(1) − a′µ(2) ) 解: E(a 2 2 1 (1) (2) −1 (1) (2) = (µ − µ )′Σ (µ − µ ) > 0, (因Σ > 0) 2 1 (1) (2) −1 (1) (2) 类似可证: E(a′X | G2 ) − µ = − (µ − µ )′Σ (µ − µ ) < 0,. 2 即 E(a′X | G1) > µ, E(a′X | G2 ) < µ .
第五章 判别分析
所以 q1 f1 ( x) = 0.1613, 类似可得 q2 f 2 ( x) = 0.0304, q3 f 3 ( x) = 0.1174,
所以样品x=2.5判归 1. 判归G 因0.1613>0.1174>0.0304,所以样品 所以样品 判归
7
第五章 判别分析
解三:后验概率判别法 解三 后验概率判别法, 后验概率判别法 计算样品x已知 已知,属 的后验概率: 计算样品 已知 属Gt的后验概率 qt f t ( x) P(t | x) = 3 (t = 1,2,3) ∑ qi fi ( x) 当样品x=2.5时,经计算可得 时 当样品
北大应用多元统计第五章
第五章 §5.1 距离判别法 两总体判别:简例1
简例1 :记二维正态总体N2((i), )为Gi(i=1,2)(两总体
协差阵相同),已知来自Gi(i=1,2)的样本数据阵为
X X (1)
42
3 3 4 21 1 180 0 2,
(2) 32
5 4 39 7 5.n k1 2 4,, n m 2 2 3
例如:在医学诊断中,一个病人肺部有阴影,医生要判 断他是肺结核、肺部良性肿瘤还是肺癌.这里肺结核病 人、良性瘤病人、肺癌病人组成三个总体,病人来源于 这三个总体之一,判别分析的目的是通过测得病人的指 标(阴影的大小,边缘是否光滑,体温多少……)来判断他 应该属哪个总体(即判断他生什么病).
第五章 判别分析
两总体判别: Σ1=Σ2 时的判别方法
对给定样品X,为比较X到各总体的马氏距离, 只须计算Yi(X ) :
第五章 §5.1 距离判别法
两总体判别: Σ1=Σ2 时的判别方法
因为函数Yi(X)是X的线性函数
(i=1,2),故
Ci
第五章 §5.1 距离判别法
两总体判别: Σ1=Σ2 时的判别方法
若考察这两个马氏距离之差,经计算可得:
22
28
X~32 (2) 011 220, A2 (X~(2))X~(2) 22 28
第五章 §5.1 距离判别法 两总体判别:简例1
样本合并组内A为 离差阵
AA1A2 22 2822 2844 146,故
其中
不妨设μ1>μ2 ,则a为正数,W(x)的符号取决于
x>μ或x<μ.
第五章 §5.1 距离判别法
两总体判别: Σ1=Σ2 时的判别方法(m=1时的错判率)
高数红宝书——第五章 多元函数微分学
如 ②全 导(只有多空间曲线才存在全导)
而 归结为一元函数求导,符合下列叠加原理: , 称为全导。
陈氏第8技 关于显隐式求偏导和等效表达式的结论。
● 如果(表达式,表达式,表达式),如 ,则用符号1, 2,3 分别代表对第1、第2、第3项求偏导,如。注意而。
● 一般情况下。因为为隐式求偏导,表示把复合函数中的当成不变 量,对的偏导,而为显式求偏导表示把复合函数中的和都当成不变量, 对的偏导。例如:
【例30】 求函数 在条件下的极值 解: 先计算在条件的极值即可使用拉氏乘数法则
或 当λ=1时不适题意,故λ≠1 代入方程组可得 及 又
故分别为的极小值点的极小值点为: 【例31】 求二元函数在直线,轴和轴所围成的闭域D上的最大值与最小 值。
解:① 在D内只有驻点(2,1)
②求在D的边界上的最值 在边界和上 在边界 上,代入
驻点有三类: 第一类: 第二类: 第三类:边界上的最值 综合上述结果,可得
评 注 由于积分是个区域, 故需要讨论被积函数的无条件极值和有条 件极值;如果题中所给积分曲线或曲面积分,则只需讨论有条件极值。 【例34】求证:, 其中:。 证明:等效于求函数的最大值与最小值。 先求开区域 上的极值,再求边界上的极值,一起比较得出最大值与最 小值。 【例35】求坐标原点到曲线的最短距离。
正定
负定
不定时
形象记忆法: 无根取极值,负负得正。 ④条件极值:对自变量有附加条件(一般以方程的形式给出)的极 值。 利用拉格朗日乘数法求解 一般根据实际问题来判断求得的点是否为极值点以及是极大值还是极 小值。 ⑤最值求法:比较区域内驻点的极值和边界曲线上的最大值与最小
值,其中最大的就是 最大值,最小的就是最小值。
专升本第七课(多元积分学2)
x
故二重积分可写为
∫∫ f ( x, y)dσ =∫∫ f ( x, y)dxdy D D
高等数学 极坐标系下二重积分的计算 2. 在极坐标系下用同心圆来划分区域 , 在极坐标系下用同心圆来划分区域D, 面积微元: 面积微元 1 1 2 2 ∆σ i = ( ri + ∆ri ) ⋅ ∆θ i − ri ⋅ ∆θ i 2 2
1.根据积分区域类型选择坐标系 根据积分区域类型选择坐标系
计 ∫∫ xdxdy 其 D为 算 , 中
x2 + y2 =1, y = x,以及x轴所围成的第一象限部分。
2.根据积分区域类型选择积分次序 根据积分区域类型选择积分次序
D
计 ∫∫ xydxdy, 其 R是 抛 线 2 = x及 算 中 由 物 y
围成的第一象限内的区域。 x 2 + y 2 = 2 y及x = 0 围成的第一象限内的区域。 解
∫∫
D
x 2 + y 2 dxdy
π
2 0 2 sin θ 0
= ∫ dθ ∫
π
2 0
r 2 dr
o
r
8 3 = ∫ sin θdθ 3 π 8 1 3 = ( cos θ − cos θ ) 02 3 3
a
a2 π rdr = ( 3 − ). 2 3
)
2.计算二重积分 计算二重积分
其中D: ∫∫ ydxdy 其中 :x
D
2
+ y 2 = 2ax 与x轴所围成的上半圆。 轴所围成的上半圆。 轴所围成的上半圆
(答案: 答案:
∫
π
2 0
dθ ∫
2acosθ
0
2 3 r sin θdr =L= a 3
(约翰逊版)实用多元统计分析第五章课后答案.doc
5.4经计算可得:<4.64、‘2.8794 10.0100 -1.8091、x = 45.4,S =10.0100 199.7884 -5.64009.965;c 1.8091 -5.6400 3.6277 丿‘0.5862 -0.02210.2580、S'1 = -0.0221 0.0061 -0.0016、0.2580 -0.0016 0.4018 丿S 的特征值和特征向量分别为人=1.3014,q =(—0.8175 0.0249 —0.5754)'& = 4.5316,色=(0.5737 -0.053—0.8173)'入=200.4625心=(0.0508 0.9983 -0.029if由所有(u l9u 2,u 3)组成U 的90%置信椭圆为由于 ^17 (0.1) = 2.44,故有其三个主轴的长度分别为:2列紀 j 如 2xVF^J 鍔X2.44 - 24.8071 2 佝鳩3x19 -—x 2.44 =307.884920x17(b)排汗量XI 的Q ・Q 图:'0.5862 -0.0221 20(4.64一绚,45.4-u 2,9.965一禺)-0.0221 0.0061 ,0.2580 -0.0016 0.2580-0.00160.4018‘4.64 - )45.4 — u 2 W 、9.965 _如丿3x19 1717(0.1)"0.5862 -0.0221 20(4.64 -绚,45.4 一 u 2,9.965 -冷)-0.0221 0.0061、0.2580 -0.0016 0.2580-0.00160.4018孑4.64-普、 45.4 — (9.965-均丿< 8.18123x19 - ------- x 2.44 =46.2911 20x17钠含量X2的Q ・Q 图:QQ Plot of Sample Data X2 versus Standard Normal钾含量的Q-Q 图:70 o o o o6 5 4 3 <D-dlues -ndu- joQQ Plot of Sample Data X1 versus Standard Normal-1.5-0.5 0 0.5 1 Standard Normal Quantiles1.5 29 8 7 6 5 4 3①-dLUBS Indu- jo s ①三UBno-1.5-1-0.5 0 0.5 1 Standard Normal Quantiles1.5 2QQ Plot of Sample Data X3 versus Standard Normal•1.5-105 0 0.5 1 Standard Normal Quantiles1.5 254321098761— 1— XI 和X2的散点图:80 r 70 60 50 40 30 20 XI 和X3的散点图:5 x114—鼻■13*♦12一♦11■ ** *m10■ *♦ ♦98♦ * *« **71 1 1 1 11 ♦2 3 45 678 9X1X2和X3的散点图:14r♦131211co10由排汗量XI 、钠含量X2、钾含量X3数据的Q.Q 都接近于直线,而且各对观察值的散点图 都近似的接近于椭圆,因此可以认为多元正态假定是合理的。
多元统计分析 第5章 聚类分析
余弦相似性 Cosine Similarity
A document can be represented by thousands of attributes,
p (such as each recording the frequency of a particular word keywords) or phrase in the document. xi yi
feature mapping, ... Cosine measure: If d1 and d2 are two vectors (e.g., termfrequency vectors), then cos(d1, d2) = (d1 d2) /||d1|| ||d2|| ,
where indicates vector dot product, ||d||: the length of vector d
d1 = (5, 0, 3, 0, 2, 0, 0, 2, 0, 0) d2 = (3, 0, 2, 0, 1, 1, 0, 1, 0, 1) d1 d2 = 5*3+0*0+3*2+0*0+2*1+0*1+0*1+2*1+0*0+0*1 = 25 ||d1||= (5*5+0*0+3*3+0*0+2*2+0*0+0*0+2*2+0*0+0*0)0.5=(42)0.5 = 6.481 ||d2||= (3*3+0*0+2*2+0*0+1*1+1*1+0*0+1*1+0*0+1*1)0.5=(17)0.5 = 4.12 cos(d1, d2 ) = 0.94
多元统计分析课件第五章_聚类分析
止。如果某一步距离最小的元素不止一个,则对应ቤተ መጻሕፍቲ ባይዱ些
最小元素的类可以同时合并。
【例5.1】设有六个样品,每个只测量一个指标,分别是1, 2,5,7,9,10,试用最短距离法将它们分类。
(1)样品采用绝对值距离,计算样品间的距离阵D(0) ,见 表5.1
一、系统聚类的基本思想
系统聚类的基本思想是:距离相近的样品(或变量)先聚成 类,距离相远的后聚成类,过程一直进行下去,每个样品 (或变量)总能聚到合适的类中。系统聚类过程是:假设总 共有n个样品(或变量),第一步将每个样品(或变量)独 自聚成一类,共有n类;第二步根据所确定的样品(或变量) “距离”公式,把距离较近的两个样品(或变量)聚合为一 类,其它的样品(或变量)仍各自聚为一类,共聚成n 1类; 第三步将“距离”最近的两个类进一步聚成一类,共聚成n 2类;……,以上步骤一直进行下去,最后将所有的样品 (或变量)全聚成一类。为了直观地反映以上的系统聚类过 程,可以把整个分类系统画成一张谱系图。所以有时系统聚 类也称为谱系分析。除系统聚类法外,还有有序聚类法、动 态聚类法、图论聚类法、模糊聚类法等,限于篇幅,我们只 介绍系统聚类方法。
在生物、经济、社会、人口等领域的研究中,存在着大量量 化分类研究。例如:在生物学中,为了研究生物的演变,生 物学家需要根据各种生物不同的特征对生物进行分类。在经 济研究中,为了研究不同地区城镇居民生活中的收入和消费 情况,往往需要划分不同的类型去研究。在地质学中,为了 研究矿物勘探,需要根据各种矿石的化学和物理性质和所含 化学成分把它们归于不同的矿石类。在人口学研究中,需要 构造人口生育分类模式、人口死亡分类状况,以此来研究人 口的生育和死亡规律。
第五章 多元校正与多元分辨
)T ) ( y − y ) ( y − y ) = eT e
令
)T ) T T 2 f (c) = (y − y) (y − y) = (y − Xc) (y − Xc) = e e = ∑ei
f (c) = ( y − Xc)T ( y − Xc) = yT y − yT ( Xc) − ( Xc)T y + ( Xc)T ( Xc) = yT y − yT Xc − cT Xy + cT X T Xc = yT y − 2 yT Xc + cT X T Xc
对某些混合体系其定性组成其定性组成均已知均已知分析目的在于对各种物种分析目的在于对各种物种或物种的不同或物种的不同形态形态进行定量分析进行定量分析这样的试样包括已知药物片这样的试样包括已知药物片剂分析和某些已知有机反应的过程分析样本剂分析和某些已知有机反应的过程分析样本
第五章 多元校正与多元分辨
主要研究复杂多组分体系的定性定量问题: (1) 白色分析体系:对某些混合体系 , 其定性组成 白色分析体系:对某些混合体系, 均已知, 分析目的在于对各种物种 ( 均已知 , 分析目的在于对各种物种( 或物种的不同 形态) 进行定量分析, 形态 ) 进行定量分析 , 这样的试样包括已知药物片 剂分析和某些已知有机反应的过程分析样本。 剂分析和某些已知有机反应的过程分析样本。 (2) 黑色分析体系:对于分析试样毫无验前信息 , 黑色分析体系:对于分析试样毫无验前信息, 即有关其物种数, 即有关其物种数,哪几种化学物种及其浓度皆不清 楚,
间接校正法用混合物量测谱来直接估计未知混合物量 测谱的各组分浓度,有一定减轻非线性因素的作用, 但是由于间接校正方法仍是采用线性模型,对非线性 严重的分析体系仍不可能得到令人满意的结果。 1. K-矩阵法 思路:先通过混合物的校正矩阵,借最小二乘求得 各组分的纯物种谱,再用求得的纯物种谱来求未知 待测混合物各组分的浓度。 好处(1)各组分的纯物种谱是由混合物的校正矩阵求 得,有一定抗非线性作用。(2)校正矩阵可由实验者 确定,可方便进行试验。
第05章多元时间序列分析方法
第05章多元时间序列分析⽅法142第五章多元时间序列分析⽅法[学习⽬标]了解协整理论及协整检验⽅法;掌握协整的两种检验⽅法:E-G 两步法与Johansen ⽅法; ? 熟悉向量⾃回归模型VAR 的应⽤; ? 掌握误差修正模型ECM 的含义及检验⽅法; ? 掌握Granger 因果关系检验⽅法。
第⼀节协整检验前⾯介绍的ARMA 模型要求时间序列是平稳的,然⽽实际经济运⾏中的⼤多数时间序列都是⾮平稳的,通常采取差分⽅法消除时间序列中的⾮平稳趋势,使得序列平稳后建⽴模型,这就是第四章所介绍的ARIMA 模型。
但是,变换后的时间序列限制了所要讨论问题的范围,并且有时变换后的序列由于不具有直接的经济意义,从⽽使得转换为平稳后的序列所建⽴的时间序列模型的解释能⼒⼤⼤降低。
1987年,Engle 和Granger 提出的协整理论及其⽅法,为⾮平稳时间序列的建模提供了另⼀种重要途径。
①⽬前,协整问题研究已经成为20世纪80年代末到90年代以来经济计量学建模理论的⼀个重⼤突破,在分析变量之间的长期均衡关系中得到⼴泛应⽤。
⼀、协整概念与定义在经济运⾏中,虽然⼀组(两个或两个以上)时间序列变量(例如⼈民币汇率与外汇储备、货币供应量和股票指数)都是随机游⾛,但它们的某个线性组合却可能是平稳的,在这种情况下,我们称这两个变量是平稳的,既存在协整关系。
其基本思想是,如果两个(或两个以上)的时间序列变量是⾮平稳的,但它们的某种线性组合却表现出乎稳性,则这些变量之间存在长期稳定关系,即协整关系。
根据以上叙述,我们将给出协整这⼀重要概念。
⼀般⽽⾔,协整(cointegration)是指两个或两个以上同阶单整的⾮平稳时间序列的组合是平稳时间序列,则这些变量之间的关系的就是协整的。
为何会有协整问题存在呢?这是因为许多⾦融、经济时间序列数据都是不平稳的,但它们可能受到某些共同因素的影响,从⽽在时间上表现出共同趋势,即变量之间存在⼀定稳定关系,他们的变化受到这种关系的制约,因此它们的某种线性组合可能是平稳的,即存在协整关系。
多元统计第五章判别分析
第一节 引言
在我们的日常生活和工作实践中,常常会遇到判别分析问题。
案例一:为了研究中小企业的破产模型,选定4个经济指标:总负债率、
收益性指标、短期支付能力、生产效率性指标。对17个破产企业(1类)和21
个正常运行企业(2类)进行了调查,得关于上述四个指标的资料。现有8个 未知类型的企业的四个经济指标的数据,判断其属于破产企业一类还是正 常运行企业一类? 案例二:根据经验,今天与昨天的湿度差x1及今天的压温差x2 (气压与温度
ˆ Σ
1 A , n 1
1,2,, k
三、判别分析的实质
设R1,R2,…,Rk是p维空间R p的k个子集,如果它们互
不 相交,且它们的和集为R p,则称R1,R2, …,Rk为R p的一 个划分。
在 两 个 总 体 的 距 离 判 别 问 题 中 , 利 用
W (X) (X μ)' α 可以得到空间 R p 的一个划分 R1 {X : W ( X) 0} R2 {X : W ( X) 0}
x2
-0.41 -0.31 0.02 -0.09 -0.09 -0.07 0.01 -0.06 -0.01 -0.14 -0.3 0.02 0 -0.23 0.05 0.11 -0.08 0.03 0 0.11 -0.27
x3
1.09 1.51 1.01 1.45 1.56 0.71 1.5 1.37 1.37 1.42 0.33 1.31 2.15 1.19 1.88 1.99 1.51 1.68 1.26 1.14 1.27
Σ 的一个联合无偏估计为
n
n2 1 和 X(2) Xi(2) n2 i 1 1 ˆ Σ ( A1 A2 ) n1 n2 2
《应用多元分析》第三版(第五章 判别分析)
§5.2 距离判别
❖ 一、两组距离判别 ❖ 二、多组距离判别
一、两组距离判别
❖ 设组π1和π2的均值分别为μ1和μ2,协差阵分别为Σ1和 Σ2(Σ1,Σ2>0) ,x是一个新样品(p维),现欲判断它 来自哪一组。
25
1.01
0.4
26
1.45
0.26
27
1.56
0.67
28
0.71
0.28
29
1.5
0.71
30
1.37
0.4
31
1.37
0.34
32
1.42 0.43
33
0.33
0.18
34
1.31
0.25
35
2.15
0.7
36
1.19
0.66
37
1.88
0.27
38
1.99
0.38
39
1.51
0.42
40
1.68
❖ 1. Σ1=Σ2=Σ时的判别 ❖ 2. Σ1≠Σ2时的判别
1. Σ1=Σ2=Σ时的判别
❖ 判别规则:
x x
1 2
, ,
若d 2 x,1 d 2 x, 2 若d 2 x,1 d 2 x, 2
❖
令W
x
a
x
μ
,其中
μ
1 2
μ1
μ2
,
a Σ 1 μ1 μ2 ,则上述判别规则可简化为
x x
1, 2,
若W x 0 若W x 0
❖ 称W(x)为两组距离判别的(线性)判别函数,称a为
应用多元统计分析课后习题答案详解北大高惠璇部分习题解答省名师优质课赛课获奖课件市赛课一等奖课件
4.7067
取a 1 A1( (1) (2) )
d
1 65 1381
3323 ,
则aAa
1,
且a满足 : Ba Aa ( d 2 ).
12
第五章 鉴别分析
判别效率(a) aBa 4.7067.
aAa
Fisher线性判别函数为u( X ) aX
1 89765
(32
X1
33X
2 判别准则为 判X G1 , 当W ( X ) 0,
判X G2 , 当W ( X ) 0, 试求错判概率P(2 |1)和P(1| 2).
解 : 记a 1 ( (1) (2) ),W ( X ) ( X )a是X的
线性函数,当X
G1时,W
(
X
)
~
N1
(1,
2 1
), 且
20
第五章 鉴别分析
20 20
时,
u
(
X
(1)
)
1 89765
(32,33)
20 20
4.3390
因u( X (1) ) 4.3390 u* , 判X (1) G2.
当X (1)
15 20
时,
u
(
X
(2)
)
1 89765
(32,33)1250
3.8050
因u( X (2) ) 3.8050 u* 判X (2) G1.
其中W ( X ) a( X *)
( X * )1( (1) (2) ) ,
* 1 ( (1) (2) ).
2 10
第五章 鉴别分析
5-4 设有两个正态总体G1和G2,已知(m=2)
(1)
1105, (2)
应用多元统计分析课后答案-朱建平版
,则称
为
的一个划分。判别分析问题实质上就是在某种意义上,以最优的性质对 p维空间
0 10 210 543 0 876 30 10 9 8 5 2 0 由上表易知
中最小元素是 于是将
, , 聚为一类,记为 计算距离阵
0 30 63 0 85 2 0
中最小元素是 =2 于是将 , 聚为一类,记为 计算样本距离阵
0 30 63 0
中最小元素是 于是将 , 聚为一类,记为 因此,
不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离 公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合 适的距离测度方法。 5.5试述K均值法与系统聚类法的异同。 答:相同:K—均值法和系统聚类法一样,都是以距离的远近亲疏为标 准进行聚类的。
不同:系统聚类对不同的类数产生一系列的聚类结果,而K—均值 法只能产生指定类数的聚类结果。
0
16 0
64 16 0
中最小元素是
于是将
,
聚为一类,记为
因此,
第六章 6.1 试述主成分分析的基本思想。 答:我们处理的问题多是多指标变量问题,由于多个变量之间往往存在 着一定程度的相关性,人们希望能通过线性组合的方式从这些指标中尽 可能快的提取信息。当第一个组合不能提取更多信息时,再考虑第二个 线性组合。继续这个过程,直到提取的信息与原指标差不多时为止。这 就是主成分分析的基本思想。 6.2 主成分分析的作用体现在何处? 答:一般说来,在主成分分析适用的场合,用较少的主成分就可以得到
多元统计分析第5章 案例分析 2020.5.6
1)建立Bayes判别准则 2)假设有一新样品 x0 满足 f1( x0 ) = 0.36
和 f2( x0 ) = 0.24, 判定 x0 的归属问题. 解 (1)
19
例3 设有两个正态总体 G1,G2,且
1
=
2 6
,2
=
4 2
,1
=
2
=
=
1 1
1 9
,
而其先验概率分布为 q1 = q2 = 0.5, 误判代价为
C(2 1) = e4 ,C(1 2) = e;试用Bayes判别法确定样本
X
3
=
5
应归属于哪一类?
解 由Bayes判别法知
W (x) =
f1( x) f2 ( x)
=
exp[(
x
−
)T
−1 ( 1
−
2
)]
exp( 4 x1
+
正常使用填空题需3.0以上版本雨课堂
作答
填空题 2分
Fisher判别法就是要找一个由p个变量组 成的 [填空1]使得各自组内点的 [填空2] 尽可能接近,而不同组间点的尽可能疏远
正常使用填空题需3.0以上版本雨课堂
作答
填空题 2分
判别分析中,若两个总体的协差阵相等,则 [填空1]判别与 [填空2]判别等价
• Bayes判别法 优点:错判率较小 不足之处: 需要获取总体的分布及参数值, 实现困难 实际问题中有时也没必要知道其分布
方法之优缺点
• Fisher判别 优点:可以分类,也可以分离 不足之处: 一般需假定各组的协方差阵相等 逐步判别 优点:对每个变量的地位进行评判 不足之处: 需结合Bayes判别一起使用
《多元统计分析(第5版)》课后习题答案
对数据进行标准化处理主要为了消除变量的量纲以及量纲差别较大时所带 来的影响,尤其当变量间的单位不同且量级差别特别大时,使用不做任何处理的 数据进行计算,可能会得到极不合理的结果。
2. 欧氏距离与马氏距离的优缺点是什么? 欧氏距离是计算点与点之间距离的常用方法,其缺点是坐标的各维度对计算
则y12的密度函数为:
������(������)
=
2ϕ(√������)
∙
1 2√������
=
2 √2������
exp
(−
������ 2)
∙
1 2√������
=
1 √2������������
exp
(−
������ 2)
,
������ ≥ 0
即
������(������)
=
{
1 √2������������
证 明 : 不 妨 设 Σ = diag(������12, … , ���������2��� ),X 的 均 值 向 量 为 μ = (������1, … , ������������) , 则
X~N(μ, Σ). X的概率密度函数为:
��������������)
因此,X的分量是相互独立的随机变量。
5. y1与y2是相互独立的随机变量,且y1~N(0,1),y2~N(3,4)。 (a)求y12的分布。
(b)如果y = [(y2-y31)/2],写出y′y关于y1与y2的表达式,并写出y′y的分布。 (c)如果y = [yy12]且y~N(μ, Σ),写出y′Σ−1y关于y1与y2的表达式,并写出y′Σ−1y 的分布。
应用多元统计分析课后习题答案详解北大高惠璇(第五章部分习题解答)
特征向量时等号成立 .
又S 1B ( X (1) X (2) )( X (1) X (2) )S 1与
D 2 ( X (1) X (2) )S 1( X (1) X (2) )
有相同的特征值 .故1 D2;
18
第五章 判别分析
以下来验a就 证是D2对应的一个特征: 向量 S1BaS1(X(1) X(2))(X(1) X(2))S1(X(1) X(2))
应用多元统计分析
第五章部分习题解答
第五章 判别分析
5-1 已知总体Gi (m=1)的分布为: N((i),i2) (i=1,2) ,按
距离判别准则为(不妨设μ(1)>μ(2),σ1<σ2)
xx G G21,,若 若x**或 xx**,,
其中
解:
*
1(2) 1
2(1) 2
试. 求错判概率P(2|1)和P(1|2).
2
PU a PU b
(1) 2
(2) 1
(1) 1
(2) 2
.
.
(b) (a)
4
第五章 判别分析
5-2 设三个总体的分布分别为: G1为N(2,0.52), G2为
N(0,22),G3为N(3,12).试问样品x=2.5应判归哪一类? (1) 按距离准则; (2) 按Bayes准则 q1q2q31 3,L(j|i) 1 0,,ii jj
所以 q1f1(x)0.16,1类 3 似可得 q2f2(x)0.03,0q34f3(x)0.11,74
因0.1613>0.1174>0.0304,所以样品x=2.5判归G1.
7
第五章 判别分析
解三:后验概率判别法,
计算样品x已知,属Gt的后验概率:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5.1 判别分析和聚类分析有何区别?答:即根据一定的判别准则,判定一个样本归属于哪一类。
具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。
聚类分析是分析如何对样品(或变量)进行量化分类的问题。
在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。
通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。
5.2 试述系统聚类的基本思想。
答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。
5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造?答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。
因为我们把n 个样本看作p 维空间的n 个点。
点之间的距离即可代表样品间的相似度。
常用的距离为 (一)闵可夫斯基距离:1/1()()pq qij ik jk k d q X X ==-∑q 取不同值,分为 (1)绝对距离(1q =)1(1)pij ik jk k d X X ==-∑(2)欧氏距离(2q =)21/21(2)()pij ik jk k d X X ==-∑(3)切比雪夫距离(q =∞)1()max ij ik jkk pd X X ≤≤∞=-(二)马氏距离(三)兰氏距离对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。
将变量看作p 维空间的向量,一般用 (一)夹角余弦21()()()ij i j i j d M -'=--X X ΣX X 11()p ik jkij k ik jk X X d L p X X =-=+∑(二)相关系数5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则?答: 设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。
(1). 最短距离法,mini k j rkr ij X G X G D d ∈∈=min{,}kp kq D D =(2)最长距离法,maxi p j qpq ij X G X G D d ∈∈=,maxi k j rkr ij X G X G D d ∈∈=max{,}kp kq D D =(3)中间距离法其中(4)重心法2()()pq p q p q D X X X X '=-- )(1q q p p rrX n X n n X +=22222p q p q krkpkqpq rrrn n n n D D D D n n n=+-(5)类平均法12211cos ()()pikjkk ijp pik jk k k XX X X θ====∑∑∑12211()()()()pik i jk j k ij p pik i jk j k k X X X X r X X X X ===--=--∑∑∑ij G X G X ij d D jj i i ∈∈=,min22222121pq kq kp kr D D D D β++=221i p j jpq ij X G X G p qD d n n ∈∈=∑∑221i k j rkr ij X G X G k rD d n n ∈∈=∑∑22p q kp kq rrn n D D n n =+(6)可变类平均法其中β是可变的且β <1(7)可变法22221()2kr kp kq pq D D D D ββ-=++ 其中β是可变的且β <1 (8)离差平方和法1()()tn t it t it t t S X X X X ='=--∑2222k p k q k kr kp kq pq r kr kr kn n n n n D D D D n n n n n n ++=+-+++通常选择距离公式应注意遵循以下的基本原则:(1)要考虑所选择的距离公式在实际应用中有明确的意义。
如欧氏距离就有非常明确的空间距离概念。
马氏距离有消除量纲影响的作用。
(2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。
如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。
(3)要考虑研究对象的特点和计算量的大小。
样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。
实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。
5.5试述K 均值法与系统聚类法的异同。
答:相同:K —均值法和系统聚类法一样,都是以距离的远近亲疏为标准进行聚类的。
不同:系统聚类对不同的类数产生一系列的聚类结果,而K —均值法只能产生指定类数的聚类结果。
具体类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K —均值法确定类数的参考。
5.6 试述K 均值法与系统聚类有何区别?试述有序聚类法的基本思想。
答:K 均值法的基本思想是将每一个样品分配给最近中心(均值)的类中。
系统聚类对不同的类数产生一系列的聚类结果,而K —均值法只能产生指定类数的聚类结果。
具体类数的确2222(1)()pq kr kp kq pqrrn n D D D D n n ββ=-++定,有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K 均值法确定类数的参考。
有序聚类就是解决样品的次序不能变动时的聚类分析问题。
如果用)()2()1(,,,n X X X 表示n 个有序的样品,则每一类必须是这样的形式,即)()1()(,,,j i i X X X +,其中,1n i ≤≤且n j ≤,简记为},,1,{j i i G i +=。
在同一类中的样品是次序相邻的。
一般的步骤是(1)计算直径{D (i,j )}。
(2)计算最小分类损失函数{L[p(l,k)]}。
(3)确定分类个数k 。
(4)最优分类。
5.7 检测某类产品的重量, 抽了六个样品, 每个样品只测了一个指标,分别为1,2,3,6,9,11.试用最短距离法,重心法进行聚类分析。
(1)用最短距离法进行聚类分析。
采用绝对值距离,计算样品间距离阵0 1 0 2 1 0 5 4 3 0 8 7 6 3 0 10 9 8 5 2 0 由上表易知中最小元素是于是将,,聚为一类,记为计算距离阵3 06 3 08 5 2 0中最小元素是=2 于是将,聚为一类,记为计算样本距离阵3 06 3 0中最小元素是于是将,聚为一类,记为因此,(2)用重心法进行聚类分析计算样品间平方距离阵1 04 1 025 16 9 064 49 36 9 0100 81 64 25 4 0易知中最小元素是于是将,,聚为一类,记为计算距离阵16 049 9 081 25 4 0注:计算方法,其他以此类推。
中最小元素是=4 于是将,聚为一类,记为计算样本距离阵16 064 16 0中最小元素是于是将,聚为一类,记为因此,5.8 下表是15个上市公司2001年的一些主要财务指标,使用系统聚类法和K-均值法分别公司编号净资产收益率每股净利润总资产周转率资产负债率流动负债比率每股净资产净利润增长率总资产增长率111.090.210.0596.9870.53 1.86-44.0481.99211.960.590.7451.7890.73 4.957.0216.11300.030.03181.99100-2.98103.3321.18411.580.130.1746.0792.18 1.14 6.55-56.325-6.19-0.090.0343.382.24 1.52-1713.5-3.366100.470.4868.486 4.7-11.560.85710.490.110.3582.9899.87 1.02100.2330.32811.12-1.690.12132.14100-0.66-4454.39-62.759 3.410.040.267.8698.51 1.25-11.25-11.4310 1.160.010.5443.7100 1.03-87.18-7.411130.220.160.487.3694.880.53729.41-9.97128.190.220.3830.31100 2.73-12.31-2.771395.79-5.20.5252.3499.34-5.42-9816.52-46.821416.550.350.9372.3184.05 2.14115.95123.4115-24.18-1.160.7956.2697.8 4.81-533.89-27.74解:令净资产收益率为X1,每股净利润X2,总资产周转率为X3,资产负债率为X4,流动负债比率为X5,每股净资产为X6,净利润增长率为X7,总资产增长率为X8,用spss对公司聚类分析的步骤如下:a)系统聚类法:1.在SPSS窗口中选择Analyze→Classify→Hierachical Cluster,调出系统聚类分析主界面,并将变量X8-X1移入Variables框中。
在Cluster 栏中选择Cases单选按钮,即对样品进行聚类(若选择Variables,则对变量进行聚类)。
在Display栏中选择Statistics和Plots复选框,这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。
图5.1 系统分析法主界面2.点击Statistics按钮,设置在结果输出窗口中给出的聚类分析统计量。
我们选择Agglomeration schedule与Cluster Membership中的Range of solution 2-4,如图5.2所示,点击Continue按钮,返回主界面。
(其中,Agglomeration schedule表示在结果中给出聚类过程表,显示系统聚类的详细步骤;Proximity matrix 表示输出各个体之间的距离矩阵;Cluster Membership 表示在结果中输出一个表,表中显示每个个体被分配到的类别,Range of solution 2-4即将所有个体分为2至4类。
)3.点击Plots按钮,设置结果输出窗口中给出的聚类分析统计图。
选中Dendrogram复选框和Icicle栏中的None单选按钮,如图5.3,即只给出聚类树形图,而不给出冰柱图。
单击Continue按钮,返回主界面。