主成分分析PPT幻灯片
合集下载
主成分分析法例子剖析-PPT
…… zm是与z1,z2,……,zm-1都不相关的x1,x2,…xP, 的所有线 性组合中方差最大者。 则新变量指标z1,z2,…,zm分别称为原变量指标x1,x2,…,xP 的第一,第二,…,第m主成分。
从以上的分析可以看出,主成分分析的 实质就是确定原来变量xj(j=1,2 ,…, p) 在诸主成分zi(i=1,2,…,m)上的载荷 lij ( i=1,2,…,m; j=1,2 ,…,p)。
分z2代表了人均资源量。
③第三主成分z3,与x8呈显出的正相关程度 最高,其次是x6,而与x7呈负相关,因此可 以认为第三主成分在一定程度上代表了农业 经济结构。
显然,用三个主成分z1、z2、z3代替原来9个变量(x1, x2,…,x9),描述农业生态经济系统,可以使问题更进
一步简化、明了。
rij
n
(xki xi )(xkj x j )
k 1
n
n
(xki xi )2 (xkj x j )2
k 1
k 1
(4)
(二)计算特征值与特征向量:
① 解特征方程 I R 0 ,求出特征值,并 使其按大小顺序排列 ;
1 2 , p 0
② 分别求出对应于特征值 i的特征向量
大家好
1
一、主成分分析的基本原理
❖ 假定有n个样本,每个样本共有p个变量, 构成一个n×p阶的数据矩阵
x11 x12 x1 p
X
x21
x22
x2
p
xn1
xn 2
xnp
(1)
❖降维处理!!!
当p较大时,在p维空间中考察问题比较麻烦。 降维是用较少的几个综合指标代替原来较多 的变量指标,而且使这些较少的综合指标既 能尽量多地反映原来较多变量指标所反映的 信息,同时它们之间又是彼此独立的。
从以上的分析可以看出,主成分分析的 实质就是确定原来变量xj(j=1,2 ,…, p) 在诸主成分zi(i=1,2,…,m)上的载荷 lij ( i=1,2,…,m; j=1,2 ,…,p)。
分z2代表了人均资源量。
③第三主成分z3,与x8呈显出的正相关程度 最高,其次是x6,而与x7呈负相关,因此可 以认为第三主成分在一定程度上代表了农业 经济结构。
显然,用三个主成分z1、z2、z3代替原来9个变量(x1, x2,…,x9),描述农业生态经济系统,可以使问题更进
一步简化、明了。
rij
n
(xki xi )(xkj x j )
k 1
n
n
(xki xi )2 (xkj x j )2
k 1
k 1
(4)
(二)计算特征值与特征向量:
① 解特征方程 I R 0 ,求出特征值,并 使其按大小顺序排列 ;
1 2 , p 0
② 分别求出对应于特征值 i的特征向量
大家好
1
一、主成分分析的基本原理
❖ 假定有n个样本,每个样本共有p个变量, 构成一个n×p阶的数据矩阵
x11 x12 x1 p
X
x21
x22
x2
p
xn1
xn 2
xnp
(1)
❖降维处理!!!
当p较大时,在p维空间中考察问题比较麻烦。 降维是用较少的几个综合指标代替原来较多 的变量指标,而且使这些较少的综合指标既 能尽量多地反映原来较多变量指标所反映的 信息,同时它们之间又是彼此独立的。
《主成分分析》课件
投资组合优化
通过主成分分析,找到不同投 资标的之间的关系,优化投资 组合的效益。
主成分分析在市场调研中的应用
1
偏好分析
通过主成分分析,找到消费者的特征
产品定位
2
和偏好,精准制定相应的市场策略。
通过主成分分析,找到消费者对产品
的不同评价因素,合理确定产品的定
位。
3
竞品分析
通过主成分分析,评估竞争对手的优 势和劣势,为企业提供相应的决策依 据。
慕课在线学习行业民调
通过主成分分析,找到影响学 习者的因素,比如课程质量、 师资水平、学习难度等方面。
降水量分析和气候变化
通过主成分分析和时间序列分 析,找到影响气象预测和气候 变化的主要原因和特征。
食品市场调查分析
通过主成分分析,找到影响消 费者购买健康食品的因素,制 定相应的市场营销策略。
标准化数据
通过Z-score标准化数据,去除不同变 量的量纲影响。
提取主成分
根据协方差矩阵的特征值和特征向量, 提取主成分。
如何选择主成分数量
特征值
根据特征值大于1的原则,选择主成分的数量。
累计贡献率
当累计贡献率到达一定阈值后,选择主成分数量。
图形分析
通过屏幕图和贡献率图来选择主成分数量。
主成分分析的优点和缺点
应用
主成分分析适用于变量之间没有明确因果关系 的情况下,提取它们的主成分;而因子分析需 要基于理论或先验知识,对变量进行选择和定 量,发现变量间的潜在因子。
主成分分析在金融分析中的应用
股票指数分析
通过主成分分析,找到影响整 个股票市场的因素,快速判断 股票市场的健康状况。
信用卡违约风险评估
通过主成分分析,找到导致信 用卡违约的因素,提高信用卡 贷款的质量。
《主成分分析PCA》课件
1 PCA用于降维,而线
性回归用于预测
PCA帮助我们理解数据的 本质,而线性回归则是用 来预测未知的结果。
2 PCA通过寻找最大方
差方向来解释数据差 异
PCA通过找到能够解释数 据最大方差的方向来降低 数据的维度。
3 线性回归通过拟合一
个线性函数来解释数 据
线性回归则通过拟合一个 线性函数来解释数据之间 的关系。
到协方差矩阵。
3
计算协方差矩阵的特征值和特征
向量
通过对协方差矩阵进行特征值分解,得
选择前n个最大的特征值对应的 特征向量,构成特征向量矩阵
4
到特征值和特征向量。
根据特征值的大小,选取对应的特征向
量来构成特征向量矩阵。
5
将数据投影到特征向量上得到降 维后的数据
将数据乘以特征向量矩阵,得到在新的 低维空间中投影的数据。
《主成分分析PCA》PPT课件
# 主成分分析PCA ## 介绍 - 主成分分析(PCA)是一种常见的数据降维方法 - 通过将高维数据映射到低维空间,以发现数据中的主要变化 ...
PCA步骤
1
数据中心化
将数据减去数据平均值,以使数据中心
计算数据协方差矩阵
2
位于原点。
计算数据在不同维度之间的相关性,得
PCA应用
数据可视化
通过PCA降维,可以将高维数据可视化到二维或 三维空间。
特征选择
通过PCA可以找到数据中最能解释数据变异的特 征。
压缩数据和降噪
PCA可以用于将数据压缩到较低的维度,同时去 除数据中的噪声。
数据预处理
在机器学习中,使用PCA进行数据预处理可以提 高模型的性能。
PCA与线性回归的比较
主成分分析课件ppt课件
主成分分析
•§1 主成分分析的基本思想与理论 •§2 主成分分析的几何意义 •§3 总体主成分及其性质 •§4 样本主成分的导出 •§5 有关问题的讨论 •§6 主成分分析步骤及框图 •§7 主成分分析的上机实现
2020/5/28
11
主成分分析
主成分分析(principal components analysis)也称主分量 分析,是由霍特林(Hotelling)于1933年首先提出的。主成 分分析是利用降维的思想,在损失很少信息的前提下把多个 指标转化为几个综合指标的多元统计方法。通常把转化生成 的综合指标称之为主成分,其中每个主成分都是原始变量的 线性组合,且各个主成分之间互不相关,这就使得主成分比 原始变量具有某些更优越的性能。这样在研究复杂问题时就 可以只考虑少数几个主成分而不至于损失太多信息,从而更 容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时 使问题得到简化,提高分析效率。本章主要介绍主成分分析 的基本理论和方法、主成分分析的计算步骤及主成分分析的 上机实现。
2020/5/28
1100
目录 上页 下页 返回 结束
§2 主成分分析的几何意义
由第一节的介绍我们知道,在处理涉及多个指标问题的时 候,为了提高分析的效率,可以不直接对 p个指标构成的 p维 随机向量X (X1, X 2 , , X p )'进行分析,而是先对向量 X 进行线
性变换,形成少数几个新的综合变量Y1,Y2, ,YP ,使得各综
2020/5/28
99
目录 上页 下页 返回 结束
§1.2 主成分分析的基本理论
基于以上三条原则决定的综合变量 Y1,Y2, ,YP 分
别称为原始变量的第一、第二、…、第p 个主成分。
•§1 主成分分析的基本思想与理论 •§2 主成分分析的几何意义 •§3 总体主成分及其性质 •§4 样本主成分的导出 •§5 有关问题的讨论 •§6 主成分分析步骤及框图 •§7 主成分分析的上机实现
2020/5/28
11
主成分分析
主成分分析(principal components analysis)也称主分量 分析,是由霍特林(Hotelling)于1933年首先提出的。主成 分分析是利用降维的思想,在损失很少信息的前提下把多个 指标转化为几个综合指标的多元统计方法。通常把转化生成 的综合指标称之为主成分,其中每个主成分都是原始变量的 线性组合,且各个主成分之间互不相关,这就使得主成分比 原始变量具有某些更优越的性能。这样在研究复杂问题时就 可以只考虑少数几个主成分而不至于损失太多信息,从而更 容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时 使问题得到简化,提高分析效率。本章主要介绍主成分分析 的基本理论和方法、主成分分析的计算步骤及主成分分析的 上机实现。
2020/5/28
1100
目录 上页 下页 返回 结束
§2 主成分分析的几何意义
由第一节的介绍我们知道,在处理涉及多个指标问题的时 候,为了提高分析的效率,可以不直接对 p个指标构成的 p维 随机向量X (X1, X 2 , , X p )'进行分析,而是先对向量 X 进行线
性变换,形成少数几个新的综合变量Y1,Y2, ,YP ,使得各综
2020/5/28
99
目录 上页 下页 返回 结束
§1.2 主成分分析的基本理论
基于以上三条原则决定的综合变量 Y1,Y2, ,YP 分
别称为原始变量的第一、第二、…、第p 个主成分。
主成分分析方法-PPT课件
定义:记x1,x2,…,xP为原变量指标,z1, z2,…,zm(m≤p)为新变量指标
z1 l1 1x1 l1 2x2 l1 p x p z2 l2 1x1 l2 2x2 l2 p x p z l x l x l x m1 1 m2 2 mp p m
2.根据特征根的变化来确定
1 p i 1 p i1
i
④ 计算主成分载荷
l p ( z , x ) e ( i , j 1 , 2 , , p )(3.5.5) ij i j i ij
⑤ 各主成分的得分:
z11 z 21 Z z n1 z12 z 22 zn2 z 1m z 2m z nm
六、主成分模型中各统计量的意义
1、主成分的方差贡献率:
i
p
i1
i
这个值越大,表明第i主成分综合信息的
能力越强。 i 2、主成分的累计贡献率 i 表明取前几个主成分基本包含了全部测 量指标所具有信息的百分率。
七、主成分个数的选取
1.累积贡献率达到85%以上
ei
e i 1 , 2 , ,p ),要求 i(
p
j 1
e ij2 1 ,
③ 计算主成分贡献率及累计贡献率
▲贡献率:
i
k 1
p
(i 1 ,2, , p)
k
▲累计贡献率:
k 1 k 1 p i k
(i 1,2, , p )
k
, , 一般取累计贡献率达85—95%的特征值 1 2, m 所对应的第一、第二、…、第m(m≤p) 个主成分。
《主成分分析》幻灯片PPT
PCA的实质——简化数据
用尽可能少的变量〔主成分〕反映原始数据中尽 可能多的信息,以简化数据,突出主要矛盾。
反映原始数据特征的指标:方差-离散度 主成分:原始变量的最优加权线性组合 最优加权:
第一主成分:寻找原始数据的一个线性组合,使 之具有最大方差〔数据离散度最大的方向〕
第二主成分:寻找原始数据的一个线性组合,使 之具有次大方差,且与第一主成分无关
12.00
14.00
16.00
run100m
18.00
20.00
二、PCA的模型与算法
设:x为标准化变量, 原始数据阵 X s [x 1 ,x 2 , x p ] PCA目标:找到原始数据方差最大的线性组合
❖设:线性组合系数为p×1=[1, 2, … p]T
❖即:要找一个 使z=Xs= 1x1+ 2x2 +…+ pxp具有
What does PCA do?
Original data matrix, say n by p 正交旋转
New data matrix, say n by q, with q < p:
例:研究55个国家运发动径赛 能力,用8项径赛成绩
经PCA得到新数据阵: z55×2:选取2个主成分, 其中第一主成分表示综合
0.0
1
第一主成分-1.0包0 含的信0.0息0 量显然1.00
-21..000
售 电 量
Z2
大于第二主成分,因而忽略s 第
二主成分信息损失不大 -2.0
-2
-1
Ma Xin, North China Electric Power University
0
1
2
3
第九章 主成分分析PPT课件
➢ 因而,人们希望对这些变量加以“改造”,用少数的互 不相关的新变量反映原始变量所提供的绝大部分信息, 通过对新变量的分析解决问题。
前言
➢ 主成分分析是把各变量之间互相关联的复 杂关系进行简化分析的方法。
➢ 在多指标的数据分析中,压缩指标个数的 讨论成为实际工作者关心的问题之一。
➢ 主成分分析就是将多个指标转化为少数几 个综合指标的一种常用的统计方法
5维空间在平面上的投影
x2 y2
x1
x3
y1 x4
x5
y1 =l11x1 +l21x2 +…+l51x5 y2 =l21x1 +l22x2 +…+l52x5
x2
y2
x1
x3 y1
x4为Z,标准化后的变量记为X。作标准化变换:
z j
1 n
n
zkj
k 1
xkj
zkj sj
➢ yl,y2除了可以对包含在xl,x2中的信息起着 浓缩作用之外,还具有不相关(图形中表 现为正交)的性质,这就使得在研究复杂 的问题时避免了信息重叠所带来的虚假性。 二维平面上的个点的方差大部分都归结在 yl 轴上,而y2轴上的方差很小。 yl 和 y2 称为 原始变量xl和x2的综合变量。 y 简化了系统 结构,抓住了主要矛盾。
➢ 主成分分析能起到既减少指标个数,又不影响所要达 到的统计分析的目的。
➢ 要注意的是,主成分分析方法往往是一种 手段,它要与其它方法结合起来使用。
➢ 常与回归分析、因子分析、聚类分析结合 在一起使用
问题的提出
设在一个问题中,有n个个体,对每一个个体测定了p个指 标,其观察值组成了一个矩阵
x11 x12 ... x1p
前言
➢ 主成分分析是把各变量之间互相关联的复 杂关系进行简化分析的方法。
➢ 在多指标的数据分析中,压缩指标个数的 讨论成为实际工作者关心的问题之一。
➢ 主成分分析就是将多个指标转化为少数几 个综合指标的一种常用的统计方法
5维空间在平面上的投影
x2 y2
x1
x3
y1 x4
x5
y1 =l11x1 +l21x2 +…+l51x5 y2 =l21x1 +l22x2 +…+l52x5
x2
y2
x1
x3 y1
x4为Z,标准化后的变量记为X。作标准化变换:
z j
1 n
n
zkj
k 1
xkj
zkj sj
➢ yl,y2除了可以对包含在xl,x2中的信息起着 浓缩作用之外,还具有不相关(图形中表 现为正交)的性质,这就使得在研究复杂 的问题时避免了信息重叠所带来的虚假性。 二维平面上的个点的方差大部分都归结在 yl 轴上,而y2轴上的方差很小。 yl 和 y2 称为 原始变量xl和x2的综合变量。 y 简化了系统 结构,抓住了主要矛盾。
➢ 主成分分析能起到既减少指标个数,又不影响所要达 到的统计分析的目的。
➢ 要注意的是,主成分分析方法往往是一种 手段,它要与其它方法结合起来使用。
➢ 常与回归分析、因子分析、聚类分析结合 在一起使用
问题的提出
设在一个问题中,有n个个体,对每一个个体测定了p个指 标,其观察值组成了一个矩阵
x11 x12 ... x1p
主成分分析完整ppt课件
的系数向量。对于多维的情况,上面的结论依然成立。
这样,我们就对主成分分析的几何意义有了一个充分的了解。 主成分分析的过程无非就是坐标系旋转的过程,各主成分表达 式就是新坐标系与原坐标系的转换关系,在新坐标系中,各坐 标轴的方向就是原始数据变差最大的方向。
2021/6/12
1199
目录 上页 下页 返回 结束
其中,U为旋转变换矩阵,由上式可知它是正交阵, 即满足
U'U1 , U'UI
2021/6/12
1144
目录 上页 下页 返回 结束
§2 主成分分析的几何意义
经过这样的旋转之后,N个样品点在 Y 1 轴上的离散程度最
大,变量 Y 1 代表了原始数据绝大部分信息,这样,有时在研
究实际问题时,即使不考虑变量 Y 2 也无损大局。因此,经过
指标转化为几个综合指标的多元统计方法。通常把转化生成
的综合指标称之为主成分,其中每个主成分都是原始变量的
线性组合,且各个主成分之间互不相关,这就使得主成分比
原始变量具有某些更优越的性能。这样在研究复杂问题时就 可以只考虑少数几个主成分而不至于损失太多信息,从而更
容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时
上述旋转变换就可以把原始数据的信息集中到
Y
轴上,对数
1
据中包含的信息起到了浓缩的作用。进行主成分分析的目的
就是找出转换矩阵 U ,而进行主成分分析的作用与几何意义
也就很明了了。下面我们用遵从正态分布的变量进行分析,
以使主成分分析的几何意义更为明显。为方便,我们以二元
正态分布为例。对于多元正态总体的情况,有类似的结论。
1.每一个主成分都是各原始变量的线性组合;
这样,我们就对主成分分析的几何意义有了一个充分的了解。 主成分分析的过程无非就是坐标系旋转的过程,各主成分表达 式就是新坐标系与原坐标系的转换关系,在新坐标系中,各坐 标轴的方向就是原始数据变差最大的方向。
2021/6/12
1199
目录 上页 下页 返回 结束
其中,U为旋转变换矩阵,由上式可知它是正交阵, 即满足
U'U1 , U'UI
2021/6/12
1144
目录 上页 下页 返回 结束
§2 主成分分析的几何意义
经过这样的旋转之后,N个样品点在 Y 1 轴上的离散程度最
大,变量 Y 1 代表了原始数据绝大部分信息,这样,有时在研
究实际问题时,即使不考虑变量 Y 2 也无损大局。因此,经过
指标转化为几个综合指标的多元统计方法。通常把转化生成
的综合指标称之为主成分,其中每个主成分都是原始变量的
线性组合,且各个主成分之间互不相关,这就使得主成分比
原始变量具有某些更优越的性能。这样在研究复杂问题时就 可以只考虑少数几个主成分而不至于损失太多信息,从而更
容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时
上述旋转变换就可以把原始数据的信息集中到
Y
轴上,对数
1
据中包含的信息起到了浓缩的作用。进行主成分分析的目的
就是找出转换矩阵 U ,而进行主成分分析的作用与几何意义
也就很明了了。下面我们用遵从正态分布的变量进行分析,
以使主成分分析的几何意义更为明显。为方便,我们以二元
正态分布为例。对于多元正态总体的情况,有类似的结论。
1.每一个主成分都是各原始变量的线性组合;
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/3/10
4
思考:我们如何得到这些包含最大差异性 的主成分方向呢?
答案:事实上,通过计算数据矩阵的协 方差矩阵,然后得到协方差矩阵的特征 值特征向量,选择特征值最大(即方差 最大)的k个特征所对应的特征向量组成 的矩阵。这样就可以将数据矩阵转换到 新的空间当中,实现数据特征的降维。
2020/3/10
差为0时,说明X和Y是相互独立。Cov X , X就 是X的方
差。当样本是n维数据时,它们的协方差实际上是协 方差矩阵(对称方阵)。
2020/3/10
7
2020/3/10
8
PCA的几何意义
2020/3/10
9
图中, B点表示样例, A点表示在 u上的投影, u是直线
的斜率也是直线的方向向量,而且是单位向量。蓝色点 是在 上u 的投影点,离原点的距离是 x,u
2020/3/10
2
数据降维
降维就是一种对高维度特征数据预处理方法。降维是将 高维度的数据保留下最重要的一些特征,去除噪声和不 重要的特征,从而实现提升数据处理速度的目的。在实 际的生产和应用中,降维在一定的信息损失范围内,可 以为我们节省大量的时间和成本。降维也成为应用非常 广泛的数据预处理方法。
降维具有如下一些优点: ·使得数据集更易使用。 ·降低算法的计算开销。 ·去除噪声。 ·使得结果容易理解。
降维的算法有很多,比如主成分分析(PCA)、奇异值分解 (SVD)、因子分析(FA)、独立成分分析(ICA)。
2020/3/10
3
PCA原理详解
PCA的概念 PCA(Principal Component Analysis),即主成分分析方法,是一种 使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射 到k维上,这k维是全新的正交特征也被称为主成分,是在原有 n维特征的基础上重新构造出来的k维特征。PCA的工作就是从 原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的 选择与数据本身是密切相关的。其中,第一个新坐标轴选择是 原始数据中方差最大的方向,第二个新坐标轴选取是与第一个 坐标轴正交的平面中使得方差最大的,第三个轴是与第1,2个轴 正交的平面中方差最大的。依次类推,可以得到n个这样的坐 标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方 差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎 为0。于是,我们可以忽略余下的坐标轴,只保留前面k个含有 绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部 分方差的维度特征,而忽略包含方差几乎为0的特征维度,实 现对数据特征的降维处理。
因此需要找到一种合理的方法,在减少需要分析的指标 同时,尽量减少原指标包含信息的损失,以达到对所收 集数据进行全面分析的目的。由于各变量之间存在一定 的相关关系,因此可以考虑将关系紧密的变量变成尽可 能少的新变量,使这些新变量是两两不相关的,那么就 可以用较少的综合指标分别代表存在于各个变量中的各 类信息。主成分分析与因子分析就属于这类降维算法。
2020/3/10
10
从总体相关系数矩阵出发求解主成分
2020/3/10
11
记
2020/3/10
12
样本的主成分
2020/3/10
13
实例操作
2020/3/10
14
试计算这8个指标的主成分及对13个工业部门进行排序。
2020/3/10
15
经过因子分析可得到
2020/3/10
16
2020/3/10
-0.0860
-0.4196
-0.1976
0.2135 0.1609 0.8509
1.5712
-1.4049
-1.3933
1.0785
4.8850 -0.9718
sc -1.0158
-0.0299
0.0015
-0.8653
-1.0122
-0.8894 0.0465
-0.3295 -2.1531 -3.0397 0.7000 -1.3776 -1.4625 0.6317 3.3411 1.3915 0.6680 0.0353 0.9725 0.6225
-0.4955
-0.3382
-0.5234
0.9286
17
MATLAB方法
可得结果
0.5554 -0.1120 -0.0801
0.5434
-0.1287
-0.1339
0.5706 -0.0082 -0.1437
p3
0.1329 -0.0017
0.5069
-0.0012
0.4714 -0.4304
-0.0003 0.5382 -0.0812
6
由上面的公式,我们可以得到以下结论
(1) 方差的计算公式是针对一维特征,即针对同一特 征不同样本的取值来进行计算得到;而协方差则必 须要求至少满足二维特征;方差是协方差的特殊情 况。
(2) 方差和协方差的除数n ,1这是为了得到方差和协
方差的无偏估计。协方差为正时,说明 和 是正相关 关系;协方差为负时,说明 和 是负相关关系;协方
5
协方差和散度矩阵
样本均值: 样本方差:
1 n
x n i1 xi
S 2 1 n
n 1 i1
xi x 2
样本X和样本Y的协方差:
Cov
X
,Y
E
X
E
X
Y
E
Y
1 n
n 1 i1 xi
x
yi
y
2020/3/10
主成分分析
组长:郭圣锐 小组成员:罗琳 张玉峰 石小丰
2020/3/10
1
背景
在许多领域的研究与应用中,通常需要对含有多个变量 的数据进行观测,收集大量数据后进行分析寻找规律。 多变量大数据集无疑会为研究和应用提供丰富的信息, 但是也在一定程度上增加了数据采集的工作量。更重要 的是在很多情形下,许多变量之间可能存在相关性,从 而增加了问题分析的复杂性。如果分别对每个指标进行 分析,分析往往是孤立的,不能完全利用数据中的信息, 因此盲目减少指标会损失很多有用的信息,从而产生错 误的结论。
-0.3443
-0.0493
-0.3900
-1.3748
-0.5289