因子分析应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
公因子方差 0.967 0.826 0.989 0.933 0.976 0.984 0.923 0.876 0.922 0.990 0.918 0.895 0.705 0.983 0.989 0.821 0.885 0.881 0.961 0.986 0.893 0.957 0.556 0.837 0.920 0.911
1 1.00 0.85 0.96 0.95 0.98 0.96 0.92 0.89 0.97 0.93 0.44 0.87 0.68 0.92 0.93 0.88 0.46 0.86 0.91 0.93 0.90 0.87 0.69 0.53 0.91 0.88 1.00 0.79 0.77 0.84 0.79 0.80 0.71 0.80 0.75 0.42 0.77 0.56 0.73 0.75 0.70 0.31 0.82 0.75 0.76 0.77 0.71 0.66 0.59 0.80 0.77
1.00 0.47 1.00 0.65 0.52 1.00 0.60 0.42 0.93 1.00
3、计算特征方程
R − λI = 0
的全部特征值: 的全部特征值:
q
λ 1 ≥ λ 2 ≥ … ≥ λp ≥ 0
p i =1 i
,并根
据累积比
∑λ / ∑λ
j =1 j
的大小确定的数目q。 的大小确定的数目 。全
因子分析应用
因子分析的应用领域
因子分析最初是应用于教育心理学。 因子分析最初是应用于教育心理学。 现在已经广泛应用于环境监测数据的分 消费者习惯和态度研究(U&A); );品牌 析;消费者习惯和态度研究(U&A);品牌 形象和特性研究;服务质量调查;个性测试; 形象和特性研究;服务质量调查;个性测试; 形象调查;市场划分识别;顾客、 形象调查;市场划分识别;顾客、产品和行 为分类等等。 为分类等等。 在这些实际应用中, 在这些实际应用中,通过因子得分可以 得出不同因子的重要性指标, 得出不同因子的重要性指标,而管理者则可 根据这些指标的重要性来决定首先要解决的 市场问题或产品问题。 市场问题或产品问题。
1.00 0.84 0.93 0.93 0.96 0.39 0.94 0.66 0.96 0.96 0.87 0.49 0.82 0.97 0.97 0.88 0.91 0.71 0.47 0.95 0.92
1.00 0.79 0.94 0.78 0.63 0.71 0.61 0.79 0.79 0.78 0.48 0.84 0.72 0.78 0.91 0.71 0.63 0.59 0.80 0.71
表 6-3 平 均 值 与 标 准 偏 差
2、计算变量的相关系数
• 由标准化数据Z求相关系数矩阵R=(rij)
1 n rij = ∑ Z ik Z jk n − 1 k =1
其结果见表6-4
(i, j = 1,2, L, p )
元素 Cs Tb Sc Rb Fe Co Na Eu K La Sb Se Ta Sm Ce Yb Lu Ba U Th Cr Hf W Nd As Br
名 平均值 称 钐 1.41 铈 17.83 镱 0.61 镥 0.13 钡 186.92 铀 1.31 3.57 20.70 1.24 5.29 16.74 15.89 11.85
标准差 0.99 12.74 0.44 0.15 119.08 1.66 2.86 17.06 0.92 5.05 7.78 15.37 17.06
1.00 0.27 0.88 0.72 0.99 1.00 0.87 0.51 0.79 0.94 0.99 0.78 0.98 0.72 0.47 0.90 0.87
1.00 0.38 0.22 0.27 0.27 0.37 0.57 0.41 0.27 0.29 0.63 0.22 0.31 0.23 0.46 0.32
2
3
4
5
6
7
8
9
10
表6-4 相关矩阵
11 12 13 14 15
16
17
18
19
20
21
22
23
24
25
26
1.00 0.93 0Leabharlann Baidu95 0.99 0.84 0.95 0.93 0.98 0.36 0.92 0.65 0.98 0.98 0.87 0.51 0.82 0.96 0.99 0.85 0.94 0.68 0.47 0.94 0.92
d =
2 i
∑a
k =1
q
2 ik
因子 元素 Cs Tb Sc a1 0.979 0.838 0.985 0.949 0.978 0.983 0.886 0.923 0.955 0.986 0.440 0.919 -0.701 0.960 0.967 0.894 0.589 0.866 0.945 0.970 0.882 0.924 0.722 0.549 0.952 0.907 a2 0.037 0.126 -0.110 0.160 0.113 -0.080 0.346 -0.151 0.103 -0.206 0.822 -0.077 -0.108 -0.210 -0.205 -0.019 0.364 0.127 -0.213 -0.194 0.262 -0.276 -0.034 0.211 0.038 -0.111
1.00 0.94 0.91 0.93 0.91 0.94 0.89 0.53 0.80 0.67 0.90 0.90 0.83 0.60 0.85 0.84 0.90 0.87 0.85 0.59 0.55 0.88 0.80
1.00 0.95 0.91 0.86 0.96 0.91 0.50 0.90 0.65 0.90 0.91 0.89 0.53 0.88 0.91 0.91 0.90 0.85 0.67 0.58 0.95 0.90
表 6-5 初 始 因 子 负 载 矩 阵
Rb Fe Co Na Eu K La Sb Se Ta Sm Ce Yb Lu Ba U Th Cr Hf W Nd As Br
5、最终因子载荷阵
• 将A得到的初始因子矩阵A施行方差极大旋转,得 得到的初始因子矩阵A施行方差极大旋转 方差极大旋转, 到旋转后的因子矩阵B 正规化还原 还原, 到旋转后的因子矩阵B,对B作正规化还原,得最 终因子负载阵K 终因子负载阵K。 π π , θ ∈ − 4 4 ,代 • 具体计算过程:由式(6-21)得 具体计算过程:由式( 21) 入式( 18),按式( 25)对初始因子矩阵A ),按式 入式(6-18),按式(6-25)对初始因子矩阵A 变换, 代入式( 变换,将旋转后的新的因子负载 b代入式(6ij 20),由式( 24)检验,若不满足要求, ),由式 20),由式(6-24)检验,若不满足要求,则返 回到式( 21) 24), ),如此反复循环至式 回到式(6-21)至(6-24),如此反复循环至式 21)得到满足,再按式( 26)计算, (6-21)得到满足,再按式(6-26)计算,从而 得到最终因子负载阵K 结果见表6 得到最终因子负载阵K。结果见表6-6。
• 我将通过此例的计算来说明因子分析的整个 过程。 过程。
1、监测数据的标准化
• 根据表6-2给出的监测数据 xij(i=1,2…36=n,j=1,2…26=p),结合下式进行标 准化处理。标准化数值为Zij:
Z i× j =
式中:
X ij − X j
X
j
1 = n
∑
n 10
10 n
Sj
X
ij
i =1
1.00 0.87 0.50 0.79 0.94 0.99 0.78 0.98 0.72 0.47 0.89 0.87
1.00 0.55 0.74 0.84 0.86 0.78 0.82 0.64 0.38 0.85 0.81
1.00 0.36 0.45 0.51 0.41 0.49 0.35 0.21 0.58 0.44
环境因子分析实例
大气污染源识别应用
• 张孟威(1979-1980年)利用因子分析对北 张孟威(1979-1980年 京某地区大气飘尘作数据分析。 京某地区大气飘尘作数据分析。测定大气中 26种元素的浓度值 数据见表6 种元素的浓度值, 的26种元素的浓度值,数据见表6-2,目的 是识别出该地区主要的地面污染源类型及其 对大气污染的贡献率。 对大气污染的贡献率。
1.00 0.55 0.86 0.87 0.80 0.48 0.75 0.96 0.90 0.80 0.84 0.67 0.46 0.97 0.94
1.00 0.71 0.71 0.63 0.31 0.62 0.65 0.67 0.60 0.69 0.49 0.44 0.62 0.51
1.00 0.99 0.87 0.51 0.78 0.93 0.99 0.77 0.98 0.71 0.44 0.88 0.85
1 Sj = ∑ ( X ij − X j ) 10 − 1 i =1 n 计算值见表6-3
2
编 号 1 2 3 4 5 6 7 8 9 10 11 12 13
元素 符号 Cs Tb Sc Rb Fe Co Na Eu K La Sb Se Ta
名 称 铯 铽 钪 铷 铁 钴
平均值 1.24 0.28 2.91 14.66 5.67 5.71 12.44 0.34 27.64 -9.06 12.44 5.91 0.22
4、初始因子载荷矩阵
• 计算前q=4个特征值所对应的单位特征向量以此对 计算前q=4 q=4个特征值所对应的单位特征向量以此对 应的特征向量为列构成矩阵G 应的特征向量为列构成矩阵G,再取特征值的开方 便可得初始因子矩阵A 值,便可得初始因子矩阵A
A= G λ
• 式中, -----特征值 式中,λ-----特征值 • 计算初始因子矩阵前,应先将特征值及其对应的 计算初始因子矩阵前, • 特征向量由大到小顺序排列,结果见6-5。表6-5 特征向量由大到小顺序排列,结果见6 中公因子方差计算式为: 中公因子方差计算式为:
1.00 0.76 0.80 0.78 0.74 0.54 0.73 0.81 0.77
1.00 0.96 0.80 0.91 0.65 0.43 0.95 0.94
1.00 0.79 0.98 0.69 0.45 0.91 0.89
1.00 0.71 0.57 0.43 0.82 0.78
1.00 0.70 0.43 0.84 0.82
部特征值的总和
∑λ
i =11
26 11
i
26 = 11
本例中前4个特征值 本例中前 个特征值 =20.2+1.5+1.1+0.7=23.5,占全部特 , 征值的90.3%,故选定因子数目q=4。 征值的 ,故选定因子数目 。 这就意味着选定4个主要的污 这就意味着选定4个主要的污 染源类型。 染源类型。
标准差 编号 元素 符号 0.85 0.15 2.19 9.11 3.63 4.98 5.90 0.21 14.79 6.70 14.86 7.29 0.15 14 15 16 17 18 19 20 21 22 23 24 25 26 Sm Ce Yb Lu Ba U Th Cr Hf W Nd As Br
1.00 0.83 0.92 0.30 0.82 0.64 0.94 0.92 0.80 0.42 0.82 0.89 0.95 0.82 0.92 0.57 0.44 0.83 0.81
1.00 0.90 0.46 0.83 0.64 0.89 0.91 0.87 0.52 0.80 0.86 0.89 0.89 0.83 0.71 0.52 0.89 0.85
因子负载 a3 0.055 0.285 -0.065 -0.020 0.040 -0.054 0.132 -0.020 0.013 -0.063 -0.214 -0.082 0.169 -0.087 -0.052 -0.140 -0.553 0.337 -0.084 -0.080 0.015 -0.081 0.088 0.655 -0.071 -0.074 a4 -0.073 -0.161 -0.049 0.075 -0.074 -0.089 0.005 -0.033 -0.016 0.100 -0.056 0.194 0.416 0.104 0.097 0.030 0.396 -0.020 -0.122 0.026 0.214 0.143 0.164 0.249 -0.086 -0.268