一种基于多元统计分析的综合评价模型及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表 2 各市综合评价得分及排序
Tab.2 Municipalities comprehensive evaluation and ranking points
城市
综合得
排
城市
分
名
大连
0.9919
8
营口
沈阳
0.8397
9
锦州
盘锦
0.7516
10
丹东
鞍山
0.7018
11
葫芦岛
本溪
0.4338
12
铁岭
抚顺
相对而言,排在第五类的铁岭市是全国重要的粮食产区,其粮食产量占全省的四分之一; 阜新市畜牧业发达,畜牧业产值达到农业总产值的45%,是辽宁省的畜牧业基地;而这三座 城市经济规模都不大,国内生产总值都很低,排在全省14个城市的最后.表明这三座城市都 应充分利用自己的优势,加快推进工业化、产业化,加大招商引资力度.例如阜新市要集中 力量上大项目,壮大骨干企业,进一步加强工业主导地位,形成具有较强竞争力的支柱产业 和优势产业,大力推进经济产业结构调整.
(
R
−1h1 #
)
'
⎤ ⎥ ⎥
=
⎡ ⎢ ⎢
h1' #
⎤
⎥ ⎥
R
−1
=
H
' R −1
.
⎢⎣β
' (m
)
⎥⎦
⎢⎣β m1 " β mp ⎥⎦
⎢⎣(R −1hm )' ⎥⎦ ⎢⎣hm' ⎥⎦
再代入每个样品的各指标值(即变量),就得到样品 i 在第 j 个主因子上的得分
fij (i = 1,2,", n, j = 1,2,", m) .
高载荷指标
主因子意义
X 1 -国内生产总值 GDP X 3 -GDP 增长率 X 5 -全社会固定资产投资额 X 6 -年末银行贷款余额 X 7 -储蓄存款余额 X 8 -储蓄存款占 GDP 比重 X11 -在职职工工资总额 X15 -进出口商品总值 X 2 -人均 GDP X 4 -人均社会消费品零售总
从图我们可以看到曲线在 k = 5 处拐弯并逐渐平滑,所以将这 14 个城市分为五类,具
体的分类结果为:
表 3 辽宁省 14 个市的区域经济发展水平分类
Tab.3 The level of classification in the regional economic development in the 14 cities of Liaoning Province
额
X 9 -城镇居民人均可支配收
入
X10 -流动资产周转次数 X 12 -规模工业资金利税率 X13 -规模以上工业销售产
销率
X 14 -城镇从业人员
经济规模因子
资金活动热度 因子 从业因子
主因子 权重
0.6836
0.2030 0.1134
-3-
排 名
1 2 3 4 5 6 7
http://www.paper.edu.cn
(8) 记综合得分为 Z = (zij )n×1 ,其中
∑ zi1
=
m
α j yij , i = 1,2,", n , yij
j =1
=
f ij
−
min{ ∀i
f
ij
}
,i = 1,2,", n. j = 1,2,"m ,
max{ ∀i
f
ij
}
−
min{ ∀i
f
ij
}
α j 为权重,其算法为:
n
∑ ① 计算各因子方差贡献 s j = aij 2 , j = 1,2,", m . i =1
2. FAOSCEM 的算法
⎡ω11 ω12 " ω1p ⎤
设样本为
n
,指标为
p
的数据阵为
Ω
=
⎢⎢ω21 ⎢#
ω 22 #
"
ω
2
p
⎥ ⎥
#⎥
,具体算法如下:
⎢⎢⎣ωn1
ωn2
"
ω np
⎥ ⎥⎦
n×
p
(1)记原始数据标准化矩阵为 X = (xij )n×p ,其中
∑ ∑ xij
=
ωij − ω j σ
由于大连经济基础雄厚,经济活动活跃,2006年大连的进出口贸易总额为全省第一,是 位居第二的沈阳的两倍;加之地理位置优越,自然资源特别是旅游资源丰富,近年来吸引了 大量的外来投资,等等.这些因素确立了大连在辽宁省经济发展中的领先地位.
沈阳市为辽宁省省会,东北地区的经济、文化、交通和商贸中心,是中国的工业重镇, 工业立市思想得到全面落实,沈阳也成为全国先进装备制造基地.同时沈西工业走廊、沈北 新区、大浑南地区和东部旅游度假区等四大空间建设,也吸引了来自国内外的大量投资.座 落在盘锦市的辽河油田,是全国重要的石油化工基地之一,这也奠定了盘锦市为全国油气生 产基地的地位.盘锦也是国家级生态建设示范区,自然禀赋优越,气候适宜,植被繁茂,多 水无山,被誉为是“北国江南”.鞍山市被誉为祖国的钢都,是全国重要的工业城市之一,其 综合实力雄厚.这些原因也使得这三座城市的综合经济实力得分较高,但仍存在不足之处, 沈阳市在发展自己的工业的同时应注意全部劳动力资源的实际利用情况,提升就业率.盘锦 市应充分发挥自己的优势,发展与石油相关的产业.并充分利用其良好的生态环境,丰富的 渔业,吸引外来投资.鞍山市的全社会固定资产投资额相对较低,该指标反映固定资产投资 规模、速度、比例关系和使用方向的综合性指标.所以鞍山市应注意扩大固定资产投资.
j
j − i + 1 t=i Z(t) .
(10) 计算最小分类损失函数{L[P(l, k)],3 ≤ l ≤ 14,2 ≤ k ≤ 13} .其递推公式为:
⎪⎧ ⎪⎩⎨L[
L[P(n,2)] = min{D(1, j −1) + D( 2≤ j≤n
P(n, k)] = min{L[P( j −1, k −1)] + k≤ j≤n
区域经济发展水平
同类水平的城市群
(类)
一
大连
二
沈阳,盘锦,鞍山
三
本溪,抚顺,辽阳,营口
四
锦州,丹东,葫芦岛
五
铁岭,阜新,朝阳
(4)分类结果的初步诠释
-4-
http://www.paper.edu.cn
从表3可知,由FAOSCEM推演出的对辽宁省14个市的区域经济发展水平的评价符合辽 宁省的实际情况,结论是可以接受的.
http://www.paper.edu.cn
Based on a statistical analysis of the multiple comprehensive evaluation model and its application
0.3717
13
阜新
辽阳
0.3519
14
朝阳
综合得 分 0.3254 0.2279 0.2144 0.1693 0.0813 0.0380
0
(3)分类损失函数曲线及分类结果,见图1及表3.
图 1 分类损失函数随分类数 k 变化的趋势图 Fig.1 Categories loss function with the classification of changes in trends k
j, n)} D( j, n)}
(11) 确定最优分类数 k 并给出分类结果.
通过 L[P(n, k)]对 k 作图,在曲线拐弯处来确定 k .
3. FAOSCEM 的实证分析
本文以辽宁省14个市的区域经济发展水平问题对FAOSCEM进行实证分析.我们选取下 列15个指标为初始的评价指标体系:
-2-
4. 致谢
本文是在指导老师包研科老师的亲切关怀和悉心指导下完成的.在做这篇论文的过程 中,包老师在学业上给予我悉心的指导和帮助,为我付出了大量的心血,学生必将受益终生. 在此谨向包老师致以诚挚的敬意和衷心的感谢.
同时感谢阜新市统计局以及在我论文期间帮助过我的同学和朋友.
-5-
参考文献
[1]高惠旋.应用多元统计分析[M].北京:北京大学出版社,2005. [2]辽宁省统计局.辽宁省 2007 统计年鉴[M].北京:中国统计出版社,2007.
m
∑ ② 求各因子的权重α j = s j
s j , j = 1,2,", m ;
j =1
(9) 设有序样品依次为 Z (1) , Z (2) ,", Z (n) ( Z (t) 为 m 维向量).
∑ ∑ 计算各样品间的距离 D(i, j) =
j
(Z(t) − ZG )2 ,
t =i
其中 Z G
=
1
,σ j
=
n
1 −1
n i =1
(ωij
−ω j ) , ω j
=
1 n
n
ωij
i =1
.
(2)建立各指标的相关系数矩阵.
样本相关阵 R = (rij ) ,其中
∑ rij =
eij eii e jj
(i, j = 1,2,", p) , eij
=
Leabharlann Baidu
n
( xtj
t =1
−xi )(xtj
− xj);
(3)求各指标的特征值和特征向量及相应的贡献率
1. 前言
本文按照组合建模的技术路线,提出了一种基于因子分析和 Fisher 有序样品聚类法的综 合评价模型(Factor Analysis & Optimal Segmentation of Comprehensive Evaluation Model , FAOSCEM ):
(1) 利用因子分析方法进行指标体系的简化. (2) 以各公共因子的方差贡献构造指标权重进行指标综合. (3) 在样品综合得分的基础上,利用 Fisher 有序样本聚类法对样品进行分类和划分等 级. 其后,本文以辽宁省 14 个市的区域经济发展水平问题对 FAOSCEM 进行了实证分析.
抚顺市既是国家的老工业基地,又是煤炭资源枯竭型城市,但其自然资源丰富,有34 种矿产资源.所以抚顺市在做大其优势产业的同时加速产业转型.但是抚顺市从业人员因子较 低,应提高人员的就业率,加强资金利用率.
锦州,丹东,葫芦岛各因子得分都处于中等偏下水平,事实上这三座城市的经济规模也 不是很大,经济活动不是很活跃,所以应加大投入,加强资金利用率.
根据 RL = ΛL 来计算特征值特征向量,其中 L = (l1, l2 ,",l p ) , Λ = (λ1, λ2 ,", λ p ) .
根据准则
λ1
λ1 + " + λm + " + λm + " + λp
≥
P0
确定 m 个主因子,通常 P0 ≥ 0.8 .
(4) 建立因子载荷阵.
-1-
http://www.paper.edu.cn
因子载荷矩阵. (6) 将指标按因子载荷量分类.
(7) 记各样品的主因子得分 F ,则 Fj = β j1 X 1 + " + β jp X p + ε j ( j = 1,", m) [1].
令
Β
=
⎡ ⎢ ⎢
β' (1) #
⎤ ⎥ ⎥
=
⎡ ⎢ ⎢
β11 #
"
β1p #
⎤ ⎥ ⎥
,则 Β
=
⎡ ⎢ ⎢
综上所述,本文用因子分析和聚类分析方法综合评价辽宁省14个省辖市的经济发展水平 的结果是合理的,事实上也与辽宁省的实际情况基本一致.事实上,随着政策的变化以及各城 市发展思路的调整,各公共因子所代表的主要指标会不断发生变化,因而各城市之间的排名 也会有所改变.
由于作者经济知识有限,所以在一些城市的评价建议方面存在着局限,这也是本文的不 足之处.
记 λ1 ≥ λ2 ≥ " ≥ λ p ≥ 0 为 R 的特征值,其相应的单位正交特征向量为 l1,l2 ,",l p .则因
def
子载荷阵 A = ( λ1 l1,", λm lm ) = (aij ) p×m .
(5) 对因子载荷阵实施方差最大旋转,得正交因子矩阵.
记因子载荷矩阵为 A ,取正交矩阵 T ,则 H = AT ,其中 H = (hij ) p×m 即为旋转后的
http://www.paper.edu.cn
一种基于多元统计分析的综合评价模型及应用
张谢谊,包研科
辽宁工程技术大学理学院,辽宁阜新(123000)
E-mail: zhangxieyi97@163.com
摘 要:本文提出了一种基于因子分析和 Fisher 有序样本聚类法的综合评价模型,并将其应 用于辽宁省区域经济发展水平的研究。 关键词:因子分析;有序样品聚类法;综合评价模型;经济指标;区域经济;发展水平
依据文献[2]采集了辽宁省14个城市2006年的上述指标数据,按FAOSCEM的算法用 MATLAB对数据进行了处理,主要计算结果如下:
(1)提取的主因子、指标的分类及主因子权重系数,见表1. (2) 各市综合评价得分及排序,见表2.
主 因子
F1
F2 F3
表 1 指标分类及主因子权重系数 Tab.1 Classification and the main indicators of the weight factor
http://www.paper.edu.cn
X 1 -国内生产总值 GDP; X 2 -人均 GDP; X 3 -GDP 增长率; X 4 -人均社会消费 品零售总额;X 5 -全社会固定资产投资额;X 6 -年末银行贷款余额;X 7 -储蓄存款余额; X 8 -储蓄存款占 GDP 比重; X 9 -城镇居民人均可支配收入; X10 -流动资产周转次数; X11 -在职职工工资总额; X 12 -规模工业资金利税率; X13 -规模以上工业销售产销率; X14 -城镇从业人员; X 15 -进出口商品总值.