主成份分析法在甘肃省各城市综合实力评价中的应用
主成分分析用于多指标评价的方法研究主成分评价
主成分分析用于多指标评价的方法研究主成分评价一、本文概述本文旨在探讨主成分分析(PCA)在多指标评价中的应用及其方法研究。
主成分分析作为一种广泛使用的统计分析工具,其主要目的是通过降维技术,将多个相关变量转化为少数几个独立的综合指标,即主成分,以便更好地揭示数据的内在结构和规律。
在多指标评价体系中,由于指标间可能存在的信息重叠和相关性,直接分析往往难以得出清晰的结论。
因此,利用主成分分析进行降维处理,提取出关键的主成分,对于简化评价过程、提高评价效率和准确性具有重要意义。
本文首先介绍主成分分析的基本原理和步骤,包括数据标准化、计算协方差矩阵、求解特征值和特征向量、确定主成分个数以及计算主成分得分等。
然后,结合具体案例,详细阐述主成分分析在多指标评价中的应用过程,包括评价指标的选择、数据的预处理、主成分的计算和解释等。
对主成分分析方法的优缺点进行讨论,并提出相应的改进建议,以期为多指标评价领域的研究和实践提供参考和借鉴。
通过本文的研究,旨在加深对主成分分析在多指标评价中应用的理解,提高评价方法的科学性和实用性,为相关领域的研究和实践提供有益的启示和帮助。
二、主成分分析的基本原理和方法主成分分析(Principal Component Analysis,PCA)是一种广泛应用于多变量数据分析的统计方法。
其基本原理是通过正交变换将原始数据转换为一系列线性不相关的变量,即主成分。
这些主成分按照其解释的原始数据方差的大小进行排序,第一个主成分解释的方差最大,之后的主成分依次递减。
通过这种方式,主成分分析可以在不损失过多信息的前提下,降低数据的维度,从而简化复杂的多变量系统。
数据标准化:需要对原始数据进行标准化处理,以消除量纲和数量级的影响。
标准化后的数据均值为0,标准差为1。
计算协方差矩阵:然后,计算标准化后的数据的协方差矩阵,以捕捉变量之间的相关性。
计算特征值和特征向量:接下来,求解协方差矩阵的特征值和特征向量。
基于主成分分析法的沿海11省市综合经济实力评价
基于主成分分析法的沿海11省市综合经济实力评价作者:杨山力来源:《中国集体经济》2014年第08期摘要:利用2013年中国统计年鉴数据,选择8项经济指标,采用主成份分析对我国沿海11个省市的经济实力进行综合评价排序,并按照主成份分析得分值的高低进行进一步分类和阐释。
关键词:经济发展;综合实力;主成分分析;沿海一、引言辽宁、河北、天津、山东、江苏、上海、浙江、福建、广东、广西、海南是我国大陆的沿海省、市。
自20世纪80年代实施改革开放以来,沿海地区先后通过设立经济特区、沿海开放城市、开发开放上海浦东等重大政策,使该地区成为中国经济最活跃、吸引外资最多、经济总量最大、对国家贡献最大、对外影响力最大的区域。
但区域经济差异是经济发展过程中不可避免的现象,地区发展不平衡也是我国的基本特征之一。
沿海各省、市有着比较相似的自然环境和资源等客观条件,经济发展水平依然存在较大的差异。
沿海地区的经济发展对中国的经济发展起着领头羊的作用,是中华民族崛起不可缺少的强劲动力,只有客观、准确地评价沿海各省、市的综合经济实力,分析各地区经济发展的差异,然后提出有针对性的政策和意见,才最终实现推动沿海各省、市经济的协调稳定发展。
二、研究方法(一)主成分分析简介主成分分析方法(Principal Component Analysis)简称(PCA),是一种解决最终问题的“中间过程”。
在社会经济研究中经常会遇到多指标的问题,这些指标间往往存在一定的相关,直接纳入分析不仅复杂,使变量之间难以取舍,而且可能因多元线性而无法得出正确结论。
主成分分析的目的就是运用线性变换,将原来的多个指标组合成相互独立的少数几个能充分反映母体信息的指标,从而在不丢掉主要信息的前提下,避开了变量之间共线性的问题,便于进一步分析。
在主成分分析中,提取出的每个主成分都是原来多个指标的线性组合,比如有两个原始变量x1和x2,则一共可提取出如下两个主成分:PCA1=a11x1+a21x2PCA2=a12x1+a22x2原则上如果有n个变量,则最多可提取出n个主成分,但如果将它们全部提取出来就失去了该方法简化指标的实际意义。
对主成分分析中综合得分方法的质疑(王学民)
对主成分分析中综合得分方法的质疑王学民原载于《统计与决策》,2007年第8期摘要:在作主成分分析时,国内近年来流行一种通过建立综合评价函数来对各样品进行综合排名的方法。
本文对这一方法的不科学性作了阐述,并指出在综合评价函数中对各主成分使用贡献率加权是错中加错。
关键词:主成分;信息量;综合评价函数;综合得分一、问题的提出在多元数据分析中,近年来国内流行一种通过建立综合评价函数来对所有样品进行综合排名的方法。
该方法是这样的:对p 个原始变量12,,,p x x x ,通过主成分分析,取前m 个主成分12,,,m y y y ,其方差分别为12,,,m λλλ ,以每个主成分i y 的贡献率1pi i i i αλλ==∑作为权数,构造综合评价函数1122m m F y y y ααα=+++计算出每个样品的(F )综合得分,然后依这个得分的大小对所有样品进行综合排名。
对这种用线性组合的方式来综合各主成分的方法,笔者从未在国外的有关多元统计分析的文献中见过。
该方法粗看起来似乎有一定道理且很有吸引力(似乎可以综合排名了),但仔细推敲之后就会发现这一方法是对主成分思想和方法的误解,是不科学的,没有什么理论和应用上的价值。
该综合排名方法在我国的多元数据分析应用中已得到了比较普遍的误用,笔者曾在参考文献[1]中的253页上简略地谈到过这一问题,现觉得很有必要针对这一问题作一具体阐述,谈谈自己的观点,供大家参考和讨论。
二、主成分的基本思想除了将主成分法用于聚类或回归分析或寻找变量之间的共线性关系等目的之外,主成分分析的一般目的由两点组成:(1)将多个有相关关系的变量压缩成少数几个不相关的主成分(综合变量),并保留绝大部分信息;(2)给出各主成分的具有实际背景和意义的解释。
这里我们只讨论主成分分析的这种一般目的。
主成分的价值就在于它的信息量(可用方差来度量)达到最大化,即使前少数几个主成分能使累计贡献率达到一个较大的百分数,这几个主成分能不能用还得看它们是否都能得到符合实际意义的解释。
浅谈统计综合评价中主成分分析法的应用
的方 法 . 简称 综合 评价方 法 。 其基
并 评 单位 “ 综合 状况 ” 的排 序 。 本思 想是 将 多个 指标 转化 成 为一 其 分 量 不相 关 的新 随 机 向量 , 个能 够反 映综 合情 况 的指 标来 进
行评价 。
以方 差作 为 信息 量 的测 度 ,对 新
构 成 综 合 评 价 的 要 素 主 要
. 法 。 由单 项 评价 值 计算 综合 评价 序 ,而 且还 可 根据 模糊 评 价集 上 3评价 指标 。评 价 指标 体 系 是 从
值 时一 般 采 用 加 权 算 术 平 均 法 . 所 以 ,各 种 常规 综合 评价 方 法 的 区别 主要 在 于单项 评 价值 的 计算 的值 按最 大 隶属 度 原则 去 评定 对 象 的等级 。
个方面: 一 , 第 各评 价 指标 无量 纲 做 出评价 与排 序 ,而且 还 可进 一 随 着综 合评 价 技术 理 论 的开展 与 实 践活 动 ,评 价 的领 域也 从最 初 化 的方 法 .也 是将 评 价指 标 的实
步分 析各决策 单元非D E有 效 的
际值转 化 为评 价值 或称 单项 得 分 原 因 及其 改进 方 向 ,从 而 为决策 的 各行 各业 经 济统 计 综合 评价 拓 生 的计算 方 法 。常见 的 消除 量纲 的 者 提供 重要 的管理 决策 信 息 。(1 展 到后 来 的技 术水 平 、 活质 量 、 3 社 环 方 法有 相 对化 处理 法 、函数化 处 模 糊 评价法 。模 糊评 价法 奠 基 于 小 康 水 平 、 会 发展 、 境 质 量 、 综合 国力 、 效 考评 等 绩 理法 和标 准化处 理法 。 二 , 第 由单 模 糊数 学 。它 不 仅可 对评 价 对象 竞争 能力 、 这些都 能构 成被 评价对 象 。 项 评 价 值 计 算 综 合 评 价 值 的 方 按 综 合分值 的大 小进 行评 价 和排 方 面 。
主成分分析方法在综合评价中的应用
理人 员针刺 伤 的发 生率还 会降低 。要建 立针刺伤报 告 管理 制度 , 定期对 已发 生 的针刺 伤 进行 追 踪调 查 。 医 务科 、 护理部 、 院感 科和病 区护士 长做好 护理人员 的培 训 和督察工 作 。
小 结
为一层 乳胶 或聚 乙烯手 套 , 能 减少 刺 伤 时 医务 人 员 可
标函数 , 骤如下 : 步
1 将 数据 标准化 : .
Xj= ( 一 ) , = 1 … , 和 S 表 示 样 / , P,
数 ( ) 病 死率 ( ) 日均 门 诊 人 次 ( ) 出院 病 人 x4 、 x5 、 x6 、 平 均费 用( ) 见 表 1 x, , 。为与 该文结 果 比较, 们沿用 我
维普资讯
ch n s o r a fHe l i e eJ u n l a t S o h
针头等 锐器过 程 中不 能徒 手 处理 ; 接 触病 人 体 液 等 ③ 项操 作时戴手 套 , 洗 污染 的 器械 时 戴双 层 手 套。 因 清
线性组 合 ; 而在 几何 上这 些 线性 组 合 代表 选 取一 个 新 坐标系 , 是 以 x1 x2 …, 它 , , x 为 坐 标 轴 的 原 坐 标 系 旋转后 得到 的【 。 l 】
) 其 中 m 为选择 的 主成 分个 数 。主 成分 个数 的 确 ,
定可 以借助 “ 底 碎 石 图” 个 有效 的视 觉工 具 确定 , 崖 这
北京师范大学数学科学学院统计与金融数学系(0 8 5 金 蛟 10 7 )
本 文用主 成分 分析 方法 对 某 医院 1 0年 不 同性 质 的 医疗质 量指标进 行综合评 价, 果如下 。 结 原理与方 法
( je)J , , P 表 示特征根 一特 征 向量对 。 ,j ( :1 2 …, ) 3 得到样 本主成 分 : J j , . Z =e X J=1 …, , P。X 的第 个主成 分解 释 的总 方 差所 占的 比例 ( 差 贡献 方 率) 为 / 。 P 4 得到综 合评 价的指标 函数 : .
甘肃省区域城市化水平综合测度研究
甘肃省区域城市化水平综合测度研究本文在建立区域城市化水平测度指标体系的基础上,运用主成分分析法,以甘肃省14个地州市为研究地域单元,对甘肃省区域城市化水平进行了综合测度,并通过聚类分析将其划分为4种梯度类型。
同时,分析了甘肃省城市化水平的地域差异特征、各类城市发展所面临的问题及发展方向。
标签:城市化;主成分分析;聚类分析;甘肃省城市化是因生产力的发展而使人们的生产方式、生活方式、和行为方式变化的过程,其内涵在于,它不仅是简单的城乡人口结构的转化,更重要的,它是一种产业结构及其空间颁布结构的转化,是传统生产方式、生活方式和行为方式向现代化生产方式、生活方式和行为方式的转化。
目前,我国已经进入快速城市化时期,各地区提出了加速城市化,以城市化推动区域经济快速发展的战略。
但相关战略提出的科学性仍有待进一步探讨,其主要表现是从城市人口数量上提高城市化水平,各地区之间存在城市化水平的相互攀比现象,有些地区不顾区域客观条件制约,热衷于搞城市化运动。
不少市县追求个人政绩,出现城市化过热现象。
这种现象的出现可能违背了城市化发展的客观规律,与当前以单一的人口城市化指标来衡量城市发展水平有密切的关系。
因此,如何科学有效地测度区域城市化水平是亟待解决的现实和理论问题。
一、区域城市化水平测度(一)測度指标体系构建对城市化水平的测度,学术界提出了多种方法。
归结起来,这些测度方法可分为主要指标方法和复合指标方法两类。
主要指标法是指通过几个最具本质意义、最具象征性,而且便于统计分析的个别指标来反映和描述城市化水平。
复合指标法是选用与城市化有关的一组指标来综合分析,以衡量城市化的水平。
城市化内涵十分丰富,不仅体现了一个地区人口结构的变化,还体现出该地区的经济发展水平、产业结构演变以及人民生活质量的提高。
因此,文章采用复合指标来衡量区域城市化水平。
结合上述城市化内涵分析,建立城市化水平测度指标体系(表1)。
(二)计算方法多指标综合指数法的计算方法有多种,文章拟采用线性加权求和法计算各城市的城市化水平,计算公式如下:式中:F表示某一省域城市化发展水平的综合指数;Wi表示该城市第i项指标的权重(同级指标取等权);Wij为第i市第j个指标的原始数据的标准化值。
利用主成会合析法分析我国35个中心城市的综合发展水平
所以选取 Y 为第一 主成分 , 2 】 Y 为第二 主成分 , 而且 这两个 主成 分之方 差和占全 部总方差的 鹞 .4 %. 5 8 即基本上保留了原来 指标 X 。 2 …, l 1 x , X O的信 息, 样由原来 这 的1 0个指标转化 为两个新指标 。起 到了降维的作用。 前两个主成分 y .2的线性组合为 : 1y
.
一
、
客观 准确地描速砸区社会经济现状是制定新的发展战略∞肇础和前提。因此. 分析评
价 3 个中心城 市的综合发展水平 . 论对城 市自身 的发展 . 5 无 还是对周边地 区的进 步. 都
有 十分 重 要 的意 义 。 二 、主 成 分 分 析 法 1 主成分分析法简介。主成分分析法 ( . .
其中 :1 x 代表年底总人 口, 2 x 代表国内生产总值 ,3 x 代表工业总产值 ,4 ) 代表客运 c 总量 .5 x 代表货运总量 。6 】 代表地方财政 预算 内收入 .7 c x 代表 固定资产投资总额 . 代 表城乡居民年底储 蓄额 .9代表在岗工人数 。1 ) c xn代表在岗职工工资总额 。
:一 l l 1 一 k一 1
性 即 可加 性 。
() 3 客观性( 科学的确定权重) 。在层次分析法计算得过程中. 其权重是通过专家打 分来 确定权重 的. 也就是说在确定权重的问题 上具 有了人为色彩 。而 在主成分分析法 的计算 过程 中, 在确定综合 因子的权 重时 , 克服 了某些 评价方法中人 为确 定权重的缺 陷。 使得综合评价结果唯一 。 () 4 简单性( 计算简介 . 方便 ) 。随着电子计算机技 术的发展 . P S S S等计算机 SS.A 软件的推与使用. 使得主成分分析法 在综合评价实践中的广泛应用成为现实 三、 主成分分析法在 3 个中, 城市发展水平分析中的应用 5 在城 市综 合发展水平评价中 , 及的指标往往很多。为 了简化系统结构 . 涉 抓住综合 发展水平的主要问题 . 我们可由原始数据矩阵 出发求主成分。在评价全围 3 个中心城 5 市的综合发展水平 中, 涉及到 1 O项指标 . 原始数据见下表 . 即样 品效 n 3 , = 5 变量效 p =
主成分分析法评价我国各地区循环经济发展水平
主成分分析法评价我国各地区循环经济发展水平摘要循环经济是基于系统生态原理和市场经济规律组织起来的,具有高效的资源代谢过程、完整的系统耦合结构及整体、协同、循环、自生功能的网络型、进化型复合生态经济。
我国地域辽阔,各地区在自然条件、资源禀赋、经济发展水平上存在着较大的差异,因而各地区循环经济发展水平存在较大的差异性,各地区发展循环经济的对策也应有所区别。
为全面评价分析我国2011-2012年各地区循环经济发展水平,根据我国地理位置和区域经济发展状况,在东部、中部和西部各选取3个省份作为评价对象,同时为了与全国平均水平比较也将全国平均作为一个评价对象。
使用主成分分析法对各地区循环经济发展情况进行分类与评价。
结果表明:甘肃省循环经济水平最差。
上海市循环经济水平最高。
上海、北京、广东、重庆、安徽五省市的循环经济水平位于全国前列,超过了全国的平均水平。
而山西、湖北、内蒙古、甘肃四省循环经济水平较差,低于全国平均水平。
关键词:主成分分析,循环经济,评价1.引言循环经济是基于系统生态原理和市场经济规律组织起来的,具有高效的资源代谢过程、完整的系统耦合结构及整体、协同、循环、自生功能的网络型、进化型复合生态经济。
作为一种新的经济发展模式,其推行和应用受到政策、经济实力、科技发展水平等方面的制约。
我国地域辽阔,各地区在自然条件、资源禀赋、经济发展水平上存在着较大的差异,因而各地区循环经济发展水平存在较大的差异性,各地区发展循环经济的对策也应有所区别。
为全面评价分析我国2011-2012年各地区循环经济发展水平,根据我国地理位置和区域经济发展状况,在东部、中部和西部各选取3个省份作为评价对象,如表1。
同时为了与全国平均水平比较也将全国平均作为一个评价对象。
使用主成分分析法对各地区循环经济发展情况进行分类与评价。
表1 原始数据省份单位GDP能耗(吨标煤/万元)万元GDP用水量(m3/万元)单位面积土地GDP产出(万元/km2)三废综合利用产品产值占工业产值比例%环境污染治理投资占GDP比例(%)北京 1.29 80.78 2610.02 0.37 1.53 上海 1.07 158.52 9042.69 0.22 0.94 广东0.96 289.79 892.29 0.38 0.70 山西 4.23 183.74 194.14 0.83 1.48 安徽 1.47 435.72 343.45 0.67 0.86湖北 1.42 384.63 339.45 1.45 0.71重庆 1.32 253.25 323.98 0.54 1.81内蒙古 2.43 632.36 23.68 0.61 1.63甘肃 2.70 781.31 38.58 0.76 1.06全国平均1.43 405.32 143.98 0.64 1.402.数据标准化由于影响各城市循环发展的各指标的浓度不同,需要将数据进行标准化。
基于DEA模型的甘肃省地方政府绩效评估
基于DEA模型的甘肃省地方政府绩效评估基于DEA模型的甘肃省地方政府绩效评估引言:地方政府绩效评估是确保政府机构有效运转的关键工具,也是提升政府服务质量和满足民众需求的重要手段。
甘肃省地方政府作为中国西北地区的一部分,其绩效评估更是具有特殊意义。
本文将采用DEA模型对甘肃省地方政府的绩效进行评估,以期为政府改革和提高政府运作效率提供借鉴。
一、DEA模型简介DEA(Data Envelopment Analysis)是一种非参数效率评估方法,常用于评价相对效率和效率改进的程度。
它测量单位是否能够以更少的投入获得更多的产出。
DEA模型的特点是可以确定影响效率的决策单位的关键因素。
二、选取评估指标在对甘肃省地方政府绩效进行评估时,应选择合适的指标来衡量其影响因素。
本文选择了以下指标:1. 财政支出效率:评估政府在财政投入方面的高效性。
2. 社会公共服务满意度:反映政府在社会公共服务领域的满意度。
3. 经济增长:衡量政府在推动地方经济发展方面的绩效。
4. 基础设施建设:评估政府在基础设施建设方面的投入情况和效果。
5. 政府形象:反映政府在舆论口碑和形象塑造方面的绩效。
三、数据收集和处理本文采用2018年的数据进行评估。
相关数据来源于甘肃省统计年鉴、财政年度报告以及公开发布的政府数据。
通过对数据的筛选和整理,得到符合研究要求的可靠数据。
四、DEA模型分析将选取的评估指标纳入DEA模型中进行计算。
以甘肃省各个地方政府为单位,设定投入和产出变量。
通过计算每个单位的效率评分,得出甘肃省地方政府的整体效率评估结果。
根据效率评分的高低,可进一步分析政府绩效的优势和不足之处。
五、评估结果与分析根据DEA模型计算的结果,得出甘肃省地方政府的整体效率评估为80%,表明甘肃省地方政府存在一定的效率问题。
具体分析如下:1. 财政支出效率方面,甘肃省地方政府财政资源投入一般,存在一定的资源浪费现象。
政府应进一步加强财政管理,优化资源配置,提高财政支出的效率。
主成分分析及其在综合评价系统中的应用
主成分分析及其在统计综合评价系统中的应用一. 文献综述主成分分析法是在对于复杂系统进行统计分析时十分有效的一种方法。
本文主要是对主成分分析法进行详细介绍,并分析其在统计综合评价中的应用[1]。
突出介绍主成分分析法在学生综合成绩分析[2]、企业业绩分析[3]及景区游客服务满意度测评[4]这三个综合评价系统中的应用。
并在文末,对主成分分析法进行了一定的改进[5],使得主成分分析法更加合理并贴近实际,且在一定程度上减小了统计分析过程中“线性化”产生的误差。
二.相关知识在我们进行系统分析时,多变量问题是经常会遇到的。
变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。
因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本文介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。
(一)主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
假定有n个样本,每个样本共有p个变量描述,这样可构成一个n×p阶的数据矩阵。
如何从这么多变量的数据中抓住事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。
为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。
那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。
如果记原来的变量指标为,它们的综合指标——新变量指标为,(m≤p)。
则在(1)式中,系数由下列原则来决定:(1)与相互无关;(2)是的一切线性组合中方差最大者;是与不相关的的所有线性组合中方差最大者;……;是与都不相关的的所有线性组合中方差最大者。
甘肃省城市交通发展水平聚类分析
甘肃省城市交通发展水平聚类分析1. 引言1.1 研究背景甘肃省位于中国西北地区,是中国重要的交通枢纽之一。
随着经济的快速增长和城市化进程的加快,甘肃省各城市的交通发展面临着新的挑战和机遇。
城市交通发展不仅关系到市民的出行便利,也关乎到城市的经济发展和社会稳定。
目前甘肃省各城市的交通发展水平存在差异,一些城市交通拥堵严重,交通设施滞后,而另一些城市则交通便利,城市交通网络完善。
通过对甘肃省各城市交通发展水平进行聚类分析,可以帮助政府和相关部门更好地了解各城市的交通状况,有针对性地制定交通规划和政策,推动城市交通的可持续发展。
本研究旨在通过聚类分析方法,对甘肃省各城市的交通发展水平进行评估和分类,为城市交通规划和管理提供科学依据。
也为甘肃省城市交通的未来发展方向提供参考,促进城市交通的优化和改善。
1.2 研究意义甘肃省是我国西北地区的重要省份,城市交通发展水平对于该省的经济社会发展具有重要意义。
本文旨在通过对甘肃省各城市交通发展水平进行聚类分析,揭示不同城市在交通发展方面的特点和差异,为进一步制定城市交通规划和政策提供科学依据。
研究意义主要体现在以下几个方面:第一,通过对甘肃省城市交通现状的分析,可以为政府部门提供决策参考。
了解各城市的交通发展状况,有助于及时发现和解决存在的问题,促进城市交通系统的优化和提升。
第二,通过对各城市交通发展水平的聚类分析,可以揭示不同城市之间的差异性和共性,为城市间交通合作和交流提供有益启示。
通过比较分析,可以发现各城市的发展优势和劣势,为城市间合作提供依据。
本研究对于深入了解甘肃省城市交通发展现状,促进交通系统协调发展,提高城市交通效益,具有重要的现实意义和实践价值。
2. 正文2.1 甘肃省城市交通现状分析甘肃省位于中国西北地区,是一个交通相对落后的省份。
根据最新的统计数据显示,甘肃省城市交通发展水平整体较低,主要表现在以下几个方面:首先是道路交通条件较差。
由于地理位置特殊,甘肃省大部分地区山多河遍,道路交通建设受到较大限制。
如何有效利用主成分分析进行综合评价.
如何有效利用主成分分析进行综合评价摘要:由于主成分分析在多元统计分析中的降维作用,使之在社会、经济、医疗、生化等各领域运用越来越广泛,但由于传统主成分分析方法的局限性导致了一些问题的产生。
这些问题吸引了许多领域专家的关注,并具有针对性的提出了一些不同的改进方法。
本文介绍了主成分分析的基本和性质,并整理了近年来主成分分析在综合评价应用中遇到的普遍问题并整理验证了认同率较强的一些改进方法,以供大家研究学习。
关键词:主成分分析;综合评价;均值化1引言1.1研究的背景和意义随着生产力的不断进步,生产方式由外延式扩张转化为追求经济效益的内涵式发展,以致在生产过程中必须考虑经济效益的各个方面,如生产力水平、技术进步、资源占用等情况,并需要就综合各方面的因素进行综合评价。
评价是根据确定的目的来测定对象系统的属性,并将这种属性变为客观定量的计值或者主观效用行为,整个过程离不开评价者的参与,而综合评价作为评价的一种也需要评价者做出相应反应或指示,而很多综合评价过程易受到评价者的干预,使评价结果产生偏差。
主成分分析能将高维空间的问题转化到低维空间去处理【9】,使问题变得比较简单、直观,而且这些较少的综合指标之间互不相关,又能提供原有指标的绝大部分信息。
而且,伴随主成分分析的过程,将会自动生成各主成分的权重,这就在很大程度上抵制了在评价过程中人为因素的干扰,因此以主成分为基础的综合评价理论能够较好地保证评价结果的客观性,如实地反映实际问题。
主成分综合评价提供了科学而客观的评价方法,完善了综合评价理论体系,为管理和决策提供了客观依据,能在很大程度上减少了上述不良现象的产生。
所以在社会经济、管理、自然科学等众多领域的多指标体系中,如节约型社会指标体系、生态环境可持续型指标体系、和谐社会指标体系、投资环境指标体系等,主成分分析法常被应用于综合评价与监控【6】。
综上所述,对综合评价指标体系理论进行研究,既有理论上的必要性,更有实践中的迫切性。
主客观加权主成分分析在区域竞争力综合评价中的应用
级 指标 经 济综 合
、
竞争力
三 级 指标 人 均 G D P 人 均 固 定 资 产 投 资 人 均消 费 零 售 总 额 城镇 居 民 可 支 配 收入 农 村 居 民纯 收 入
、 、 、 、 、
等直 接性竞争 力板块 以及 政府 调 控
教育科技
基础设施等
区域
,
间 接 性 竞 争 力板 块
见 图1
,
个 别 指 标 通 过 简 单 的 算术
产 品 提供论
,
” 、
经 济 实力论
”
、
平均而得
避 免 了 许 多 文 献 上 出 现 的提 到 的 指 标 无 法 找 到 官
。
“
综合论
”
。
基 于 以上 的界 说
,
他认 为
一
个较 为完善 的
:
、
合
方 数 据 的尴 尬
(
:)
理 的 区 域 竞 争 力概 念
应该 包 括 以下 几 层 含 义
,
目 的性 与科学 性原 则 。
,
本文综合评 价 的 目 的是 测算各
是 否 影 响评 价 结 果 这
、
竞 争 力 的 发展 水 平
并据 此 指 出区 域 差 距 的 方方面 面
。
区 域 竞 争 力值 的 大 小
因 此 所 选 指 标 进 出指 标体 系 框 架 依 据
一
善 我 国 区 域 经 济 发 展 不 平 衡 提 供 充 分 的 实证 依 据
,
各 个层 面 又 从 不
,
实施 区 域 发展 总 体 战 略
,
继 续推 进西 部
,
同 角度 评 价 总 体 区 域 竞 争 力强 弱
主成分分析法原理及应用
一、概述 在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性;而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍;为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生;为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失;主成分分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法;主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,通常综合指标主成分有以下几个特点:主成分个数远远少于原有变量的个数原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量;主成分能够反映原有变量的绝大部分信息因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息;主成分之间应该互不相关通过主成分分析得出的新的综合指标主成分之间互不相关,因子参与数据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问题;主成分具有命名解释性总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法;二、基本原理主成分分析是数学上对数据降维的一种方法;其基本思想是设法将原来众多的具有一定相关性的指标X1,X2,…,XP 比如p 个指标,重新组合成一组较少个数的互不相关的综合指标Fm 来代替原来指标;那么综合指标应该如何去提取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保持相互无关信息不重叠;设F1表示原变量的第一个线性组合所形成的主成分指标,即11112121...p p F a X a X a X =+++,由数学知识可知,每一个主成分所提取的信息量可用其方差来度量,其方差VarF1越大,表示F1包含的信息越多;常常希望第一主成分F1所含的信息量最大,因此在所有的线性组合中选取的F1应该是X1,X2,…,XP 的所有线性组合中方差最大的,故称F1为第一主成分;如果第一主成分不足以代表原来p 个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F1已有的信息就不需要再出现在F2中,即F2与F1要保持独立、不相关,用数学语言表达就是其协方差CovF1, F2=0,所以F2是与F1不相关的X1,X2,…,XP 的所有线性组合中方差最大的,故称F2为第二主成分,依此类推构造出的F1、F2、……、Fm 为原变量指标X1、X2……XP 第一、第二、……、第m 个主成分;根据以上分析得知:1 Fi 与Fj 互不相关,即CovFi,Fj = 0,并有VarFi=ai ’Σai,其中Σ为X 的协方差阵2F1是X1,X2,…,Xp 的一切线性组合系数满足上述要求中方差最大的,……,即Fm 是与F1,F2,……,Fm -1都不相关的X1,X2,…,XP 的所有线性组合中方差最大者;F1,F2,…,Fmm ≤p 为构造的新变量指标,即原变量指标的第一、第二、……、第m 个主成分;由以上分析可见,主成分分析法的主要任务有两点:1确定各主成分Fii=1,2,…,m 关于原变量Xjj=1,2 ,…, p 的表达式,即系数ij a i=1,2,…,m ; j=1,2 ,…,p;从数学上可以证明,原变量协方差矩阵的特征根是主成分的方差,所以前m 个较大特征根就代表前m 个较大的主成分方差值;原变量协方差矩阵前m 个较大的特征值i λ这样选取才能保证主成分的方差依次最大所对应的特征向量就是相应主成分Fi 表达式的系数i a ,为了加以限制,系数i a 启用的是i λ对应的单位化的特征向量,即有'ai ai = 1;2计算主成分载荷,主成分载荷是反映主成分Fi 与原变量Xj 之间的相互关联程度:(,)(,1,2,,;1,2,,)k i ki P Z x i p k m ===三、主成分分析法的计算步骤主成分分析的具体步骤如下:1计算协方差矩阵计算样品数据的协方差矩阵:Σ=s ij pp,其中11()()1nij ki i kj j k s x x x x n ==---∑ i,j=1,2,…,p 2求出Σ的特征值i λ及相应的正交化单位特征向量i aΣ的前m 个较大的特征值12…m>0,就是前m 个主成分对应的方差,i λ对应的单位特征向量i a 就是主成分Fi 的关于原变量的系数,则原变量的第i 个主成分Fi 为:Fi ='i a X主成分的方差信息贡献率用来反映信息量的大小,i α为:3选择主成分最终要选择几个主成分,即F1,F2,……,Fm 中m 的确定是通过方差信息累计贡献率Gm 来确定当累积贡献率大于85%时,就认为能足够反映原来变量的信息了,对应的m 就是抽取的前m 个主成分;4计算主成分载荷主成分载荷是反映主成分Fi 与原变量Xj 之间的相互关联程度,原来变量Xjj=1,2 ,…, p 在诸主成分Fii=1,2,…,m 上的荷载 lij i=1,2,…,m ; j=1,2 ,…,p;:在SPSS 软件中主成分分析后的分析结果中,“成分矩阵”反应的就是主成分载荷矩阵;5计算主成分得分计算样品在m 个主成分上的得分:1122...i i i pi p F a X a X a X =+++ i = 1,2,…,m实际应用时,指标的量纲往往不同,所以在主成分计算之前应先消除量纲的影响;消除数据的量纲有很多方法,常用方法是将原始数据标准化,即做如下数据变换: 其中:11n j ij i x x n ==∑,2211()1n j ij j i s x x n ==--∑ 根据数学公式知道,①任何随机变量对其作标准化变换后,其协方差与其相关系数是一回事,即标准化后的变量协方差矩阵就是其相关系数矩阵;②另一方面,根据协方差的公式可以推得标准化后的协方差就是原变量的相关系数,亦即,标准化后的变量的协方差矩阵就是原变量的相关系数矩阵;也就是说,在标准化前后变量的相关系数矩阵不变化;根据以上论述,为消除量纲的影响,将变量标准化后再计算其协方差矩阵,就是直接计算原变量的相关系数矩阵,所以主成分分析的实际常用计算步骤是:☆计算相关系数矩阵☆求出相关系数矩阵的特征值i λ及相应的正交化单位特征向量i a☆选择主成分☆计算主成分得分总结:原指标相关系数矩阵相应的特征值i 为主成分方差的贡献,方差的贡献率为 1/pi i i i αλλ==∑,i α越大,说明相应的主成分反映综合信息的能力越强,可根据i 的大小来提取主成分;每一个主成分的组合系数原变量在该主成分上的载荷i a 就是相应特征值i 所对应的单位特征向量;。
基于主成分-_聚类分析法的31_个省市经济发展水平的综合评价
2023年7月第26卷第14期中国管理信息化China Management InformationizationJul.,2023Vol.26,No.14基于主成分-聚类分析法的31个省市经济发展水平的综合评价何远霞,王 兰,焦登丹(贵州财经大学数统学院,贵阳550025)[摘 要]文章主要以我国31个省、自治区和直辖市的经济发展水平为研究对象,选取能反映经济发展水平的18个经济指标,运用主成分分析法(Principal Component Analysis,PCA)和系统聚类分析法,对31个省市的经济发展水平进行综合评价。
[关键词]主成分分析;系统聚类法;经济发展水平;综合评价doi:10.3969/j.issn.1673 - 0194.2023.14.058[中图分类号]F124 [文献标识码]A [文章编号]1673-0194(2023)14-0177-030 引 言我国部分地区因地理环境及气候条件等因素的制约,发展速度较慢,导致我国整体经济发展受到影响。
此外,研究发现,我国各省市间经济发展存在严重的不平衡现象。
研究各省市间的经济发展情况,对促进各省市更快更好地发展和充分发挥城市在经济社会生活中的主导作用都具有重要意义。
1 数据来源和指标选取本文数据源于《2022中国统计年鉴》,由Matlab软件完成数据分析。
为更加全面地评价2021年我国31个省、自治区和直辖市(以下简称31个省市)的经济发展状况,本文结合各省市经济发展实际情况和数据的科学性、可得性及可操作性等原则,选取能够反映我国31个省市经济发展水平的18个指标:人均国内生产总值(Gross Domestic Product,GDP)(元)、地方一般公共预算收入(亿元)、社会消费品零售总额(亿元)、固定资产投资(不含农户)同比增长率(%)、地区生产总值(亿元)、在岗职工人均工资额(元)、房地产开发投资额(亿元)、地方财政预算支出(亿元)、城乡居民年底储蓄余额(亿元)、客运总量(万人)、货运总量(万吨)、货物进出口总额(亿元)、人均拥有公共图书馆藏量(册/人)、公共图书馆电子阅览室终端数(台)、普通高等学校数(所)、每十万人口高等学校平均在校生数(人)、人均公园绿地面积(平方米/人)、农林牧渔业总产值(亿元)。
主成分综合评价模型
主成分综合评价模型引言:主成分综合评价模型是一种常用的多指标综合评价方法,可以用于评估和比较不同对象或方案的综合性能。
本文将介绍主成分综合评价模型的基本原理、应用领域以及优缺点,并结合实际案例进行说明。
一、主成分综合评价模型的基本原理主成分综合评价模型是一种基于统计学原理的多指标综合评价方法。
首先,通过对多个指标的测量或观测,计算得到各个指标的原始数据。
然后,通过主成分分析方法,将这些指标进行综合,得到一组主成分。
最后,根据主成分的贡献率,对不同对象或方案进行综合评价。
主成分分析是一种降维技术,通过线性变换将原始数据转化为一组互相无关的主成分。
主成分的选择是基于其解释方差的能力,通常选择前几个主成分,使其累计贡献率达到一定阈值。
主成分的计算和选择可以使用各种统计软件进行实现。
二、主成分综合评价模型的应用领域主成分综合评价模型在各个领域都有广泛的应用,包括经济、环境、工程、管理等方面。
以下是几个常见的应用领域:1. 经济领域:主成分综合评价模型可以用于评估不同地区或国家的经济发展水平。
通过选取合适的经济指标,如GDP、人均收入、失业率等,可以对不同地区或国家的经济综合实力进行比较和评价。
2. 环境领域:主成分综合评价模型可以用于评估环境质量。
通过选取合适的环境指标,如空气质量指数、水质指标、土壤污染程度等,可以对不同地区或场所的环境质量进行综合评价。
3. 工程领域:主成分综合评价模型可以用于评估工程项目的综合效益。
通过选取合适的评价指标,如投资回报率、工期、质量等,可以对不同工程项目进行综合评价,从而帮助决策者做出合理的决策。
4. 管理领域:主成分综合评价模型可以用于评估企业或组织的综合绩效。
通过选取合适的绩效指标,如销售额、利润率、员工满意度等,可以对不同企业或组织的综合绩效进行比较和评价,从而指导管理决策。
三、主成分综合评价模型的优缺点主成分综合评价模型具有以下优点:1. 可以综合考虑多个指标的信息,避免了单一指标评价的局限性。
基于主成分分析和聚类分析的我国各省市经济效益研究
基于主成分分析和聚类分析的我国各省市经济效益研究近年来,我国各省市经济效益差异逐渐凸显。
为了深入了解和研究各省市的经济效益,可以采用主成分分析和聚类分析的方法来进行研究。
主成分分析可以用来降维和提取数据特征,聚类分析可以用来发现数据之间的相似性和差异性。
首先,我们需要收集一些数据,例如各省市的GDP、人均收入、产业结构、消费水平、教育水平等指标,这些指标可以用来反映各省市的经济效益情况。
然后,我们可以利用主成分分析来降维和提取数据特征。
主成分分析是一种常用的降维方法,通过线性变换将原始数据映射到一个低维空间中,同时尽量保留原始数据的信息。
在这个过程中,我们可以得到一些主成分,主成分代表了原始数据中的一部分变异性。
通过主成分分析,我们可以将原始数据从多个指标中压缩为少数几个主成分。
通过主成分分析后,我们得到了一些主成分,每个主成分代表了原始数据中的一部分变异性。
接下来,我们可以利用聚类分析来发现数据之间的相似性和差异性。
聚类分析的目的是将数据集中的样本划分为不同的组别,每个组别内的样本应该尽可能相似,而不同组别之间的样本应该尽可能不相似。
在这个过程中,我们可以使用一些相似度或距离度量方法,例如欧氏距离或相关系数等。
通过聚类分析,我们可以将各省市划分为不同的类别,每个类别代表了一组经济效益相似的省市。
这样可以帮助我们更好地理解和分析各省市之间的经济效益差异,并挖掘出其中的规律和问题。
例如,我们可以找出经济效益较高的省市的共同特征,进而分析这些特征对经济效益的影响因素。
最后,我们可以通过可视化的方式展示各省市的经济效益研究结果。
例如,可以使用散点图来展示各省市在主成分空间中的分布情况,以及不同类别的省市的分布情况。
这样可以更直观地展示各省市之间的经济效益差异和相似性。
总之,基于主成分分析和聚类分析的研究可以帮助我们深入了解和分析我国各省市的经济效益。
通过这种研究方法,可以有效地发现各省市的经济效益差异以及其中的规律和问题,为相关决策提供科学的依据和参考。
主成分分析案例
Y2得分
-2.06481 2.32993 -1.47145 0.66326 -0.87181 1.25757 -1.40987 -0.36439 0.04577 -2.04139 -0.42078 0.33126 0.07660 0.86909 0.45974 -0.83575
主成分分析在 市场研究中的应用
1——5 组表示男性,6——10 组表示女性 1——5, 6——10 年龄从小到大排序
假若你是该食品加工业决策部 门的高级顾问,为了对食品生 产作出合理决策,请你对以上 的调查资料进行分析,为决策 者提供建议。
特征向量
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
特征根 i
方差贡献率
女性喜欢
一般喜欢
孩子 咖喱饭
炸肉饼、火腿面包
成人 鸡蛋烩饭、炸猪排 酸汤、大头鱼
一般不喜欢 特别不喜欢
孩子 干咖喱、浓汤 成人 煮牛肉、生蛋
菜粥、清汤
饼干、带馅面包 酱面条、烧鱼
服装的定型分类问题
为了较好地满足市场的需要,服装生产厂 要了解所生产的一种服装究竟设计几种型号合 适?这些型号的服装应按怎样的比例分配生产 计划才能达到较好的经济效益?
4、取每一组的中心 ( y1*k , y2*k ) (k=1,2,…,g) 作为该组的 代表点。
相应原16个指标的尺寸:
x1' r11 y1*k r12 y2*k x2' r21 y1*k r22 y2*k
x1' 6 r16,1 y1*k r16,2 y2*k
5、各种型号的比例按 该组样品数/128 确定。
Y2
0.513225 0.203116 -0.182858 0.193618 0.217290 0.113642 -0.164527 -0.114637 -0.509240 -0.025832 0.083471 0.132592 0.105402 0.199407 -0.181330 -0.261367 -0.295756
主成分分析在城市综合实力评价中的应用
西 安 工 程 科 技 学 院 学 报
J u n l fXia ie st fEn ie rn ce c n c n l g o r a ’ n Unv r i o gn e ig S in ea d Te h o o y o y
() 原始数 据 的处理 因 为在 城市综 合实 力评价 指标 体 系 中, 1 各指标 数值表 现形 式不 一 , 量单 位 计 也不 尽相 同 , 没有 直 接 的可 比性 . 了消除这 些给 评价结 果带 来 的影 响 , 为 需要 对原始 数据 进行 处理 , 即对 不
综合 实力 不 同.
定量 描述不 同城 市之 间 的综 合实 力 , 够 给当地政府 在制 定城市 发 展策 略时 以一定 的参考 , 得城市 能 使
之 间在发展 竞争 的 同时 , 够彼此 互相 学 习 , 能 借鉴其 他城 市 的经 验 , 因地 制 宜 , 现全 面协 调可持 续 发展. 实 在我 国 , 于城市 综合 实力 的 比较 已经 有 专家 学 者 提 出 的一 些行 之有 效 的指标 体 系 和 评 价方 法[. 对 1 文献 ] [—] 24探讨 了陕 西省 区域 经济发 展水 平及 工业 战略选 择 、 源 配 置等 问 题. 文选 用 多 元统 计分 析 中的主 资 本 成分 分析 法 , 陕西 省 内 9个 中心城 市 的综 合 实力 进行 实证研 究. 对
表 1 城 市综合实力评价 指标体 系
表 2 城市 综 合 实 力 评 价 指 标 原 始 数 据
22 实证 分析 .
主成分分析的基本思想 : 设法将原来众多具有一定相关性的指标( 比如 P个指标)重新组合成一组 ,
新 的相互 无关 的综合 指标 . 学 上 的处 理 就是将 原 来 的 户个指 标作 线性 组 合. 数 作为 新 的综 合 指标 , 这些 综
甘肃区域分析
一、分析区域发展的条件(自然、社会经济条件)区域发展条件包括影响区域发展的自然条件和社会经济背景条件两个方面,主要指区域自然条件和自然资源、人口与劳动力、科学技术条件、基础设施条件及政策、管理、法制等社会因素。
分析这些条件的主要目的是明确区域发展的基础,评估潜力,为选择区域发展的方向、调整区域产业结构和空间结构提供依据。
1、自然条件(1)地形地貌:甘肃位于中国西部,地处黄河上游,地域辽阔。
大部分位于我国地势二级阶梯上。
是山地形高原地貌。
地貌复杂多样,山地、高原、平川、河谷、沙漠、戈壁交错分布。
地势自西南向东北倾斜,地形狭长。
(2)气候特征:甘肃省气候干燥,气温日较差大,关照充足,太阳辐射强。
年平均气温在0-14℃间,由东南向西北降低。
年平均降水量300mm左右,降水各地差异很大,在42-760mm 之间,主要降水集中在6-9月。
甘肃省光能资源丰富,年日照时数1700-3300h,自东南向西北增加。
(3)自然资源:a.土地资源:全省总土地面积45.44万平方公里,居全国第7位。
农用地3.81亿亩,建设用地0.14亿亩,未利用地2.87亿亩。
人均占有土地26.3亩,人均占有耕地2.71亩,比全国人均占有量高出一倍多。
全省土地利用率为56.93%,尚未利用的土地有28681.4万亩,占全省总土地面积的42.05%。
b.水利资源:甘肃省的水资源主要分属黄河、长江、内陆河3个流域、9个水系。
河流具有流程短,上游水量大,水流急,下游河谷潜,水量小,河床多变等特点,但水量较稳定,但总体处于缺水状况。
c.矿产资源:甘肃省是矿产资源较丰富的省份之一,矿业开发已成为甘肃的重要经济支柱。
截止2006年底已发现各类矿产173种,占全国已发现矿种的74%。
2.社会经济背景条件2008年,甘肃实现GDP3176.11亿元,人均生产总值12110元。
全社会消费品零售总额990.14亿元,同比增长18.82%。
完成出口总值60.8亿美元,同比增长10.7%。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成份分析法在甘肃省各城市综合实力评价中的应用贾斌(地理科学1202 2012141234)摘要:本文采用客观赋值法中的主成分分析方法,通过建立一套包括4个方面26个指标的城市综合实力指标体系,对甘肃省14个中心城市和地区的综合发展水平进行研究。
通过SPSS12.0统计软件对相关原始数据进行标准化处理,并求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率。
在此基础上,确定作为初始因子的主成分变量,并计算出各主成分分值及综合分值。
最后根据综合分值对甘肃省14个中心城市的综合发展水平做出了评价。
关键词:主成分分析中心城市综合发展水平1. 引言甘肃地处我国的西北地区。
历史悠久,地域辽阔是中华文化的发祥地之一,甘肃作为我国东南部通向西北的交通要道、汉唐丝绸之路的必经之地,在地理位置上具有十分重要的地位。
由于甘肃省的自然条件差,经济发展落后,贫困面大,甘肃省又是少数民族广泛聚居的地区。
甘肃各中心城市的发展不仅直接关系到整个甘肃省的经济发展水平和西部大开发战略的成功实施,而且也关系到地区稳定与建立和谐社会等问题。
因此研究甘肃省中心城市的综合实力发展水平具有对于促进甘肃省和谐社会的发展有着深远的现实意义和历史意义。
所谓“中心城市”是指所处区域内经济比较发达、功能相对完善,对区域外的资本、技术、人力等资源具有吸纳力,对区域内其他城市及农村具有经济、政治、文化等方面的辐射力的城市[1]。
中心城市以其地理位置、规模大小、辐射范围、影响程度及吸纳能力等的不同,区分为世界级中心城市、国家级中心城市、省级中心城市等等[2]。
中心城市是区域经济的核心和区域开发的重要依托,是带动周边城市和地区经济发展的重要动力。
随着我国工业化进程的加快,中心城市经济发挥着越来越重要的作用。
中心城市的综合实力直接影响着它的区域带动力。
评价中心城市综合发展水平对于规划城市布局、确定城市等级、制定城市发展战略、构建城市产业链等具有基础意义。
目前对中心城市的评价方法主要有两类,一类是主观赋值法,如层次分析法、德尔非法、模糊综合评价法等:另一类是客观赋值法,如主成分分析、因子分析等主观赋值法是由相关专家根据主观经验评判给分或给出相关指标的权系数,然后加权计算总分的评价方法。
主观赋值法的特点是简单明了,易于操作,缺点是人为干扰因素多,尤其是在指标较多时,很难确定指标权重客观赋值法是根据客观对象构成要素的因果关系设计指标体系,根据指标体系采集原始数据,根据原始数据计算指标权重,然后加权计算总分的评价方法。
客观赋值法的优点是克服了主观赋值法人为因素的干扰,同时也可以在不损失有价值信息的情况下进行数据简化或结构简化。
近年来,国内学者在城市问题的研究中,更倾向于使用客观赋值法,本文采用客观赋值法中的主成分分析方法,通过对相关原始数据进行标准化处理,求出无量纲后数据的相关系数矩阵R及R的特征值、特征向量和贡献率;在此基础上,确定作为初始因子的主成分变量;并计算出各主成分分值及综合分值;根据综合分值对甘肃省中心城市的综合发展水平做出客观的评价。
以便客观而准确地衡量一个地区社会经济系统的发展水平。
2. 主成分分析原理和模型2.1 主成分分析原理主成分分析(Principal Components Analysis,PCA)也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量(指标)化为少数几个综合变量(综合指标),而这几个综合变量可以反映原来多个变量的大部分信息。
为了使这些综合变量所含的信息互不重叠,应要求它们之间互不相关。
例如在评价企业的经营业绩时,要考虑许多指标,如利润、产值、产品数量、产品质量、固定资产、流动资产等等。
若要全部列出,也许可以有几十个变量。
因此用少量的几个综合变量代替原来的许多变量是有实际意义的。
由这几个综合变量出发还有可能得到一个总的指标,按此总指标来排序、分类,问题就可能简单多了。
通常数学上的处理就是将原来N个指标作线性组合,作为新的综合指标。
最经典的做法就是用F1的方差来表达,即VarF1越大,表示F1包含的信息越多。
因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分如果第一主成分不足以代表原来N个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第N个主成分[3]。
2..2 主成分分析数学模型F1=A11ZX1+ A21ZX2+……+A n1ZX nF2=A12ZX1+ A22ZX2+……+A n2ZX n……F n=A1m ZX1+ A2m ZX2+……+A nm ZX n其中A1i ,A2i,A ni(i=1,2,3……m)为X的协方差阵∑的特征值多对应的特征向量,ZX1,ZX2,……ZX n,是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本文所采用的数据就存在量纲影响。
[注:本文指的数据标准化是指Z标准化]。
A=(a ij )n*m =(a1,a2,a m),Ra i=λi a i,R为相关系数矩阵,λi、a i是相应的特征值和单位特征向量,λ1≥λ2≥…≥λn≥0。
进行主成分分析主要步骤如下:1.根据研究问题选取指标与数据;2.进行指标数据标准化处理,以消除量纲不同的影响;3.求无量纲后的相关系数矩阵R,进行指标之间的相关性判定;4.求R的特征值、特征向量和贡献率;5.确定主成分的个数,本文按照特征值大于1以及和累积贡献率(即主成分解释的方差占总体方差的比例)大于85%的原则提取主成分因子;6.对主成分因子的经济意义作解释,一般由权重较大的几个指标的综合意义来确定;7.确定主成分F i表达式;8.计算各主成分和综合主成分值并进行评价与研究。
3. 指标体系的建立和选取地区综合实力反映了一个地区整体的经济实力和社会经济发展状况。
因此,应该全方位地从一个地区社会经济系统的各个领域去选择指标。
现也是多方而的。
本文在指标体系的建立上遵循了完备性、功能性、可比性和层次性原则。
选取了4个层次9个方面共26个指标以较为全而地反映各城市发展的实际情况。
(本文所用数据均来自2005年甘肃省统计年鉴)由于篇幅的原因原始数据在此未列出。
本文所选取的指标体系如表1所示:表1:指标体系44. 指标的主成分分析过程及结果本文运用著名统计分析软件SPSS12.0对上述26个指标进行计算处理。
首先对原始数据进行标准化处理,以消除观测量纲的差异及数量级的影响,使标准化后的变量均值为0方差为1然后运用SPSS12.0对标准化后的数据进行主成分分析,得到主成分的特征值和贡献率(表2)计算结果如下:表2:主成分的特征值和贡献率度。
在统计学中,一般认为主成分的累积贡献率达到85%即可保留有效信息[]从表2可以看出,本文选取的4个主成分的累积贡献率是88.297%,主成分F1、 F2、F3、 F4可以解释原始信息的能力分别是:58.894%、16.667%、8.002%、4.734%。
由表2可以看出4个主成分的累积贡献率为88.698% ,即保留了原始指标88.297%的信息,具有显著代表性。
主成分的载荷矩阵(正交旋转后的因子载荷矩阵)见表3,载荷系数代表各主成分解释指标变量方差的程度。
在主成分分析中,一般认为大于0. 3的载荷就是显著的,本文因为原始变量较多,所以选取大于0. 4的负载,使其能更好地解释原始变量。
由表2可知,第一主成分的方差贡献率最大,为58.894%,是最重要的影响因子。
由表3可知,第一主成分在国内生产总值、工业总产值、第三产业产值、财政收入、社会消费品零售总额、城乡居民存款额、各地区进出口商品总值、全社会固定资产投资、财政支出、各地区金融机构存款、邮电业务总量、公路货运量、各类专业技术人员、高中在校学生人数、公路客运量、每万人拥有公共汽车数、城镇低保人数、建筑业总产值等指标上载荷较大,该主成分既反映了社会、经济发展的总体状况,又反映了城市与国内外沟通的能力。
可以认为F1是社会、经济发展和对外开放因子。
第二主成分为16.667%,是次重要的影响因子。
该主成分在城镇人均可支配收入、农村居民人均纯收入、城市人口用自来水普及率、每千人口执业医师和执业助理医师指标上负载较大,可将F2定为社会实力因子,在分析时可针对具体指标逐个进行。
第三主成分为8.002% ,重要性与F2基本相当。
该主成分在农林牧副渔总产值、人均居住面积、城市人口用自来水普及率、公路客运量指标上载荷较大。
由于载荷最大的两项指标均代表居民的生活水平,可以认为是居民生活水平因子。
第四主成分方差贡献率为4.734%,在工业增加值率等上载荷较大,可以认为F4是经济发展速度因子。
表3:主成分负载矩阵SPSS已经计算出4个主成分的分值保存在FAC1_1~ FAC4_1种4个主成分的分值从不同的角度反映了中心城市综合发展水平其综合分值反映中心城市发展的总体水平。
以4个主成分对应的方差贡献率为权数计算综合分值:443214343213243212143211FF F F F λλλλλλλλλλλλλλλλλλλλ+++++++++++++++=运用上述公式计算各城市的综合分值F 如表4所示:表4:甘肃省各中心城市分值与排序5.结果分析从表4中的得分和排序情况看:在甘肃省的14个中心城市中综合实力最强的是兰州处于第一位。
兰州是甘肃省省会城市,是全省政治经济文化中心,近年来随着西部大开发的进行,甘肃省政府对城市社会经济的发展十分重视,不断发展经济科教事业,投资加强城市基础设施建设,人民生活水平不断提高使得城市综合实力不断加强,其综合实力排在全省第一位符合实际情况。
酒泉市,位于甘肃西北部,河西走廊西端。
酒泉是举世闻名的敦煌艺术的故乡,也是中国航天城的所在地。
国家每年都要投入大量资金建设航天城给当地的经济带来快速的发展;再加上酒泉钢铁工业的快速发展和敦煌市的莫高窟旅游业的发展。
因此,综合实力排名第二也是符合实际情况。
而临夏州和甘南州城市规模较小地处偏远山区是少数民族聚集的地区,交通不发达,因此经济基础比较薄弱故排名在后两位。
而位于中间的几个城市,在经济或者在环境方而都有这样或那样的不足,其综合实力也就不那么突出了。
6.结束语本文运用客观赋值法中的主成分分析方法对甘肃省14个中心城市的综合发展水平进行了测定,最终得出了个中心城市的综合排名。
研究发现,在我们选取的4个方面26个指标中,有14个指标对于评价城市综合发展水平具有决定性意义,这一发现的现实意义在于指出了提升一个城市综合发展水平的突破口与主攻方向。