我过农产品各地差异化的聚类分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国各地主要农产品产量差异化的聚类分析
1 引言
我国农产品产量的变化是一个受多种因素影响的复杂系统,但在发展过程中又表现出一定的规律性,可以被看做是一个按照地域变化的非常复杂的规律。
我们需要对所研究的区域进行产量区域划分,以便进行指导和研究。
因此,可以利用聚类分析的基本原理,对我国农产品产量规律进行研究
聚类分析方法属于高级统计的范畴,它是根据一批数据或者变量的诸多特征,按照关系的远近程度进行分类的。
通过选择合适的聚类变量,将每一个样本定义为多维空间的一个点,引用多维空间中点的距离概念定义不相似度。
点之间的聚类越小,表明两个样本之间的关系越紧密,相似特征越多,就越有可能分在同一类。
反之,两个样本属于不同的类别。
聚类分析是对统计样本进行定量分析的一种多元统计分析方法。
包括谱系聚类、动态聚类、有序聚类等方法。
系统聚类分析是一门多元统计分类法,对不同的要素划分类别往往反映不同目标的等级序列,能自然地、客观地得到一张完整的分类系统图。
本文利用系统聚类分析的方法,分析我国各地区主要农产品产量。
将30个地区聚为3类,并且分析各个类的特点,并提出合理的建议。
选用欧式距离来测度样本。
2 建立指标体系
2.1 确定分类指标。
进行产量区域划分要考虑诸多因素。
本文的指标包括粮食,棉花,油料,麻类,甘蔗,甜菜,烟叶,蚕茧,茶叶和水果。
2.2 填充指标数据。
参照《中国统计年鉴》有关数据,得到表 1指标
3 聚类分析
根据表 1数据,利用与统计软件spss对各个地区进行聚类分析,得到如下结果。
3.1 分析表
(1)聚类步骤 1-30 表示聚类的先后顺序。
(2)个案合并表示在某步中合并的个案,如第一步中个案 1北京和个案9上海合并,合并以后用第一项的个案号表示生成的新类。
(3)相似系数据聚类分析的基本原理,个案之间亲密程度即相似系数最接近于1 的,最先合并,因此该列中的系数与第一列的聚类步骤相对应,系数值从小到大排列。
(4)新类首次出现的步骤对应于各类步骤参与合并的两项中,如果有一个是新生成的类(即由两个或两个以上个案合并成的类),则对应列中显示出该新类在哪一步第一次生成。
如第26步中该栏第一列显示值为2,表示进行合并的两项中第一项是在第一步第二次生成的新类。
如果值为0,则表示对应项还是个案(不是新类)。
(5)新类下次出现步骤,表示对应步骤生成的新类将在第几步与其他个案或新类合并,如第一行的值是3表示第一步聚类生成的新类将在第3步与其他个案或新类合并
表 2
表 3
3.2 分析图
图1清晰地表示了聚类的全过程。
它将实际距离按比例调整到0-25 的范围内,用逐级连线的方式连结性质相近的个案或新类(本文中指各地区),直至并为一类。
在该图上部的距离标尺上根据需要选定一个划分类的距离值,然后垂直标尺划线,该垂线将与水平连线相交,则相交的交点数即为分类的类别数,相交水平连线所对应的个案聚成一类。
如下图 1:
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S
E 0 5 10 15 20
25
Label Num +---------+---------+---------+---------+---------+
北京 1 -+
上海 9 -+
天津 2 -+
西藏 26 -+
青海 29 -+
宁夏 30 -+
海南 21 -+
浙江 11 -+
福建 13 -+---+
重庆 22 -+ |
甘肃 28 -+ |
山西 4 -+ +-+
贵州 24 -+ | |
新疆 31 -+ | |
陕西 27 -+ | |
广东 19 -+---+ |
云南 25 -+ +-------------+
辽宁 6 -+ | |
江西 14 -+ | |
内蒙古 5 -+ | |
湖北 17 -+ | |
湖南 18 -+ | |
四川 23 -+-----+ +---------------------------+
江苏 10 -
+ | |
安徽 12 -
+ | |
吉林 7 -
+ | |
黑龙江 8 -
+ | |
河北 3 -
+ | |
山东 15 -+-------------------
+ |
河南 16 -
+ |
广西 20 -------------------------------------------------+
图1 聚类分析树状图
4 结论
我国各地区主要农产品产量区域划分表 4
从上表以及图形可以看出,第一类的广西农产品产量最高,是一个以农业为主的地区,可以以此为重点来发展经济。
第二类地区的产量稍逊于广西,但也是农业大省,可以大力展开农业科技来发展。
第三类地区农产量也是相对较高,这也地区的工业发展程度也相对较好,因此可以在两方面同时发展的时候,相对倾向于农业。
第四类地区农产品产量相对较低,可以偏向于发展工业与第三产业。
最后一类是以工业与第三产业为主的地区,可以在大力发展的基础上来发展农业。