基于多维标度法的农产品价格分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
市场分析
基于多维标度法的农产品价格分析
李 思1,常安定1,张梦倩1,王琳茹2
(1.长安大学理学院;2.西安市八一民族中学,陕西 西安 710064)摘 要:本文首先重点介绍了多维标度法的概念、思想以及步骤,其次,运用多维标度法对我国10个地区农产品生产者价格指数进行了处理并给出了合理的评价,最后,探讨了多维标度法的应用特点,为今后统计工作提供了参考。
关键词:多维标度法;拟合构图;产品价格
0 引言
在我们的生活中常常会遇到这样一个问题,假如我们给你若干城市的名字,你可以很容易在地图上测量出这些城市之间的相对距离。
反过来,假如我们知道了若干个城市之间的距离,我们是否可以推断出各个城市之间的相对位置。
本文所要介绍的多维标度法(Multidimensional Scaling)就是用来解决这样的问题的一种方法。
多维标度法是从心理测度学中发展而来,起初被应用于分析人类判断力的相似性,后经发展成为一种多元数据分析技术,应用于低维空间展示“距离”数据结构,简称为MDS。
通过拓展Richardson 和Klingberg等人在上世纪三十到四十年代的研究,Torgerson突破性地提出了多维标度法。
此后,Shepard 和Kruskal等人通过进一步深入研究,对多维标度法进行完善,形成了现在所使用的多维标度法。
多维标度法是一种用的数据分析方法,目前已被广泛应用到多个学科领域,被用来进行相关的数据分析。
1 多维标度法概述
1.1 多维标度法原理
(1)将研究对象对客体间的相似性评价进行搜集整理;(2)把相似性数据转换成距离数据,通常认为相似性数据与距离数据之间存在着单调关系,但不一定是简单的线性关系;(3)运用多维标度分析得到客体在心理空间中的相对位置坐标或图像;(4)通过心理空间的维度、客体在各个维度上的相对坐标来揭示事物之间的相互关系或影响,以确定引起心理活动的因素个数,对各个因素命名,或对客体进行分类整理。
1.2 多维标度法分类
多维标度过程分为非度量型多维标度过接和度量型多维标度过程。
非度量多维标度过程输入的数据是颇疗型的,度量型多维标度过程输入的数据是定距以上型,但两者输出的结果都是区间以上型。
影响多维标度过程选择的另一因素,涉及分析过程是在单一个体水平进行还是在集合水平进行。
空间图的解释能力、转折标准、统计方法及相关的知识常可帮助我们确定空间的维数,拟合度和紧缩值均可用来度量空间
团对数据的拟合程度。
1.3 多维标度法应用范围
在市场营销调研中,多维标度法的用途十分广泛。
被用于确定空间的级数(变量、指标),通过这些级数反映不同的产品或品牌在消费者心目中的认知程度,并由这些级数构建的空间中,找出在消费者心目中的关注品牌或者理想品牌的位置。
2 基本概念
多维标度法主要是将所研究事物之间的相互关系或影响用图示的方法直观地展现出来,也更有利于研究人员清晰地观察与分析。
距离阵:一个n*n阶D=(d ij)n×n满足条件:(1)D=D';(2)d ij≥0;i,j=1,2,…,n;则矩阵D为广义的距离阵;
d ij称为第i点到第j点间的距离。
欧式距离:一个n*n阶矩阵D=(d ij)n×n满足条件:(1)D=D';(2)d ij2=(x i-x j(x i-x j);i,j=1,2,…,n,则矩阵D为欧式距离。
相似系数阵:一个n*n阶矩阵C=(c ij)n×n满足条件:(1)C=C';(2)c ij≥c ij;i,j=1,2,…,n;则矩阵C为相似矩阵;c ij为第i点与第j点间的相似系数。
3 多维标度法的应用
国民经济的发展离不开农业,人民的物质生活离不开农民。
种植业、林业、畜牧业、渔业是我国的四大产业,因为地域差异,各地主营发展情况也各不相同,如何做到最好的发展,我们将通过多维标度法进行解释与分析。
例:2015中国统计年鉴公布了分地区农产品生产者价格指数,其中包括河北、山西、内蒙古等十个地区的种植业产品,林业产品、畜牧业产品和渔业产品。
价格如下表所示:
本文的计算过程运用MATLAB自编程序来实现的,具体步骤如下:
(1)将表1数据标准化后,求其距离阵D=(d ij),此处采用欧式距离,即
项目支持:陕西省科技计划项目,编号:2015JM1022。
市场分析
表一 部分地区农产品生产者价格指数
种植业林业畜牧业渔业河北106.883.0104.793.9
山西105.7116.1107.188.4
内蒙古102.291.4105.3101.1
辽宁100.374.9102.3102.2
吉林98.992.3105.0103.5
黑龙江100.281.2105.793.4
上海104.597.1101.9106.9
河南102.7103.1102.0110.8
陕西110.395.2101.9104.6
云南107.6109.998.198.2
式中x ik,x jk,表示品i和j的第k个变量值。
依据上式求得的距离阵D(该矩阵为一对称方阵):
(2)由矩阵D构造
(3)由A构造中内积阵B=(b ij)(由于b ij是将x i和x j中心化后的内积,故成B为中心化内积阵)
其中:
求得的矩阵B;
(4)用雅可比法求矩阵B的特征根λ1≥λ2≥…≥λm≥0和其对应的正交化特征向量X i;
将此特征向量规格化,即满足:x(i)' x(i)=λi,(i=1,2,…,m),那么这里x(i)就是多维标度法的经典解,也称拟合构图,即各样品点在多维空间中的坐标值。
多维标度法拟合构图的维数确定的方法有两种:一种是事先指定,但这种方法主观性较强,不一定能得到满意的结果;另一种方法是作图观察特征根的变化情况,以确定所需的维数,如图1
所:
由图1可示,当拟和构图的维数是二维时,其特征值的曲线形成转折,而二维以后,特征根很小且变化较平缓。
这是由于特征根越大,其中包含的信息量就越多,故此处选取二维构图就可以基本的反映部分地区农产品生产者价格指数的相互关系。
二维标度值,
即规格化的第1,2特征向量;根据1,2特征值可以作图,见图2(图2为各个城市居民素质分布)。
在图2中个样品点的位置以及相对亲疏程度可以显示出各种农产品的价格以及相互间的关系。
同时为明确第I,II维的含义,可以求出各指标在每一维上的因子负荷量;从图1可见,每一维上各个指标的因子负荷量的绝对值都非常接近,进而导致无法对它们的意义做出明确的解释判断,故可以对坐标轴进行正交旋转。
此处采用最大方差旋转,求得坐标轴旋转角度为44.82°,进而得到旋转后各维的因子负荷量;由于坐标轴经过旋转,故需要将原来的二维拟合构图乘以上述的正交变换阵:
即得到新的拟合构图表3,(坐标轴旋转后的拟合构图)。
从I维(横轴)来看,数值越大,表示农产品价格指数越高;从II维(纵轴)来看,数值越小,表示农产品价格指数越低。
故样品点越接近右下角,其所代表的是某地区比较适合发展该种产业;样品点越接近左上角,表示某地区可能因为某种因素,不适合该种产业的发展,从统计数据上可以看出:种植业在各组内样本之间的相似性较好,林业和渔业却有着较大差异,因为地理位置及气候的差异,所以才会出现此类现象,同时也说明了各地区应该合理利用自己独特的优势进行发展。
山西、河南、云南等地林业占了一定的优势。
4 小结
多维标度法是一种通过利用多个数据指标进行综合分析的数据评价方法,其具有直观性和定量性的特征,属于一种降维分析的数据统计算法。
多维标度法可应用于定量数据的分析研究,也可应用于定性数据的分析研究,本文中所采用的数据属于定量数据类型,给出的样品定量数据是进行操作和运算分析的基础。
假如提供的数据是定性的,则可以利用两个样本之间的匹配系数评估数据间的多维标度。
假如在一些情况下,无法对所要研究的对象的各类指标进行直接测量或者无法获得准确的测量值,仅仅获得各个样品之间的顺序差异,同样可以利用多维标度法进行分析,解决一些相关问题。
参考文献:
[1]Mar L.Davision. Multidimensional Scaling. New York,John Wlley & Sons,2010:1-10.
[2]张润楚:多元统计分析,科学出版社,2006,9.
[3]陈峰主编:多元统计分析方法,第2版,中国统计出版社,2007,50.[4]张强,钱建明.多维标度法评价人口素质,华西医科大学,2012,10(6):1-4.。