多元统计聚类分析论文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

多元统计分析论文—论科研经费与效益的关系

[摘要]研究多元统计分析的理论,利用主成分分析和聚类分析的方法对区域经济指标体系进行分析和综合,找出实质体的数量特征和内在统计规律性。通过实际的历史数据进行演算,证实与当时的客观实际情况相吻合,为决策部门衡量本地区的经济发展,制定科学决策提供了有利的支持。

[关键词]多元统计分析;主成分分析;聚类分析;因子分析;

Study on the theory of multivariate statistical analysis, using the methods of principal component analysis and cluster analysis on the index system of regional economy

For analysis and synthesis, to find out the essence of the number of features and the internal statistical regularity. Through the historical data of calculus, that is consistent with the actual circumstances, to measure the local area for the decision-making department of economic development, and provide beneficial support to make scientific decision.

1.引言

在日常生活中,我们常常遇到一些计算量大,分析工作复杂度高的数据分析工作,为了能够更加简便的进行数据分析,在此给大家介绍几种多元统计分析的方法。本文主要运用了聚类分析法,因子分析法,主成分分析法对科研经费与效益的关系进行统计分析。

2.分析方法

因子分析是多元分析中的一个主要内容,而多元分析主要讨论如何把一元正态总体的统计理论和方法推广到多元正态总体。多元正态总体的分布由两组参量,即均值向量μ和协方差矩阵(简称协差阵)∑所决定,记为N p(μ,∑)(p为分布的维数,故又称p维正态分布或p 维正态总体)。设X1,X2,…,X n为来自正态总体N p(μ,∑)样本,则μ和∑的无偏估计分别是

分别称之为样本均值向量和样本协差阵,它们是在各种多元分析问题中常用的统计量。样本相关阵R也是一个重要的统计量,它的元素为

其中υij为样本协差阵S的元素。S的分布是维夏特分布,它是一元统计中的Ⅹ2分布的推广。

另一典型问题是:假定两个多维正态分布协差阵相同,检验其均值向量是否相同。设样本X1,X2,…,X n抽自正态总体N p(μ1,∑),而Y1,Y2,…,Y m抽自N p(μ2,

∑),要检验假设H 0:μ1=μ2(见假设检验)。在一元统计中使用t统计量(见统计量)作检验;在多元分析中则用T2统计量,

,其中,

,T2的分布称为T2分布。这是H.霍特林在1936年提出来的。

而因子分析则是将影响科研经费的一组变量如经济效益、科研人员量、财政干预等舍为 y1 y2,……yp,取一新的变量y,则

y2,……yp)

将其分解为一些公共因子f与特殊因子s的线性组合,即有常矩阵A使у=Af+s。公共因子f 的客观内容有时是明确的,如在科研经费的研究中,根据各研究机构的科研成果来判断科研经费的投入效果以及它的一些影响因素等;有时则是不明确的。为了寻求易于解释的公共因子,往往对因子轴进行旋转,旋转的方法有正交旋转,斜旋转,极大变差旋转等。

从样本协差阵或相关阵求公共因子的方法有广义最小二乘法,最大似然法与不加权的最小二乘法等。通常在应用中,最方便的是直接利用主成分分析所得的头几个主成分,它们往往是对各个指标影响都比较大的公共因子。

本文研究的是科研经费与效益的关系。下面是一些运用软件分析得出的因子分析结果:

公因子方差

初始提取

经济效益 1.000 .987

成份矩阵a

成份

1

经济效益.987 科研人员数量.935 科研经费.962 提取方法 :主成分分析法。

a. 已提取了 1 个成份。

成份得分系数矩阵

成份

1

经济效益.344

科研人员数量.334

科研经费.339

提取方法 :主成分分析法。构成得分。

成份得分协方差矩阵

根据以上的软件的主成分分析结果可知,影响科研经费的主要因素是经济效益。

所谓科研经费是指国家用于发展科学技术事业而支出的费用,包括所有用于科学研究的经费。科研经费通常由政府、公司,以及某些基金会通过对申请报告的筛选来分配。大多数发达国家的科研经费通常占到国家GDP的1.5%到3%,瑞典是发达国家中这一比例超过4%的唯一一个国家。因此,国家的科研经费的多少主要建立在经济的各项发展程度上,经济效益越高,科研经费越富足,科研成果就越有分量。

根据国家统计局公布,2000年全国国内生产总值为8.9万多亿元,而2000年全国过大高校等投入的科研经费为1592.43亿元;2010年国内生产总值现价总量为401202亿元,比2000年增长312202亿元,2010年全国各大高校等的科研经费投入据不完全统计为7550.02亿元,比2000年增加5957.59亿元,是2000年科研经费投入的4.74倍

还多。根据以上数据可以得出,国家科研经费的投入是随着国家经济效益的增长而增长的。

经济是一个国家、企业以及其他各行各业的命脉,改革开放三十年来,我国的经济取得了飞跃性的发展,因此在各方面也的投入也相应的有所增长,尤其是教育和科研反面更是卓见成效,由于国家的大力投入,我国的科技国际竞争力由1995年的第二十八名提高到了如今的第三名,这些成绩的取得都是基于国家经济实力的大幅提高。我们虽然取得了一系列的成绩,但是,我们的科研支出中仍然存在一系列问题和不足。

我国科研支出依然严重不足,人均投入更低,占GDP的比例及财政支出的比例和销售收入的比例呈下降趋势,科技发展仍依赖财政支出的支持。相应地,我国整体科技实力及水平仍然不高,科技体系的整体创新能力不足,科技竞争力在国际间排名虽有提高,但关键指标仍处于中下水平。1998年,全国重大科技成果中,达到国内领先和国内先进水平的成果22435项,而达到国际先进水平以上的成果只有6149项,仅占27.4%,每个科研机构年均获得专利仅0.09项。1999年,我国工程师与科技人员/百万人才500人,而发达国家为1000—2000人/百万人。我国每年申请专利仅三万件,而发达国家则有几十万件。

其次,我国科技事业对经济增长贡献率低,仅为40%左右,发达国家则已达到60-80%。另外,对科技成果市场开发的投入不足,转化率极低。1998年,全国重大科技成果中应用技术成果为23015项中有4483项未被应用,占19.5%。其中,由于缺乏资金而未被应用的有1186项,占总成果的6.3%,占未被应用成果的26.4%。97%的科研机构的科技成果每年得到应用的仅10项。

再次,我国科技体制自身存在众多弊端,制约了科技进步对于经济、社会发展的作用,从而影响了科学技术事业支出发挥更大的效益。主要表现在:一、在科研项目的组织管理上,各类项目均采取课题制,对于一些面向应用的重大科研项目,往往缺乏系统组织、联合协作,各课题组各管一段,最终拼盘交账,这也是造成我国科研投入产出效益不高的主要原因。在科研评价上,评价高校、科研机构和科研人员往往以获得多少科研经费、发表论文的数量以及在哪儿发表等作为指标,直接导致高校和科研机构以及科研人员热衷于争项目、抢经费、发论文,而对于是否解决国民经济和社会发展的问题并不关心。二、当前科技人员普遍反映采用预算评审核定法的科研项目经费分配不公平不合理,项目经费审核、管理过于死板,不能适应科研活动的规律和特点。三、由于人员臃肿,从事非技术工作的管理人员过多,导

相关文档
最新文档