定量分析方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“数据整理和鉴别”是数据分析与预测 的前期工作,这个阶段的成果直接服务 于“数据分析与预测”
“数据分析与预测”是核心工作也是任 务最繁重的工作,这里将涉及到一系列 的定量分析方法和纷繁的数学计算,要 求较高,难度也是最大的。
数据收集
➢ 数据搜集
Байду номын сангаас
分析研究的性质及其研究方法,决定了分析研究必须以大量的、翔实的数据
求判定系数R2的方法
拟合度:RSQ()函数 回归分析报告 趋势线
2.1.3 多元线性回归
多元线性回归模型的一般形式
Y a0 a1X 1 a2X 2 ... ak X k
多元线性回归预测步骤
第一步,获得候选自变量和因变量的观测值。 第二步,从候选自变量中选择合适的自变量。有几种常用的方法:
式整理分为第一产业、第二产业、第三产业;内容整理再有可能对第一产业数据进一步分解, 比如按季度划分,分别统计报表,提炼增长趋势等观点。
1.4 数据分布的一般特征
集中趋势的测度
找出一组数据的中心或中间位置。相关概念:众数(频此出现最多的数,分单众数、复众数、无众数)、中位 数(排序了的顺序数据的中间那个数)、分位数(特殊的中位数)、平均数、加权平均数;
y 0 1x1 2x2 k xk
其中 ~ N 0, 2
0,1,2, ,k , 未知
则上式称为多重线性回归模型。
多重线性回归模型的矩阵形式
y1
记:Y
y
2
y
n
1 x11 x1k
X
1
x 21
x
2k
1
xn1
x
nk
1
2
n
1
e
2
n
则:有矩阵形式
Y X e (e ~ N(0, 2E ))
数据整理是属于数据的初加工,一般流程可用下图表示:
形式整理:将众多数据进行形式上的排序,不涉及数据具体内容,而是凭借某一外在依据进行 分门别类的处理。(外在依据:学科,使用方向,内容要点。)
内容整理:在形式整理得基础上进一步深化,从内容角度对数据再处理。 简单举例:国民经济数据,可能得到的一手资料就非常纷繁,那可能的一种整理方式,首先形
貌、所涉及的学科和领域、所需数据的内容范围和重点、主题和类属等进行认真的 分析,得以确切的认识,才能选择适当的搜集方式,顺利的开展数据调查活动。
数据整理与鉴别
经过数据搜集得到的数据通常是杂乱无章的,同时由于数据来源的广泛性、渠道的多样性,使 得其真实性和可靠性很难保证。这些数据还远远不能达到使用的要求,必须对其进行鉴别和整 理之后,才能在此基础上进行更深入的研究。
a. Y与Xk正线性相关
b. Y与Xk负线性相关
c. Y与Xk不相关
Y
Y
Y
Xk
Xk
Xk
2.1.1.1 最小二乘法
原理:因变量估计值与观测值之间均方误差极小 • (使残差平方和最小的方法)
MSE
1
n
n
(Yi'
i 1
Yi )2
1
n
n
(a
i 1
bX i
Yi )2
a M x bM y
在实际操作中,可以b通过Matilanb1或(者X Einxcel种M的x回)归(分Yi析工具M计y算)系数a和b
确定 的最小二乘法
考虑多元函数
n
Q yi 0 1xi1 k xik 2 i1
目标:确定 0 , 1, , k 使 Q 最小 方法: Q 0, i 1,2, ,k
i 解得: yˆ 0 1x1 2x2 k xk
——多重线性回归方程
有效性检验——方差分析法
线性回归方程 y 0 1x1 2x2 k xk 是否有统计意义,可检验假设
离散趋势的测度
极差(全距,衡量一组数据跨度的系数);平均差;方差和标准差;
两者需要结合来看:数据的离散程度越大,集中趋势的测度值对 该组数据的代表性就越差;离散程度越小,其代表性越好。以两 组数据为例:0、50、100;48,50,52
二、定量分析的一般方法
回归分析法 时间序列分析法
层次分析法 决策法
如:Y • 回归分析
• 规划求解 • 变量替换 • 添加趋势线
用回归方程进行预测
a b ln X
(注:在拟合曲线类型不能确定时,可选不同类型进行尝试,比较结果)
2.1.4.8 回归分析举例
某企业想了解公司某种产品的产量与收益 之间有何关系,为此收集整理了历年的产量收益数 据资料。试根据这些资料建立适当模型说明产量与收益之间的关系。
1 回归分析方法概述 2 一元线性回归分析 3 多元线性回归分析 4 一元非线性回归分析 5 多重线性回归 6 Excel的函数使用
2.1.1 回归分析方法概述
一种建立统计观测值之间的数学关系的方法
通过自变量的变化来解释因变量的变化,从而由自变量的取值预测因变量的可能值
自变量与因变量的相关关系
变量是相关的。 F 统计
如果F统计量的P值小于显著水平(或称置信度、置 信水平),则可认为方程的回归效果显著。
2.1.1.3 回归预测的步骤
第一步,获取自变量和因变量的观测值。 第二步,绘制XY散点图。 第三步,写出带未知参数的回归方程。 第四步,确定回归方程中参数值 第五步,判断回归方程的拟合优度。 第六步,进行预测
下面分别为直线拟合和对数拟合的结果,从结果中可以看出,对数拟合更合适
作线性回归拟合
做对数拟合
收益(Y) 收益(Y)
收益与产量线性拟合结果
50 45 40 35 30 25 20 15 10
5 0
0
y = 0.0196x - 2.0861 R2 = 0.8482
收益(Y) 收益估计值
500
1000
对于更复杂的情况,现在有很多拟合工具可以使用,如Origin、Matlab等
2.1.4.1 幂函数曲线拟合
设:Y aX b (U ln X、V ln Y) ln Y ln(aX b) ln a blnX (两边取对数) V ln a bU
Y
b>1
Y
a
b<1
a
b>-1
b<-1
O0
H0 : 1 2 k 0 是否成立
方法:方差分析法,将总离差平方和分解
n
n
n
ST (yi y )2 (yi yˆ)2 (yˆ y )2
i 1
i 1
i 1
SR SE
有效性检验——方差分析法
n
S R (yi yˆ)2 i 1
季度销售额(万元)
5.8 10.5 8.8 11.8 11.7 13.7 15.7 16.9 14.9 20.2
试根据这些数据建立回归模型。然后再进一步根据回归方程预测一个区 内大学生人数为1.6万的店铺的季度销售额。
2.1.2 一元线性回归
求回归系数a和b的方法
规划求解 斜率:SLOPE() 截距:INTERCEPT() LINEST()函数 回归分析报告 散点图添加趋势线
基本步骤:
搜集数据是后续所有工作的基础。 设定回归方程就是明确自变量和因变量关系的过程。因变量是果,是我们待预测的因素;自
变量是因,它的发展规律将影响因变量的趋势,选择什么自变量,要能够代表预测对象的发 展变化,特征参数的选择将直接影响到预测结果的准确性。 注意趋势的延续性。
2.1 回归分析法
• 最优子集法( R2最接近1) • 向前增选法等
第三步,确定回归系数,判断回归方程的拟合优度。 第四步,根据回归方程进行预测。
2.1.4 一元非线性回归
用一条曲线来拟合因变量对于自变量的依赖关系
通过变量替换把问题转化为一元或多元线性回归问题后,用线性回归分析 的方法建立回归模型,并进行预测(即化非线性回归为线性回归)
1500
2000
2500
产量(X)
收益与产量对数拟合结果
45 40 35 30 25 20 15 10
5 0 -5 0
收益(Y) 收益估计值
500
1000
1500
2000
2500
产量(X)
2.1.4.8 回归分析举例
残差 残差
产量X Residual Plot 10 5 0 -5 0 500 1000 1500 2000 2500 -10
定量分析方法
一、定量分析方法概述 二、定量分析的一般方法 三、定量分析方法使用
2
一、定量分析方法概述
1. 什么是定量分析方法 2. 定量分析方法的分类 3. 定量分析方法的一般程序 4. 数据分布的一般特征
1.1 什么是定量分析方法
早期的公共管理推荐经验科学的研究方法,把 观测、实验、对比、抽样、案例、访谈、调查 等方法,作为主要方法。
(Yi M y )2
i 1
(极小)
2.1.1.2 回归模型的检验
判定系数 R2 用来判断回归方程的拟合优度。 通常可以认为当R2大于0.9时,所得到的回归直线
拟合得较好,而当R2小于0.5时,所得到的回归直线很 难说明变量之间的依赖关系。 t 统计量
如果对于某个自变量,其t统计量的P值小于显著水 平(或称置信度、置信水平),则可认为该自变量与因
为基础才能获得成果。因此,数据搜集是对具体数据进行分析研究、对未来状况进
行预测的前提,也是决定整个分析研究能否得出正确的、有效地结论的关键。搜集
的数据越全、越充分,研究的基础就越牢固,结论就越准确、可靠。
➢ 数据搜集的一般程序
课题分析包括内容分析、地域分析和时域分析三方面,只有对课题研究的内容和概
20世纪40年代以后,开始引入运筹学,控制论, 系统工程、系统分析、损益分析,计算机模拟 等定量分析方法。
定量分析的定义:借助于经济学,数学,计算 机科学、统计学,概率论以及帮助决策的决策 理论来进行逻辑分析和推论。
1.2 定量分析方法的分类
回归分析法 时间序列分析法 层次分析法 决策法 优化方法 投入产出分析法
产量X
U=LN(X) Residual Plot
10
5
0
-5 6
6.5
7
7.5
8
-10
U=LN(X)
2.1.5 多重线性回归
在实际问题中,自变量的个数可能多于一个,随机变量 y与多个可控变量x1,x2,x3,…,xk之间是否存在相关关系, 则属于多重(元)回归问题。
多重线性回归模型
随机变量 y与 x1, x2 , , xk 之间的线性关系
1.3定量分析方法的一般程序
通常分析研究要经历选择课题、制定课 题计划、数据搜集、分析与预测、成果 应用及评价五个阶段,各个阶段的关系 已经具体每个阶段中需要做的工作可以 细分成如右图。
“制定课题计划”处理的好就能把握好 一个大方向,避免或少走弯路。
“数据搜集”是后期工作的立足点,数 据充分准确与否关系整个研究成果的可 信度。
Y
Y
O
X
(b> 0)
O
X
(b< 0)
2.1.4.4 双曲线函数拟合
设:Y
a
b
1
X
Y a bU
(U
1)
X
Y
Y
a
O
X
a
O
X
(b> 0)
(b< 0)
2.1.4.5二次多项式及三次多项式
Y a bX 1 cX 2 Y a bX 1 cX 2 dX 3
Y
Y
Y
O
X
(c> 0)
O
X
(c< 0)
优化分析方法
2.1 回归分析法
回归分析法:是运用数理统计方法从事务已知状态预测未来状况的一种定量研究方法。它的 基本功能是从涉及多因素相互交织的复杂现象中寻找规律,推断出有意义的结论。
回归分析法着眼于研究变量之间的互相关系,把其中一些因素作为控制的变量,而把另一些 随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的 分析
2.1.2 一元线性回归
【例5-1】 “阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客 户群是在校大学生。为了研究各店铺销售额与店铺附近地区大学生人数之间的关 系,随机抽取了十个分店的样本,得到的数据如下:
店铺编号
1 2 3 4 5 6 7 8 9 10
区内大学生数(万人)
0.2 0.6 0.8 0.8 1.2 1.6 2 2 2.2 2.6
O
X
2.1.4.6 S型(Logistic)曲线拟合
设:y
K 1 Ae x
y(1 Ae x ) K y yAe x
Ae x
K
y y
ln(K
y
y)
ln
A
x
2.1.4.7 回归分析的步骤
回归分析步骤
观察XY散点图,确定拟合曲线类型(对数曲线),写出带未知参数的回归方程
确定参数值,方法有:
1
X
O
1
X
(b> 0)
(b< 0)
2.1.4.2指数函数曲线拟合
设:Y aebX (V ln Y ) ln Y ln(aebX ) ln a bX V ln a bX
(两边取对数)
Y
Y
a
O
X
(b> 0)
a
O
X
(b< 0)
2.1.4.3 对数函数曲线拟合
设:Y a b ln X (U ln X ) Y a bU
相关文档
最新文档