(生产管理知识)生产函数估计与预测方法介绍

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

生产函数估计与预测方法介绍
一、生产函数的估计
1.含义
我们在《经济学》课程的学习中已经知道,产量是由生产要素的投入数量和组合关系决定的。

那么生产函数的估计实际就是客观反映生产量与各生产要素投入量之间的函数关系。

2.方法与步骤
估计生产函数最常用的方法是利用实际收集到的一组数据进行回归分析,这种方法较为客观,通过它得到的信息比较完全和精确。

为了完成回归分析,我们必须首先构造一个生产函数并确定函数的具体形式;然后再在收集数据的基础上用回归分析方法求出函数的具体参数值;最后,我们还需要检验回归结果对数据的拟合程度,以及回归分析的前提条件是否成立,因为一个没有显著函数关系或回归分析前提条件不成立的回归分析结果是没有意义的。

(1)影响变量的选取
就一个具体的回归分析而言,各个变量必须具有特定的含义。

在进行回归分析时,我们应该对于研究对象具有深入的了解,否则在函数构造这一步可能会漏掉一些很重要的解释变量。

在进行回归分析时应注意不要漏掉重要的解释变量,但这并不意味着解释变量越多越好,因为在模型中包括一些并不重要的解释变量反而会引起一些统计上的问题,一般来说,当解释变量超过5至6个时,就可能降低模型的自由度,甚至引起多重共线性问题,这些都会影响到模型的解释力。

对于一些属性因素,如年龄、季节、性别等,如不同的属性表现对被解释变量有明显不同的影响时,还需设计虚拟变量。

(2)生产函数形式的确定
上面所构造的生产函数只涉及了变量的选取,但为了完成回归分析,我们必须确定生产函数的具体形式。

生产函数可采用多元线性的,但一般最常用的是柯布—道格拉斯生产函数
2
211b b X AX Y =
(3)数据的收集
当模型的具体形式已经确定下来之后,我们需要针对模型中的变量收集样本数据。

数据类型包括时序数据和截面数据。

回归分析中也会碰到数据不足的情况,这时我们就不得不做一些理论上简化,
(4)建立回归方程及参数估计
1)一元线性回归模型
①总体回归模型
如果两个变量在总体上存在线性回归关系,可以用下式表示 ε++=bx a Y —随机误差
公式中a,b 是总体回归模型的参数,ε是X 变量以外其它所有影响因素对Y 值的总合影响,故称随机干扰项。

如果在一定时期内一些因素的单独影响都比较零散、微弱,就可以不把它们单独列为自变量,而合并为一个随机因素。

在一个模式中是否存在随机误差,体现了确定型依存关系和统计型依存关系的区别。

随机误差体现了在X 取既定值时Y 的变异。

②假定前提
a. ε是随机变量
对应于某个X 既定值,ε的符号和绝对值的大小是随机的,它既独立于X 的取值,也独立于前一项ε值。

b.ε服从正态分布
影响Y 的其它因素的作用趋于互相抵消,E (ε)=0,Y 的期望值落在总体回归线上,在给定X 值后,Y 值围绕Y 的期望值呈正态分布。

c.对于任何X 值,ε有恒定的方差2,x y σ(同方差性)。

无论X 取什么值,Y 值围绕总体回归线的变异程度相同。

③总体回归直线方程与样本回归直线方程
如果从总体回归函数,εβα++=x Y 中排除ε,就得到表示Y 值随X 取值而定的正态分布期望值与X 值关系的方程—总体回归直线方程bx a x y +=,μ
上式表明,在X 的值给定的条件下,Y 的期望值是X 的严密的线性函数。

x y ,μ称为Y 的条件平均数,对于一个双变量协变总体,当自变量X 取特定值时,因变
量取值服从如下 正态分布),(~2,,x y x y N Y σμ
根据样本数据拟合的直线,称为样本回归直线。

t
t x b a y ˆˆˆ+=,t=1,2,…… 式中Y 是样本回归线上与X 相对应的Y 值,可视为x y ,μ的估计,称为Y 的估
计值或拟合值,a
ˆ为截距,b ˆ为斜率,表示当X 变化1个单位时Y 的变化量,它们是总体回归系数a,b 的估计值。

实际观测到的变量Y 值,并不完全等于y
ˆ,如果用e 表示两者之差,它与总体误差项ε相对应
t t t y
Y e ˆ-= e 称为残差 由上述可知,样本回归直线是对总体回归直线的近似反映。

回归分析的主要
任务就是采用适当的方法,充分利用样本所提供的信息,使得样本回归直线尽可能地接近真实的总体回归直线。

④回归模型参数的估计
a.回归系统的估计
根据样本资料确定样本回归方程时,一般总希望Y 的估计值从整体来看尽可能接近实际观测值。

即残差t e 的总量越小越好,为了避免t e 简单的代数和会相互抵消,也便于数学上的处理,通常采用残差平方和2t e ∑作为衡量偏差的尺度。

最小二乘法就是根据这一思路,通过使残差平和和为最小来估计回归系数的一种方法。

222)ˆˆ()ˆ(t
t t t t x b a Y y Y e Q --∑=-∑=∑= 很明显,残差平方和Q 的大小将依赖于a
ˆ和b ˆ的取值。

根据微积分求极小值的原理,Q 对a
ˆ和b ˆ的偏导必须为零。

⎪⎩⎪⎨⎧∑=∑+∑∑=∑+t t t t t t Y X X b X a
Y X b a n 2ˆˆˆˆ 2)())((x x x x x x b i i i -∑--∑=⇒ 或 2
2)(ˆt t t t t t x x n Y X Y X n b ∑-∑∑∑-∑= X b Y a -= n
X b Y a t t ∑-∑=ˆ a
ˆ,b ˆ的具体数值即回归系数的估计值随选取的样本不同而不同,所以它是随机变量。

b.总体方差的估计
除了a ,b 之外 ,一元线性回归模型还包括了另一个未知参数,总体方差2,x y σ,
它可以反映理论模型误差的大小。

在数学上,2,x y σ的无偏估计是2,x y S 。

2)(222,--∑=-∑=∧
n y Y n e S x y n 为样本容量,x y S ,称为估计标准误差。

它可用于描述用样本数据拟合回归直线时,在X 取特定值时Y 观察值对于相应的拟合值的离散程序。

c.最小二乘估计量的性质
最小二乘法是估计方法中的一种,最小二乘估计量是总体回归系数的无偏估计量,数学上还可进一步证明,在所有的无偏估计量中回归系数的最小二乘估计量的方差最小;同时随着样本容量的增大,其方差会不断缩小,所以它又是最优和一致估计量。

2)多元线性回归模型
现实中,某一现象的变动常受多种现象变动的影响,右这种场合,仅仅考虑单个变量是不够的,这就产生了测定多因素之间相关关系的问题。

研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,它是一元线性回归模型的扩展,其基本原理与一元线性回归模型相类似,只是在计算上比较繁琐。

①总体回归函数与总体回归直线
t kt k t t t x x x εβββα+++++=Y Λ2211
kt k t x y x x ββαμ+++=Λ11.
α表示截距,j β表示在其它自变量保持不变的情况下,自变量j x 变动一个单位所引起的因变量Y 平均变动的数额,成为偏回归系数。

②前提假定
与一元线性前提假定相同,另外再加上,回归模型所包含的自变量之间不能具有较强的线性关系。

③样本回归方程
kt k t t x x Y ∧
++=ββαΛ11ˆˆˆ (t=1,2,……n) ④模型的估计
以三元线性回归方程为例,即t t t x x Y 2211ββα++=
a.回归系数的估计(最小二乘法)
2221122)ˆˆ()ˆ(t
t t t t t x x Y Y Y e MinQ ββ--∑=-∑=∑= ⎪⎩
⎪⎨⎧∑+∑+∑=∑∑+∑+∑=∑∑+∑+=∑22211222122111122112ˆˆˆˆˆˆˆˆˆx x x x Y X x x x x Y X x x n Y ββαββαββα b.总方差的估计
k
n e S t y -∑=2212.
n :样本容量,k :方程中回归系数的个数
22,n y S 称为回归估计的标准误差,越小表明样本回归方程的代表性越强
3
ˆˆˆ22112,-∑-∑-∑-∑=n Y x Y x Y Y S x y ββα 3)非线性回归模型
如果因变量和自变量之间是非线性关系,我们就必须采用非线性回归模型,但对非线性回归模型的估计必须首先将其转化为线性函数,然后再利用先行回归方法估计各参数。

非线性回归模型主要有以下几种:
①幂函数
2211b b x ax Y = 两边取对数,得:
2211ln ln ln ln x b x b a Y ++=
令:Y Y ln =' a A ln = 11
ln x x =', 22ln x x =' 221
x b x b A Y '+'+=' 这种形式就是前面的三元线性回归方程。

利用前文所述方法估计模型参数。

特点:方程中的参数可以直接反映因变量Y 对于某一个自变量的弹性。

Y x ax b Y X x ax b Y
X X Y Z b b b b x y /)(/)(2121112111211111=⋅⋅=⋅∂∂=-=1b 即,b 1是在其它因素不变的条件下,x 1变动1%所引起Y 变动的百分比。

②指数型:
2121x x b ab Y = 两边取对数,得:
2211ln ln ln ln b x b x a Y ++=
令Y Y ln =' a A ln = 11ln b B = 22ln b B =,则
2211x B x B A Y ++='
③多项式函数
32dx cx bx a Y +++=
令:x x =1 22x x = 33x x =
321dx cx bx a Y +++=
非线性回归方程转化为线性回归方程后,可利用前文所述方法,估计各参数,最后利用反函数转化为最初形式。

(5)回归模型的检验
1)经济学检验
经济学检验主要是检验参数估计值的符号和取值区间所显示的自变是与应变量的变化关系是否与理论和人们的实践经验相一致。

2)统计学检验
利用统计学中的抽样理论来检验样本回归方程的可靠性。

a.拟合程度的评价
所谓拟合程度,是指样本观测值聚在样本回归线周围的紧密程度,判断回归模型拟合程序优劣最常用的数量指标是可决系数,该指标是建立在对总离差平方和进行分解的基础上。

t
t t t t t e Y Y Y Y Y Y Y Y +-=-+-=-)ˆ()ˆ()ˆ()( 总离差=可解释离差+未解释离差
两边取平方,得
)ˆ)(ˆ(2)ˆ()(22t
t t t t Y Y Y Y e Y Y Y Y --∑+∑+-∑=-∑ 22)ˆ()ˆ(t
t Y Y Y Y -∑+-∑= SSE SSR SST +=
离差平方和=回归平方和+残差平方和
显而易见,如果各个样本观察点与样本回归直线靠得越紧,SSR 在SST 中所占比重超越大,因此可定义这一比例为可决系数。

222
)()ˆ(11Y Y Y Y SST SSE SST SSR r t t t -∑-∑-=-== 102≤≤r 可决系数越大,方程拟合度越高,在多元线形回归方程中,为了更准确地衡量回归方程的拟合程度,常使用经调整的多元可决系数。

22,2221)1/()ˆ()/()ˆ(1y
x y S S n Y Y k n Y Y R -=--∑--∑-= )1/())((222-∑-∑=n n Y Y S Y n 为样本容量,k 为模型中回归系数的个数。

b.显著性检验。

i. 回归系数的显著性检验
主要目的是为了检验与各回归系数对应的自变量对因变量的影响是否显著,以便对自变量的取舍作出正确判断,一般来说,当发现某个自变量的影响不显著时,应将其从模型中删除。

这样才能够做到以尽可能少的自变量去达到尽可能高的拟合优度。

回归系数的检验主要是对各自变量斜率的检验。

检验y 和X j 之间是否具备一定的线性回归关系就是判断总体斜率j β是否等于0,如果j β=0,则Y 对X j 的回归不成立。

因此关于j β假设检验将以j β=0的零假设出发,分为以下步骤:
(i )提出假设
0:0=j H β 零假设
0:1≠j H β 备择假设
显著水平05.0=α
(ii )检验统计量及概率分布
因为t Y 是服从正态分布,j
βˆ也服从正态分布 ),0(~ˆ2j N j ∧
βσβ 一般来说,2j ∧βσ是未知的,我们用其无偏估计量j
S βˆ来代替,当样本为小样本时,回归系数的估计值服从t (k n -)分布。

那么用t 检验统计量
j S t j
j ββˆ0ˆ-=
(iii )判断,查表得α.)(k n t -,其值由显著水平α和自由度k n -决定, 如果α.)(k n t t j -φ,则拒绝H 0,即认为X j 对Y 的影响是显著的。

如果α).(k n j t t -≤,则接受原假设, 即认为X j 对Y 的影响是不显著的。

ii. 回归方程的显著性检验
多元线性回归模型包括了多个回归系数,所以还需对整个回归方程模型进行显著性检验,以检验回归模型总体函数的线性关系是否显著,这主要是在方差分析基础上采取F 检验完成的。

(i )0:210===k H βββΛ
j H β:1不全为0
( iii )根据方差分析的结果求F 统计量,即
)
()1(k n SSE k SSR F --=~),1(k n n f -- ( iv )根据自由度和给定的显著性水平α,查F 分布表中的理论临界值αF ,当αF F φ,拒绝原假设,即认为总体回归函数中各自变量与因变量的线性回归关系显著。

反之认为所建立的回归模型没意义。

3)经济计量学检验
在回归分析之前,我们提出了一些回归型的假设前提,以便于使用最小二乘法拟合回归方程,并作出一系列的推断。

任何一条假设前提不符合都会使回归分析不尽合理,甚至误入歧途。

所以当我们拟合出回归方程后,需要回过头来审查一下这些假定前提是否成立。

如不成立,需作相应调整和改动。

i.自相关。

样本数据按时间顺序展开时,因变量随机误差独立性的前提往往不能成立,残值无法呈随机分布,而是在这些残值本身之间形成了某种链式效应(即自相关),样本中的因变量可能受过去变动趋势的影响。

如果自相关存在,那么就意味有一种有显著影响的因素一时序没有在回归模式的考虑之中,从而以使误差平方和SSE 不是最小值。

检验方法:按时间顺序给残差散点图或使用杠宾一沃岭检验(DW )
解决方法:增设滞后变量以改进模型,既然时序造成因变量值的前后链式影响,在回归模型中将前期因变量作为本期自变量值来对待。

ii. 异方差
对于在自变量取任何一组特定值时条件平均数的方差恒定的前提假设不成立,估计标准误差就无法作为x y ,σ的无偏估计量。

因而就无法进行参数的检验和
因变量的估计。

检验方法:绘制残值对自变量的散点图,看残值的离散度是否随自由度的变化而有规律的扩大与缩小,如是则有异方差。

解决方法:实施变量转换,即用一个与现行自变量有函数关系的自变量进入回归方程或采用加权最小二乘法。

iii. 非正态性
如果随机误差分布不是正态或趋于正态,就失去了对回归系数进行t检验和对因变量进行估计的依据。

绘制残值的直方图,通过直方图可以粗略地检验残值是否趋于正态分布,这种方法要求有一定大的样本容量,其它方法可采用拟合优度检验法。

解决方法:进行变量转换。

应有助于改变它的分布状况。

iv. 多重共线性
采用回归分析时,我们假设解释变量之间是线形无关的,如果这个假设被违背,就产生了多重共线问题,在实际应用多元回归分析时,多变共线性是难免产生的,问题在于程度的强弱。

较弱的多重共线性对回归模型的有效性影响不大,较强的会造成错误结论。

随着回归模式中自变量数目增减,回归系数的数值和符号都十分不稳定,例如,企业在进行生产分析时,将本企业的广告费和所有促销活动的费用同时作为产品生产量的解释变量,但广告费本身就是所有促销活动费用的一部分,两者高度相关。

审查方法:绘制自变量的两两散点图,判断是否线性相关;利用零级相关系数矩阵;当回归方程中自变量增加或减少时,某些偏回归系数符号发生变化,也提示存在多重共线。

消除方法:①消除线性相关程度较高的一对自变量中的一个;②对自变量实施中心离差的变量转换,即以原变量观察值对其平均数的离差作为新的样本数据拟合回归方程。

以上回归分析的内容都可通过计算机程序EXCEL完成,具体操作方法是:在分析之前,首先将自变量和因变量的样本数据输入表格中,如果回归模型是非线性的,应输入线性后的数据,然后再按下列步骤操作:
第1步:选择“工具”菜单的“数据分析”子菜单;
第2步:双击“回归”选项,弹出回归分析对话框;
第3步:对话框主要选项含义如下:
“Y值输入区域”:在此输入因变量数据区域,该区域必须由单列
数据组成;
“X值输入区域”:在此输入自变量数据区域,自变量个数最多为
16;
“输出选项”:在此输入输出表做左上角单元格的地址,用于控制
输出结果;
第4步:单击“确定”
二、最佳投入的预测
在给定各生产要素价格及投入成本的条件下,根据经济学理论确定各生产要
素的最佳投入水平。

相关文档
最新文档