第14章-受限被解释变量
第十八章-离散选择模型和受限因变量模型

第18章 离散选择模型和受限因变量模型 18.1概述在经典计量经济学模型中,被解释变量通常被假定为连续变量,但在现实的经济决策中经常面临许多选择问题。
在这样的决策问题中,或者选择问题中,人们必须对可供选择的方案作出选择。
通常被解释变量是连续的变量,但此时的因变量只取有限多个离散的值。
例如:人们对交通工具的选择,是选择坐轻轨、地铁还是公共汽车;某大型企业是否合并另一企业;对某一方案的建议持强烈反对、反对、中立、支持和强烈支持5种态度,可以分别用0,1,2,3和4表示。
以这样的选择结果作为被解释变量建立的计量经济学模型,称为离散被解释变量数据计量经济学模型(models with discrete dependent variables ),或称为离散选择模型(DCM ,discrete choice model )。
如果被解释变量只能有两种选择,称为二元选择模型(binary choice model );如果被解释变量有多种选择,称为多元选择模型(multiple choice model )。
20世纪70和80年代,离散选择模型普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。
在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得样本数据来自总体的一个子集,可能不能完全反映总体。
例如,小时工资、住房价格和名义利率都必须大于零。
这时需要建立的经济计量模型称为受限因变量模型(limited dependent variable model )。
这两类模型经常用于调查数据的分析中。
本章将讨论三类模型及其估计方法和软件操作。
一是定性(观测值为离散的或者表示排序);二是截取或者截断问题;三是观测值为整数值的计数模型。
18.2二元因变量模型在这个模型中,被解释变量只取两个值,可以是代表某件事发生与否的虚拟变量,也可以是两个决策中选一个,称为二元因变量模型。
例如:对样本个体是否就业的研究,个体的年龄、教育背景、种族、婚姻状况以及其他可观测的特征,作为解释变量,目的是研究个体这些特征对个体就业概率的研究。
第十八章-离散选择模型和受限因变量模型

第18章离散选择模型和受限因变量模型18.1概述在经典计量经济学模型中,被解释变量通常被假定为连续变量,但在现实的经济决策中经常面临许多选择问题。
在这样的决策问题中,或者选择问题中,人们必须对可供选择的方案作出选择。
通常被解释变量是连续的变量,但此时的因变量只取有限多个离散的值。
例如:人们对交通工具的选择,是选择坐轻轨、地铁还是公共汽车;某大型企业是否合并另一企业;对某一方案的建议持强烈反对、反对、中立、支持和强烈支持5种态度,可以分别用0,1,2,3和4表示。
以这样的选择结果作为被解释变量建立的计量经济学模型,称为离散被解释变量数据计量经济学模型(models with discrete dependent variables),或称为离散选择模型(DCM,discrete choice model)。
如果被解释变量只能有两种选择,称为二元选择模型(binary choice model);如果被解释变量有多种选择,称为多元选择模型(multiple choice model)。
20世纪70和80年代,离散选择模型普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领域的研究。
在实际中,还会经常遇到因变量受到某种限制的情况,这种情况下,取得样本数据来自总体的一个子集,可能不能完全反映总体。
例如,小时工资、住房价格和名义利率都必须大于零。
这时需要建立的经济计量模型称为受限因变量模型(limited dependent variable model)。
这两类模型经常用于调查数据的分析中。
本章将讨论三类模型及其估计方法和软件操作。
一是定性(观测值为离散的或者表示排序);二是截取或者截断问题;三是观测值为整数值的计数模型。
18.2二元因变量模型在这个模型中,被解释变量只取两个值,可以是代表某件事发生与否的虚拟变量,也可以是两个决策中选一个,称为二元因变量模型。
例如:对样本个体是否就业的研究,个体的年龄、教育背景、种族、婚姻状况以及其他可观测的特征,作为解释变量,目的是研究个体这些特征对个体就业概率的研究。
离散选择变量

二、线性概率模型
对于二元选择问题,可以建立如下计量经济模型。 1、线性概率模型的概念。 设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示
Yi 1 2 X i ui
其中 X i 为家庭的收入水平, Yi 为家庭购买住房的选择,即
1 Y 0 家庭已购买住房 家庭无购买住房
p (2) ln( ) 对 X i 为线性函数。 1 p p (3)当 ln( ) 为正的时候,意味着随着 X i 的增加,选择 1 的可能性也增 1 p p 选择 1 的可能性将减小。 ) 为负的时候, 随着 X i 的增加, 换言之, 大了。 当 ln( 1 p p ) 会变负并且在幅度上越来越大;当机会比由 1 当机会比由 1 变到 0 时, ln( 1 p p 变到无穷时, ln( ) 为正,并且也会越来越大。 1 p
际情况通常不符。例如购买住房,通常收入很高或很低,对于购买住房的可能性 都不会有太大的影响, 而当收入增加很快时, 对购买住房的影响将会很大。 显然, 购买住房的可能性与收入之间应该是一种非线性关系。
2、Logit 模型的含义。
综合上述讨论,我们所需要的是具有如下两个性质的模型: (1)随着 X i 的减小, pi 趋近 0 的速度会越来越慢;反过来随着 X i 的增大,
ˆ ,用人工的方法定义当 Y ˆ >1 时,取 Y ˆ =1;当 Y ˆ <0 时,取 Y ˆ =0。但要比较 求出 Y i i i i i
好地解决这类问题,只能考虑采用新的估计方法,这就是将要介绍的 Logit 模型 和 Probit 模型。
4
5
第二节 一、Logit 模型的产生
1、产生 Logit 模型的背景。
上述数学模型的经济学解释是,因为选择购买住房变量取值是 1,其概率是 p, 并且这时对应 p 的表示是一线性关系,因此,Y 在给定 X i 下的条件期望 E (Y X i ) 可解释为在给定 X i 下,事件(家庭购买住房)将发生的条件概率为 P (Yi 1 X i ) , 亦即家庭选择购买住房的概率是家庭收入的一个线性函数。 我们称这一关系式为 线性概率函数。 2、线性概率函数的估计。 对线性概率函数的估计存在以下困难: (1)随机误差项的非正态性表现。
计量经济学重点讲解

计量经济学重点讲解计量经济学重点第⼀章经济计量学的特征及研究范围1、经济计量学的定义(P1)(1)经济计量学是利⽤经济理论、数学、统计推断等⼯具对经济现象进⾏分析的⼀门社会科学;(2)经济计量学运⽤数理统计学分析经济数据,对构建于数理经济学基础之上的模型进⾏实证分析,并得出数值结果。
2、学习计量经济学的⽬的(计量经济学与其它学科的区别)(P1-P2)(1)计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对⼤多数经济理论给出经验解释,进⾏数值估计(2)计量经济学与数理经济学数理经济学:主要是⽤数学形式或⽅程(或模型)描述经济理论计量经济学:采⽤数理经济学家提出的数学模型,把这些数学模型转换成可以⽤于经验验证的形式(3)计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运⽤数据验证结论3、进⾏经济计量的分析步骤(P2-P3)(1)建⽴⼀个理论假说(2)收集数据(3)设定数学模型(4)设⽴统计或经济计量模型(5)估计经济计量模型参数(6)核查模型的适⽤性:模型设定检验(7)检验源⾃模型的假设(8)利⽤模型进⾏预测4、⽤于实证分析的三类数据(P3-P4)(1)时间序列数据:按时间跨度收集到的(定性数据、定量数据);(2)截⾯数据:⼀个或多个变量在某⼀时点上的数据集合;(3)合并数据:包括时间序列数据和截⾯数据。
(⼀类特殊的合并数据—⾯板数据(纵向数据、微观⾯板数据):同⼀个横截⾯单位的跨期调查数据)第⼆章线性回归的基本思想:双变量模型1、回归分析(P18)⽤于研究⼀个变量(称为被解释变量或应变量)与另⼀个或多个变量(称为解释变量或⾃变量)之间的关系2、回归分析的⽬的(P18-P19)(1)根据⾃变量的取值,估计应变量的均值;(2)检验(建⽴在经济理论基础上的)假设;(3)根据样本外⾃变量的取值,预测应变量的均值;(4)可同时进⾏上述各项分析。
第十章定性选择模型与受限因变量模型

尽管因变量在这个二元选择模型中只能取两个值:0或1,可是该学生的的拟合值或预测值为 0.8。我们将该拟合值解释为该生决定读研的概率的估计值。因此,该生决定读研的可能性或概率 的估计值为0.8。需要注意的是,这种概率不是我们能观测到的数字,能观测的是读研还是不读研 的决定。
对斜率系数的解释也不同了。在常规回归中,斜率系数代表的是其他解释变量不变的情况下, 该解释变量的单位变动引起的因变量的变动。而在线性概率模型中,斜率系数表示其他解释变量不 变的情况下,该解释变量的单位变动引起的因变量等于1的概率的变动。
对每个观测值,我们可根据(10.3)式计算因变量的拟合值或预测值。在常规OLS回归中,因变 量的拟合值或预测值的含义是,平均而言,我们可以预期的因变量的值。但在本例的情况下,这种 解释就不适用了。假设学生甲的平均分为3.5,家庭年收入为5万美元,Y的拟合值为
Y ˆ 0 .7 0 .4 3 .5 0 .0 0 2 5 0 0 .8
f( Y ix i;β ) [ G ( x iβ ) ] Y i[ 1 G ( x iβ ) ] 1 Y i,Y i 0 ,1 ln li( β ) Y iln [ G ( x iβ ) ] ( 1 Y i) ln [ 1 G ( x iβ ) ]
n
lnL(β) lnli(β) i1
0.13
Observations:30
ARRdejsu2=idst0ue.ad5l8Sum=Ro02f.5S3quares =3.15
F-statistic = 11.87
t-Statistic -2.65 3.25 3.08 0.02
p-Value 0.01 0.00 0.00 0.98
如表所示,INCOME的斜率估计值为正,且在1%的水平上显著。年龄和性别不变的情况下,收 入增加1000元,选择候选人甲的概率增加0.0098。
受限被解释变量数据模型

Model with Limited Dependent Variable ——Selective Samples Model 一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型
三、“归并”问题的计量经济学模型
一、经济生活中的受限被解释变量问题
cons
5759.210 4948.980 6023.560 8045.340 5666.540 5298.910 5400.240 5330.340 5540.610
incom
7041.87 6569.23 7643.57 8765.45 6806.35 6657.24 6745.32 6530.48 7173.54
二、“截断”问题的计量经济学模型
1、思路
• 如果一个单方程计量经济学模型,只能从“掐头” 或者“去尾”的连续区间随机抽取被解释变量的 样本观测值,那么很显然,抽取每一个样本观测 值的概率以及抽取一组样本观测值的联合概率, 与被解释变量的样本观测值不受限制的情况是不 同的。
• 如果能够知道在这种情况下抽取一组样本观测值 的联合概率函数,那么就可以通过该函数极大化 求得模型的参数估计量。
i 1
n
( yi X i ) 2
a X i ln1 i 1
n
yi X i i Xi n 2 ln L 2 ( yi X i ) i i 1 i 1 2 2 4 2 2 2 2
1、“截断”(truncation)问题
• 由于条件限制,样本不能随机抽取,即不能从全 部个体,而只能从一部分个体中随机抽取被解释 变量的样本观测值,而这部分个体的观测值都大 于或者小于某个确定值。 “掐头”或者“去尾”。
计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年

计量经济学_南京邮电大学中国大学mooc课后章节答案期末考试题库2023年1.如果解释变量中存在被解释变量的滞后项,那么检验是否存在自相关应当用答案:BG检验2.DW统计量值接近2时,随机误差项为()答案:无自相关3.如果回归模型中的随机误差项存在异方差,则模型参数的普通最小二乘估计量()答案:无偏但非有效4.在由n=30的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定系数为0.8500,则调整后的多重决定系数为()。
答案:0.83275.对于模型【图片】,如果在异方差检验中发现【图片】,则用加权最小二乘法估计模型参数时,权数应为()答案:6.若回归模型中的随机误差项存在异方差性,则估计模型参数应采用()答案:加权最小二乘法7.总体回归线是指答案:解释变量X取给定值时,被解释变量Y的条件均值或期望值的轨迹8.下列关于可决系数的陈述哪个是正确的。
答案:可决系数是指回归平方和(SSR)在总离差平方和(SST)中所占的比重9.在二元线性回归模型【图片】中,【图片】表示()。
答案:当X2不变时,X1每变动一个单位Y的平均变动。
10.在二元线性回归模型中,回归系数的显著性t检验的自由度为答案:n-311.面板模型中丢失若干观测值,可以说该面板数据是非平衡面板数据。
答案:错误12.面板数据模型有助于减少解释变量之间的共线性,得到更有效的估计量。
答案:正确13.面板数据模型可以解决样本量不足的问题,可以增加样本容量和自由度。
答案:正确14.固定效应模型和随机效应模型的选择性检验,通常采用的是答案:Hausman检验15.面板数据是指答案:不同时点上不同统计单位相同统计指标组成的数据16.当存在序列相关时,OLS估计量是有偏的并且也是无效的答案:错误17.两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的是不可以直接比较的。
答案:正确18.关于BG检验,下列说法正确的是答案:适用于解释变量中包含被解释变量滞后项的回归_适用于检验自相关性19.DW统计量值接近2时,随机误差项为( )答案:无自相关20.BP检验的结果可以帮助我们为加权最小二乘法寻找合适的权重答案:正确21.存在异方差情况下,普通最小二乘估计量依然是无偏和有效的。
chap受限被解释变量实用

• (2)两步法的heckman回归
• 当数据集比较大时,极大似然估计非常耗时,两步法就 提供了一种很好的替代。键入命令:
• heckman wage educ age, select(married children educ age) twostep mills(m)
• 其中,选项twostep表明使用两步法的heckman回归。 选项mills()会生成一个新变量,计算出各样本的逆米 尔斯比率,即样本不被选择的可能性。我们这里给该变 量命名为m。
• 利用这些数据,我们会讲解样本选择问题的heckman 回归的操作以及相关的预测。
第21页/共32页
• 实验操作指导
• 1 heckman回归的操作
第22页/共32页
• 下面,我们利用“fwage.dta”的数据进行样本选择模 型的回归分析。我们认为,妇女的工资是教育程度和年 龄的函数,而妇女是否选择工作的影响因素是其保留工 资(受婚姻状况、家中儿童数量影响)以及雇主提供的 工资(受教育程度和年龄的影响)。
该回归的结果;第二步是对参加工作的妇女的期望工资的预测, 且将新变量命名为yc;第三步获得wage非缺失值的观测值的 wage和yc的描述统计量。
第28页/共32页
• 如果我们想知道所有妇女的期望工资,参加工作, 如果预期不参加,则其期望工资为0。
以将其看做观测值处于均值水平下的标准误。预测的标准误(stdf)也被称作 the standard error of the future or forecast value,指的是每个观测值 的点预测的标准误。根据两种标准误的计算公式可知,stdf预测的标准误总是 比stdp预测的要大。 我们对上面的断尾回归进行默认预测以及stdp和stdf的预测,采用如下命令: predict y predict p, stdp predict f, stdf list whrs y p f in 1/10 其中,第一步为默认预测,并将预测值命名为y;第二步预测的是拟合的标准误, 并将预测值命名为p;第三步预测的是预测的标准误,并将其命名为f;最后一 步列出原序列值whrs和各预测值的前10个观测值。
第八章 (1) 离散和受限被解释变量模型

SC -2 -2 -2 -2 -2 -2 -2 -1 0 -2 -1 0 -2 0 -1 1 1 1 -1 -1 1 1 1 1 -1 0
JGF 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.9979 0.0000 0.0000 1.0000 0.0000 0.0000 0.0000 0.9998 0.9999 1.0000 0.4472 0.0000 0.0000 1.0000 1.0000 0.9999 0.0000 0.0000
• 对于两个方案的选择。例如,两种出行方式的选 择,两种商品的选择。由决策者的属性和备选方 案的属性共同决定。
二、二元离散选择模型
1、原始模型
• 对于二元选择问题,可以建立如下计量经济学模 型。其中Y为观测值为1和0的决策被解释变量;X 为解释变量,包括选择对象所具有的属性和选择 主体所具有的属性。
2、重复观测值不可以得到情况下二元Probit 离散选择模型的参数估计
ln L
fi fi Xi Xi 1 Fi F y 0 y 1 i
i
i
q i f (q i X i ) Xi F (q i X i ) i 1
n i 1
n
n
• 在样本数据的支持下,如果知道概率分布函数 和概率密度函数,求解该方程组,可以得到模 型参数估计量。
三、二元Probit离散选择模型及其参数 估计
1、标准正态分布的概率分布函数
F (t )
t
(2 )
12
exp( x 2 2)dx
f ( x) (2 )
第14章-受限被解释变量

假设个体进入样本的“选择机制”(selection mechanism)为“选 择变量 z 大于某常数 c” 。 比如,在妇女劳动力供给例子中, z w o w r ,而 c 0 。 断尾后的联合分布:
对于模型 yi xi i , i | xi ~ N (0, 2 ) ,则 yi | xi ~ N ( xi , 2 ) ,故
E( yi | yi c) xi (c xi )
如 果 用 OLS 估 计 yi xi i , 则 遗 漏 了 非 线 性 项 (c xi ) ,与 xi 相关,导致 OLS 不一致。
12
例 妇女劳动力供给模型:
劳动时间方程
o r
hours 0 1 wage 2 children 3 marriage u
工资方程 w w 0 1 age 2 education 3 children 0 location v
zi* wi ui zi* 为不可观测的潜变量。
16
假设 ui 服从正态分布,则 zi 为 Probit 模型,故 P( zi 1| wi ) ( wi ) 。 可观测样本的条件期望:
E( yi | yi 可观测) E( yi | zi* 0) E( xi i | wi ui 0) E( xi i | ui wi ) xi E( i | ui wi ) xi ( wi )
E( y | z c) y y ( z c) z
假设回归模型为 yi xi i 。
财税计量方法与应用_中南财经政法大学中国大学mooc课后章节答案期末考试题库2023年

财税计量方法与应用_中南财经政法大学中国大学mooc课后章节答案期末考试题库2023年1.如果模型中多增加了无关变量,这样造成的后果是:答案:OLS仍然是一致估计量2.如果不确定是否要在现有线性模型新增一个解释变量,那么可以做:答案:多重共线性检验3.财税计量模型的设定,最先应该做的是:答案:数据清洗和整理,检查数据输入的错漏问题4.使用解释变量做拉姆齐检验的命令是在Stata做完回归以后,使用estatovtest, rhs,它为模型设定提供了具体的遗漏了哪些高阶项的信息。
答案:错误5.单变量平稳时间序列的自回归分布滞后模型,转化成误差修正模型时,误差修正效应的系数是:答案:自回归系数之和减去16.假设非平稳变量为x,y,z,使用MLE估计VECM模型的Stata命令为:vec xy z, lags(#) rank(#) trend(none) trend(trend) sindicators(varlist)其中,lags(#)中填入滞后阶数,rank(#)填入协整秩的阶数,trend(none)trend(trend)至多出现一个,sindicators(varlist)表示加入季节虚拟变量。
答案:正确7.以下关于面板数据模型设定说法不正确的是:答案:面板数据模型如果包含截距项,那么对应的截面虚拟变量数,最大可以是截面的个数N8.无论个体效应是否与解释变量相关,动态面板数据的固定效应模型都是一致估计量。
答案:错误9.什么情况下可以使用两阶段最小二乘法,选择最好的答案:答案:阶条件恰好识别或过度识别都可以10.二值选择模型,群组数据能够使用WLS估计,但个体数据只能使用ML估计,主要原因是:答案:群组数据可以重复观测,以频率值替代概率值;个体数据只能观测一次11.归并数据模型在数据上区别于断尾数据模型的特征,使得归并数据模型建立的似然函数特征是:答案:同时包含了归并点位置的离散概率和归并点以上(或以下)数据的连续概率密度12.二值选择的核心思想是对选择概率进行建模。
离散被解释变量与受限被解释变量课件

1.断尾回归
理论: 由于被解释变量某些值取不到,故存在断尾,导致概率密 度函数和期望等都发生变化……仍用极大似然函数进行估 计。 操作:P213中 案例分析:以数据集laborsub.dta为例,估计一个决定妇女 劳动时间的模型。 1、先看一下lfp的分布 use laborsub.dta,clear tab lfp
内容页 若该值很大,为正,则用零膨胀;很小,为负,则用标准。 (设计好之后可以删掉这个文本框哦) 命令:p205中(零膨胀泊松、零膨胀负二项) 2、案例 被解释变量的分布 use CRIME1.dta,clear tab narr86 OLS回归 reg narr86 pcnv avgsen tottime ptime86 qemp86 inc86 black hispan born60,r 泊松回归 poisson narr86 pcnv avgsen tottime ptime86 qemp86 inc86 black hispan born60,r nolog 计算泊松的边际效应:mfx
(2) 进行ordered Logit估计: (设计好之后可以删掉这个文本框哦) ologit rating83c ia83 dia,nolog 预测、列出结果: predict r2 r3 r4 r5 (option pr assumed;predicted probabilties) list r2 r3 r4 r5 in 1/1
内容页
(设计好之后可以删掉这个文本框哦)
二值选择模型的微观基础
1、潜变量:不可观测。 2、随机效用法:由于存在很多决定效用的未知因素以及未 来的不确定性,So效用方程中包含一个扰动项,故曰”随 机' 3、比较:二者都可依据累积分布函数的分布形式不同各自 采取Probit或logit模型;但随机效用法比较容易推广到多值 选择的情形。
第14章-受限被解释变量

© 陈强,《高级计量经济学及Stata 应用》课件,第二版,2014年,高等教育出版社。
第14章 受限被解释变量被解释变量的取值范围有时受限制,称为“受限被解释变量”(Limited Dependent Variable)。
14.1 断 尾 回 归对线性模型i i i y ε'=+x β,假设只有满足i y c ≥的数据才能观测到。
例:i y 为所有企业的销售收入,而统计局只收集规模以上企业2数据,比如100,000i y ≥。
被解释变量在100,000处存在“左边断尾”。
断尾随机变量的概率分布随机变量y 断尾后,其概率密度随之变化。
记y 的概率密度为()f y ,在c 处左边断尾后的条件密度函数为(),P()(|)0,若若f y y c y c f y y c y c ⎧>⎪>>=⎨⎪≤⎩由于概率密度曲线下面积为1,故断尾变量的密度函数乘以因子1P()y c >。
3图14.1 断尾的效果4断尾分布的期望也发生变化。
以左边断尾为例。
对于最简单情形,~(0,1)y N ,可证明(参见附录)()E(|)1()c y y c c φ>=-Φ对于任意实数c ,定义“反米尔斯比率”(Inverse Mill ’s Ratio ,简记IMR)为()()1()c c c φλ≡-Φ则E(|)()y y c c λ>=。
5图14.2 反米尔斯比率6对于正态分布2~(,)y N μσ,定义~(0,1)y z N μσ-≡,则y z μσ=+。
故[]E(|)E(|)E ()E ()()y y c z z c z z c z z c c μσμσμσμσμσμσμσλμσ⎡⎤>=++>=+>-⎣⎦⎡⎤=+>-=+⋅-⎣⎦对于模型i i i y ε'=+x β,2|~(0,)i i N εσx ,则2|~(,)i i i y N σ'x x β,故[]E(|)()i i i i y y c c σλσ''>=+⋅-x x ββ如果用OLS 估计i i iy ε'=+x β,则遗漏了非线性项[]()i c σλσ'⋅-x β,与i x 相关,导致OLS 不一致。
第十四章 eviews软件学习 其他回归方法

第十四章其他回归方法本章讨论加权最小二乘估计,异方差性和自相关一致协方差估计,两阶段最小二乘估计(TSLS),非线性最小二乘估计和广义矩估计(GMM)。
这里的大多数方法在“联立方程系统”一章中也适用。
线性回归模型的基本假设iki k i i t u x x x y +++++=ββββ 22110i = 1 , 2 , … , n在普通最小二乘法中,为保证参数估计量具有良好的性质,通常对模型提出若干基本假设:1.解释变量之间互不相关;2.随机误差项具有0均值和同方差。
即0)(=iu E 2)(σ=iu Var i = 1 , 2 , … , n 即随机误差项的方差是与观测时点t 无关的常数;3.不同时点的随机误差项互不相关(序列不相关),即0),(=-s i i u u Cov 4.随机误差项与解释变量之间互不相关。
即),(=i ji u x Cov 5.随机误差项服从0均值、同方差的正态分布。
即i u ~),0(2σN 当随机误差项满足假定1 ~ 4时,将回归模型称为“标准回归模型”,当随机j = 1 , 2 , … , k , i = 1 , 2 , … , n i = 1 , 2 , … , n s ≠ 0, i = 1 , 2 , … , n古典线性回归模型的一个重要假设是总体回归方程的随机扰动项同方差,即他们具有相同的方差。
如果随机扰动项的方差随观测值不同而异,即的方差为,就是异方差。
用符号表示异方差为。
异方差性在许多应用中都存在,但主要出现在截面数据分析中。
例如我们调查不同规模公司的利润,会发现大公司的利润变化幅度要比小公司的利润变化幅度大,即大公司利润的方差比小公司利润的方差大。
利润方差的大小取决于公司的规模、产业特点、研究开发支出多少等因素。
又如在分析家庭支出模式时,我们会发现高收入家庭通常比低收入家庭对某些商品的支出有更大的方差。
i u 2σ2i σ22)(i i u E σ=i u §14.1 加权最小二乘估计变量可支配收入交通和通讯支出变量可支配收入交通和通讯支出地区IN CUM地区IN CUM甘肃山西宁夏吉林河南陕西青海江西黑龙江内蒙古贵州辽宁安徽湖北海南4009.614098.734112.414206.644219.424220.244240.134251.424268.504353.024565.394617.244770.474826.364852.87159.60137.11231.51172.65193.65191.76197.04176.39185.78206.91227.21201.87237.16214.37265.98新疆河北四川山东广西湖南重庆江苏云南福建天津浙江北京上海广东5000.795084.645127.085380.085412.245434.265466.576017.856042.786485.637110.547836.768471.988773.108839.68212.30270.09212.46255.53252.37255.79337.83255.65266.48346.75258.56388.79369.54384.49640.56表1 中国1998年各地区城镇居民平均每人全年家庭可支配收入及交通和通讯支出单位:元使用加权最小二乘法估计方程,首先到主菜单中选Quick/ Estimate Equation … , 然后选择LS-Least Squares(NLS and ARMA)。
计量经济学前沿第七讲限制因变量模型与估计evmi

Pr(Y | P / Irartio,black) 0.091 0.559P / Iratio 0.177black
(0.029) (0.089)
(0.025)
Pr( y | P / I ratio,black) (2.26 2.74P / I ratio 0.71black)
(0.16) (0.44)
二值响应的 Probit 和 Logit 模型
▪ 二值响应的 Probit 和 Logit 模型的大多数应用中,主要目 的是为了解释 x 对响应概率的影响,通过 G(z) 将各解释 变量与相应概率联系起来。
Pr( y 1| X ) G(0 1X i1 2 X i2 ) G(zi ) (3)
▪ 方程(4)(5)关于解释变量和参数都是非线性的,应用 最大似然估计法 MLE(Maximun Likelihood Estimation) 估计参数。
17
Copyright © 2003 Prentice-Hall, Inc.
Probit 模型的估计
估计方法:
1. MLE 最大似然估计
2. 利用分组数据求得 的估计值 ,用传统的
Probit 和 Logit 模型的估计
▪ 给定解释变量和二元因变量的观察值
▪ Probit 模型估计
0 1X i1 2 X i 2
▪
Pr( y
Logit
1| X ) (
模型估计
0
1
X
i1
2
X
i2
)
(t )dt
(4)
Pr( y
1|
X
)
G(zi )
1
1 e( 0 1Xi1 2 Xi 2 )
(5)
住房价格,对已购房者p > 0,对未购房者p = 0
2011管理统计-二元选择模型和受限因变量

第20页,共28页。
(2)下截取(左截取)
定义类似于上截取模型。一个特殊的下截取模 型,TOBIT模型
yi
0
yi*
if if
yi* 0 yi* 0
例1,研究人们在一个月中酒方面的花费就是一个例子。有相当多的人在酒方面的 花费为零。我们不是简单的将这些观测从样本中去掉,而是建立Tobit模型。
如果Y*大于某值(如C),我们只能观察到 y=c.
第19页,共28页。
考虑潜变量模型
yi* xiβ ui
被观察数据y与潜变量 的关系 yi*
yi
yi* c
if yi* c if yi* c
即:y min( y*, c)
例如,在电影或者球赛的门票销售中,由于受到场地的限制, 门票的需求量超过了座位数C时,我们只能观察到Y=C。
L为无约束似然值,L0为参数为0约束下的似然值。
概率的正确预测率
检查Y=1或0的概率的正确性,判断拟合的好坏
预测值与真实值的相关系数
相关系数高,表明拟合越好
第14页,共28页。
4、模型的选择
直接比较三种概率模型的系数是没有意义的
线性概率模型可用于问题的初步分析 Logit模型,系数含义可以通过机会比得以解释
。
Y的期望
E(Y | Y 0) (x' ) x' (x' ) (x' )[x' (x' )]
第27页,共28页。
可以得到:
E(Yi | xi ) ( xi' )
xi
第28页,共28页。
第4页,共28页。
二、线性概率模型
1、线性概率模型: 例如,研究居民的收入和是否购买住房的关系
政府补助与涉农类企业创新投资——基于融资约束视角

[收稿日期]2023-09-11[基金项目]安徽省高校哲学社会科学研究项目 企业数字化转型的财务风险与防范机制研究(2022AH051603);安徽省高校哲学社会科学研究项目 安徽推进制造业数字化转型的政策效应与路径优化研究 (2023AH040271)㊂[作者简介]王闽(1976 ),男,安徽科技学院财经学院教授㊂胡伟(1987 ),男,安徽科技学院管理学院硕士研究生㊂2024年第1期总第126期北京化工大学学报(社会科学版)Journal of Beijing University of Chemical Technology(Social Sciences Edition)No.1.2024Total No.126政府补助与涉农类企业创新投资基于融资约束视角王闽1㊀胡伟2(1.安徽科技学院财经学院;2.安徽科技学院管理学院,安徽蚌埠233030)㊀㊀[摘㊀要]以A 股涉农上市公司2015 2021年数据为样本,探讨政府补助对涉农企业创新投资的影响效应,并探究融资约束的调节作用㊂结果表明,研究期间我国政府补助对涉农企业创新投资产生显著的正向激励效应,而融资约束对涉农企业创新投资产生抑制效应㊂检验融资约束与政府补助交互作用对创新投资的影响时发现,融资约束对政府补助正向激励涉农企业创新投资存在反向抑制效应㊂以上效应在经济上行期㊁非国有产权性质㊁中小规模涉农企业中表现尤为明显㊂㊀㊀[关键词]政府补助;涉农企业;融资约束;创新投资;调节效应㊀㊀[中图分类号]F324F812.45[文献标识码]A [文章编号]1671-6639(2024)01-0029-13一㊁引言㊀㊀创新是当前我国经济结构转型升级的关键,是驱动农业经济高质量发展的第一动力㊂作为一种准公共物品的生产活动,涉农企业创新投资面临棘手的外部性难题,即社会收益高于私人收益,以致私人投资意愿低迷㊂加之农业生产活动具有天然的 弱质性 特征使得研发创新遭遇自然和市场双重风险,严重抑制了农业企业创新㊂因此,政府积极运用产业政策内化外在性,通过给予企业补助的方式纠正创新投资不足引致的市场失灵,其补助政策激励机制意在鼓励企业增加创新投资[1][2],完善市场机制,产生知识溢出和技术扩散,创造社会价值和提升整体社会福利[3][4]㊂市场机制与科技进步是中国式农业现代化的核心驱动力[5],作为推动农业创新投资的重要微观市场主体,涉农企业的发展壮大对于中国式农业现代化的深入发展具有重要的示范引领作用㊂OECD 官方报告显示创新对一国经济贡献度高达50%[6],因此,创新投资有助于提升农业技术进步贡献率,突破 大国小农 和 小生产大市场 的现实制约,在提质增效的同时实现规模化经营和产出提高,促进农业经济稳定持续发展和巩固农业的基础性地位,着力增强我国经济长远发展的韧性㊂然而,现有部分研究提出了与政府补助初衷相悖的观点,认为政府补助对企业创新投资无显著影响[7][8],政府补助甚至替代或挤出企业本身自有研发资金[9][10],致使产业政策质疑之声泛起,尤其是在政府补助体量和规模不断扩大的今天,政策工具的实施效果备受关注㊂那么,在创新驱动农业高质量发展的当下情境中,政府补助对涉农企业创新投资的作用效果如何,受到哪些因素92北京化工大学学报(社会科学版)2024年第1期的主导和影响,以及如何更好地发挥政府补助优化涉农企业创新投资的作用,即在发挥政府补助正向激励企业创新投资的同时,使得企业能够更好地汲取外部创新资源实现企业最优的创新投资规模,这是关乎创新驱动农业高质量发展的关键问题,也是本文关注的核心问题㊂值得注意的是,涉农企业创新投资除了受到创新活动本身的负外部性抑制之外,创新资金的 瓶颈 问题也是制约企业创新的重要因素㊂尤其是我国涉农类相关金融市场存在不完全性,固有的信贷歧视使得涉农企业外源融资出现高溢价成本以及由此产生的资源低效配置双重扭曲现象㊂信贷市场即使有国家提供的政策性优惠资源,也会因 所有权歧视 及 规模歧视 现象而出现信贷配给,使得信贷资源通过非利率的方式流向国企和大规模非农企业,导致资源错配,进一步收紧创新资金 瓶颈 ㊂然而,当前研究主要是在探讨政府补助与企业研发投入之间的关系,如有学者研究发现政府补助促进研发投入[11];也有学者研究表明政府补助存在挤出效应;还有学者研究认为政府补助与研发投入存在非线性关系,以及不同的政府补助规模产生不同的作用效果[12],从而忽视了融资约束这一重要变量㊂事实上,政府给予企业补助本质上是为了弥补企业创新的外部性损失,促进企业加大研发力度以满足有效需求,以及发挥 杠杆效应 撬动社会资源服务于企业创新,其本质在于缓解融资约束㊂就涉农企业而言,创新投资本质上是研发投入问题,高风险㊁收益不确定以及研发过程不可分割等特性是其内在属性,这无疑将考验企业创新资源的可持续和稳定供给能力㊂因此,问题的关键在于,政府补助的激励机制是否能够促进企业增加研发投资,是否能够撬动外部创新资源服务于企业研发创新,尤其是在面临融资约束的情况下,融资约束与政府补助激励机制的关系究竟如何,这是本文尝试探究的问题㊂二、理论分析与研究假设㊀㊀研究表明,政府补助政策的激励效应之所以能够发生作用,其内在动因主要包括:(1)资金补充效应㊂政府补助通过资金注入的方式增强了企业内源融资能力[13],既为企业研发创新提供了直接的资金来源,也降低了企业自主研发的活动成本[14],同时也增强了企业从事研发创新活动的内在意愿㊂(2)纠正非政府失败㊂创新投资提供的是准公共物品,具有正向溢出效应,而市场机制的不健全和市场体系的不完善易于诱发非独占性的外部效应,致使私人投资不足,严重抑制研发创新,而政府补助在弥补市场的负外部性方面具有激励作用㊂(3)信号认证效应㊂政府倾向于补助那些拥有创新投资潜力的企业,这向外部投资者传递出企业保有政府信用背书的认证信号和企业值得投资的利好信息,进而有利于企业拓展融资渠道,缓解融资约束,提高创新投资意愿㊂基于以上分析,提出假设H1:H1:政府补助对涉农企业创新投资产生正向激励效应㊂融资约束影响企业创新投资的主要机制有以下三个方面:第一,融资约束制约企业使用资金的规模㊂融资约束对企业而言,表现为企业获得潜在投资机会所面临的融资难易程度,融资难度越大,企业则越难以从外部获取可用资金,进而使得企业投资规模受限㊂原因在于,一方面,在资金掣肘的情况下,企业往往会放弃那些调整成本过高㊁资金需求量大的创新投资项目,进而弱化了创新投资强度;另外,企业可用资金获得受限不利于创新投资的成功率,因为创新具有研发过程不可分割和研发收益不可预期的特性,任何一个阶段出现资金链的中断都会影响研发创新最终目标的实现,特别是在创新投资的初始阶段和创新项目的攻关期,资金链的断裂意味着创新投资的失败[15],将产生高昂的调整成本和沉没成本㊂第二,融资约束使得创新投资成本提高㊂企业面临融资约束时其外部融资成本明显高于内部融资成本,而创新投资对资金的可持续和稳定供给能力提出了很高的要求,因此当内部现金流仅能维持企业日常经营时,企业通过获取外源融资推进创新投资项目变得至关重要㊂然而,创新投资的高风险和保密性加剧了信息不对称程度,使得外部投资者索取高于一般市场的风险溢价032024年第1期王闽㊀胡伟:政府补助与涉农类企业创新投资 基于融资约束视角以对冲不确定性风险进而推高了创新投资成本㊂投资的净现值理论认为,若投资成本显著高于企业创新投资可预期的现金流净现值时,当前投资则毫无意义,理性投资者会主动摒弃该投资项目㊂第三,融资约束弱化了创新投资动机㊂融资约束使得企业内部可用资金不足,而外部资金供给乏力引致企业财务风险,弱化了企业从事创新投资的积极性㊂Whited &Wu [16]在分析融资约束与企业风险管理的关系时指出,企业面临的经营风险根源在于融资约束㊂面对融资约束时,企业管理层对高风险的创新投资项目持谨慎态度,对不确定性投资持保守态度㊂基于以上分析提出假设H2:H2:融资约束对涉农企业创新投资产生抑制效应㊂企业创新之所以会出现融资约束,原因在于,高度的信息不对称是企业创新投资的固有属性,容易出现逆向选择和道德风险问题[17],致使外部投资者索取较高的融资溢价进而加剧了企业融资问题㊂相关学者研究认为政府补助能够向外部投资者传递企业创新投资活动真实信号的利好信息,即得到政府补助的企业往往具有较高的投资价值,认为这种 光环效应 一定程度上弱化了 柠檬市场 效应,有助于企业获得外部投资,提升创新投资能力㊂Soderblom [18]指出政府补助表现出一种 认证效应 ,发挥了信号认证功能,反映出企业良好的市场发展前景㊂然而,本文认为政府补助的信号效应要想真正发挥正向引导功能,缓解企业面临的融资约束,金融体系的协同配合至关重要㊂金融体系越发达,金融结构越完善,整体融资环境越活跃,则政府补助的信号传递功能越强,越能够发挥创新激励作用,相反,则会产生抑制作用㊂进一步的,就我国涉农企业而言,政府补助对涉农企业创新投资存在信号过度识别和弱识别两种识别机制,即政府补助并不能通过信号效应缓解企业融资约束㊂这是因为:首先,从产业经济发展角度分析,农业属于第一产业,与二㊁三产业相比,农业经济发展整体处于收缩阶段,外部投资者更加倾向于投资二㊁三产业获得高额回报,导致针对农业的投资者歧视现象㊂而政府补助之所以难以有效发挥信号传递功能,原因在于,农业企业创新投资容易对补助资源产生依赖,补助政策和创新收益的不确定性使得外部投资者出于风险规避的考量对创新投资持谨慎态度进而收紧资金 瓶颈 加剧融资约束㊂其次,金融市场不健全不完善导致要素配置扭曲[19]㊂具体而言,与农业相关的金融市场尚不完备,而创新投资具有高投入㊁高风险㊁长周期㊁对资金持续稳定供给要求高等特性,当政府补助的力度难以满足涉农企业对创新投资的需求时,补助信号不能被外部投资者有效识别,信号传递功能被弱化,加上创新投资的固有属性与银行信贷的低风险偏好相违背,这增加了涉农企业创新投资的融资难度㊂最后,涉农企业创新投资面临自然和市场双重风险,自然灾害和价格波动推高了风险溢价,融资约束居高不下㊂融资约束与政府补助交互作用对涉农企业创新投资的影响的异质性分析包括三个方面:首先,根据经济上行期和经济下行期分析涉农企业融资约束与政府补助交互作用对企业创新投资的影响,须从第一㊁二㊁三产业整体发展角度衡量㊂与经济下行期相比,在经济上行期,外部融资环境偏向二㊁三产业,第一产业农业面临较高融资约束㊂进一步地,考虑到农业创新投资面临自然和市场双重风险,相较于经济下行期,农业企业在经济上行期,市场相对活跃,风险降低,创新投资需求大,涉农企业倾向于扩大创新投资,但是与农业相关的金融体系发展滞后以及信贷歧视使得企业面临严重的融资约束问题㊂其次,涉农企业产权性质不同,其融资能力和制度支持显著不同㊂与国有涉农企业相比,以盈利为首要目的的非国有涉农企业在获得政府补助后能够积极加强创新投资,然而创新投资的固有属性使其对内部资金要求过高,内源融资难以满足有效需求时,则融资约束加剧㊂而国有企业因为需要承担更多的以非利润为导向的社会责任,对创新投资持保守态度,政府补助对国有企业难以形成有效激励,此外,国有企业因兑付刚性和预算软约束而无需考虑融资约束问题㊂然而,非国有企业欠缺与政府天然的政治关联优势,其内部13北京化工大学学报(社会科学版)2024年第1期流动性不足而外部融资成本过高使得创新投资无法达到最优水平㊂最后,相较于大规模涉农企业,融资约束与政府补助交互作用对中小规模涉农企业创新投资抑制作用更显著㊂其理论基础在于,中小规模涉农企业创新投资积累的是无形资产,具有调整成本高㊁风险高㊁周期长等特性,风险管理和抗压能力弱㊂加之无形资产占比较高且缺乏有价值的抵押品来锁定信贷风险,银企间信息不对称使得债权融资受限,进而加剧融资约束[20]㊂而大规模企业虽然有充足的现金流和物质资本,流动性强,融资渠道广,但大规模企业因市场占有率高而存在 创新惰性 ㊂根据以上分析,提出假设H3㊁H4㊁H5㊁H6: H3:融资约束对政府补助正向激励涉农企业创新投资存在反向抑制效应㊂H4:与经济下行期涉农企业相比,融资约束对政府补助正向激励涉农企业创新投资在经济上行期存在的反向抑制效应更显著㊂H5:相较于国有涉农企业,融资约束对政府补助正向激励涉农企业创新投资在非国有企业中存在的反向抑制效应更显著㊂H6:同大规模涉农企业相比,融资约束对政府补助正向激励涉农企业创新投资在中小规模企业中存在的反向抑制效应更显著㊂三、研究设计㊀㊀(一)数据来源与样本选择本文以2015 2021年中国A股涉农上市公司为样本,按照证监会2012版行业分类标准,选择全部A类 农㊁林㊁牧㊁渔业 ,制造业中选择C13㊁C14㊁C15㊁C17㊁C19㊁C20及C26中主营业务涉及农业㊁农业机械㊁农药㊁植保㊁肥料的企业作为涉农企业㊂在筛选数据的过程中,剔除ST㊁∗ST暂定上市㊁退市的样本以及关键变量缺失的样本,为减轻极端异常值影响,对连续性变量进行1%的Winsorize处理,最终筛选出1417个公司年度观测值㊂除经济政策不确定性指数外,其他相关数据都是从RESSET㊁CSMAR以及Wind数据库获得,采用STATA17.0对数据进行处理㊂(二)变量定义与模型设计1.变量定义(1)被解释变量以涉农企业创新投资(R&D)为被解释变量,用涉农企业当年研发投入与营业收入之比来衡量企业创新投资活动的强度㊂(2)核心解释变量核心解释变量为政府补助(Sub),计算公式为本期政府补助/本期营业收入㊂本文其他各具体变量定义与计算方法如表1所示㊂(3)调节变量融资约束(D_FC)为调节变量㊂Hadlock& Pierce[21]创建的SA指数包含两个内生性较弱的企业指标,即企业规模(Size)和企业年龄(Age),因此,参考鞠晓生等[22]的研究,以SA指数衡量融资约束㊂由于SA指数是负值,对其取绝对值转化为正数,SA指数越大则说明融资约束越严峻,根据SA指数中位数生成虚拟变量,当SA指数绝对值大于中位数时,则D_FC=1,表明该企业存在融资约束;当SA指数绝对值小于中位数时,则D_FC= 0,表明企业不存在融资约束,SA指数具体计算公式如下:SA=-0.737∗Size+0.043∗Size2-0.04∗Age(1)㊀㊀(4)控制变量参考已有文献,选取企业规模(Size)㊁企业成立时间(Age)㊁资产负债率(Lev)㊁股权集中度(Sha)㊁资产回报率(ROA)㊁固定资产占比(F-asset)㊁企业成长能力(Growth)㊁市场势力(Market)作为控制变量[23]㊂(5)分组变量㊀经济政策不确定性程度(EPU)㊁企业产权性质(State)㊁企业规模(Size)为分组变量㊂其中EPU 指数用贝克尔等人开发的中国经济政策不确定性指数表示[24],参考李增福等[25]的研究,本文对月度经济政策不确定性指数均值取对数,用以衡量年度EPU指数,计算公式如下:EPU=Lnð121EPU M12/100(2)㊀㊀其中,EPU M代表月度经济政策不确定性指数㊂232024年第1期王闽㊀胡伟:政府补助与涉农类企业创新投资 基于融资约束视角表1 变量定义变量类别变量符号变量定义变量计算方法被解释变量R&D 企业创新投资强度创新投入总额/营业收入∗100解释变量Sub 企业政府补助强度政府补助总额/营业收入∗100调节变量D_FC 融资约束SA 指数大于中位数取1,小于中位数取0Size 企业规模取样本年总资产的自然对数Age 企业成立时间企业成立至今的年限Lev资产负债率负债总额除以总资产Sha 股权集中度第一大股东持股比例控制变量ROA资产回报率净利润除以总资产F-asset 固定资产占比固定资产净额除以总资产Growth 企业成长能力营业收入增长率Market 市场势力企业营业收入与营业成本之比取对数Year 年度虚拟变量对应该年份取1,否则取0Industry行业虚拟变量所属该行业取1,否则取0EPU 经济政策不确定性程度中国经济政策不确定性指数分组变量State企业产权性质国有企业为1,非国有企业为0Size企业规模大规模取1,中小规模取0㊀㊀2.模型设计(1)政府补助与涉农企业创新投资模型构建为研究政府补助与涉农企业创新投资之间的关系,即检验假设H1,构建模型(3):R &D i ,t =β0+β1Sub +β2Size +β3Age +β4Lev +β5Sha +β6ROA +β7F-asset +β8Growth +β9Market +IndustryFE +YearFE +εi ,t(3)㊀㊀(2)融资约束与涉农企业创新投资模型构建为研究融资约束与涉农企业创新投资之间的关系,即检验假设H2,构建模型(4):R &D i ,t =β0+β1D _FC +β2Size +β3Age +β4Lev +β5Sha +β6ROA +β7F-asset +β8Growth +β9Market +IndustryFE +YearFE +εi ,t(4)㊀㊀(3)融资约束与政府补助交互作用与涉农企业创新投资模型构建参考贾洪文和程星[26]的模型构建方法,在模型(3)的基础上分步加入调节变量(D_FC)及其与解释变量的交互项(D _FC ∗Sub)构建模型(5)和模型(6):R &D i ,t =β0+β1Sub +β2D _FC +β3Size +β4Age +β5Lev +β6Sha +β7ROA +β8F-asset +β9Growth +β10Market +IndustryFE +YearFE +εi ,t (5)R &D i ,t =β0+β1Sub +β2D _FC +β3D _FC ∗Sub +β4Size +β5Age +β6Lev +β7Sha +β8ROA +β9F-asset +β10Growth +β11Market +IndustryFE +YearFE +εi ,t(6)㊀㊀模型(6)中β3为政府补助与融资约束交互项的回归系数,若β3为正且显著,则说明融资约束与政府补助交互作用(D_FC∗Sub)促进涉农企业创新投资,反之,则说明融资约束对政府补助促进涉农企业创新投资存在反向抑制作用㊂Industry FE和Year FE 分别代表行业和年份固定效应,其他控制变量与模型(3)(4)相同㊂四、实证检验及结果分析㊀㊀(一)描述性统计与多重共线性检验表2为主要变量的描述性统计和多重共线性检验结果㊂涉农企业创新投资(R&D)这一变量的最大值为19.210,最小值为0.004,标准差为1.921,说明不同的涉农企业具备的创新投资能力显著不同;政府补助(Sub)的最大值是29.240,最小值是0,标准差为1.822,说明不同的涉农企业所获得的政府补助金额存在显著差异㊂其他变量描述性统计结果大致与已有研究相同㊂根据方差膨胀因子(VIF)显示的数值和容差值(1/VIF)可知,VIF 值均在1.160至2.630之间,都小于3,1/VIF 值均大于0.1,说明各变量之间不存在明显的多重共线性(见表2)㊂(二)实证结果1.基准回归结果和交互项检验回归结果表3是政府补助与涉农企业创新投资㊁融资约束与涉农企业创新投资以及政府补助与融资约束交互作用对涉农企业创新投资影响的回归结果㊂列(1)报告了政府补助对涉农企业创新投资影响的回归结果㊂列(1)中政府补助(Sub)的系数33北京化工大学学报(社会科学版)2024年第1期㊀㊀㊀表2㊀变量描述性统计和多重共线性检验变量样本数最大值最小值平均值中位数标准差VIF1/VIF R&D141719.2100.0042.3092.0231.921 Sub141729.2400.0000.7150.2641.8221.3100.761 D_FC1417 1.0000.0000.5001.0000.5002.5300.395 Size141725.90019.44022.14022.0801.0451.4600.684 Age141747.0007.00023.73024.0005.0722.6300.380 Lev1417 1.0700.0290.3700.3530.1731.7100.586 F-asset14170.7500.0020.2590.2340.1471.3800.726 Growth1417130.700-2.7800.4530.1263.7711.1600.864 Sha141788.2404.08035.50034.22014.8301.1900.842 Market1417 2.555-0.3190.3950.3170.3132.1900.456 ROA14170.482-0.8600.0510.0480.0711.7000.588为0.102,且在5%的水平上显著为正,该结果验证了假设H1的成立,并表明政府给予涉农企业补助能够促进其增加创新投资,即政府补助对涉农企业创新投资产生正向激励效应㊂列(2)报告了融资约束对涉农企业创新投资影响的回归结果㊂融资约束(D_FC)的系数为-0.183,且在1%的水平上显著为负,该结果证实了假设H2,这意味着涉农企业面临的融资约束抑制企业创新投资,凸显出融资约束确实是企业创新投资的 绊脚石 ㊂列(3)列(4)用于检验融资约束的调节效应㊂列(4)报告了融资约束与政府补助交互项对涉农企业创新投资影响的回归结果,融资约束与政府补助交互项(D_FC∗Sub)系数为-0.075,且在5%的水平上显著为负,该结果证实了假设H3,这表明融资约束对政府补助促进涉农企业创新投资存在反向抑制效应㊂这种抑制效应可能的原因在于:(1)由于涉农领域相关金融市场发展滞后,补助的信号传递功能遭遇阻滞,政府补助引致外部投资者集聚的正向激励效应难以有效发挥,融资约束抑制政府补助的正向激励作用㊂(2)涉农企业获得的政府补助较少,对外部投资者传递的积极信号较弱,不足以激励外部投资者增加风险投资,抑制创新资金持续供给㊂(3)农业从产业大类上讲属于第一产业,其整体发展落后于其他产业,这也是政府主张以创新引领农业高质量发展的现实原因㊂政府补助可能会使得涉农企业相关主体对补助资源产生较大依赖,致使外部投资者变得谨慎,此时信号发挥过度识别功能,强化了外部投资者规避弱势产业高风险创新活动的投资行为,弱化了政府补助㊀㊀㊀表3㊀政府补助㊁融资约束与涉农企业创新投资:全样本回归结果Variables(1)(2)(3)(4)R&D R&D R&D R&D Sub0.102∗∗0.097∗∗0.140∗∗(2.09)(2.00)(2.65) D_FC-0.183∗∗-0.278∗∗-0.218(-2.71)(-2.10)(-1.61) D_FC∗Sub-0.075∗∗(-2.05) Size-0.290∗∗∗-0.169∗∗∗-0.289∗∗∗-0.296∗∗∗(-5.85)(-6.67)(-5.82)(-5.96) Age-0.021∗∗-0.001-0.001-0.001(-2.24)(-0.10)(-0.06)(-0.06) Lev-1.219∗∗∗-0.628∗∗∗-1.212∗∗∗-1.170∗∗∗(-3.81)(-3.84)(-3.79)(-3.66) F-asset-0.443-0.154-0.475-0.471(-1.31)(-0.90)(-1.41)(-1.40) Growth0.026∗∗0.0070.026∗∗0.026∗∗(2.28)(1.26)(2.26)(2.25)Sha-0.012∗∗∗-0.004∗∗-0.012∗∗∗-0.012∗∗∗(-3.79)(-2.49)(-3.80)(-3.85) Market 1.087∗∗∗0.569∗∗∗ 1.059∗∗∗ 1.062∗∗∗(5.69)(5.82)(5.54)(5.56)ROA-0.644-0.367-0.563-0.503(-0.86)(-0.96)(-0.75)(-0.67) Constant10.195∗∗∗ 3.909∗∗∗9.797∗∗∗9.916∗∗∗(9.48)(7.03)(8.98)(9.09) Year FE YES YES YES YES Industry FE YES YES YES YES Observations1417141714171417R-squared0.3200.3450.3220.324 F-value21.71024.30021.20020.720㊀㊀注:括号中为标准误差,∗∗∗表示p<0.01,∗∗表示p<0.05,∗表示p<0.1(下表同)㊂对企业创新的促进作用㊂2.稳健性检验(1)稳健性检验借鉴万良勇等[27]的研究,选取创新投入与主营业务收入的比值作为原被解释变量创新投资的替换变量进行稳健性检验㊂从表4回归结果可以看出,在替换被解释变量后,列(1)政府补助(Sub)的系数为0.088,且在1%的水平上显著为正;列(2)融资约束(D_FC)的系数为-0.267,在1%的水平上显著为负;列(3)交互项(D_FC∗Sub)的系数为-0.084,在1%的水平上显著为负㊂这再次证明,政府补助正向激励涉农企业创新投资,融资约束对涉农企业创新投资产生负向抑制效应,融资约束对政府补助正向激励涉农企业创新投资存在反向抑制效应,说明结论具有较强的稳健性㊂(2)内生性检验432024年第1期王闽㊀胡伟:政府补助与涉农类企业创新投资 基于融资约束视角表4㊀稳健性检验Variables (1)(2)(3)替换变量替换变量替换变量Sub 0.088∗∗∗0.127∗∗∗(3.45)(4.36)D_FC -0.267∗∗∗0.014(-3.88)(0.07)D_FC∗Sub-0.084∗∗∗(-2.79)Size -0.145∗∗∗-0.150∗∗∗-0.142∗∗∗(-5.50)(-5.75)(-5.42)Age -0.129∗∗∗-0.034-0.098∗∗(-5.20)(-0.98)(-2.17)Lev -0.183∗∗∗-0.180∗∗∗-0.185∗∗∗(-6.52)(-6.41)(-6.58)F-asset 0.0320.0330.033(1.23)(1.25)(1.27)Growth -0.035-0.028-0.031(-1.41)(-1.13)(-1.27)Sha -0.052∗∗-0.051∗∗-0.052∗∗(-2.18)(-2.15)(-2.17)Market_0.225∗∗∗0.223∗∗∗0.228∗∗∗(6.84)(6.77)(6.92)ROA 0.0070.0060.006(0.25)(0.20)(0.22)Constant -0.589∗∗∗-0.526∗∗∗-0.667(-4.43)(-3.95)(-0.88)Year FEYES YES YES Industry FEYESYESYESObservations 141714171417R-squared 0.3210.3220.325F -value19.20019.33018.430㊀㊀第一,滞后2期㊂考虑到我国政府补助多为事后奖励,从获得政府补助到企业管理层作出增加研发投入的决策,时序上存在延迟,所以对政府补助作滞后2期处理,生成L2.Sub 进行内生性检验㊂由表5列(1)(2)可知,解释变量政府补助(L2.Sub)的系数为0.084,在1%的水平上显著为正,交互项(D_FC∗Sub)的系数为-0.034,在5%的水平上显著为负,滞后2期回归结果表明基准回归结果稳健㊂第二,2SLS 法㊂借鉴颜晓畅[28]的研究,选取涉农企业的营业收入作为政府补助的工具变量,对营业收入取对数进行两阶段最小二乘法(2SLS)回归㊂由表5列(3)(4)可知,列(3)政府补助(Sub)系数为0.433,且在1%的水平上显著为正;列(4)政府补助与融资约束交互项(D _FC ∗Sub)系数为-0.523,且在1%的水平上显著为负,这些结果表明模型不存在内生性问题,说明研究结果具有可靠性㊂表5㊀内生性检验Variables (1)(2)(3)(4)滞后2期滞后2期2SLS 2SLSL2.Sub 0.084∗∗∗0.081∗∗∗(2.96)(3.29)Sub 0.433∗∗∗0.614∗∗∗(3.65)(5.44)D_FC -0.3230.616∗∗∗(-1.57)(3.66)D_FC∗Sub-0.034∗∗-0.523∗∗∗(-1.98)(-5.14)Size -0.227∗∗∗-0.179∗∗∗-0.132∗∗∗-0.150∗∗∗(-7.66)(-6.83)(-3.36)(-3.35)Age -0.076∗∗∗0.003-0.114∗∗∗-0.111∗∗(-2.81)(0.06)(-3.52)(-2.00)Lev -0.047-0.091∗∗∗-0.102∗∗-0.151∗∗∗(-1.46)(-3.21)(-2.30)(-2.95)F-asset 0.013-0.013-0.052-0.045(0.49)(-0.50)(-1.37)(-1.12)Growth -0.0050.001-0.046-0.033(-0.18)(0.03)(-1.09)(-0.85)Sha -0.084∗∗∗-0.045∗-0.109∗∗∗-0.118∗∗∗(-3.06)(-1.90)(-2.91)(-2.95)Market_0.0420.213∗∗∗0.0270.047(1.40)(6.66)(0.79)(1.08)ROA 0.042-0.0440.090∗∗0.067(1.34)(-1.54)(2.17)(1.47)Constant -0.134∗∗-0.179∗∗∗-0.310∗∗∗-0.747∗∗∗(-2.21)(-6.83)(-4.25)(-4.71)Year FEYES YES YES YES Industry FEYESYESYES YES Observations 14151,41514171417R-squared 0.0940.352--F -value9.72523.490--Wald chi2(11)-125.52085.580Prob >chi2-0.0000.000㊀㊀3.进一步讨论:异质性分析(1)基于宏观经济环境从宏观经济环境角度进行异质性分析是为了锚定涉农企业在整个产业经济环境中的发展趋势,探究企业创新投资的周期性变化㊂表6和表7是根据EPU 指数分组为经济上行期和经济下行期的相关回归结果㊂首先,对比表6表7列(1)回归结果可以发现,经济上行期政府补助(Sub)的系数为0.071,且在5%的水平上显著为正,而经济下行期政府补助的系数为-0.116不显著,这表明相比经济下行期,政府补助对经济上行期涉农企业创新投资的正向激励作用更大㊂可能的原因是,涉农企业创新投资的特殊性在于其面临自然和市场双重风险,而在经济上行期,市场需求大㊁风险降低使得涉农企53。
第十四章下界解析

点集,d 1:
pi qj
( (
x1, x1,
x2 x2
, , ,,
xn xn
) )
0 0
rk ( x1, x2 ,, xn ) 0
1i m 1 j s sk t
(14.3.1)
令 #V 是 V 在 E n 中 所 具 有 的 连 通 分 支 个 数 , 则
#V d ( 2 d 1)nt1。
那么,树的高度至少为 logn, 由此得到,检索n个元素,在最坏情况下,至少需要进行 logn 1次
比较。
定理 14.1 检索具有n个元素的有序数组,在最坏情况下的
比较次数是 logn 1。
检索问题的下界是 ( log n ),而二叉检索算法是检索问题中 的最优算法。 例如, A {3, 4,7,10,15,18, 26,30,31,38},则二叉检索问题 的判定树如图 14.1 所示:
第十四章 下界
14.1 平凡下界 14.2 判定树模型 14.3 代数判定树模型 14.4 线性时间归约
14.1 平凡下界
▪ 平凡下界:用直观的方法就可以推导出来。
例 检查n个元素的整数数组中,其值为偶数的元素个数。 需要对数组中的每一个元素进行判断和累计。 对每一个元素进行判断需要 (1)时间, 对n个元素进行判断,就需要 ( n )时间。 因此, ( n )是求解这个问题的所有算法的下界。
15
4
30
3
7
18
31
10
26
38
图14.1 检索有序数组的判定树
14.2.2 排序问题
一、基于比较的排序问题: 数组A是一个具有n个元素的无序数组,把数组A按非增或 非降顺序排序。
14.2.2 排序问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
OLS ˆ ,得到估计值 ˆ, ˆ, ˆ 。 第二步:用 OLS 回归 yi xi , i
更有效率的方法是 MLE。 在两步法中,第一步误差被带入第二步,效率不如 MLE 的整体 估计。 两步法的优点在于,操作简便;对于分布的假设也更弱(即使不 假设二维正态分布,也可能成立)。 为检验是否存在样本选择偏差(sample selection bias),可使用似 。 然比检验来检验原假设“ H 0 : 0 ” 如使用 Heckit,无法进行此 LR 检验。
( y , z ) ,相关系数为 ,联合密度函数为 f ( y, z ) 。
假设个体进入样本的“选择机制”(selection mechanism)为“选 择变量 z 大于某常数 c” 。 比如,在妇女劳动力供给例子中, z w o w r ,而 c 0 。 断尾后的联合分布:
10
f ( y | y 1)
f ( y) , 1 F (0)
y 1,2,
如果 y 服从泊松分布,则
e y f ( y | y 1) , y !(1 e ) y 1,2,
进行 MLE 估计, 得到 “零断尾泊松回归” (zero-truncated Poisson regression)。如果 y 服从负二项分布(NB1 或 NB2),可进行“零断 尾负二项回归”(zero-truncated negative binomial regression)。 14.3 随机前沿模型(选读)
E( y | z c) y y ( z c) z
假设回归模型为 yi xi i 。
15
yi 是否可观测取决于选择变量 zi (取值为 0 或 1)
可观测 yi 不可观测 zi =1 zi =0
决定二值变量 zi 的方程为
1, 若 zi* 0 zi * 0, 若 zi 0
6
ˆx 。 ˆ 参见图 14.3。总体回归线为 xi ,而样本回归线为 i
yi
a + b xi
ˆx ˆ +b a i
c
xi
图 14.3 断尾回归示意图
7
使用 MLE 可得到一致估计。断尾前的概率密度:
2 1 1 yi xi 1 yi xi f ( yi ) exp 2 2 2
© 陈强,《高级计量经济学及 Stata 应用》课件,第二版,2014 年,高等教育出版社。Leabharlann 第 14 章 受限被解释变量
14
被解释变量的取值范围有时受限制,称为“受限被解释变量” (Limited Dependent Variable)。 14.1 断 尾 回 归 假设只有满足 yi c 的数据才能观测到。 对线性模型 yi xi i , 例: yi 为所有企业的销售收入,而统计局只收集规模以上企业 数据, 比如 yi 100,000 。 被解释变量在 100,000 处存在 “左边断尾” 。
4
图 14.2 反米尔斯比率
5
对 于 正 态 分 布 y ~ N ( , ) , 定 义 z
2
y
y z 。故
~ N (0, 1) , 则
E( y | y c) E( z | z c) E z z (c ) z z (c ) (c ) E
yi* , 若 yi* 0 yi * y 0 0, 若 i
21
如使用满足条件“ yi 0 ”的子样本,将导致断尾,出现偏差, 因为
E( yi | xi ; yi 0) E( yi* | xi ; yi 0) (给定 yi 0 ,必然 yi yi* ) E( xi i | xi ; yi* 0) xi E( i | xi ; xi i 0)
断尾随机变量的概率分布 随机变量 y 断尾后,其概率密度随之变化。 记 y 的概率密度为 f ( y ) ,在 c 处左边断尾后的条件密度函数为
f ( y) 若 yc , f ( y | y c) P( y c) 0, 若 yc
由于概率密度曲线下面积为 1, 故断尾变量的密度函数乘以因子 1 。 P( y c)
E( yi | zi* 0) ( wi ) k xik xik
右边第一项为直接影响,第二项是通过改变个体进入样本可能 性而产生的间接影响(即选择性偏差)。 如知道 ,就知道 ( wi ) ,可把它作为解释变量引入回归方程。 Heckman (1979)提出“两步估计法” ,也称“Heckit” 。 第一步:用 Probit 估计方程 P( zi 1| w ) ( wi ) ,得到估计值ˆ , ˆ ( wˆ ) 。 计算 i
w o 表示 offered wage, w r 表示 reservation wage。
如果 w o w r 0 ,则选择不工作,无法观测到劳动时间(hours), 造成劳动时间方程的偶然断尾与样本选择问题。
13
考虑二维正态随机向量 ( y, z ) ,记期望为 ( y , z ) ,标准差为
xi E( i | xi ; i xi ) xi xi
12
例 妇女劳动力供给模型:
劳动时间方程
o r
hours 0 1 wage 2 children 3 marriage u
工资方程 w w 0 1 age 2 education 3 children 0 location v
对于模型 yi xi i , i | xi ~ N (0, 2 ) ,则 yi | xi ~ N ( xi , 2 ) ,故
E( yi | yi c) xi (c xi )
如 果 用 OLS 估 计 yi xi i , 则 遗 漏 了 非 线 性 项 (c xi ) ,与 xi 相关,导致 OLS 不一致。
并将 Probit 扰动项的标准差 u 标准化为 1。 其中,E( i ) E(ui ) 0 , OLS 估计,将遗漏非线性项 ( wi ) 。 如 wi 与 xi 相关,则 OLS 不一致,除非“ 0 ”(即 y 与 z 不相关)。
17
解释变量 xik 的边际效应:
样本被观测到的概率:
8
P( yi c | xi ) 1 P( yi c | xi ) yi xi c xi xi 1 P i c xi xi 1 P c xi 1
2
图 14.1 断尾的效果
3
断尾分布的期望也发生变化。以左边断尾为例。 对于最简单情形, y ~ N (0, 1) ,可证明(参见附录)
E( y | y c)
(c )
1 (c )
对于任意实数 c,定义“反米尔斯比率”(Inverse Mill’s Ratio, 简记 IMR)为 (c ) (c ) 1 (c ) 则 E( y | y c) (c) 。
f ( y, z | z c) f ( y, z ) P( z c)
偶然断尾 y 的条件期望:
E( y | z c) y y (c z ) z
14
() 为反米尔斯比率(IMR)函数。
如果 0 (y 与 z 相互独立), 则 z 的选择过程并不对 y 产生影响。 如果 0 (即 y 与 z 正相关),则“ z c ”偶然断尾的结果是把 y 的整个分布推向右边(因为 () 0 ),从而使得条件期望 E( y | z c) 大于无条件期望 E( y ) 。 在“ z c ”条件下,偶然断尾 y 的条件期望为
19
14.5 归 并 回 归 对于线性模型 yi xi i ,当 yi c (或 yi c )时,所有 yi 都被归 并为 c,称为“归并数据”(censored data)。 例 (上不封顶的数据,top coding)在问卷调查中,常有诸如“收 入在¥50,000 及以上”这样的选项。 例 (边角解)考虑买车的决定,并考察“买车开支”这个变量。 如果不买车, 则 “买车开支” 的最优解为边角解, 即买车开支为 0; 反之,如果买车,则买车开支一定为正数。 例 (边角解)考察“劳动时间”这个变量。对于失业或待业者而 言, “劳动时间”的最优解为边角解,即劳动时间为 0;而就业者
20
的劳动时间一定为正数。 归并回归(censored regression)与断尾回归不同的是, 虽有全部观 测数据,但某些数据的 yi 被压缩在一个点上。
yi 的概率分布就变成由一个离散点与一个连续分布所组成的混 合分布(mixed distribution)。
假设 yi* xi i ( yi* 不可观测), i | xi ~ N (0, 2 ) , 归并点为 c 0 。 假设可观测到:
zi* wi ui zi* 为不可观测的潜变量。
16
假设 ui 服从正态分布,则 zi 为 Probit 模型,故 P( zi 1| wi ) ( wi ) 。 可观测样本的条件期望:
E( yi | yi 可观测) E( yi | zi* 0) E( xi i | wi ui 0) E( xi i | ui wi ) xi E( i | ui wi ) xi ( wi )
断尾后的条件密度: