社会学内生性问题
工具变量在社会科学因果推断中的应用
⼯具变量在社会科学因果推断中的应⽤⼀、导⾔: 因果推断的圣杯在反事实因果的框架之下 ,基于调查数据的社会学定量分析要进⾏因果推断,难度极⼤。
其主要原因在于,社会学家⼀旦要证明某个他们所感兴趣的“因”会带来⼀定的“果”,就必须⾯对⼀个永恒挑战:“内⽣性”问题( endogeneity) 。
也即: 如果某个潜在的、⽆法观测的⼲扰项,既影响“因”,⼜影响“果”,那么,利⽤最⼩⼆乘法模型( 简称OLS模型) 进⾏回归分析所得到的估计量就会是有偏误的,⽽不具有因果推断⼒。
在实证分析中,⽆论是经典的教育回报研究( Card, 1999),还是我国学界⾮常关注的关系⽹、社会资本研究( Mouw, 2003, 2006; 陈云松、范晓光,2010,2011) ,内⽣性问题都极为重要且亟待解决。
解决内⽣性问题的常⻅⽅法,主要包括⼯具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity scorematching,简称PSM) 、实验以及准实验( experimentsand quasi-experiments) 等等。
近年来,其中不少⽅法已经逐步在我国社会学界得到评述和应⽤( 梁⽟成, 2010; 陈云松、范晓光, 2010, 2011; 陈云松, 2012; 胡安宁,2012; 魏万⻘,2012) 。
在反事实因果分析框架下,实验或准实验⽅法最切近要义。
但社会科学的很多研究主题和领域决定了⽆法使⽤实验⽅法,⽽其他⽅法也都具有较⼤的局限性。
如固定效应模型只能消除时间固定的⼲扰项,倾向值匹配⽅法则完全依赖于“可观测因素被忽略”的假说。
相⽐较⽽⾔,对基于调查数据的定量分析,⼯具变量⽅法具有独特优势。
不过,⼯具变量⽅法在社会学分析中的运⽤,⽬前却远远不如它在计量经济学和政治学定量分析中那么⼴受⻘睐( 政治学和计量经济学研究中⼯具变量⽅法的使⽤参⻅Sovey & Green,2011; Angrist et al., 1996; Angrist & Krueger, 2001) 。
证明模型存在内生性问题
证明模型存在内生性问题一、什么是内生性内生性是社会科学中常见的概念,它指的是两个或多个变量的相互关系受到被观察影响的现象,这样的现象提示观察变量之间存在某种内在的关系,或者由于观察技术的限制,导致观察自身的习惯受到影响,也可能产生内生性现象。
内生性问题出现的原因主要有以下四点:1. 错误的变量分析。
有时,研究者可能未能充分地对变量进行详细的分析,未能发现变量之间的相关性,从而导致内生性问题。
2. 观察结果受到主观影响。
有些研究结果来自于观察者的主观判断,由于观察者本身的主观偏见,研究结果也可能受到影响,从而受到内生性影响。
3. 研究设计问题。
研究者在设计研究时,可能没有考虑到有可能出现的内生性问题,也就是说,研究者并未采用一些技术手段去排除内生性的影响,从而使研究结果出现偏差。
4. 模型中未考虑的因素。
研究人员可能过于依赖于历史资料,而未能考虑模型中未预料到的影响因素对研究结果的影响,从而使模型受到内生性影响。
二、如何证明模型存在内生性1.引入新变量。
一般来说,引入新变量是检验模型中内生性的有效方法,研究人员可以引入新变量,重新计算结果,看看新变量是否会影响模型的结果。
如果模型的结果受到新变量的影响,说明模型存在内生性问题。
2.采用控制研究。
研究人员可以尝试采用控制研究的方法,即比较因变量不变的情况下,采取相同措施却遭遇不同结果的研究,从而分析是否存在内生性问题。
3.采用模糊绝对正确样本试验。
模糊绝对正确样本试验(FAT)是一种对模型有效性进行检验的方法。
研究者运用FAT技术,可以分析出模型的收敛程度,从而判断模型是否存在内生性问题。
4.采用序列组研究法。
序列组研究法是一种能够检测内生性的方法,它采用多个重复发生的事件作为研究对象,分别记录不同变量的变化,从而确定不同变量对研究结果的影响,看看其是否存在内生性问题。
通过上述几种检验方法,研究人员可以检验模型中是否存在内生性问题,从而为模型的改进提供有效的参考。
内生性的例子
内生性的例子【篇一:内生性的例子】以前发的东西研究领域过于狭窄,今天发一个估计大家都感兴趣的话题:内生性。
国内杂志上的文章很多是不控制内生性问题的,但是,学过计量的人都知道,不控制内生性问题的文章,说得极端点,应该被称为垃圾(这话我也是从麦克法登的一个弟子那里听来的)。
接下来,我想简单的梳理一下内生性问题,同时以最近读到的一篇文章为例,看看top journal paper是如何处理这个问题的。
关于公司金融领域里的内生性问题的一个比较好的综述是总的说来,内生性主要由以下原因造成:1. 遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。
否则,就会造成解释变量与残差项相关,从而引起内生性问题。
2. 解释变量与被解释变量相互影响3. 度量误差(measurement error):由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差(regression error)的一部分,从而导致内生性问题。
解决内生性问题的方法主要有:1.工具变量法(iv)这种方法相信大家都已经学过,就是找到一个变量和内生化变量相关,但是和残差项不相关。
在ols的框架下同时有多个iv,这些工具变量被称为two stage least squares (2sls) estimator。
具体的说,这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为iv,放到原来的回归方程中进行回归。
2. 自然实验法就是找到一个事件,该事件只影响一部分样本,或者只影响解释变量而不影响被解释变量。
3.difference-in-difference (did)法思想是按照一定的标准,找到与样本match的控制组。
在假设外在冲击同时影响两个组别的情况下,做差来剔除掉外界冲击的影响。
4. 动态panel思想是将解释变量和被解释变量的滞后项作为iv好了,说了这么多,给大家举一个例子,这是我最近看到的最让我难忘的一篇文章。
内生性问题通俗理解
内生性问题通俗理解内生性(endogeneity)是经济学中的一个重要概念,它是两个经济变量间的相互关系的一种特殊形式,也是经济学家们长期关注和研究的热点问题。
在这篇文章中我们将以通俗易懂的方式让读者对这一概念有一个正确的理解。
内生性概念可以从因果分析这一经典学习方法中获得比较直观的认识,简单地说,内生性是指某一因素与另一因素之间有直接因果关系,即其中一个因素是由另一个因素决定的,它们之间存在着内部的因果关系。
例如,工资与生活水平之间的关系就是一个典型的内生性关系。
对于一个个体来说,拥有更高的工资水平可能会带来更高的生活水平,而拥有更低的工资水平可能会使生活水平下降。
这种直接的因果关系表明,工资水平是生活水平的内生因素,它不仅能够直接影响生活水平,而且也能够间接影响其他经济指标。
经济学家们通过试验来测定变量之间的内生关系,从而能够更好地理解经济问题,并作出更有效地政策建议。
例如,在考察一个国家经济发展水平时,经济学家可以比较它的投资水平、消费水平、就业水平等,通过试验来测定它们之间的内生关系,分析出最有效的策略。
内生性也可以用于解释消费者行为。
例如,消费者对某一商品价格的反应可以通过检验变量之间的内生关系来解释。
消费者若感觉某件商品价格太贵,则可能会减少购买该商品,从而影响到该商品的销量。
但是,价格的变化不一定会导致消费者的响应,消费者的决策受到许多内在因素的影响,有很多时候,价格的变化只是影响消费者行为的一个因素,这种情况就属于非内生性,即因果关系不存在或不明显。
可以说,内生性是经济学中一个重要的概念,它在解释经济现象和行为中起着重要作用,并且还能够帮助经济学家作出更有效的分析和政策建议。
如前所述,内生性也可以从因果分析这一经典学习方法中获得比较直观的认识,读者有必要仔细研究并了解这一重要概念。
社会学定量分析中的内生性问题测估社会互动的因果效应研究综述_陈云松
社会2010#4CJS 第30卷社会学定量分析中的内生性问题测估社会互动的因果效应研究综述陈云松 范晓光*作者:陈云松 牛津大学纽菲尔德学院(Author 1:C hen Yun s ong ,Nu ffiel d Coll ege ,Oxford Un i versity) E-m ai:l yunsong .chen @nu ffiel d .ox .ac .uk ;作者2:范晓光,浙江省社会科学院社会学研究所(Author 2:Fan X i aoguang ,Ins tit u te of Sociol ogy ,Zheji ang Acade my of Soci al Sciences)**作者感谢To m Sn ij ders 、PeterH edstr Êm 、Nan D i rk deG raaf 、陈友华、郝大海、李煜等教授与徐建牛、吴桂英、章奇、李志赟和郭茂灿等同对本文的批评和建议。
此外,还要感谢5社会6匿名审稿人宝贵的评审意见。
文责自负。
摘 要:因果关系是社会学分析的核心议题。
然而,基于调查数据的定量分析都会受到内生性问题的困扰,从而往往难以作出恰当的因果性推断。
大量现有的社会学定量分析虽以解释为己任,但实质上要么仅仅停留在描述统计相关阶段,要么得出错误的因果性结论。
本文以社会互动研究为例,详细讨论了遗漏偏误、自选择偏误、样本选择偏误和联立性偏误等四种主要的内生性问题的来源,并介绍了克服内生性问题的一系列模型识别方法。
最后还基于中国综合调查(CGSS2003)问卷,提出了通过提高调查数据信息量以利克服内生性问题的可能性。
关键词:内生性 因果效应 社会互动The Endogeneity P roble m in Quantitative Analysis:A Revie w of Estimating Caus al Effects of Social Interaction Chen Yunsong &Fan X iao guangAbstract :Cause -effect relationsh i ps are the core area i n soci ol ogical analysis .H ow ever ,soci ologi cal anal ys i s based on survey data is confronted by the endogeneity prob l em wh i ch p l agues causal i n f erences .M any existi ng stud i es am i i ng at provi d i ng explanati ons f or soci al pheno m ena ei ther merel y descri bes the statistical associ ati ons a m ong variables or arrives at prob l emati c causal concl usi ons .Focusi ng on t he soci al i nteracti on stud i es ,this paper addresses the m aj or sources of potenti al endogeneity b iases ,na m el y ,the om itted variab le bias ,sel-f selecti on b ias ,sa mp le -selection b i as and the sm i ultaneity b ias .U seful m odel #91#i den tificati on strategi es for correcti ng t hese prob le m s are revie w ed .Based on CGSS2003,th i s paper al so d i scusses how to partiall y correct for the endogeneity proble m t hrough aug m en ting t he vol u m e of survey data .Key words :endogeneit y ,causal effects ,soci al interacti on近几十年来,社会学家们对社会学发展的现状和目的争议重重。
社会学视角下的性侵犯问题
社会学视角下的性侵犯问题性侵犯问题一直是社会关注的焦点,自从MeToo运动兴起以后,更是引起了广泛的关注。
从社会学的角度来看,性侵犯不仅是一个个案,也反映出了社会文化、结构以及权力关系等方面的问题。
本文将从社会学视角出发,探讨性侵犯问题的深层次原因以及解决措施。
一、性侵犯的社会文化背景性侵犯的背后往往反映了两种文化特征:一是强权文化,二是性别文化。
强权文化是指一些人或群体出于权力控制的目的,利用强势方式来迫使他人服从。
在性侵犯中,施暴者使用的是强暴、胁迫、恐吓等手段,迫使受害者进行性行为。
强权文化的形成和发展有多方面原因,其中行业文化、历史传统、地域文化等方面的因素均有所涉及。
例如娱乐圈中的性侵犯案件就涉及到了娱乐圈的权力体系、潜规则、道德水平等因素。
性别文化则是指一种社会文化,强调男性和女性的性别角色和性别特征,并以此作为社会结构的基础。
在性别文化中,男性被赋予了支配的特权,女性则被定义为更为弱势的性别。
这种文化往往会导致男性和女性在权力和地位上的不平等。
在性侵犯中,大部分受害者是女性,而施暴者往往是男性。
这一方面反映了性别的不平等,另一方面也凸显了男性对权力的渴求。
二、性侵犯的社会结构根源性侵犯在一定程度上反映了社会结构的问题。
具体来讲,性侵犯与社会结构的不平等、权力分配、观念意识等方面息息相关。
根据社会学家的研究,性侵犯的背后往往涉及到了不平等的社会结构。
在这种结构下,施暴者往往占据社会制度和资源分布的极端地位,仅此一件就让他们认为自己可以把握他人的身体和权力。
例如,学校校长、院士教授等具有极端权力的群体,都存在着性侵犯事件。
性侵犯还与权力分配有关。
具体而言,在一些机构和组织中,权力集中在某些人手中,这些人握有相对较强的社会资源和话语权。
此时,这些人可能会把性侵犯作为一种极端的手段来控制和压制他人。
观念意识也是性侵犯问题的重要因素。
某些观念意识,例如“男性自居的权利意识”、强势文化、历史的传统、城市城市中的生活、行业规范等,都为性侵犯的发生创造了一定的条件。
调查问卷内生性问题的方法
调查问卷内生性问题的方法调查问卷是社会科学研究中常用的数据收集工具,通过问卷可以获得大量的信息和数据。
然而,在设计和实施调查问卷时,我们常常会面临内生性问题。
内生性问题指的是调查对象的回答可能受到问题本身的影响,导致结果的偏倚。
为了减少内生性问题的影响,我们可以采用以下方法:首先,问题的顺序要合理。
研究者在设计问卷时应该注意问题的逻辑顺序,将相关的问题放在一起。
这样可以减少被调查者因为前面的问题而对后续问题产生偏见或者疲劳感,从而提高问卷的有效性。
其次,问题的表述要清晰明了。
研究者在设计问卷时应该避免使用模糊或含糊不清的语言,确保问题的表述准确无误。
模糊的问题容易导致被调查者的回答不准确或者不符合实际情况,从而影响结果的可靠性。
第三,问题的选择要多样化。
研究者在设计问卷时应该尽量提供多个选择,以满足不同被调查者的需求和观点。
如果一个问题只提供了两个选择,可能会限制被调查者的回答范围,从而导致结果的偏倚。
第四,问题的顺序要随机化。
研究者在实施问卷调查时应该采用随机抽样的方法,将问题的顺序随机排列。
这样可以降低被调查者的回答顺序对结果的影响,减少内生性问题的可能性。
最后,问题的回答要保证匿名性。
研究者在设计问卷时应该保证被调查者的回答是匿名的,不会暴露个人隐私。
这样可以增加被调查者的回答的真实性和可靠性,减少内生性问题的可能性。
综上所述,调查问卷内生性问题会对研究结果产生偏倚,影响研究的可靠性和有效性。
为了减少内生性问题的影响,研究者在设计和实施问卷时应该注意问题的顺序、表述、选择、顺序随机化以及回答的匿名性。
通过合理的设计和实施,我们可以提高问卷的质量,获得更加准确和可靠的数据,为研究提供有力的支持。
社会学定量分析中的内生性问题
社会学定量分析中的内生性问题一、本文概述本文旨在探讨社会学定量分析中的内生性问题,分析其对研究结果的影响,以及提出相应的处理策略。
内生性问题在社会学研究中具有重要的理论和实践意义,因为它可能导致研究结果的偏误,甚至改变研究结论的方向。
本文首先将对内生性问题的概念进行界定,明确其在社会学定量分析中的地位。
接着,我们将回顾内生性问题在社会学领域的研究现状,包括已有的理论探讨和实证分析。
在此基础上,本文将深入剖析内生性问题的产生原因,探讨其对研究结果的具体影响。
我们将提出一些处理内生性问题的策略和方法,以期为社会学定量分析提供更为准确、可靠的研究结果。
通过本文的研究,我们希望能够增强社会学研究者对内生性问题的认识和理解,推动社会学定量分析方法的不断完善和发展。
二、内生性问题的定义与类型内生性问题在社会学定量分析中是一个核心概念,它涉及到因果关系的准确识别。
简单来说,内生性问题指的是在回归分析中,解释变量与误差项之间存在相关性,这种相关性会导致回归系数的估计值出现偏差,从而影响我们对因果关系的判断。
内生性问题的出现通常源于以下两种情况:一是遗漏变量,即模型中未包含所有与因变量和自变量相关的变量,这些遗漏的变量可能会导致估计结果的偏误;二是测量误差,即变量的观测值与其真实值之间存在差异,这种差异也可能引起内生性问题。
内生性问题的类型多样,常见的主要有以下几种:选择偏差(Selection Bias)、遗漏变量偏差(Omitted Variable Bias)、同时性偏差(Simultaneity Bias)以及样本选择偏差(Sample Selection Bias)等。
选择偏差通常发生在样本选择过程中,导致样本不具有代表性;遗漏变量偏差则是因为模型中遗漏了与因变量和自变量都相关的变量;同时性偏差多发生在自变量和因变量相互影响的情况下,使得传统的回归分析方法无法准确识别因果关系;样本选择偏差则是因为样本选择过程中存在的某种系统性偏差,导致估计结果不准确。
内生性问题
内生性问题引言:内生性问题是指与一个系统、组织或现象内在联系紧密、相互影响、互为因果的问题。
这些问题既不是纯粹由外部因素所引起,也不是完全由内部因素所导致,而是两者相互作用的结果。
内生性问题在社会科学领域尤为常见,包括经济学、政治学、社会学等。
一、内生性问题的定义内生性问题在研究中意味着变量之间存在相互影响关系,不仅自变量影响因变量,同时也可能因变量对自变量产生影响。
这种相互影响可以是正向的也可以是负向的,有时甚至是复杂的回馈关系。
内生性问题的存在使得我们需要更加谨慎地解读数据和分析结果,以避免产生误导性的结论。
二、内生性问题的原因内生性问题的主要原因在于变量之间的复杂关系。
一方面,变量之间可能存在遗漏变量问题。
在研究中,我们不能将所有可能影响因变量的因素都纳入考虑,有些变量可能被忽略而导致结果出现偏差。
另一方面,变量之间也可能存在反向因果关系。
因变量可能同时作为自变量影响其他因变量,这种复杂的关系造成了内生性问题的存在。
三、内生性问题的解决方法为了解决内生性问题,研究者可以采用以下方法:1. 仔细控制变量:通过控制可能产生内生性问题的其他变量,使得自变量与因变量之间的关系更加可靠。
这可以通过实验设计、随机分配处理组和对照组等方法来实现。
2. 使用工具变量:工具变量是一种在经济学领域中常用的解决内生性问题的方法。
它通过引入一个与自变量相关但不直接影响因变量的变量来进行分析。
通过工具变量的引入,可以排除内生性问题对研究结果的影响。
3. 进行因果推断:通过仔细验证变量之间的因果关系,可以帮助我们更清楚地了解内生性问题的存在。
借助因果推断的方法,可以准确地解释变量之间的相互作用,并确定影响因变量的主要因素。
四、内生性问题的影响内生性问题的存在会对研究结果产生明显的影响。
如果不加以解决,内生性问题可能导致对因果关系的错误解读,使得研究结论产生偏差,缺乏可靠性和有效性。
此外,内生性问题还可能使得研究结果的泛化能力受到限制,难以推广到其他情境或群体。
社会临场理论的三个内生性问题
社 会 临场 理 论是 传 播 学技 术 与社 会 (e h o og tc n l y
n oit a d s c e y) 研究领 域的一个重要理论 该理论最初 由 Shor W i t lliam s 和 C 而sti 等三位学者 于 1976 年提 出 e 在 电信 ( e ec m m n ea o )传播的社会心理学 tl o u i t n i 一书
关键词
社会临场;社会心理学 ;技 术与社会
T h e S ocia l P resen ee T h eo ry R v isited e
W A N G Tian iao j (Sehool of M edi and C om m uni a eation, C i U niveo i of H ong Kong, H ong K ong ty ty )
3. 利用社会 临场 研究探索 人际交流和 社会认 知
临场者 不等于互动对象
在一个人际互动的交流情境 中 , 人们需要 考虑 哪 些 因素? 符号互动论的主要代表 人物之一 的 (沁 山 任 an 曾在他的 日常生 活的 自我呈现 一书 中明确指 出, 在 一次交流互动过 程中 , 影响个体行动决策 的因素至 少 有三个 : (l 表演者 . (2)观 看表演 的人 ; (3 既非表 演 ) ) 者又非观看 者的人 者 其 中第 二点提到 的 观 看表演 互 动交流 的对 然而 , 这种简化却 在社 会临场 理论 中被操 作化为
象 , 从而实现 了理论 的定量检验 是有先天缺 陷的
等更大的研究议题 i c B o ca 等人在 系统 梳理 了过去 二十 五年 间社会 临场理论的研究成 果后 指出 , 社会临场理论是深深扎 根于符号互动论和人际传播之社会心理学的 符号互 动论强调 : 主体对外物赋予的意义是其行动的基础 , 而这种意 义只存在于主体与外物的互动交流过程 中; 同时 , 主 体对意义的让释会随交流过程的展开而不断 调整 0 1 社会临场理论以符号互动论 中主动的行动者 为核心 , 将个体对于技术和 (被中介的)他人的主体感 知与界定作为主要的变量进 行测 量 , 并在此 基础上对 人们 被中介的互动交流行 为和交流 中使用 的媒介之 特性作出解释 而人际传播的社会心理学之众 多成果
内生性问题
工具变量和两阶段最小二乘一、背景虽然在OLS 的大样本性质中,我们放宽了强外生性的假定,用弱外生条件来进行替代,即()0E x ε'=。
但是,在实际的问题中,弱外生性的条件往往也是不容易满足的。
也就是说,变量的内生性问题总是不可避免的。
内生性引起的问题主要是引起参数估计的不一致。
可以说,内生性问题是在实际应用中最经常遇到的问题。
这个部分讨论的就是如何解决由内生性问题引起的参数估计的不一致。
二、知识要点1、引起内生性的原因及其对参数估计的影响2、代理变量法解决内生性问题3、工具变量法和2SLS 的性质 三、要点细纲1、引起内生性的原因及其对参数估计的影响 (1)模型设定偏误(遗漏变量)这主要是因为实际的问题中,一个变量往往受到许多变量的影响,在实际建模过程中无法将解释变量全部列出。
在这样的情况下,遗漏的变量的影响就被纳入了误差项中,在该遗漏变量与其他解释变量相关的情况下,就引起了内生性问题。
即()0E x ε'≠。
(2)测量误差关于测量误差引起内生性的问题要基于测量误差的假设。
测量误差可能是对被解释变量y 的测量误差,也可能是由于对解释变量x 的测量误差。
这两种情况引发的结果是不一样的。
A. 被解释变量y 的测量误差。
不妨假设y 的真实值是*y ,测量值为y ,则可以将测量误差表示成:*0e y y =-。
假设理论的回归方程为:*011k k y x x βββε=+++将测量误差方程带入得到:0110k k y x x e βββε=++++011k k x x v βββ=+++其中0v e ε=+是实际回归方程的残差。
显然,由于y 的测量误差0e 是与i x 相互独立的,所以实际回归方程的残差v 也与各解释变量相互独立(无关)。
外生性条件满足。
B. 解释变量x 的测量误差假设在回归式011k k y x x βββε=+++ 中,测量误差产生于k x ,即实际回归式为:*011k k y x x βββε=+++并有*kk k e x x =-如果假设cov(,)0k k x e =,则将测量误差带入方程得到:011k k k k y x x e βββεβ=++++ 011k k x x v βββ=+++显然,外生性条件满足。
内生性问题原因和处理方法
内生性问题:就是模型中的一个或多个解释变量与随机扰动项相关的问题。
变量的内生性问题总是不可避免的。
内生性引起的问题主要是引起参数估计的不一致.引起内生性问题的原因:(1)遗漏变量这主要是因为实际的问题中,一个变量往往受到许多变量的影响,在实际建模过程中无法将解释变量全部列出。
在这样的情况下,遗漏的变量的影响就被纳入了误差项中,在该遗漏变量与其他解释变量相关的情况下,就引起了内生性问题.(2)测量误差关于测量误差引起内生性的问题要基于测量误差的假设.测量误差可能是对被解释变量y 的测量误差,也可能是由于对解释变量x 的测量误差。
这两种情况引发的结果是不一样的。
( 3) 双向交互影响这种情况引起的内生性问题在现实中最为常见。
其基本的原理可以阐述为,被解释变量y 和解释变量x 之间存在一个交互影响的过程.x 的数值大小会引起y 取值的变换,但同时y 的变换又会反过来对x 构成影响.这样,在如下的回归方程中:011k k y x x βββε=+++,如果残差项ε的冲击影响了y 的取值,而这样的影响会通过y 传导到x 上,从而造成了x 和残差项ε的相关。
也就是引起了内生性问题。
内生性问题处理方法:1。
工具变量法(IV)就是找到一个变量和内生化变量相关,但是和残差项不相关。
在OLS 的框架下同时有多个IV,这些工具变量被称为两阶段最小二乘(2SLS)估计量.具体的说,这种方法是找到影响内生变量的外生变量,连同其他已有的外生变量一起回归,得到内生变量的估计值,以此作为IV,放到原来的回归方程中进行回归。
2。
代理变量法(Proxy)Proxy方法是将不可观测的变量用近似的变量进行替代,也就是说,是在残差项中提取出有用的信息,但是并没有对现有的解释变量进行处理。
3。
自然实验法就是就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组.该事件只影响一部分样本,或者只影响解释变量而不影响被解释变量。
“内生性” 到底是什么鬼?
“内生性”到底是什么鬼?王也/ 纽约大学政治学博士生内生性(endogeneity)的概念跟内生变量(endogenous variable)的概念息息相关。
而内生变量这一概念的兴起又跟社会科学的模型化和系统化密不可分。
比如曼昆在他的经济学原理(或者是宏观经济学?)一开头就举了一个汉堡包的例子:在汉堡包的生产中,有投入(原料、劳动、工厂),有产出(汉堡包),我们感兴趣的是中间的制作流程。
那么研究者应该做的,是通过一个模型来刻画上述制作流程(比如一个生产函数),从而给定模型的输入(各类投入品的消耗),就能计算出对应的输出(汉堡包产量)。
在得到了准确的模型之后,我们就可以进一步对汉堡包的生产进行预测和改进,达到理解世界和改造世界的目的。
在这个例子中,投入就是汉堡包制造模型中的外生变量,而产出则是内生变量。
换言之,外生变量是模型中的“原因”,而内生变量是模型中的“结果”。
很明显,这种思考问题的方法带有浓重的控制论色彩,将任何社会现象都看作一个包含了输入、输出和模型三部分的系统(或许是二战期间大批巨型工程,比如曼哈顿工程的遗产?)。
在政治学里,这种视角导致了大卫·伊斯顿(David Easton)的系统主义尝试(今天的影响力已然不大)。
而在经济学中,其结果是学者们开始将宏观经济的运行作为一个包含了数十乃至数百种输入和输出的巨大系统加以处理,以至于联立方程模型在五六十年代变得非常流行。
学者们认为,可以用一大堆线性方程来表示各个宏观指标(比如物价、失业率、利率等等)之间的关系,从而为政府的经济政策指定提供参考(当然凯恩斯主义的发展在其中也扮演了重要角色)。
我们都知道,在一个回归方程里,等号左边是因变量,右边是自变量。
在联立方程模型里,我们有几十乃至几百个方程,所以每个变量都可能同时出现在方程 A 的左手边和方程 B 的右手边。
也就是说,这些变量的值既被其他变量决定,又能够影响另外一些变量。
它们在整个模型中起了中间环节的作用,因此被称为“内生变量”(只出现在左手边的变量显然也是内生的)。
调查问卷内生性问题有哪些
调查问卷内生性问题有哪些调查问卷是社会科学研究中常用的数据收集工具,它可以帮助研究者获取大量的数据,从而进行定量分析和统计。
然而,在设计和实施问卷调查时,研究者需要注意到问卷的内生性问题,这些问题可能会对研究结果产生误导和偏差。
内生性问题指的是问卷中可能存在的与研究结果相关的问题,这些问题可能影响到问卷的可靠性和有效性。
以下介绍几个常见的内生性问题。
首先,社会期望和回应偏差是一种常见的内生性问题。
在填写问卷时,受访者可能会受到社会期望的影响,选择符合社会期望的回答,而不是真实的想法或行为。
这种偏差可能导致问卷结果与实际情况不符,从而影响研究的准确性。
其次,主观记忆偏差也是问卷调查中的内生性问题之一。
受访者在回答问题时,可能会受到个人记忆的限制和偏见的影响。
有些事件可能被忘记或者过于夸大,而有些事件可能被低估或者忽略。
这种记忆偏差可能导致问卷结果不准确,无法反映真实的情况。
另外,问卷设计中的问题顺序也可能引发内生性问题。
研究者在设计问卷时,需要注意问题的顺序是否会影响受访者的回答。
例如,如果将一些敏感的问题放在前面,可能会导致受访者回答更加保守或者回避。
这种问题顺序引发的内生性问题可能会影响到问卷结果的可靠性。
此外,问卷中的问题表述和选项设置也可能引发内生性问题。
问题的表述是否清晰明确、选项的设定是否全面准确,都会影响受访者的回答。
如果问题表述模糊或者选项设置不全面,可能导致受访者对问题的理解不一致,或者无法选择合适的答案。
这种问题引发的内生性问题可能会影响到问卷结果的可靠性和有效性。
综上所述,调查问卷内生性问题在研究中是需要格外关注的。
研究者在设计和实施问卷调查时,需要认真考虑和处理这些问题,以确保问卷结果的可靠性和有效性。
通过合理的问卷设计和注意内生性问题的存在,可以提高问卷调查的质量,为研究者提供更准确的数据基础。
理论的内生性与外生性因素划分
理论的内生性与外生性因素划分引言在社会科学研究中,理论的内生性与外生性因素是两个重要的概念。
它们用来解释社会现象的发生和发展过程中,各种因素之间的关系。
理论的内生性与外生性因素划分是社会科学研究中的一个基本问题,对于深入理解社会现象的规律具有重要意义。
理论的内生性因素理论的内生性因素是指与研究对象具有内在关联性的因素。
它们是从研究对象内部产生的,对研究对象的变化有直接的影响。
理论的内生性因素可以分为两类:结构性内生性因素和行为性内生性因素。
结构性内生性因素结构性内生性因素是指研究对象内部的结构性特征对其变化产生的影响。
这些特征包括组织结构、制度安排等。
例如,一个国家的政治制度对其政治稳定性和发展方向产生着重要影响。
在经济研究中,市场结构的特点决定了企业之间的竞争程度和市场的效率。
行为性内生性因素行为性内生性因素是指研究对象内部的行为决策对其变化产生的影响。
这些行为决策可以是个体行为或组织行为。
例如,个体的消费决策对市场需求的形成和商品价格的变化起着重要作用。
在组织研究中,企业管理者的决策会影响企业的发展方向和业绩。
理论的外生性因素理论的外生性因素是指与研究对象具有外部关联性的因素。
它们是从研究对象外部产生的,对研究对象的变化具有间接的影响。
理论的外生性因素可以分为两类:结构性外生性因素和行为性外生性因素。
结构性外生性因素结构性外生性因素是指研究对象外部的结构性特征对其变化产生的影响。
这些特征包括社会制度、经济环境等。
例如,国际贸易环境的变化会对一个国家的出口产生显著影响。
在文化研究中,社会价值观的改变会导致文化传统的演变。
行为性外生性因素行为性外生性因素是指研究对象外部的行为决策对其变化产生的影响。
这些行为决策可以是其他个体或组织的行为。
例如,全球金融市场的波动会对一个国家的金融体系产生影响。
在国际关系研究中,其他国家的外交政策会对一个国家的安全环境产生重要影响。
理论的内生性与外生性因素的划分问题理论的内生性与外生性因素的划分并不是一道简单的任务,它需要根据具体的研究对象和研究问题来进行判断。
内生性产生的原因及解决方案
2020/4/5
20
Difference in difference models
Basic two-way fixed effects model
变量有测量误差也无法用我们前面学过的方法 解决。
因此我们就必须寻找一种新的方法。
2020/4/5
14
二、内生性的解决方案
事实上,仅仅为了解决内生性问题,并不需要我 们对内生性问题的缘起有很深入的理解。对于应 用型的实证研究而言,我们只需要掌握解决内生 性问题的具体方案即可。内生性问题的解决方案 一共四种,理论上来讲,这四种方案应对内生性 问题都很有效。但于我个人而言,我对四种方法 的评价是有高低的,由高到低分别介绍如下。
其基本思想是,将受冲击的样本视作实验组,再按照一定 标准在未受冲击的样本中寻求与实验组匹配的对照组,而 后做差,做差剩下来的便是这次冲击的净效应。
双重差分法实际上是固定效应的一个变种,差分的过程实 际上是排除固定效应的过程。ZERA在《计量论文写作和 发表的黑客教程》有一个非常简明风趣的举例,我转述于 此,以飨读者。
states but at a variety of times
2020/4/5
29
ui is a state effect vt is a complete set of year (time)
effects Analysis of covariance model
Yit = β0 + β3 TitAit + ui + λt + εit
内生性问题
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat
因变量M1:MONEY STOCK(CURR,TRAV.CKS,DEM DEP,OTHER CK'ABLE DEP)(BIL$,SA) 自变量IP:INDUSTRIAL PRODUCTION: TOTAL INDEX (1987=100,SA) 自变量PPI: PRODUCER PRICE INDEX: FINISHED GOODS (82=100,NSA) 自变量TB3:INTEREST RATE: U.S.TREASURY BILLS,AUCTION AVG,3-MO.(% PER ANN,NSA) 外生变量URATE: UNEMPLOYMENT RATE: ALL WORKERS, 16 YEARS & OVER (%,SA) 外生变量AAA: BOND YIELD: MOODY'S AAA CORPORATE (% PER ANNUM)
y 0 1 x1 2 x2 k xk u
u = w+
– 如果存在 Cov( x j , w) 0 ,则所有的估计系数不具有一致 性
• 遗漏变量通常源于无法观察的影响因素 • 考虑影响工资的模型
log(wage) 0 1educ u
• 该模型忽略了人的能力(如果能找到代理变量, 如IQ,可以将其加入模型中) • 人的能力将影响其受教育的程度
联立方程(simultaneity,双向因果)
结构模型(structural model ) :把内生变量表述为其他内生变量、前定变量 与随机误差项的方程体系。 例:如下凯恩斯模型(为简化问题,对数据进行中心化处理,从而不出现截 距项) ct = 1 yt + ut1 It = 1 yt + 2 yt-1 + ut2 yt = ct + It + Gt 消费函数, 投资函数, 行为方程 (behavior equation ) 行为方程
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
about
Part 4:结 语
Part4:结语
总体来看,能够部分解决内生性的方法主要是固
定效应方程和倾向性评分匹配。而理论上可以全部解 决内生性的方法则包括工具变量以及自然实验。
THANK S
到的资源量X(如求职协助者的职业声望)是否对收入(Y)有显著效应。 然而,某些未被观察的变量X′(如自尊心)可能同时作用于个体工作结果和
使用社会关系求职的选择性之上——自尊心强的人不愿意找人求职,而且自
尊心导致工作努力和较高的收入。若仅对那些报告了使用社会关系的局部 样本建立简单的OLS模型,这样等于只对一个自尊心不强、工作不努力的样 本进行估计,社会资本的因果效应可能出现高估。
3.样本选择偏误
当因变量的观察仅仅局限于某个有限的非随机样本时,样本的选择偏
误就容易产生。这种对某些观察值的非随机性排斥不仅源自数据收集程序,
而且也来自于研究中社会现象本身所固有的特质。
3.样本选择偏误
3.样本选择偏误
例子:要调查该社会资本的效应,最直观的方法是对表示自己的工作
是“通过协助者找来的”被访者进行分析,观察他所“动员”或“使用”
所有未被观察的因子都被控制。
既然建立起:穷举式的模型在 理论上是不可能的,一个替代 性方案只是利用滞后因变量作 为未被观察的个体异质性和历 史因子的代表。
2、运用固定效应模型去控制“时间固定的”非观测因素。
例子:在学校的同群效应研究中,利用学校的面板数据控制了固定
的个体、学校年级以及学校效用,由此发现了学校年级同群的平均成绩
口才不仅增加了找关系的成功概率,而且本身也影响工作类型和工资水平—
—应为较高的语言技能本身就代表了较强的能力。
2.自选择偏误 (主解释结果/因变量是在莫种程度上被个人选择所决定)
2.自选择偏误
例子:如果一个求职者因为自身的某一个特点选择了“找熟人”这种 求职方式,那么“找熟人”事件本身对于他求职的影响,就很难说是因果 性的,在这里,我们把决定是否“找熟人”定义为被求职者自己觉察到的 效应方程。比如“胆怯”是X2,也即一个同时影响找关系的决策(X1)和 工资水平(Y)的遗漏变量,那么“胆怯”势必进入ع和 ع′。既然方程(5) 设定“胆怯”与“找熟人”( X1 )相关,那么方程(4)里的偏误项ع就自 然地也会与X1 相关了。因此,方程(4)产生了偏误估计。
例子 :组内策略常被运用到邻里效应、社会网络效益的研究中,以解决 潜在的遗漏家庭特征变量问题。该方法的根本逻辑是,通过比较在不同社区 或朋友圈子的同胞兄妹,以此消除家庭固定效应,从而准确的评估邻里或者 朋友圈的同群效应。
4、工具变量
如前所述,家庭特征在识别邻里、班级或学校同群效应时往往是遗漏变量。 为了解决该问题,社会学家常常把州、县或大都会地区层面的汇总数据作为解 释变量的工具变量。例如,运用大都会地区的失业率、家庭收入中位数和贫困 率作为学校中贫困学生比例的工具变量,研究发现,学校中贫困生比例对学生 怀孕或辍学行为并无显著的同群效应。
2.利用方程的递归结构
利用方程的递归结构,即强加一个时间序列去打破自变量与因变量之间的 联立性。也就是说,人们可以假定个体在t+1期时的行为实际仅仅受到t期时主 群行为的影响。在实验室的实验中,他比较容易实现。然而,在基于观察数据 的实证研究中,情况要更为复杂。使用该方法必须假设未被观察的变量不随时 间变化,而且行动者们必须不具前瞻性。
子的学习成绩。
4.条件方差限定
基本事项:对一个既定的社会互动现象,个人结果的跨组别方差有三个因素所导致 (组群异质性的方差、个体异质性的方差以及组群解释变量的方差)。如果每个组群由 大小不同的次级组群随机组成,那么显然对这些次级组群而言,上级组群和个体的异质 性方差是一样的,但他们各自的解释变量的方差却不一样。那么,通过比较不同次级组 群的解释变量方差,就可以识别解释变量的因果效应。 例如,检验幼儿园学业成绩的学校同群效应,将老师和学生随机分配到两种类型的 教室:小班和大班。由于每个小班平均成绩的方差要大于大班,那么所有小班组成的次 组群的平均成绩方差要大于大班组成的次组群。这样,班级大小就提供了识别外生性变 化的资源。本质上,条件方差限定方法相当于寻找只通过影响组内方差才影响跨组群方 差的工具变量。
社会学定量分析中的内生性问题
测估社会互动的因果效应研究综述
CONTEXT
about 前言 about 问题来源 about 解决方法 about
结语
about
Part 1:前 言
Part 1:前 言
因果关系是社会学分析的核心议题。然而,基于调查数据的定量分
析都会受到内生性问题的困扰,从而往往难以做出恰当的因果性推断。 大量现有的社会学定量分析虽以解释为己任,但实质上要么仅仅停留在 描述统计相关阶段,要么得出错误的因果性结论。
解决自选择偏误
解决联立性偏误
解决样本选择偏误
1.无需考虑联立性偏误
首先检视一些特殊情况:即人们可以假定有相互因果关系引致的联立性是 可以不予考虑的,例如,假定社区里的老住户不受新迁入家庭的影响。其原因 是,迁入家庭数量和原有家庭数量之间的比率很小,也就是说,社会互动的因 果效应被假设为单向度的。既然是单向因果,就无需考虑联立性偏误。
对个人成绩的增长有正向作用。 固定效应往往会得到较大的标准误差,更重要的是,他无法控制随 时间、家庭、学校变化的非观测因素。在实证研究中,对同一被访者进 行重复观察的“真”面板数据往往难以搜集。不过,在特定假设下,组 织的管理记录可以用来追踪一段时间内的变量差异,也就可以进行固定 效应分析了。
3、组内策略:即用非时间性的组内差异去估计固定效应模型
2.倾向评分方法(PSM)
该方法最直观的理念是,用尽量相似的控制组成员和对照组成员来进行比
较,以减少偏误。 例如,为了探究邻里选择对高中辍学和未成年人怀孕的效应,引进PSM方 法来比较处于青春期的具有相同观察因素和不同邻里的两组儿童。研究发现那 些较高贫困型社区的个体比较低贫困型社区的高中生更有可能发生辍学和未成 年人怀孕。 缺陷:非常依赖于大样本和对照组、控制组匹配程度, 且对未被观察的 干扰性无能为力。
4.联立性偏误(本质是解释变量连带地由因变量决定,也即双向因果关系)
about
Part 3:解决方 法
Part3:解决方法
解决一般性遗漏变量偏误
解决自选择偏误
解决联立性偏误
解决样本选择偏误
1、利用非传统数据作为遗漏变量的替代
① 在邻里研究中,当纳入更多 对父母特征的控制时,生长在贫 困社区这一因素对于个体的影响 趋于下降。 ② 在学校效应研究中,控制父 母是否选择社区 ……. 然而,我们永远不知道是否
3.工具变量
联立性偏误实际亦可看做是一种特殊的遗漏变量偏误。只不过他是由双向
因果导致的,因此,工具变量方法必然是适应的。
例如:利用村庄中家庭水井里测出砷污染的比例为工具变量,分析了孟加 拉国农村八年级学生班级数学考试对于个体数学成绩的内生社会互动效应。其
理由是砷污染会影响儿童智力发育,从而外生的影响那些被污染水井家庭的孩
Part3:解决方法
解决一般性遗漏变量偏误
解决自选择偏误
解决联立性偏误
解决样本选择偏误
1.使选择行为不存在(最直观的方法)
使选择行为不存在的最佳途径是随机分配,这是因为随机分配可以确保因 变量和未观察因子之间没有任何关联性的出现。实验和自然实验可以设计出随 机分配,他们显然是理想的方法。 例如,利用大一新生宿舍随机分配这个自然实验,发现了作用于学术成就、 GPA等方面的同群效应。
解决一般性遗漏变量偏误
解决自选择偏误
解决联立性偏误
解决样本选择偏误
二阶段法
运用Probit和logit模型去预测使用社会关系的倾向,尔后控制其预测值以消
除样本选择偏误。由于样本选择也可以被视为遗漏变量问题的特殊类型,工具
变量方法实际上也可以对他加以处理。
Part3:解决方法
解决一般性遗漏变量偏误
Part 1:前 言
社会学定量分析中的内生性问题指人们一般通过控制一系列变量使
两个组别具有可比性,但总有哪些无法观察的或学者 未想到的变量。这 也即意味着解释变量和遗漏误差项出现了相关,不能满足高斯马尔科夫 定理,估计参数就会有偏误。
Part 1:内生性问题
Add your title
about
3.建立选择过程的模型
例如:建立在实验中,由班级规模引起的班级拆分可能性模型。接着,检 定班级规模和学生考试成绩之间可能的因果关系。 由于自选择问题也可以被看做是一种遗漏变量偏误的特殊类型,因此我们 也可以通过纳入更多的控制变量、代理变量和固定效应模型等传统方法来处理 这个问题。
Part3:解决方法
Part 2:问题来 源
Part 2:问题来源 自选择偏误
一般性遗漏变量偏误
样本选择偏误
联立性偏误
1
1.一般性遗漏变量偏误
例子:假设我们要估计“找熟人”,相对于“不找熟人”对于求职的因果影
响,如果在模型中个体的“口才”(X2)被遗漏,那么我们估计出的“使用社会
关系” (X1)对“工资收入”(Y) 的影响可能就是有偏误的。