逻辑_想象和诠释_工具变量在社会科学因果推断中的应用
工具变量在社会科学因果推断中的应用
⼯具变量在社会科学因果推断中的应⽤⼀、导⾔: 因果推断的圣杯在反事实因果的框架之下 ,基于调查数据的社会学定量分析要进⾏因果推断,难度极⼤。
其主要原因在于,社会学家⼀旦要证明某个他们所感兴趣的“因”会带来⼀定的“果”,就必须⾯对⼀个永恒挑战:“内⽣性”问题( endogeneity) 。
也即: 如果某个潜在的、⽆法观测的⼲扰项,既影响“因”,⼜影响“果”,那么,利⽤最⼩⼆乘法模型( 简称OLS模型) 进⾏回归分析所得到的估计量就会是有偏误的,⽽不具有因果推断⼒。
在实证分析中,⽆论是经典的教育回报研究( Card, 1999),还是我国学界⾮常关注的关系⽹、社会资本研究( Mouw, 2003, 2006; 陈云松、范晓光,2010,2011) ,内⽣性问题都极为重要且亟待解决。
解决内⽣性问题的常⻅⽅法,主要包括⼯具变量( instrumental variable,简称IV) 、固定效应模型( fixed effects model,简称FE) 、倾向值匹配( propensity scorematching,简称PSM) 、实验以及准实验( experimentsand quasi-experiments) 等等。
近年来,其中不少⽅法已经逐步在我国社会学界得到评述和应⽤( 梁⽟成, 2010; 陈云松、范晓光, 2010, 2011; 陈云松, 2012; 胡安宁,2012; 魏万⻘,2012) 。
在反事实因果分析框架下,实验或准实验⽅法最切近要义。
但社会科学的很多研究主题和领域决定了⽆法使⽤实验⽅法,⽽其他⽅法也都具有较⼤的局限性。
如固定效应模型只能消除时间固定的⼲扰项,倾向值匹配⽅法则完全依赖于“可观测因素被忽略”的假说。
相⽐较⽽⾔,对基于调查数据的定量分析,⼯具变量⽅法具有独特优势。
不过,⼯具变量⽅法在社会学分析中的运⽤,⽬前却远远不如它在计量经济学和政治学定量分析中那么⼴受⻘睐( 政治学和计量经济学研究中⼯具变量⽅法的使⽤参⻅Sovey & Green,2011; Angrist et al., 1996; Angrist & Krueger, 2001) 。
互助问答第174问 IV-Probit中二阶段外生变量都要放入一阶段中吗
V-Probit模型可以用下面的方程表示:
yi*=1表示被访者i 找到工作,Si表示社会资本,Xi是外生个人特征,如
性别、年龄等.
请问老师:第二阶段方程(2)中的全部外生变量Xi,都要放入第一阶段回
归方程(1)中?为什么?
参考文献:[1]陈云松.逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用[J].社会学研究,2012,27(06):192-216+245-246.
是否加入取决于工具变量z满足的假设;如果z独立于二阶段方程中的全部外生变量X和误差项epsilon,两条方程是否放入X不影响参数估计的一致性,但是加入后会改善有效性;如果z只是在控制了X之后才与误差项epsilon独立,就需要控制X。
学术指导:张晓峒老师
本期解答人:张川川老师
统筹:易仰楠
编辑:李宁宁
技术:林毅。
社会科学因果推断前沿方法
社会科学因果推断前沿方法1.引言1.1 概述社会科学因果推断的前沿方法是指通过科学的方法和技术分析,来揭示社会现象背后的因果关系。
社会科学因果推断的意义在于帮助我们更好地了解社会现象的原因和结果,从而指导社会政策的制定和社会问题的解决。
本文旨在介绍社会科学因果推断的前沿方法,包括实验设计与随机控制试验、自然实验与断点回归设计、工具变量法、倾向得分匹配法、差分处理法、面板数据模型和计量经济学模型等。
通过对这些方法的详细介绍和分析,可以帮助读者了解各种方法的原理、应用场景以及优缺点。
本文将首先在引言部分概述社会科学因果推断的意义和前沿方法的重要性。
接着,将详细介绍各种前沿方法的原理和实际运用。
实验设计与随机控制试验是一种被广泛应用的方法,可以通过随机分组来消除干扰因素,得出因果关系。
自然实验与断点回归设计则是在现实环境中观察自然变化的结果,从而进行因果推断。
工具变量法通过利用某种外生变量来估计被观察变量的因果效应。
倾向得分匹配法则是通过选择控制组来进行比对,以减少样本选择偏差。
差分处理法则是通过比较同一单位在不同时间或空间条件下的结果,得出因果关系。
面板数据模型则是利用面板数据进行因果推断。
最后,计量经济学模型是一种利用数学模型来分析因果关系的方法。
在结论部分,本文将总结前沿方法的优缺点,评估各种方法的适用场景和局限性,并展望未来的发展方向。
希望通过本文的阐述,读者能够更全面地了解社会科学因果推断的前沿方法,为今后的研究和实践提供参考和借鉴。
1.2 文章结构本文分为引言、正文和结论三个部分。
引言部分包括概述、文章结构和目的三个子部分。
首先,我们将概述社会科学因果推断的重要性以及相关领域的研究现状。
然后,介绍文章的整体结构,明确各个部分的内容要点和安排顺序。
最后,说明本文的目的,即探讨社会科学因果推断的前沿方法,以期给读者提供一个全面的了解和参考。
正文部分是本文的核心部分,涵盖了七个前沿方法。
首先介绍社会科学因果推断的意义,为读者提供背景和理解。
逻辑学在社会科学中的作用和意义
逻辑学在社会科学中的作用和意义导言社会科学作为研究人类行为和社会现象的学科领域,对于理解社会的运作方式和解决社会问题起着重要的作用。
而逻辑学作为一门基础学科,研究思维和推理规律,在社会科学中也发挥着重要的作用和意义。
本文将探讨逻辑学在社会科学中的作用,以及它对于社会科学研究的意义。
一、逻辑学的基本概念和方法1.1 逻辑学的定义逻辑学是研究思维和推理规律的学科,它探讨了正确思维的方法和规则,是一门旨在提高思维质量的学科。
1.2 逻辑学的基本方法逻辑学的基本方法包括命题逻辑、谓词逻辑和演绎推理。
命题逻辑研究命题之间的关系,谓词逻辑研究谓词的逻辑结构,演绎推理则是通过具体推理规则得出结论的方法。
二、逻辑学在社会科学中的作用逻辑学在社会科学中发挥着重要的作用,具体表现在以下几个方面:2.1 推理和证明逻辑学为社会科学提供了推理和证明的方法。
社会科学需要通过推理和证明来探讨问题并得出结论。
逻辑学提供了一套科学严密的推理方法,可以帮助社会科学家进行有条理的思考和表达。
2.2 概念的界定社会科学研究面临着大量复杂的概念和概念之间的关系,逻辑学可以帮助社会科学家清晰地界定概念,避免概念的混淆和歧义。
2.3 问题的分析和解决社会科学常常面临复杂的社会问题和矛盾,逻辑学可以帮助社会科学家对问题进行分析和解决。
逻辑学提供了一套系统的思维方法,可以帮助社会科学家分析问题的本质、找出问题的根源,并提出解决方案。
2.4 科学论证社会科学需要进行科学论证来证明研究的可行性和正确性。
逻辑学提供了科学的证明方法,可以帮助社会科学家合理地组织研究材料,进行逻辑推理,从而得出科学的结论。
三、逻辑学对社会科学研究的意义逻辑学对社会科学研究具有重要的意义,主要有以下几点:3.1 精确的表达和沟通逻辑学可以帮助社会科学家进行精确的表达和沟通。
社会科学研究需要准确的语言表达才能保证研究的准确性和可靠性。
逻辑学提供了严密的思维和表达方法,可以帮助社会科学家清晰地表达自己的研究观点和结论。
因果推断-原理与方法-概述说明以及解释
因果推断-原理与方法-概述说明以及解释1.引言1.1 概述概述因果推断是科学研究中一种重要的推理方法,用于确定事件或事物之间的因果关系。
通过观察和分析相关的现象和数据,我们可以试图找出事件之间的因果关系,并从中得出相应的结论。
因果推断广泛应用于各个学科领域,如生物学、经济学、社会学等,对于我们理解和解释现实世界的各种现象和问题有着重要意义。
在因果推断的过程中,我们通常需要收集大量的数据,并进行合理的分析和处理。
通过对数据的观察和实证研究,我们可以识别出变量之间的关联性,并尝试去解释或预测某个因果关系的可能性。
因果推断的核心思想在于寻找因果关系的可信度和有效性,同时排除其他潜在的影响因素,以确保我们得出的结论具有科学性和可靠性。
在进行因果推断时,我们需要注意以下几个方面。
首先,我们要明确研究的目的和问题,确保将注意力集中在感兴趣的现象和事件上。
其次,我们要选择合适的样本和数据收集方式,确保数据的质量和可比性。
此外,我们还需要运用适当的统计方法和模型,进行数据分析和推断。
最后,我们要进行合理的解释和判断,严谨地评估因果关系的可信度和影响程度。
总之,因果推断是一种重要的科学研究方法,它可以帮助我们理解和解释现实世界中的各种现象和问题。
通过对相关现象和数据的观察和分析,我们可以找出事件之间的因果关系,并通过合理的推断得出科学的结论。
然而,在进行因果推断时,我们需要注意数据质量、统计方法的选择以及合理的解释和判断,以确保我们得出的结论具有科学性和可靠性。
未来,随着科技的进步和方法的创新,因果推断在科学研究中将扮演更加重要的角色,为我们提供更深入、准确的认识和理解。
1.2 文章结构文章结构部分的内容应该包括对整个文章的组织和流程进行介绍。
主要包括以下几个方面:首先,可以简要介绍文章的总体组织结构。
说明文章分为引言、正文和结论三个部分,并提及各个部分的目的和内容。
然后,详细描述引言部分的作用和内容。
引言部分可以作为文章的开场,引导读者对于因果推断的概念和原理有一个整体的了解。
社会科学的想象力:工具变量和因果推断
社会科学的想象力:工具变量和因果推断∗陈云松提要:工具变量(Instrumental Variable)是社会科学定量分析中解决内生性问题的重要手段,是基于调查数据进行因果推断的前沿方法。
本文在简要介绍工具变量的定义、原理及估算方法的基础上,对实证分析中较为常见的五类工具变量进行回顾梳理,为今后的研究寻找工具变量提供了参考。
同时,对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。
最后,就工具变量方法的潜力和局限性进行了剖析。
本文是目前社会学文献中首次对工具变量进行梳理分类的研究,也是中文社会学文献中首次对工具变量方法进行全面介绍。
关键词:工具变量内生性定量分析因果推断Abstract:Instrumental variable(IV)method is one of the most important strategies to deal with the endogeneity problem in quantitative analysis to conduct causal inference.This paper introduces the concept,principle and model of IV,and reviews five classes of IVs used in previous studies.It also illustrates the Local Average Treatment Effect which is of importance to interpret the IV estimates.An empirical analysis is employed as a template to demonstrate how to conduct an IV analysis.Finally the criticism of IV method is also discussed.Key word:Instrumental Variable;Endogeneity;Quantitative Analysis;Causal Inference.作者简介:陈云松,牛津大学社会学博士,牛津大学社会学系、纳菲尔德学院。
逻辑_想象和诠释_工具变量在社会科学因果推断中的应用
逻辑、想象和诠释:工具变量在社会科学因果推断中的应用*陈云松提要:工具变量(instrumental variable)是社会科学定量分析中解决内生性问题的重要手段,是基于调查数据进行因果推断的前沿方法。
本文在简要介绍工具变量的定义、原理及估算方法的基础上,对实证分析中较为常见的五类工具变量进行回顾梳理,为今后研究寻找工具变量提供了参考。
同时,对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。
最后,就工具变量方法的潜力和局限性进行了剖析。
关键词:工具变量内生性定量分析因果推断一、导言:因果推断的圣杯①在反事实因果的框架之下,②基于调查数据的社会学定量分析要进行因果推断,难度极大。
其主要原因在于,社会学家一旦要证明某个他们所感兴趣的“因”会带来一定的“果”,就必须面对一个永恒挑战:“内生性”问题(endogeneity)。
也即:如果某个潜在的、无法观测的干*作者感谢康奈尔大学摩根(Stephen Morgan)教授、牛津大学斯奈德斯(Tom Snijders)教授和赫斯特罗姆(Peter Hedstr m)教授、香港科技大学吴晓刚教授、中山大学梁玉成副教授、浙江省社会科学院范晓光助理研究员的讨论、批评和建议,同时感谢匿名评审专家和编辑部提出的修改意见以及CGSS2003和CHIPS2002数据团队。
文责自负。
①圣杯(grail)系指耶稣受难时用来盛放鲜血的圣餐杯。
在凯尔特神话中,追寻圣杯是一个神圣而伟大的主题,“有能者居之”,其过程则充满艰险,传说有无数骑士为了寻求圣杯而踏上了不归之路。
②关于社会科学定量分析中的反事实因果框架可参见摩根和温肖普的文章(Morgan&Winship,2007)。
谢宇(2006)曾经以大学教育为例来说明反事实因果的含义。
比如,在分析大学教育对个体的收入是否有因果效应时,对一个上大学的学生,我们不可能获得他不上大学情况下的数据。
课题研究论文:浅析社会科学中的因果推理
158745 社会其它论文浅析社会科学中的因果推理科学研究的终极目标是理论解释,对现象的描述和分类是前科学阶段。
所谓科学理论,是关于超脱具体现象的一般性概念和命题系统,不仅能够说明是什么,还能够说明为什么。
如牛顿力学,解释苹果垂直落地、行星运行轨迹等。
社会科学虽然有很大的特殊性,描述性研究占据很大份额,但理论解释仍然是其最高目标(Merton,1968)。
[1]一、社会科学中因果关系相关理论因果关系在我们生活的世界中无所不在,几乎身边的每件事物都可以找见由其产生引致结果的因果缘由。
由于现有科学水平的局限性,有些未知事物我们还在探索中,但我们相信将来终会对其进行科学的说明。
所以我们会普遍认为,因果关系不仅存在于自然科学、人文科学中,还在社会科学中占有重要的地位,是我们生活中最基本、最本质、最原始的存在关系。
[2](一)休谟问题因果关系的论述是休谟的重要贡献,该论述颠覆了自古以来人们对因果关系的看法。
该理论对于休谟的整个哲学体系而言占有核心重要的地位――它不但是休谟认识论的重要内容,而且在不同程度上成了其伦理学、美学、宗教哲学的一个基本依据。
在《人性论》中,休谟对因果关系作了详尽而条理清晰的论述。
休谟认为,所谓因果,有三层含义。
第一是原因和结果事件之间在时空上毗连,时空联接是因果关系的先决条件。
如果两个时空相距很远的物体产生了因果作用,那么其间必然存在某种因果链条的衔接。
第二是时间顺序,即因先果后。
第三是必然联系,即因果现象相伴而生,有其因必有其果。
休谟指出,这三要素中,前两条是必要因素,而第三条是最重要的。
这一条也是最具争议的。
关于第三要素,休谟用了两个术语,一是必然联系,二是恒定关联。
二者在语义上有细微不同,恒定关联强调经验伴随现象的重复性,用现代统计学术语就是统计相关。
而必然联系则是超越感官经验的,是人类对恒定关联的心理印象。
这种定义上的微妙矛盾蕴含了经验主义的基本问题。
一方面,休谟强调,因果联系不同于逻辑推论,一定来自经验;我们不能通过分析原因事件的特性而推导出它的结果。
因果推断模型在社会科学研究中的应用
因果推断模型在社会科学研究中的应用引言:社会科学研究的目标是揭示社会现象之间的因果关系,而因果推断模型成为了一种有效的工具。
在社会科学研究中,因果推断模型帮助研究者从观察到的数据中识别因果关系,并提供了一种可靠的方法来评估政策和干预措施的有效性。
本文将介绍因果推断模型的概念、方法和在社会科学领域的应用。
一、因果推断模型的概念因果推断模型是一种基于统计学和计量经济学原理的方法,它的目标是通过控制其他可能的干扰因素,从而推断出某个变量对目标变量的因果影响。
这种模型的核心思想是建立一个对于观察到的数据更好的解释模型,并通过模型中的变量关系来推断因果效应。
二、因果推断模型的方法1. 随机对照实验随机对照实验是因果推断模型中最可靠的方法之一。
研究者通过随机分配被试对象到实验组和对照组,并在实验组中施加干预措施,然后比较两组的差异来推断干预措施对目标变量的因果效应。
通过随机分组,实验组和对照组在除了干预措施之外的其他因素上是相似的,这样可以排除其他可能的干扰因素。
2. 自然实验自然实验是观察某些存在自然干预的情况下,推断因果效应的方法。
例如,研究者可以观察一个城市实施了一项政策后,与此相关的变量是否发生了改变。
自然实验的优势在于可以观察到现实生活中的变化,但由于无法控制其他可能的干扰因素,结果的可靠性有一定的限制。
3. 已有数据分析已有数据分析是一种基于现有数据进行推断的方法。
研究者利用统计学方法,在观察到的数据中找到与目标变量相关的变量,并通过建立回归模型或者其他统计模型来推断因果效应。
已有数据分析的优势在于利用了大量的数据资源,但也面临着数据质量、数据收集方法等方面的挑战。
三、因果推断模型在社会科学中的应用1. 教育领域因果推断模型在教育领域的应用广泛。
例如,研究者可以利用随机对照实验来评估某种教育政策对学生学习成绩的影响。
通过比较实验组和对照组之间的差异,可以得出干预措施对学生成绩的因果效应。
2. 健康领域在健康领域,因果推断模型可以帮助研究者评估某个药物或治疗方法对患者健康状况的影响。
因果推断实用计量方法
因果推断实用计量方法因果推断是社会科学领域中的一个重要问题,在政策制定、经济分析、社会学研究等方面起到了至关重要的作用。
为了解决因果推断问题,研究者们开发了一系列实用计量方法,本文将介绍其中一些常用的方法及其原理。
首先,要理解因果推断的概念,我们需要明确什么是因果关系。
在社会科学研究中,因果关系指的是一个事件A的发生导致了另一个事件B的发生。
为了能够观察到因果关系,我们通常需要满足三个条件:相关性、时间顺序和排除其他可能性。
相关性是指事件A和事件B之间存在一种关联关系,即事件A的发生与事件B的发生之间具有一定的关联性。
对于因果关系而言,相关性是必要但不充分的条件。
时间顺序是指事件A的发生在事件B之前,即事件A是事件B的因。
排除其他可能性是指在观察到A和B之间存在相关性和时间顺序的情况下,我们需要排除其他可能导致A和B之间关联的因素。
这种排除措施通常通过随机试验和控制变量分析来实现。
下面我们将介绍一些常用的实用计量方法。
首先是随机试验法。
随机试验是在实验中通过随机分配处理或干预措施,从而满足伪随机性的要求。
随机试验的核心思想是将样本随机分成实验组和对照组,对实验组进行一种干预措施,然后观察实验组和对照组在一些变量上的差异。
这种方法在经济学中常用于评估政策的效果。
例如,研究者可以通过随机选择一些城市来实施一项政策,然后观察实施政策的城市和未实施政策的城市之间的差异,从而评估该政策对于经济发展的影响。
其次是断点回归法。
断点回归法是一种利用自然断点来进行因果推断的方法。
在一些政策干预或自然实验中,存在一些变量达到一些特定数值时,出现了突变的情况。
这种突变点可以被视为一个“随机分配”的机制,因此可以用于估计干预对于其他变量的效应。
例如,研究者可以通过分析学生单科考试分数在其中一分数线附近的变化情况,来评估是否存在教育政策对学生成绩的影响。
再次是倾向得分匹配法。
在一些实证研究中,研究者无法进行随机试验或者找不到合适的突变点。
探究社会科学研究中的因果推理
探究社会科学研究中的因果推理在社会科学研究中,因果推理是一种重要的思维方式和方法论。
它帮助研究者理解和解释各种社会现象之间的关系,揭示出背后的原因和结果。
然而,因果推理并非一种简单的关联性分析,而是需要深入思考和严密的逻辑推理。
首先,因果推理要求我们识别和区分相关性和因果性。
相关性是指两个或多个变量之间存在一种关联或联系,而因果性则是指其中一个变量的变化直接导致另一个变量的变化。
在社会科学研究中,我们经常面临着相关性和因果性之间的混淆。
因此,我们需要通过观察和实证研究来确定变量之间的因果关系。
其次,因果推理需要考虑其他可能的解释和变量。
在社会科学研究中,很少有单一的因果关系,更多的是多个因素共同作用的结果。
因此,当我们观察到两个变量之间存在因果关系时,我们必须排除其他可能的解释和变量。
这需要我们进行深入的研究和探索,以确定真正的因果关系。
此外,因果推理还需要考虑时间顺序和因果链条。
时间顺序是指因果关系中的因果变量在时间上先于结果变量的发生。
因果链条是指因果关系中的中间变量或中介变量。
在社会科学研究中,我们经常需要追溯过去的事件和现象,以确定因果关系的时间顺序和因果链条。
这需要我们进行大量的数据收集和分析,以建立可靠的因果推理。
最后,因果推理需要我们进行实证研究和实证验证。
社会科学研究中的因果关系往往是复杂和多变的,我们不能凭空臆断或主观推测。
相反,我们需要通过实证研究和实证验证来支持和证明我们的因果推理。
这需要我们运用各种研究方法和技术,如实地调查、实验研究和统计分析等。
综上所述,因果推理在社会科学研究中具有重要的意义和作用。
它帮助我们理解社会现象之间的关系,揭示出背后的原因和结果。
然而,因果推理并非一种简单的关联性分析,而是需要深入思考和严密的逻辑推理。
我们需要识别和区分相关性和因果性,考虑其他可能的解释和变量,考虑时间顺序和因果链条,并进行实证研究和实证验证。
只有这样,我们才能建立可靠的因果推理,为社会科学研究提供有力的支持和证据。
工具变量的基本思路和条件_概述及范文模板
工具变量的基本思路和条件概述及范文模板1. 引言1.1 概述在社会科学研究中,为了解决内生性问题,研究者们采用了各种方法来估计因果效应。
其中,工具变量法是一种常用的方法。
工具变量方法通过引入一个“工具变量”来解决内生性问题,并通过建立有效的控制组和处理组之间的随机分配关系,从而得到更准确可靠的因果效应估计。
1.2 文章结构本文将对工具变量的基本思路和条件进行概述,并结合一个实际案例进行分析和讨论。
首先,我们将介绍工具变量的概念及其应用场景;接下来,我们将详细阐述工具变量的基本思路;然后,我们将讨论使用工具变量法时需要满足的条件和假设;随后,我们将给出一个实际案例,并选择合适的工具变量来解释数据;最后,我们将讨论工具变量方法的优点与局限性,并比较其他相关方法并推荐应用场景;最后将探讨未来发展方向。
1.3 目的本文旨在全面介绍工具变量方法以及其应用场景,并对其基本思路和条件进行清晰阐述。
通过对实际案例的分析,我们可以更加深入地理解工具变量方法的应用过程和效果。
同时,本文还旨在讨论工具变量方法的优点与局限性,并探索其他相关方法的比较和推荐应用场景。
最后,我们希望能够为未来工具变量方法的发展提供一些建设性的意见和建议。
2. 工具变量的基本思路和条件2.1 工具变量概念及应用场景工具变量是在因果推断中使用的一种统计方法,用于解决由于内生性问题导致的结果偏误。
内生性问题通常指的是某个解释变量与干扰项之间存在相关关系,从而影响到结果变量与解释变量之间的因果关系判断。
工具变量可以作为一个外生的、不受干扰项影响的解释变量来代替原始解释变量,从而消除内生性问题。
工具变量通常应用于经济学和社会科学领域研究中,尤其是在处理无法进行随机实验的情况下,例如评估政策效果、分析医疗干预措施等。
2.2 工具变量的基本思路工具变量方法基于仪器变异原理,通过选择一个与原始解释变量相关但与干扰项无关的仪器(即工具)来进行因果推断。
它的基本思路是使用该仪器来代替原始解释变量,以准确估计结果变量对原始解释变量的因果影响。
互助问答第174问 IV-Probit中二阶段外生变量都要放入一阶段中吗
V-Probit模型可以用下面的方程表示:
yi*=1表示被访者i 找到工作,Si表示社会资本,Xi是外生个人特征,如
性别、年龄等.
请问老师:第二阶段方程(2)中的全部外生变量Xi,都要放入第一阶段回
归方程(1)中?为什么?
参考文献:[1]陈云松.逻辑、想象和诠释: 工具变量在社会科学因果推断中的应用[J].社会学研究,2012,27(06):192-216+245-246.
是否加入取决于工具变量z满足的假设;如果z独立于二阶段方程中的全部外生变量X和误差项epsilon,两条方程是否放入X不影响参数估计的一致性,但是加入后会改善有效性;如果z只是在控制了X之后才与误差项epsilon独立,就需要控制X。
学术指导:张晓峒老师
本期解答人:张川川老师
统筹:易仰楠
编辑:李宁宁
技术:林毅。
因果推断在教育及其他社会科学领域的应用
因果推断在教育及其他社会科学领域的应用1. 因果推断的基本概念说到因果推断,大家可能会想,“这是什么高深莫测的东西?”其实啊,说白了,就是搞清楚“这个事情跟那个事情之间有没有关系”。
比如,老师发现学生在课外读书多,考试成绩就好,是不是可以推断:多读书导致成绩提高呢?当然,这中间可能还有很多因素,比如学生本身的基础、老师的教学质量等等。
但是,简单来说,因果推断就是我们试图找出“因”和“果”之间的那条线。
2. 教育领域的应用2.1 教学方法的评估在教育领域,因果推断可真是个好帮手!比如,教育研究者们想知道不同的教学方法哪个更有效。
有的老师可能喜欢用传统的讲授法,有的则偏爱互动式学习。
通过因果推断,研究者可以设计实验,让一组学生用传统方法学习,另一组用互动方法,然后比较他们的成绩。
这样就能清楚看到,究竟哪种方法对学生的学习效果更好,真是一目了然嘛!2.2 教育的影响不仅如此,因果推断在教育方面也有着举足轻重的地位。
想象一下,某个地方的教育部门决定缩短假期,增加上课时间,声称这样可以提高学生的学业成绩。
可是,光靠说可不行!研究人员可以通过因果推断分析这种实施前后的学生成绩变化,看看缩短假期究竟有没有带来实际的好处。
如果没效果,那这就得好好“反思”一下了。
3. 社会科学中的应用3.1 经济的评估转到社会科学,因果推断同样表现得淋漓尽致。
经济学家们常常研究对经济的影响,比如降低税收是否能刺激消费。
通过因果推断,他们能够把税收实施前后的经济数据进行比对,找出真实的因果关系。
比如,结果显示,税收降低后,消费确实上升,那么这个就值得推广;要是数据一看就是“空中楼阁”,那就得另找办法了。
3.2 社会干预的效果另外,因果推断还被用来评估各种社会干预措施的效果,比如针对贫困家庭的援助计划。
研究者们通过追踪那些接受了援助的家庭,看看他们的生活状况是否有改善。
这样可以帮助我们更好地理解,哪些措施是真正有效的,哪些则可能只是纸上谈兵。
社会科学中因果推断方法
社会科学中因果推断方法
社会科学研究往往需要用到因果推断方法,这种方法能够帮助研
究者找到变量之间的因果关系。
因果推断是社会科学中最基本的方法
之一,它关注的是变量之间的因果关系,而不是仅仅查找它们之间的
相关性。
因此,因果推断有助于我们更好地解释现象、预测变化并制
定政策。
在因果推断中,要明确两个概念:因果和相关。
相关是指两个变
量之间可能存在的联系,而因果则是指其中一个变量导致另一个变量
的变化。
通过排除其他可能的因素,我们可以确定一个变量对于另一
变量的变化是直接的原因。
这种因果关系可以进行证明或者证伪,这
也是因果推断的基本原则。
因果推断方法有很多,包括实验研究、随机对照实验、自然实验、比较样本等等。
实验研究是最常见的一种因果推断方法,它通常需要
建立一个实验组和一个对照组,然后对变量进行控制和测量,以确定
变量之间的因果关系。
随机对照实验是实验研究中最有效的方法之一,它能够控制随机因素来避免选择偏差,这种方法能够产生高精度和可
靠的结果,是证明因果关系的最佳方法之一。
另外,自然实验和比较样本也是因果推断方法的有效手段。
自然
实验可以利用外界因素的干预来研究变量之间的因果关系,而比较样
本则可以通过比较不同的群体、场景或方法来确定变量之间的因果关系。
总之,因果推断是社会科学研究中最基本的方法之一,在社会科
学领域有着广泛的应用。
无论采用什么方法,我们都需要清楚地理解
变量之间的因果关系,通过控制其他因素来证实它们之间的因果联系,从而帮助我们更好地理解社会现象、预测未来和制定政策。
因果推断在教育及其他社会科学领域的应用
因果推断在教育及其他社会科学领域的应用大家好,今天我们来聊聊因果推断在教育及其他社会科学领域的应用。
我们要明白什么是因果推断。
简单来说,就是通过分析事物之间的因果关系,来预测未来的发展。
这在我们的日常生活中有很多应用,比如我们可以通过分析过去几年的高考分数线,来预测接下来几年的分数线走势。
那么,因果推断在教育领域有哪些应用呢?下面我们就来一起探讨一下。
我们来看看因果推断在教育管理中的应用。
在教育管理中,我们需要对学生的学习成绩、出勤率等数据进行分析,以便更好地了解学生的表现和需求。
比如,我们可以通过分析学生的考试成绩,来判断他们的学习效果是否良好。
如果发现某个学生的考试成绩一直不理想,我们就需要找出原因,是教学方法不当,还是学生自身原因导致的。
这样,我们就可以针对性地采取措施,帮助学生提高成绩。
因果推断在教育政策制定中也有很大的作用。
政府需要根据社会的发展状况和人民的需求,制定相应的教育政策。
在这个过程中,因果推断可以帮助政府更好地了解教育政策对社会的影响。
比如,我们可以通过分析过去几年的教育政策实施情况,来预测未来几年的政策效果。
这样,政府就可以更加科学地制定教育政策,更好地满足人民的需求。
再来看看因果推断在教育研究中的应用。
在教育研究中,我们需要对教育现象进行深入的分析,以便找到问题的根源。
比如,我们可以通过分析学生的学习成绩、教师的教学水平等因素,来探究影响学生学习成绩的关键因素。
这样,我们就可以针对性地改进教学方法,提高学生的学习效果。
因果推断还可以应用于教育评估中。
在教育评估中,我们需要对教育机构的教育质量进行评价。
通过对教育机构的教育资源、师资力量、教学质量等方面的数据分析,我们可以找出影响教育机构教育质量的关键因素。
这样,我们就可以针对性地改进教育机构的管理,提高教育质量。
我们来看看因果推断在教育技术中的应用。
随着科技的发展,越来越多的教育技术出现在我们的生活中。
比如,我们现在可以通过手机、电脑等设备进行在线学习。
因果推断在教育及其他社会科学领域的应用
因果推断在教育及其他社会科学领域的应用大家好,今天我们来聊聊因果推断在教育及其他社会科学领域的应用。
我们要明白什么是因果推断。
因果推断就是通过分析事物之间的因果关系,来预测事物未来的发展。
在教育领域,因果推断可以帮助我们了解哪些教育方法对孩子的成长更有帮助,从而提高教育质量。
那么,因果推断在教育领域有哪些具体应用呢?接下来,我们就来一一揭晓。
我们来看看因果推断在家庭教育中的应用。
有时候,家长们会发现孩子学习成绩不好,就会想方设法地给孩子报各种补习班、培训班。
但是,这些方法真的能提高孩子的学习成绩吗?其实,关键在于找到孩子学习成绩不好的原因。
因果推断告诉我们,要想提高孩子的学习成绩,首先要找出孩子学习成绩不好的原因,然后针对性地进行改进。
比如,如果孩子学习成绩不好是因为基础薄弱,那么家长就应该从加强基础知识入手;如果是因为孩子缺乏兴趣,那么家长就应该想办法培养孩子的兴趣。
因果推断让我们明白,要想让孩子的学习成绩提高,关键在于找准原因,对症下药。
我们来看看因果推断在课堂教学中的应用。
在课堂教学中,老师通常会根据教学大纲和教材来进行教学。
但是,有时候老师会发现,有些学生学得很好,而有些学生却学得很差。
这时,老师就需要运用因果推断来分析原因。
因果推断告诉我们,要想让所有学生都能学好,就要找出导致学生学得好或差的原因。
比如,如果发现有些学生学得好是因为他们平时勤奋刻苦,那么老师就可以鼓励其他学生向他们学习;如果发现有些学生学得差是因为他们缺乏自信,那么老师就可以多给他们一些鼓励和支持。
因果推断让老师明白,要想让所有学生都能学好,就要找出原因,对症下药。
我们来看看因果推断在教育政策制定中的应用。
教育政策制定者需要根据社会的发展需求和教育的现状来制定相应的教育政策。
这时,因果推断就显得尤为重要。
因果推断可以帮助政策制定者找出影响教育发展的关键因素,从而制定出更加科学合理的教育政策。
比如,政策制定者可以通过因果推断发现,要想提高全民的教育水平,就必须加大对农村地区的教育投入;要想提高女性的教育水平,就必须消除性别歧视。
因果推断在教育及其他社会科学领域的应用
因果推断在教育及其他社会科学领域的应用大家好,今天我们来聊聊因果推断这个神奇的技能,它在教育及其他社会科学领域可是大有作为哦!让我们一起揭开它的神秘面纱吧!我们来了解一下什么是因果推断。
因果关系是指一个事件(因)导致另一个事件(果)的发生。
而因果推断就是通过分析数据,找出事件之间的因果关系。
这在教育领域可是个非常重要的技能,因为它可以帮助我们了解学生的学习过程,找出影响学生成绩的关键因素,从而提高教学质量。
那么,因果推断在教育领域有哪些应用呢?接下来,我们就来盘点一下吧!1. 学生成绩预测假设我们有一个学生A,他的学习成绩一直不理想。
我们可以通过收集他的学习资料,分析他的成绩变化趋势,找出影响他成绩的关键因素。
比如,他的出勤率、课堂表现、作业完成情况等。
这样,我们就可以预测他未来的学习成绩,为老师提供针对性的教学建议。
2. 课程设计在课程设计过程中,我们需要考虑如何让学生更容易地掌握知识。
这时,因果推断就派上用场了。
我们可以通过分析学生的学习数据,找出影响他们掌握知识的关键因素。
比如,学生的学习速度、理解能力、兴趣爱好等。
然后,我们可以根据这些因素调整课程内容和教学方法,让学生更容易地掌握知识。
3. 教育资源分配在教育资源有限的情况下,如何合理分配资源是一个重要的问题。
这时,因果推断可以帮助我们找到影响学生学习效果的关键因素。
比如,学生的学习成绩、家庭背景、所在学校的教学质量等。
通过这些因素,我们可以更公平地分配教育资源,让每个学生都能得到更好的教育。
4. 教育政策制定政府在制定教育政策时,需要考虑如何提高教育质量和公平性。
这时,因果推断也可以帮助政府找到关键因素。
比如,学生的学习成绩、家庭背景、所在地区的经济发展水平等。
通过这些因素,政府可以制定更有针对性的教育政策,提高教育质量和公平性。
因果推断在其他社会科学领域也有广泛的应用。
比如,在心理学领域,研究人员可以通过分析实验数据,找出影响心理行为的关键因素;在社会学领域,研究人员可以通过分析社会现象的数据,找出影响社会结构的关键因素。
因果推断在教育及其他社会科学领域的应用
因果推断在教育及其他社会科学领域的应用大家好,今天我们来聊聊因果推断在教育及其他社会科学领域的应用。
我们要明白什么是因果推断。
因果推断就是通过分析一系列事件之间的关系,找出它们之间的因果关系。
这在我们的日常生活中非常常见,比如我们想知道为什么下雨天会感冒,就需要进行因果推断。
那么,因果推断在教育领域有哪些应用呢?接下来,我将从三个方面给大家详细介绍。
1. 教育政策制定因果推断在教育政策制定中的应用非常广泛。
政府需要根据社会现象来制定相应的教育政策,而这些政策的制定往往需要对各种因素进行深入的分析和研究。
例如,政府可能想要了解某地区的教育水平与经济发展之间的关系,以便制定更加合理的教育政策。
这时,因果推断就可以帮助政府找到这两者之间的因果关系,从而制定出更加有效的政策。
2. 教育资源分配因果推断在教育资源分配中的应用也非常关键。
在一个国家或地区内,教育资源往往是有限的,如何合理地分配这些资源是一个非常重要的问题。
通过因果推断,我们可以了解到不同地区、不同群体之间的教育水平与资源分配之间的关系,从而为政策制定者提供有力的支持。
例如,政府可以通过因果推断了解到某个地区的教育水平与该地区的贫困率之间存在一定的关联性,那么在分配教育资源时,就应该优先考虑这个地区,以提高当地的教育水平和减少贫困率。
3. 教育质量评估因果推断在教育质量评估中的应用也是非常重要的。
教育质量评估的目的是为了了解教育过程中的优点和不足,以便采取相应的措施进行改进。
通过因果推断,我们可以了解到教育过程中的各种因素与教育质量之间的关系,从而为教育工作者提供有益的参考。
例如,教师的教育水平与学生的学习成绩之间可能存在一定的因果关系,那么在评估教育质量时,就应该重点关注教师的教育水平问题。
因果推断在教育及其他社会科学领域的应用非常广泛,它可以帮助我们更好地了解各种因素之间的关系,从而为我们的生活带来更多的便利。
因果推断并不是万能的,我们在使用它的过程中也要注意避免一些常见的误区,比如过度依赖因果推断、忽略其他相关因素等。
数据科学中的因果推断:探索因果推断方法在数据分析与决策中的应用
数据科学中的因果推断:探索因果推断方法在数据分析与决策中的应用摘要随着大数据时代的到来,数据科学在各个领域都发挥着越来越重要的作用。
然而,数据分析往往停留在相关性分析层面,无法揭示变量之间的因果关系。
因果推断作为一门新兴学科,为数据分析提供了更深入、更可靠的洞察。
本文将探讨因果推断方法的原理、常用技术,并结合实际案例,阐述其在数据分析与决策中的应用价值。
1. 引言在数据驱动的决策过程中,了解变量之间的因果关系至关重要。
传统的统计分析方法往往只能揭示变量之间的相关性,而无法确定因果关系。
例如,冰淇淋销量与溺水人数之间存在正相关,但这并不意味着吃冰淇淋会导致溺水。
因果推断方法通过设计合理的实验或利用观察性数据,可以帮助我们识别真正的因果关系,从而为决策提供更可靠的依据。
2. 因果推断的基本原理因果推断的核心思想是通过干预或控制某些变量,观察其他变量的变化,从而推断变量之间的因果关系。
为了实现这一目标,因果推断引入了潜在结果框架、因果图模型等概念。
2.1 潜在结果框架潜在结果框架认为,每个个体在不同干预下都存在潜在结果。
例如,一个人在接受某种药物治疗和不接受治疗的情况下,其健康状况可能会有所不同。
因果效应被定义为个体在不同干预下的潜在结果差异。
2.2 因果图模型因果图模型通过有向无环图 (DAG) 描述变量之间的因果关系。
DAG 中的节点表示变量,有向边表示因果关系的方向。
因果图模型可以帮助我们识别混杂因素、中介变量等,为因果推断提供指导。
3. 常用因果推断方法3.1 随机对照试验 (RCT)RCT 是因果推断的黄金标准。
通过随机分配干预,RCT 可以有效控制混杂因素,从而准确估计因果效应。
然而,RCT 在实际应用中存在伦理、成本等限制。
3.2 倾向得分匹配 (PSM)PSM 利用倾向得分 (即个体接受干预的概率) 将接受干预组和未接受干预组的个体进行匹配,从而模拟 RCT 的效果。
PSM 在观察性研究中具有广泛应用。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
逻辑、想象和诠释:工具变量在社会科学因果推断中的应用*陈云松提要:工具变量(instrumental variable)是社会科学定量分析中解决内生性问题的重要手段,是基于调查数据进行因果推断的前沿方法。
本文在简要介绍工具变量的定义、原理及估算方法的基础上,对实证分析中较为常见的五类工具变量进行回顾梳理,为今后研究寻找工具变量提供了参考。
同时,对工具变量估计量的权重性特征进行了阐述,并结合实例展示了使用工具变量进行因果推断的基本步骤和要点。
最后,就工具变量方法的潜力和局限性进行了剖析。
关键词:工具变量内生性定量分析因果推断一、导言:因果推断的圣杯①在反事实因果的框架之下,②基于调查数据的社会学定量分析要进行因果推断,难度极大。
其主要原因在于,社会学家一旦要证明某个他们所感兴趣的“因”会带来一定的“果”,就必须面对一个永恒挑战:“内生性”问题(endogeneity)。
也即:如果某个潜在的、无法观测的干*作者感谢康奈尔大学摩根(Stephen Morgan)教授、牛津大学斯奈德斯(Tom Snijders)教授和赫斯特罗姆(Peter Hedstr m)教授、香港科技大学吴晓刚教授、中山大学梁玉成副教授、浙江省社会科学院范晓光助理研究员的讨论、批评和建议,同时感谢匿名评审专家和编辑部提出的修改意见以及CGSS2003和CHIPS2002数据团队。
文责自负。
①圣杯(grail)系指耶稣受难时用来盛放鲜血的圣餐杯。
在凯尔特神话中,追寻圣杯是一个神圣而伟大的主题,“有能者居之”,其过程则充满艰险,传说有无数骑士为了寻求圣杯而踏上了不归之路。
②关于社会科学定量分析中的反事实因果框架可参见摩根和温肖普的文章(Morgan&Winship,2007)。
谢宇(2006)曾经以大学教育为例来说明反事实因果的含义。
比如,在分析大学教育对个体的收入是否有因果效应时,对一个上大学的学生,我们不可能获得他不上大学情况下的数据。
因此,社会学定量分析中只能用平均干预效应来替代,也即估算一组大学生(干预组)与一组非大学生(控制组)之间的平均收入差异。
291论文逻辑、想象和诠释:工具变量在社会科学因果推断中的应用扰项,既影响“因”,又影响“果”,那么,利用最小二乘法模型(简称OLS 模型)进行回归分析所得到的估计量就会是有偏误的,而不具有因果推断力。
在实证分析中,无论是经典的教育回报研究(Card,1999),还是我国学界非常关注的关系网、社会资本研究(Mouw,2003,2006;陈云松、范晓光,2010,2011),内生性问题都极为重要且亟待解决。
解决内生性问题的常见方法,主要包括工具变量(instrumental var-iable,简称IV)、固定效应模型(fixed effects model,简称FE)、倾向值匹配(propensity score matching,简称PSM)、实验以及准实验(experiments and quasi-experiments)等等。
近年来,其中不少方法已经逐步在我国社会学界得到评述和应用(梁玉成,2010;陈云松、范晓光,2010,2011;陈云松,2012;胡安宁,2012;魏万青,2012)。
①在反事实因果分析框架下,实验或准实验方法最切近要义。
但社会科学的很多研究主题和领域决定了无法使用实验方法,而其他方法也都具有较大的局限性。
如固定效应模型只能消除时间固定的干扰项,倾向值匹配方法则完全依赖于“可观测因素被忽略”的假说。
相比较而言,对基于调查数据的定量分析,工具变量方法具有独特优势。
不过,工具变量方法在社会学分析中的运用,目前却远远不如它在计量经济学和政治学定量分析中那么广受青睐(政治学和计量经济学研究中工具变量方法的使用参见Sovey&Green,2011;Angrist et al.,1996;Angrist&Krueger,2001)。
但是,近10年来社会学界对于工具变量的态度,正在由不熟悉、犹豫不决向着逐步接纳而转型。
10年前,康奈尔大学的摩根有感于工具变量方法得不到社会学家青睐而专门写成一篇《社会学家该不该用工具变量》的文章(Morgan,2002)。
整整10年后,美国《社会学年鉴》(Annual Review of Sociology)专门刊出了博伦关于工具变量在社会学分析中应用的综述(Bollen,2012)。
这篇重要论文从技术角度详细回顾了2000-2009年间在美国三大顶级社会学刊物(American Sociological Review,American Journal of Sociology,以及Social Forces)刊发的57篇采用工具变量方法的论文。
毫无疑问,工具变量方法逐步被社会学界关注和接纳的过程,充分展示了社会学定量分析方法的演进以及与其他①在社会资本和社会网研究中对内生性问题关注最早的仍是计量经济学界(参见Manski,1993,2000;Moffitt,2001;Durlauf,2002;Durlauf&Fafchamps,2004;Bramoulléet al.,2007)。
391学科在方法论上的进一步融合。
那么,何以说工具变量是定量分析中因果推断的“圣杯”?这是因为,好的工具变量非常难以寻觅,寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭,甚至往往需要研究者的灵感。
但它在模型上的简洁性,它对社会科学想象力、逻辑力和诠释力的要求,既为定量分析提供了因果推断的重要武器,也让分析的过程充满趣味和奇思妙想。
本文将以尽量浅显的语言,总结回顾工具变量的原理、来源、分类和特性,并结合具体分析案例,勾勒工具变量方法的实施步骤和诠释要点。
本文是当前社会学文献中首次对工具变量进行梳理和分类的尝试,也是目前我国社会学定量分析领域第一次对工具变量的全面介绍、评述和案例展示。
二、工具变量的原理:模型之外的力量工具变量的原理最早由菲利普·莱特(Philip G.Wright)在上世纪20年代末提出(Stock&Trebbi,2003),这里仅作扼要介绍和基本的模型推演。
首先,我们给出一个典型的线性回归模型:y=β0+β1x1+βX+ε(1)这里y为因变量,也即“果”;x1为自变量,或者解释变量,也即“因”。
大写的X为外生控制项向量(也即一组假定为外生的其他控制变量,例如年龄、性别等等),ε则为误差项。
如果ε与x1不相关,那么我们可以利用OLS模型对方程进行无偏估计。
然而,如果一个重要变量x2被模型(1)遗漏了,且x1和x2也相关,那么对β1的OLS估计值就必然是有偏的。
此时,x1被称作“内生”的解释变量,这也就是著名的“内生性”问题。
要解决这一内生性问题,我们需要引入更多信息来进行无偏估计。
工具变量的方法就是引入一个外生变量Z,且Z必须满足以下两个条件:与ε不相关,但与x1相关。
或者说,Z仅仅通过影响x1来影响y。
这样,根据工具变量的必备条件,我们可以得到:Cov(Z,x1)≠0;Cov(Z,ε)=0(2)由方程(1)我们可以推导出:Cov(Z,y)=β1Cov(Z,x1)+βCov(Z,X)+Cov(Z,ε)。
再根据方程(2)和X是外生向量的假设,我们得到Cov(Z,y)491社会学研究2012.6=β1Cov (Z ,x 1),也即:β1=Cov (Z ,y )/Cov (Z ,x 1)故此,我们可以对β1进行无偏估计:^β1=∑ni =1(Z i -珔Z )(y i -珋y )∑n i =1(Z i -珔Z )(x 1i -x 1)(3)方程(3)里的^β1,也就是工具变量估计量。
如果用上述公式还不能直观清晰地表达工具变量的原理,那么我们可以用下面的示意图来做一简要说明。
在图1中,模型的范围用虚线框来表示。
工具变量Z 处于模型之外(也即在虚线框之外),因此是完全外生的。
①此时,工具变量Z 只能通过影响自变量x 1而间接影响因变量y 。
如果工具变量Z 和自变量x 1密切相关,那么,只要工具变量Z 有了增量变化,就必然会对自变量x 1产生一个来自模型之外的冲击。
如果自变量x 1和因变量y 之间真的存在因果关系,那么Z 对x 1带来的冲击也就势必传递到y 。
这样,在一系列的假说之下,只要Z 对y 的间接冲击能够被统计证明是显著的,我们就可以推断出x 1对y 必然有因果关系。
利用对Z 与x 1相关的估算,以及Z 与y 的间接相关的估算,理论上我们就可以推导出x 1和y 之间真实关系的大小β1。
因此,图1非常清晰地展示了工具变量的原理:利用来自模型之外的外生差异进行无偏估计。
较为常见的工具变量估算方法是两阶段最小二乘法(two-stage least-squares ,也即2SLS )。
在回归的第一阶段,内生的因变量x 1放在模型左侧,而右侧则为原模型中全部X 以及工具变量Z 。
然后对每一个x 1进行预测赋值。
在第二阶段,模型左侧是因变量y ,右侧则为X 和x 1的第一阶段预测值。
工具变量估计量肯定是一致的(参数估计的一致性指当样本容量趋向无穷大时,参数估计趋近于参数真值,也就是收敛于参数真值)。
不过其估计方差也比相应的OLS 估计方差要大。
工具变量Z 和自变量x 1之间的关系越紧密,则估计方差越小。
要确保工具变量分析结果稳健可信,我们必须首先检验工具变量的合法性,同时还要观察工具变量模型和一般的单方程模型(如OLS 或Probit 模型)之间的分析结果有无系统差异。
这里,有几个至关重要591论文逻辑、想象和诠释:工具变量在社会科学因果推断中的应用①当然,模型内的干扰项和主解释变量以及因变量之间的关系也可能是逆向的。
社会学研究2012.6图1模型之外的力量:工具变量原理的统计量的判别是必不可少的。
(1)Z和x1必须是强相关。
否则,就会带来弱工具变量问题,导致估计量有偏。
在使用二阶段估计法时(2SLS),一般我们可以依赖F统计量来判断两者之间的关系强弱。
一般而言,如果F统计量大于经验值10,则不存在弱工具变量问题(Stock &Yogo,2005)。
(2)工具变量的外生性是无法用统计方法直接验证的。
不过当我们同时使用多个工具变量时(也即模型被过度识别时overidentified),则可以进行沙根检验(Sargan Test);此外,有一些研究会把工具变量直接加入主模型进行偏系数的显著性检验,不过严格意义上这一做法并不具有有效性。
(3)豪斯曼内生性检验(Hausman Test of Endogeneity),用以检测OLS模型和工具变量模型之间是否存在系统差异。
如果有,则应采纳工具变量估计量。
(4)瓦尔德内生性检验(Wald Test of Endogeneity),用以检测单方程Probit模型与IV-Probit模型之间是否存在系统差异。