从统计学的视角看实验经济学
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
经济理论问题
+生产力研究,No.15.2008
从统计学的视角看实验经济学
王维红,顾庆良
(东华大学旭日工商管理学院,上海200051)
【摘要】实验经济学将实验的方法引入经济问题研究,是经济学方法论的一次重大变革,实验方法正逐渐成为经济学研究的一种重要工具。
然而,由于实验经济学尚处于发展的初始阶段,对于经济实验的方法还很少有人进行深入的研究。
文章指出,实验经济学虽然是一个全新的研究领域,但经济实验本质上是一种统计实验,应遵循统计实验研究的基本方法和基本规律。
实验经济学可以借鉴统计学的研究方法,得到更大、更快的发展。
【关键词】实验经济学;信度;效度;实验设计;统计检验
【中图分类号】F011【文献标识码】A【文章编号】1004-2768(2008)15-0010-03
实验经济学将实验的方法引入经济问题研究,是经济学方法论的一次重大变革,实验研究方法正逐渐成为经济学研究的一种重要工具。
然而,由于实验经济学尚处于发展的初始阶段,对于经济实验的方法还很少有人进行深入的研究,比如实验观测次数的问题、实验结果的信度和效度问题、实验结果的检验问题等。
本文将从统计学的视角对这些问题做初步的思考。
一、实验方法在经济学研究方法论上的意义及应用中存在的问题
(一)实验经济学
实验经济学的起源可以追溯到20世纪30年代到60年代,大致可分为三个源头:一是在1931年,萨斯通(Thurstone)首次采用实验的方法来确定个体的无差异曲线;二是在1950年决瑟尔和弗鲁德用实验的方法模拟著名的“囚徒困境”问题并得到了与纳什均衡不一致的实验结果。
三是哈佛大学的爱德华·张伯伦(EdwardH.Chamberlin)等人在1942年通过建立一个实验性市场来检验竞争性市场的均衡条件,也得到了与竞争性均衡结果不一致的实验结果。
随后,实验参加者之一史密斯采用双向口头拍卖的集中交易实验方式,发现即使在很少的信息及适度数量的参与者的情况下,市场也能很快地收敛到竞争性均衡,“大量的、具有完美信息的经济代理人”不是市场效率的必要条件。
1962年史密斯将论文“竞争市场行为的实验研究”发表于权威杂志《政治经济学》,这篇论文被认为是实验经济学诞生的标志,弗农·史密斯也因此被尊称为实验经济学之父。
实验方法是任何学科发展到一定阶段所共有的研究方法,经济学也不例外。
实验经济学就是用“受控实验”的方法来研究经济问题。
所谓“受控实验”,是指实验具有可控制性和可重复性。
虽然用实验方法研究经济问题,可追溯至上百年前甚至更早,但是真正进行经济学“受控实验”距今只有几十年的时间。
2002年,弗农·史密斯获得了诺贝尔经济学奖,这表明实验经济学的研究方法已得到了各国学者的普遍认同。
如今,实验研究方法已被广泛应用于行为经济学、产业组织理论、博弈论等许多方面并取得了丰硕的成果。
(二)实验方法在经济学研究方法论上的意义
实验是“科学”实证和发现的最基本也是最有力的工具之一,实验方法对于经济学研究方法论的重要意义在于:
1.它表明经济理论的环境和机制基础是可以再造或模拟的,经济理论完全具备实验检验的条件。
之前,人们一直认为社会科学是不可实验的。
比如诺贝尔经济学奖获得者萨缪尔森在他和诺德豪斯合著的《经济学原理》中说:“经济学家在检验经济法则时,无法进行类似化学家或生物学家的受控实验,因为他们不容易控制其他重
【收稿日期】2007-01-22
【作者简介】王维红(1966-),女,山东济南人,东华大学旭日工商管理学院副教授、博士研究生,研究方向:应用统计学,供应链管理;顾庆良(1949-),男,上海人,东华大学旭日工商管理学院教授、博士生导师,研究方向:市场营销。
!"
要因素。
所以只能像天文学家或气象学家那样满足于观测。
”实验经济学否认了这种观点。
实验经济学就是要再造经济理论的环境和机制基础,用实验的观察结果来检验理论、发现新的经济规律或评价经济政策的效果。
2.经济学中许多重要的假定需要用实验去验证。
经济学中许多很重要的假定需要用实验去验证,例如,经济学最基本的假设是“理性人”(经济人)假设,即假设所有人(或法人)都是追求利益最大化的。
这个假定虽然给经济学研究带来许多方便,但也遭到了许多学者的质疑,现实中也有许多不符合该假设的现象。
事实表明,人不仅有利己性,也有利他性。
在现实中存在着纯粹的利他行为,即不期待别人的回报而将他人利益作为行动本身目的的行为。
人不是纯粹的“经济动物”,人的行为受情感等非理性因素的影响。
实验经济学认为将经济参与人定义为可犯错误的、有学习能力的行为者更具有现实的合理性。
因为经济参与人在决策时并不经历与经济学家相同的思考和计算过程,比如鲁斯(Roth)的实验研究就表明参与人是低理性的,因此,在实验经济学中代之以实证命题,作为理论和实践探讨的出发点。
3.对传统的经济解释的方法进行了拓展。
过去,经济学家一般运用逻辑演绎或构造计量经济模型的方法来解释经济现象。
在构造的模型越来越高深复杂的同时,如何用实际经济数据来检验这些模型与经济现实是否相符却成为一个难以解决的问题。
首先,实际观察数据具有不可重复性,即历史不可能重复,不可能重现与历史完全相同的环境;其次,实际观察数据是众多影响因素混合在一起发生作用的结果。
我们无法将众多影响因素区分开,只研究一部分因素的影响结果。
实验经济学则可以弥补这些缺陷。
实验研究方法至少具有两个优点:一是利用标准化的实验方法可使实验具有可重复性,也就是说,在此条件下,无论谁去进行实验都可以得到类似的结果;二是可控制性,将全部因素中一部分因素固定不变,来研究另一部分因素对实验结果的影响,即通过控制某些条件来达到分离因素的目的。
(三)将实验方法应用于经济学研究时存在的问题
1.实验结果的信度和效度问题。
实验经济学继承了自然科学重视经验的实证传统,在思维和分析方式上都采用经验归纳的方法,认为:“在实验室中的微观经济中已被验证的关于个人行动以及制度执行的命题,在其他条件不变的同样状况下,在离开实验室的微观经济中仍然适用”,史密斯将这种思想称为“并行原理(paral-lelism)”。
然而,从统计学角度看,实验的结果只是变量的全部取值中的一个样本,根据样本推断总体只有一定程度的信度(可靠性)和效度(有效性)。
人们在应用“并行原理”时,存在犯错误的可能性。
事实上,在将实验结果应用于现实经济中时,应承认实验结果不是百分之百可靠,才是一种科学的态度。
2.没有根据信度和效度的要求来设计实验。
同其它任何实验一样,为了保证实验结果达到预期的信度和效度,经济实验也要根据研究目的来设计实验,包括样本容量的大小及样本抽取方法,试验过程如何进行(例如,将哪些变量相对固定)等。
然而我们注意到,在实验经济学中,有些经济实验,没有注意到样本的代表性问题;有些经济实验,样本容量不够,实验次数很少;也有些经济实验,实验方法值得商榷等等,这些都在一定程度上影响了实验结果的信度和效度。
例如,在早期的实验经济学文献中,几个经典的实验都是以学生为实验对象,因此有人质疑实验结果是否反映了客观现实。
认为有处理大量资金经验的公司领导人与尚未接触社会的学生思考方式不同,假如以学生为实验对象来研究资本市场,实验结果缺乏可靠性。
从统计学意义上来说,这种质疑是有道理的。
又如,对于Kahneman和Tversky在1979年的研究中所发现的“10个被试中有7个人选择以25%的概率损失6000元,而非以50%的概率同等可能地损失4000元或2000元(意即各25%),尽管两种选择的期望值完全相同,而前者有更大的风险”这个结论,我们就有理由怀疑:根据一个容量为10的样本所做出的结论可靠性有多大?
3.经济实验的结果也需要统计检验。
经济实验结果也要进行统计检验,检验可控变量对实验结果影响是否显著。
二、经济实验的设计与统计处理
(一)经济实验应遵循一般统计实验的设计与检验方法
可控制性与可重复性是统计实验的基本前提。
统计实验就是在控制某些变量的前提下,进行大量重复实验,观察实验结果,用样本推断总体。
经济实验本质上是一种统计实验,应遵循一般统计实验的设计与检验方法。
1.样本选取。
在经济实验中,被试者只是所研究的目标群体的一个样本,根据统计学理论,样本的选取必须具有代表性,样本的代表性直接决定了实验结果的可靠性。
为了保证样本的代表性,样本应从目标总体中抽取,并应满足样本的抽取原则——
—随机原则,可用简单随机抽样、整群抽样、分层抽样或系统抽样等组织方式,用重
!"
复抽样或不重复抽样的方法抽取样本。
2.样本容量。
根据统计学理论,要使实验结果具有一定的精确性和可靠性(置信度),样本容量需要足够大。
因此,实验前必须首先确定必要的样本容量。
3.实验设计。
实验设计是实验工作的核心环节。
一般来说,应当根据实验目的来设计实验。
实验设计既是科学又是艺术。
实验设计按其复杂程度可分为单一处理设计、匹配处理设计和多重处理设计。
单一处理设计研究单个变量对实验结果的影响,一般用于对某种理论的适应性检验;匹配处理设计进行单个变量在不同条件下实验结果的对照研究,一般用于对某种理论或政策的评价;多重处理设计可同时考察多个变量或一个变量不同水平下的变化效果,因而效率较高。
例如,正交设计法是一种被广泛应用的多重处理设计方法,它借助预先设计好的“正交表”来安排实验和对数据进行统计分析。
这种方法的优点是能够大大减少实验次数。
比如某问题受8个因素影响,若每个因素取5个水平,需要做58=390625次实验,但用正交实验设计法实验次数不多就可以掌握其内在规律。
4.统计检验。
统计检验的目的,是检验实验中可控变量对实验结果的影响是否显著。
统计检验方法大致有两类:参数检验方法和非参数检验方法。
参数检验方法一般用于服从正态分布的数值型变量。
而在经济实验中,由于研究的往往是列名尺度或顺序尺度的变量,或者虽然研究的是数值型变量,但由于人的行为是受情感、心理、社会等众多因素影响的一个复杂过程,很难假定总体的分布形态,因此,常使用非参数检验方法,如二项式检验、!2检验、Kolmogorov-Smirnov检验、Fisher精确概率检验、Wilcoxon检验、Mann-Whitney检验以及随机化检验等,应根据检验目的来选择检验方法。
当然,在适合使用参数检验方法时,应首选参数检验方法。
(二)经济实验的特殊设计规范
当然,经济实验毕竟有其特殊性,因此它有自己特殊的设计规范。
比如,史密斯认为,为了使在实验室中所进行的实验能够反映现实经济情况,经济实验必须遵循以下实验设计规范:
1.报酬的单调性(Monotonicity):被试者(在实验经济学中实验参与者称为被试者:subjects)愿意接受报酬并做出真实的反映,同时,被试者认为报酬量越多越好。
即:设P(m,u)表示被试的偏好函数,其中m是报酬量,
u是其他因素,则当m1>m2时,P(m1,u)>P(m2,u),当P对m可微时,有"P
>0。
为满足这个条件,我们一般使用
#m
货币作为报酬手段。
2.报酬的显著性(Saliency):在实验中,被试者行为与其获得报酬有关,并足以向外界传递信息。
也就是说,被试者的行为与报酬的关系,应当能突出显示实验主持者所希望的制度,被试者应理解这种制度。
因此,假使给予每个被试者同样的报酬,就不满足报酬的显著性。
在“市场实验”中,假使按照每个人在实验中的“利润”给予报酬,则可满足报酬的显著性。
3.报酬的优超性(Dominance):在实验中,被试者的效用变化来自实验报酬,除此之外的其它原因可以忽略不计。
为满足这个条件,在实验中一般是在让报酬增加时,让比较明显的其它u中的因素固定不变。
4.实验的支配性:在实验中,被试者自己支配其做出行动所需的费用。
5.实验的隐私性:在实验中,作为实验者要避免表明实验的目的,而且在大部分实验中,应让被试者对其它被试者的报酬不了解或无法判断,仅根据他自己报酬做出决策。
6.实验的并行性:实验条件可以重复,其设计方法也可以用于类似实验。
上述实验设计规范主要是针对如何将各种因素对被试者的行为决策的真实影响测试出来而设计的。
总之,实验经济学虽然是一个全新的研究领域,但经济实验本质上是一种统计实验,应遵循统计实验研究的基本方法和基本规律,实验经济学可以借鉴统计学的研究方法,得到更大的发展。
【参考文献】
[1]Friedman,D.&Sunder,S.ExperimentalMethods:APrimerforEconomistsM.CambridgeUniv.Press,1994.
[2]Weizsacker,G.IgnoringtheRationalityofOthers:EvidencefromExperimentalGames.HarvardBusinessSchoolworkingpaper.
[3]弗农·史密斯.经济学中的实验方法[A].新帕尔格雷夫经济学大词典[C].北京:经济科学出版社,1996.
[4]叶泽方,方齐云.实验经济学的方法论演进[J].经济学动态,2002,(9).
[5]唐盛明.实用社会科学研究方法[M].上海:立信会计出版社,1998.
[6]蔡志明.经济学中的实验方法与技术[J].华东师范大学学报(哲学社会版),1997,(3).
[7]李增刚.行为经济学和实验经济学的基础2002年诺贝尔经济学奖获得者思想介评[J].经济评论,2002,(6).
(责任编辑:X校对:R)!"。