组织行为学的研究方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
组织行为学的研究方法
研究目的
研究术语
评价研究
研究设计
研究中的道德
小结
对于每一个复杂的问题,都有一个简单的、精巧的、错误的解决方案。
——H.L.门肯(H.L.Mencken) 几年前,我的一位朋友声称他看到一项研究结果,终于知道了如何才能爬到一家大公司的最高层的奥秘,为此他欣喜若狂。
虽然我很怀疑对这样一个问题是否有一个简单的答案,但为了不打击他的热情,我还是向他请教了那项研究结果。
你猜他说什么?我的朋友告诉我说:那就是参加大学运动会!当时我的反应用诧异这个词是绝不足以形容的,于是我向他详细请教。
此项研究对象包括全美500家大公司1700名成功的高级管理人员,研究者发现,其中半数的人参加过校际水平的大学运动会。
[1]我这位擅长统计的朋友告诉我,既然在所有大学生中仅有不足2%的人参加过校际运动会,那么,此项研究结论纯属偶然发生的事件的概率不到千万分之一。
总结完他的分析后他对我说,根据这项研究,我应该鼓励管理专业的学生们组建一支学校运动队。
当我暗示他这个结论可能靠不住时,我的朋友多少有点局促不安。
接受调查的经营人员都是男性,他们是20世纪40年代和50年代的大学生,那么,这项研究结果同样适用于21世纪的女大学生吗?并且,这些高管人员并不是典型的大学生。
他们当中的大部分都就读于普林斯顿、马萨诸塞等著名私立大学,这些大学参加校际间运动会的学生占相当大的比例,而这些学校的学生并没有怎么碰过足球或篮球,他们参加的是诸如高尔夫球、网球、棒球、越野长跑、划艇、橄榄球之类的小项运动。
而且,研究人员也有可能混淆了因果关系的方向,即或许是那些具有内在动机和相当能力升到大公司最高职位上的个体偏爱于学生运动会这样的竞技活动。
经我这么一说,我这位朋友倒真是因为误用研究数据而感到有些不好意思。
当然,这样的人远远不止他一个。
我们总是被各种各样的报告所包围,诸如老鼠体内某些物质与癌症有关的实验报告,以及大学生对于性的态度发生变化的调查等等。
在这些类似的研究中,多数是经过精心设计的,并明确指出了调查结果的意义及其局限性。
但也有些研究设计粗糙,得出的结论不是令人十分怀疑,就是毫无意义。
这个附录的目的绝不是使你一下子成为一个研究人员,而是想提高你作为行为科学研究成果的消费者的意识。
了解一些研究方法,不仅能使你对本书所介绍的信息和结论有更深刻的认识,并审慎地考察这些研究的数据收集过程,还能够使你日后遇到商业或专业期刊中组织行为学的研究报告时,做出更老到的评价。
所以,理解有关行为科学的研究非常重要,因为:(1)它是本书中有关理论的基础;(2)它对你未来阅读研究报告以及评价它们的价值大有
裨益。
研究目的
研究涉及系统的收集信息,其目的在于帮助我们探索真理。
虽然我们永远也不可能发现绝对的真理——在组织行为学领域,绝对真理意味着准确地判断任何人或群体在任何组织环境中可能的行为表现——当前进行的研究只是补充了已有的组织行为学知识体系,具体表现为以下几种方式:支持某些理论;对其他理论提出质疑;以新理论取代旧的缺乏证据的理论。
研究术语
研究人员在彼此之间或同外界交流时有他们自己的常用词汇,下面将简明扼要地对你在行为科学研究中可能遇到的一些比较常见的术语下个定义。
[2]
变量变量是能被测量的,可能在数量、强度的任一方面或两方面都发生变化的一种一般特征。
本书中出现的一些组织行为学的变量的例子有工作满意度、员工生产率、工作压力、能力、个性、群体规范等。
假设对于两个或多个变量间的关系所作的试探性解释称为假设。
我的那位朋友所说的参加大学运动会可以导致登上大公司最高职位就是一个假设。
除非被实证研究所证实,否则假设就只能是试验性的解释。
因变量因变量是受自变量的影响而发生变化的反应变量。
在假设中,它是研究人员着重解释的变量。
回到前面说的例子,在我的那位朋友的假设中,因变量是指能够成为高级管理人员这一事件。
在组织行为学的研究中,常见的因变量有生产率、缺勤、流动、工作满意度及组织承诺。
[3]
自变量自变量是导致因变量变化的原因。
在前例中,参加校际间的学生运动会便是我朋友的假设中的自变量。
在组织行为学中,通常研究的自变量包括智力、个性、工作满意度、经验、动机、强化模式、领导风格、报酬分配、甄选方法以及组织设计。
你可能已经注意到了,组织行为研究者常常把工作满意度既作为自变量又作为因变量。
这并不是什么错误,而恰恰反映出具体变量的命名要依据其在假设中的位置而定。
如在“工作满意度的提高会降低流动率”这句话中,工作满意度是一个自变量;而在“加薪使工作满意度提高”这句话中,工作满意度又成了一个因变量。
调节变量调节变量可以减弱自变量对因变量的影响,它也能被认为是权变变量:如果X(自变量),那么Y(因变量)会出现,但只有在Z(调节变量)存在的情况下才能发生。
我们不妨把它转换成真实生活中的例子。
我们可以说,如果增加工作领域中直接监督的程度(X),则会提高工人的生产率(Y),但这种影响受到所从事任务的复杂性(Z)的制约。
因果关系根据定义,假设中暗含着一种关系,也就是说,它意味着一种预先假设的原因与结果的关系。
自变量的变化被认为会引起因变量的变化。
然而,在行为研究中,如果发现二者有关联的话,很可能做出不正确的因果假设。
例如,早期行为科学家发现在员工满意度和生产率之间存在着某种关系,他们得出结论,一个愉快的工人会是一个高产的工人。
随后的研究证实了这种关系,但这个关系在箭头的指向上却发生了变化。
有关事实明确地显示,高生产率会导致满意度的上升,而非后者导致前者。
相关系数了解两个或多个变量间的某种关系是一回事,而了解这种关系的强弱程度则应另当别论。
相关系数这个术语就是用来表示变量间的这种强度的,表示为从-1(完全负相关)到+1(完全正相关)。
当两个变量变化方向相同时,相关系数为正数;当两者变化方向相反,即此消彼长时,相关系数则为负数;若两者各自独立发生变化时,我们定义相关系数为零。
例如,研究人员想调查一组员工对工作的满意程度,通过公司的缺勤记录,研究人员可对工作满意度分数和个人缺勤记录计算相关系数,来确定是否工作满意度高的人比工作满意度低的员工出勤情况更好。
假设研究人员发现工作满意度和缺勤率之间的相关系数为+0.5,能说明两者之间的相关程度确实很高吗?遗憾的是,还没有精确的数字界限来区分相关关系的强弱。
这时,需要用标准的统计检验来确定相关关系是否显著。
还有一点需要指出的是相关系数仅仅用来测量两个变量之间的相互关联程度,数值大并不意味着一定存在因果关系。
比如,妇女裙子的长度与股票市场的价格长期以来被认为是高度相关的,但你必须注意这并不意味着二者之间存在因果关系。
在这里,高相关系数更可能来自偶然关系,而不是预测关系。
理论我们最后要介绍的术语是理论。
理论所描述的是一套系统的相互关联的概念或假设,旨在解释或预测某些现象。
在组织行为学中,理论也经常被称为模型。
在本书中两者可以通用。
组织行为学中的各种理论不胜枚举。
例如,关于如何激励员工的理论,关于最有效的领导风格的理论,解决冲突的最好方法以及如何获得权威的理论等等。
在有些情况下,我们至少可以举出五六个相互独立的理论来解释和预测某一具体的现象。
在这种情况下,难道是只有一种理论是正确的,其他的都错了吗?事实显然并非这样,这只是反映了科学的运作。
研究人员检验和修正过去的理论,并在恰当的时候提出新的被证明具有更高解释力和预测力的模型。
众多理论都试图解释共同的现象,只不过说明组织行为学是一门充满活力的学科,并且在不断成长和发展。
评价研究
作为一个潜在的行为科学研究的用户,你应当时时谨记一条格言:“货物出门,概不退换”——让自己倍加小心!在评价任何一项研究时,你都需要提出以下三个问题。
[4]它有效吗?研究是否确实测量了它要测量的内容?近年来许多心理测验均因为不能准确测量出工作申请者能否胜任工作的能力而被摒弃不用。
但效度问题涉及所有研究,所以如果你看到某项研究探讨高凝聚力的工作团队与高生产率之间的关系,应该了解每一个变量是如何测量的,并且是否真正达到了测量的目标,真的测出了想测的内容。
它可信吗?信度是指测量结果的一致性。
你若每天都用一支木制标杆来测量自己的身高,那么你所得到的结果是高度可信的;但是如果你用的是弹性圈尺的话,则你身高的测量结果就可能出现显著差异。
当然,你的身高并不会每天都在变,测量结果的变化是由测量工具的不可靠造成的。
因此,假设一个公司让一组员工来完成一份信度高的工作满意度调查问卷,6个月后利用同一问卷再测一次,只要在此期间没有影响员工工作满意度的重大事件发生,我们可以预期,两次测量的结果应该是相当接近的。
它具有普遍性吗?研究的结果是否可以概括到最初参加研究的人员以外的群体?例
如,应该小心那些以大学生为被试者的研究的局限性。
这些研究的结论是否同样适用于实际工作中的全日制员工呢?同样,以加拿大新斯科舍省马洪贝镇的10个核电厂的工程技术人员为调查对象得出的有关工作压力的研究结果,对劳动者总体来说是否具有普遍性呢?
研究设计
研究工作是一种此消彼长的平衡过程,信息的丰富性往往使研究的普遍适用性大打折扣。
研究人员越是尽力控制干扰变量的作用,其研究结果的实用性就越低。
高精度、普遍适用性和严格控制往往意味着昂贵的代价。
研究人员在确定研究对象、研究地点以及收集数据的方法时,总要做出某种程度的妥协。
好的研究设计并非完美无缺,但它们能够确切地反映出所要解决的问题。
在评价下述五种常用的研究设计的优缺点时,你必须铭记这些事实。
这五种研究设计方法是案例研究、现场调查、实验室实验、现场实验以及聚合定量评价。
案例研究你手头如果有一本本田宗一郎的自传,就会知道他的童年是多么穷困潦倒。
他开办过一间小型车库,组装过摩托车,并最终生产汽车,这些经历使他最终创立了世界上最大、最成功的公司。
让我们再换一个场景,假设你正在上一堂工商管理课程,教师给你们每人发了一份长达50页的材料,内容是有关沃尔玛和凯马特两家公司的历史,其中描述了各自的经营战略、管理哲学、商品购买计划,还包括它们的资金平衡表及收入报告。
教师要求你们阅读这些材料,分析数据,并且找出近年来沃尔玛远比凯马特成功的原因。
本田的自传和有关沃尔玛与凯马特的材料就是案例研究。
因为来自真实的生活情境,所以案例研究提供了对一种情境的深层次分析,它们一般是非常详尽的描述,提供了有关个体、群体及组织的翔实的资料。
案例研究的资料来源于观察,有时借助于访谈以及对文献资料的复述来获得支持证据。
案例研究也有其不足之处,它不可避免地带有观察者的认知偏见和主观解释,案例的阅读者也会受到观察者或案例撰写者所选择的案例内容的限制。
同时,案例的适用范围也会因信息的广度和深度的扩展而降低。
因为根据一个样本得出的结论要概括到其他情境的话往往带有一定的危险性,所以案例研究很难证实或拒绝某个假设。
但是,你又不能否认案例研究确实提供了深层次的分析。
对于初期的探索性研究和对组织中的真实问题进行评价,案例研究是非常有效的手段。
现场调查有人设计了一份很长的问卷,用来评价拥有几十亿美元资金的大公司的道德政策、正式的道德结构以及规范化的活动,如道德培训以及高层管理人员参与这些项目的程度。
通过《财富》500强工业公司和500强服务业公司的公共事务部或对外联络部接触,了解到各公司负责道德和规范问题的管理者的名字和通讯地址,问卷连同一封解释研究性质的说明信一起邮寄给这1000位管理者。
其中的254人寄回了完整的问卷,回收率略高于25%。
调查结果表明,77%的公司有正式的道德准则,54%的公司有专人负责处理道德问题。
[5]以上研究即为一典型的现场调查,这种调查通过选择有代表性的样本(本例中为公开上市的美国大公司的1000名高管人员)来代表更大的要考察的群体(lO亿美元以上的美国公司)。
研究者针对自己感兴趣的具体特点(道德项目的内容与结构以及实践),采取问卷或访谈的形式收集数据,让被调查者回答。
调查项目的标准化设计便于研究的量化、分析和总结,使研究人员能够根据代表性样本推断更大的总体。
现场调查使得做研究很经济,它只调查样本,而不必调查总体中的每个成员,因此减少了费用。
(例如,美国有5000家公司年销售额超过10亿美元,因为有些是私营公司,不向公众披露它们的财务数据,所以这些公司不包括在《财富》排名榜上)。
此外,正如道德研究所展示的,现场调查为了解人们对具体问题的感受或者他们报告自己的做法的方式提供了一条便利可行的途径。
另外,现场调查的数据极易量化。
但是,它也存在潜在的弱点。
第一,邮寄问卷很少能够全部回收,低回收率带来的问题是,根据答复者得出的调查结论是否也能推广到那些未做答复的调查对象?第二,通过调查的形式较易于了解到被调查者的态度或想法,却不易于了解其行为。
第三,被调查者可能受到社会赞许性的影响,即被调查者的回答往往是他们认为研究者想听到的答案。
第四,由于现场调查关注的是具体问题,因此不容易获得深层次的信息。
第五,样本的选择决定了调查结果的普遍性。
例如,《财富》500强高层管理人员的回答丝毫无助于我们了解中小企业和非营利性组织的情况。
总而言之,即使设计完好的现场调查也不得不以放弃信息深度为代价,以获得信息的广度、普遍性和经济性的效果。
实验室实验下面的研究是一个实验室实验的经典例子。
研究者斯坦利·米尔格拉姆(Stanley Milgram)想测量人们究竟能在多大程度上服从命令,于是他设计了一个学习实验,他让被试扮演教师的角色,研究者告诉这些教师,在每次学生回答问题出错时都要给予电击惩罚。
斯坦利想弄清楚被试是否会听从命令,若电击强度加大,被试服从指挥的意愿是否会降低。
为了验证这些假设,斯坦利雇用了一些被试。
他让每一个被试相信,实验是为了调查惩罚对记忆效果的影响。
他们的任务是扮演教师,当学生在学习测验中出现错误时,就对他们实施惩罚。
惩罚是通过电击来实现的。
被试坐在一个有30个级别的电击发生器前,电压从O开始,以每级15伏递增至450伏。
在相应的电压上都有标志,从15伏“轻量电击”到450伏“危险:强烈电击”。
为了增加实验的真实性,被试在隔壁房间里感受了45伏的电击,并看到了学生——一位温和愉快的50岁左右的男士,被绑在电椅上。
实际上,电椅仅仅是道具而已。
学生是演员,电击是录音电话声,但被试并不知道真相。
实验开始了,被试坐在电击发生器前,根据研究者的指导从最低水平的电击开始,每当学生犯了错误或未做出反应,便会增加一级电击强度。
由于学生犯错误太多,电压的强度迅速增加。
当电压达到75伏时,被试听到了来自学生的言语反馈:学生开始哼唧和呻吟;150伏时,他要求退出实验;180伏时,学生大叫着说他再也不能忍受了;到300伏时,他恳求退出实验,并尖叫着说心脏承受不了啦,然后就再也不回答任何问题了。
大多数被试提出了抗议,并担心增加电击强度会伤害学生的心脏,置其于死地。
他们不想再继续这项工作了。
对于被试的犹豫和反抗,实验者始终只有一句话:“你们别无选择,只有继续。
你们的工作就是惩罚学生的错误。
”当然,被试事实上是有选择的,他们完全可以站起来,走出实验室。
大多数被试都不同意对学生加重惩罚,但是不同意并不等于不服从,62%的被试将电击一直增加到了450伏,其余38%的被试所实施电击的平均电压也接近于370伏![6]
在实验室实验中,如斯坦利设计的实验,研究人员创设出一种人工环境,然后在控制条件下操纵自变量。
由于其他因素保持不变,研究人员最后就可得出这样的结论,即因变量的任何变化都是由于对自变量的操弄或变化所引起的。
注意,由于控制了条件,研究人员能够推测出自变量和因变量之间的因果关系。
实验室实验为达到精确性和可控性而牺牲了现实性和普遍性。
它对变量的控制程度更高,测量更准确。
但是,实验室研究的结果常常难以推广到实际的工作情境中。
这是因为人工实验室永远难以仿造出真实组织的错综复杂和微妙之处。
另外,许多实验室实验所处理的现象不能在真实情境中重复或应用。
现场实验下面是现场实验的一个例子。
一家大公司的管理人员想要了解每周4天工作制对员工缺勤率的影响,更确切地说是4天内每天工作10小时与传统的5天内每天工作8小时相比,缺勤率是否会有所降低。
由于这家公司规模较大,它拥有几家制造厂,所雇用的工人情况基本相同。
于是管理人员在克利夫兰选择了两家工厂进行实验。
显而易见,两个规模相同的工厂,如果一家设在密西西比的农村,而另一家在哥本哈根城城区,耍对这样的两家工厂进行比较是不合理的。
因为像民族文化、交通状况、天气等因素可能比工作日的变化更能解释二者之间可能出现的任何差异。
其中一家工厂为实验组,工人们实行4天工作制,另一家工厂则是控制组,即工人们仍旧按5天工作制进行工作。
两家工厂分别记录了18个月内的缺勤情况。
之所以持续时间这么久,是为了尽量减少实验工厂的工人们由于新奇感可能给实验结果带来的误差。
18个月后,管理人员发现,实验工厂的缺勤率下降了40%,而在控制工厂却只下降了6%。
基于实验设计的可行性,管理人员认为引起实验工厂缺勤率大幅度下降的原因是工作日的压缩。
现场实验除了在真正的组织中进行外,与实验室实验没有多大差别。
自然的场景比实验室更真实,这就增加了实验的有效性,却不利于控制。
另外,如果控制群体不能维持恒定,外界因素的干扰定会降低控制效果,如工人罢工、大规模裁员、公司重组等等。
现场实验的最大问题可能与选择组织时的偏差有关。
并非所有的组织都允许外部研究人员进行实地的调查研究,尤其是那些遇到严重困难的组织。
而大多数已发表的组织行为学研究都是由外部研究人员所做的,因此,很可能所发表的研究报告几乎毫无例外是在成功的和管理有效的组织中进行的,这就是选择偏差。
总体而言,在以上所讨论的四种研究设计中,现场实验是最有效和最具有普遍性的。
除了成本较高外,它的确是以最小代价取得了最大的成就。
[7]
聚合定量评价组织行为校正对任务绩效的影响究竟有多大?已经有大量的现场实验试图对这个问题做出说明。
遗憾的是,各种研究所得出的结果相去甚远,使得人们很难总结出一个统一的结论。
为了协调各种各样的结论,两位研究人员收集了过去20年里所有关于组织行为校正对任务绩效的影响的实证研究,做了一个综述。
[8]排除了那些包含不恰当的信息或者没有定量数据的研究,以及那些没有满足行为矫正条件的研究,研究者最后筛选出19篇研究报告,包含了2818个人的数据。
借助于一种被称为元分析的聚合分析技术,研究者能够定量地整合所有的研究,并最终得出结论,在实施组织行为校正干预以后,个人的平均任务绩效提高了50~67个百分点。
这些研究者做的关于组织行为校正与任务绩效的关系的综述向我们展示了元分析的作用,这是一种定量化的文献综述方法,它使得研究人员可以考察大量的单个研究结论的有效性,然后应用一种公式来确定它们是否能形成一致的结果。
[9]如果结果确实具有一致性的话,那么研究人员更有信心得出研究的有效性是具有普遍意义的结论。
元分析法是一种克服定性综述可能导致的不精确解释的有效手段,可以综合定量研究的变异。
此外,这种方法有助于研究人员区分出可能存在于自变量和因变量之间的调节变量。
在过去的25年中,曾掀起过一股推广这种研究方法的浪潮,究其原因是因为它提供了一种更为客观的方法来代替传统的文献综述。
虽然元分析法要求研究者自己做出大量的判断,这使研究过程引入了大量的主观因素,但毫无疑问,元分析法现在已成为组织行为学文献中广泛应用的一种方法。
研究中的道德
研究人员在对被试进行研究时,并不总是坦诚相待的。
例如,现场调查中的问题可能会使回答者感到尴尬,或被看成是对隐私权的侵犯。
而实验室研究也素来以研究者向被试隐瞒真实的研究目的而闻名,“因为他们(研究人员)觉得为获得真实的反应而进行欺骗是十分必要的”[10]。
由斯坦利主持的“学习实验”是30多年前完成的,一直受到心理学家们基于伦理道德的广泛批评,因为他对被试撒谎,告诉被试研究是为了调查学习情况,但实际上进行的却是有关服从的研究。
他所运用的电击仪器只不过是一个道具而已,即使那个“学生”也是斯坦利雇来的同谋,因为他曾接受训练伪装出受伤忍痛的样子。
然而,道德过失还在继续。
例如,2001年,哥伦比亚大学的一位组织行为学教授用大学抬头的信纸分别给纽约市的240家饭店发了一封信,信中详细描述了他和妻子为了庆贺他们的结婚纪念日而到这家饭店用餐,吃了有毒的食物,导致他一晚上在卫生间里呕吐。
[11]信是这样结尾的:“尽管我不想以书面的形式向商务监督部门或卫生部门报告这件事,但我想让你们知道,我多么期望你们对此做出相应的解释。
我期待着你们的回复。
”这封编造的信是这位教授研究的一部分,他想了解饭店如何处理顾客的抱怨。
可是,这封信却带来了厨房恐慌,很多饭店的老板、经理和厨师兴师动众地检查他们的菜单、烹调和运送过程,看是否有污染的食物,同时质问厨房的工人是否工作有疏漏。
后来,大学专门为此发了一封道歉信,承认这是“一位年轻教师犯的过分的判断错误”。
但这封道歉信对于平息前一封信所带来的混乱几乎没有作用。
专业工作者协会,如美国心理学学会、美国社会学学会及管理学会都正式颁布了进行研究的指导方针,但是,有关道德问题的争议仍在继续。
一方面,有人认为道德约束太严会损害实验的科学性和有效性,压制今后的研究:例如,为了避免研究结果不准确,有时欺骗的手段是必要的。
并且,那些坚持使道德控制最小化的人注意到,很少有被试由于被欺骗而受到明显的伤害。
即使是在斯坦利的高度操纵的实验中,也只有1.3%的被试表示对此经历有不满之感。
而争议的另一方将焦点集中于参与者的权力上,有的学者认为对道德问题应严加控制,主张任何程序都不应该使被试在情绪上和身体上感到不适。
作为专业人员,研究者应对被试绝对诚实,并不惜一切代价维护被试的个人隐私。
小结。