文献研读:行为主义学习理论在化学学习或教学中的指导作用与局限性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
早期刺激——反应学习理论
一、桑代克试误学习理论
桑代克在19世纪末通过实验的方法,把联想和习惯融合进自己的理论体系,把联想主义(associationism)改变成联结主义(connectionism),即最早的刺激—反应学习理论,从而从根本上推翻了自由意志和理性力量对行为的主导作用。
他的这种学说来源于他著名的迷箱实验。
在此实验研究基础上,他得出自己对学习的定义:学习实际上是一个建立刺激与反应之间的联结的过程。
他根据实验的结果提出了众多学习律,其中主要有:
(一)准备律(1aw of readiness)
桑代克观察到,在他的实验过程中,为了保证学习的发生,猫必须处于饥饿状态。
如果猫吃得很饱,把它放进迷箱后,它很可能不会显示出任何学习逃出迷箱的行为,而是蜷缩在那里睡觉。
因此,对学习的解释必须包括某种动机原则,这就是他所谓的准备律。
换言之,学习者是否会对某种刺激做出反应,同他是否已作好准备有关,强调学习开始前预备定势的作用。
(二)效果律(1aw of effect)
桑代克在实验中发现,为了保证学习的发生,除了猫必须处于饥饿状态外,食物是必需的。
他在1911年出版的《动物的智慧》(AnimalIntelligence)一书中讲得很清楚:只有当反应对环境产生某种效果时,学习才会发生。
如果反应的结果是令人愉快的,那么学习就会发生;如果反应的结果是令人烦恼的,那么这种行为反应就会削弱而不是加强。
(三)练习律(1aw of exercise)
练习律是由使用律(1awof use)和失用律(1awof disuse)构成的。
桑代克认为,一个已形成的可变联结,若加以应用,这种联结的力量便会增强(即使用律);一个已形成的可变联结,若不予以使用,这种联结的力量便会减弱(即失用律)。
换言之,所谓练习律,是指反应重复的次数越多,刺激—反应之间的联结便越牢固。
除了上述三个主要学习律(其中最主要的是效果律)之外,桑代克还提出了一些从属的附律,或称为学习的原则。
(一)多重反应律
多重反应(multipleresponses)律学习者对同一刺激情境可能会做出多种多样的反应。
当某一反应不能产生满意的效果时,就会做出其他
反应,直到有一种反应最终导致满意的效果为止。
在桑代克看来,多重反应的原则至少遍布动物和人类的90%的学习中。
(二)定势律
定势(set)律或称“态度”(attitude)或“顺应”(adjustment)的原则。
桑代克在实验中发现,动物可能会以某种特定的态度对待某种外部情境,这取决于它的年龄、饥饿状态、精力状况或瞌睡程度等。
(三)选择性反应律
桑代克发现,有机体在学习时往往会有选择地对刺激情境中的某些要素做出反应,而对其他要素不予理会。
这就是选择性反应(selective response),学习者正是由于能够辨别刺激情境中各部分要素的特征,才使学习成为可能。
(四)同化律
同化(assimilation)或称“类推”(analogy)的原则。
当有机体对新的刺激情境作出反应时,这种反应往往是与他(它)在以往类似情境中习得的反应相类似的。
桑代克由此提出“共同要素论”:如果两种学习情境基本相同,就会产生类似的反应;迁移是否发生,取决于两种情境之间是否存在共同要素。
(五)联想性转换律
桑代克认为,有机体已习得的对一组刺激的反应,可以逐渐转换成对一组新的刺激的反应,这叫做联想性转换(associativeshifting)。
具体的做法是:先在刺激情境中加上一些新的刺激成分,然后减去原来的刺激成分,直到只需新的刺激、完全没有原来刺激时也能唤起这种反应为止。
(六)所属性原理
所属性原理是指,如果学习者认识到两个项目在某一方面彼此具有相属关系,那么在它们之间就比较容易形成联结。
二、巴甫洛夫条件作用理论
根据他的实验,概括出以下几个学习律。
(一)习得律
根据巴甫洛夫条件作用的原理,学习就是通过条件刺激与无条件刺激的配对而引起条件反射的过程。
在实验中,条件刺激与无条件刺激可以有多种配对方法(见图2-4)。
由于条件刺激在条件作用过程中是起信号的作用,预示无条件刺激的到来,因此,在逆向条件作用
过程中,条件刺激在无条件刺激之后出现,这就起不到预报或信号的作用,因而不可能建立条件反射。
这便是习得(aquisition)。
(二)消退律
消退(extinction)是指条件刺激多次重复而不伴随无条件刺激,条件反射逐渐削弱直至消失的过程(见图2-6)。
但是,条件反射的消失并不意味着这一习惯再也没有了。
在过了一段时间后,条件反射会自发恢复。
但这种自发恢复是不完全的,即不可能达到原来的强度(见图2-7)。
(三)泛化律
泛化(generalization)是指某一种条件反射一旦确立,就可以由类似于原来条件刺激的刺激引发。
巴甫洛夫在实验过程中发现,有机体在开始时一般都以同样的方式对与原来条件刺激相似的刺激作出反应。
例如,如果原来的条件刺激是500hz的音调,现在用400hz或600hz 的音调也能引起条件反射。
就一般而言,刺激与原来的条件刺激越相似,引发条件反射的可能性就越大。
(四)辨别律
当条件作用过程开始时,有机体需要辨别相关刺激与无关刺激。
通过辨别(discrimination)学习,有机体有选择地对某些刺激作出反应,而不对其他刺激作出反应。
在条件作用中,辨别是与泛化相反的过程。
如前所述,如果有机体已对500hz的音调建立了条件反射,会对400hz 或600hz的音调产生分化反应。
但是,如果采用有差异的配对方法,即把500hz的音调与无条件刺激配对,而在呈现400hz或600hz的音调时不伴随无条件刺激,这样,有机体对400hz或600hz的音调的反射就会消退,而只对500hz的音调形成条件反射。
(五)高级条件作用律
巴甫洛夫在实验中发现,可以用其他各种刺激来替代原来的条件刺激,以唤起已确立的那种条件反射。
换言之,原来的条件刺激可以在后来的尝试中起无条件刺激的作用。
例如,狗在对铃声形成唾液分泌反射之后,把铃声(CS1)与灯光(CS2)配对,也能使狗产生唾液分泌反射。
狗对灯光(CS2)形成条件反射的过程,也就是高级条件作用(higher—orderconditioning)的过程。
三、华生行为主义学习理论
华生的学习观点与他所处的时代密切相关。
华生在1914年出版的《行为:比较心理学导引》(Behavior:AnIntroduction to Comparative
Psychology)一书对其理论和观点作了系统阐述,提出了自己的学习理论。
(一)频因律
华生认为,在其他条件相等的情况下,某种行为练习得越多,习惯形成得就越迅速。
这就是所谓的频因(frequency)律因此,练习的次数在习惯形成中起重要作用。
在形成习惯的过程中,有效动作之所以保持下来,无效动作之所以消失,是由于有效动作比任何一种无效动作出现的次数都多,这是因为每一次练习总是以有效动作的发生而告终的。
(二)近因律
华生认为,当反应频繁发生时,最新近的反应比较早的反应更容易得到加强,这就是近因(recency)律。
因为在每一次练习中,有效的反应总是最后一个发生,所以这种反应在下一次练习中必定更容易出现。
由此,他把反应离成功的远近,作为解释一些反应被保留、另一些反应被淘汰的原则。
斯金纳操作学习理论
一、学习的定义
斯金纳在解释学习时,已看到了巴甫洛夫、华生和格思里等人对学习的解释。
斯金纳对学习过程的解释与巴甫洛夫和华生是一致的,认为学习是刺激和反应之间形成联结的过程。
不同的是,他把学习行为分为两类:应答性行为和操作性行为。
(一)应答性行为
应答性行为由已知刺激引起,其产生是由于无条件刺激与条件刺激配对的结果,它只是经典条件作用导致的学习。
在这种学习中,个体只是对刺激情境的驱动而做出被动反应,且导致这种反应的刺激并不是任何条件下都有效。
(二)操作性条件反应
操作性行为强调操作性的条件作用过程,注重反应的强化刺激,操作带来强化,因而反射具有工具的作用,会对环境产生一定的效果,这种效果作为强化称为操作行为的动力源泉。
操作性行为可以通过外部强化和自我强化的机制控制自身的反应,具有主动性,这不同于应答性行为,刺激出现才有一个特殊的反应。
动物和人大部分行为都是操作性行为,它是有可变的适应环境的特性,是发展的。
直觉、注意、言语和思维等都是操作性行为。
二、斯金纳操作学习理论
(一)斯金纳的实验—斯金纳箱
斯金纳认为,“学习”即反应概率的变化;“理论”是对所观察到的事实的解释;“学习理论”所要做的,是指出引起反应概率变化的条件。
所以,研究行为的目的,是要形成一种分析各种环境刺激的功能的方法,以决定和预测有机体的行为。
斯金纳发明了一种叫做斯金纳箱的学习装置。
斯金纳箱的一个特点是,动物可以反复做出斯金纳称为“自由操作的反应”
(free-operant responding)。
所谓“自由”,即动物的行为不像在迷津里那样受到限制;所谓“操作”,是因为动物的反应是主动作用于(或操作)环境。
斯金纳箱的一个重要优势在于它能在可控制的环境下对行为作细致科学的研究,正如巴甫洛夫一样,斯金纳的贡献不仅仅在于他所发现的规律,而在于他所使用的科学方法。
(二)斯金纳的强化原理
1.强化的类型
斯金纳区别了两种强化类型:正强化(positive reinforcement,又译积极强化)和负强化(negative reinforcement,又译消极强化)。
当在环境中增加某种刺激,有机体反应概率增加,这种刺激就是正强化物。
当某种刺激在有机体环境中消失时,反应概率增加,这种刺激便是负强化物。
负强化物即厌恶刺激,是有机体力图避开的那种刺激。
需要注意的是,无论是正强化物还是负强化物,它们的结果都是增加反应概率。
斯金纳还区分了强化的两个来源:一级强化物和二级强化物。
一级强化物包括所有在没有任何学习发生的情况下也起强化作用的刺激,如食物和水等满足生理基本需要的东西。
二级强化物包括那些在开始时不起强化作用,但后来作为与一级强化物或其他强化物配对的结果而起强化作用的刺激。
2.强化的安排
一般说来,实验者可以有两种选择:(1)连续强化,即每一次正确反应之后都给予强化;(2)间歇强化,即并不是每一次正确反应之后都给予强化(如表2-1所示)。
3.不同强化安排的效果
(1)对习得速度的影响
(2)对反应速度的影响
(3)对消退速度的影响
4.负强化与惩罚
在当今许多心理学或教育心理学著作中,往往都混用负强化与惩罚这两个概念。
而在斯金纳看来,这两者是有本质区别的。
在非得给予惩罚时,一定要注意两点。
第一,要注意利用惩罚后的反应抑制期。
也就是说,要尽可能通过强化加强其他的行为反应。
第二,惩罚一定要在不良反应发生后立即给予,延迟的惩罚可能是无效的。
三、斯金纳操作学习理论的应用
斯金纳根据强化相倚关系设计了促使有机体行为变化的两种技术:塑造与渐退。
(一)塑造:反应的辨别
塑造(shaping)是指通过安排特定的强化相倚关系使有机体做出他(它)们行为库中原先不曾有过的复杂动作。
通过塑造技术来训练有机体从事某种行为反应,主要是采用“相继近似法”(method of successive approximations),就是通过不断强化一系列逐渐接近最终行为的反应来塑造某种行为。
(二)渐退:刺激的辨别
渐退(fading)是指,通过有差别的强化,缓慢地减少两种(或两种以上)刺激的特征,从而使有机体最终能对两种只有很小差异的刺激作出有辨别的反应。
斯金纳有时把这种技术称之为刺激控制。
斯金纳认为,通过巧妙地编排程序,可以使小动物对微妙的刺激差别作出辨别反应。
四、对斯金纳操作学习理论的评价
斯金纳在桑代克的效果律和巴甫洛夫的强化概念的基础上,进一步发展了强化学说,使强化理论能够解释人的许多态度和行为。
从本质上说,斯金纳企图用操作性强化理论来解释人类所有的学习行为,认为只要分析强化的效果并依此设计控制强化程序,就可以塑造和去除人的任何行为,这未免使人怀疑这一结论的合理性了。
“因为人的认识与情感,思维与行动、个性特征与社会交往等方面的复杂性和微妙性程序,决非用‘强化物’这把‘万能钥匙’所能开启的。
”
瑕不掩瑜,斯金纳经过延伸和发展而构建的强化程序早已被承认并广泛应用于人类的社会情境,如心理治疗、问题儿童的处理、课堂管理等方面,斯金纳用操作性条件作用解释了人类所有学习包括行为动作、学术活动和社会关系等。
强化理论尤其对学校教育中促使学生行为的变化与改善方面价值更大,它能指导我们恰当地运用奖励和惩罚,正确地培养和矫正学生的道德行为。