6赫尔驱力还原学习理论

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、赫尔学习系统的基本公设
1、一级学习系统:S E R=D*S H R
赫尔学习系统中的两个最基本的概念:(1)与需要相关的动机状态,赫尔称之为驱
力(D);(2)通过强化产生的刺激-反应之间的联结,赫尔称其为习惯(H)。

从而引出了赫尔最基本的假设(Hull,1949):S E R=D*S H R 。

通过这种定量的方法,可以把行为看作是行为所依赖的两个变量——驱力与习惯——的函数。

在赫尔的体系中,驱力是非常一般的、不指向特定行为的;而习惯是非常具体的。

因此,习惯(S H R)表明了特定刺激引起特定反应的倾向。

赫尔的另一个公设是:“习惯的形成是驱力还原的结果。

”可见,驱力还原可以导致新的反应。

后来,赫尔对自己的公设作了修正。

他认为,每一种驱力状态都有一种独特的驱力刺激(drive stimulus,简称S D)。

当某些方面的需要激活了内部感受器时,这种生理需要就会被转化成一种驱力状态。

这种感受器的激活,形成了一种驱力刺激(S D)。

2、二级学习系统:
赫尔在他的公式中增加了一个新的构成——诱因动机(K),公式就成了:S E R=K*D*S H R 。

赫尔的学习系统有了两种动因:原有的一级驱力因素;新加的二级诱因。

这样,就有了两种学习:(1)一级学习系统,即刺激-反应的学习;(2)二级学习系统,即建立在二级强化物和诱因动机基础上的学习。

从而引出了两个概念:二级驱力(secondary drive)与二级强化(secondary reinforcement)。

3、学习系统中的其他变量:
(1)刺激强度的动机机制(V)
赫尔认为,对于一定程度上的习惯力量来说,刺激强度越大,反应潜能也就越高。

这样,赫尔的方程式就成了:S E R=K*D*V*S H R 。

(2)强化延迟(J)
强化延迟得越久,反应潜能就越弱。

因而,赫尔的方程式有添加了一个构成:
E R=K*D*V*J*S H R 。

S
(3)反应潜能(S E R)
反应是一个因变量,而反应潜能则是一个中介变量。

只有当反应潜能超过反应阈限(reaction threshold)时,才能唤起反应。

(4)抑制潜能(I)
赫尔还假设,存在着一些抑制行为、阻止行为表现的因素或抑制潜能(inhibitory potential,简称I)。

他认为存在着两种抑制:反应性抑制和条件性抑制。

这两种都是作为负的反应潜能而起作用的。

所谓“反应性抑制”(reaction inhibition,简称I R)是指,在任何时候,只要反应一发生,就会产生反应性抑制,即反应机制开始趋于疲劳。

赫尔把反应性抑制引入他的系统,是为了解释自发恢复的现象。

同时,也有助于解释这种事实:有机体在密集训练时比分散训练时操作水平要差一些,这是因为在密集训练时,反应性抑制没有机会消散的缘故。

所谓“条件性抑制”(conditioned inhibition,简称s I R)是指,有机体如果在某种情境中作出一种反应,但没有伴随强化,那就会增加条件性抑制的程度,这就像强化某一反应会增强其反应强度一样。

这样,事实上就有了两种学习机制:一种是使受强化的反应更可能出现;一种是使没有受到强化的反应出现的可能性减少。

因此,赫尔的方程式可以变为:S E R=K*D*V*J*S H R -(I R+S I R)。

(5)波动机制(S O R)
赫尔认为,即便实验者尽一切努力使习惯力量和驱力水平达到最高限度,使抑制因素减少到最低程度,我们仍然可以看到反应强度的血多变化无常。

赫尔假定,波动是一种抑制,是随机变化的。

因此,赫尔的方程式可以变为:S E R=K*D*V*J*S H R -(I R+S I R)-S O R。

PS:稍作总结:赫尔的反应强度可用如下公式表示:S E R=K*D*V*J*S H R -(I R+S I R)-S O R,其中,K
表示诱因动机,D表示驱力,V表示刺激强度的动机机制,J表示强化延迟,I R和S I R分别表示反应性抑制和条件性抑制,S O R代表波动机制。

二、赫尔学习系统中派生的中介机制
1、部分预期目标反应(r G)
部分预期目标反应(fractional antedating goal reactions,简称r G)是赫尔用来作为诱因动机(K)的支撑物的机制。

赫尔对学习的解释主要依赖于对强化的解释。

赫尔坚持认为,强化是由驱力还原构成的。

2、强化梯度(gradient of reinforcement)
有两类强化的时间梯度。

一类是以条件刺激(cs)与无条件刺激(ucs)之间的时距为基础的,这主要表现在经典条件作用中。

另一类以反应与强化之间的时距为基础的强化时间梯度,这主要表现在操作条件作用中。

强化延迟越久,对学习的妨碍也就越大。

而且,离目标近的刺激-反应联结,比离目标远的联结够强些,其联结的强度是根据离目标距离远近按顺序递减的。

3、习惯族系等级系统(habit-family hierachy)
之所以称为“族系”,是因为它们都是根据共同的部分预期目标反应(r G)整合在一起的;之所以称为“等级系统”,是因为它们是根据以往受强化的优先程度按顺序排列的。

有机体之所以作出某种选择,是因为这种反应在以往受强化的机遇比其他反应更大些,因而,与这种选择相联系的反应潜能也比其他选择的反应潜能更强些。

三、评论
从赫尔把学习理论主要集中在强化的原则上这个角度来看,赫尔的理论与桑代克的效果律较为接近,而与格思里的邻近理论与托尔曼的符号学习理论相对立。

赫尔理论体系之所以经不住时间的考验,主要原因有两条:一、他试图形成一个包摄一切的理论体系是不切实际的。

从当代学习理论发展的趋势来看,趋向于建立一种能抓住学习过程某些特点的学习模式,而不似乎大一统的理论框架。

二、赫尔过于醉心于用数学公式来构建行为系统。

赫尔最了不起的,是他随时准备根据实验结果修正自己观点的态度。

PS:幸好赫尔的大多数公设现在看来都是有错误的,不然我利用自己的已有经验、数学逻辑和思维水平还真理解不了他的有些东西。

当然,不排除有酸葡萄心理,不过,赫尔的精神与科学态度倒是非常值得学习的。

四、赫尔学习理论的影响——斯彭斯定量刺激-反应理论
1、斯彭斯的基本观点
斯彭斯认为,研究心理学的最终目的,是要在刺激-反应联结的参照系内,使行为理论在较高水平上得到精确的量化。

他的基本假设是:行为具有足够的秩序和规则,是可以对行为作出合乎规律的描述的。

2、斯彭斯对赫尔公设系统的修正
有人称斯彭斯的学习理论是一种“半强化和半临近的理论”。

斯彭斯认为,工具性反应的习惯强度(H)是反应在某种情境中发生的次数的函数,它与强化物是否呈现无关。

在他后期认为,习惯强度是刺激-反应联结的次数与强化次数的函数,至于强化量是无关紧要的。

诱因动机(K)等于部分预期目标反应(r G),或r G 部分预期目标刺激(s G)。

于是,斯彭斯就把赫尔的诱因动机(K)与部分预期目标反应(r G)这两个概念合二为一了。

这一方面简化了赫尔的理论,另一方面也消除了诱因动机(K)原有的不确定性。

尽管斯彭斯也认为反映潜能是由驱力(D)、诱因动机(K)和习惯(H)决定的。

斯彭斯的方程式为:E=H(D+K)。

3、赫尔与斯彭斯对泛化与辨别的解释
赫尔论泛化:两个刺激越是相类似,其中任何一个刺激就越有可能代替另一个刺激引起
条件反应。

这两种刺激在同一维度上的差异,可以被描述为这一维度的泛化梯度。

他还强调,习惯强度和反应潜能的泛化是随驱力强度的变化而变化的。

斯彭斯论辨别:条件性抑制(S I R)会形成一种负刺激(negative stimulus,简称S_),并会泛化到整个刺激维度上去;而习惯(S H R)则会形成一种正刺激(positive stimulus,简称S+),它也会沿着刺激维度把习惯强度泛化到这一刺激维度的其他点上。

斯彭斯这一理论的基本假设是:(1)形成正刺激(S+)的习惯强度随每一次的强化而增强;(2)形成负刺激(S_)的抑制性潜能随每一次不强化而增强;(3)兴奋性潜能和抑制性潜能都会泛化到其他刺激上去;(4)正刺激(S+)泛化的量值大雨负刺激(S_)泛化的量值;(5)兴奋过程与抑制过程是以代数方式相互作用的;(6)最有相对最强习惯潜能的刺激最有可能发生反应。

4、评论
同赫尔一样,斯彭斯认为,学习即形成刺激-反应联结的过程,或形成习惯的过程,但他更强调通过有控制的实验分析来探索学习心理的规律。

同斯金纳一样,斯彭斯的理论也可称为“刺激-反应强化理论”,但他试图分析强化的性质,而斯金纳则不讨论这个问题。

斯彭斯的理论有时又像格思里的理论一样,被称为邻近理论,因为他的部分预期目标反应(r G)可以被看作是格思里的一种动作-产生的刺激,都是为了说明有机体在达到目的以前反应不止的原因。

所以,称斯彭斯的学习理论是一种“半强化和半临近的理论”是贴切的。

相关文档
最新文档