4第四章 强化

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
拥有性强化物:指在一段时间内个体可以拥有享受的东 西。如有机会坐一次飞机;穿上自己喜欢的衣服;有一个私 人房间;以及像其他刷子、指甲刀、皮带等拥有物。至少是 暂时拥有。
(4)社会性强化物
社会性强化物:指个体喜欢接受的语言刺激或身体刺激如 口头赞美(好孩子、真棒、太好了、等等)以及温情的轻拍、 拥抱、点头、微笑,甚至是简单的一瞥等社会性注意。
(三)正确实施强化
①实施前把计划告诉当事人,以取得其配合; ②在所需要的行为出现后立即强化; ③给予强化物时,告知当事人被强化的具体行为; ④分配物质强化时,最好能结合精神奖励,同时,为避 免餍足,应经常更换赞扬方式; ⑤每次只给予少量的强化物; ⑥不要在强化后提出批评和要求。 ⑦注意实施过程中强化物本身可能产生的不良影响。某 些强化物(看电视、打游戏等)不断给予,反而会使个体 养成另一种不良行为习惯; ⑧强化过程中注意个体行为的成效,避免功利性。(个 体可能为了获得强化物故意做出某种行为,这样容易养成 功利性。这样的行为也很难迁移或在自然环境下维持,一 旦强化物消除,行为就会明显消退)。
是指一种偶然的(或间歇的)而不是每一次都对所发 生的行为进行强化的方法。
日常生活中,很多行为都是通过间歇强化获得的, 因为有些行为不可能每次都获得强化(只有部分能被 强化),如买彩票、赌博等。因此它又叫部分强化。
(二)、连续强化与间歇强化
2、间歇强化与连续强化的比较(p79)
(1)使用阶段上 (2)克服餍足效果上 (3)操作的可行性上
(三)强化物的数量和品质 强化物的数量越大,强化的效果越明显。但这
种关系是有一定限度的,当强化物的量超过一量时, 就是丧失强化作用,甚至成为厌恶刺激,尤其是原 始强化物(食物等)。这种餍足是暂时的,一旦量 减少了,又可恢复强化力量。
条件性强化物虽然也有餍足,但不像那么原始 强化物明显。
强化物的品质不像数量那样可以计算,取决于 个体的偏好。个体越喜欢的强化物,强化效果越好。
(二)选择强化物的方法
1、活动观察
通过日常生活的观察,了解当事人在自由 时间内的兴趣爱好,作为选择强化物的依 据。
2、事件调查
(1)问卷调查:就是设计一份简单的调查表,直截了当地 让当事人回答自己在所选顶目中,最感兴趣的是什么。它可以 经济有效地了解当事人的喜好,并在短时间内搜集到大量的资 料。
(2)事件清单:就是以图文并茂的形式,分类列出各类物 品,活动及事件,让当事人选择,以了解其喜好。这对于口语 表达能力 差的当事人或年幼的儿童,尤其适用。
四、强化的程式及其特点
❖ (一)定比例强化(FR程式) ❖ (二)变比例强化(VR程式) ❖ (三)定时距强化(FI程式) ❖ (四)变时距强化(VI程式)
第四章:强化
第一节:强化与强化物的含义及类型 第二节:正强化及其使用 第三节:负强化及其使用
第一节:强化与强化物的含义及类型
一、强化与强化物的含义 二、强化的类型 三、强化物的类型与选择 四、强化的程式及其特点
一、强化与强化物的含义
所谓的强化(reinforcement),是 指有机体做出某一反应的结果提高了 该行为以后发生概率的过程。
人们通常喜欢某些事物,却更喜欢另一些事物。即人们对 事物的喜欢是有等级、程度不同的。譬如,在一个实验中,要 求小朋友将如下四类事物按喜欢的程度排序:
A 玩过迷宫游戏 B 看柯南卡通片 C 吃巧克力 D 用锤子敲东西 某儿童的排序结果是B > C >A >D,将儿童对各种事物或活 动的态度从喜欢到不喜欢拍成序列就是强化物的等级。排在前 面的事物或活动可以强化排在后面的事物或活动。即强化价值 较高的对强化价值较低的起强化作用。 对强化的等级的分析有助于我们进一步了解强化物,能增 强我们在行为矫正过程中使用强化的针对性、有效性。
❖ 缺点:每一次得到强化后,会有一段时间 “停顿”。停顿时间的长短,与FR的大小成 正比。
❖ 使用FR程式应注意的问题:
❖ 1. 目标行为不能是连续行为
❖ 2. 要求的反应数目只能逐渐增加,不能增加 太快。
如:FR5——FR10——FR20——FR50
❖ 3. 最终所要求的反应数目不能过多,否则会 导致反应中断。
(一)定比例强化(FR)
❖ 只有当事人做出的反应达到所要求的特定次 数时,反应进行强化。
❖ 如:工人每完成50件产品,得到一定数目的 工资,就是FR50程式。
❖ 优点:由于在FR中,个体获得强化物的数量 与所发生的反应数目成正比,为了获得更多 强化物,个体必须尽快做出反应,因此有利 于提高反应效率。
第二节:正强化及其使用
一、正强化的含义与范例 二、正强化物等级 三、影响正强化的因素 四、有效运用正强化的原则 五、正强化实施案例
一、正强化的含义
就是指反应之后所紧随的事件或活动造成 反映概率提高的现象。或者说,在一个反应 之后呈现的某一刺激,而使该反应出现的频 率上升的过程。
二、正强化物等级
(四)让当事人逐渐脱离程序
①当目标行为多次以我们期望的频率发生时,应 逐渐减少物质强化物而用社会性强化物来维持该 行为;
②寻找环境中的其他自然强化物,并用它来维持 行为;
(三)无条件强化与条件强化
❖ 无条件强化:对食物、水、性等追求和对高 温、严寒、疼痛等的逃避,都直接或间接地 与有机体的基本需求相关,因此称它为无条 件强化,或原始强化。
❖ 将食物、水、性等自然的积极刺激称为无条 件强化物。将高温、严寒、疼痛等自然的消 极刺激称为无条件惩罚物。
(三)无条件强化与条件强化
四、有效运用正强化的原则
(一)正确选择目标行为 所选择的行为应该是具体的行为(如微笑),而 不是一般行为(如社会化)。对具体行为,能客 观地进行控制、观察、评价其改变,能反复对其 进行强化。
(二)正确选择强化物 用来增强行为的强化物必须具备以下特点: ①易用; ②能立即呈现在所需要的行为发生之后; ③多次使用不至于引起迅速的满足; ④不需要花费大量的时间。 为此,须就强化物对当事人进行调查。
所谓强化物(rein forcer),就是指 能起到强化作用的事件或刺激,也就 说,它的出现可以提高行为反应发生 的概率。
二、强化的类型
(一)正强化与负强化 (二)连续强化与间歇强化 (三)无条件强化与条件强化
(一)正强化与负强化
1、含义
正强化(positive reinforcement,又叫积 极强化,阳性强化)就是指有机体做出某一行 为反应后,导致刺激的出现或刺激强度的增加, 并且提高了该行为在今后发生概率的过程。如 获得食物或加大奖励。
(2)、条件强化物
根据条件强化物的性质再进行分类,又可以分成两类: 物类强化物和社会性强化物。
a. 物类强化物(也称为次级强化物)是指一些物品原 初不具有强化的作用,通过和其他“原级强化物” 的联系 而获得强化力量的刺激物。一般地,学校惯用的分数、奖状、 毕业证书、奖金等都属于物类强化物。因为它们能换取赞赏、 表扬、食物、衣服、娱乐品等。
负强化(negative reinforcement,又叫 消极强化,阴性强化)就是指有机体做出某一 行为反应后,导致了刺激的消失或刺激强度的 降低,并且结果也提高了该行为在今后发生的 概率。如回避电击或减轻惩罚。
2、正、负强化的异同点
(1)不同点:正强化的行为结果导致刺激的出 现或刺激强度的增加;而负强化的行为结果导致刺 激的消失或刺激强度的减弱。
❖ 条件性强化:分数、名次、称赞、金钱等中 性刺激,由于和已具有强化作用的刺激(无 条件强化物或已被条件化的强化物)的反复 多次联系,也获得了强化的力量。人们把这 种强化称为条件性强化,又Baidu Nhomakorabea次级强化。
❖ 它们的价值不是自然获得的,而是通过学习 获得的。
❖ 分数、名次、称赞、金钱等刺激物叫条件性 强化物。
(二)变比例强化(VR)
❖ 是指每次强化所要求的反应数目不是固定不变 的,而是不可预测地变化着。如:学生课堂上 的举手发言、赌博。
❖ 优势: ❖ 1. 在反应被强化之后,没有停顿。 ❖ 2. 每次强化所要求的反应数目比FR程式中变化
的范围大,因此更不容易出现反应减退。
(三)定时距强化(FI)
❖ 是指目标行为在上一次被强化后,经过某一 固定时间间隔后再一次进行强化。也就是在 某一固定时间间隔内,只要目标行为发生了, 就获得强化。
最早系统研究活动强化物的是普雷马克(D.Premack,1965), 他的研究结论被称为普雷马克原理。
普雷马克让孩子们从两种活动中选择一种:其一是玩弹球游戏机; 其二是吃糖果。当然一些孩子选择了前者,一些孩子选择了后者。有 趣的是,对于更喜欢糖果的孩子,若将吃糖果作为强化物,便可以增 加其玩弹球游戏机的频率;相反,对于更喜欢玩弹球游戏机的孩子, 若以玩弹球游戏机作为强化物,便可提高其吃糖果的量。由此可见, 比较喜欢的活动可以用来强化不太喜欢的活动。
(2)相同点:它们两者的最终目的都在于提高 了行为反应在今后再次发生的可能性
(二)连续强化与间歇强化
1、连续强化与间歇强化的含义
连续强化(continuous reinforcement):就
是指当所需要的目标行为一旦发生,就给予强化的方 法。也就是说,只要行为发生,就能获得强化。
间歇强化(intermittent reinforcement):就
(四)机体的先前状态 剥夺和餍足是个体机体的两种典型状态,当个
体处于剥夺状态时,强化物的强化价值就会提高, 剥夺时间越长,强化价值越大。当个体处于餍足状 态时,强化物的强化价值就会降低,餍足的程度越 高,强化价值越小。
注:为了保护个体健康,不要采用严厉的剥夺。
此外,外界指令、环境变化等,也会影响强化 效果。
三、影响正强化的因素
(一)强化与行为的一致性(关键) 只有出现良性行为时,才进行强化。如果
强化物与目标行为不一致,目标行为就难以改 变。
一致性强化与非一致性强化效果差异显著。
(二)强化与行为的直接性 强化物的效果与目标行为和强化物之间的
时间间隔密切相关,立即强化比延缓强化效果 好。(延缓强化可能恰好强化了不良行为)
2、根据强化物的内容
(1)消费性强化物 (2)活动性强化物 (3)拥有性强化物 (4)社会性强化物
(1)消费性强化物
消费性强化:就是指糖果、饼干、水果、饮料等一 次性消费物品。它们往往属于无条件强化物,其强化价 值是不需要学习就有的。
(2)活动强化物
活动强化物:就是指人们喜欢从事的各种活动或倾 向于争取的各种权利,如打游戏、看电视、出外郊游、 参加娱乐活动、获得自由空间等。
三、强化物的类型与选择
(一)强化物的类型 (二)选择强化物的方法
(一)强化物的类型
1、根据强化物的性质
(1)无条件强化物 (2)条件强化物
(1)无条件强化物
就是本身就具有强化作用的自然物。 包括食物强化物、操作性强化物即拥有 性强化物。它们都直接或间接地与机体 的基本需要(尤其是生理需要)有关。 因此,又被称为“原级强化物”。
(2)、条件强化物
次级强化物的主要特点是:第一,不容易受某一短缺状 态的影响。即个体对强化物的需要程度较为一致,不为训练 环境所左右;第二,由于次级强化物的强化价值由原级强化 物的强化价值累积而成(如钱可以买吃的,也可以买玩的和 用的),因此其吸引力比单独的原级强化物大得多。
b. 社会性强化物(也称为高级强化物)是指人际交往 中表现出来的关怀或赞美的动作、语言及表情,诸如微笑、 感谢、拥抱、拍肩膀等。
❖ 缺陷:也存在“停顿”现象,且停顿时间比 FR程式还要长。
❖ 停顿时间的长短与FI程式的时间长度和个体 的时间观念有关。FI越长,停顿时间越长; 个体时间观念越弱,停顿时间越长。
(四)变时距强化(VI)
❖ 是指在一次强化发生后到下一次强化发生前, 期间的时间间隔围绕一个平均值不可预测地 变化。
❖ 两次强化之间没有停顿现象。适合于持续性 行为的训练。
这种用高频行为(喜欢的行为)作为低频行为(不喜欢的行为) 的有效强化物的例子随处可见。比如,“吃了这些蔬菜就让你吃肉”, “做完作业后,让你看一个小时的电视”等等,由于祖母对付孙子常 用这种方法,所以又被称为祖母原则。
普雷马克原理应用的条件:低概率行为(目标行为)在先,高概 率行为在后。
(3)拥有性强化物
相关文档
最新文档