行为主义学习理论(4)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
强化伴随着条件刺 强化伴随着反应, 激,强化不是奖赏 强化是奖赏 反应是被动的 刺激间信号关系 信号学习 情绪学习 反应是主动的 特定的反应 简单的 技能学习
结果的角色: 结果的角色: 强化 Reinforcement
强化物(Reinforcer) 强化物(Reinforcer): 能增强行为的各种结果 consequence which increases the frequency of behavior
不确定的 不可预期的
先行事件的作用 Role of Antecedents
提示线索或先行刺激(antecedent stimulus) :表明哪些行为将受到强化或惩罚,如提前告 知学生作品的评价量规(演示文稿支架.doc)
辨别(discrimination):利用提示线索( cues)了解行为强化的最佳时机,如学生知道 何时向老师提出合理要求,教师察觉课堂上学 生的面部表情
Albert Bandura’s 社会学习理论
Social Learning Theory
社会性学习:
通过观察和模仿,直接向榜样学习 观察学习(observational learning)的四个阶 段: 1. 注意阶段 Attention
2. 3. 4.
保持阶段 Retention 再现阶段 Reproduction 动机阶段 Motivation
结果的作用: 结果的作用: 强化
普雷马克原理( Principle) 普雷马克原理(Premack Principle) (“Grandma’s Rule”):将低渴望的活动与高 Rule”):将低渴望的活动与高 渴望的活动联系起来, 渴望的活动联系起来,以促进低渴望活动的出 现
“If you eat your vegetables, you may have dessert.”
B. F. Skinner ‘s 操作性条件反 射
Operant Conditioning
定义: 应用愉快的或不愉快的结 果来改变行为 use of pleasant and unpleasant consequences to change behavior Box: Skinner’s Box 在控制的环境中开展试验
如果一个动作之后伴随着某种令人不满的结果,则 该动作在相似情景中被重复的可能性就会减少,联 结就减弱。
桑代克的练习律和准备律
个体当前行为的结果在决定其未来行为方 面起到非常重要的作用 练习律:一个已形成的可变联结,若加以 利用,就会增强(用律);若久不利用, 就会变弱(废律)。 准备律:当一个传导单位准备好传导时, 传导就产生满足;不传导就产生烦恼。当 一个传导单位未准备好传导时,强行传导 就会产生烦恼。
行为主义学习理论的优势和局限
优势:在解释人类的大部分行为方面非常有用,在 行为改变方面有为明显 局限性:只关注可观察的外显行为,很少对难以观 察到的内部学习过程,尤其是对高级认知能力的过 程进行研究 社会学习理论是行为主义学习理论的直接衍生物, 在行为主义和认知主义观点间架起了一座桥梁
强化物(reinforcer)
强化物:能增强行为(提高行为出现 的频率)的各种结果 没有任何一种奖赏能成为适合于所有 情景中所有人的强化物 强化物的分类:
一级强化物和二级强化物 正强化物和负强化物 内部强化物和外部强化物
一级强化物和二级强化物
一级强化物:满足人类基本需求,如 食物、安全、温暖
社会强化物,如表扬、微笑、 拥抱、关注
Social Learning Theory: 迈承巴姆Meichenbaum 迈承巴姆Meichenbaum
认知行为矫正 (Cognitive Behavior Modification): 通过自我陈述(自言 Modification)
自语)对自己的行为进行监控和调节
“What is my problem? What is my plan? Am I using my plan? How did I do?
使行为与结果之间的联系明确化 提高反馈的信息价值
塑造 Shaping
定义:对学生趋向成功的每 定义: 定义 一步都给予强化,以引导学 生实现最终的目标 课堂应用 通过强化学习者逐步趋 课堂应用: 课堂应用 近预期目标的每一步来教授新技能 或新行为
强化程序 Schedules of Reinforcement:
操作性条件反射
强化结果 Reinforcing Consequences
增加行为重复发 生的可能性
惩罚结果 Punishing Consequences
减少行为重复发 生的可能性
经典条件反射与操作性条件反射的区别
经典条件反射 反应类型 强化的性质 反应的主动性 学到了什么 适合于解释 S-R 型 操作条件反射 R-S 型
causes a
惊吓Βιβλιοθήκη BaiduStartle (UCR) 刺耳的噪声 Loud noise (UCS)
+ =
场景 Presentation (CS) 场景 Presentation (CS) 惊吓 Startle (CR)
causes a
E.L. Thorndike’s 效果律
Law of Effect
如果一个动作之后伴随着某种令人满意的结果,则该 动作在相似情景中被重复的可能性就会增加,联结就 增强。
实用的强化物
最好使用能起作用、但不太贵的非物质的强化物 从最不物质化到最物质化依次排列的强化物:
自我强化 表扬 关注 评定和认证 家庭强化 特权 活动强化物 物质化的强化物 食物
课堂中强化的应用
1. 确定你想要学生做出的行为,当这些行为出现时予以 确定你想要学生做出的行为, 强化。 强化。
2. 告诉学生你所期望的行为表现,当他们表现出来时, 给予强化,并告知原因。
负强化物( Reinforcer) 负强化物(Negative Reinforcer): 使 个体摆脱不愉快情景, 个体摆脱不愉快情景,如免除孩子洗 碗 结果: 强化行为 strengthens behavior 结果:
内部强化物和外部强化物
内部强化物(intrinsic reinforcers):人 内部强化物(intrinsic reinforcers):人 们因受到内部动机的驱使而从事某种活动,行 为本身所具有的奖励 外部强化物(extrinsic reinforcers):激 外部强化物(extrinsic reinforcers):激 励人们从事某种活动的表扬和奖励 对儿童原本自愿做出的某些行为进行强化,则 可能削弱长期的内部动机(Deci, 可能削弱长期的内部动机(Deci,Koeatner & Ryan,1999) Ryan,1999) 但教师无需担心外部强化物的作用会损害内部 动机
可变时距程序 ( variable-interval : VI):不定时给予强化物, 课堂上对学习活动的抽查。 VI能够非常有效地维持一 个高频率的行为,具有很 强的抗消退性
课堂行为的维持
当学习一个新行为时,用以下方式强化正确行为:
经常的 可预测的
当一个行为或技能已经建立,用以下方式强化正确 行为:
只有当强化不奏效时才考虑使用惩罚 当有必要使用惩罚时,应尽可能采用温和的方式, 不能使个体感到彻底挫败 学校中的体罚是违法的
结果的及时性
结果在行为之后立即出现比延迟一段时间再出现 更能影响行为 立即给予的小强化物比延迟给予的大强化物更有 效力(Kulik 1988),如戒烟和控制饮食的困难 效力(Kulik 1988),如戒烟和控制饮食的困难 及时反馈的目的:
条件刺激 Conditioned Stimulus 条件刺激 Conditioned Stimulus 条件反应 Conditioned Response
causes a
Classical Conditioning: An Example
刺耳的噪声 (UCS) 场景 Presentation (NS)
Pavlov’s Classical Conditioning
无条件刺激 无条件反应 Unconditioned Stimulus causes an Unconditioned Response 中性刺激 Neutral Stimulus
+ =
无条件刺激 Unconditioned Stimulus
刺激Stimuli: 刺激Stimuli: 刺激
- 气味 smells - 声音 sounds - 温度 temperature
定义: 因经验而导致个体行 为的改变 change in an individual caused by experience
学习的类型
有意的 Intentional 无意的 Unintentional
教育心理学: 教育心理学: 理论与实践 第五章
行为主义学习理论
本讲的主要问题
什么是学习? 什么是学习? 行为主义学习理论是如何演变的? 行为主义学习理论是如何演变的? 行为主义学习理论有什么主要原则? 行为主义学习理论有什么主要原则? 社会学习理论如何帮助我们理解人类 的学习? 的学习?
什么是学习? 什么是学习?
暂时隔离(time out):将犯错误的学生与其他学生隔离一 暂时隔离(time out):将犯错误的学生与其他学生隔离一 段时间,如让这些学生在角落里、教室外的走道上或办公室 “坐冷板凳”实验(Sit “坐冷板凳”实验(Sit and Watch)(White & Bailey, Watch)(White Bailey, 1990):这个方案在体育课上产生明显的惩罚效果 1990):这个方案在体育课上产生明显的惩罚效果
强化物
二级强化物: 与一级或其他 二级强化物联 系,获得强化 价值
活动强化物,如玩玩具、做 游戏、从事有趣的活动 代币强化物,如钱、分数、 积分、奖品
强化物类型
一级强化物 Primary Reinforcers:
食物 Food 水 Water 温暖 Warmth 安全 Security 性 Sex
固定比率程序(fixedratio :FR):做出定 量的行为之后获得强化 物,如做完6题可以玩
固定时距程序( fixed-interval:FI ):定时给予强化物 ,如期中、期末考试
可变比率程序(variableratio :VR):做出不定 量的行为之后获得强化物 ,如VR1、VR60,如赌博游 戏、被点名回答问题。 VR具有很强的抗消退能力
强化物类型
二级强化物 Secondary Reinfocers 金钱 Money 分数 Grades 星星 Stars 表扬 Praise
正强化物和负强化物: 正强化物和负强化物:
正强化物( Reinforcer) 正强化物(Positive Reinforcer):给 予个体的强化物,如表扬、分数、 奖品等 结果:强化行为strengthens 结果:强化行为strengthens behavior
3. 在恰当的行为出现时,尽快给予强化。
惩罚物 Punishment: 减弱行为的结果
两种惩罚
呈现不愉快的结果 Presentation of unpleasant consequences
取消愉快的结果 Removal of pleasant consequences
惩罚物
惩罚物的分类:
呈现惩罚(presentation punishment):使用不愉快的 呈现惩罚(presentation punishment):使用不愉快的 结果或厌恶性刺激(aversive stimulus),即强迫接触 结果或厌恶性刺激(aversive stimulus),即强迫接触 不喜欢的事或情景,如批评、指责学生 取消性惩罚(removal punishment):愉快结果的取消, 取消性惩罚(removal punishment):愉快结果的取消, 即阻止接触喜欢的事或情景,如丧失特权、剥夺课间休息 、放学后留校