行为主义学习理论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Six Assumptions of Operant Conditioning
Learning is behavioral change Behavioral change is related to changes in environmental events or conditions The relationships between behavior and conditions can be determined … … Date from study of behavior are the sources The behavior of individual organism is the appropriate data source The dynamics of an organism's interaction with the environment is the same for all species(P117)
The discriminative stimulus (辨别刺激)
Any stimulus that is consistently present when a response is reinforced Becomes a behavioral cue for the response Often are environmental events and the verbal statements Individuals also construct discriminative stimuli for themselves, such as lists and written plans(P119)
Essential principle of reinforcement
Factors influence behavioral consequences
Individual's past reinforcement history Skills repertoire of the individual Particular characteristics inherited by the individual
causes a
惊吓 Startle (UCR) 刺耳的噪声 Loud noise (UCS)
+ =
场景 Presentation (CS) 场景 Presentation (CS) 惊吓 Startle (CR)
causes a
E.L. Thorndike's 效果律
Law of Effect
如果一个动作之后伴随着某种令人满意的结果,则该 动作在相似情景中被重复的可能性就会增加,联结就 增强.
强化物类型
一级强化物 Primary Reinforcers:
食物 Food 水 Water 温暖 Warmth 安全 Security 性 Sex
强化物类型
二级强化物 Secondary Reinfocers 金钱 Money 分数 Grades 星星 Stars 表扬 Praise
正强化物和负强化物: 正强化物和负强化物:
Pavlov's Classical Conditioning
无条件刺激 无条件反应 Unconditioned Stimulus causes an Unconditioned Response 中性刺激 Neutral Stimulus
+ =
无条件刺激 Unconditioned Stimulus
只有当强化不奏效时才考虑使用惩罚 当有必要使用惩罚时,应尽可能采用温和的方式, 不能使个体感到彻底挫败 学校中的体罚是违法的
结果的及时性
结果在行为之后立即出现比延迟一段时间再出现 更能影响行为 立即给予的小强化物比延迟给予的大强化物更有 效力(Kulik 1988),如戒烟和控制饮食的困难 效力(Kulik 1988),如戒烟和控制饮食的困难 及时反馈的目的:
内部强化物和外部强化物
内部强化物(intrinsic reinforcers):人 内部强化物(intrinsic reinforcers):人 们因受到内部动机的驱使而从事某种活动,行 为本身所具有的奖励 外部强化物(extrinsic reinforcers):激 外部强化物(extrinsic reinforcers):激 励人们从事某种活动的表扬和奖励 对儿童原本自愿做出的某些行为进行强化,则 可能削弱长期的内部动机(Deci, 可能削弱长期的内部动机(Deci,Koeatner & Ryan,1999) Ryan,1999) 但教师无需担心外部强化物的作用会损害内部 动机
Mental ability susceptibilities to certain reinforcers : food, sugar and salt(P122)
操作性条件反射
强化结果 Reinforcing Consequences
增加行为重复发 生的可能性
惩罚结果 Punishing Consequences
操作条件反射学习理论的要义
Three essential components of learning The discriminative stimulus(辨别刺激) stimulus(辨别刺激) Essential principle of reinforcement Categories of reinforcement Punishment
学习与教学: 学习与教学: 从理论到实践
行为主义学习理论
本讲的主要问题
什么是学习? 什么是学习? (Basic Assumptions) 行为主义学习理论是如何演变的? 行为主义学习理论是如何演变的? Skinner 操作条件反射学习理论核心 要素是什么? 要素是什么? (The components of learning)
结果的角色: 结果的角色: 强化 Reinforcement
强化物(Reinforcer) 强化物(Reinforcer): 能增强行为的各种结果 consequence which increases the frequency of behavior
强化物(reinforcer)
强化物:能增强行为(提高行为出现 的频率)的各种结果 没有任何一种奖赏能成为适合于所有 情景中所有人的强化物 强化物的分类:
3. 在恰当的行为出现时,尽快给予强化.
惩罚物 Punishment: 减弱行为的结果
两种惩罚
呈现不愉快的结果 Presentation of unpleasant consequences
取消愉快的结果 Removal of pleasant consequences
惩罚物
惩罚物的分类:
呈现惩罚(presentation punishment):使用不愉快的 呈现惩罚(presentation punishment):使用不愉快的 结果或厌恶性刺激(aversive stimulus),即强迫接触 结果或厌恶性刺激(aversive stimulus),即强迫接触 不喜欢的事或情景,如批评,指责学生 取消性惩罚(removal punishment):愉快结果的取消, 取消性惩罚(removal punishment):愉快结果的取消, 即阻止接触喜欢的事或情景,如丧失特权,剥夺课间休息 ,放学后留校
如果一个动作之后伴随着某种令人不满的结果,则 该动作在相似情景中被重复的可能性就会减少,联 结就减弱.
桑代克的练习律和准备律
个体当前行为的结果在决定其未来行为方 面起到非常重要的作用 练习律:一个已形成的可变联结,若加以 利用,就会增强(用律);若久不利用, 就会变弱(废律). 准备律:当一个传导单位准备好传导时, 传导就产生满足;不传导就产生烦恼.当 一个传导单位未准备好传导时,强行传导 就会产生烦恼.
Three essential components of learning
Three components: discriminative stimulus (SD), response (R) and reinforcing stimulus (Sreinf.) The sequence of learning events is (SD)- (R)-(Sreinf.) (R)-
实用的强化物
最好使用能起作用,但不太贵的非物质的强化物 从最不物质化到最物质化依次排列的强化物:
自我强化 表扬 关注 评定和认证 家庭强化 特权 活动强化物 物质化的强化物 食物
课堂中强化的应用
1. 确定你想要学生做出的行为,当这些行为出现时予以 确定你想要学生做出的行为, 强化. 强化.
2. 告诉学生你所期望的行为表现,当他们表现出来时, 给予强化,并告知原因.
一级强化物和二级强化物 正强化物和负强化物 内部强化物和外部强化物
一级强化物和二级强化物
一级强化物:满足人类基本需求,如 食物,安全,温暖
社会强化物,如表扬,微笑, 拥抱,关注
强化物
二级强化物: 与一级或其他 二级强化物联 系,获得强化 价值
活动强化物,如玩玩具,做 游戏,从事有趣的活动 代币强化物,如钱,分数, 积分,奖品
结果的作用: 结果的作用: 强化
普雷马克原理( Principle) 普雷马克原理(Premack Principle) ("Grandma's Rule"):将低渴望的活动与高 Rule"):将低渴望的活动与高 渴望的活动联系起来, 渴望的活动联系起来,以促进低渴望活动的出 现
"If you eat your vegetables, you may have dessert."
什么是学习? 什么是学习?
刺激Stimuli: 刺激Stimuli: 刺激
- 气味 smells - 声音 sounds - 温度 temperature
定义:因经验而导致个体行为的改变 (change in an individual behavioral caused by experience ) 学习的类型 有意的 Intentional 无意的 Unintentional
减少行为重复发 生的可能性
经典条件反射与操作性条件反射的区别
经典条件反射
反应类型 强化的性质 反应的主动性 学到了什么 适合于解释 S-R型
操作条件反射
S-R-S型
强化伴随着条件刺 强化伴随着反应, 激,强化不是奖励 强化是奖励 反应是被动的 反应是主动的 刺激间信号关系 信号学习 特定的反应 技能学习
条件刺激 Conditioned Stimulus 条件刺激 Conditioned Stimulus 条件反应 Conditioned Response
causes a
Classical Conditioning: An Example
刺耳的噪声 (UCS) 场景 Presentation (NS)
B. F. Skinner 's 操作性条件反 射Biblioteka Baidu
Operant Conditioning
定义: 应用愉快的或不愉快的结 果来改变行为 use of pleasant and unpleasant consequences to change behavior Box: Skinner's Box 在控制的环境中开展试验
暂时隔离(time out):将犯错误的学生与其他学生隔离一 暂时隔离(time out):将犯错误的学生与其他学生隔离一 段时间,如让这些学生在角落里,教室外的走道上或办公室 "坐冷板凳"实验(Sit "坐冷板凳"实验(Sit and Watch)(White & Bailey, Watch)(White Bailey, 1990):这个方案在体育课上产生明显的惩罚效果 1990):这个方案在体育课上产生明显的惩罚效果
正强化物( Reinforcer) 正强化物(Positive Reinforcer):给 予个体的强化物,如表扬,分数, 奖品等 结果:强化行为strengthens 结果:强化行为strengthens behavior
负强化物( Reinforcer) 负强化物(Negative Reinforcer): 使 个体摆脱不愉快情景, 个体摆脱不愉快情景,如免除孩子洗 碗 结果: 强化行为 strengthens behavior 结果: