操作制约:行为如何被奖励和惩罚塑造
操作制约:行为如何被奖励和惩罚塑造
操作制约是心理学中一个重要的理论,它解释了动物和人类如何通过行为的结果来学习和改变行为。本文将详细介绍操作制约的形成机制、奖励和惩罚的不同类型及其效果,以及在日常生活、教育和体育领域的应用。
在上个章节,我们讲解了古典制约,学习了为什么宠物狗在听到摇铃时就会开始流口水。在这个章节中,操作制约能做到的事情又不一样了。你知道动物训练师如何教导大象用前脚走路吗?知道老师如何教导幼儿园的小婴儿说“请、谢谢、对不起”吗?这些都是通过操作制约才能达成的。
在操作制约中,动物先做出一个行动,接着它们依据得到的反馈是正向的还是负向的来决定未来是否继续表现出行为。
操作制约是如何形成的?
在1898年,心理学家爱德华·桑代克(Edward Thorndike)提出了一个核心理论:效果律。简单来说,效果律讲述当一个行为被奖励了,那么这个行为会更频繁地出现,而如果一个行为导致惩罚,那么这个行为会减少出现。
爱德华·桑代克;来源:Famous Psychologists
扩展了这个理论的是斯金纳(B. F. Skinner),20世纪最有影响力的心理学家之一。斯金纳做了许多实验来验证效果律,例如:让鸽子走八字和玩乒乓球等。另外,斯金纳还设计了著名的斯金纳箱——一个实验笼子用于观察动物。斯金纳箱中有一个按钮,当动物推动按钮,就会有水、食物送进来,而斯金纳通过研究动物们的行为来确定效果论——动物行为是被它们得到的回报所塑造的。
通过给予奖励和惩罚,研究者能让动物展现出原本不会出现的行为(例如上述的鸽子走8字),不过这样的训练还是会受到动物本身生理构造的限制(所以你不能训练狗去飞)。
斯金纳箱构造;来源:Simple Psychology
奖励 vs 惩罚
在操作制约中,一个行为的结果影响了行为是否会出现增加或减少。在这里,回报分为“奖励”和“惩罚”。
奖励能增加行为,分为:
- 提供想要的东西
- 移除不想要的东西
惩罚能减少行为,分为:
- 提供不想要的东西
- 移除想要的东西
奖励/惩罚图表;来源:鹰式家庭
举例:
奖励(1. 提供想要的东西):
妈妈在孩子的哭闹下买了玩具。对于孩子来说,哭闹的行为的结果是得到玩具,也就是妈妈“提供想要的东西”,所以孩子可能会继续哭闹。奖励(2. 移除不想要的东西):
今天头痛,所以吃了一颗止痛药,止痛药缓解了疼痛,“移除了不想要的东西”,所以以后头痛可能就会知道要吃止痛药。奖励(混合):
老师看到所有同学都很乖,决定把数学课换成电影课。在这里,老师不仅提供了有趣的电影(提供想要的东西),也同时移除了无聊的数学课(移除不想要的东西)。惩罚(1. 提供不想要的东西):
驾驶超速收到罚单,在这个情境中,超速的行为导致了罚单,也是“不想要的东西”,所以超速驾驶的行为会减少。惩罚(2. 移除想要的东西):
网络酸民因留言过激而导致账号使用权限被封,也就是“移除想要的东西”,所以这是一个惩罚。惩罚(混合):
同学A不交作业,老师请同学A下课去走廊罚站作为惩罚。对于同学A来说,不交作业的行为所带来的后果是罚站所导致的无聊,以及被移除自由的下课时间,老师不仅 1.提供不想要的东西也 2.移除想要的东西,所以同学A可能不会再不交作业了。
读到这里,你可以想想生活中还有哪些例子呢?
奖励周期
在我们提到的奖励例子中,每次做出行为就会有相应的反馈叫做“连续强化”,这种情况下,学习行为会非常迅速,但是当反馈停止后,行为也会一并快速消失。
例如,如果每次老鼠按压按钮就会得到食物,结果突然有一两次发现没有食物出现了,那么老鼠很快就停止这个行为。
相反的,如果老鼠按压按钮得到食物是不定期的,虽然最开始,行为增加的速度会比较慢,不过即便有一两次没有出现食物,老鼠也会想说再多试几次,搞不好下次就会出现食物了,这个不及时的奖励周期也可以被称作“间歇性强化”。
现实中,我们会使用4种间歇性增强奖励周期。
- 固定比例时制(Fixed Ratio):每做出X次的行为,就会得到奖励。学习速度快,但是如果停止奖励,很快行为就会消失。
- 例如:小孩子每帮妈妈做家务十次就可以得到零用钱。
- 可变比例时制(Variable Ratio):每做出不固定次数的行为,就会得到奖励。学习速度较固定比例时制慢一点,但是行为即使在停止奖励的情况下也不易消失。
- 例如:赌博玩老虎机,不确定什么时候会得到奖励。
- 固定时距时制(Fixed Interval):每过一段时间会给出一次奖励,学习效果在时间快到的时候才会出现并表现行为,如果停止奖励,行为容易消失。
- 例如:月薪、每一小时才会在老鼠按压按钮时给出一次食物。
- 可变时距时制(Variable Interval):不固定时间给出一次奖励,学习效果最慢但是即便停止奖励也不容易让行为消失。
- 例如:老师课堂上有时候突然问加分题,所以学生每天努力复习。
4种间歇性增强奖励周期的学习速率状况;来源:Simple Psychology
惩罚可能带来的不良影响
家庭中,一味的惩罚孩子可能带来不良后果,有心理学家整理了四大原因:
被惩罚的行为消失了不代表被忘记,而只是单纯被压抑了而已。当家长发现打骂孩子能让孩子听话,从家长的角度来看,家长打骂的行为被“奖励”了,这可能导致家长更进一步去打骂孩子作为主要教养模式。
惩罚很常误导孩子去着重在辨别环境上,而不是改变行为本身。举例来说,惩罚孩子骂脏话可能只会在家里不骂脏话,但是在学校时仍会继续骂。
惩罚(尤其是肢体的)会带给孩子恐惧,而且孩子可能不只会将恐惧链接到行为上,也会链接到进行惩罚的人(家长/老师),进而导致家庭关系失调或是对于上学感到紧张。
在遭受肢体惩罚的同时,孩子也在通过观察,学习那些暴力,这可能会影响他未来处理人际关系/家庭关系的态度。
因此,许多学者认为与其使用惩罚,可以更着重奖励/鼓励,来塑造好的行为。
来源:Parenting for Brain
操作制约如何造成迷信?
有时候,我们会不小心将我们的行为和一个无关联的结果联系在一起,例如我们大家可能都有考试的幸运物,假设有天我穿蓝色的衣服去考试,结果得了满分,这样的结果可能会让我开始相信我的行为(穿蓝色衣服)会带来好成绩,但其实两者之间并没有任何关联。另一个例子可能是,今天在进考场前,大叫了三声,后面结果成绩不好,就认为是由于大叫了三声而导致这个不好的结果的。这种迷信(穿蓝色衣服会得好成绩、大叫三声会考差)就是因为我们在操作制约下犯的认知错误,所以下次在听到这种迷信时,不妨想想迷信之所以会产生的原因吧!
日常生活的应用
操作制约在人类社会的应用层出不穷,除了上面提及到的以外,还能够延伸到教育领域,根据斯金纳所说,教育成功很重要的一点,是人要能及时得知自己的行为是对或者错误的,而一个应用就是线上的考试测验,学生能立刻知道自己的答题正确率,从而调整自己的认知。而在体育领域,我们也看见操作制约的理论能辅助教练训练选手,刚开始时,只要是小成功就给予正向鼓励,随着越来越进步,挑战也会越来越难,这样慢慢精进,会让学习者在成长的过程中拥有进取心以及成就感,学习效果也会提升。
总之,操作制约的理论应用在我们生活周遭都可以看见,与古典制约一起,两者占据了行为学很重要的地位,希望你读完这章节能有所获得。
总结
- 操作制约讲述动物们的行为由其结果决定,被奖励的行会增加,而被惩罚的行为会减少
- 依据给予奖励的周期不同分为四种:固定比例时制、可变比例时制、固定时距时制、可变时距时制。
- 惩罚可能会带来不良影响,所以在塑造行为时,可以着重在奖励。
- 操作制约能用以解释迷信的诞生。
- 在日常生活乃至教育领域及体育领域都能见到操作制约的应用。
本文原文来自zetria.tw