固定時(shí)距強化
1. 定義
在操作性條件反射中,固定時(shí)距強化是指這樣一種強化程式,首次反應只有在特定時(shí)間段之后才得到獎勵。在這種強化程式中,每當臨近時(shí)間段的結尾,反應就會(huì )大量增加。但在呈現強化物之后,反應又會(huì )立即減弱。
2. 基本特征
非常明顯的強化后暫停
隨著(zhù)強化時(shí)間的鄰近,反應會(huì )逐漸增加
3. 例子
實(shí)驗室:假設你正在訓練老鼠按壓杠桿(見(jiàn)圖1,譯者添加),每隔10分鐘,你會(huì )強化首次反應。在強化后的第一個(gè)5分鐘,老鼠不會(huì )過(guò)多地按壓杠桿,但當10分鐘臨近時(shí),老鼠會(huì )愈發(fā)頻繁地按壓杠桿。
真實(shí)世界:每周薪水就是固定時(shí)距強化的典型例子。雇員每7天得到一次強化,當發(fā)薪日臨近時(shí),會(huì )出現高反應率。
圖1——斯金納箱

變化時(shí)距強化
1. 定義
在操作性條件反射中,變化時(shí)距強化是指這樣一種強化程式,在一個(gè)無(wú)法預期的時(shí)間段之后,反應會(huì )得到獎勵。這種強化程式會(huì )導致緩慢而穩定的反應率。
2. 基本特征
很難消退
反應率比較低但穩定
強化后只有非常短暫的反應后暫?,F象
3. 例子
檢查郵件:在一天中,你會(huì )在任一時(shí)間去檢查你的郵件,而不是在收到每封郵件的時(shí)候去檢查。
雇主檢查你的工作:你的老板有沒(méi)有在一天中好幾次來(lái)你的辦公室檢查你的工作進(jìn)度?這是一個(gè)變化時(shí)距強化的例子。你沒(méi)法準確知道這種檢查會(huì )在什么時(shí)候發(fā)生。
固定比率強化
1. 定義
在操作性條件反射中,固定比率強化是指這樣一種強化程式,反應只有累積到了一定次數才會(huì )得到強化。這種強化程式會(huì )產(chǎn)生高且平穩的反應率,并且在呈現強化物后,只有短暫的暫?,F象。
2. 基本特征
高且平穩的反應
非常適合用于學(xué)習新的行為
在強化后會(huì )有短暫的反應后暫?,F象,但會(huì )很快恢復
3. 例子
生產(chǎn)線(xiàn)工作:每制作完成15個(gè)部件,部件工廠(chǎng)的工人就有報酬可拿。這會(huì )造成高的生產(chǎn)效率,工人也會(huì )選擇更少的休息。然而,可能會(huì )造成精疲力竭和較低的工作質(zhì)量。
在視頻游戲中收集代幣:在許多視頻游戲中,為了得到某種獎勵,你會(huì )收集足夠多的代幣、物品或積分。
變化比率強化
1. 定義
在操作性條件反射中,變化比率強化是指這樣一種強化程式,在一個(gè)無(wú)法預期的反應次數之后,反應會(huì )得到強化。這種強化程式會(huì )造成很穩定的反應率。賭博和彩票就是典型的例子。
2. 基本特征
高且穩定的反應率
強化后只有短暫的暫?,F象
3. 例子
老虎機:游戲者不知道自己要玩多少次才有可能贏(yíng)。他們只知道最終是會(huì )贏(yíng)的。這就是老虎機如此有效,游戲者又很難放棄的原因。每當他們往老虎機投入一枚硬幣,他們總是有可能贏(yíng)的。
銷(xiāo)售獎金:呼叫中心通常會(huì )給員工提供隨機的獎金。員工永遠不知道他們要打多少通電話(huà)才能得到獎金,但他們知道,打更多的電話(huà)、完成更多的銷(xiāo)售,他們會(huì )更有可能得到獎金。
圖2——強化程式(圖片來(lái)自維基百科,譯者添加)

總結(以下內容為譯者總結):
1. 反應后暫?,F象是由固定的程式設計造成的,變化的程式設計反應率比較穩定,但固定比率強化會(huì )比固定時(shí)間強化恢復更快(因為多勞多得),反應率相對平穩
2. 按比率強化比按時(shí)間強化有著(zhù)更高的反應率,因為多勞多得;變化的程式設計比固定的程式設計造成更高的反應率,因為其具有不可預期的特點(diǎn)
3. 學(xué)習新的行為要用固定程式設計,以強化還沒(méi)有建立的聯(lián)結;而固定比率強化優(yōu)于固定時(shí)距強化,前者有更高的反應率
4. 變化的程式設計相比固定的程式設計,反應更難消退;而相比于變化比率強化,變化時(shí)距強化更難消退
5. 與間歇強化相對的是連續強化,即在每次反應后都給予強化,連續強化學(xué)習新的行為最快,但也最易消退
聯(lián)系客服