可以更及時地看到,因為它僅依賴於接受強化物的知覺,而不是像初級強化物那樣,依賴於生物學過程。
(2)搞機率活動作為陽性強化物
普雷馬克原則(Premack principle)是指,更有可能發生的活動可以用來強化不太可能發生的活動。強化物可以是有機體認為有價值的任何事件或活動。
5、強化程式表(schedules of reinforcement)
在現實生活或實驗室裡,強化物可以按照比率程式表——經過一定次數的反應,或者間隔程式表——第一次反應後經過一個指定的時間間隔,來實施。
每種情況下,既可以有不變的或固定的強化模式,也可以有不規則的或可變的(variable)強化模式,它們構成了強化程式表的四種主要型別。
部分強化效應(partial reinforcement effect):在部分強化程式表中獲得的反應比那些在連續強化中獲得的反應更能抵抗行為的消退。
(1)固定…比率(FR)程式表(fixed…ratio schedule)
每次反應後都伴有強化時,我們稱這種程式表為FR…1程式表。
很多售貨員都是由FR程式表強化的:他們必須賣出一定數量的貨物,才能得到報酬。
(2)可變…比率(VR)程式表(variable…ratio schedule)
在可變—比率程式表,強化物之間的平均反應次數是預先確定了的。可彎…比率程式表產生的反應速率最高,抗消退能力最強,尤其是當VR值較大的時候。
賭博似乎就是受VR程式表控制的。
(3)固定—間隔(FI)程式表(fixed…interual schedule)
固定—間隔程式表中,強化物是在經過一個固定的時間間隔後,有機體第一次做出某反應時出現。
F1程式表中的反應速率表現為扇形模式。隨著回報時間的臨近,動物的反應越來越多。按月支付薪水即是將你置於FI程式表中。
(4)可變—間隔(VI)程式表(variable…interual schedule)
在可變—間隔程式表中,平均時間間隔是預先確定了的。產生中等的但卻很穩定的反應速率。
課上常有臨時的、不規則的突然測驗。
6、行為塑造
連續接近塑造法(shaping by successive approximations),對任何連續接近並最終與預期反應相匹配的行為進行強化。
要讓塑造法起作用,你必須定義向著目標行為前進的各個行為成分,並運用差別強化來推進這一過程的每一步。
四、生物學與學習
學習的生物制約性(Biological constraints on learning)指的是物種的遺傳天賦所帶來的學習上的任何限制。這些約束可以是動物的感覺、行為和認知能力。
1、本能漂移
凱勒?不裡蘭和馬瑞恩?不裡蘭(Keller Breland and Marion Breland)
即使動物學會了進行完美的操作反應,隨著時間的推移,“習得的行為也會向著本能行為漂移”。他們稱這種傾向為本能漂移(instinctual drift)。
並非學習的所有方面都受實驗者的強化物控制。作為動物在環境中正常的、遺傳編排中的反應,行為或者更易被改變,或者更難被改變。當目標反應與生物相關因素相一致時,反射作用就會非常有效。
2、味覺—厭惡學習(taste…aversion learning)
味覺厭惡僅僅透過CS與其後果的一次匹配即可形成。
一些條件反射的例項,不僅依賴刺激與行為間的關係,而且依賴由遺傳預先安排的有機體對待環境刺激的方式。
五、學習的認知影響
1、動物認知
(1)認知地圖
愛德華?托爾曼開創了學習認知過程的研究先河。
先前曾走過迷津的老鼠擁有對認知地圖(cognitive map)迷津整體佈局的表徵做反應,而不是透過嘗試錯誤盲目地探索迷津的各個不同部分。表明:條件反射不