这种v用什么p图软件哪个好p?要告诉我,也要把我教会!

[转载] 最出名的训犬教材《别毙了那只狗》第1
我的图书馆
[转载] 最出名的训犬教材《别毙了那只狗》第1
[转载] 最出名的训犬教材《别毙了那只狗》第1-4章
第一章 ' V# o4 ^2 o, J. x/ A2 b' h
    7 ~0 I* y1 o9 b. B- A0 f
& & 比奖励更有效的 “增强原则”「正增强物」是什么? 所谓「增强物」即任何与某项行为共同出现、通常会增加该行为发生频率的事物。请你牢记,它是优良训练的秘诀·增强物可以分为两种:「正增强物」和「负增强物」。「正增强物」指训练对象希望获得的事物,如食物、抚摸或称读;而「负增强物」则指训练对象希望走避的事物,如被猛击、皱眉的表情或不悦耳的声音,如上车后没系上安全带时一直哔哔作响的警告声即是负增强物。3 o4 E5 ^/ C# d& B* a0 |( x$ Z# B _
- q' M3 C* @ m* D& & 只要是原本就会出现的行为,无论它多么罕见,都可以利用「正增强」加强这个行为。例如你召唤一只幼犬过来,当牠过来时便拍拍牠,即使日后没有对牠多作其它训练,牠被召回身边的可能性也会越来越高。假设你希望某人(子女、父母或情人)打电话给你,但他从来不打电话给你,那你是无计可施的,因为增强式训练的重点是:你无法增强 一个从不发生的行为。反过来说,如果他每次打电话给你时都相谈共欢,使这个「打电话给你」的行为获得正增强,他将来再打电话给你的可能性或许便会提高。(当然,假如你每次接到电话都予以「负增强」尽说些令人反感的话:「你为什么现在才打电话来?非得我打给你吗?你都不打来。」他会为了回避这种烦扰而不想打电话给你了;事实上,你的所作所为正是训练他别再打电话来。)$ u9 U6 Q7 ]2 G; S9 P6 M
    4 o, E$ K& H5 h
& & 增强式训练最根本的原则便是针对行为给予正增强。在科学文献里,心理学家可能会这么说:「『行为方法』用来......」或者「这个问题利用『行为方法』而获得解决」。这通常意谓心理学家以正增强取代了原有方法,不过这并不暗示他们采取本书提及的所有正增强技巧,他们甚至司能并不知道这些技巧。 l' E, A/ X' G: Y) X) B2 T9 N
    &&D) I7 C7 g# F6 l- Z# h2 z
& & 然而,改用正增强作法通常足以解决问题,至今它仍是协助解决尿床问题最有效的方法;早上起来时发现床单没湿,即立即给予称赞及拥抱。在自己身上运用正增强原则也很有效。我以前是莎士比亚读书会的会员,在那里认识一位年近五十、热爱打回力球的华尔街律师。他无意间听到我与他人聊天时谈到了训练,他便聊起他在打回力球时会试试使用正增强,他原本习惯在出错时骂脏话,但现在会试着在打出好球时称赞自己。两个星期后我碰巧周见他,我问他:「回力球打得如何」?他的脸上浮现华尔街律师身上少见的惊奇欢愉的表情。他告诉找:「起初我觉得自己真是个大傻瓜,因为每次打了好球就对自己说:『干得好!彼特,真有你的!』如果只有我一个人练习,我甚至还会拍拍自己的背。后来我开始打得越来越好,在回力球俱乐部的排名比以前升高了四级,把过去一些很难抢分的对手打得七零八落,而且我也获得了吏多乐趣,找不再大骂自己,赛后不会感到生气失望。打了一个坏球,那没什么好在意的,之后就能打出好球。我发现自己最爱看到对手犯错、生气、扔球拍,我知道这鹧举动对球赛毫无帮助,所以我只要微笑就好了……」真是可长的对手啊!而他只不过改用了正增强而已。增强物的性质是相对而不是绝对的。雨对鸭子来说是正增强物,但对猫来说却是负增强物,而对牛来说(至少在天候暖和的情况下)则无关紧要。吃饱后,食物不再是正增强物,而如果对方打定主意要惹你生气,那么再多的微笑和赞美(增强物)也无用武之地。因此为了达到增强的效果,增强物必须是对方想要的东西。无论任何训练状况,有多种增强物可供选择将会很有帮助。在海洋世界的海生馆里,杀人鲸便有许多不同的增强物,包括鱼只(食物)、在不同身韵部位抚摸搔痒、社交关注及玩具等。在整个表演秀里,牠们永远不知道接下来哪一个行为将被增强,或者增强物将是什么,这些「意外惊喜」会让牠们觉得兴味盎然,有时候甚至可以进行整场表演仍用不到一般常用的鱼只增强物,在表演结束后才获得喂食。对训练者来说,不断变化增强物的种类也是一件极具挑战又有趣的半。正增强也是送礼艺术的依据,当选中对收礼者具有增强作用的礼物时,对送礼者也是种增强作用且有助于人际关系。在美国的文化中,送礼这件事常由女性负责,我甚至还知道有个家庭由妈妈负责为全家人采买送给彼此的圣诞礼物:到了圣诞节清晨拆总物时,可笑的对话出现了:「喔!这个礼物是安送给比利的。」然而每个人都知道这份礼物和安一点关系也没有。坦白说,这种作法无法磨练孩子增强他人的技巧。对正增强观察敏锐的男性会比其它男性占有更大优势。身为母亲的我就要求儿子们一定要懂得如何送礼,举例来说,在他们七岁和五岁时,有一次我带他们到一家昂贵的名店为妹妹挑选洋装。他们很喜欢躺在豪华舒适的椅子上,对妹妹试穿的每件衣服品头论足,他们的小妹也很喜欢这样,当然她握有锻后的决定权。多亏那次经验和其它类似练习机会;他们三人都学会了如何真心关切他人,为亲爱的人寻找有效正增强物也成了一种乐趣。哪些是「负增强」? 增强物的作用是增加行为发生频率,但它不一定都是学习者想要的东西,避免不喜欢的东西也可能是种增强。实验室研究显示,如果改变行为可以让厌恶刺激消失,这个厌您刺激即可增加该行为发生频率,这类刺激就称为「负增强物」,一种人类或动物会设法避免的刺激。负增强物可能是极其轻微的厌恶刺激,例如讲冷笑话时朋友不屑地瞥你一眼,或冷气吹送过来的一阵凉风让你起来换个位置.而极剧烈的厌恶剌激,例如公开侮辱或电击,除了可以当作处罚之外,也可拿来作为负增强物;我们被老板责骂的经验或许极具处罚性质,但楚我们很快便学会,当爱骂人的老板站在前门时就从后门溜进公司上斑。负增强物是指经由行为改变即能停止或避免的厌恶刺激,只要新行为一出现,厌恶刺激立即停止出现,因而强化了新行为。假设我坐在姑妈家的客厅里,像在自己家里一样把脚跨放在桌上,姑妈挑高一边眉毛表示不满,我便把脚放回地上,她的表情放松了,我也松了一口气。以这个例子来说,挑高的眉毛是一种厌恶刺激,具有负增强物的作用,我以新行为停止了这厌恶刺激,所以脚留在地上的行为将来可能再度发生,在我姑妈家里是如此,到了别人家里可能也会一样。 负增强物几乎能完成所有的训练,传统的训练方法多半就是这么做--当左边缰绳拉紧时,马儿只要向左转,拉扯嘴巴的讨厌压力即会减少,因此马儿学会了向左转;狮子退回台子上并待着不动,因为这么做才能避免被鞭子挥到,或有椅凳挡在面前。然而,负增强并不同于处罚,两者的差别在哪儿呢?处罚是指在意图改变的行为发生后才产生的厌恶刺激,对该行为可能毫无影响,我在本书初版中写道:[没人知道成绩不佳而被修理的男孩将来的成绩会不会变好,但是他绝对不可能改变这张已带回家的成绩单。] 的确,当我们怀着意图进行处罚时,我们经常已错过时机太久,不过这还不是处罚和负增强真正不同的地方。现代行为分析学者把任何停止行为的事件都视为处罚。幼儿把发夹插入插座时,妈妈用力一抓,把他的手拍开---这个行为停止了,但其它事情可能开始发生---幼儿关始哭、妈妈感到愧疚等等,不过把发夹插入插座的行为确实消失了,至少当时是如此,这就是处罚的作用。心理学家史金纳更明确定义[处罚]可以是[某项行为导致喜欢事物消失的过程],或者也可以是[某项行为导致不喜欢事物发生的过程]。不论是哪种定义,处罚也许让当下发生的行为停止了,但是没有人可以预料以后会出现什么后果。我们已知增强物可以增强未来的行为,但无法预测处罚楚否能够导致行为改变。妈妈抓住幼儿或用力打他的手(即使时间点抓得很准),这个作法是否保证他将来不会再度把东西插入插座呢?去问问任何一位家长,你就会明白现实情况往往是:家长把小东西收好,盖件墙上的插座或者用家具文件住插座。等幼儿长大,他们特别想这么做的冲动就会消失。行为分析学者认为,增强或处罚都始一个由后果定义的[过程]。负增强物可以拿来进行有效训练,尽管使用厌恶刺激,训练过程仍可能相当无害。以下是个利用负增强训练骆马的好例子(感谢骆马专家吉姆·洛根提供此法)。骆马是种半驯化的动物,美国人把牠们当成宠物饲养,其它地区的人则饲养骆马群作为毛料来源.骆马和马儿一样非常瞻怯害羞,除非自幼时常接触人类,否则人们很难靠近牠们,虽然利用食物增强的训练法对骆马效果极佳,但常牠们对人类过于惊惧而不敢接近取食时,这个方法也派不上用场,所以现今的骆马训练师作法是,利用响片作为讯号,告知骆马牠们的行为将获增强,但这时使用的初级增强物(或真正的增强物)是[移除负增强物(即厌恶刺激)]。实际上,你等同对骆马说: “如果我走近到离你三十呎处,你可以保持站着不动吗?可以?很好,我按下响片就会转身离去。”、 “现在,如果我走到离你二十五呎处,你可以站着不动吗?可以? 很好,我按下响片就走。” 利用响片标定骆马站着不动的行为,并且利用[可怕人类的离开]作为增强物,有时在五平十分钟内即能靠近到能够触摸到牠的距离·骆马控制着整个局势,只要牠站着不动,牠就可以让人类走开! 所以牠继续站着不动。当人能摸了骆马几次之后才离开,这时便打破僵局了,这个人不再令牠感到害怕。现在饲料桶即可出场,沟通的对话转变为: “你站着不动时我可以摸模你吗?可以?按响片就赏你好吃的东西。” 这时骆马便进入获取[正增强物]的阶段,这些正增强物包括食物、搔痒和拍抚,而且牠正把站着不动的新行为做得很棒,而不是朝着别处逃命去。利用离开(或好行为出现即不再施压)的作法就是所谓[通马语者]常利用的训练技巧,训马者在围起来的区域内与自由奔跑的马匹互动,在相当短的时问内使马匹脱胎换骨:野生的马儿从惊怕逃窜变得能够冷静接纳人类,甚至容许马鞍及人类骑乘,这种整体性的转变可说非常神奇。使用这些技巧的训练者虽然都习惯以某个声音或动作作为标定讯号(或制约增强物),但很少人真正意识到自己这么做,反而常用迷信说法解释这种现象。其实这种现象一点都不神奇,全是运用[操作制约]的结果。虽然负增强很有效,但请牢记:每次使用负增强时,同时也使用了处罚。当拉紧左边缰绳,在马儿转向左以前,向前直走的行为即不断受到处罚。而且滥用负增强和厌恶刺激也可能导致莫瑞·西德门博士所谓的[附带作用],也就是因处罚引起的不良副作用(请见第四章)。 抓准增强物出现的时间点/强化的时机前述已提过,增强物必须和想改变的行为一起出现。增强物出现的时问点本身就是讯息,它告知学习者你喜欢的行为究竟是什么,当动物试图学习的当下,增强物想传达的讯息会比增强物本身更重要。运动员或舞者受训时,教练喊出[对!]或[很好!]可立即标定当下的正确动作,给予对方确实需要的讯息,若等到回到史衣室才进行事后检讨,则无法产生作用。增强时机过晚是训练生手最大的问题。例如当狗儿坐下来,在主人说出[好乖!]时,牠正好又回到站姿,这么一来,到底哪个行为被[好乖!]增强呢?是站着的行为! 每当你发现训练出现问题时,第一个该问自己的问题便是增强时机是否太晚,如果你在训练某人或动物时忙得无法分心留意,这时请人帮忙观察,看看自己增强的时机是否太迟,将会大有帮助。* u. H0 W3 |' {' N; E0 L&&}( d) I
    我们增强他人的时机往往太晚,“亲爱的,你昨晚看起来美极了!” 这句话的效果与当下实时赞美的差别很大,迟来的增强甚至可能有适得其反的效果 ([怎么,我现在难道不美吗?]);然而对于为时已晚的补偿话,我们却常常寄以厚望。)过早给予增强也可能很没效率。美国布隆克斯动物园的管理员曾对大猩猩十分头疼,他们必须让牠进入户外栏舍才能打扫室内栏舍,但是牠考绌喜欢坐在进出口,力大无穷的牠可以挡住滑门,阻止门关上,当管理员把食物摆在户外或以香蕉诱引牠时,大猩猩不是不加理会就是抢了食物再赶在门关上前回去挡门。他们请了动物园里的一位训练师处理这个问题,这位训练师解释,[挥舞香蕉]及[丢入食物]是企图以[贿赂]来增强一个尚未发生的行为,但真正有效的解决办法是当大猩猩坐着挡门时不予理会,但是只要牠自己到户外时便给予食物奖励。问题就这么解决了!家长有时也会误以为自己是鼓励小孩,事实上却太早给予增强([好孩子,就是这样,你“几乎”做对了!) , 因而可能增强了努力的行为,[努力]去做某事和[实际]做到某平是不同的,有时候小孩哭喊着「我做不到!」或许是事实,但是它也可能是努力行为受到过度增强的症状。一般而言,在行为出现前给予礼物、承诺、赞美或任何东西,完全无法增强这们行为,因为受到增强的是增强物出现当下的行为,也最可能是要求增强物的行为。进行负增强训练的时机点也很重要。马儿学习到当左边缰绳拉紧时向左转,但是在牠左转后必须不再拉繁缰绳,这个停止拉扯的动作即为增强物。在上马后踢踢马腹,马匹往前走了,便不该再继续踢(除非你要牠跑快一点)。新手骑士常会不断踢马,彷佛得不断踩油门马儿才会跑,但对于马儿而言这个动作并不具讯息,因此马术学校里产生了“铁腹马”,无论骑马的人踢得多急,牠们仍以牛步行进。同样反应也出现在常遭父母、老板或老师唠叨责骂的人,负增强物在期望结果达成时如果没有立刻消失,它将不会有增强作用,也不会传递任何讯息,唠叨责骂不但只成为名符其实的噪音,也是信息论中谈到的[噪音]。
) {( L; m&&~1 b: s    我观赏足球和棒球的电视转播赛时发现,球员被增强的时机点总是准确无误,这让我印象深刻。在球员跨过本垒达阵的同时,观众立即爆出欢呼声,而且一旦得分或确定输赢,仔细看看那些球员之问彼此热烈增强的动作。这对演员来说却相当不同,尤其是电影演员。即使是在舞台上演出,仍然得等到谢幕才能获得掌声,而电影演员除了偶尔从导演、摄影师或工作人员得到响应外,他们获得的增弦全都错过了时机,影迷信件和好的影评在数周或甚至好几个月后才会出现,这与洋基球场爆出轰天欢呼的情形比起来显得逊色无趣,他们工作起来可能特别缺乏成就感,即使有很不错的增强物,但获得的时机却总是「太迟」,也难怪常有一些明星近乎病态地喜欢谄媚奉承和追求刺激了。
* P4 L$ E% H$ @# m    增强物的大小 / y5 L, L9 X$ }! _8 {
    刚关始利用食物来增强的训练新手常搞不清楚食物增强物应该多大,答案是尽可能越小越好,增强物越小,动物能越快吃掉它,不但可以减少训练者等待的时问,而且每次练习时还可以增加增强物的使用次数,不会让动物一下子就吃饱吃腻了。一九七九年,我担任华盛顿特区的国立动物园的顾问,教导动物园员工使用正增强技巧。在训练课程上有位管理员抱怨自己的猫熊训练进展得太慢,我认为这不寻常,像猫熊这种贪心又活跃的大型动物以食物作为增强应该很容易训练,在我观察过一回训练后发现,这位管理员虽然已缓俊塑造出猫熊的动作,但是问题出在她每次给予大熊猫的增强物竟是一整根胡萝卜,猫熊好整以暇地享受每根胡箩卜,在管理员宝贵的十五分钟训练时间里牠只得到了三次增强物(而且牠也难免吃腻胡萝卜了),如果改成每次只给一片胡萝卜的话,情况将好得多。一般来说,一小口增强物就足以让动物保持兴趣,对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,对大象则是半颗苹果,如果是特别喜爱的食物,份量共至可以更少,例如喂给马儿-茶匙的谷子,美国国立动物园的管理员甚至只用葡萄干便训练北极熊做出许多有用的行为(例如依指令移动至另一个栏舍)。
) G9 X9 T# p# s, U: ?) ]    训练的基本法则是,如果每天只训练一次,在满足每日给食份量的四分之一前,动物的训练反应都会很好,等训练结束后再给牠其余的份量。如果每天训练达到三至四次,你可以把平常份量分为约八十等份,每次训练用二十至三十份。八十份增强物似乎是任何动物维持学习兴趣的每日最高量(这或许是幻灯片匣是多只能放入八十张幻灯片的原因,因为每常讲师要求换第二个幻灯片匣时我总是会抱怨一下)。行为的难易程度也与增强物的大小有关,我们在海洋生物世界的经验发现,要求鲸鱼表演笔直冲出水面二十二呎的高难度跳跃动作时,必须给予一条大青花鱼作为奖赏,如果只给平常增强用的两条小梭鱼,牠们会拒绝表演这个动作。至于人类,增强物的大小虽然没有一定的定律,但是有时候工作越艰难,报酬将会越大,如果我们完成了艰难工作却未获得相对报酬时,我们肯定痛很不已。 # E' t. l. T. N8 X% ]3 r
    意外的[大奖]&&U! Z! v1 k& ?1 T* }
& &「大奖」是一个对动物或人类都极为有效的技巧。大奖是指非常大的增强物,万至可能比平常大上十倍,而且训练对象没料到它会出现。我曾在一家广告公司任职,公司除了有一般的圣诞派对,大案子结案或签下新客户时也会有非正式的庆祝活动,不过董事长还有个习惯,他每年总会举行-两次突如其来的惊喜派对,可能是在某天下午三、四点时,他会阔步行经每个办公室,大喊着要大家停下工作、关上电话总机,接踵而至的是外烩服务人员、乐师、调酒员、香槟、熏鲑鱼和所有派对应有的东西。这些全为我们而来,而且没有特殊理由,这对五十名员工来说完全是出乎意外的大奖,我认为这对提升高昂的工作情绪有极大影响。大奖也可以用来标定「突破性的意外进步」,以我认识的一名训马师为例,当年轻马儿首度完成一项困难动作时,他随即从马背跃下,除去马鞍和马勒,然后放牠在场地里任意奔跑 --给予完全的自由便是一个大奖,而这么做似乎把新行为保留下来。0 E! a$ R6 ~( O' O; g8 `
    然而,遇到动物不听话、害怕或抗拒而完全不出现好行为时,偶尔给一次大奖也可能有效改善动物的反应。我们曾在海洋生物世界进行一些由美国海军资助的研究,作法是增强海豚的新反应,但不增强过去训练过的旧有行为,研究对象是一只极少出现新反应、名为[胡]的温驯海豚,如果牠出现反应却未获增强,牠就会变得不动。后来有次训练时,牠持续二十分钟没有出现反应,训练师在这时候丢给牠两条鱼奖励牠这个「没有反应的行为」,[胡]似乎被这个慷慨大礼吓了一跳,再度变得活跃起来,很快出现一个可被增强的动作,后来的几次训练因而出现了真正进展。我也曾亲身体会过这只海豚的经验。在我十五岁时,骑马课是我最大的人生乐事,每张骑马券可上十次课,但我每个月零用钱只够买一张。当时我与父亲菲利普·威利及继母瑞琪同住,虽然他们对我很好,但正处于青少年叛逆期的我,总是一副刻薄残忍、暴躁易怒的态度。有天晚上这两位慈爱又总明的家长告诉我,他们对我的行为感到忍无可忍,所以他们决定要嘉奖我: 他们送给我一张全新的骑马券,这是他们其中一人不辞辛劳地到马场购买的。 哇! 我完全没资格收下这样的大奖! 我记得我当下洗心革面,多年后在我撰写本书时,继母瑞琪确认这段记忆的确属实。我并不完全了解这种不劳而获的大奖为什么具有如此突然又效果深远的作用,我只知道那张额外的骑马券实时解放我心中的压抑和憎恨,我猜这便是那只海豚的感受。或许将来有人会拿它作为博士研究论文,向我们解释原由。/ P' Z( G9 R. ?7 ]4 S
    制约增强物
7 M4 k4 V6 y) z( a0 S; \/ p$ q    当动物出现你希望鼓励的行为时,你司能根本无法即刻给予增强物,尤其使用食物增强时更是如此。以训练海豚跳跃为例,当牠跃入空中时我不可能马上拿鱼喂牠,这么一来每次奖励牠跳跃而赏牠鱼儿吃的时问势必延误。但事实上,久而久之海豚终究还是会把跳跃动作和吃鱼联想在一块儿,于是跳跃动作还是会增加,只是关键在于牠无法得知我到底是喜欢牠跳跃的哪一点,是高度?弧度?还是水花四溅的入水动作?于是牠必须跳跃许多次,才能找到我心中期望的跳跃动作是什么。遇到这种状况时,我们便可以利用「制约增强物」。6 o( [&&L0 V& ^9 W, {! z
    「制约增强物」是指一个原本不具意义的讯号(可能是声音、光线或动作),刻意让它在增强物出现之前或出现期间出现。现代海豚训练师都利用警用哨笛作为制约增强物,海豚即使在水底也可听到哨音,而且训练师还可以空出双手比手势及喂鱼。我时常使用一种发出响声的便宜派对玩具训练其它动物,这些玩具只要一压就会发出喀达喀达声,或者我也会特别选用某个称赞用语,当成制约增强物之用,例如使用「乖狗狗!」或「乖马儿!」学校老师常使用「那很不错唷!」和「非常好!」等具有形式意义且谨慎运用的赞美也出于此理,学童总是会迫不及待把事情做完,等着听到这启赞美。
2 A7 Y- Z5 C3 [5 l    日常生活中的制约增强物不胜枚举,诸如我们总是喜欢听到电话铃响或看到被信塞得满满的信箱,即便接到的电话大都很无趣或者信箱里多半是垃圾信,因为我们从过去多次经验学习到,电话铃响或信件与好的事情具有关连性。我们喜欢圣诞节音乐,讨厌牙医诊所的气味,我们在周遭摆设一些东西(照片、盘子或奖杯),不是因为它们美观或实用,而是因为它们能让我们回忆起快乐时光或亲爱的人,这些东西都是制约增强物。讲求实效的正增强动物训练几乎都应该先从建立制约增强物开始,在正式展开训练前,趁动物尚未刻意出现行为,先教导牠制约增强物的重要性,作法是让这个「制约增强物」与食物、拍抚或其它真正的增强物产生联结,随后你可以在动物身上看出牠们是否已经理解这是你示意「很好!」的讯号,通常牠们接收到制约增强物时会表现出停格一下的反应,然后开始寻找真正的增强物。有了制约增强物,你将拥有一个能够真正与动物沟通的方式,告知牠你到底喜欢牠的哪一点行为,所以不必当怪医杜立德也能与动物「交谈」,利用这种「习得」的增强物你将会惊讶自己可以对动物「说」出许多讯息。制约增强物的威力极大,我曾见过饱足的海洋哺乳动物为了获取制约增强物仍持续工作,马儿和狗儿持续工作一小时以上只为了得到少许的初级增强物,人类当然也会为了钱不停工作,说穿了「钱」就是一种制约增强物,是用来买东西的代换品,而钱赚得根本花不完的人甚至特别爱赚钱,他们对这个制约增强物已沉迷得无法自拔。可以联结到多种初级增强物的制约增强物将更具威力。举例来说,动物在训练时可能不想要食物,但如果同一个声音增强物曾被刻意联结到喝水或其它乐趣,这个增强物将仍具效用,而且会更有效。我家猫咪听见「好乖!」时就会看见晚餐出现、被人拍抚、得以进出门口或领取表演把戏的奖赏,于是我现在便可以轻易利用「好乖!」增强牠们跳下餐桌的行为,而不必给予真正的增强物。然而,金钱之所以具有极大增强作用,或许正是因为它几乎可以与所有东西作联结,是一种联结甚广的制约增强物。制约增强物一旦建立起来了,便必须谨慎的使用它,以免减低了它的效用。帮我骑乘我家韦尔斯小型马的孩子很快便学会,只有在他们想增强马儿行为时才可以说「乖马儿!」,若只是单纯想表达对马儿的喜爱,只要不使用这三个字,他们对着马儿说得天花乱坠都没有关系。某天他们看见一名新来的孩子抚摸马儿脸颊时边说:「你是乖马儿!」其中三个孩子立即包围质问她:「妳为什么对牠这么说?牠又没做什么!」同理,我们应该给予子女(配偶、父母、情人或朋友)很多的爱与关注,不需要在他们出现特定行为才给予,但我们确实应该慎用赞美,把赞美当成制约增强物,实际出现好行为时才赞美,即便是幼童,人们对于虚情假意或无意义的赞美都会很快感到厌恶,因而不再具有任何增强作用。 3 l! o& R% c! ]' V, j) b7 q( c
    响片训练
$ y$ g. h9 i! z# c4 w    海洋哺乳动物训练师通常以哨音作为制约增强物,用来训练鲸豚、海豹和北极熊。凯勒·布瑞兰首度在六○年代将这个训练概念引进海洋哺乳动物园和美国军用海豚训练,他曾是制约心理学家史金纳博士的研究生,他把哨音称作「中介刺激」,因为它除了告知海豚即将获得一条鱼之外,也成了海豚「在池中央跳跃」(被增强的行为)和「游到池旁领赏」两个动作之间的中介联结。行为分析的文献承认制约增强物具有这两个作用,不过它还有更多作用等候发现。到了90年代,越来越多动物训练师开始使用操作制约、塑形法、正增强和制约增强物,也有越来越多的民众开始这么做,由狗儿饲主引领风潮(请见第六章),由于狗儿饲主使用的制约增强物是种内含金属簧片的塑料响片,他们便称这种训练为「响片训练」,而称自己为「响片训练者」。
$ E. C, M- t) D&&V# R6 M    响片训练者使用的响片除了是制约增强物,以及介于「赚取」和「实际获得」食物之闲的刺激外,它还具有多种未获研究的功能。首先最重要的功能是奥登·林兹博士所称的「事件标定器」作用,响片让训练对象明确知道被增强的行为是什么,它甚至把主控权交到训练对象的身上,过了一阵子之后训练对象不再只是重复行为,而是显露出意愿:「嘿!我使你按下响片了!你看看,我再做一次!」响片训练者把这种转变称为「灯泡亮了」比喻浑然开窍、豁然开朗的时刻,不管对训练者或训练对象都具有极大的增强效果。爱伦·瑞丝博士向我指出,响片训练者使用的制约增强物也是一个代表「完毕了!」的终结讯号,诚如训练师盖瑞·威尔克斯所言:「响片终结了行为」吃块热狗奖赏。哲学家葛雷格里·贝特森在海洋生物世界任职数年,他主张操作制约只不过是一个用来与外星生物沟通的系统,它的确可以拿来这么用。标定讯号的另一个主要功能是用来沟通特定讯息,训练师史帝夫·怀特警官告诉我,他曾叫他的巡逻德国牧羊大搜寻某个被丢在六呎高树丛顶端的对象,那只狗在地面搜寻很久但徒劳无功,然后当牠碰巧把头抬高时,史帝夫按下了响片,那只狗立刻转而嗅闻头部高度的空气,警觉到目标对象的气味,然候开始往区域内较高的地方搜寻气味,甚至以后脚站立起来嗅闻,于是在史帝夫没有再度出手协助下,牠找到了对象位置,猛跳到树丛顶取得了这项对象。「继续加油!」以刚刚史帝夫在和他的狗沟通时的例子来看,他们之间的沟通有另一个特点,史帝夫的响片声并不是作为一个终结讯号,而是一个「继续加油!」的讯号,由于狗儿尚未发现目标对象,响片的适时出现不但是增强了往上方嗅闻的行为,也让狗儿继续出现搜寻的行为。我在本书初版中曾写道,我们可以多次使用制约增强物但不给予真正的增强物,直到最后再给予即可。我之所以这么说是因为,有时候在训练海洋生物世界的海豚出现长时性行为或连锁行为时会这么做,但是我当初写书时并没有意识到,我们事实上使用了(至少)两种的制约增强物(或标定讯号)一种是正常音量的哨音,代表「这就对了!食物随后就到,过去那边取食,完毕了!」另一种则是较轻的哨音,代表「这就对了,但是还没达到目标!」我在九○年代曾与许多响片训练新手共事,训犬书籍作家摩根?史贝克特称这些人为「跨域训练者」,指精通处罚式训练,但正试图改用塑形法和正增强的人。当时我发现他们都很愿意按响片,但却极不愿意给食,甚至到了已经让响片意义不复存在的地步。对此我必须强调,唯有遵循「按一次响片,给一次零食」的通则才能教会人们如何有效塑造行为。不过,在许多现实状况中,有些「过渡性的增强刺激」可能非常好用,如同上述史帝夫与巡逻犬的例子所示,另择一个增强刺激,并藉由这个刺激告知训练对象「那就对了,继续加油!」是个解决方法。「继续加油!」的讯号并不需要直接联结初级增强物,只要在响片终结声出现之前插入这个讯号即可,学习者很快就可以理解到,它只是一个引领至最终增强物的讯号。0 N% r9 S; O8 q# g5 m# ~8 m. o
     接下来你便可以好好运用这个「过渡性的增强刺激」,在连锁行为当中利用它作为蕴含讯息的标定讯号,不必让进行中的行为停下来;举例来说,敏捷赛中狗儿进行障碍竞速,主人必须在狗儿迅速移动之下指示牠下一个障碍是什么,我曾见过狗儿在达成某项障碍后,表现出不知所措的样子,彷佛没听清楚指示,不知该穿入隧道还是跨栏,牠的头在两项障碍之问来回摆动着,当狗儿朝跨栏望过去,主人大喊「没错!」时,狗儿才立刻跑向正确的障碍项目。如同最终才出现的响片声一样,这种过渡性的讯号可以是任何刺激(响片、哨音、大喊一声或挥一下手),但要注意的是,这个刺激并不能只是怀抱希望的鼓励或加油打气(这么做可能使动物分心或不小心增强其它行为),它也必须是一种意义明确、精确使用的制约增强物。习得厌恶刺激及时发出的「习得正面讯号」是告知接收者「你现在的行为很好,将为你带来好处,所以多出现这个行为吧!」,而你也可以建立「习得厌恶刺激」,它告诉接收者的讯息是「你现在的行为不好,你要是不停止这个行为的话,不好的事就会验生。习得厌恶刺激比起威胁史为有效,有些动物 -- 我想到的是猫咪 -- 对于大喊大叫和责骂没有反应,不过我有一位朋友有次却意外治好了她家猫咪爱抓沙发的毛病,事实是因为她大喊出的「不!」变成了习得厌恶刺激。有天她在厨房里失手掉落一个铸铜大托盘,正好就掉在猫咪身旁,而当托盘掉下时,她大喊「不!」,下一秒托盘即落地发出巨响,猫味被吓得跳起来,全身毛都竖了起来。之后当猫味抓沙发时,主人一喊「不!」,猫咪便看来一副惊惧样,立即停止动作,在重复两次之后这个行为便永远消失了。此训斥是生活中必要存在的一部分,以正增强作为教导的主要工具,这并不代表必要时不能说「不!」(例如幼儿拿东西戳入插座时),然而,一些训练者拿这种现实状况为例认为无论什么状况,教导时经常作「纠正」是很合理的,事实上他们犯了两个错:第一、他们似乎认为纠正的好处和正增强一样多,却没考虑到它对学习者产生的其它影响(请见第四章「处罚」)。第二、他们使用训斥和处罚,但并未建立警告讯号(即习得厌恶刺激)。要让「不!」产生效果的诀窍在于必须让它成为制约负增强物,举例来说,如果你觉得有必要使用P字链(收缩链),你便应该在狗儿犯错的同时说出「不!」,然后在拉扯链子之前稍等一会儿,给牠机会修正行为以避免处罚。如果你只是直接拉扯P字链但没给牠警告,这个拉扯的动作就只是纯粹沦为处罚,将无可预期它对未来行为的影响,而且这个处罚的累积效应可能会影响狗儿的工作饮望。另一个常犯错误是,当狗儿回到位置上时依然继续猛扯链子,这使牠的两个行为都受到处罚。如果纠正式训练方法缺乏了制约负增强物,实际用到厌恶刺激的机会将会增加,也将使学习速度变慢。有时候传统训练师为了获得可靠稳定的行为,必须比应用增强训练的训练师多花费许多时间进行训练,也许花上数个月或甚至数年以上,这不只是因为他们所依赖的处罚方式会让行为消失,也因为他们使用处罚时缺少了制约负增强物,必须重复训练之后,动物才能归纳出牠们应该出现的行为。近来有一类特殊的制约负增强物颇受训犬人士欢迎,这种「无奖励标定(确定)讯号」通常是以平淡语气说出「错!」这个字,概念是当狗儿表现不同行为试图猜测你想要什么时,你可以利用一个表示「那个行为不会得到增强」的讯号告诉牠哪些行为没用。
d- i u% L&&B$ R* j# N' h' T    根据史金纳博士对「处罚」的定义 - 把动物想要的事物取走,这表示当「错!」这个字代表动物将无法获得增强物时,它无可避免地成为一个习得厌恶刺激,而它是否也因提供讯息而变得具有增强作用呢?我在训犬界里看过一些「错!」可派上用场的特殊情况,如果你的狗已经知道很多塑型完成的行为和指示讯号--也就是说,牠对训练极富经验--你便可以利用「错!」这个口令作为要牠改变行为的讯号,意思是:「省省力气,那么做没用,试试别的。」要让这个作法奏效必须符合以下条件: 训练对象过去为了获得响片声而变化行为或主动尝试新行为时常获得增强的经验。使用这种必须巧妙运用的讯号时之所以出现问题,通常是因为人们把它用在没有经验、不明白人们想要什么的狗儿身上,这时人们很容易把这个讯号比照P字链使用:叫狗儿坐下,牠没坐下,立刻喊:「错!」如果这个讯号确实带有「不会获得增强物」的意义,那么「没有坐下」的行为即遭到处罚。但是这并不代表坐下的行为现在即将发生,事实上它的后果很可能与其它处罚一样无可预料,狗儿可能完全不再反应并低头怯怯地偷偷溜走,或者牠会放弃你,开始自己寻求增强物,因而出现不当行为,例如吠叫、暴冲、嗅闻地面或抓痒,把注意力移到他处。 无法预料的奖励更具吸引力/变化的强化
g P; |. s$ n&&a&&N3 Y0 x    有个广为流传的错误观念是,当开始以正增强训练某个行为时,便必须在训练对象的余生里一直使用正增强物,如果不这么做,这个行为将会消失。这个说法并不正确,事实上只有在学习的阶段才需要持续使用增强物。你可能会经常称赞幼儿使用马桶的行为,但是一旦这个行为完成学习,它将自行获得增强。我们应该常常给予初学者增强物,例如教小孩骑自行车时可能需要不断告诉他:「那就对了,现在骑稳,你做到了,很好!」如果当他学会骑车而你却仍不断称赞他,这时你就很蠢了(小孩也会以为你发神经了)。
/ c# B! L0 a8 Y4 K, I4 X0 n9 q& u    为了使学成的行为维持一定的可靠程度,非但没有必要每次都增强这个行为,而且极为重要的是,不可以经常增强这个行为,而要改为偶尔增强,而且是随机性(无法预测)的增强。心理学家称这种增强方式为「变化性增强时制」,它维持行为的效果比起持续性、可预测的增强方式更好。一位心理学家曾跟我这么解释:假设你的新车总是很容易岭动,某天当你坐上车后把车钥匙一转,它却没发动,你可能会再试着发动几次,但是你很快就会判断这辆车出了问题而打电话给修车厂,由于转动车钥匙的行为没有立即带来期待的增强结果,这个转动钥匙岭动车子的行为很快便会消失。相反地,如果这是台老旧的破车,几乎很少在第一次就发动,而且通常还得花很久时间发动,这时候你便可能花上半个小时不断试图启动,因为这个转动车钥匙的行为长期以来一直受到变化性增强,因而能稳定维持着这个行为。如果海豚每次跳跃都一定有鱼吃,牠跳跃的动作将很快变得马虎敷衍,过得去就好,然后要是不给鱼了,海豚跳跃的动作很快就会消失。不过,如果在牠学会跳跃就有鱼吃的概念后,我现在开始只增强第一次跳跃、第三次跳跃,接着便随机增强牠的跳跃动作,这个行为就会稳定维持下来,当动物没获得奖励时,牠们反而会更常跳跃,期盼下次中奖的机会,而且跳跃时甚至可能变得更有活力。如此一来,我便能够选择增强较具活力的跳跃动作。利用变化性增强时制可以塑造出较佳的表现。不过即使是专业动物训练师,有些人仍法善用变化时制的正增强方法,它对许多人似乎都是个特别难以理解与接受的概念,我们都知道当错误行为停止时,我们就不必再继续处罚,可是我们往往无法理解为何没有必要继续奖励好的行为或甚至不应该这么做。这其实是因为我们想以正增强训练出进退有礼的良好行为时,我们自己也不太确定应该怎么做。变化性增强时制的威力正是赌博的本质,要是每次投一块硬币到吃角子老虎里就会有十块硬币掉出来,你很快就会丧失兴趣,虽然你的钱会越来越多,但是这种方式实在很无趣。人们之所以爱玩吃角子老虎正是因为他们无法预料将出现什么:可能空空如也、可能掉下一些钱、也可能掉下很多钱。我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性增强的作用就是让他们上瘾的原因。 9 Q1 ? q0 N, f% t8 ~* K/ f9 ~( l
& & 变化性增强出现的时间间隔越长,它所维持行为的效果就越强,不过如果你想设法消除某项行为,把时间间隔拉长的变化性增强就对你很不利。所有未获增强的行为都有自行消失的倾向,但是如果它不时获得增挂,尽管只是偶发事件 -- 抽根烟、喝杯酒或者对不断唠叨或哀求的人梢事让步 -- 这个行为不仅不会消失,事实上它可能反而被这种间隔拉长的变化性增强时制维持得更好,这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。8 A% e$ Y J$ O1 G2 Y% l3 x
& & 我们都看过一些遭配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人却执迷不侮的情况,传统以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其它方式离开恶劣的另一半,他们旋及又会找到同类型的对象重蹈覆辙。这些长期成为受害者的人是否具有严重的心理问题呢?有这个可能,不过他们也可能是长间隔变化性增强时制的受害者。常你刚开始与对方交往时,认为对方迷人、性感、风趣你的钱会越来越多,但是这种方式实在很无趣又无微不至,即使这个人日后逐渐变得难以相处,甚至施暴,但偶尔还是会对你展现好的一面,即使获得这些美好增强物的时光变得越来越罕见,它却成了你的人生寄托。从常理来看,这似乎是十分反常的现象,但是从训练观点的角度看来却显而易见:这些美好时光出现得越少、越无可预测,它的增强作用越强大,而且你的基本行为也将越为持久。此外,也不难理解为什么曾经有过这类关系的人会再度寻求同类对象,因为他们与和善正派的正常人交往时可能就是少了那种增强物极少出现、令人渴盼、因而增强效果加倍所带来的快感。从操纵者的角度来看,想任意使唤某个人、并且让他随时言听计从,只要偶尔给他他想要的东西就可以达到目的了,这便是皮条客管理手下妓女的手法之一。它的确是个极为有效的方法,但是一旦受害者理解到操纵者的强烈「魅力」至少有部分来自这种变化性增强时制,他们通常便能冷静离开这种关系,找寻不同的对象。, Z1 R2 \' P/ V$ K3 Q, Y' q
    不适用变化性增强的情况/ Q& t1 i3 d |# D0 S
    在行为学成后不应该采用变化性增强的情况只有一种,那就是当这个行为牵涉到解答问题的时候。高级服从训练要求狗儿从一堆杂七杂八的东西里找出主人摸过且带有气味的对象,每当狗儿选对对象时都必须让牠知道,这样牠才知道下次该怎么做。进行分辨测验(例如找出两个声音之频率较高者)时,动物每次答对都必须获得增强,这样牠才能一直获知要求牠回答的问题是什么(当然,这时可以使用制约增强物)。我们在玩填字游戏或拼图时,每次猜对就会被增强,因为只有正确的字或拼图片才能放入对应的空格或位置里,如果每个空洞都可放入多片拼图,你便得不到因正确选择带来的正增强,这种回锁对于多数选择性测验的情境都是必要的。
; A# n! g& K [ s4 B    如何打破「起头最难的障碍」0 e4 N/ Z! U- `& h
    除了变化性增强时制之外,我们也可以采用「固定增强时制」,这意谓动物必须在预定时间内持续某项行为,或者必须完成预定次数的行为之后才会获得增强。举例来说,我可以安排海豚连续跳跃,每跳完六次就增强一次,于是连跳六次的行为很快就会经常出现。但固定增强时制的问题是,连续行为当中较早出现的行为永远得不到增强,于是常会变得越来越马虎,过得去就好。以海豚跳跃为例,除了最后一次实际获得增强的跳跃动作以外,其它跳跃动作将逐渐变得越来越小。固定增强时制的缩减效应或许是影响人类许多任务的一项因素,以工厂装配线为例,人们通常必须工作一段固定时间才能获得增强,与工作表现优劣无关,人们当然只想尽量少花力气,只要足以让他们待下来就好,而且每次刚开始工作时的表现可能会特别糟。以海豚来说,偶尔随机增强第一次或第二次跳跃对于维持行为的效果与增强第六次跳跃一样有帮助。对人类来说,如果各式奖励津贴或其它形式增强物(例如颁奖)与工作量或工作表现有直接关系,并且不与平常的增强物同时出现,它的增强效果将会很好。3 f( ?: x. S2 s% L
    无论采取固定或变化性增强时制,都可以训练出一长串的连续行为,小鸡可以为了一粒玉米猛啄钮扣一百次以上,人类也有许多久候增强的例子,有位心理学家开玩笑地说,自人类存在以来,等待时问最久、一直未获增强的行为就是念研究所。间隔极长的增强时制有时会因为超过极限而失效,小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能量高于一粒玉米提供的能量时,啄东西的行为通常会消失,因为做这件事所获得的好处太少,变得不值得做。这种情形当然也常岭生在人类身上。间隔极长的增强时制也可能产生另一个现象,小鸡一旦开始啄东西以后即会毫不间断地持续啄,因为每啄一次将更接近获得增强的机会,不过研究人员注意到,增强间隔拖得越长,小鸡开始啄东西的行为就会越晚出现,这种情形称为「长时间行为的延迟启始现象」,这是每个人在日常生活中都非常熟悉的现象。遇到任何耗时很长的工作时,无论是报所得税或整理车库,每个人都想得出许多无法立即开始进行的理由。写作(有时甚至只是写封信)是个花时问的行为,虽然一旦开始写了之后通常会进行顺利,但是要叫人坐下来开始写真的很难! 作家詹姆斯·索伯 发现,要他开始着手写稿真的非常困难,他有时会装装样子骗他老婆(可理解地,她当然急着要他写稿,因为这样才能付房租),他会整个早上躺在书房沙发上用一只手看书,同时用另一只手随便敲着打字机键盘,将来可以获得金钱正增强物的愿景不敌这个延迟启始的现象,而假装打字的动作至少阻止了被老婆斥责的负增强物。
0 X' }/ ~* o& c6 @$ `    要克服这种延迟启始的现象有一个方法:在行为刚开始时即给予一些增强物。我有时会在海豚连续跳跃六次的动作中增强第一次或第二次的跳跃动作,我也会用同样的技巧训练自己。多年来,我曾经每星期有一两个晚上要上研究所的课,三小时的课再加上地铁各一小时的来回,每次都花上很久的时问,每当接近下午五点钟我总是出现不想去上课的强烈欲望。不过后来我发现,假如我把这趟路程分段,再把第一段分成五个小步骤 -- 走路到地下铁、赶上列车、转车、搭公交车去大学和最后爬上楼梯去教室,而且每当在我完成一个小步骤就犒赏自己一小块我很喜欢但平常不吃的巧克力,这个增强每个初期小步骤的作汰至少让我能够走出家门,而且几星期之后我已经能够一路前去上课,不再需要巧克力,心中也没有挣扎。
; U& K$ s$ \/ Y( L    迷信行为:意外的增强效果 9 x X' x! f7 |) g
    现实生活中无时无刻都会出现增强,而通常都是碰巧发生的。一位研究者鹰的生物学家注意到,如果老鹰在某处树丛下抓到老鼠,随后约有一星期的时间牠每天都会到该处侦察,牠飞经那个特定地点的机率已经被强烈增强。如果你在垃圾桶里找到一张二十美元的大钞,我相信你隔天再次经过这个垃圾桶时,肯定会仔细往里头瞧瞧。那个意外的增强对老鹰有利,事实上,动物行为可说是为了使每个物种从增强上获利而演化出来,然而关连性也会意外产生,而且它仍可能对行为有深切影响。如果某项行为与后果其实毫不相干,但动物仍出现该行为,彷佛牠必须这么做才能获得增强,科学家称此行为为「迷信行为」。就举咬铅笔的例子好了,如果考试时把铅笔放到嘴里,正好在此时想到了正确答案或好灵感,于是咬铅笔的行为即受到了增强。我上大学时每枝铅笔都盖满了齿痕! 遇到特别难的考试时,我有时还会把铅笔咬断。咬铅笔有助于思考吗?当然没有,这只是个被意外制约的行为罢了。人们出任要务时会穿上特定衣物或进行某套仪式也是出于同理。我看过一名棒球投手每次准备投球前都会进行一套九个步骤的连锁动作:轻碰棒球帽、把球轻触手套、把棒球帽往前推、擦擦耳朵、把棒球帽往后推、单脚来回磨地等等,局势紧张时他可能还会把整套动作重复两遍,而且从来不会变动动作顺序。这套动作发生的时间相当短(球赛播报员从不曾提及这些动作),然而它却是一套极为繁复的迷信行为。动物接受训练时也常会蹦出迷信行为,牠可能会出现一些你并未特意要求的反应,但这些反应常被意外增强而受到制约,例如,动物可能出现牠似乎必须待在某处、面朝特定方向或出现特定坐姿时才能获得增强的样子,当你要牠换地方训练或面朝另一个方向时,牠的行为却难以理解地突然做不好了,想找出原因可能得花些功夫,因此聪明的作法是,在行为至少完成了部分训练之后,随即在进行训练时变化所有你不认为重要的情境变量,以免发展出一些日后可能成为阻碍的意外制约行为。最重要的是,要注意不经意时形成的增强间隔模式。动物和人类对时间的间隔都很敏锐。有一次,我十分确信自己已训练两只鼠海豚依讯号跳跃(看我的手势),直到一位来访的科学家拿着秒表告诉我,只要每隔二十九秒牠们就会跳跃一次;果真没错,无论我是否给讯号,牠们都会每二十九秒跳一次,我给讯号的行为意外被制约得极为规律,而鼠海豚是因为发觉了这个规律性而跳跃,并非依照我所给予的讯息而动作。9 C! D8 x r' _$ m5 m
    许多传统动物训练师的想拭及行为也都充斥着迷信,他们有些人告诉我,海豚较喜欢穿白色衣服的人、骡子一定非揍不可、熊不喜欢女性等等。而「训练」人类的人可能也一样糟糕,例如他们可能相信小学五年级的孩子一定得大声责骂不可。这类训练师受到传统的摆布,训练时每次都必须按照完全相同的步骤,因为他们无法区分哪些方法有效、哪些只是迷信。这种无能(或混淆)常见于多种专业领域 -- 教育界、工程界、军中,特别是医界,令人瞻寒的是,极多施予病人身上的处理程序并不具疗效,它们纯粹只是沿习或时兴的作法而已,任何住院过的病患随便想都能想到六项不必要的程序,这些程序都是迷信行为罢了。
1 _* D0 i7 ?8 x( K1 K) V6 h/ N    有趣的是,单单向人指出迷信行为无效并不一定能使它消失,由于它受到强烈制约,人们可能因而为它强烈辩护,如果攻击某位医生惯用的疗法无用或甚至有害,你一定会遭到猛然反击。我相信如果有人命令那位有九个暖身迷信步骤的投手脱掉那顶他得碰四次的棒球帽,他一定会奋力抗拒。不过,你仍然可以去除自己的迷信行为,方法是一议自己明白它与获得增强物无关。我儿子泰德是银行家,他的嗜好是参加剑击比赛,他每个星期会找出两三段时间练习,而且常在周末四处旅行参加比赛。有天他碰上一名很强的对手,他却因为把最爱用的一把剑忘在家中而提不起劲,当然,他输了那场比赛。后来他发现提不起劲比起那把剑更影响他的剑击表现,而且使用「最爱用」的剑其实全是迷信行为。泰德于是开始着手去除所有他找得出来的剑击相关迷信行为,他发现自己有很多迷信行为:一定要穿戴特定衣物,心中深信一夜睡不好、吵架或甚至比赛时把果汁喝光了等等都可能影响比赛表现,他系统性地一一检视这些状况,每找到一个迷信行为就消除对它的依赖。现在,每次参加比赛他都能轻松自信以对,即使赛前一小时他恶运连连似地错过火车、弄丢球衣球具、与出租车司机争吵,或者穿着练习用服装和配错对的袜子、使用借来的剑也都无所谓了
* F7 U8 v) M( d% L$ @    利用正增强可以做什么?
* ?0 H0 L6 X&&Q# r. R* Q    以下是我认识的人应用正增强的一些例子:设计师茱蒂为了温故知新,每周到附近大学上一次夜间绘画课,班上同学多半也是设计师或商业艺术家。考师每周指定回家作业,但这些专业人士有许多人根本不做作业,老师总是习惯至少花上十分钟向全班唠叨作业欠缴的情形,茱蒂被骂烦了,于是建议老师不要再批评不缴交作业的人,而改赞美那些缴交作业的人。老师接受了建议,日后在课堂上公开称赞每件完成的作业。到了第三个星期,老师不但有一班快乐学习的学生,缴交作业的人数也增加了。
1 s7 e. r# d) U) |( a# ?( M    大学生仙娜到朋友家中拜访,却遇见朋友为了帮家中的德国牧羊犬的耳朵上药,四个成年人企图协力抓住牠,不要让牠挣扎乱动,却徒劳无功而且还有些危险。仙娜并不特别爱狗,不过她学过正增强,她从冰箱拿出一些起司,五分钟之内狗儿被她训练得安静不动,她一个人轻松完成耳朵上药。有位年轻女子嫁了一名男子,结果她的先生爱指使人又很苛刻,更糟的是,她同住的公公也是一个样儿,这名女子的母亲告诉我这则故事,她第一次造访时看到自己女儿的遭遇甚为惊恐,但她女儿说:「别担心,妈,等着瞧吧!」她的作法是遇到命令和苛刻言词时尽可能不予反应,但两人之中任何一人出现和颜悦色或体贴倾向时即马上作增强,给予认可及热情。一年之内她已使两人改头换面,成为亲切和气的好男人。现在他们都会带着微笑欢迎她回家,而且都会马上起身帮忙拿杂货。
5 M! P$ O0 E- Q7 `9 Q2 W! j    有个国二女生住在都市里,她喜欢周末带狗到乡间散步,可是她的狗经常跑走,召牠回来时牠又常拒绝回到身边,尤其到了回家的时间更是如此。某个周末她关始这么做:每当狗儿东跑跑西跑跑,然后自动跑来找她时,她便对牠施出浑身解数,称赞牠、拍拍牠、像对婴儿般对牠矶叽呱呱讲话、抱抱牠等,等到回家的时闲到了,她叫狗儿过来,牠便很高兴地回来了,女孩以盛大的仪式欢迎狗儿,这个增强物显然胜过狗儿平常拖延时间所获得的自由,从此牠去乡间散步不再出现问题。
; c. ^&&S( y! s p- |    一名初级行政人员有个恐怖暴躁的上司,他从自己工作内容当中找出了一些可能增强上司的地方(例如拿文件请他签名),并且尽可能挑选上司不在气头上的时间找他,渐渐地,这位上司变得和气,后来还开始讲起笑话。有些人发展出的增强物极为特殊,使得他人一心设法获得这种增强。安娜特是一名住在郊区的家庭主妇,孩子都长大离家了,如果她没有一群朋友经常打电话来分享消息,她几乎与世隔绝。这些朋友不一定是邻居或亲戚,许多人是住在远地的忙碌职业妇女,我就是其中之一。我们为什么都打电话给安娜特呢?当我们有坏消息(例如感冒、遇到国税局查税或者保母要搬走了),安娜特会安慰我们,给我们忠告,不过这些都是朋友应该做的事,但她的过人之处在于,当我们有好消息,她会特别增强,如果你告诉她银行批准了你的贷款,她不会只说:「太棒了!」,她会特别指出你做了哪些努力,为什么你受之无愧,她的响应可能是:「妳看吧,记得妳以前为了维持良好信用有多努力吧!还记得妳千辛万苦解决了电话公司的问题,还申请了一张航空卡吗?现在一切都值得了,妳被评为好的生意人,不过那时妳得先做出正确的行动,妳也确实这么做了,我真是为妳感到自豪。」哇!这不仅仅是认可而已,这是「增强」唷 -- 而且她增强的是过去所作的努力,即使当时只觉得那真是场磨难。安娜特不会把好消息归类于「好运」,她使它转变成增强他人的机会,当然也增强了大家想打电话给她的意愿。
# T, V6 ]' y2 ] p6 y) q! D    团体中的增强
z9 r5 y7 [, M4 }& b! p' I, Z
    业务代表大会、家长会、卡内基课程或减肥巾心,这类闲授自我成长集体课程的机构其实大多非常仰赖集体对个人的增强效果,掌声、奖牌及颁奖仪式等集体嘉奖形式是很有效的增强物,有些作法还相当异想天开。以前有一位业务主管希望增强手下业务团队的年度表现,于是他雇用了挤满一整个足球场的人,为员工、高阶主管和所有员工家属盛大举行一场派对,他让所有业务代表从球员出场的地方跑进球场,分数板上闪动着他们的大名,由全场群众高声欢呼迎接。
( O( K3 `6 ]! `# z5 d( z j% }* R3 A&&i    我上过沃纳.欧哈德的「欧哈德研讨会训练课程」,它有些吹擂自我的推销意味,但是从训练的角度来看,我发现这个课程设计得很巧妙,经常高明运用塑形及增强原则。我认为它的名字「训练课程」取得很适切,带领课程的人称为「训练官」,塑形的目标是认识自孜,主要增强物不是训练官的反应,而是所有人表现出的非语言集体行为。为了发展出集体增强行为,他们要求二百五十名学员在每位讲者讲完之后都必须鼓掌,无论他们是否想这么做,因此从一开始,害羞的人得到鼓励,胆子大的人也得到了奖励,而且任何人的见解(无论见解深入或愚蠢)都被大家接受。起初大家的鼓掌只是义务性质,但它很快变得具有真正沟通意义 -- 它不同于戏院里的掌声,并不是用来表达欣赏程度,而是表达不同程度的感受和意义。举例来说,我那次上课的学员里有名好辩的男子,我想每次的课程都会有这样的人,他经常从训练官的话里挑语病,到了第三或第四次时,训练官闲始回嘴,其实大家都看得很清楚,从逻辑来看这名男子说得一点也没错,但是随着他们吵得越来越久,早已没人在乎谁对谁错,其余的二百四十九位学员都只希望他闭嘴坐下。这里的规则 -- 其实是塑形法的原则 -- 并不允许我们提出抗议或叫他住嘴,但是他逐渐意识到周遭一片寂静,我们看着他渐渐领悟到没人在乎他是对的,当「对」或许并不重要时,他变得结结巴巴,慢慢地闭上金口坐了下来,所有人立刻爆发出轰堂掌声,表达大家赞同、谅解及全然放松之意 -- 这对他刚刚的体悟是极为有效的正增强。在这种训练过程中,真正重要的是行为,因此不需要言语,但要向局外人解释这种训练常常极为困难。欧哈德像是禅学导师,常以格言开示,以上例来看,欧哈德的课程格言是:「当你是对的,你就是只是『对的』而已。」意思是,你不一定有人爱,也不一定人很好,你只是「对」而已。如果派对上有人高谈阔论、举止夸张,而我引用这句格言,上过欧哈德课程的人可能都会大笑 -- 事实上,任何一位好的现代训练者司能都会大笑,不过多数听到这句话的人可能会以为我是白痴或喝醉了。好的训练概念并不一定可用言语解释清楚。
2 W) V3 u3 W2 X    别忘了增强自己) ~, h6 v, F) y' I4 t
    增强式训练还可以应用在自己身上,我们常忽略这个作法。我们往往很容易对自己过于严苛,一位我认识的牧师说:「我们很少人为自己设下容易达成的低标。」于是我们经常连续多日忙碌无休,事情一件接着一件做,从不留意或感激自己。事实上,除了改变习性或学习新技能时可以增强自己之外,每日生活的努力也应该获得一些增强,我认为缺乏增强物是导致焦虑和沮丧的因素。你可以利用健康的方式增强自己:给自己一小时的假散步去、和朋友聊天或读一本好书,或者也可以利用不健康的方式:抽烟、喝一杯威士忌、大吃一顿、通宵玩乐等等。
3 p0 H&&O1 ~3 y1 Z9 J: T; X    我很喜欢已故美国女演员罗丝·高登的建议:「演员极需要赞美,如果我撑过一段没有赞美的日子,我就会自我赞美,它的效果一样很好,因为至少我知道这个赞美是真心诚意的。」
&&e/ O! O/ q5 H6 F    塑形法
: N, \5 J' Y: ?4 \: d    不打, 不骂, 不施压的训练法; t$ \# S$ o* _/ w6 |7 b# I3 p
    什么是塑形法? 增强动物已经出现的行为,让这些行为更常发生是很好,但是训练者要怎么做才能使动物出现那些牠们可能永远都不会碰巧出现的行为呢?怎么做才能让狗儿后空翻,或让海豚跃人圈圈内呢?8 R6 H {/ R& k) ~6 X# m3 R% B
    狗儿后空翻、海豚跳圈圈或人类投篮都是经过塑形的行为。塑形法是指把一个倾向于正确方向的小行为慢慢进行调整,每次只改变一点儿,朝最终行为目标推进。这个过程有个专有名词 - 「连续渐进法」。生物行为并非一成不变,因此才有可能进行塑形法,不管动物的行为是什么,有时这个行为在某些方面的表现可能较强烈有力,因此无论你希望塑造出的终极行为多么复杂或困难,你都可以利用牠目前已出现的行为作为第一步,再一步步建立过渡行为。举例来说,假设我想训练鸡「跳舞」,起初我可能会先观察鸡的动作,等到牠每次刚好往左栘动时便作增强,很快地我的第一个目标即能达成 -- 鸡变得常往左方移动,而且牠的动作不 一定每次相同,有时只移动一点,有时做很大的移动动作。接着,我会选择性地增强较大的往左动作,例如增强牠转了四分之一圈,当它成为最常出现的反应时,我可以把增强标准拉高,设定新目标,开始选择增强鸡转了半圈或半圈以上的行为。等到鸡被塑形到为了一个增强物可以快速转完很多圈时,我可能才会认定自己达成终极目标 -- 成功训练一只会跳舞的鸡。我们都相当习惯塑形也很习惯被塑形,大致说来养儿育女多半就是塑形的过程,无论是打网球或打字,训练任何肢礼技巧主要都得运用塑形法。当我们试图改变自己的行为,例如戒烟、克服害羞或增进理财能力时,我们也常常运用塑形法。是否能够成功塑造自己或他人行为的关键,不在于我们多么精通塑形法,而是我们有多坚持。已故《纽约时报》乐评家海洛,荀贝格提到一位不算杰出的欧洲指挥家,这位指挥家会为了音乐会要求乐团排演一整年,因而演出极为美妙的音乐。因此,几乎是任何事情,只要投入足够的时问,我们多数人都能略微精通。但这么做实在很无聊,无论滑雪、弹钢琴或其他事情,我们不都想要尽快学会吗?我们当然都想这么做,这时候便需要好的塑形技巧了。此外,我们不都也较喜欢避免或尽量减少重复练习吗?没错,有些肢体技巧当然需要重复练习,因为肌肉的「学习」速度很慢,必须不断重复动作,这些动作才变得容易。虽然如此,设计完美的塑形计划确实可以让练习次数减到最少,让每次的练习都有实际成效,大幅加速训练进展。对于运动、音乐演奏或其他发挥创造力的工作,你可能期盼能有水平一致的演出,也可能希望自己或自己训练的人尽可能展现最精彩的表演,正确运用塑形法是不可或缺的关键。
$ N& x) C3 n&&L- H    方法重要,原则更重要 : N2 X' v# M; U4 [: L# e3 k8 T/ [
    塑形法分为两个层面:「方法」-- 各阶段发展出来的行为和发展出这些行为的步骤,及「原则」-- 行为被增强的理由、增强方式及时间点的依循原则。多数训练者、训练书籍和训练人的老师都只重视塑形「方法」-- 「照图示把双手放在高尔夫球杆上」、「瞄准目标之前先把眼睛对准来复枪上的瞄准孔」、「以顺时钟方向用打蛋器打蛋」,这么做确实很不错,通常这类方法都经由许多人多年的尝试错误而发展出来,所以它们一定管用。骑马时把脚踝放低,就可以坐得更稳;打高尔夫球时,若能塑形出不错的送杆动作,你的球也许就能飞远一点儿。若你有兴趣学习某项技能(或技巧),我极力鼓励你尽可能找出训练这项技能(或技巧)的所有方法 -- 你可以透过书籍、老师和教练,或者去观察研究他人。不过,千万不要忽略塑形法的「原则」层面,有效训练不只要用好方法,更要用好的塑形技巧才是。依照原则控制何时提高要求、何时放松要求、如何以最有效的方式提高增强标准、遇到困难时如何解决,最重要的一点或许是何时应该停止训练,这些问题一般都由训练者或教练凭直觉和经验判断、随机去做或完全靠运气。然而能否成功运用这些原则,便成了「教学胜任」与「教学优越」的差异,也是塑形过程令人愉快、迅速且成功或令人沮丧、缓慢且无聊生厌的差异。
3 l2 j# o% e/ r5 U, B% L, J0 v    塑形法的十大原则 5 A e0 R3 y( h) ^
    塑形法有十大原则,有些原则源自实验证实的心理学法则,有些原则据我所知甚至从未被正式研究过,但任何塑形经验丰富的人都会自然而然认为它们很合理:当你违反其中一项原则时,你通常都会知道(虽然往往晚了一步)。
1 l& M, G% {4 _/ n# T    逐渐提高增强标准的幅度不可过大,这样训练对象才有不断被增强的机会。实际应用这个原则时,它意谓当你提高行为标准时,你应该把要求定在动物已经可以达到的行为范围内。如果你的马匹能够跳过两呎高的障碍,有时还高出一呎,你便可以试着把一些障碍调高到两呎半,但是把所有障碍都调高到三呎就是自找麻烦,虽然动物有能力做到,但是牠还无法经常出现这个行为,如果把障碍调高到三呎半,当然肯定是彻底失败。无论现在或未来,调高增强标准的快慢与动物的实际能耐无关,不管牠是否是只可能跳高八呎的长腿大马,也不管牠是否惯常跳过四呎高的牧场围栏,调高增强标准的快慢与你透过塑形过程达到的沟通效果有关,如果动物清楚你的增强原则,就可以早点调高标准。每次调高增强标准时,你便改变了规则,所以你必须让训练对象有机会发现:虽然规则改变了,只要牠多费点儿劲表现,仍然可以轻易获得增强物,而且继续维持旧标准的行为有时已经不管用了。然而牠只有在达到新的增强标准时获得增强,才能够学会这一点。如果你把增强标准调得过高,要求牠出现超乎过往能力的行为 ‐‐ 不管牠自己平常是否出现这个行为 ‐‐ 你都是在冒险,因为牠的行为可能因此完全瓦解,牠在跳跃过程中也很可能学会不良习慎,例如临阵拒跳或撞掉跳杆,你必须耗时费力才能根除这些不良习惯。所以塑造行为最快的方法 ‐‐ 有时也是唯一的方法 ‐‐ 就是调整增强标准时,调高幅度必须很容易让动物持续进步,即使每次进步只有一点点,持续的进步仍然比强求快速进步、可能失去所有良好表现的冒险作法更能快速达到你的终极目标。
- a0 d# e# d5 \) p    我曾经见过一位父亲犯下这种严重错误。他青春期的儿子功课很差,于是他没收了儿子最爱的机车,等到功课变好时才会还他。他儿子真的因此努力念书,功课日渐进步,从不及格进步到丁等,又从丁等达到丙等。但是,这位父亲不但没有增强他的进步,反而认为进步不够,继续禁止他骑车。这个突然提高标准的要求太困难了,最后他儿子完全放弃念书,而且变得非常不信任人。
6 O' L f# X/ q' U$ S    每次只针对行为的某项特性进行训练,不要企图同时塑形两项特性。
* O( v1 E! Q: k& ?# r* E# d    我的意思并不是指在同一段练习时间内不能训练多种不同行为,这当然可以。在任何一种课程里,我们可能先练习动作,然后再练习速度;以网球练习为例,我们可能先练习反手拍,然后再练正手拍,之后再练习步法及其他,这么做可以减少单调无聊的情形。好的指导老师会一直变化练习项目,当一项有些进步之后就换到下一项。不过,训练每项行为时,你应该每次只针对一项增强标准作练习。假如我想训练海豚溅水,这次因为水溅得不够高而不给增强物,下次又因为牠溅错方向而不给,海豚将因此无法领悟出我到底希望牠做什么。一份增强物无法传达两种讯息,我应该先对溅水的高度进行塑形直到满意为止,然后再针对溅水的方向(不管溅水的高度)进行塑形!直到牠学会了溅水的方向。等到两项增强标准都能个别达成之后,我才能要求牠同时达到这两项标准。) g r- [0 | U* w9 l7 [
    第二条原则有很多可以实际运用的地方,如果一件事可以分解成个别的小单元,然后再针对每个小单元各自塑形,学习的速度将会加快许多。以高尔夫球的推杆进洞为例,这个动作取决于球推出后的适当距离,不可太短、不可从洞口经过或跳过,而且推杆的方向必须很正确,没有偏向洞口的某一边。如果想教自己推杆,你或许可以在草地上拉起一条几呎长的胶带,先练习从两呎处推杆,让球压过胶带就停下来,再从四呎、六呎、十呎处推杆,依此类推;你也可以把胶带贴成一圈,从一定距离练习瞄准圈圈推杆,再逐渐把圈圈缩小,直到能够稳定打中非常小的标的物为止。等到自己对推杆距离和方向控制技巧都很满意时,再合并两项同时练习,先使用大目标物并变化距离,然后缩小目标物并改变距离,直到能够从不同距离打中小目标物为止。最后才加入新项目的增强标准(例如往上坡推杆),但是每次只加入一个。如果你投入的心力够多,以及个人的眼手协调够好,这样一来,你的推杆技巧会变得很棒或甚至技艺超群。任何打高尔夫球的人只要按照这种单一目标的塑形计划练习几个周末就会有很大的进步,这好过整个夏天漫无目标地练习,只期待每一球刚好打出适当距离和方向。我们学习技能时经常遇到无论练习再多似乎都无法进步的情形,其实原因在于我们老想一次同时修正很多地方,这样的练习并没有塑形作用,而且一直重复动作或许能够进步,但也可能轻易增强错误的地方。你必须思考,这个行为的特性是否不只一项?能否把这个行为分解成更小的动作,再依各项特性个别训练?当你注意到这两件事,许多训练的问题自然会迎刃而解。
2 D8 _( ^- K* i' K    3) 进行塑形时,先「变化性增强」目前符合增强标准的行为,然后再提高增强标准
: ~/ ~9 u! Q8 `3 y R    许多人至始至终就反对在训练时使用正增强物的概念,他们认为这么一来,他们可能一辈子都得给零食才能获得好行为。但事实正好相反,利用增强物的训练方法其实可以使你解脱,不再需要时时留意这个行为是否发生,这是(变化性增强)发挥的作用。变化性增强的意思是指一个行为有时会被增强,但有时不会,当我们教导行为时,我们通常采取无变化增强时制,意思是我们增强所有符合要求的行为,但是如果我们只是想要维持行为的出现,我们偶尔才会给予增强,例如一旦建立起分担家务模式后,你的室友或配偶回家时可能会顺便去拿干洗衣物,不需要你每次都给他增强物,但是遇到你生病或天候不佳让他特别多跑一趟时,你便可能需要表达一下谢意。然而,当我们利用厌恶刺激作训练时(多数人刚开始训练时都会这么做),我们通常会学习到一个原则:每当动物出错或行为不佳时务必进行纠正,如果不这么做的话行为就会越变越糟。许多狗儿被牵绳牵着时,因为可能会被猛抽处罚而表现得很乖,但是只要一放开牵绳,牠们的行为就变得极不稳定。许多青少年和朋友出去时会做一些不敢在父母面前做的事,这是因为他们完全明白在什么环境下处罚不会出现,这就是「阎王不在,小鬼作怪」的道理,可是这也是以厌恶刺激作训练时的副作用之一,既然处罚意谓「不可以这么做!」 缺乏厌恶刺激的意思就是「现在可以做了!相反地,正增强的训练方法不仅不必一辈子增强每个正确反应,而且在学习过程中还必须偶尔忽略反应不作增强。
$ n2 @ U6 e% `- u3 S4 K [5 b    为何会如此呢?' 塑形法的重点在于选择性增强某些反应,如此一来动物的反应才会一点一滴地改善,直到达到新目标。所有行为都非一成不变,常预期出现的增强物被跳过省略时,接下来出现的行为将会有些不同,因此偶尔省去增强物的作法可以让你挑选出表现较强烈或较佳的反应,这种作法称为「区别性增强时制」,只选择某类反应作增强,例如增强符合较快、较长或面朝左等等要求的反应。但是对经验不多的学习者而言,牠原本一直能够获得预期的增强物,现在却突然得不到了,这个情况可能让牠大感吃惊;例如你的幼犬坐下来,你按下响片就给零食,牠坐下的动作越来越迅速,也出现越开心的样子 -- 「你看!我坐下了!按响片吧!」突然间,有时候坐下却不管用了!如果你的幼犬尚未学习接受偶尔不会出现增强物的状况,牠很可能会失望地放弃,或者退步回到原来表现较差或较为迟疑的反应。虽然讨论行为学习的教科书并未提及这个作法,但如果你正训练一个毫无经验的学习生手,在你开始挑选更强烈或更佳的反应之前,事先刻意教导牠学习容忍增强时制的小小变化将会很实用。你的训练对象必须能够容忍你偶尔出现的「失误」才不会完全不反应,或者以专业术语来解释,这代表你必须先建立起变化性增强时制,然后名能藉由区别性增强时制增强较佳的表现。0 u3 ] g0 o# h& w
    90年代时,我在训犬讲座里把变化性增强时制(短期使用的间歇性增强时制)称为「买一送一」,作法是让狗儿做两次动作,例如让牠以鼻子碰标的物两次,才按响片给赏,这样可以让动物学习容忍间歇性增强时制,让当前行为及日后的其他行为更不容易消失。
5 ]; n$ e0 Q9 |    在学习阶段短期使用这种间歇性增强时制有另外一个好处,如果你的训练对象能够容忍偶尔不给增强物的情形,当你不增强某个原本足以增强的行为时,学习者不但会重复这个行为,而且第二次的行为很可能会更为剧烈。「嘿!我做到了,你没看到吗?你看,我又做了一次!」这个加剧后的行为称为「消弱突破现象」,可以让你更快达到目标行为。精通塑形法的人为了激发更不同或更强烈的反应,甚至可能刻意不给增强物,犬类行为学家盖瑞·威尔克斯)称此技巧为「借机利用消弱突破」。
3 N! J* {2 E! M0 i6 V    当训练对象学习到增强物跳过一次没给并不代表行为做错了,只是代表牠可能需要再试一次时,塑形过程便由连续增强时制(新行为刚出现时使用)转为区别性增强时制(挑选更好的动作、更长的时间、越快达成行为的反应等等),然后再转回连续增强时制(当「完美」行为出现时,专有名词称此为「符合增强标准」的行为),这时已没必要故意采取间歇性增强时制,因为训练对象已经能够忍受变化性增强时制了。)最后,当行为的各项特性都达到满意程度时,它通常已经变成动物能够自然出现的行为之一。你可以要求这个行为成为其他更复杂行为的一部分,把标准动作、速度和距离等等都融合成一个大行为,好比参加赛跑、执行任务或进行每口活动,这个大行为即成为受到增强的行为,这时你可以将它转为间歇性(或维护性)增强时制,只要偶尔单击响片或说声「谢谢!」即可维持行为的流畅表现。高频率正增强方式(训练初时可能经常按响片给食的频繁动作)这时就可保留起来,等到训练新行为时再行运用。9 y' H; E L9 i&&Y5 S
    4) 针对某项行为特性采用新的增强标准时,暂时放宽其他特性的旧有增强标准。假设你正学习打回力球,每次都能成功地把球打向目标方向,接着你想练练球速,但是当你用力挥拍时球就乱飞,这时候,你先别理会球的方向,只要用力挥拍就好,在你拥有一些控制球速的能力之后,球很快就会恢复正确方向。学过的东西不会被忘记,但是处于吸收新技能的压力下,原来已学习很好的行为有时会暂时瓦解。有一次我在某歌剧的首次着装预演时,看见指挥家因为合唱歌手连连唱错而大发雷霆,他们好像全然不记得自己辛勤练习之后的歌唱成果,这是因为他们第一次穿着厚重戏服、站在梯子上,而且必须边动边唱的缘故;适应新要求的过程暂时干扰先前学成的行为,等到预演快结束时,他们的音乐学习能力又重现了,并不需要有人从旁指导。海豚训练师称这种现象为「新水池症候群」,当海豚移入新水池时,你可以预期牠会「忘记」所有牠知道的行为,直到牠「吸收」了这个新刺激为止。在新情境下,如果你因为训练完成的行为出错而苛责自己或其他人(或其他动物)时,这便是很糟的训练方式。这是非常重要的概念,通常此类错误可以很快自我更正,但是斥责容易导致情绪不安,而且有时容易被聚焦在错误上头,使得错误更难改掉。* S( e. K& f- h&&s% M, |- ~; q
    5) 永远抢得先机。
1 |0 e) f, y0 W, |    进行行为塑形时,必须事先完善计划整个行为塑形过程,这是为了确保当动物突然大幅进步时,你仍知道下个要增强的动作是什么。我曾经花两天时间塑形一只刚捕捉到的海豚跳过一根高出水面几吋的横杆,当这个行为训练得很好之后,我把横杆调高了几吋,牠不但立刻跳了过去而且轻而易举,很快地我把横杆越调越高,这只刚学习跳跃的动物在十五分钟内已经能跳高到八呎。这类「突破性」的塑形表现随时可能发生,在人类身上当然也看得到这种现象,许多高智商的动物身上也不例外,我相信这是一个内在觉醒的例子,人或动物突然对自己被要求出现的行为恍然大悟(以上例来说,是跳得更高一点儿),于是便照做了。虎鲸以能够达到塑形目标的能力而著名,虎鲸训练师开玩笑地说:「只要把行为写在黑板上,再把黑板放在水里,虎鲸就会按表操课,完全不需要训练牠们。」* }& z$ r! C- I; M' M& m
    当训练动物突然出现大幅进步时,训练者可能因此措手不及。原本打算要从行为训练成行为,可是动物只经过两次增强就突然表现出完美的 行为,这时训练者心中最好已经先有个底,知道接下来要做 行为和 行为,否则你将会不知道接下来要增强哪个行为。对训练对象而言,行为的突破常是件令人兴奋的事。动物似乎也很喜欢「啊!我知道了!」的感受,而且牠们常会冲来冲去,表现出兴高采烈的样子。因此行为出现突破时便成为能够迅速大幅进步的黄金契机,如果自己未作好准备,不知道接下来该做什么,使得动物一直维持在低水平的表现,除了浪费时间之外,最严重的伤害可能是使动物打消动机或感到厌烦,于是牠将来工作的意愿便会降低。除了一些极佳的环境外,学校系统的规划目的似乎是用来阻碍儿童的个别学习,它不仅不利没有足够时间学习的迟缓儿,也不利快速学习的聪颖孩子,当这些孩子的灵活思考加速学习时,他们并不会获得额外增强。他们只要一眨眼即了解数学老师所讲的东西,但他们获得的奖励却可能是为时数小时或甚至数周难捱的无聊时光,等待其他人一点一滴慢慢完成学习,难怪这些聪明或迟缓的孩子觉得到街头混日子有趣多了。 ( N: I&&|; j, V' b2 E) q0 w. Y- f
    塑形中途不可更换训练者。
: Q&&G' X% a7 N    塑形过程当中撒换训练者将冒着让进度变慢的风险,不管移交时多么仔细讨论过增强标准,但每个人的要求标准、反应时间以及期望进步的程度一定都有些许差异,训练对象在适应这些个别差异之前,最终影响就是使动物丧失被增强的机会,在某种程度上这也是一种「新水池症候群」。每个训练对象当然可以有多位不同的老师,由不同老师教授法文、算术或足球并不会有什么问题,但是学习单一行为时,在塑形期间(或半知半解的期间),逐步提高的增强标准最好能维持一致性,每次必须由同一位老师负责塑形某一个行为。举例来说,家中若有两个孩子和一只狗,两个孩子都想教狗儿把戏,你可以让他们去教,但是他们得教不一样的把戏,免得可怜的狗儿困惑不已。有心向学的人即便在最糟的环境下也能学习。美国哥伦比亚人学曾进行一项广为人知的「猿类语言」实验,它教导猿类使用美国手语的字汇及其他暗码讯号,学习对象是一只名为「尼姆.青布斯基」)的幼猿。由于预算拮据及其他种种因素,这只可怜的动物在三年期问经历了上百位手语老师,实验人员和学生都失望不已,他们并没有找到尼姆真正使用语言的确切证据,也就是说牠显然不曾造句,不过牠的确学会辨认并理解三百个以上的手语讯号(名词和动词等等)。我认为尼姆处于这种状况仍有此表现已经令人惊叹,而且同样让人惊讶的是够学习,可是这并不是很好的作法。塑形中途换人训练应该只有一种必要的情况,当然就是在训练持续停滞不前的时候,若原本几乎没有形成任何学习,换人也就不会有什么损失。
0 I* }3 L. K$ N    当某个塑形方法没有进展时,改采用别的方法。无论什么行为,只要训练者动动脑筋,塑形出这个行为的方法不胜枚举。拿教小孩游泳为例,如果目标是希望他们沉入水里的时候不会害怕、很自在,有些老师进行这个塑形任务的第一步时,可能会让他们在水中吐泡泡,有些老师则让他们很快把脸浸入水中便马上起来,而有些老师可能会让他们在水中跳上跳下,直到他们敢跳起来再沉入水中。好的老师在训练时如果看见有个孩子对某个方式感到无聊或害怕时,他会改换方式,同一个塑形方法不一定对每个个体都管用。马戏团训练师之类的传统训练师常忽略这一点,他们的塑形方法大都经过多代琢磨、世代家传 -- 教熊骑脚踏车就是得这样,教狮子吼就是得那样。这些传统「秘技」已被视为最好的方法,虽然有时这确实没错,但是也因它们常被视为唯一王道,马戏团表演因而老是看来差不多。9 }! e& ]1 ~* i
    美国广播电视名人阿瑟·戈弗雷曾到海洋生物世界录过一集节目,他邀请我到他与妻子在维吉尼亚州的牧场作客,参观那里的马术训练。戈弗雷的骑术和训马技术精湛,并且拥有多只表演用马匹。我们观看一只马儿以传统方法训练「敬礼」(弯折一只前脚,前半部身秾往下趴)的过程,动用了两名男子以及多次套索和鞭打的动作,马儿在这种训练之下不断被迫弯折前脚,直到牠学会自行弯起前脚往下趴为止。我告诉他们没有必要这么做,声称自己不必碰到马儿也能训练牠敬礼(一种可能的方法是,在墙上放个红点,利用食物和标定讯号塑形,训练马儿以膝盖碰红点,然后再逐渐把红点移近地面!如此一来为了准确碰到红点,马儿即必须折起前脚趴下才能获得增强)。这个无礼的建议引起戈弗雷盛怒 -- 怎么可能有这种说法!如果有其他训练敬礼的方法,他怎么可能不知道!他气恼至极,我们得把他带到谷仓外头来回走个两三趟他才慢慢冷静下来。令人惊讶的是,人们对于不管用或成效不彰的方法极为顽强坚持,他们一心相信,同样的方法只要多做几次就会生效。行为分析研究先驱莫里·西德曼博士主张「训练时最重要的是理解训练原理,而非只是学习方法」,主要理由在于,每个人都自有「方法」,但是真正管用的方法都得遵循训练原理。% ~- s. c1 v* f$ K% I8 k' P; p$ B
     8) 不可无故中止训练,这么做将形成一种处罚。! D0 V&&I8 a4 r3 I* e
    这项原则不包括平常在家里临时起意(但仍具意义和成效)的塑形行为 -- 称赞学校作业、欢迎返家的人、鼓励孩子等等,这种非正式的塑形行为有时增强这里、有时增强那里并没有关系。然而在较正式的情况下,例如授课或塑形出动物的某个行为时,在训练时间结束之前,训练者应该专注在训练对象或课程上,这不只是礼貌或良好的自律行为,它也是一种绝佳的训练技巧。当训练对象试着获取增强物时,牠与训练者已有了一个协议,如果这时候训练者开始与路人闲嗑牙、接电话或做白日梦,这个建立起来的协议便被破坏了,增强物停止出现并非由于训练对象犯了错,这种作桔造成的伤害可能远比训练者单纯错失增强好时机更加严重,它可能处罚了一些当时出现的良好行为。当然,如果你想向训练对象表达责备之意,「移除注意力」会是个好方法。海豚训练师称此为「暂停时间」,用来纠正错误行为,把装鱼水桶拿起来离开一分钟是少数几个用来对海豚表达「不行!」或「错了!」的方法之一,而它通常非常有效,你可能不认为海豚会有懊恼或悔悟的样子,但是牠们真的有。移除注意力是很有效的工具,所以不要草率滥用或不当使用。
* P/ ~( S1 |: i- `! p: o& \5 b0 N    如果行为越表现越差,请回顾所有塑形的步骤。
. L9 T# S, |4 j: R$ c% m    我们都知道在多年荒废之后再度尝试说某种语言、背诵某首诗或骑脚踏车时那种非常不安的感觉。有时外在因素会暂时使熟练的行为消失,例如上台紧张而无法好好讲出背得很熟的演讲词,或是跌倒而严重影响攀岩能力。有时候后续学习的东西遮蔽掉原来的学习或者与其抵触,因而出现混合出现的情况,例如你努力想说出某个西班牙文单字,但却说出德文。有时处罚或其他不好事件的副作用会干扰不相干的行为。身为律师的爱犬人士摩根·史贝克特提及有次服从竞赛时,每只上场比赛的狗儿都避开某个特定赛场角落,哪里藏有什么不好的事吗?只有那些狗儿才知道答案。有时显然已经训练良好的行为仍会变得很差,而且永远找不到原因。你的狗儿在服从竞赛中一向表现杰出,但这次牠竟然在三分钟坐下等待的比赛项目中起身,游荡到赛场外头。谁知道原因?有人在乎原因是什么吗?这种时候,你需要的不是合理的理由,而是有效的解决方法。修正这类退步最快的方法不是硬碰硬,不应坚持训练对象的行为一定得完全回复到令你满意为止,也不应坚持牠得在完全回复后名予以增强。正确的作法应是回想所有塑形的过程,并且很快地重新经历所有塑形步骤,到新情境(二十年后、在公共场所、在雨中等等)中进行增强,每个步骤只要增强一两次就好。我们在海洋生物世界把这个技巧称为「回到幼儿园程度」,它常能在十或十五分钟内把表现不佳的行为拉回原来的水平。考前复习功课或上台前翻翻剧本临阵磨枪正是这么做,这种方法多少重复了原本的塑形过程,一让身心都获得复习,应用在动物或人身上都一样好用。
) m& g0 t) B, l' c' Z    在训练进展很好时停下训练。
' O J6 F( @. C5 G4 w    每次塑形训练应该多久?答案取决于训练对象的专注力。猫咪似乎在十多个增强物之后就会变得烦躁,所以训练五分钟可能已经算是相当久,训练狗儿和马匹可以久一点,许多人类课程大都在一小时左右,足球练习、研究生研讨会和其他不同训练则可能全天进行。结束训练的「时机」比停止训练的「时间点」来得重要,你永远都应该在训练进展很好时结束训练,不但每回训练都应该这么做,而且每回训练到不同阶段(将改换训练下个行为时)也应该这么做。你应该在训练进展不错时就告一段落 -- 也就是说,只要达成了一些进步就停手。最后达成的行为会记得最清楚,所以你必须确定最后一个行为是值得增强的好表现。但通常我们见到三、四个好反应时,例如狗儿完美拾回指定对象、跳水员第一次完成转体一圈半动作、歌者唱好了一段难唱的歌曲,我们常会兴奋过头而想一看再看或一做再做,所以一次又一次地重来,设法重现佳绩。但这只会很快一让训练对象疲累、行为变差、不断出现错误,接着就是纠正和破口大骂,最后搞砸了训练。业余骑师最常这么做,我很讨厌观看马术跳高练习,因为当马匹表现优异时他们常常不会结束练习、见好就收,常常继续练习到马匹开始越跳越糟为止。
, a. l7 W) s1 T    身为训练者,你得强迫自己见好就收,这需要有些胆识才做得到。你可能因而在下次练习时发现,拾回、翻滚跳水或独奏的表现不仅和上次结束练习时一样好,而且表现显然更佳,事实上你可能一开始进行练习,训练对象的表现即比上回结束练习时更好,于是可以立即针对一些进步作增强。当然,行为的塑形与不断重复操练的作法完全相反,它不但可以产生稳定的进步,而且也是一种绝对不会犯错的训练方式。它的训练进展可能极快,我曾经训练一只一岁迷你马配戴马勒,从开始到结束只花了十五分钟,而且牠从此不需重新训练配戴,我的作法只是轮番塑形五个动作(往前、停步、往左、往右和往后),并且增强每个动作的进步。要达成如此迅速训练成效的方法似乎有违常理,它取决于你是否肯放下时间压力、特定设定目标和要求迅速进步的训练目标,完全看你肯不肯见好就收,这种过程很类似禅修。有时候,你无法在每次训练时都挑高点结束,或许学生付了一小时的学费,所以要求必须上一小时的课,较好的结束时机可能已经过去。或者这回训练并不顺利,没有较好的表现,而且即将出现倦怠的问题,此时聪明的作法是在结束训练之前给训练对象一些一定可获增强的简单练习,让他们记得这次练习整体使他们获得了增强;海豚训练师常在结束困难且漫长的训练后,作一些简单的玩球练习,骑马课老师有时会玩「老师说…」或「捉鬼」游戏,但最不推荐的作法是在训练快告一段落时才开始介绍新的任务或新的信息,使结束之前出现一连串表现不佳、未获增强的行为。小时候我的钢琴课总是这么结束,非常令人丧志,我现在仍然不会弹钢琴。1 E8 V6 G3 i* ~4 C1 L& B4 C5 k
    从训练游戏开始# @( w7 U. ]& w. ]4 W0 r1 Q
    即使你知道塑形的原则也对它有所了解,除非自己进行塑形练习,不然还是无法应用它。塑形不是一个用口头描述的过程,而是非口语的技巧,是一连串必须花时间进行的互动行为,有如舞蹈、作爱或冲浪,无法藉由阅读、想象或讨论而习得,你必须实际行动。& ?7 R' f2 k! i/ e/ [! @
& &「训练游戏」是发展塑形技巧时既简单又很棒的方法。我透过训练游戏教授训练技巧,许多训练师把它当成娱乐,它也可以成为很有趣的派对游戏。* U: I' [2 A' z1 ]4 p
    训练游戏至少需要两个人一起玩:一个当训练对象,另一个当训练者,六个人是最佳人数,因为每个人在大家玩累之前都至少有一次机会训练人或被训练,不过人数更多的团体(例如一班学生或一群演}

我要回帖

更多关于 在线p图软件 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信