Positiv og negativ forsterkning

Positiv og negativ forsterkning

Noen ganger når man hører hundefolk diskutere treningsmetoder, skulle man nesten ikke tro at de snakket om den samme dyrearten. Forestill deg at du har invitert to erfarne hundeinstruktører til middag. Som alltid når hundefolk er samlet, blir samtaleemnet fort ganske ensporet, og allerede under forretten er bikkjepraten i gang.


Tekst: Morten Egtvedt & Cecilie Køste


Middag med to hundeinstruktører

Dere begynner først å diskutere problemet med naboens briard som av en eller annen grunn har utviklet et “hilserituale” som går ut på å plante forbeina i brystkassen til alle folk den skal hilse på. “Sett kneet i brystet på´n”, sier den første instruktøren. “Snu ryggen til og overse hunden til den har alle beina på bakken”, sier den andre. “Jaha”, tenker du og spiser videre.

Under hovedretten begynner dere å diskutere hvorfor så mange hunder gjør det dårligere i lydighetskonkurranser enn på trening. “Bikkja skjønner at føreren ikke kan ta han inne i ringen”, sier den ene instruktøren. “Bikkjene skjønner at de ikke får tennisballen eller godbiten så lenge de er inne i ringen”, sier den andre. “Hæ?”, tenker du mens du lusker ut på kjøkkenet etter desserten.

Dere begynner på desserten. “Vær konsekvent! Har du sagt “sitt” så skal hunden sitte enten den vil eller ikke”, sier den ene instruktøren. “Hvis hunden ikke etterkommer kommandoen er det du som går for fort frem. Gjør det litt lettere for hunden og prøv en gang til”, sier den andre.

På dette stadiet har du blitt så forvirret at du forlengst har mistet matlysten. Når de to instruktørene begynner å diskutere apportering, finner du det smartest å snike deg ut på toalettet. Gjennom døra hører du at ordene “tvangsapport” og “baklengskjeding” flyr gjennom lufta mens lydnivået stadig blir høyere.

De to instruktørene fortsetter å komme med tilsynelatende helt motstridende løsninger på de samme problemene. De er selvsagt helt uenige med hverandre, og ingen av dem kan fatte og begripe hvordan den andre noen gang har fått til en hund. Samtidig vet du at begge instruktører kan vise til gode resultater i praksis med sine egne hunder.

Hva er årsaken til at de to er så uenige? Kan det være noe med middagen? Svaret får du kanskje hvis du leser videre.

To typer forsterkning

Adferd hos dyr (inkludert mennesker) er slett ikke så tilfeldig som det av og til kan se ut til ved første øyekast. Hvis man ser nærmere etter, vil man oppdage at de aller fleste handlinger fører til et eller annet synlig resultat.

Adferd Konsekvens (resultat av adferden)
Per tar ned dørhåndtaket Døra går opp
Hunden drar i båndet Hunden kommer seg fortere framover
Kari går utenom en søledam Kari unngår å bli våt på beina
Hunden går og legger seg i kurven sin Eieren slutter å stirre/peke på hunden

I alle disse fire eksemplene ser vi at adferden har et resultat, eller en konsekvens som man sier på fagspråket. Enten oppnår vi noe vi har lyst på (døra åpner seg, hunden kommer seg fortere framover til interessante lukteflekker) eller vi unngår noe ubehagelig (unngår å bli våte på beina eller en truende eier). I alle tilfeller blir adferden forsterket. Det vil si at det blir mer sannsynlig at adferden vil bli gjentatt neste gang vi er i en lignende situasjon.

Vi ser fra eksemplene at det er to typer forsterkning. Den første kaller vi positiv forsterkning. I dagligtale kaller vi ofte dette for belønning. Når en adferd resulterer i noe vi har lyst på, er det mer sannsynlig at vi vil gjenta den samme adferden senere i en lignende situasjon.

Hvis du har gått 9 års grunnskole og ellers fått en normal oppdragelse har du også lært å utføre en hel del adferder for å unngå ubehagelige ting. Dette kalles for negativ forsterkning. Hvis en adferd fører til at vi unngår noe ubehagelig er det også større sjanse for at vi vil gjenta denne adferden neste gang vi er i en lignende situasjon.

Hvis man ser litt nøyere etter er det vanligvis lett å se på en hund om adferden den utfører akkurat i dette øyeblikket er under kontroll av positiv eller negativ forsterkning. Neste gang du ser på en lydighetskonkurranse kan du legge spesielt godt merke til hundens kroppsholdning og ansiktsuttrykk. Legg også merke til førerens oppførsel og stemmebruk. En hund som jobber for å få tennisballen eller en godbit (positiv forsterkning), vil oppføre seg på en annen måte enn en hund som jobber for å unngå et rykk i halsbåndet, kjeft eller noe annet ubehagelig (negativ forsterkning). For utenforstående kan det se ut som om de to hundene gjør nøyaktig det samme. Begge to utfører jo øvelsene og følger førerens kommandoer. Likevel lever de to hundene i to helt forskjellige verdener.

Hundeførerne oppfører seg også forskjellig. En hundeeier som har lært hunden å jobbe primært for å unngå ubehag vil ofte si kommandoene med høyere stemme, han vil ofte ha en truende kroppsholdning og du ser på eieren at han er klar til å ”ta hunden” hvis den skulle finne på noe tull.

Hundeeiere som har lært å bruke positiv forsterkning på en effektiv måte trenger ikke å brøle kommandoene. De vet at hunden hører aldeles utmerket og at det ikke er volumet som er avgjørende for resultatet. De har også ofte en mer avslappet kroppsholdning (selv om de sikkert også blir anspente under konkurranser) og stoler mer på hunden sin. Hunder som er trent positivt har jo ingen grunn til å ville stikke av uten videre. Det er jo hos eieren at godsakene finnes.

Adferd er egoistisk

Det er en utbredt misforståelse (eller i beste fall lite presist) at hunder gjør ting “fordi vi sier det”, “fordi den jobber for oss”, “fordi vi har lederskap/er sjefen” osv. Hunden jobber enten 1) for å oppnå noe den har lyst på, eller 2) for å unngå noe ubehagelig. Andre alternativer finnes ikke!

Kommandoen vår er bare et hint til hunden om at hvis den utfører en bestemt adferd akkurat nå, har den sjansen til 1) å få en godbit (eller en annen belønning) eller 2) den kan unngå en ubehagelig korrigering (avhengig av hvordan den har blitt trent). Med andre ord – adferden innebærer noe fordelaktig for hunden selv. All adferd er egoistisk!

Hunden adlyder slett ikke en kommando fordi den vil at eieren skal føle seg bedre (”bli tilfredstilt”) – den gjør det fordi dette innebærer noe fordelaktig for den selv. Hundeeiere som sier at “hunden skal gjøre det fordi jeg sier det!” trener stort sett med hjelp av mye ubehag hvis man ser nærmere etter.

Av en eller annen grunn vil hundeeiere som trener med mye ubehag ofte bruke mange abstrakte begrep som f.eks. ”respekt”, ”autoritet”, ”lederskap”, de snakker om å etterligne ulver osv. Kanskje har dette sammenheng med at det ikke er så moro å snakke konkret om hvordan de trener i praksis. Det høres unektelig litt finere ut å si at man bruker ”ulvemetoden” enn å si at ”jeg fillerister hunden eller rykker i halsbåndet slik at hunden letter fra bakken”.

Utsagn om at hunder prøver å tilfredstille oss har derfor liten dekning. Det har derimot atskillig mer å gjøre med at hunden har funnet ut at den får mindre kjeft når den gjør som du sier enn at den har noen dypere forståelse for din emosjonelle tilstand.

Ros

Er ros alltid en positiv forsterker? De fleste forutsetter dette. Imidlertid forstår ikke hunden hva “flink gutt” betyr før han har lært det. Ros kan faktisk bety forskjellige ting for forskjellige hunder.

En hund som blir trent hovedsaklig med positiv forsterkning, får ofte ros rett før tennisballen eller godbiten blir servert. For denne hunden vil “flink gutt” etterhvert bety det samme som “belønningen er på vei!”. Du kan formelig se at det lyser tennisracket i øynene på en slik hund når den får ros. I denne situasjonen kan vi derfor anta at ros er en betinget positiv forsterker, for å bruke fagspråket.

En hund som blir trent mye med ubehag får også ros av og til, men her får rosen en annen betydning. For denne hunden betyr rosen noe sånt som at “akkurat nå er det ingen fare for at jeg får kjeft, rykk i bånd eller andre ubehageligheter”. Det vesentlige for denne hunden er med andre ord at når den får ros er den “trygg” og slipper ubehageligheter en liten stund. Denne rosen er med andre ord på et helt annet språk…

Mange tror at de trener “positivt” fordi de ofte roser hundene sine når de gjør riktig. De tror til og med at hunden jobber for å få ros. Hvis man ser nærmere på mange av disse hundene, vil man imidlertid se at de egentlig jobber for å unngå å bli korrigert. Rosen forteller dem at de ikke blir korrigert akkurat nå, men adferden er fortsatt under kontroll av negativ forsterkning. Hvis denne hundeføreren slutter å korrigere når hunden gjør feil og bare roser som før, vil sannsynligvis hunden slutte å prestere særlig bra ettersom det er det å unngå ubehageligheter som gjelder for denne hunden.

Vi har også en tredje type hund, som det finnes ganske mange av. Denne hunden forbinder ikke rosen med noe som helst. Føreren har hørt at man skal rose hunden, så det gjør han ganske ofte, men rosen etterfølges sjelden av noe annet. Rosen har derfor ingen som helst betydning. Den er bare “bakgrunnsstøy” uten signalverdi for hunden og har derfor ingen treningseffekt i det hele tatt.

Hvem har rett?

Nå som vi vet litt mer om forsterkning kan vi gå tilbake til de to kranglefantene ved middagsbodet. Hvem er det egentlig som har rett?

Hvorfor går hunden dårlig i lydighetsringen? Er det fordi den vet at føreren ikke kan “ta han” eller er det fordi den vet at den ikke får godbiter i ringen? Det høres kanskje merkelig ut, men begge instruktører kan faktisk ha like rett. Det kommer bare an på hvordan hunden er trent…

For en hund som er trent med mye ubehag, er nok den første forklaringen den mest sannsynlige. Hunden har gjennom flere konkurranser funnet ut at han “er trygg” inne i ringen samme hva han gjør. Det er egentlig ikke helt presist å si at hunden “skjønner” at føreren ikke kan “ta han”; Vi kan si at en hund som blir trent med mye ubehag lever i den forståelse at så lenge den ikke blir korrigert, gjør den riktig. Når denne hunden går dårlig inne i lydighetsringen og føreren ikke kan korrigere hunden for dette (det har han jo ikke lov til etter regelverket), vil han faktisk forsterke at hunden går dårlig! Fraværet av ubehag “forteller” hunden at den gjør riktig selv om både poeng og forhåpninger om opprykk blåser avgårde. Noen førere som opplever dette sier at hunden egentlig vet at den gjør feil. Men det gjør den ikke! Tvert i mot så vet hunden at den gjør alt helt riktig (sett fra sitt ståsted) så lenge den ikke blir korrigert – samme hvor elendig den går (sett fra dommerens og førerens synspunkt).

Hunder som er trent med positiv forsterkning, kan etter noen konkurranser finne ut at de aldri blir belønnet inne i lydighetsringen samme hvor bra de går. Dermed forsvinner arbeidslysten ut av vinduet. I dette tilfellet er det den andre instruktøren som har rett.

Løsningen blir i begge tilfeller å trene så likt konkurransesituasjonen som mulig. For førere som trener mye med ubehag er det viktig at de har trent så godt og grundig før konkurransen at de er sikre på at hunden ikke gjør feil. For hvis den gjør feil under konkurransen og føreren ikke kan korrigere dette, vil hunden lære at “dette er en grei måte å gjøre det på under konkurranser!”.

For førere som trener mest med positiv forsterkning er det viktigste at man har lært hunden å jobbe over lengre tid og utføre flere øvelser for hver belønning. Det beste er om hunden kan gå gjennom hele konkurranseprogrammet for å få tennisballen eller godbiten til slutt (på utsiden av ringen), men dette må trenes opp gradvis. Også her er det viktig å trene likt konkurransesituasjonen slik at hunden ikke finner ut at det er mye mindre sjanse for å bli belønnet under konkurranser. Hunden finner fort ut at “aha, denne situasjonen kjenner jeg igjen, her er det ingen vits å anstrenge seg. Jeg får ikke ballen uansett”.

Når man vet hvorfor hunder oppfører seg slik de gjør trenger vi ikke lenger å tillegge dem menneskelige egenskaper eller motiver. Hunder er slett ikke ”sta”, ”prøver å opponere”, ”protestere” eller ”teste deg”. De bare gjør det som blir forsterket – punktum.

Skal man være ”konsekvent”?

Skal man være “konsekvent” eller skal man bare overse hunden når den gjør feil? Nok en gang har begge instruktører like rett, og her ligger en vesentlig forskjell mellom trening med positiv og negativ forsterkning.

Hvis du trener med aversiv kontroll (ubehag) må du være “konsekvent” i den betydning at hunden må være helt sikker på at hvis den gjør en feil, blir det ubehagelig – hver eneste gang i alle situasjoner. Hvis du bare korrigerer en uønsket adferd av og til, vil hunden med en gang begynne å tenke ”hva var det som var forskjellig i denne situasjonen og når jeg gjorde nøyaktig det samme før i dag? Kan det kanskje ha noe å gjøre med at eieren min ikke var i rommet da…?” Omtrent slik ville hunden kanskje ressonert hvis den kunne snakke og ressonere. Vel, den finner ihvertfall konklusjonen ganske fort.

Hvis du først korrigerer hunden etter å ha gjentatt kommandoen flere ganger, lærer hunden fort ikke å skjerpe seg før den tredje kommandoen (eller når stemmebruken er høy nok). Derav rådet om at man skal “mene hva man sier”.

Med en hund som er trent med positiv forsterkning, f.eks. en tennisball eller godbit, er det ikke like viktig å være “konsekvent” i den samme betydningen. Hvis hunden går dårlig fri ved foten, er det ingen krise. Føreren kan bare velge å avbryte (beklager kamerat – dette får du ingen belønning for!), eller fortsette å gå og vente med å belønne til hunden går bra nok. Samtidig må føreren innse at hunden ikke var klar for dette steget enda og gå litt tilbake i innlæringen ved neste forsøk.

Hvis vi trener med positiv forsterkning kan vi etterhvert belønne etter en variabel forsterkningsskala. Dette betyr at vi belønner sjeldnere rent gjennomsnittlig, men etter et uregelmessig mønster. Omtrent som en spilleautomat. Hvis vi øker tiden som hunden må jobbe for hver belønning gradvis og fornuftig, får vi etterhvert en hund som kan jobbe over lang tid mellom hver belønning.

Hvis du trener med aversiv kontroll, kan du ikke bruke en forsterkningsskala. Aversiv kontroll er bare effektivt hvis hunden vet at den blir korrigert hver eneste gang den gjør feil.

Vi ser at dette er to fundamentalt forskjellige måter å trene på. Trener man med aversiv kontroll, kan vi si at man leter etter feil. Hver feil må korrigeres og etterhvert finner hunden “den smale sti” som han kan holde seg på for å slippe ubehageligheter. Trener man med positiv forsterkning, leter man heller etter det hunden gjør riktig. Etterhvert finner hunden ut hva som gir resultat og ikke. Det er ikke rart at treningsrådene kan bli forskjellige….

”Sikker i øvelsen”…..?

Mange hundeeiere bruker mest positiv forsterkning under nyinnlæringen, men hevder så at man etterhvert må stille “krav”. Dette innebærer stort sett at man begynner å korrigere hunden når den gjør feil. ”Den vet jo hva den skal gjøre..!” Man starter altså innlæringen med positiv forsterkning, men baserer seg etterhvert også på negativ forsterkning. Det hevdes at dette er nødvendig for å gjøre hunden “sikker” i øvelsen. Det er riktig at dette er én måte å gjøre det på. Det er imidlertid helt feil at man gjøre dette.

Det er ingen trenere som kaster seg over en spekkhogger som gjør feil for å korrigere den (det skulle jeg likt å se forresten) – og de kjøttbergene blir rimelig sikre i å hoppe gjennom ringer likevel. Her skaper man “sikkerhet” i øvelsen gjennom variabel forsterkning samt å holde tilbake fisken (belønningen) når spekkhoggeren gjør feil, ikke presterer bra nok eller ikke utfører øvelsen raskt nok på kommando/signal. Det samme kan man selvfølgelig gjøre med hunder også.

En hund blir aldri 100% sikker på å utføre en øvelse. ”Full kontroll”, som noen snakker om, sier nok mer om enkelte instruktørers markedsføringsegenskaper enn om deres forståelse for hvordan levende vesener fungerer.

Hver gang hunden blir belønnet for å gjøre en ting riktig blir den litt flinkere, og det er dermed enda litt mer sannsynlig at den vil gjøre ting riktig også neste gang. Jobben vår er å gi hunden så mange vellykkede repetisjoner som mulig i så mange forskjellige situasjoner som mulig. (En ”vellykket repetisjon” er tre ting: 1) hunden gjør det vi vil, 2) vi forsterker presist, og 3) forsterkeren er noe hunden virkelig setter pris på). Hvis vi trener riktig vil vi etterhvert få en hund som gjør det vi ber den om i de aller fleste situasjoner – og det skal vi være fornøyd med.

Er det egentlig praktisk mulig å bare overse alt det gale en hund gjør og heller bare belønne når den gjør riktig? Vel, det er dessverre ikke riktig så enkelt heller. Det hadde vært så enkelt hvis de eneste positive forsterkerne i hundens liv befant seg i vår jakkelomme, men verden byr jo som kjent også på mange andre fristende ting. Det er selvsagt meningløst å overse eller ignorere en hund som ikke kommer på innkalling og springer bort til andre hunder eller går og lukter i stedet. Selv om hunden gikk glipp av godbiten fordi den ikke kom, blir den jo fortsatt belønnet for å stikke av. Å leke med andre hunder eller å lukte på tispeflekker er jo meget effektive forsterkere. Å overse uønsket adferd er bare effektivt så lenge vi har kontrollen over det hunden ønsker å oppnå (oppmerksomhet, godbitene vi har i lomma osv.).

Å sette grenser, eller rettere sagt hindre at hunden blir forsterket for uønsket adferd, er derfor også nødvendig i noen situasjoner. Men dette kan gjøres på en rolig og vennlig måte uten å skyte spurv med kanoner. Bruk langline som du rolig kan stoppe unghunden med når den prøver å stikke av. Klikk og belønn når den kommer til deg i stedet (og kanskje la den springe bort til den andre hunden som belønning fordi den kom til deg!). Sett hånden foran brystet på valpen når den prøver å hoppe opp på kakebordet, klikk og belønn når den holder alle fire beina på bakken.

Sideeffekter ved bruk av forsterkning

Forsterkere øker sannsynligheten for adferder som produserer dem. Aversive stimuli (ubehag) reduserer sannsynligheten for adferder som produserer dem. Men bruk av forsterkning og straff har også i tillegg endel sideeffekter som det er greit å være oppmerksomme på.

Bivirkninger av aversiv kontroll

Bruk av negativ forsterkning og positiv straff kaller vi samlet for aversiv kontroll. Bruk av aversive prosedyrer har en rekke bivirkninger som stort sett medfører problemer.

1. Aversiv kontroll hemmer selvstendighet

Dette er ikke så vanskelig å skjønne. Hvis en hund har lært å gå fri ved foten for å slippe å få et rykk i båndet er det ganske utenkelig at hunden frivillig vil ta initiativet til å komme på plass og ”be” om å få gå fri ved foten. Ved å gjøre dette vil jo hunden sette seg i en situasjon der den kan risikere å bli tilført ubehag, og det gjør ingen normale dyr.

Jo mer av hundens adferd som blir opprettholdt av aversiv kontroll, jo mindre selvstendig vil hunden bli. Når slike hunder prøver å gjøre noe på eget initiativ blir de ofte utsatt for ubehag, og etterhvert finner de ut at det er best å gjøre minst mulig. På godt norsk kaller vi dette en ”ferdigbanket” hund. Den kan ved første øyekast virke veldig snill, rolig og problemfri, og hundeeieren er kanskje også ganske fornøyd med hundens oppførsel. Men denne ”lydigheten” skyldes mer at alt egeninitiativ er fjernet, enn at hunden egentlig har lært å være lydig…

Hunder som utsettes for aversiv kontroll i mindre grad vil også som regel vise tegn på hemmet selvstendighet. Når man er redd for å gjøre feil er det som regel best å ikke gjøre noe i det hele tatt.

2. Hunden vil gjerne unngå personer eller situasjoner som forbindes med aversive stimuli

En hund som under lydighetstrening i høy grad blir trent med aversiv kontroll, vil helst prøve å unngå f.eks. appellplassen hvis den har mulighet til det. Det er interessant å se hundeeiere med slike hunder idet de går inn på appellplassen. De går med hunden under streng kommando for å holde kontrollen på den. Og det må de – hvis hunden selv fikk sjansen til å velge hadde den aldri blitt med frivillig. Den gjør det bare fordi den har lært at det som skjer hvis den stikker av er verre.

Hvis eieren er forbundet med ubehag oppstår også et annet problem. All adferd som gjør at hunden kan slippe unna eieren, om så bare for noen sekunder, vil bli (negativt) forsterket. Bruk av ubehag etablerer nødvendigvis unnslippelse fra dette ubehaget som en forsterker.

Dette fenomenet ser vi ofte tydelig på hunder som blir trent med aversiv kontroll. Disse hundene leter aktivt etter forstyrrelser under trening. Alt som kan føre til at de slipper unna eieren en liten stund er meget forsterkende. Derfor blir slike hunder mye lettere forstyrret av lukter på bakken, andre hunder osv. Selv ting som i utgangspunktet ikke er spesielt interessant (f.eks. fugler, som egentlig ikke er interessant for en schäfer) kan blir brukt som en beleilig ”unnskyldning” for å komme seg unna den konstante trusselen som eieren representerer (spesielt under aktiv trening).

Observer gjerne grundig neste gang du ser en slik ekvipasje. Det er lett å se på hunden når den aktivt leter etter forstyrrelser. De stikker ikke nødvendvis av, for det tør de ikke hvis de er trent endel, men man kan se at de ofte slipper øyekontakten, setter nesa i været og lukter overdrevent på vinden og andre små tegn. Det de egentlig gjør er å gjøre akkurat så lite som de må for å slippe unna ubehaget.

3. Modelleffekt

Straffeprosedyrer kan ha en modelleffekt. Det er velkjent blant mennesker at folk som blir mishandlet ofte ender opp som mishandlere selv. Mindre alvorlige tilfeller er f.eks. at mellomlederen som får kjeft av toppsjefen kjefter nedover i systemet på sine underordnede, eller at barn som får kjeft av foreldrene går løs på yngre søsken.

Det samme kan også skje hos hunder. En hund som blir angrepet av andre hunder kan begynne å angripe andre hunder selv. Det som er enda mer interessant og viktig å være klar over, er at hunder som blir behandlet hardt av eieren ofte kan utagere mot andre hunder som en direkte følge av dette.

Vi har f.eks. sett flere eksempler på hunder som stikker av fra eieren under trening (av den aversive sorten), og flyr rett på en annen hund, som den normalt ville gått bra sammen med hvis de hadde møttes ute på tur. Det er liten tvil om at treningen er den direkte årsaken til hundens oppførsel.

4. Følelser og følelsesutløst adferd

Alle stimuli utløser følelser. Når man blir utsatt for aversive stimuli oppleves følelser som ubehag, men blir lei seg eller sint. I noen tilfeller kan aversive stimuli føre til følelsesutløst adferd som sinne og aggresjon. Dette gjelder både for mennesker, hunder og de fleste andre dyr. Aggresjonen kan bli rettet mot den som utfører treningen, men også mot andre ”sikrere” mål, som f.eks. andre hunder.

5. Ødelegger kommandoen som betinget (positiv) forsterker

Den kanskje mest alvorlige bivirkningen ved bruk av aversive stimuli i hundetreningen, er at man ødelegger kommandoene sine. En kommando/signal for en adferd som kun blir opprettholdt av positiv forsterkning vil fungere som en betinget forsterker (som et klikk!). Adferden kan dermed inngå i adferdskjeder og forsterke foregående adferd. Dette er en forutsetning for å kunne baklengskjede lydighetsøvelser effektivt.

Hvis man derimot bruker aversive stimuli i treningen av en adferd vil kommandoen bli en betinget negativ forsterker – en trussel på godt norsk. Dette gjelder også om aversiver blir brukt i kombinasjon med positiv forsterkning. Å unnslippe ubehag er som regel alltid viktigere enn å oppnå goder. Kommandoen signaliserer nå muligheten for å bli utsatt for et ubehag hvis hunden ikke utfører kommandoen.

Ingen liker å motta trusler. Adferder/kommandoer som er innlært med bruk av aversiv kontroll kan derfor ikke lenger brukes effektivt i adferdskjeder. Tenk deg f.eks. øvelsen fremmadsending til rute i LP klasse 3. Hunden springer perfekt ut til ruta og eier brøler ”ligg!” (som er innlært med aversiv kontroll). Hvis man gjentar dette noen ganger vil man se at hunden blir dårligere og dårligere til å springe til ruta. Dette er ikke så rart ettersom hunden i realiteten blir utsatt for en trussel hver gang den springer ut til ruta. Å springe ut til ruta blir straffet og vil dermed bli mindre og mindre sannsynlig. Det de fleste hundeførere da gjør er å reparere dette ved å bare trene selve fremmadsendingen, f.eks. ved å legge en tennisball i ruta noen ganger. Når feilen er rettet opp kan de igjen rope/brøle ”ligg!” noen ganger før de må reparere igjen.

Hvis avstands-liggen hadde vært positivt innlært hadde ligg-kommandoen positivt forsterket å springe ut til ruta, og adferdskjeden hadde blitt opprettholdt selv om man kjørte begge leddene hver gang. Mange timer med reparasjonstrening hadde dermed vært unngått…

Dette problemet gjelder i flere situasjoner enn man tror. Hvis man har brukt ubehag i forbindelse med innkallingstrening (f.eks. springer ut og ”tar” hunden hvis den ikke kommer på innkalling) vil hunden i realiteten bli straffet for det den gjør akkurat når den får innkallingssignalet (innkallingssignalet signaliserer til hunden at det er fare på ferde hvis den ikke kommer) . Dette kan være ødeleggende f.eks. for brukshunder på rundering eller i feltsøk. Da vil søksadferden bli straffet hver gang eier roper. Det samme gjelder også for gjeterhunder og stående fuglehunder i arbeid, men hos disse rasene er jaktlysten så høy at det sjelden vises like tydelig. Men også disse hundene hadde nok jobbet enda bedre om innkallingen hadde vært positivt innlært.

6. Mister muligheten til å bruke negativ straff effektivt

Negativ straff er et viktig verktøy i hundetreningen. Å holde tilbake eller fjerne muligheten til å oppnå en positiv forsterker gir oss muligheten til å redusere uønsket adferd uten alle bivirkningene som følger med bruk av aversive stimuli. En vanlig bivirkning av negativ straff er at dyret prøver hardere neste forsøk, og dermed får vi kanskje fram adferd som vi kan forsterke. Dette er sterkt ønskelig.

Hvis vi bruker aversive stimuli i treningen mister vi imidlertid muligheten til å bruke negativ straff effektivt. Tenk deg en hund som er vant til å bli utsatt for et ubehag hver gang den gjør feil. Hvis nå eieren plutselig bestemmer seg for å slutte med dette og i stedet bruke negativ straff (holde tilbake forsterkeren/overse hunden når den gjør feil) vil dette være svært lite effektivt. Adferden vil nå i stedet bli negativt forsterket ettersom hunden slipper unna ubehaget den er vant til å bli servert. Problemadferden vil dermed øke i frekvens.

Hunden må gjennom en lang ”konverteringsperiode” før negativ straff kan brukes effektivt igjen. I denne perioden må eier kun bruke positiv forsterkning. Lave kriterier og høy forsterkningsfrekvens hjelper hunden raskere gjennom denne prosessen. Men hvis hunden er meget ”gjennomtrent” med aversive stimuli vil det ta lang tid, og man vil ikke oppnå den samme effekten man kunne hatt hvis det i utgangspunktet ikke hadde blitt brukt aversive stimuli i treningen.

7. Effekten av positiv forsterkning blir mindre

Hvis man under trening benytter seg av både positiv forsterkning og aversiv kontroll er det en faktor man bør være klar over. Vi kan se for oss en hund som blir belønnet med både godbiter og andre ting når den er flink, men også tildels kraftige korrigeringer når den gjør feil – en ikke helt uvanlig praksis. Når hunder utsettes for mye ubehag under treningen blir virkningen av belønningen mindre! Hunden kan rett og slett bli så opptatt av å unngå ubehag at den ikke jobber så hardt for belønningen lenger. Dette har sannsynligvis sammenheng med at det evolusjonært sett har større overlevelsesverdi å unngå noe truende enn å oppnå en enkelt fordel.

I en medisinsk fagbok kan vi hente følgende utsagn: “Det er spesielt interessant at stimulering av straffsenteret {i hjernen} ofte kan inhibere senterne for belønning og velbehag totalt, noe som demonstrerer at straff og frykt tar overhånd over velbehag og belønning” (Guyton & Hall, 1996). Sagt på en enklere måte; du kan belønne hunden til du blir grønn, men det “går ikke inn”. Hunden jobber kun for å unngå å bli korrigert – ikke for belønningen. Effekten av belønning blir derfor størst om du ikke kombinerer med bruk av ubehag.

Vi ser ofte tydelige eksempler på dette når vi begynner å klikkertrene hunder som tidligere mest har blitt trent med negativ forsterkning (såkallte ”crossover-hunder”). Ofte vil de ikke engang spise godbiter som de får gratis til å begynne med. Man kan nesten se på hundene at det eneste som står i hodet på dem er ”jeg må unngå trøbbel, jeg må unngå trøbbel, jeg må…osv”. Men hvis man fortsetter tålmodig med å klikke små ting hunden gjør frivillig og tilby godbitene (selv om hunden i starten spytter dem ut), så skjer det noe interessant etterhvert. Til slutt tar nemlig hunden godbiten. Og idet hunden svelger godbiten kan du nesten se at mynten faller ned i brusmaskinen. ”Wow, jeg kan spise godbiter!”. Og nå vil etterhvert hunden bli mer og mer ivrig på godbitene. Noen hunder kan bli så glupske at du nesten skulle tro at de prøver å ta igjen alle tapte år uten godbiter. Neste skritt er at hunden også begynner å tilby stadig flere adferder frivillig. ”Utrolig! Jeg kan gjøre ting uten at eier kommanderer meg – og jeg får godbiter for det!!” Å se forandringen på slike hunder er til tider utrolig rørende. De går fra viljeløse sofaputer til hunder som faktisk lever.

Det er også en annen ulempe ved å kombinere bruk av belønning og ubehag. En av de største fordelene med å trene 100% positivt er at du kan «fortelle» hunden meget effektivt at den gjorde feil bare ved å holde tilbake belønningen. På denne måten kan du på en veldig fin måte fortelle hunden både hva den gjør riktig (= belønning) og hva den ikke gjør riktig (= ingen belønning). Hvis man derimot kombinerer bruk av belønning og ubehag er det ikke like effektivt å holde tilbake belønningen når hunden gjør feil. For denne hunden betyr nemlig både «belønning» og «ingen ubehag» at den gjorde riktig! Hunden er derfor fortsatt ganske så fornøyd, for den fikk jo ikke noe ubehag ihvertfall. Man mister dermed en veldig grei måte å kommunisere med hunden, og må derfor ofte gå hardere inn for å fortelle hunden når den gjør feil i stedet (med alle de ulemper det fører med seg). Det er med andre ord verre å slutte med aversiv kontroll når du først har begynt.

8. Straff er forsterkende for strafferen

Den farligste bivirkningen ved å bruke ubehag i treningen er imidlertid en bivirkning som rammer deg selv. Å straffe virker forsterkende på den som straffer. Det vil si at for hver gang du kjefter, rykker i båndet eller bruker andre ubehag mot hunden, øker sannsynligheten for at du vil gjøre dette i framtiden også. For å si det enkelt: Hver gang du bruker vold vil du bli mer voldelig.

Tenk deg at du er ute og går tur med hunden og at den drar i båndet. Dette er plagsomt, og du rykker i båndet. Når du rykker i båndet slutter hunden å dra i noen sekunder – ubehaget ditt forsvinner. Din egen rykke-i-bånd-adferd blir med andre ord negativt forsterket, og dermed øker sannsynligheten for at du vil rykke i båndet også neste gang hunden begynner å dra.

Tenk deg at du trener hunden til å bli liggende, men det går ikke særlig bra. Du kjenner at du blir mer og mer frustrert og til slutt ”sprekker du” og tar hunden skikkelig og presser den ned i bakken. Idet du går løs på hunden får du ut en masse frustrasjon – det føles kjempegodt der og da, ikke sant? Du har nå ”oppnådd” to ting. Du har utsatt hunden for alle de bivirkningene vi nettopp har nevnt, og i tillegg har sjansen økt for at du vil opptre voldelig neste gang du havner i en lignende situasjon.

Det er viktig å være klar over dette fenomenet, for vi kan garantere deg at hvis du tidligere har trent hunder med negativ forsterkning vil du i starten ha store omstillingsproblemer når du nå skal begynne med klikkertrening. Du vil oppleve situasjoner der det rett og slett gjør fysisk vondt at du ikke kan korrigere hunden. Dette er nok også en sterkt medvirkende årsak til at mange hundeeiere nekter å innse at det er mulig å trene hunder uten bruk av ubehag.

Men den gode nyheten er at dette heldigvis går over etterhvert! Bruk av straff er som røyking – det er svært vanedannende, men det går an å slutte bare du gjør et ærlig forsøk. Etterhvert vil du oppleve at du får kontroll over hunden ved å belønne riktig adferd i stedet for å korrigere feil, akkurat som du oppdager hvor godt det er å kunne puste normalt når du står opp om morgenen etter å ha kuttet ut røyken i noen uker. Og da blir det etterhvert lettere og lettere.

Bivirkninger av positiv forsterkning

At aversiv kontroll har bivirkninger er kjent for de fleste. Men positiv forsterkning har også endel bivirkninger. Disse er dog sjelden like alvorlige, men uansett er det greit å kjenne til dem også.

1. Forsterkning av en adferd senker frekvensen av andre adferder

Når en adferd blir forsterket og dermed blir mer sannsynlig, vil nødvendigvis andre adferder bli mindre sannsynlig. Hunden kan jo ikke gjøre to oforenelige ting på en gang. Dette samme forholdet gjelder også ved bruk av straff. Hvis en adferd straffes og dermed forekommer sjeldnere vil andre adferder nødvendigvis forekomme oftere (f.eks. forekommer gjerne passivitet oftere når andre adferder blir straffet).

Som en bivirkning av positiv forsterkning er imidlertid dette som regel en ønsket effekt. Hvis vi forsterker at hunden ser på oss, vil tiden hunden ser på andre ting minske. Hvis vi forsterker at hunden går pent i bånd vil tiden hunden drar i båndet minske. Hvis vi forsterker at hunden er stille vil bjeffing bli mindre sannsynlig.

I en shaping-prosess benytter vi oss av denne bieffekten. Vi forsterker kun måladferden eller tilnærminger til denne (f.eks. å berøre target sticken med snuten), dermed øker denne i frekvens mens andre adferder (f.eks. å bite i target sticken, sitte, bjeffe, stirre på oss osv) synker i frekvens (hvertfall i akkurat denne situasjonen). Dette kalles for DRO-prosedyren (differential reinforcement of other behavior).

Tidlig i treningen når vi fortsatt jobber med å shape fram grunnferdigheter, kan vi ofte oppleve at når vi trener mye på en adferd er periode, blir det vanskeligere å få fram adferder vi har lært inn for en stund siden. Hvis du f.eks. har prioritert trening på ligg i en uke, vil hunden tilby stå og sitt sjeldnere enn før. Dette er imidlertid en bieffekt det det er fort å rydde opp i. Hvis du igjen forsterker sitt og stå endel ganger vil også disse adferdene snart være tilbake til sitt vanlige nivå igjen.

2. Forsterkning kan gi generell økning av aktivitetsnivå

Dyr som blir utsatt for aversiv kontroll blir ofte passive og initiativløse. Hyppig bruk av positiv forsterkning kan ha motsatt effekt – aktiviteten blir høyere. Dette er som regel en positiv bieffekt, men noen hundeeiere kan ha problemer med å takle den økte aktiviteten i starten. Det er som kjent mer problemer med levende hunder enn med døde hunder…

Det er velkjent at hunder som blir klikkertrent fort kan bli veldig kreative både i og utenfor treningssituasjonen. Selv synes vi dette som regel er veldig sjarmerende, og adferder som vi ikke ønsker kan vi fort fjerne ved å la være å forsterke dem utenfor selve treningssituasjonene. Vi respekterer imidlertid at alle ikke er av samme formening.

Dette er også en av grunnene til at hardhendte treningsmetoder fortsatt er populære. Slike metoder produserer ofte passive hunder som det ikke er noe bry med. Noen liker at hundene er sånn. I noen land liker de at kvinner er sånn også…

Spesielt når man belønner med høypotente forsterkere som ball, fille, ekstra gode godbiter (eller bare mat generelt for veldig matglade hunder) merker man ofte denne ekstra aktivitetsøkningen spesielt godt. Hunden kan begynne å hoppe på fører, forsyne seg uforsiktig av godbiter og leker, bjeffe osv. Endel hundeeiere har problemer med å takle denne økte aktiviteten og vil insistere på å alltid bruke en type belønning som hunden ikke er så ivrig etter for å unngå disse bivirkningene.

Gode trenere vil imidlertid enkelt kunne takle en ivrig hund og sette stor pris på dette. Når hunden er ivrig er det gode muligheter for å få både høy fart og presisjon hvis treningen legges opp på riktig måte. Uønskede adferder som bjeffing, biting i fingre når hunden skal ta belønningen osv kan som regel fort fjernes hvis man er nøye med at hunden aldri får noe resultat av disse adferdene. Og når hunden først har lært det vi vil at den skal gjøre vil som regel andre adferder forsvinne av seg selv.

3. Forsterkere som diskriminative stimuli

Synet av forsterkere fungerer også som diskriminative stimuli for visse adferder. Når man begynner å trene en hund med godbiter kan man oppleve at hunden blir ”godbitfiksert” som mange kaller det. Den vil mase, pipe, krafse på lommene dine og gjøre mange forskjellige ting for å prøve å ta snarveien til godbitene. Mange trekker da konklusjonen at man må legge bort godbitene hvis de skal få hunden til å gjøre andre ting enn å mase på lommene.

Et annet fenomen vi ofte møter på hundekurs er hundeeiere som nekter å bruke tennisball eller andre favorittleker som belønning. Når vi spør hvorfor sier de at ”hunden blir helt gal”. Dette er også eksempel på samme fenomen. Synet av tennisballen er en diskriminativ stimulus som ofte fører med seg endel (uønsket) adferd som hundeeieren har vanskelig for å kontrollere.

Selv anser vi aldri dette for et problem. Vi kan fort lære hunden at maseadferd ikke blir forsterket. Hvis den skal oppnå godbitene eller ballen må den i stedet gjøre det vi har satt som kriterium – ingenting annet blir forsterket! Så snart vi har trent inn noen adferder forsvinner den voldsomme masingen av seg selv (se bieffekt nr. 1!). Man bør også legge stor vekt på å lære hunden å forsyne seg av belønningen på en akseptabel måte. Godbithånda åpnes bare når hunden tar pent (IKKE når den biter eller er grådig). Og når den leker med ballen bør den lære å komme frivillig tilbake og levere fra seg denne – ikke stikke over alle hauger.

Det som er utfordringen er å unngå å forsterke alle de uønskede adferdene som kan boble fram når hunden blir mer ivrig. Man bør heller ikke positivt straffe disse adferdene, ettersom det kan føre til senket aktivitetsnivå igjen.

Som instruktør bør man være klar over dette fenomenet. Mange hundeeiere opplever hundens masing som svært problematisk, og hvis vi ikke hjelper dem gjennom denne fasen kan vi risikere at de ikke lenger vil bruke belønning i treningen. Gjør vi jobben vår og lærer hundeeieren å administrere belønningen korrekt, vil det bare være positivt jo mer ivrig hunden er på belønningen.

4. Følelsesutløst adferd

Også positive forsterkere fører med seg følelser. Som regel er dette det vi kan kalle gode følelser, som glede og tilfredstillelse. Også ved stimuli som pålitelig går forut for levering av forsterkere, vil vi oppleve følelser som vi kaller forventning eller oppstemthet.

Dette må stort sett regnes som positivt, men det kan også føre med seg endel uønsket adferd. Hunden kan av og til bli alt for intens, den kan begynne å pipe og bjeffe osv. Vi trenger heldigvis ikke fjerne hundens glede for å løse dette problemet. Det er nok at vi setter tydelige kriterier og kun forsterker når hunden utfører adferder uten piping og bjeffing. Vi kan også avbryte treningen hvis hunden blir for intens slik at at denne intense adferden ikke blir forsterket. Når hunden er rolig fortsetter vi treningen igjen.

En hund som blir trent med positiv forsterkning er en lykkelig hund. Det samme gjelder forresten også mennesker, hvis du lurte på det.

Hvordan skal jeg trene?

Dette er et valg du må ta selv. Som hundeeier vil du stadig høre at du trene på en spesiell måte for å få resultater. Dette er feil. Når folk sier at du gjøre en ting er dette som regel bare et uttrykk for denne personens preferanser. Og kanskje har denne preferansen blitt så sterk at han/hun har fått skylapper og ikke lenger greier å se at det finnes alternativer. Eller kanskje han/hun rett og slett ikke vet at det finnes alternativer.

Så la dette være sagt nok en gang: Du kan trene alle lydighetsøvelser både med positiv forsterkning og med negativ forsterkning (eller en kombinasjon av disse).

Men før du nå begynner å tro at det nærmest er likegyldig for oss hvordan du trener hunden din, skal du få vår helt klare mening. Vår drøm er at alle hundeeiere lærer å trene effektivt med positiv forsterkning. Ikke bare for hunden sin del, men kanskje mest av alt for eierens del. Måten du trener på gjør noe med hunden, men det gjør også noe med deg.

En viktig bivirkning ved å bruke ubehag i treningen din er, som vi tidligere nevnte, at du ”ødelegger” kommandoene dine. Hvis du f.eks. har lært hunden å ligge ved hjelp av å bruke ubehag vil kommandoen ”ligg” rett og slett være en trussel for hunden. Kommandoen betyr ”legg deg, ellers….”. Innkallingen din vil bety ”kom hit, ellers…”. Resultatet er at du får en hund som rett og slett hater å få kommandoer. Joda, den adlyder kanskje, men den hater det likefullt. Ingen liker å få trusler…

Og noe tristere hundehold enn dette kan vi rett og slett ikke tenke oss. Tenk deg at din beste venn skal komme når du roper fordi han er redd for at du skal gjøre ubehaglige ting… Sammenlign dette med en hund som kommer mot deg i fullt firsprang overlykkelig over at du endelig ropte på den slik at den fikk sjansen til å komme inn til deg og få en godbit eller en liten kosestund. Og hva er et flott resultat i lydighetsringen verd hvis du vet med deg selv at du har truet hunden din gjennom programmet…?

Opplevelsen av å gå gjennom et perfekt lydighetsprogram der du ser at hunden tydelig går og venter på belønningen hele tiden, er noe vi unner alle hundeeiere å oppleve. Når du først har opplevd dette, er det ingen vei tilbake…

Oppsummering

Adferd opprettholdes av positiv eller negativ forsterkning. Andre alternativer finnes ikke. Det er viktig å være klar over hvilke konsekvenser man selv benytter til enhver tid. Med litt trening er det også ganske enkelt å se på en hund om adferden blir opprettholdt av positiv eller negativ forsterkning.

I tillegg til å øke eller redusere sannsynligheten for adferd vil all bruk av forsterkning og straff også føre med seg noen bivirkninger ovenfor andre adferder enn de som ble påvirket direkte. Disse er det greit å være klar over.

De fleste bivirkninger av positiv forsterkning ser ut til å være positive, mens de fleste bivirkninger av aversiv kontroll er problematiske. Unntak finnes imidlertid. Mange hundeeiere vil faktisk synes at passiviteten som aversiv kontroll fører med seg er positiv (gjelder spesielt de som ikke bruker hunden til noe spesielt formål utover å være en rolig familiehund). Og den økte aktiviteten som bruk av positiv forsterkning kan føre med seg vil også betraktes som uønsket i noen tilfeller.