Klikkertrening eller lommetrening?

Klikkertrening eller lommetrening?

Klikkertrening har opplevd en eksplosjonsartet vekst de siste 20 årene. Men i et sjeldent intervju, sier Canis-gründer Morten Egtvedt at han ser mørke skyer på horisonten for klikkertreningens videre utbredelse. Han forteller at ifølge sikre observasjoner har klikkertrening blitt mer enn halvert i popularitet de siste årene, til fordel for en ny metode som ser ut til å ta hundeverden med storm i disse dager.

 

Journalist: Så hvilken ny metode er dette egentlig snakk om?

Morten: Vel, det positive er at den nye metoden ligner veldig på klikkertrening. Strengt tatt er den eneste forskjellen at de bruker enn annen adferdsmarkør enn klikkeren.

 

Jornalist: For nye lesere – hva er en adferdsmarkør?

Morten: En adferdsmarkør er en stimulus som trenere bruker til å markere den adferden de ønsker å forsterke. Den mest presise adferdsmarkøren er klikkeren. Det er en veldig distinkt lyd som hunden sjelden hører i andre sammenhenger. Når klikkeren etterfølges av belønning i 100% av tilfellene, vil denne lyden være en svært effektiv adferdsmarkør.

Men man kan også bruke andre adferdsmarkører – et kort og konsist ”Bra!”, en hundefløyte, et lysglimt eller en bestemt berøring, kan også brukes som markør.

 

Journalist: Hva er grunnen til at dyretrenere ofte bruker slike adferdsmarkører i treningen?

Morten: Det tar litt tid å få en godbit eller hundeleke fra lomma og inn i munnen på hunden. I løpet av denne tiden, har hunden som regel påbegynt andre adferder enn den vi egentlig ønsket å forsterke. Riktig brukt, vil en presis adferdsmarkør ”fotografere” riktig adferd, og fungere som en ”bro” over tidsgapet mellom ønsket adferd og selve forsterkerleveringen.

Det betyr at så lenge vi klikker presist, skjer det ingen reduksjon i forsterkningseffekten av riktig adferd selv om det går et sekund eller to før vi leverer forsterkeren til hunden rent fysisk. Dette er en kjempefordel når man trener dyr (inkludert mennesker). Du kan da formidle presis forsterkning selv om dyret ikke ser på deg, selv om det er på avstand, og selv om du har belønningen gjemt i lomma og det tar et sekund eller to å få den opp.

 

Journalist: Men nå har det altså kommet en ny treningsmetode som ligner veldig på klikkertrening. Den bruker altså en annen markør, og ser ut til å ta verden med storm. Bruker denne metoden en veldig fancy og teknologisk avansert adferdsmarkør ettersom den har blitt så populær på så kort tid?

Morten: Vel, nei. De fleste som bruker denne metoden vet ikke engang hvilken adferdsmarkør de egentlig bruker. De tror de bruker klikkeren som markør, men det er ikke engang sikkert at hundene deres legger merke til klikkerlyden ettersom de allerede har lagt merke til den andre adferdsmarkøren. Og det at hundetrener ikke er oppmerksom på hvilken markør han egentlig bruker, kan føre til noe upresis forsterkning noen ganger.

 

Journalist: OK, så de forsterker ofte mindre presist, men likevel tar denne metoden verden med storm? Det er noe rart som skjer her…

Morten: Vel, hundetrening går ofte fort, og de færreste har gode nok observasjonsferdigheter til å legge merke til disse små detaljene.

 

Journalist: Så du mener at hundeeiere har dårligere syn enn før?

Morten: Nei, observasjonsferdigheter dreier seg ikke så mye om hvor gode øyne du har – det handler mer om å vite hvilke detaljer du skal se etter. Hvis man derimot vet hva man skal se etter og i tillegg gjerne studerer treningen på video i tillegg, ser man en helt klar tendens. Denne nye metoden er i ferd med å ta fullstendig over for klikkertrening.

 

Journalist: Selv om de som bruker metoden ikke vet at de bruker metoden? Og selv om de som bruker metoden ofte forsterker mer upresist fordi de ikke er klar over hvilken adferdsmarkør de egentlig bruker? Dette er sjokkerende!

Morten: Ja, det er ikke bra. Men den gode nyheten er at så snart hundetrenere blir gjort bevisst på saken og legger merke til hva de gjør, så hopper de fort tilbake til klikkertrening igjen. Det kreves som regel bare et par ukers rehabilitering med fokus på saken, og så er problemet løst. Av egen erfaring vet jeg imidlertid at tilbakefall kan forekomme, så det er viktig å ha kontinuerlig fokus på egne trenerferdigheter.

 

Journalist: Så du har prøvd ut denne metoden selv også? Dette var saftige nyheter for hundebladforsidene…

Morten: Ja, når jeg ser på gamle filmer av meg selv, ser jeg at det skjedde rett som det var. Og innimellom, når jeg ikke har fått kaffekoppen min i tide, kan det fortsatt forekomme den dag i dag. Hva kan jeg si… det kan tydeligvis skje i de beste familier.

 

Journalist: Men nå må vi ikke holde leserne våre i mørket lenger – hva heter denne nye metoden, og hvilken markør er det snakk om?

Morten: Metoden heter ”Lommetrening”. Og den adferdsmarkøren som brukes, er ”å bevege belønningshånda mot lomma”. Derav ”Lommetrening”.

 

Journalist: Å bevege hånda mot lomma? Er dette virkelig en adferdsmarkør?

Morten: Alle stimuli som pålitelig varsler levering av forsterker, vil automatisk fungere som adferdsmarkører. Det kalles også for ”Sekundær forsterker” eller mer presist ”Betinget forsterker”. Og hvis du tenker deg om innser du fort at nesten ingenting varsler levering av forsterkning mer pålitelig enn at hånda til hundetrener beveger seg mot lomma…

 

Journalist: Hmm…interessant. Men disse hundetrenerne bruker som regel fortsatt klikkeren eller ordet ”bra!” i tillegg? Vil ikke dette være mye tydeligere for hunden enn at hånda begynner å bevege seg mot lomma?

Morten: Når vi snakker om betinging er det av mindre betydning hvor ”tydelig” de forskjellige stimuli er. Det som er viktig er rekkefølgen.

 

Journalist: På hvilken måte?

Morten: Det som er den evolusjonære årsaken til at klassisk betinging som læringsprinsipp har oppstått, er at individer som lærer at visse stimuli varsler om viktige hendelser (dvs. gode ting eller farlige ting) vil ha en seleksjonsmessig fordel framfor individer som ikke lærer denne koblingen like lett. Klassisk betinging innebærer enkelt forklart at visse stimuli som i utgangspunktet er nøytrale, får signalverdi gjennom at de gjentatte ganger blir ”paret” med ”den viktige hendelsen”. Klikket får signalverdi fordi det varsler at mat eller morsomme ting er på vei. Rasling i buskene kan få signalverdi fordi det varsler at en løve snart hopper fram.

 

Journalist: Eh…Ok?

Morten: Men du skjønner sikkert at rekkefølgen er av vesentlig betydning i denne læringsprosessen. Hvis hunden får godbiten først, og først etterpå hører klikket, vil ikke klikket ha noen signalverdi. Hunden har jo allerede fått maten. Og hvis lyden av rasling i buskene først kom samtidig som at løven satte klørne sine i rumpa di, ville ikke denne lyden hatt den store signalverdien heller.

 

Journalist: Nei, det høres logisk ut. Så du mener det hjelper ikke engang at lyden kommer samtidig som den viktige hendelsen? Skjer det ingen læring da heller?

Morten: Det er dessverre ingen evolusjonære fordeler forbundet med etterpåklokskap for en antilope som har en sulten løve hengende i hekken…

 

Journalist: OK, så det betyr altså at klikkeren må komme FØR maten for at den skal ha noen signalverdi.

Morten: Det er korrekt. Men helst ikke rett før. Forsøk har faktisk vist at betinging skjer mer effektivt hvis avstanden mellom ”stimulus” (for eksempel klikk) og ”viktig hendelse” er større enn 0,3 sekund, og mindre effektivt hvis denne avstanden er mindre enn 0,3 sekund. (Se for eksempel Gregory Kimble, 1947.)

 

Journalist: Så det er bedre at hunden får belønningen 0,4 sek eller mer etter klikket, enn at maten er i munnen på hunden kun 0,1 sek etter klikket??

Morten: Ja, minst 0,4 sek ser ut til å gi sterkere betinging. Dette er også logisk i et evolusjonært perspektiv. Hvis du lærer sammenhengen mellom visse stimuli som varsler viktige hendelser med minst 0,4 sek, har du faktisk tid til å gjøre noe som øker sjansene for overlevelse i dette tidsrommet – som for eksempel å få 3 meters forsprang på løven, eller starte utskillelse av spytt i munnen for å fordøye godbiten bedre. 0,1 sekunds varslingstid er atskillig mindre nyttig i praksis, og det kan derfor se ut som om kroppen ikke ser verdien i å lære dette like effektivt.

 

Journalist: Ok, men la oss unngå å bli altfor filosofiske, og heller holde oss til praktisk hundetrening. Jeg skjønner at det er viktig å forsinke belønningslevering med ca. 0,4 sek etter klikket for optimal betinging av klikket. Men jeg skjønner ikke hva dette har å gjøre med at denne nye treningsmetoden – var det ”Lommetrening” du kallte den – er i ferd med å ta over verden?

Morten: Vel, la oss gå tilbake til busken med løven bak – jeg lover å komme til poenget, så bare vær litt tålmodig. Tenk deg en antilope som 20 ganger har hørt lyder bak busken, og 20 ganger unnsluppet løven 1 sekund før den hoppet fram. For denne antilopen kan du sikkert se for deg at ”lyd fra busk” har temmelig høy signalverdi.

 

Journalist: Jo, jeg kan tenke meg noen sammenlignbare scenario fra eget liv…

Morten: Ja, ikke sant. OK, tenk deg nå at det rabler for løvene, og de plutselig begynner med en helt ny jaktteknikk. Først kommer det en lyd fra busken de har gjemt seg bak (akkurat som før), men like etter denne lyden holder løven opp et stort rødt skilt hvor det står ”Nå kommer jeg og tar deg!”. Først et halvt sekund etter å ha vist dette skiltet, hopper løven fram for å ta antilopen. Og da er spørsmålet: Tror du antilopen lærer sammenhengen mellom store røde skilt og løver som hopper fram?

 

Journalist: Vel, skiltet var jo veldig tydelig…

Morten: Ja, skiltet er kanskje tydelig – men det har absolutt null signalverdi (ikke engang om vi forutsetter at antiloper kan lese). Antilopen vet jo allerede at løven venter bak busken, ettersom den hørte lyden først. At løven deretter holder opp et stort, rødt skilt i tillegg, gir ingen ny informasjon til antilopen, og det vil derfor ikke skje noen effektiv betinging i forhold til skiltet.

 

Journalist: Jamen, hva har dette med hundetrening å gjøre?

Morten: Det lommetrenere gjør (som de ikke vet at de gjør), er at når de klikker (eller sier bra!) har de allerede signalisert til hunden at ”belønningen er på vei” ved å bevege hånda mot belønningslomma. At de etterpå klikker (eller sier ”bra!”) i tillegg blir det samme som at løven holder opp et verdiløst skilt, når antilopen allerede vet hva som kommer.

 

Journalist: Aha, nå begynner bitene å falle på plass her.

Morten: Så hvis du nå forestiller deg at du er en hund som har blitt ”lommetrent” en stund… hvilket stimulus vil du holde mest utkikk etter? Klikk etter håndbevegelser?

 

Journalist: Håndbevegelser så klart.

Morten: Nettopp. Og jo mer lommetrening hunden erfarerer, jo sterkere blir ”lommebevegelsene” som betinget forsterker – mens klikkeren blir desto mindre viktig. I de verste tilfellene ser man hunder som ikke lenger reagerer på klikkeren i det hele tatt hvis de for eksempel er på avstand med ryggen mot fører og ikke kan se bevegelsene til hundefører i tillegg.

 

Journalist: Er det riktig å si at lommebevegelsene ”blokkerer” for klikket?

Morten: Ja, det er akkurat det som skjer.

 

Journalist: Så det kan faktisk være en hel mengde klikkertrenere der ute som klikkertrener hundene sine, men der hundene ikke lenger vet hva klikket betyr?

Morten: Nja, en viss betingingseffekt mellom klikk og belønning vil alltids skje, ettersom hundene ofte får klikk (og deretter belønning) mens de har ryggen vent mot hundetrener og derfor ikke ser lommebevegelsene. Men det er helt klart at mange klikkertrenere bruker klikkeren på en måte som definitivt ikke er opp til dens fulle potensiale.

 

Journalist: Men dette kunne fikses ganske greit, nevnte du?

Morten: Ja, og første skritt er bare å bli oppmerksom på saken, slik leserne av denne artikkelen allerede er. Da kan man en periode være veldig bevisst på å holde arbeidsposisjonen til etter klikket.

 

Journalist: Hva mener du med ”å holde arbeidsposisjonen”.

Morten: ”Å holde arbeidsposisjonen” vil si at du ikke gjør noe som forteller hunden at belønningen er på vei, før tidligst 0,3 sek etter at du har klikket. Å holde arbeidsposisjonen kan innebære at du står rolig med hendene ned langs siden, og først etter at du har klikket, begynner du bevegelsene som forteller hunden at du er i ferd med å belønne. Hvis du for eksempel trener fri ved foten står du av forståelige grunner ikke rolig, så da vil det å holde arbeidsposisjonen innebære at du går framover slik du alltid går fri ved foten fram til du klikker – og gjerne minst et skritt eller to ekstra etter klikket – før du stopper og begynner belønningsrutinen.

 

Journalist: OK, så det er altså veldig viktig å alltid holde arbeidsposisjonen i minst 0,3 sek etter klikket?

Morten: Det er ikke viktig sammenlignet med verdens miljøproblemer eller at Rosenborg vinner den norske fotballserien, men i hundetreningssammenheng er det ekstremt viktig. I hvert fall så lenge du ønsker å klikkertrene effektivt – og ikke ubevisst havne i lommetreningsstatistikken.

 

Journalist: Det må jeg si… dette var virkelig interessante nyheter. Hvordan kan dette ha fått lov til utvikle seg såpass ubemerket i et så stort omfang?

Morten: Dette blir selvfølgelig bare spekulasjoner, men jeg tror mye henger sammen med at mange hundetrenere de siste årene har lagt mer og mer vekt på å alltid belønne hunden i en spesiell posisjon. Det holder ikke lenger å klikke riktig adferd – hunden skal også på død og liv belønnes i akkurat denne posisjonen. Og det er klart at når hunden absolutt må belønnes i samme posisjon som den er i når klikket kommer, blir det viktig å få belønningen lynraskt opp av lomma. Derfor begynner hundetreneren gradvis belønningsbevegelsen tidligere og tidligere. Etter hvert blir det så ille at de ikke engang tør å ha belønningen gjemt i lomma, og går alltid med denne klar i hånda som en slags sutteklut i stedet.

 

Journalist: Var det ikke Bob Bailey som sa ”Click for action – treat for position”?

Morten: Jo, det stemmer. ”Click for action – THEN treat for position”. Det kan være nyttig å belønne i en spesiell retning/posisjon etter at du først har klikket korrekt adferd. Men det skal ikke gjøres i en og samme operasjon! Klikk først – SÅ belønner du evt i en bestemt posisjon. Det er viktig at treneren tør å stole på klikket. Belønningsplasseringen er kun en bonus.

For mange har det dessverre blitt motsatt. Og ettersom klassisk betinging ikke virker baklengs, vil klikkeren nødvendigvis få mindre og mindre effekt – hvilket igjen vil føre til at treneren føler at hurtig belønningslevering og en spesiell belønningsplassering blir viktigere og viktigere. Det blir en selvforsterkende ond sirkel.

 

Journalist: Du ber altså hundetrenere legge mindre vekt på belønningsplassering?

Morten: Jeg sier at hvis folk vil klikkertrene, så skal de stole på klikket! Jeg ber ikke folk legge mindre vekt på belønningsplassering – jeg ber dem legge enormt stor vekt på klikket – og i tillegg bruke forskjellige former for belønningsplassering som prikken over i´en.

Med god klikkertrening kan du få begge deler. Du kan markere ønsket adferd uhyre presist, du holder arbeidsposisjonen i minst 0,3 sek etter klikket – og SÅ kan du plassere belønningen akkurat der det passer best for akkurat denne adferden. Og for guds skyld – slutt å ha tvangstanker omkring hva hunden gjør eller ikke mellom klikket og levering av belønningen. Og HVIS det er viktig hva hunden gjør, LÆR hunden å ”fryse” (bli i posisjonen) etter klikket når du trener akkurat denne adferden.

 

Journalist: Da takker jeg for praten, Egtvedt. Jeg forstår du er en travel mann for tiden. Har du noen siste råd til lommetrenere som ønsker å rehabliteres?

Morten: Ja, det har jeg. Første skritt er å innrømme ovenfor seg selv at man (helt uforskyldt, selvfølgelig) har blitt en lommetrener. Hvis man ser seg selv trene på video, ser man det sort på hvitt, og det er som regel en effektiv oppvåkning.

Andre skritt er å begynne å øve inn Det er viktig å holde arbeidsposisjonen mer enn 0,3 sekunder etter klikket hvis du vil ha fullt utbytte av klikket. nytt bevegelsesmønster. Tenk på at begge hendene dine skal være limt til siden på låret når du klikker, og deretter en liten tanke lenger før du begynner belønningsbevegelsen.

Du kan gjerne tørrtrene uten hund og virkelig overdrive denne pausen (i 1-2 sekunder) mens du er tidlig i rehabiliteringsfasen. Og hold belønningen skjult i lomma til enhver tid under trening – unntatt når du faktisk belønner.

Tredje skritt er kontinuerlig årvåkenhet, slik at du ikke sklir tilbake til gamle uvaner. Å se seg selv trene på video med jevne mellomrom eller få en treningskamerat til å observere treningen din og telle antall korrekte og feil responser, kan være veldig nyttig.

Fjerde skritt trenger du ikke å tenke på – når du har trent med riktige bevegelse over en lengre periode, vil du utvikle flyt på de nye bevegelsene, og da går ting av seg selv. Og da er du klikkertrener for alltid.