Baklengskjeding viser seg ofte å være et vanskelig tema, selv for folk som har jobbet med klikkertrening en stund. Det er egentlig ikke så rart. Konseptet er avansert i teorien, og innebærer mange utfordringer i praksis også. Så hvorfor maser jeg da alltid om at «alt som kan baklengskjedes bør baklengskjedes»…?
Tekst: Morten Egtvedt
Svaret er rett og slett at baklengskjeding innebærer flere store fordeler når du begynner å få dreisen på det:
- Øvelser som er («ferdig») baklengskjedet er mer stabile og pålitelige.
- Øvelser som er baklengskjedet krever mindre vedlikeholdstrening (”reparasjonstrening”).
- Øvelser som er baklengskjedet gir ofte raskere reaksjon på kommandoene i kjeden ettersom hunden alltid «vet» hva det neste leddet i kjeden er.
- Baklengskjeding gjør innlæringsprosessen enklere for hunden (og føreren – ihvertfall så snart denne har fått draget på kjedingen).
Ofte hører jeg folk si at det er samme om man baklengskjeder eller forlengskjeder. Dette er ikke riktig. Det er forsåvidt riktig at begge deler kan gi deg en tilsynelatende ferdig øvelse, men «det samme» er det på ingen som helst måte. Jeg skal i denne artikkelen prøve å gi en læringsteoretisk begrunnelse for hvorfor baklengskjeding er mer effektivt.
Forsterkningsteorier
Hvordan virker egentlig forsterkning? Hva er det som gjør at «noe» øker sannsynligheten for adferder når dette «noe» kommer rett etter en adferd? Flere forskere har gjort forsøk på å forklare dette.
Clark Hulls drift-reduksjons teori er kanskje den mest kjente. Denne teorien er basert på at all adferd hos dyr (og mennesker) er basert på drifter (Chance, 1994). Drifter oppstår når et dyr blir deprivert for fysiologiske behov. Drift-reduksjonsteorien sier at enkelte stimuli (f.eks. mat) virker forsterkende på adferd fordi det reduserer en drift (f.eks. sult).
Hull skilte mellom primære og sekundærer forsterkere. Primære forsterkere (mat, vann, søvn, oksygen, sex osv). reduserer fysiologiske drifter Sekundære forsterkere reduserer ikke fysiologiske drifter, men virker forsterkende fordi de er assosiert med primære forsterkere.
Idag regnes imidlertid drifts-teorien som avleggs. Det er i flere forsøk vist at det finnes stimuli som er forsterkende selv om de verken reduserer en drift eller er parret med en primær forsterker (Siqueland & Delucia, 1969). I tillegg er det umulig å observere drifter – drifter er kun en teoretisk konstruksjon (på linje med ”motivasjon” og andre abstrakte begreper), og dette er også en svakhet med teorien.
Selv om dagens forskere foretrekker andre forklaringsmodeller, er begrepet «sekundær/betinget» forsterker fortsatt en viktig del av læringsteorien, og dette er kanskje Hulls viktigste bidrag.
Premacks prinsipp
En annen forsterkningsteori er imidlertid atskillig mer interessant, spesielt når vi snakker om baklengskjeding. David Premack forklarte i 60-årene forsterkning på en måte som ikke blandet inn fysiologiske drifter (Chance, 1994). Tradisjonelt vil de fleste hundetrenere se på «mat» eller «en tennisball» som en forsterker. Premack argumenterte imidlertid for at det er selve adferden «å spise» eller «å springe etter tennisballen» som er forsterkeren (eller eventuelt «muligheten» til å spise eller løpe etter tennisballen).
Men hva er det som bestemmer at noen bestemte adferder kan forsterke andre adferder? Premacks prinsipp sier at «mer sannsynlige adferder kan forsterke mindre sannsynlige adferder”.
Det vil si at hvis «å spise godbiter» er mer sannsynlig enn «å gå fri ved foten», kan dette brukes som forsterker (ihvertfall så lenge det ikke er andre adferder som er enda mer sannsynlige i denne situasjonen – f.eks. å springe etter andre hunder).
Det snakkes ofte om «preferansehierakier» i denne sammenhengen. For en hund (og for mennesker) vil det i en aktuell situasjon alltid være noen adferder som har høyere preferanse (sannsynlighet) enn andre. Og adferder som ligger høyere i preferansehierakiet kan dermed forsterke alle adferder som ligger under seg i hierarkiet. Mange hundeeiere er kjent med at å utføre en sirkuskunst eller en annen morsom favorittadferd (f.eks. apportering), kan fungere som forsterker for andre lydighetsøvelser. Dette samme prinsippet ligger til grunn for all forsterkning. Godbiter fungerer generelt bra som forsterker fordi «å spise» er mer sannsynlig enn de fleste andre adferder i mange situasjoner.
Preferansehierakier er ikke statiske. Hvilke adferder som er mest sannsynlige i et bestemt øyeblikk kan skifte flere ganger om dagen. Rekkefølgen på adferdene i preferansehierarkiet skifter avhengig av omgivelsene, om hunden f.eks. er sulten eller mett eller tørst osv. I tillegg kan vi forandre sannsynligheten på adferder ved hjelp av treningen vår. Mer om dette litt senere.
Hvorfor baklengskjeding?
Premacks prinsipp forklarer det som var utgangspunktet for denne artikkelen – hvorfor baklengskjeding er mer effektivt.
Det som kjennetegner en stabil adferdskjede er at den første adferden blir forsterket av den andre, den andre adferden av den tredje, den tredje av den fjerde osv. Selv om «primærforsterkeren» (f.eks. å spise godbit eller løpe etter en tennisball) kun kommer etter den siste adferden i kjeden, vil alle adferder i kjeden bli forsterket, og dermed opprettholdt effektivt. Det er dette som gjør kjeden stabil – for at en adferd skal være stabil må den forsterkes!
For at kjeden skal være stabil må dermed de siste adferdene i kjeden alltid ha høyere sannsynlighet (ligge høyere i preferansehierakiet) enn de foregående. Hvis derimot den første adferden i en kjede er mer sannsynlig enn den andre, vil adferden ikke være stabil. Hunden vil da utføre den første adferden i kjeden, men denne vil ikke bli forsterket ettersom den andre adferden er mindre sannsynlig. Når adferder i kjeden blir utsatt for ekstinksjon (ikke forsterket) vil kjeden etter ganske kort tid «falle fra hverandre».
Tenk deg f.eks. at du trener stå under marsj. Du har jobbet masse med første halvdel av øvelsen (fri ved fot + stå) ettersom dette er den vanskeligste delen av øvelsen. Siste halvdel av øvelsen (bli stående mens du går 10 m fra hunden og deretter tilbake) har du til sammenligning trent relativt lite på. Dette medfører at første halvdel av øvelsen er atskillig mer sannsynlig enn den siste halvdelen, ettersom du har forsterket den så mange flere ganger.
Hvis du nå bestemmer deg for å sette sammen hele øvelsen, kan du etter noen repetisjoner oppleve at hunden blir dårligere til å stanse på stå-kommandoen. Grunnen er rett og slett at å bli stående mens du fortsetter videre i 10 m og deretter kommer tilbake ikke er forsterkende (ettersom denne adferden er mindre sannsynlig). Selv om hunden de første gangene stanser fint og gjennomfører hele øvelsen likevel, er å stå på kommando nå under ekstinksjon (adferden blir ikke lenger forsterket); Hunden stanser på kommando og forventer å få belønningen med en gang, men må i stedet bli stående igjen mens du går ifra den. Skuffelser er sjelden forsterkende… Det er dermed kun et tidsspørsmål før hunden slutter å stanse like raskt som før.
Det de fleste hundeeiere da gjør er å «ta fra hverandre øvelsen» og belønne med en gang hunden stanser på stå-kommandoen igjen. Når hunden igjen stanser raskt kan de prøve hele øvelsen igjen – men de kan fortsatt ikke kjøre hele øvelsen mer enn noen få ganger før de må kjøre mer «reparasjonstrening» nok en gang. På denne måten kan de få øvelsen til å fungere perfekt på konkurranser (der øvelsen kun skal kjøres en gang), men de vil aldri egentlig få en stabil øvelse. De er dømt til evig reparasjonstrening.
Den beste måten å komme seg ut av denne reparasjonssirkelen på, er å baklengskjede øvelsen. Hvis man sørger for at siste halvdel av øvelsen er mer sannsynlig enn den første vil det at hunden stanser på stå-kommandoen faktisk bli forsterket av at hundefører fortsetter 10 meter og deretter kommer tilbake (ettersom hunden ”vet” sikkert at dette fører til belønning).
Hvordan gjøre adferder mer sannsynlige?
OK, hemmeligheten til å få en stabil kjede er altså at de siste adferdene i kjeden må være mer sannsynlige (ligge høyere i preferansehierarkiet) enn de foregående. Men hvordan gjør vi en bestemt adferd mer sannsynlig enn andre adferder? Jo, følgende adferder vil normalt være svært sannsynlige:
- 1. Adferder som totalt sett er forsterket svært mange ganger i løpet av hundens liv.
- 2. Adferder som ofte er forsterket meget bra (høy kvalitet på forsterkningen).
- 3. Adferder som nylig har blitt forsterket. En adferd som du nettopp har forsterket flere ganger etter hverandre vil nesten alltid være mer sannsynlig enn andre mulige adferder (selv om de andre adferdene totalt sett har blitt forsterket flere ganger i hundens liv).
Punkt tre er noe som alle klikkertrenere kjenner til. Hunder blir veldig fort «repetisjonskloke» – det vil si at de gjentar den adferden som vi nettopp har forsterket. Hvis du har forsterket en adferd 3-4 ganger på rad, skal det veldig mye til at hunden plutselig velger en annen adferd den femte gangen.
Og det er nettopp dette prinsippet vi benytter når vi baklengskjeder i praksis: Vi sørger for at den siste adferden i kjeden nylig er blitt forsterket flere ganger slik at denne dermed er veldig sannsynlig – mer sannsynlig enn de foregående adferdene i kjeden.
- Vi gjentar først den siste adferden i kjeden 3-6 ganger eller mer om nødvendig, og belønner denne.
- Deretter setter vi på den neste siste adferden – går rett videre til den siste adferden og belønner til slutt.
- Deretter kjører vi det tredje siste leddet, går rett videre til det neste siste og deretter det siste før vi belønner.
- Osv
Når vi baklengskjeder på denne måten vil adferdene i kjeden alltid ligge i en stigende rekkefølge i preferansehierakiet. Den siste adferden vil nylig være gjentatt flere ganger enn den nest siste adferden. Den nest siste adferden vil nylig være gjentatt flere ganger enn den tredje siste osv. Når alle adferdene i kjeden etterfølges av mer sannsynlige adferder vil alle adferder i kjeden bli effektivt forsterket, og det er dette som gjør kjeden stabil.
Når du trener kompliserte og/eller energikrevende kjeder anbefaler jeg også å forsterke kvalitativt bra (punkt 2) for å være sikker på at kjeden opprettholdes.
«Latmannskjeding»
I noen tilfeller (spesielt i korte og ukompliserte kjeder) kan du få en rimelig stabil kjede også uten å baklengskjede. Hvis den siste adferden i kjeden er veldig sannsynlig fordi du har forsterket den svært mange ganger (eller svært godt) sammenlignet med de første adferdene i kjeden, vil du få en «baklengskjedingseffekt» selv om du forlengskjeder. Dette kan du utnytte ved å alltid passe på at siste ledd i en kjede er trent veldig godt. I slike tilfeller kan man slippe unna med forlengskjeding.
Men i lange kjeder vil du som regel alltid få svi for manglende baklengskjeding.
Hvordan sette sammen hele øvelser?
Det er grovt sett bare to måter å sette sammen flere adferder til en kjede eller ferdig øvelse: Enten forlengskjeder du, eller så baklengskjeder du. Når du baklengskjeder repeterer du først siste ledd noen ganger, deretter legger du til nest siste ledd osv. Hvis du gjør det på en annen måte, forlengskjeder du nødvendigvis. Jeg skal her gjennomgå noen prinsippielt forskjellige måter å trene på når man skal sette sammen hele øvelser.
Gruppe 1 – tren delmomenter hver for seg, sett sammen av og til – reparer med jevne mellomrom
Lydighetsutøvere har tradisjonelt ikke brydd seg spesielt mye om å baklengskjede når de setter sammen øvelsene. Det vanligste er å trene delmomentene grundig hver for seg, og til slutt sette sammen øvelsen uten noe fast system (i praksis vil dette bety at de forlengskjeder). Forlengskjeding innebærer i de aller fleste tilfeller at kjeden ikke blir stabil fordi de første adferdene i kjeden ikke blir forsterket. Øvelsen kan likevel fungere noen ganger ettersom adferdene i kjeden tidligere er forsterket mange ganger hver for seg, og det tar derfor noen repetisjoner uten forsterkning før de begynner å bli dårligere. Men det er som regel kun et tidsspørsmål før man må ta fra hverandre øvelsen og forsterke de enkelte delene igjen.
Gruppe 2 – baklengskjed noe helt, andre ting delvis
Noen hundetrenere begynner etterhvert å bruke baklengskjeding mer og mer. Noen øvelser baklengskjedes 100% (apportering er f.eks. en øvelse der det har blitt «standard» å baklengskjede). Andre øvelser baklengskjedes delvis, men man tar fortsatt fra hverandre øvelsen relativt ofte, og er ikke nødvendigvis så nøye med å baklengskjede når man setter sammen øvelsen igjen. Hundeeiere i denne gruppen som får sving på kjedingen beveger seg ofte i retning gruppe 3 etterhvert som de blir flinkere.
I denne gruppen finner man også de som ”kvasikjeder”. Det vil si at de ikke baklengskjeder systematisk, men de sørger ihvertfall for at det siste leddet i kjeden er trent svært godt slik at det har rimelig høy sannsynlighet selv om man forlengskjeder av og til.
Gruppe 3 – baklengskjed alt som kan baklengskjedes!
Den siste gruppen (som jeg selv tilhører) har som målsetning å baklengskjede alle øvelser som kan baklengskjedes. Vellykket baklengskjeding krever fortsatt at man er meget nøye med å lære inn de enkelte delene av øvelsen hver for seg og ikke minst generaliserer adferdene godt FØR man kjeder.
Når man er er ferdig med å baklengskjede en øvelse kan man kjøre hele øvelsen gjentatte ganger uten at utførelsen blir dårligere. Spesielt kortere kjeder trenger man ofte ikke å ta fra hverandre igjen så lenge hunden lever. Lange kjeder kan det imidlertid fortsatt være en fordel å ta fra hverandre av og til. Forsterkningsfrekvensen kan bli for lav hvis man alltid kun kjører hele øvelser, og derfor trener jeg ofte delmomenter eller eventuelt halvparter av øvelsene selv om de egentlig er «ferdigkjedet».
En viktig forskjell fra gruppe 2 er imidlertid at når jeg setter sammen øvelsen igjen etter å ha tatt den fra hverandre baklengskjeder jeg alltid på nytt. Jeg forsikrer meg dermed alltid om at de siste delene av kjeden er mer sannsynlige (ligger høyere i preferansehierakiet) enn de foregående adferdene i kjeden slik at alle adferder i kjeden – ikke bare den siste – blir effektivt forsterket.
En annen fordel med å baklengskjede er at det blir lettere for hunden å gjøre riktig. Etter første adferd trenger ikke hunden å lure på om den får belønning med en gang, eller om den skal gå videre til neste ledd. Den er alltid forberedt, og reagerer dermed som regel hurtigere på neste kommando.
Baklengskjeding er imidlertid ingen enkel vei til målet. Man møter en rekke utfordringer i kjedeprosessen. Hunden vil etterhvert f.eks. gjerne prøve å teste om den kan hoppe over ledd i kjeden, tyvstarte på kommandoer som den ”vet” kommer osv. I tillegg blir svakheter i delmomentstreningen alltid brutalt avslørt når man begynner å kjede. Det er viktig at alle adferder som skal inngå i kjeden er flytende, og at du har god stimuluskontroll der det trengs FØR du begynner å kjede.
Men når du har jobbet deg gjennom kjedingen og står der med en ferdig baklengskjedet øvelse – da er det verd strevet.
Oppsummering
Premacks prinsipp forklarer hvorfor øvelser/adferdskjeder som er baklengskjedet er mer stabile enn øvelser som er forlengskjedet. I øvelser som er baklengskjedet blir hvert ledd i kjeden effektivt forsterket av neste ledd, selv om belønningen kun kommer etter siste adferd. I forlengskjedede øvelser blir som regel kun den siste adferden effektivt forsterket, ettersom de første adferdene som regel er mer sannsynlige enn de siste.
Boka ”Lydighetstrening i teori og praksis” er den første hundeboka som beskriver hvordan man kan bruke baklengskjeding gjennomført i lydighetstrening. Hvis du ønsker å lære mer om denne måten å trene på finner du grundige treningsbeskrivelser der.
Referanser
Chance, ”Learning and behavior”, 1994
Køste/Egtvedt, ”Lydighetstrening i teori og praksis”, 2005