Klikker – Klassisk eller operant?

Hei Morten og Cecilie.

Oversender noe som står på diskusjonssiden for å få avklart. Dere er såpass oppegående på hva er klikker, hvilke funksjoner som blir iverksatt og sysselsatt og hvordan læringsprosessen er. Jeg vrir og vrenger hodet mitt, mye virker logisk og andre ting virker stikk motsatt av tidligere lært. Vennligst svar her eller på diskusjonssiden.

Klassisk og Operant betinging.

Klassisk.
Mange tror at bruken av klikker bygger på operant betinging, dette er feil.

Selve bruken av klikker er ikke operant men klassisk betinging. Klikket betyr ingenting for hunden i begynnelsen, men etter mange gjentagelser hvor mat (eller annen forsterkning) følger etter klikket, skapes en assosiasjon mellom klikk og mat. Et stimuli (klikk) fører til et ammet stimuli (mat) og det er skapt en assosiasjon.

Når hunden først har lært å assosiere klikket med noe behagelig, (klassisk) kan klikkeren brukes til å forsterke en handling som hunden utfører (operant)

Klassisk betinging skaper en assosiasjon mellom to ytre stimuli. ( F.eks. klikk og mat )

Operant.
Mange tror at operant betinging bare dreier seg om positiv forsterkning, dette er feil.

Operant betinging skaper en assosiasjon mellom en handling (som hunden selv utfører) og konsekvensen av denne handlingen.

Det er fem mulige konsekvenser av en handling, disse er:
Noe behagelig starter eller er tilstede = Positiv Forsterkning
Noe kontinuerlig ubehagelig fjernes = Negativ Forsterkning
Noe ubehagelig starter eller er tilstede = Positiv Straff
Noe kontinuerlig behagelig fjernes = Negativ Straff
Handlingen er uproduktiv = Ingen konsekvens

Når vi i NRO sier at vi ofte jobber med operant innlæring mener vi at vi over tid gir hunden et motiv for å nå et mål. Den må selv finne ut hvordan den vil løse oppgaven. Denne måten å jobbe på fører til en bedre og raskere innlæring, selv om forberedelsene tar noe lenger tid enn ved detaljstyrt innlæring.

Det hunden selv kommer på husker den best, derfor må den få tid til å løse oppgaven selv uten at noen står over den med pekefingeren.

Bjarne Isachsen, NRO

Siden han vedkjenner seg sine ord – har jeg lyst til å få din og Cecilie kommentar. Når det blir skrevet sånn er det ikke lett å skille på hva klikker er…..

Svar fra Morten Egtvedt

Ah, her har vi et interessant emne! Jeg synes Bjarne gjør en meget god oppsummering her. Jeg har ikke trent sammen med Bjarne selv (kjenner flere som har gjort det), men han ser ut til å ha en teoretisk forståelse som de fleste instruktører kan misunne han, og i tillegg evnen til å omsette det i praksis, ifølge rapportene.

Bjarne har rett i at selve innlæringen av klikkeren først og fremst bør forklares med klassisk betinging, dvs at et i utgangspunktet nøytralt stimulus (klikkeren) etter gjentatte parringer med en ubetinget stimulus (f.eks. mat) etterhvert utløser en betinget respons/refleks (sikling, økt stressnivå etc). – litt upresist kan man kanskje si at det dannes en assosiasjon (assosiasjon er ikke noe vitenskaplig begrep i denne sammenhengen, men kan brukes for å gjøre ting mer forståelig). Senere kan klikkeren brukes for å forsterke operant adferd mer presist.

MEN vi kan også analysere det slik at klikkeren er en diskriminativ stimulus for å snu seg mot føreren for å få belønningen. Om det er klassisk eller operant betinging kommer helt an på hvilken adferd og hvilke stimuli du ser på akkurat der og da . Når hunden hører klikket vil det forekomme både reflekser (sikling, økt generell aktivitet etc) og operant adferd (snu seg mot eieren). Det blir uansett upresist når man blander inn begrep som assosiasjon. Man må definere helt konkret hvilken adferd og hvilke stimuli man analyserer/observerer for å snakke helt presist.

Jeg er helt enig med Bjarne i at det blir feil å automatisk sette likhetstrekk mellom klikkertrening og operant betinging. All hundetrening vil i praksis bygge på operant betinging uansett hvordan man trener (jmf. Bjarnes definisjoner av operant betinging. Jeg ville i en definisjon lagt mer vekt på at det skjer en observerbar forandring i sannsynligheten i adferden framfor å si at det skjer en «assosiasjon» mellom adferd og konsekvens, men det blir akademisk flisespikkeri i denne sammenhengen).

OPERANT ELLER IKKE?
La oss forlate Bjarnes utmerkede innlegg og gjøre ting enda litt vanskeligere for moro skyld…
1. Se for deg en hund som lærer sitt ved at føreren står passiv og klikker og belønner hunden når den setter seg helt av seg selv.
2. Se så for deg en annen hund som lærer sitt ved at eieren fører en godbit over nesa på hunden (og gir godbiten når den setter seg).

Mange vil si at det kun er hund nr. 1 som lærer ved operant betinging. Det er upresist å si! Begge hundene lærer operant, og begge hundene trenes med bruk av positiv forsterkning. Det som er den prinsippielle forskjellen er GRADEN AV HJELPEBETINGELSER! (hjelpebetingelser kan vi i denne sammenhengen definere som stimuli som er tilstede under innlæringen, som ikke skal behøve å være tilstede når innlæringen er ferdig.) For å kverulere litt har jo også hund nr. 1 en viss grad av hjelpebetingelser – føreren står rett foran hunden og ser på den, hunden kjenner sikkert lukten av godbitene i lomma osv… Dette er alle stimuli (hjelpebetingelser) som etterhvert må bort hvis f.eks. målet vårt er at hunden skal kunne sette seg på kommando sitt mens vi står 50 meter unna med ryggen til og vinden står vekk fra hunden slik at den ikke lukter hva vi har i lomma… Når noen sier at de «trener operant» vil det kanskje være mer presist å si at de trener med minimal bruk av hjelpebetingelser. Og jeg er helt enig i at det er å foretrekke på i mange sammenhenger (men slett ikke alle…?).

TO TYPER ADFERD
Det er ikke bestandig så lett å skille mellom klassisk og operant betinging. I all praktisk hundetrening vil alltid begge læringsprosessene opptre. Det er et greit utgangspunkt at vi først skiller mellom to typer adferd:

1. Operant adferd
2. Reflekser (respondant adferd)

Reflekser er den eneste adferdstypen som er involvert når vi snakker om klassisk betinging. Når vi snakker om operant betinging er det operant adferd som er involvert.

Reflekser har et 1:1-forhold til miljøet. En spesifikk stimulus (mat i munnen) utløser en spesifikk refleks (sikling) enten dyret vil eller ikke. Det eneste som læres ved klassisk betinging er at også andre i utgangspunktet nøytrale stimuli etterhvert kan utløse de samme refleksene. Vi kan oppsummere skjematisk på denne måten.

1. Ubetinget stimulus (mat i munnen) = ubetinget respons (sikling)
2. Nøytralt stimulus (syn av matskål) + ubetinget stimulus (mat i munnen) = ubetinget respons (sikling)
(punkt 2 gjentas noen ganger…)
3. Betinget stimulus (syn av matskål) = betinget respons (sikling)

Operant betinging kan på sin side oppsummeres skjematisk på denne måten:
Diskriminativ stimulus – adferd – konsekvens = økt sannsynlighet for adferd eller redusert sannsynlighet for adferd i lignende situasjoner.

En diskriminativ stimulus gir på en måte beskjed til dyret om at i denne situasjonen fører en bestemt adferd til en bestemt konsekvens (f.eks. vil kommandoen sitt mens fører står en meter foran hunden informere dyret om at den nå har sjansen til å få godbiten sin (konsekvens) hvis den setter seg (adferd). Diskriminative stimuli (situasjonen) øker eller senker sannsynligheten for at bestemte adferder skal opptre, men forholdet er på langt nær like fast som med ubetingede stimuli og reflekser. Når vi snakker om operante adferder sier vi heller ikke at de er utløst slik som reflekser – vi sier heller at de er utført. Det er konsekvensen som opprettholder adferden. (Reflekser trenger på sin side ingen konsekvenser for å bli opprettholdt – naturen har allerede ordnet det slik at spesifikke stimuli utløser refleksene hver gang.)

INNLÆRING AV KOMMANDOER
Mange mener at innlæring av kommandoer er klassisk betinging. Vel, lyden av kommandoen SITT utløser helt sikkert noen reflekser (f.eks. sikling, frykt, økt generell aktivitet osv. avhengig av hvordan innlæringen har foregått), men selve adferden sitt som kommanderes, er operant. Kommandoen er en diskriminativ stimulus, ikke en betinget stimulus. Adferden sitt er ikke en refleks, men en operant adferd som opprettholdes av konsekvensen som kan være en godbit (positiv forsterkning) eller at noe ubehagelig avsluttes (negativ forsterkning).

(FORSØK PÅ) OPPSUMMERING
Ålreit, nå har jeg sikkert beveget meg langt vekk fra spørsmålet og kanskje skapt enda mer forvirring, men det øker forhåpentligvis lysten til å lære mer om adferd & læring. I vår bok Klikkertrening for din hund tar vi for oss bare toppen av isfjellet, og det er heldigvis mer enn nok for å trene de fleste hundene du kommer over i løpet av livet. Hvis man virkelig har lyst til å gå i dybden finnes det nok til å drukne seg opptil flere ganger (se litteraturliste bakerst i boka til å begynne med).

For å oppsummere litt hva som var utgangspunktet: Hva er en klikker?

Det viktigste er å skille mellom bruk av klikker og klikkertrening. Det som kjennetegner klikkertrening er

1) Hovedsaklig bruk av positiv forsterkning (og negativ straff)
2) Systematisk bruk av en betinget forsterker (f.eks. klikkeren)
3) Minimal bruk av hjelpebetingelser/påvirkning, hunden skal hele tiden delta frivillig

Det er med hensyn til disse tre punktene man først og fremst må diskutere forskjeller i hundetrening. Hvilke konsekvenser bruker du (jobber hunden din for å oppnå noe den har lyst på eller for å unngå noe ubehagelig)? Bruker du en betinget forsterker systematisk eller mer tilfeldig? Hvor stor grad av hjelp bruker du under innlæringen?

Deretter er treningens effektivitet et spørsmål om
1) Hvor effektiv er forsterkeren?
2) Hvor flink er du til å forsterke presist (riktig adferd)?
3) Hvor flink er du til å øke kravene (kriteriet for tildeling av forsterker) skritt for skritt?

Morten Egtvedt
…som forøvrig er aktiv i Norske Redningshunder (NRH) 😉