Klassisk betinging & operant betinging

Klassisk betinging & operant betinging

Klassisk betinging er navnet på et fenomen Pavlov studerte på begynnelsen av 1900-tallet. Han skulle egentlig studere hunders fordøyelsessystem, som begynner med at det utskilles spytt i munnen. Men han ble etterhvert fascinert av at hundene begynte å sikle med én gang han kom inn i rommet og før de hadde fått mat i munnen. Så han begynte å studere dette fenomenet i stedet. 


Tekst: Cecilie Køste


Pavlov lot en metronom lage lyd og ga hundene mat mens metronomen tikket. Dette gjorde han mange ganger. Så satte han metronomen igang uten å gi hundene mat. Da fant han ut at de siklet likevel. Pavlov hadde altså fått hundene til å sikle når de hørte at metronomen tikket i vei. Han gjorde det samme med bl.a. en bjelle, lys og strømstøt. Selv når hundene fikk strømstøt begynte de å sikle.

På vitenskapelig språk kalles maten for en ubetinget stimulus fordi den alltid og alene utløser en refleks (1), i dette tilfellet hundenes sikling. Vi kan si at maten er en «ulært» (ubetinget) stimulus. Du trenger ikke å lære å sikle når du får mat i munnen- det bare skjer. Lyden fra metronomen er derimot en betinget stimulus. Det er fremdeles en refleks som utløses, sikling, men nå utløses siklingen av en stimulus hunden har «lært».

Hvis vi tar lukking av øyet som eksempel vil luft som blåses mot øyet føre til at øyet lukker seg av refleks. Lufta som blåses mot øyet er en ubetinget stimulus fordi den alltid og alene utløser refleksen (blunke). Tenk deg så at vi parer luftblåsingen med at individet ser et grønt lys flere ganger. Til slutt vil det grønne lyset utløse blunkingen selv om det ikke blir blåst luft mot øyet.

Når vi snakker om klassisk betinging er det bare snakk om stimuli og reflekser samt følelser. Vi har en ubetinget stimulus og den utløser en refleks hos individet. Så kan vi lage en betinget stimulus ved å pare den betingede stimulusen med den ubetingede stimulusen gjentatte ganger. Da vil også den betingede stimulusen utløse samme refleks. Når vi snakker om klassisk betinging er det altså reflekser vi snakker om.

Det finnes fem forskjellige reflekstyper (1). Disse er;

1. adaptive reflekser (AR) som knerefleksen, saliveringsrefleksen (sikling) eller øyeblinkrefleksen.

2. orienteringsrefleksen (OR) som består i at man orienterer mot det som utløste refleksen, hjertefrekvensen reduseres og svetteutskillelsen i huden øker.

3. forsvarsrefleksen (DR (defense reflex)) som er forbundet med kamp- eller fluktreaksjoner og forbereder kroppen på akkurat kamp eller flukt.

4. Støkkerefleksen (startle) som du ser dersom du spretter fram og skremmer noen.

5. Faste adferdsmønstre (FAM evt FAP (fixed action patterns)) som er mer kompleks adferd hos dyr, men som likevel er bl.a. stereotype, uavhengig av erfaring og ikke kan stanses midt i forløpet. Eksempler er edderkoppens nettspinning, enders adferd når et egg faller ut av reiret og gjøkens måte å tvinge avkommet sitt over på andre.

Alle disse refleksene kjennetegnes ved at de er utløst av en stimulus og ikke «bevisst» eller viljebestemt utført av individet. Reflekser er en automatisk, ufrivillig og stereotyp respons utløst av en sensorisk stimulus (5). Du kan f.eks. ikke bestemme deg for å ikke sikle når du får mat i munnen. En refleks er rett og slett utenfor din kontroll. Har du kontroll er det ikke en refleks. Grunnen til at du ikke har kontroll er at nervesignalene fra den sensoriske stimulusen aldri når hjernen din. Signalene går bare til ryggraden eller til hjernestammen, og derfra til musklene eller organene som responderer (5).

I tillegg må man, hvis man skal kunne karakterisere noe som en refleks, vite at nesten alle individer innen en art viser samme adferd på akkurat samme stimulus. Alle hunder sikler når de får mat de liker i munnen, og alle friske mennesker sparker ut med leggen når legen slår dem på kneet.

For å kunne kalle noe en refleks må vi også vite helt sikkert at adferden ikke er lært. Det kan se ut som om naturen har «bestemt» at noen ferdigheter er for viktige til å ta sjansen på at dyret skal lære det på egen hånd. Først når adferden er medfødt, gjelder for alle innen arten, utløses av en sensorisk stimulus og ikke kan endres av erfaring eller styres av individet selv, kan vi kalle adferden for en refleks (4). Og først når vi har med en refleks å gjøre er det snakk om klassisk betinging.

Operant betinging

Operant betinging beskriver all læring som IKKE handler om reflekser, men det man kan kalle «viljestyrt» eller «målrettet» adferd (Obs: «Fri vilje» eksisterer egentlig ikke, men brukes her for å gjøre det enklere å forstå forskjellen fra refleksresponser). Vi kan gjerne si at individet opererer på miljøet, derav ordet operant.

Når vi snakker om operant betinging, eller operant innlæring, snakker vi om adferd som styres av de konsekvensene (utfall) adferden får (1). Hvis vi skal lære hunden å sitte gir vi den en godbit når den setter seg. Da vil hunden sette seg igjen for å se om den får noe godt. Hundens adferd er «målrettet». Den setter seg for å få godbiten.

Forskjellen på klassisk betinging og operant betinging

Ting blir kanske litt klarere når man sammenligner klassisk og operant betinging. Ofte blir det framstilt som om skillet mellom klassisk og operant betinging er at klassisk betinging er en slags «passiv» læringsform mens operant betinging er en «aktiv» læringsform. Dette er unøyaktig. Klassisk betinging har med reflekser å gjøre. Operant betinging dreier det seg om målrettet adferd (gjør noe for å oppnå et eller annet).

Man kan også si at forskjellen er at responsen ved klassisk betinging UTLØSES av bestemte stimuli. Når man snakker om operant adferd er denne UTFØRT (2) (individet har som sagt et mål med det den gjør og adferden formes av den konsekvensen adferden har).

Ved klassisk betinging er konsekvensen av refleksen uten betydning for om refleksen gjentas neste gang. Refleksen vil alltid utløses uansett hva den fører til (påvirkes ikke av straff eller belønning). Ved operant betinging er det bare konsekvensen av adferden som styrer om adferden vil gjentas eller ikke.

La oss ta noen praktiske eksempler på dette. Du er hos legen og hun skal sjekke knerefleksen din. Hun slår til kneet ditt og leggen spretter ut uten at du har bedt den om det – det er en refleks og du har derfor ikke kontroll over foten din. Dessverre er legen helt nyutdannet og hun har ikke passet på at det ikke står noe i veien. Du smeller derfor leggen din rett opp i undersøkelsesbenken. Det gjør skikkelig vondt! Legen blir litt flau, og må gjøre undersøkelsen én gang til. Selv om du fikk vondt i leggen vil faktisk leggen din sprette ut igjen når hun slår. Selv om du erfarte smerte ved å sparke ut, vil refleksen utløses likevel. Og til og med hvis du igjen sparker leggen hardt i benken, vil refleksen utløses når legen slår deg på kneet atter en gang. Dette vil også skje fjerde, femte og sjette gang (hvis du ikke har gått hjem før den tid…)

Du er også med i et forsøk der du har lært å sikle hver gang du ser et rødt lys. Sitron ble brukt som ubetinget stimulus fordi du alltid produserer spytt når du får en sitronbåt i munnen. Det røde lyset ble paret med sitronen mange ganger, til du siklet masse når det røde lyset ble slått på. Så kommer en mann inn og sier at du får 2 millioner hvis du ikke sikler når lyset kommer på. Tror du at du blir millionær? Dessverre. Spyttprodukssjonen er en refleks du ikke kan styre. Så det er bare å gå hjem, finne fram Lotto-kupongen og krysse fingrene…

Reflekser er livsviktige og automatiske mekanismer som sikrer likevekt for kroppen din, og ligger utenfor din vilje eller evne til å velge. Refleksene vil altså ikke styres av de konsekvensene adferden får, og endres ikke enten du belønner eller straffer dem. Det eneste man kan endre er hvilke stimuli som utløser reflekser – man kan ikke endre refleksen selv.

Operant adferd styres imidlertid ikke av en ubetinget stimulus eller betinget stimulus slik refleksiv adferd gjør, men operant adferd kan også styres (2). Hvis vi skal lære hunden å sitte kan vi gjøre det ved å gi hunden en godbit når den setter seg. Hunden vil da sette seg for å få godbiten. Vi gir hunden en godbit hver gang den setter seg raskt, og vi sier «sitt» samtidig som den setter seg eller vi påvirker den til å sette seg. Etter en stund sier vi: «Sitt» først, og når hunden setter baken i bakken belønner vi den med f.eks. en godbit.

Dette er et eksempel på operant betinging. Når vi kommer med et kommandoord må hunden utføre en adferd for å få belønningen. Hunden UTFØRER en adferd, å sette seg, for å få godbiten. Denne adferden utløses ikke av kommandoen som en refleks, men er «målrettet» og viljestyrt. Hunden sitter når du sier det fordi den da får belønningen.Vi har nå adferden «sitt» på kommando, så hver gang vi sier: «Sitt» setter hunden seg fint.

Kommandoen «sitt» kalles på vitenskapelig språk for en diskriminativ stimulus. Dette er er en stimulus som signaliserer at en bestemt adferd vil ha en bestemt konsekvens (1). La oss ta telefonen som eksempel. Telefonen ringer. Dette er en diskriminativ stimulus for adferden «å ta telefonen». Konsekvensen av at du tar telefonen er at du får snakke med noen i den andre enden, men dette skjer bare når telefonen faktisk ringer. Hvis du tar telefonen når den ikke ringer er det aldri noen som sier: «Hei», i den andre enden.

Kommandoene våre fungerer på samme måte. Når hunden hører ordet «sitt» signaliserer det til hunden at adferden å sette seg vil ha en bestemt konsekvens (kanskje den får en godbit). Men når vi ikke sier «sitt» vil ikke det å sette seg føre til noe spesielt.

Mange tror at det er snakk om klassisk betinging når vi lærer hunden vår en kommando. Dette er feil av to grunner: Sitt-kommandoen er IKKE en betinget stimulus, og sitt-adferden er IKKE en refleks (hunden kan velge om den vil sitte eller ikke). Når vi snakker om kommandoer og øvelser vi lærer hundene våre er det bestandig snakk om operant betinging der kommandoene er diskriminative stimuli og adferdene er OPERANTE adferder, ikke enkle reflekser.

Det er stor forskjell mellom ubetingede og betingede stimuli og en diskriminativ stimulus. En ubetinget stimulus utløser alltid og alene en refleks. Etter betinging vil en betinget stimulus også utløse samme refleks – hver gang – uansett konsekvens (utfall). Men en diskriminativ stimulus utløser ikke reflekser slik ubetingede og betingede stimuli gjør i klassisk betinging (1). En diskriminativ stimulus signaliserer at «hvis du utfører adferden vil det føre til en bestemt konsekvens». Individet har altså et valg. Når telefonen ringer kan man la den ringe eller man kan løfte av røret. Løfter man av røret er konsekvensen av denne adferden at man får prate med noen (om det er forsterkende eller ikke kommer an på personen i den andre enden…)

Når man sier «sitt» til hunden har den også to muligheter. 1) den kan sette seg eller 2) den kan la være å sette seg. Hunden har et valg siden det å sette seg ikke er en refleks. Ordet «sitt» er en diskriminativ stimulus som kan signalisere at hvis hunden setter seg kan den bli belønnet ( eller kan signalisere at hvis hunden ikke setter seg blir den presset ned i sitt eller rykket i øret.)

Hvis kommandoene våre var betingede stimuli som i klassisk betinging ville de utløst en adferd hver eneste gang, i alle situasjoner og uten at vi belønnet hunden for å utføre adferden. Tar vi innkalling som eksempel vet vi alle at innkallingsordet vårt ikke alltid, i alle situasjoner, fører til at hunden kommer øyeblikkelig…i alle fall ikke hvis vi aldri belønner hunden for å komme.

Kommandoen «sitt» er altså en diskriminativ stimulus, og fram til nå har signalisert at hunden kan få en godbit når den setter seg. Så sier vi: «Sitt», men i stedet for å få en godbit får hunden et skikkelig strømstøt i baken. Dette gjentas flere ganger. Hver gang hunden setter seg knaller vi til med et skikkelig strømstøt. Hvor sannsynlig er det at hunden setter seg neste gang du sier: «Sitt»? Ikke spesielt sannsynlig, så lenge hunden ikke er av den machosistiske typen.

Her har vi en veldig god test på om det er snakk om klassisk eller operant betinging. En klassisk betinget adferd vil utløses til tross for konsekvensene adferden har. En operant betinget adferd vil endres av konsekvensene adferden har. Leggen ditt spretter fortsatt opp selv om det gjorde vanvittig vondt å sparke den i benken – du har ingen kontroll på det som skjer. Hunden derimot slutter å sette seg når du sier «sitt» hvis den får et heftig strømstøt i baken hver gang den setter seg. Når du sier «sitt» vil altså ingen refleks utløses, men hunden kan velge å sette seg eller velge å la være – å sitte er viljestyrt. Man kan si at den diskriminative stimulusen ikke UTLØSER adferd – men den øker sannsynligheten for at hunden UTFØRER adferden å sette seg (3).

Mange trekker fram det å springe til døra når det ringer på som et eksempel på klassisk betinging. Hvis dette var et utslag av klassisk betinging ville altså «å springe til døra» være en refleks. For at det skal kunne være en refleks må den være genetisk, altså ikke lært, den vil ikke styres av konsekvensene adferden får og det må eksistere en ubetinget (ulært) stimulus som alltid uløser refleksen. Men «å springe til døra» er ikke genetisk, hunder slutter å springe til døra dersom det aldri er noen der når det ringer på og det finnes ingen ubetinget stimulus som får hunder til å springe til døra hvis det ikke ringer på.

«Å springe til døra» er en operant adferd og denne adferden er avhengig av adferdens konsekvens. Dørklokka er en diskriminativ stimulus som etterhvert forteller noe sånt som «hvis du springer til døra nå vil du møte mennesker der.» Siden «å springe til døra» er en viljestyrt adferd kan faktisk hunder velge å ikke springe til døra når det ringer på. Det skjer ikke så ofte her i huset i alle fall, men hvis det er utsikter til mat på kjøkkenet forlater de ikke det rommet frivillig – selv ikke for å møte mennesker.

Men den klassiske betingingen var ikke død…

Derimot kan de fleste hunder etterhvert vise økt aktivitet eller stress når det ringer på. Dette er følelser og reflekser som utløses av ringeklokka, og de kan ikke styres av hundene. Her er det snakk om klassisk betinging. Ringeklokka UTLØSER en del «ikke-viljestyrte» følelser og reflekser, men det å faktisk reise seg og løpe til døra er viljestyrt og UTFØRES av hundene fordi de da møter mennesker utenfor døra eller i gangen.

Oppsummering

Klassisk betinging handler om reflekser. Disse refleksene utløses og kan ikke styres av individet. Refleksene er like for alle innen samme art, og kan ikke forandres. De påvirkes ikke av konsekvensene adferden får.

Operant betinging handler om læring av adferd som er «målrettet» og viljestyrt, der individet gjør noe for å oppnå et eller annet (f.eks. setter seg for å få en godbit). Operant adferd styres av konsekvensene adferden får der vi ser mer av adferd som forsterkes og mindre av adferd som straffes.