Tidlig på 50-tallet kom psykologen Clark Hull med en teori som skulle forklare hvorfor forsterkere øker sannsynligheten for at adferd gjentas. Denne teorien ble kalt drift-reduksjons (drive-reduction) teorien, og var basert på Hulls idé om at all adferd hos mennesker og dyr er basert på drifter. Driftene oppsto når et dyr, eller menneske, ble deprivert for et nødvendig gode. Et tørst dyr blir for eksempel drevet til å skaffe seg vann.
Tekst: Cecilie Køste
For Hull var forsterkeren det som reduserer en eller flere av driftene. Hvis et dyr ikke har fått mat er godbiter en effektiv forsterker fordi det reduserer driften til å skaffe seg mat, eller på godt norsk; reduserer sulten. Hulls teori fungerer greit når det er snakk om forsterkere som mat og vann, men Hulls kritikere påpekte at det ikke alltid var snakk om at forsterkerne tilfredsstilte drifter. Det er for eksempel ikke en kjent fysiologisk drift for penger som blir tilfredsstilt når man får lønn. Hull svarte kritikken ved å påpeke at det finnes to typer forsterkere: primær forsterkere og sekundær forsterkere.
Primære forsterkere reduserer fysiologiske drifter. De enkleste eksemplene er selvsagt mat, vann, søvn, oksygen og sex. Dette er forsterkere som er felles for alle fordi det sikrer individets og artens overlevelse.
Sekundære forsterkere reduserer ikke fysiologiske drifter. I følge Hull er sekundær forsterkere forsterkende fordi de er assosiert med en primær forsterker. Disse forsterkerne er altså ikke felles for alle, men må læres ved å pares med en primærforsterker gjentatte ganger. Denne læringen skjer ved klassisk betinging, og det er derfor sekundære forsterkere ofte kalles for betingede forsterkere (og primære forsterkere for ubetingede). Det aller beste, og mest universale, eksempelet på en sekundær forsterker er penger. Penger er forsterkende fordi det er assosiert med alt det man kan kjøpe for penger, for eksempel mat (primær forsterker) som reduserer sult (drift).
David Premack forklarte i 60-årene adferd og forsterkning på en litt annen måte, uten å blande inn fysiologiske drifter. Han mente at det ikke var noen prinsipiell forskjell mellom forsterkere og responser. Han formulerte et prinsipp om differensiell sannsynlighet som gikk ut på at en lite sannsynlig respons, ville forsterkes av en etterfølgende mulighet for å utføre en mer sannsynlig respons. Det vil si at dersom en hund er sulten vil spising være sannsynlig, mens bjeffing er mindre sannsynlig. Etter Premacks prinsipp om differensiell sannsynlighet vil vi kunne forsterke bjeffing (mindre sannsynlig respons) med mat (dvs. spising, som er en mer sannsynlig respons). Et barns lekselesing kan forsterkes med muligheten til å se på TV (hvis det da ikke er mer sannsynlig at barnet leser lekser enn sannsynligheten for at det ser på TV – men det skjer bare i en ønskeverden). Vanskeligheten med Premacks prinsipp er at sannsynligheten for adferd endres i løpet av døgnet. Om natta er for eksempel mest sannsynlige respons soving, mens det ved middagstid er spising som er mest sannsynlig. Andre aktiviteter kan være svært forsterkende uten at vi utfører responsen kontinuerlig (for eksempel sex) .
Premack svarte på kritikken ved å si at den umiddelbare sannsynligheten var det som la grunnlag for forsterkning, og denne kan manipuleres. Blir organismen deprivert for vann vil drikking være forsterkende fordi drikking da blir sannsynlig, blir hunden deprivert for mat vil spising være mer sannsynlig og godbiter kan brukes som forsterkere. Begrensning i muligheten til å utføre en adferd vil altså ha stor betydning for om adferden kan brukes til å forsterke annen adferd. Begrenses hundens mulighet til å leke med kong, vil konglek fungere forsterkende på mindre sannsynlig adferd (for eksempel å komme på innkalling).
Premacks prinsipp har bidratt til å utvide begrepet forsterker til alt å gjelde alt som virker forsterkende på adferd, i motsetning til Hull som kun snakket om mat, vann, sex osv. og det som var forbundet med dette. På denne måten vil individets foretrukne aktiviteter også blir tatt med i begrepet, og dette åpner for at individet må observeres for at man skal kunne finne ut hva individet liker å gjøre for å finne effektive forsterkere. Liker hunden å leke med kong er det en effektiv forsterker, liker hunden å ha drakamp med fille er det en effektiv forsterker osv. På samme tid er det nødvendig å skille mellom en forsterker som er forsterkende i seg selv og en forsterker som har sin forsterkende egenskap på grunn av sin forbindelse med en annen forsterker. Vi trenger altså begrepene primær (ubetinget) forsterker og sekundær (betinget) forsterker.
For oss som driver med hund er det kanskje lettest å tenke på en primær forsterker som det hunden jobber for. Jobber hunden for mat så er mat hundens primære forsterker. Jobber hunden for å få leke med kongen så er det hundens primære forsterker. Litt upresist kan vi si at den primære forsterkeren er det samme som belønningen.
En sekundær forsterker er det vi lærer hunden at henger sammen med belønningen. Den sekundære forsterkeren kan egentlig være hva som helst du som hundefører kan formidle til hunden, men for å være effektiv bør den sekundære (betingede) forsterkeren svare til visse krav. Den bør være kort, konsis, lett observerbar for hunden, ikke blandet med andre tegn eller ord og ikke brukt i andre sammenhenger. Forslag er et kort ord, for eksempel «BRA!», eller en kort lyd fra fløyte eller klikket fra en klikker.
«En rekke forskere har pekt på nødvendigheten av umiddelbar forsterkning for at en adferd skal opprettholdes» (Horne og Øyen, 1991). Allerede Skinner viste at frekvensen av spaktrykking ble redusert til en brøkdel av tidligere nivå når han utsatte matforsterkeren med seks sekunder (1938). Andre forskere har vist at det samme gjelder dersom forsterkeren ble utsatt med bare to sekunder. Dersom man presenterer en sekundærforsterker umiddelbart etter adferden, vil adferden likevel opprettholdes i frekvens selvom den primære (ubetingede) forsterkeren leveres relativt lang tid etterpå. Med en sekundærforsterker (eller om man vil; betinget forsterker) kan man altså opprettholde den adferden man ønsker uten å tenke på at den «egentlige» (primære) forsterkeren kommer altfor sent. Sekundærforsterkeren bygger på en måte en bro over tidsgapet, og blir gjerne kalt en «bridge» (bro) blandt amerikanske delfintrenere. Ved å bruke en sekundærforsterker kan du altså godt bruke de fem sekundene det tar å ta ballen eller godbiten ut av lomma uten at adferden faller fra hverandre av den grunn.
Sekundærforsterkere læres inn ved klassisk betinging. Det var dette Pavlov holdt på med med hunden sine. Pavlov begynte sine forsøk med å måle mengden spytt hundene produserte, men da han oppdaget at bare synet av ham rommet førte til at hundene produserte spytt skiftet han raskt retning på forskningen sin. Han begynte å starte en metronom før hundene fikk mat, og etter gjentatte repetisjoner begynte hundene å sikle når de hørte lyden av metronomen.
Pavlov kalte maten en ubetinget stimulus fordi den utløste en refleks (spyttproduksjon), og han kalte lyden fra metronomen en betinget stimulus fordi den utløste spyttsekresjon fordi den var paret med en annen stimulus. Spyttsekresjonen som kom etter den betingede stimulusen kalte han en betinget respons. For at en betinget stimulus skal kunne utvikles må en rekke betingelser være oppfylt.
Den ubetingede stimulusen må være sterkere og av større betydning fysiologisk og biologisk enn den betingede stimulusen. Sterke betingede stimuluser kan brukes så lenge den ubetingede stimulusen er sterkere. Pavlov viste blant annet at elektriske støt kan etableres som betinget stimulus. Selvom hunden i begynnelsen av forsøket klynket og prøvde å komme seg vekk fra strømkilden, begynte den etterhvert å sikle når den fikk strømstøt fordi det gjentatte ganger ble presentert mat under strømstøtet.
Hvor fort en betinget stimulus blir etablert er avhengig av hvor ofte den betingede stimulusen følges av en ubetinget stimulus. Når hver betinget stimulus følges av en ubetinget stimulus vil forholdet mellom dem beskrives som p(US/BS) = 1.0. Hvis en ubetinget stimulus følger den betingede stimulusen bare annenhver gang vil forholdet mellom dem beskrives som p(US/BS) = 0.5. Jo lavere dette tallet er, altså jo lavere sannsynligheten for at en betinget stimulus etterfølges av en ubetinget stimulus, jo lengre tid vil det det ta å utvikle en betinget respons. I tillegg vil denne bli desto svakere når den kommer opp på et stabilt nivå. På dette punktet er klassisk betinging forskjellig fra operant betinging der variabel forsterkning er ønskelig.
Læring skjer raskest i de tilfellene der kontingensen mellom en betinget stimulus og en ubetinget stimulus er perfekt. Det vil si i de tilfellene der en ubetinget stimulus alltid følger den ubetingede stimulusen (p(US/BS = 1.0), og den ubetingede stimulusen aldri opptrer dersom ikke den betingede stimulusen opptrer.
Responsen på den betingede stimulusen kan også reduseres i styrke og etterhvert forsvinne når den betingede stimulusen presenteres uten at denne blir fulgt av en ubetinget stimulus.
Pavlov mente at en betinget stimulus bare kunne læres dersom den betingede stimulusen kom før den ubetingede stimulusen i tid, og dersom den betingede stimulusen fremdeles var til stede når den ubetingede stimulusen ble presentert. Dette er en prosedyre som kalles forsinket betinging (Pavlov 1927). Dette betyr at dersom man vil ha en fløytelyd må man presentere lyden før hunden får mat, og fremdeles blåse i fløyta når maten blir servert hunden. Pavlov har ikke fått entydig støtte fra senere forskning på dette punktet.
En annen prosedyre kalles spor-betinging. Denne kjennetegnes ved at den betingede stimulusen avsluttes før den ubetingede stimulusen presenteres. På den måten blir det et lite opphold mellom betinget stimulus og ubetinget stimulus. Pavlov mente at denne metoden ikke var effektiv, men senere forskning har vist at han tok feil på dette punktet.
Dersom en betinget stimulus presenteres alene en eller flere ganger før den blir paret med en ubetinget stimulus oppstår noe som kalles latent inhibisjon1. Dette betyr at det går saktere å etablere en betinget respons enn dersom hunden aldri hadde blitt utsatt for den betingede stimulusen.
Innlæring av en sekundær forsterker
Hva kan vi lære av denne informasjonen når vi skal igang med å lære hunden en sekundær eller betinget forsterker? For det første kan vi bruke spor-betinging. Det gjør altså ingenting at klikket, fløytelyden eller ordet «bra!» er kort og avsluttet før godbiten eller ballen kommer. Man trenger ikke gjøre oppholdet lengre en nødvendig, men et lite opphold har ingen betydning.
Vi skal ikke presentere det vi ønsker å bruke som en sekundær forsterker før vi er klar til å pare den med den primære (ubetingede) forsterkeren. Da vil innlæringen av klikket, fløyta eller ordet «bra!» gå saktere på grunn av latent inhibisjon. (La altså ikke ungene leke med klikkeren!)
Til slutt skal vi ikke variere om den primære (ubetingede) forsterkeren følger den sekundære (betingede) forsterkeren eller ikke. Klikker vi, blåser vi i fløyta eller sier ordet «bra!» skal alltid den primære (ubetingede) forsterkeren følge. Dette gjelder både i innlæringen av den sekundære (betingede) forsterkeren og senere. Er en adferd bra nok til å klikke, er det bra nok til å belønne!
Referanser
Svartdal og Flaten, » Læringspsykologi», Ad Notam Gyldendal 1998
Pryor, «Ikke skyt hunden», Canis Forlag 2002-05-02
Sidman, «Coercion and its fallout» Authers Cooperative Inc. Publishers 1989
Chance. «Learning and behavior», Brooks and Cole Publishing Company 1994