Læring, straff og belønning

18.04.2017 19:32

Jeg har her hentet frem igjen et innlegg jeg skrev i 2013....
 

Det slår meg dessverre gjentatte ganger at altfor mange hunde-eiere ikke ønsker eller orker å bruke tid på å dressere hundene sine på en etisk forsvarlig måte. Det er mye enklere å "korrigere" hundene hver gang de gjør noe eier ikke liker. Om ikke annet så lærer da hunden at i nærheten av eier er det best å forholde seg passiv og rolig, for da unngår man ubehag. Og hunden fremstår som "dressert og lydig", når den egentlig bare er passiv, og har meldt seg ut, som en forsvarsmekanisme.
Dette er både etisk forkastelig, og det er i strid med lov om dyrevelferd. OG det eneste hunden har "lært" er å være passiv. (sikkert behagelig for noen eiere...)

Generelle prinsipper om hvordan vi skal omgås dyr er nedfelt i Lov om dyrevelferd (2010). Loven slår fast at dyr har egenverdi uavhengig av den nytteverdien de måtte ha for mennesker (§3). I samme paragraf står det også at dyr skal behandles godt og beskyttes mot fare for unødige påkjenninger og belastninger.Et mer detaljert regelverk for de ulike husdyrene er hjemlet i forskrifter.
Loven stiller også krav om at dyr skal ivaretas av tilstrekkelig og faglig kompetent personell (§5). Det er dyreholders ansvar å sørge for dette.

Forutsetningen for å kunne lære og dressere andre individer med en metode som er fri for ubehag, fordrer en viss basis-kunnskap. Både om hvordan læring foregår, og ikke minst om hva som skjer når man utsetter dyr for ubehag.Dette med læring først:

Læringspsykologien er en retning som forklarer hva læring er, hvordan den skjer og hvordan læringen kan forbedres.
En definisjon av læring:

en relativt varig forandring i atferd eller i mulig atferd som et resultat av erfaring

Atferd som skyldes instinkter eller reflekser, regnes ikke som læring. Læring påvirkes både av medfødte disposisjoner (arv) og det miljøet læringen foregår i.Der er flere læringsteorier:

De assosiative teoriene: forklarer læring som en kopling av hendelser som henger sammen (stimulus–respons), der er to hovedformer:
Klassisk betinging
Operant betinging

De kognitive teoriene: legger vekt på at vi kan tenke ut løsninger ut fra en helhetlig vurdering av situasjonen (innsikt) framfor prøving og feiling.

Klassisk betinging:
Skjer via en link til biologiske reflekser. Læringen foregår ved at en nøytral stimulus (betinget stimulus) kommer rett før en annen stimulus (ubetinget stimulus) som har med responsen (en refleks)  å gjøre. Den ubetingede stimulus kan feks være mat og responsen sikling. Hunder sikler ved syn/lukt av mat - det er nedfellt i dem som en refleks og ikke noe de kan styre selv. Den betingede kan feks være som bjella som ringte i Pavlos forsøk med hunder: Han ringte med bjella rett før han satte frem mat til hundene - som siklet ved synet/lukten av maten. Etterhvert ble lyden av bjella i seg selv nok til å utløse siklinga. Den varslet hjernen egentlig - dog ubevisst for hundene - om at nå kommer det mat.Han hadde da skapt en ubevisst assosiasjon mellom bjella og mat og dermed koblingen mellom bjella og sikling.  Respons (sikling) på den betingede stimulusen (bjella) kalles en betinget respons ( imotsetning til refleks som er en ubetinget respons på et ubetinget stimulus). Klassisk betinging handler derfor om reflekser. Som er biologisk tilstede hos alle innen samme art.

I Pavlovs forsøk var utbetinget stimulus en lyd, betinget stimulus var mat, responsen (både betinget og ubetinget) var spyttutskillelse - som er en refleks. Den betingede responsen (spyttutskillelse ved lyd) er lært, den utbetingede (spytttskillelse ved mat) er automatisk .
Koplingen mellom en betinget stimulus (eks. lyd) til en respons (eks. spyttutskillelse) vil holde seg en viss tid, men forsvinne hvis ikke den ubetingede stimulusen (eks. mat) dukker opp innimellom. Dette kalles utslokking (ekstinksjon). Refleksen (sikling ved syn av mat) - den ubetingede responsen - kan derimot ikke la seg utslukke.

Operant betinging:
eks. Skinners forsøk med rotter og duer. Kan både forsterke eksisterende atferd og skape ny atferd.En respons utløser en forsterkning (stimulus) slik at responsen gjentas. Forsterknings-psykologien snakker om styrking av en respons ved operant (eller instrumentell) betinging hos dyr og mennesker.

Forsterkning i operant betinging kan inntreffe på to måter: Ved at en belønnende stimulus ("belønning" feks en godbit, ros, el) tilføres i situasjonen når en bestemt respons avgis, «positiv forsterkning», eller ved at en uønsket stimulus, f.eks fysisk ubehag, fjernes fra situasjonen når responsen avgis, «negativ forsterkning». Forsterkning viser til en prosess: styrking av respons som følge av de konsekvensene responsen har.

Optimal forsterkningseffekt sees hvis forsterker, den stimulus som fungerer forsterkende, inntreffer nokså umiddelbart etter responsen. Forsterker som inntreffer bare av og til, «partiell forsterkning», etablerer en respons som er vanskeligere å avlære enn hvis forsterkere inntreffer kontinuerlig (se ekstinksjon), og partiell forsterkning gir generelt en høyere sannsynlighet for ønsket respons. Forsterkere kan være ulærte (ubetingede),eller lærte (betingede). Forsterkere kan prinsipielt være alt som har motiverende verdi for individet, fra eksterne stimuli, f.eks. penger, til atferd individet liker å utføre. Hos mennesker kan forsterkning forekomme med eller uten bevissthet om at læringen finner sted.

Klassisk betinging dreier seg om atferd som allerede finnes, men som knyttes til en stimulus, og forklarer dermed ikke ny atferd.Operant betinging kan også forklare hvordan ny atferd skapes.
I klassisk betinging vil en stimulus gi en respons, ved operant betinging er det motsatt: en respons gir en stimulus (forsterkning) slik at responsen gjentas.

Disse teoriene er utgangspunkt for hvordan man lærer dyr, feks hunder, en bestemt adferd, ev "avlærer" dem uønsket adferd. Noen bruker feks en klikker som et tilbakemelding på at nå kommer belønning, andre bruker stemmen. Det er ikke KLIKKEREN som er poenget i denne typen læring, men hvordan man benytter seg av betinging og forsterkere.
Mer om klassisk og operant betinging kan du lese her.


Så dette med KORREKSJON:
En korreksjon er en positiv straff så sant den reduserer forekomsten/intensiteten/varigheten av en adferd.
En positiv straff vil si at man tilfører (derav ordet positiv) noe som reduserer frekvensen av atferden (straff). 

Per definisjon – hvis en korreksjon reduserer en uønsket atferd så er det en positiv straff.

Det er konstatert (Victoria Voith) at man kan skjemme bort hunden sin uten at det innebærer risiko for problemadferd. De bortskjemte hundene ble sammenlignet med hunder som ble holdt ganske strikt, men de hadde altså ikke større grad av problemadferd enn de "veloppdragne" og strikt dresserte.
Andre studier viser også at fravær av straff ikke gir samme nevrobiokjemiske reaksjoner som belønning gir. Og fravær av belønning gir heller ikke samme reaksjoner som straff. Så disse 4 gir 4 helt ulike nevrologiske konsekvenser biokjemisk i hjernen, og dermed emosjonelt.

https://forskning.no/hjernen-aper-primater-psykologi/2013/08/straff-og-belonning-i-forskjellige-hjerneomrader


 

Læring og stress;
For en enkel oppsummering av hva stress er, kan du lese her.
Å bli utsatt for traumatiske hendelser tidlig i barndommen påvirker hjernens utvikling. Systemet som håndterer respons på stress skades, og dette har igjen følger for hvordan individet prosesserer følelsesmessige minner. Eksempelvis vil høynet nivå av ”stresshormonet” kortisol forsterke minner fra emosjonelle hendelser, blokkere evnen til å avlære fryktrelaterte minner og forsterke minner knyttet til konteksten for den skremmende hendelsen.

En traumatisk hendelse kan dermed føre til minner som er svært kraftfulle og vanskelige å glemme. Hvis de stadig aktiveres, kan det føre til ytterligere utskillelse av kortisol. For mye kortisol kan også avstedkomme dårlige læringsevner i ikke-skremmende sammenhenger, noe som videre forsterker de negative effektene.

Vedvarende høyt nivå av kortisol kan dessuten skade hjerneceller i områder av hjernen som understøtter læring.Når hjernen arbeider, snakker nervecellene i hjernen sammen gjennom kontaktpunkter, såkalte synapser. Det som skjer under lagring av informasjon, er at kontaktpunktene endrer styrke. Langvarig og alvorlig stress påvirker kontaktpunktenes evne til å forandre seg - og dermed evnen til å ta imot og lagre ny informasjon i langtidshukommelsen. Forskning viser at flere andre fysiologiske mekanismer i hjernen påvirkes negativt av stress. Mennesker som er kronisk stresset gjør det dårligere på en rekke oppgaver som er relatert til den prefrontale cortex. Denne delen av hjernen har betydning for arbeidsminne og oppmerksomhet.
Der er ingen grunn til å tro at stress hos hunder håndteres bedre nevrologisk enn stress hos mennesker(barn).


Hunder som vet de kan forvente positiv straff, altså ubehag, som respons fra eier vil ha økte stresshormoner over lengre tid (målt forhøyede nivåer av stresshormoner lenger en en uke etter at stress er påført) pga tap av "egenkontroll" i de situasjonene den utsettes for. Metoder som betinger straff lærer hundene derfor kun passivitet, istedetfor at hunden lærer å mestre ulike situasjoner.
Fysisk korrigering krever at man er konsekvent og følger opp hele tiden. For å opprettholde effekten må man ty til stadig kraftigere korreksjon for at det skal fungere. Dette vil demotivere hunden fra å tilby adferder frivillig i frykt for å bli korrigert. Korrigerer du feil og på feil tidspunkt risikerer du også å få feil reaksjon fra hunden med forhøyet stressnivå og redusert innlærings-evne som følge.
Positiv trening, ev  for noen; "klikketrening":
Denne type rening har den ulempen at det krever en del mer tankevirksomhet og planlegging fra førers side enn ved andre metoder. Å straffe uønsket atferd krever ikke særlig mye tankevirksomhet. MEN: Man må likevel ha god timing, og gjenta straffen, for å opprettholde effekten. Som man må gjenta forsterkningen ved positiv trening. Å legge merke til og belønne positiv atferd krever en viss våkenhet. En annen ulempe er at du gjennom hele hundens oppvekst bør fokusere på kontroll, feks bruke langline. Så det er ikke en metode som egner seg for latsabber…..


Og man må noen ganger ha en viss tilmodighet. Læring er en biokjemisk og organisk prosess i hjernen, og den kan ikke forseres. Noen ganger trenger individet tid, med flere repetisjoner, kanskje med kortere eller lengre pauser mellom, for å lære. Quick-fix kan virke fristende for mange - og en hund som "plutselig" lar være å bryte fellesdekken etter å ha fått en runde med "fysisk straff/korreksjon", kan virke imponerende. Helt til det øyeblikket den ikke lenger vil delta i konkurransen overhodet, og bare melder seg helt ut. Og som med belønning - straff må gjentas, for den virker bare en stund. Forskjellen er at når en hund oppnår noe den opplevere som motiverende  etter en adferde, vil den jobbe for å gjenta den adferden. Straff handler om å unngå. Og hunder lærer seg raskt forskjell på trening og konkurranse... 

 


En god hundefører setter ikke hunden sin i situasjoner den ikke takler. Men ingen metoder er effektive uten god timing, passende kriterier og riktig forsterkning.

Det er med klikkertrening/positiv trening som med alle andre metoder: desto bedre treneren behersker metoden og desto mer en trener med hunden sin, desto bedre blir resultatet.


Det å konsekvent sette rammer og grenser for en hund, er ikke det samme som det som på folkemunne kalles straff. Rammene setter grenser for hva en hund faktisk får til å gjøre. Feks vil kobbel på tur begrense hvor langt unna eier en hund kan bevege seg, uten at kobbelet i seg selv er en straff. Rykker man hardt i kobbelet KAN det derimot oppleves som en straff for hunden. (uten at den vet hva den ev straffes for). Hundene mine får ikke løpe til døren og hoppe opp på besøkende. Jeg hindrer dem, ved at de fysisk ikke kommer til, og ikke får oppmerksomhet (ev får andre beskjeder - feks "gå og legg deg"). Og hunder lærer raskt mønster, rutiner, regler. Selv er jeg en ganske "streng" hunde-eier. Som har regler i hverdagen. De får ikke utagere på andre hunder på tur (jeg får dem ned i en sitt og bli om jeg ser at de kan fristes til det, og belønner dem for å bli sittende. Om de forsøker å bryte sitten, tar jeg tak i halsbåndet og holder dem fast  - og ber dem igjen om å sitte. De forstår raskt at det ikke nytter å prøve å bryte den sitten - de hindres rett og slett. Og belønnes når de sitter. At jeg hindrer dem ved å holde dem fast tror jeg at de bare opplever som begrensende, ikke som angstfremmende, ubehagelig eller vondt.) 
Mine hunder vet at jeg er forutsigbar, at jeg ikke påfører dem ubehag (bevisst i hvert fall) som trigger angst eller frykt. Og jeg terper på adferden jeg vil ha fra de er 8 uker gamle. Som å gå ved fot (en million belønninger ved venstre kne i løpet av første leveår), komme på innkalling (= alltid svensk kjøttbolle eller leverpostei), sitte på kommando (godis, godis og atter godis). Jeg er tolmodig - jeg har målet foran meg. Som mor vet jeg at barn ikke er ferdig oppdratt, opplært og utdannet på 3 år, 7 år eller 12 år. Som hunde-eier har jeg samme perspektiv - adferden skal shapes og bygges inn i hunden til den automatisk tilbyr det jeg vil, uten å tenke, fordi den -uten å vite det selv - forventer kjøttboller (ev ros, dvs stemmen min betinget ved hjelp av godbiter - noe som kaper gode følelser i hunden) som resultat i enden av adferden. Da er adferden "Flytende". OG automatisert. 

 

Ikke fall for fristelsen å påføre hunden ubehag, angst eller smerte for en quick-fix. Tenk LÆRING. Og flytende adferder tilbudt med logrende haler. DA kan du stole på hunden din. At den faktisk gjør som du vil. 
 

 
Anbefalt litteratur:
Karen Pryor: veien inn i dyrets sinn
 

 

Ref;
Svartdal, Frode. (2012, 9. november). Forsterkning: psykologi. I Store norske leksikon. Hentet 28. juli 2013 fra https://snl.no/forsterkning/psykologi.

Cecilie Køste: Klassisk betinging & operant betinging; https://www.canis.no/bibliotek/artikkel.php?artid=179

Thomas Stokke; Trening av ro i oppflukt og skudd (RIOS) med klikkertrening.

Persistent Fear and Anxiety Can Affect Young Children’s Learning and Development: National Scientific Council on the Developing Child (2010). Working Paper No. 9.https://www.regjeringen.no/nb/dep/kd/dok/rapporter_planer/aktuelle-analyser/aktuelle-analyser-om-barnehager/frykt-i-ung-alder-pavirker-hjernens-arki.html?id=711826

Harald Aastorp: Stress forandrer hjernen: https://www.forskning.no/artikler/2003/august/1061296720.7

Anders Hallgren: Rädda, arga och stressade hundar. Att lindra och bota med enkla medel.

Anders Hallgren: Lykkelige, lydige hunder.