Læring, straff og belønning

18.04.2017 19:32

Jeg har her hentet frem igjen et innlegg jeg skrev i 2013....
 

Det slår meg dessverre gjentatte ganger at altfor mange hunde-eiere ikke ønsker eller orker å bruke tid på å dressere hundene sine på en etisk forsvarlig måte. Det er mye enklere å "korrigere" hundene hver gang de gjør noe eier ikke liker. Om ikke annet så lærer da hunden at i nærheten av eier er det best å forholde seg passiv og rolig, for da unngår man ubehag. Og hunden fremstår som "dressert og lydig", når den egentlig bare er passiv, som en forsvarsmekanisme.
Dette er både etisk forkastelig, og det er i strid med lov om dyrevelferd. OG det eneste hunden har "lært" er å være passiv.

Generelle prinsipper om hvordan vi skal omgås dyr er nedfelt i Lov om dyrevelferd (2010). Loven slår fast at dyr har egenverdi uavhengig av den nytteverdien de måtte ha for mennesker (§3). I samme paragraf står det også at dyr skal behandles godt og beskyttes mot fare for unødige påkjenninger og belastninger.Et mer detaljert regelverk for de ulike husdyrene er hjemlet i forskrifter.
Loven stiller også krav om at dyr skal ivaretas av tilstrekkelig og faglig kompetent personell (§5). Det er dyreholders ansvar å sørge for dette.

Forutsetningen for å kunne lære og dressere andre individer med en metode som er fri for ubehag, fordrer en viss basis-kunnskap. Både om hvordan læring foregår, og ikke minst om hva som skjer når man utsetter dyr for ubehag.



Dette med læring først:

Læringspsykologien er en retning som forklarer hva læring er, hvordan den skjer og hvordan læringen kan forbedres.
En definisjon av læring:

en relativt varig forandring i atferd eller i mulig atferd som et resultat av erfaring

Atferd som skyldes instinkter eller reflekser, regnes ikke som læring. Læring påvirkes både av medfødte disposisjoner (arv) og det miljøet læringen foregår i.







Der er flere læringsteorier:

De assosiative teoriene: forklarer læring som en kopling av hendelser som henger sammen (stimulus–respons), der er to hovedformer:
Klassisk betinging
Operant betinging

De kognitive teoriene: legger vekt på at vi kan tenke ut løsninger ut fra en helhetlig vurdering av situasjonen (innsikt) framfor prøving og feiling.

Klassisk betinging:
Skjer via en link til biologiske reflekser. Læringen foregår ved at en nøytral stimulus (betinget stimulus) kommer rett før en annen stimulus (ubetinget stimulus) som har med responsen (en refleks)  å gjøre. Den ubetingede stimulus kan feks være mat og responsen sikling. Hunder sikler ved syn/lukt av mat - det er nedfellt i dem som en refleks og ikke noe de kan styre selv. Den betingede kan feks være som bjella som ringte i Pavlos forsøk med hunder: Han ringte med bjella rett før han satte frem mat til hundene - som siklet ved synet/lukten av maten. Etterhvert ble lyden av bjella i seg selv nok til å utløse siklinga. Den varslet hjernen egentlig - dog ubevisst for hundene - om at nå kommer det mat.Han hadde da skapt en ubevisst assosiasjon mellom bjella og mat og dermed sikling.  Respons på den betingede stimulusen kalles en betinget respons ( imotsetning til refleks som er en ubetinget respons på et ubetinget stimulus). Klassisk betinging handler derfor om reflekser. Som er biologisk tilstede hos alle innen samme art.

I Pavlovs forsøk var utbetinget stimulus en lyd, betinget stimulus var mat, responsen (både betinget og ubetinget) var spyttutskillelse - som er en refleks. Den betingede responsen (spyttutskillelse ved lyd) er lært, den utbetingede (spytttskillelse ved mat) er automatisk .
Koplingen mellom en betinget stimulus (eks. lyd) til en respons (eks. spyttutskillelse) vil holde seg en viss tid, men forsvinne hvis ikke den ubetingede stimulusen (eks. mat) dukker opp innimellom. Dette kalles utslokking (ekstinksjon). Refleksen - den ubetingede responsen - kan derimot ikke la seg utslukke.

Operant betinging:
eks. Skinners forsøk med rotter og duer. Kan både forsterke eksisterende atferd og skape ny atferd.En respons utløser en forsterkning (stimulus) slik at responsen gjentas. Forsterknings-psykologien snakker om styrking av en respons ved operant (eller instrumentell) betinging hos dyr og mennesker.

Forsterkning i instrumentell betinging kan inntreffe på to måter: Ved at en belønnende stimulus ("belønning" feks en godbit, ros, el) tilføres i situasjonen når en bestemt respons avgis, «positiv forsterkning», eller ved at en uønsket stimulus, f.eks fysisk ubehag, fjernes fra situasjonen når responsen avgis, «negativ forsterkning». Forsterkning viser til en prosess: styrking av respons som følge av de konsekvensene responsen har.

Optimal forsterkningseffekt sees hvis forsterker, den stimulus som fungerer forsterkende, inntreffer nokså umiddelbart etter responsen. Forsterker som inntreffer bare av og til, «partiell forsterkning», etablerer en respons som er vanskeligere å avlære enn hvis forsterkere inntreffer kontinuerlig (se ekstinksjon), og partiell forsterkning gir generelt en høyere sannsynlighet for ønsket respons. Forsterkere kan være ulærte (ubetingede),eller lærte (betingede). Forsterkere kan prinsipielt være alt som har motivasjonell verdi for individet, fra eksterne stimuli, f.eks. penger, til atferd individet liker å utføre. Hos mennesker kan forsterkning forekomme med eller uten bevissthet om at læringen finner sted.

Klassisk betinging dreier seg om atferd som allerede finnes, men som knyttes til en stimulus, og forklarer dermed ikke ny atferd.Operant betinging kan også forklare hvordan ny atferd skapes.
I klassisk betinging vil en stimulus gi en respons, ved operant betinging er det motsatt: en respons gir en stimulus (forsterkning) slik at responsen gjentas.

Disse teoriene er utgangspunkt for hvordan man lærer dyr, feks hunder, en bestemt adferd, ev "avlærer" dem uønsket adferd. Noen bruker feks en klikker som et tilbakemelding på at nå kommer belønning, andre bruker stemmen. Det er ikke KLIKKEREN som er poenget i denne typen læring, men hvordan man benytter seg av betinging og forsterkere.
Mer om klassisk og operant betinging kan du lese her.


Så dette med KORREKSJON:
En korreksjon er en positiv straff.
En positiv straff vil si at man tilfører (derav ordet positiv) noe som reduserer frekvensen av atferden (straff). Ved korreksjon oppnår man å redusere forekomsten av en atferd. Med andre ord: positiv straff.

Per definisjon – hvis en korreksjon reduserer en uønsket atferd så er det en positiv straff.

Det er konstatert (Victoria Voith) at man kan skjemme bort hunden sin uten at det innebærer risiko for problemadferd. De bortskjemte hundene ble sammenlignet med hunder som ble holdt ganske strikt, men de hadde altså ikke større grad av problemadferd enn de "veloppdragne" og strikt dresserte.
Andre studier viser også at fravær av straff ikke gir samme nevrobiokjemiske reaksjoner som belønning gir. Og fravær av belønning gir heller ikke samme reaksjoner som straff. Så disse 4 gir 4 helt ulike nevrologiske konsekvenser biokjemisk i hjernen, og dermed emosjonelt.

http://forskning.no/hjernen-aper-primater-psykologi/2013/08/straff-og-belonning-i-forskjellige-hjerneomrader


 

Læring og stress;
For en enkel oppsummering av hva stress er, kan du lese her.
Å bli utsatt for traumatiske hendelser tidlig i barndommen påvirker hjernens utvikling. Systemet som håndterer respons på stress skades, og dette har igjen følger for hvordan individet prosesserer følelsesmessige minner. Eksempelvis vil høynet nivå av ”stresshormonet” kortisol forsterke minner fra emosjonelle hendelser, blokkere evnen til å avlære fryktrelaterte minner og forsterke minner knyttet til konteksten for den skremmende hendelsen.

En traumatisk hendelse kan dermed føre til minner som er svært kraftfulle og vanskelige å glemme. Hvis de stadig aktiveres, kan det føre til ytterligere utskillelse av kortisol. For mye kortisol kan også avstedkomme dårlige læringsevner i ikke-skremmende sammenhenger, noe som videre forsterker de negative effektene.

Vedvarende høyt nivå av kortisol kan dessuten skade hjerneceller i områder av hjernen som understøtter læring.Når hjernen arbeider, snakker nervecellene i hjernen sammen gjennom kontaktpunkter, såkalte synapser. Det som skjer under lagring av informasjon, er at kontaktpunktene endrer styrke. Langvarig og alvorlig stress påvirker kontaktpunktenes evne til å forandre seg - og dermed evnen til å ta imot og lagre ny informasjon i langtidshukommelsen. Forskning viser at flere andre fysiologiske mekanismer i hjernen påvirkes negativt av stress. Mennesker som er kronisk stresset gjør det dårligere på en rekke oppgaver som er relatert til den prefrontale cortex. Denne delen av hjernen har betydning for arbeidsminne og oppmerksomhet.
Der er ingen grunn til å tro at stress hos hunder håndteres bedre nevrologisk enn stress hos mennesker(barn).


Hunder som vet de kan forvente positiv straff, altså ubehag, som respons fra eier vil ha økte stresshormoner over lengre tid (målt forhøyede nivåer av stresshormoner lenger en en uke etter at stress er påført) pga tap av "egenkontroll" i de situasjonene den utsettes for. Metoder som betinger straff lærer hundene derfor kun passivitet, istedetfor at hunden lærer å mestre ulike situasjoner.
Fysisk korrigering krever at man er konsekvent og følger opp hele tiden. For å opprettholde effekten må man ty til stadig kraftigere korreksjon for at det skal fungere. Dette vil demotivere hunden fra å tilby adferder frivillig i frykt for å bli korrigert. Korrigerer du feil og på feil tidspunkt risikerer du også å få feil reaksjon fra hunden med forhøyet stressnivå og redusert innlærings-evne som følge.




Positiv trening, ev i betydningen "klikketrening":
Denne type rening har den ulempen at det krever en del mer tankevirksomhet og planlegging fra førers side enn ved andre metoder. Å straffe uønsket atferd krever ikke særlig mye tankevirksomhet. Å legge merke til og belønne positiv atferd krever en viss våkenhet. En annen ulempe er at du gjennom hele hundens oppvekst bør fokusere på kontroll, feks bruke langline. Så det er ikke en metode som egner seg for latsabber…..

Klikkertrenere/positive trenere lærer hunden hva den skal gjøre fra starten av. En god hundefører setter ikke hunden sin i situasjoner den ikke takler. Men ingen metoder er effektive uten god timing, passende kriterier og riktig forsterkning.

Det er med klikkertrening/positiv trening som med alle andre metoder: desto bedre treneren behersker metoden og desto mer en trener med hunden sin, desto bedre blir resultatet.






Anbefalt litteratur:
Karen Pryor: veien inn i dyrets sinn








 

 

Ref;
Svartdal, Frode. (2012, 9. november). Forsterkning: psykologi. I Store norske leksikon. Hentet 28. juli 2013 fra http://snl.no/forsterkning/psykologi.

Cecilie Køste: Klassisk betinging & operant betinging; http://www.canis.no/bibliotek/artikkel.php?artid=179

Thomas Stokke; Trening av ro i oppflukt og skudd (RIOS) med klikkertrening.

Persistent Fear and Anxiety Can Affect Young Children’s Learning and Development: National Scientific Council on the Developing Child (2010). Working Paper No. 9.http://www.regjeringen.no/nb/dep/kd/dok/rapporter_planer/aktuelle-analyser/aktuelle-analyser-om-barnehager/frykt-i-ung-alder-pavirker-hjernens-arki.html?id=711826

Harald Aastorp: Stress forandrer hjernen: http://www.forskning.no/artikler/2003/august/1061296720.7

Anders Hallgren: Rädda, arga och stressade hundar. Att lindra och bota med enkla medel.

Anders Hallgren: Lykkelige, lydige hunder.