lørdag 9. august 2014

Pløying av pensum: Sentrale begreper

Straff og forsterkning

  • To måter å omtale konsekvensen av påvirkning av atferd. 
  • En forsterker: Godbit, leke - noe som betyr noe for hunden og som hunden vil ha
  • En straff: Ubehag/smerte som betyr noe for hunden og som hunden vil unngå
  • Straff: atferden blir mindre sannsynlig
  • Forsterkning: atferden blir mer sannsynlig
  • Positiv: stimulus tilføres
  • Negativ stimulus fjernes
  • Positiv forsterkning: stimuli tilføres, og atferden blir mer sannsynlig
    • Gir godbit etter ønsket atferd, og atferden blir mer sannsynlig.
  • Positiv straff: stimulus tilføres og atferden blir mindre sannsynlig
    • Gir ubehag/smerte og atferden blir mindre sannsynlig, strømming for å få sauereine hunder.
  • Negativ forsterkning: stimuli fjernes og atferden blir mer sannsynlig
    • Ubehaget fjernes og atferden blir mer sannsynlig, presse baken ned i sitt med hånda, og trykket fjernes. 
  • Negativ straff: stimuli fjernes og atferden blir mindre sannsynlig
    • Godbit fjernes og atferden blir mindre sannsynlig.

Viktige former for læring
  • Habituering: Reaksjonen avtar i styrke for hver gang hunden møter det som utløser en reaksjon. En venner seg til det som stimulerer /skjer og reagerer mindre og mindre på det. 
  • Sensitivering: Reaksjonen øker i styrke for hver gang hunden møtes stimulus. Motsatt av habituering. 
  • Klassisk betinging: Pavlov. Stimulus utløser en refleks hos hunden. Mat utløser sikling. Ubetinget stimulus - ubetinget respons. Det skjer uansett. 
  • Operant betinging: Atferd styres av de konsekvensene atferden får. Atferd-konsekvens. Stimulus-atferd-konsekvens.
  • Observasjonslæring: Hunden observerer hva andre hunder gjør, og etteraper dette. For eksempel en uredd hund KAN bli nervøs av å være sammen med en redd hund på nyttårsaften. 
Ekstinksjon
  • En slutter med å forsterke tidligere forsterket atferd. Forutsetter at en kjenner forsterkeren som opprettholder atferden.
  • Eksempel: En gir ikke godbit for hver repetisjon hunden gjør, men gradvis sjeldnere. 
 
Shaping
  • Vi setter kriterier for atferd og belønner hunden når den utfører handlinger som nærmer seg kriteriene. 
  • Eksempel: Vi vil at hunden skal slå av lyset med lysbryteren på veggen: vi kan belønne at hunden står vendt mot veggen, ser på veggen, ser på bryteren, går nærmere veggen, inntil veggen, snuser på veggen, snuser høyere på veggen, løfter på frambenet inntil veggen, løfter på begge frembena inntil veggen, står på bakbena og støtter seg til veggen, tilfeldig berøring av lysbryteren med labben, mer konsekvent berøring av lysbryteren med labben. Alt dette FØR vi legger på en kommando. 

Baklengskjeding
  • Hunden kan det siste elementet før vi legger på det nest siste osv. Slik vet hunden hva den skal gjøre når den får en oppgave. Bygge på noe som er kjent. 
  • Eksempel, innlæring av apport: Belønne interesse for apportbukk, gripe om apportbukk, holde apportbukk, sitte i utgangsstilling og gripe+holde apportbukk+avlevering, gripe/holde apportbukk+gå rundt fører+sitte i utgangsstilling+ holde apportbukk+avlevering, ikke gå tilbake til fører uten å ha med apportbukken gitt av medhjelper, ikke gå tilbake til fører før den selv har plukket opp apportbukken, gå selv ut og hente apportbukken+tilbake til fører for korrekt avlevering. 

Timing
  • Hvilken atferd som forsterkes avhenger av når forsterkeren kommer. En forsterker som blir gitt for sent, vil kunne utløse uønsket atferd eller skape forvirring for hunden. En presis forsterker vil kunne understreke for hunden at den gjør riktig. 

Stimuluskontroll
  • Vi har stimuluskontroll på en atferd når:
    • Hunden gjør x når du sier x
    • Hunden ikke gjør y når du sier x
    • Hunden gjør ikke x hvis du sier y
    • Hunden gjør ikke x hvis du ikke sier x
  • Du har stimuluskontroll på "ligg" når hunden legger seg når du sier ligg og ikke ellers. 
  • Metoder for oppnåelse av stimuluskontroll:
    • Gi kommandoen samtidig som når atferden utføres frivillig
    • Gi kommandoen like før atferden utføres
    • Test kommandoen i stadig vanskeligere situasjoner, generalisering. 
    • Belønn kun atferden hvis signalet er gitt.
    • Gi andre kommandoer og ikke forsterk atferden hvis den utføres - og gi deretter riktig signal og forsterk!
  • ds

Ingen kommentarer:

Legg inn en kommentar