Saturday, May 10, 2008

Stimuluskontroll

I dag snakket vi om hvordan vi satt signal på ulike atferder. Det er så utrolig inspirerende å gå på kurs når man lærer noe nytt!
Det jeg har blitt lært opp til når man setter på signal på en atferd er:
1. Få frem atferden frivillig
2. Gi signalet idet hunden utfører atferden
3. Gi signalet like før atferden utføres frivillig
4. Test signalet i gradvis vanskeligere situasjoner
5. Forsterk kun atferden hvis signalet er gitt, shape frem passitivitet
6. Gi andre signal og ikke forsterk atferden (gi så riktig signal og belønn)

I dag lærte jeg derimot noe nytt.
Å gi signalet idet hunden utfører atferden frivillig er det samme som å betinge inn klikkeren ved å legge ut masse godbiter på bakken og klikke idet hunden tar en godbit i munnen. Unødvendig bruk av tid!
Si man skal sette på kommando på sitt. Få frem atferden slik at med en gang hunden har svelget godbiten så kommer den til å sette seg på nytt, ivrig og med en glad innstilling.
Hunden kommer nå til å sette seg igjen når du tar den ut etter lekepausen eller å ha sendt den i buret ettersom den har blitt forsterket for det så mange ganger. Å starte helt på punkt èn er dermed unødvendig arbeid. I tillegg er det viktig å være tidlig ute med å proofe signalet. Forandre miljøet og hva du selv gjør slik at det eneste som er likt hver gang er ditt signal, da vil det bli viktigere for hunden å høre på hva du sier og lettere å skille ut dine signaler.
Her er hvordan man setter signal på en atferd, her sitt.
Ta en lekepause etter du har fått fin flyt på frivillige sitter og send hunden i buret
Fri ut hunden i en lekepause, og si sitt. Hunden kommer da til å sette seg siden det var den fikk belønning for sist.
Signalet vil da ikke ha noe å si for hunden, for den kommer til å utføre det uansett siden man nettopp har gitt masse belønninger for det, så man kan like gjerne si signalet først og så belønne når hunden setter seg.
Hvis hunden blir stående et par tre sekunder og vente før den tilbyr sitt etter vi har belønnet så belønn fordi om.. Etter hvert forandrer man alle de andre stimuliene og miljøsignalene slik at det er ditt signal som er det eneste som er det samme. Jo tidligere man begynner med dette, jo raskere vil hunden begynne å skille ut ditt signal.
Vi skal ikke være kommentatorer som bare beskriver hva hunden gjør, vi skal gi signalet først og så skal hunden gjøre det.
Når man skal belønne passitivitet med en kommando, så belønn gjerne passitiviteten med godbiter. Da går det raskere for hunden å skjønne hva den skal, man får høyere frekvens som gir mer effektiv trening enn å bruke mye straff.
Om hunden gjør feil så gjør det ikke noe. Hunden må gjøre feil for å finne ut hva som er rett. Hvis hunden forventer en kommando og er på vei til å gjøre det, så sier du motsatt.
Proof at hunden virkelig hører på ditt signal, hold frem en godbit, sett deg på huk, lokk med en leke eller gå til et vanskeligere miljø. Ditt signal er det samme uansett og hunden kan velge å enten være alert og følge med på dine signaler eller å sjanse og miste muligheten for belønning. Utfordre hunden, ikke gjør det for lett. Tren på å skille mellom 3-4 kommandoer samtidig når du skal begynne å gjøre det vanskeligere. Hvis man bare har to kommandoer man trener på å skille mellom har hunden alltid 50-50 sjanse for å få rett og det er lettere å bare gjette enn å konsentrere seg. For eksempel når man trener lukt diskriminering med post it lapper eller pinner. Om man bare har to pinner er det enkelt for hunden å bare velge noe, men om det ligger hundre pinner på planen må hunden virkelig tenke etter før den gjør et valg. Da koster det mer å gjøre feil enn om hunden bare har to valg, den kan jo bare velge rett etterpå.
Dette var hvordan vi jobbet med target diskrimineringsoppgaven vår i dag, når hunden markerte rett forsøkte vi hele tiden å utfordre den og lokke den til å gjøre feil. Dette gikk veldig bra med Kry, hun var flink til å skille ut nøklene fra andre fristelser og ting som ble holdt fremfor henne, selv om pipeballer var noe hun virkelig fikk bruket konsentrasjonen på for å huske hva hun skulle gjøre. Så har vi brukt masse tid på denne leksen også da.
Det viktigste når man trener signalkontroll er å kjøre korte effektive økter så hunden er på topp hele tiden, bruke ofte lekepauser og buret mellom øktene. Jeg kommer definitivt til å jobbe videre med dette hjemme, jeg har allerede testet litt ut med sitt og stå under marsj og det er kjempe spennende. Jeg elsker å lære noe nytt!


Vi brukte også litt tid på å utvikle bedre belønninger. Når man bruker bare godbiter i en økt er det viktig å starte og avslutte med lek! Å proofe lekingen både ved å belønne rett valg med det hunden vil ha, men også med å prøve og utkonkurrere med mer engasjerende lek var noe vi brukte siste delen av dagen til. Ha hunden løs og la den få velge. Om den velger å løpe bort til den andre personen som står og vifter med en leke blir den leken borte. Det er kun hos deg det er kult! Hvis du belønner rett valg med forstyrrelsen så sørg for at du belønner når hunden virkelig er engasjert i leken og slipper forstyrrelsen helt, ikke når den holder et øye med forstyrrelsen mens den leker med deg.
Å avslutte treningsdagen på denne måten er en fin måte å lære hunden å yte enda litt ekstra når den egentlig har lyst å ligge i buret og slappe av.
Det samme som strikkmotor prinsippet Morten har beskrevet i sin blogg. Gjør det lettere og belønn bedre på slutten av økten når hunden egentlig ikke orker mer slik at den får en positiv opplevelse av å fortsette å jobbe til tross for at den er sliten.

Neeei du, ikke skal jeg bli lokket av mine nøkler igjen!

Target diskriminering er også en stimuluskontroll øvelse

14 comments:

Anneli said...

Spennende, interessant, lærerikt... Men jeg kjenner det går litt rundt for en stakkar:-( Jeg sliter litt med å huske alt jeg leser og lærer. Tror jeg akkurat som riesenschnauzeren min trenger mange mange repetisjoner... Men det kommer seg vel. Så jeg kommer nok til å lese innlegget mange ganger, og så prøve ut! Ha en fortsatt strålende dag:-)

HÅKON GROVEN said...

I praksis, på steg to, blir det til at jeg sier kommando i det jeg ser at hunden er på tur til å starte adferden.

Det jeg forøvrig ofte ser både hos kursdeltagere og andre, er at det slurves både med steg to og tre.

Så mitt råd er: hvis du hopper over steg to så vær veldig bevisst på hvorfor du gjør det. Og vær nøye med steg tre slik du beskriver!

Hvis man føler "behov" for å bruke kroppsbevegelser for å få hunden til å utføre kommandoen er man definitivt på feil vei.

Et klassisk eksempel man ofte ser på kurs er at deltagerne bruker både armer og bein og ekstra stemme etc for å få hunden til å reagere på versågod til godbitskål.

Min erfaring er altså at mange har en tendens til å gå for fort fram når de skal sette på kommando, ikke for sakte...

Elin said...

Høres ut som om dere har hatt en spennende og lærerik helg! Det er alltid gøy å lære nye ting.
Jeg må si meg enig med Håkon i at jeg synes ofte kursdeltakere har en tendens til å hoppe litt fort frem, men så lenge man vet hva man driver med er det jo sikkert greit.
Uansett så gleder jeg meg veldig til du kommer hjem så jeg kan høre og se alt dere har jobbet med i helgen!

Thomas said...

Et vanlig syn er at folk går for sakte fremover fordi de 1) bare kommenterer det hunden allerede gjør og/eller 2) kjører med "urene" signaler som håndsignal samtidig med verbale signaler. Mange går altså for langsomt frem fordi de går for fort frem/slurver ;)

Min påstand er: Det tar ca 5 rep å lære hunden klikket. Det tar ikke flere rep å lære hunden en kommando om atferden er bra, rekkefølgen er rett (kommando-atferd-belønning) og disse 3 er tydelig atskilt fra hverandre.

Morten Egtvedt said...

Om jeg forstår forskjellen i signalinnlæring riktig er det her hovedsaklig snakk om å hoppe over steg to (eller evt bare bruke 5 reps på den). Men sparer man egentlig noe tid på dette? I praksis vil man jo starte med steg 2 mens man fortsatt fokuserer på å få tilstrekkelig flyt på den frivillige adferden (altså, man begynner på steg to når den frivillige adferden er bra nok med tanke på presisjon, men mens du fortsatt kan få bedre flyt). Det betyr at det stort sett vil være snakk om like mange reps før man kan starte på steg 3 uansett.

Og hvis du da har "kommentert" adferden i lengre tid vil du ha en bedre betinging av signalet som gjør den mye mer effektiv i å forsterke at hunden venter på signalet i steg 3 (grunnen til at man eventuelt sliter på steg 3 og føler behov for å forsterke passivitet med godbit i stedet for signal, er etter min erfaring ofte nettopp at signalet ikke er betinget godt nok i steg 2 - og da er det nødvendigvis veldig vanskelig å forsterke venting...

At man tidlig bør variere posisjon osv er jeg derimot helt enig i. Men dette bør jo være en naturlig del av steg en og to...

Selv hopper jeg derfor aldri over steg 2 - tvert imot er nok dette et av mine favorittsteg. :-) Min erfaring er at hvis man "kommenterer" (= betinger) den frivillige adferden lenge nok går de neste stegene i signalinnlæringen veldig greit - spesielt med en signalklok hund som kjenner gangen i steg 1-5 fra før.

Men det er heldigvis mange måter å gjøre det på. Signalinnlæring er generelt enkelt så lenge den frivillige adferden først er flytende.

Thomas said...

"hvis du da har "kommentert" adferden i lengre tid"
"hvis man "kommenterer" (= betinger) den frivillige adferden lenge nok"


Problemet med å "gi signalet samtidig som hunden utfører atferden", er at atferden påbegynner først, deretter kommer signalet. Betingingen går betydelig raskere om signalet kommer før hunden utfører atferden. Det kan skje betinging ved omvendt betinging (reverse conditioning) også, det tar bare "lengre tid", må gjøres "lenge nok" eller fungerer når det dreier seg om meget betydningsfulle stimuli, som ved klassisk betinging av et signal til strømstøt.

"og føler behov for å forsterke passivitet med godbit i stedet for signal, er etter min erfaring ofte nettopp at signalet ikke er betinget godt nok i steg 2"

Selvsagt kan man forsterke passivitet med signaler om aktivitet, men med hete hunder, dvs hvis man har utvikla bra belønninger og hunden elsker atferden, kan det være mer effektivt og innebære bedre belønningsplassering (les: timing) å forsterke at hunden venter med en godbit. Ikke minst med tanke på klassisk betinging, hvordan vil du at hunden skal vente, hvilket stressnivå, hvilken muskelspenning og hvordan påvirker dette atferden på lang sikt, feks når hunden skal jobbe lenge uten belønning? Feks om du forsterke å ligge stille med innkalling og heftig dralek hver gang, øker eller minsker sannsynligheten for uro eller tjuvstart i praksis? Eller om du hver gang hunden setter seg i oppflukten feller fugl for den og ber den apportere, øker eller minsker sannsynligheten for at den knallapportereri praksis?

Morten Egtvedt said...

Hei Thomas!

Jeg er klar over at reverse conditioning kun fungerer i spesielle tilfeller, men ved steg 2 i signalinnlæringen er det ikke bare dette som skjer. Selv om adferden er påbegynt før signalet fortsetter jo adferden i de fleste tilfeller også en stund etter signalet - og ikke minst kommer også forsterkningen etter signalet. Så det er ingen tvil om at det skjer effektiv betinging. Og som Håkon sa i en tidligere kommentar - som regel gir man også på steg 2 signalet helt i starten på adferden eller når man ser at hunden skal til å starte på adferden (ingen vits i å vente med å gi signalet lenger ut i adferden enn nødvendig).

Når det gjelder å klikke/belønne for at hunden venter, gjør jeg også det noen ganger. Men jeg tenker ikke på dette som stimuluskontrolltrening, men som "getting the behavior". Hvis man under f.eks. avstandskommandering opplever at hunden skifter (frivillig) adferder for raskt, kan man først shape at hunden holder hver posisjon lenger, og så vente med å sette på signalene til hunden kan holde hver posisjon minst 4-5 sekunder uten problemer. Men før eller siden må man komme seg videre fra dette også.

Når det gjelder eksemplene du nevner vil alle øke sannsynligheten for at hunden venter (forutsatt riktig timing). Men all kjeding innebærer at hunden vil teste - og det må man jobbe seg gjennom. Eller man kan velge å unngå testingen ved å klikke og belønne i stedet... Hva som lønner seg kan sikkert variere.

Morten Egtvedt said...

Og sist men ikke minst... selv om det alltid skjer betinging er ikke stimuluskontroll en Pavloviansk prosedyre - det er operant betinging. Signalet skal først og fremst etableres som en diskriminativ stimulus - ikke en betinget stimulus (selv om det selvsagt blir det også).

HÅKON GROVEN said...

For meg, varierer det med type adferd hvor mange/få reps jeg har på steg to.

For enkelte adferder er det veldig lett å forutse om/når hunden kommer til å utføre adferden på nytt, for andre er det verre. Dette påvirker hvor modig jeg er.

Innkalling i skogen (feks. jakt og rundering) er eksempel på adferd hvor jeg vil ha relativt mange reps på steg to.

Sitt/ligg/stå er antageligvis eksempel på det motsatte, hvor jeg ofte kjører mange reps på kort tid under innlæring og dermed har "mer å gå på".

Thomas said...

Jeg tviler ikke på at Morten får bra stimuluskontroll på Kiras atferder. Men med tanke på hvor mange det er som sliter med timing, så tror jeg det er lettere om kjøre litt safe med tydelig forskjell mellom kommando-atferd-belønning og at nyansene mellom å gi kommando samtidig som, like før og før atferden ofte flyter litt sammen for mange trenere.

Men (som vanlig) er min bedre halvdel flinkere til å formulere seg, derfor henviser jeg til til vår blogg for videre redegjørelse for vårt syn.

Anonymous said...

Hei siv!!!
Du ruler med hunder:)
Hilsen ????

Morten Egtvedt said...

Det er etter mitt syn atskillig mer "safe" å kjøre lenger på steg 2... (enig med Håkon).

Jeg tror man ganske enkelt kan oppsummere hovedgrunnen til at enkelte klikketrenere har problemer med stimuluskontrollen: De trener for lite på det...

Fanny said...

Jag tror att Morten sa den största sanningen i den här diskussionen! Det är helt sant.

Emelie said...

"Jeg tror man ganske enkelt kan oppsummere hovedgrunnen til at enkelte klikketrenere har problemer med stimuluskontrollen: De trener for lite på det..."

Håller med!