Feel the reinforcer

»Many of us succeed in teaching complex skills with talented and sometimes less talented dogs, and often helping a partnership find a happier, balanced life. But there are some people who find that although they follow the prescribed protocols, the results are below their expectations. Their dog is given lots of attention for a sit when greeting, but still jumps up. There are some dogs that find it hard to learn new behaviours with consistency. They learn a great heelwork style but seem to droop with predictability despite lots of clicks and treats when in correct position. On the surface everything seems to be on track but when exploring a little deeper there are undercurrents affecting the behaviour: reinforcement patterns

Mnogi vodniki občutijo frustracijo, ko kljub intenzivnemu delu s psom pravih rezultatov ni. Navzvzen se zdi, da delajo vse prav – klikajo prave trenutke, nagrajujejo obilno, psa spodbujajo in motivirajo. Sledenje shemi za uspešno šolanje ni dovolj, pa tudi reči, da se je treba zanesti na občutke, vodnikom začetnikom prav nič ne koristi. Na proces učenja je treba pogledati s ptičje perspektive in v verigi C&T videti še vse tisto, kar se dogaja sočasno. Uspeh navadno definitajo detajli, ki jih niti ne zaznavamo oz. jih sprejemamo na nezavedni ravni.

Čudovito potovanje v širna prostranstva učenja in vsega, kar nam pri tem stoji ob in na poti, je začel B. F. Skinner leta 1969, ko je drzno dejal, da: »What's inherited is not the behaviour but a susceptibility to reinforcement.« Tisto, na kar bi se torej morali fokusirati, niso vedenja sama, ampak psičkova dovzetnost za krepitev vzorcev vedenj. Knjiga Kay Laurence 40 let pozneje pokaže, da je reinforcement in to, koliko ga (ali ga ne) uporabljamo pravilno, ključni moment uspešnega šolanja s klikerjem oz. s pozitivno motivacijo sploh. C&T je le majhen delček v procesu učenja, katerega okvir je nagrajevanje. V naravi vedenj je, da se spreminjajo. Spreminjajo se tudi že naučena vedenja, kajti nobeno, še tako perfektno naučeno vedenje, ni stalno in za zmeraj. In kaj spreminja vedenja? Zgodovina nagrajevanj.

Knjigo sem prebrala na dušek in prepričana sem, da bo kmalu postala eno temeljnih klikeraških čtiv. Kay je odličen inštuktor, brilijanten pedagog in luciden pisec. Presrečna sem, da sem knjigo prejela z njenim osebnim posvetilom. Mislim, da bo feel the reinforcer moja nova klikeraška mantra. Toplo priporočam!

Vir in © copyright: Kay Laurence, Teaching with Reinforcement for every day and in every way, 2009.

Klikerjevih trinajst plus sedem

Kaj je smisel vzgoje in šolanja psa? Kakšen cilj si postavimo najpozneje v trenutku, ko pes pride v naš dom? Zakaj bi radi obiskali pasjo šolo in kaj od nje pričakujemo? Kaj pomeni, da pes zna sedi, prostor in poleg? Ljudje me navadno ne sprašujejo tega, ampak mi postavljajo mikroskopsko detajlna vprašanja, kako naj se česa lotijo; če bi jih zanimala celotna slika, bi v enem zamahu dobili odgovor na vse zastavljene dileme in izvedeli še marsikaj zraven. Preden se česar koli lotimo, bi morali definirati, kaj bomo psa naučili ter kakšno metodologijo bomo pri tem uporabili. Če želimo dober rezultat, potrebujemo dober načrt dela – načrt s ciljem, opredeljeno metodologijo in definiranimi koraki. Učenje malo tega in malo onega malo po tem in malo po onem sistemu je sicer bolje kot s psom nič početi; a tako učenje je luknjičasto in žal marsikdaj privede do neljubih psičkovih vedenj. Ukvarjanje s parcialnimi problemi navadno žal ne reši niti detajlov; kadar si začrtamo pot, se z učenjem ene vaje kaže napredek še na par drugih področjih.

Če bi izmed vseh vedenj klasičnega repertoarja pasjega šolanja izbrala esencialna vedenja, ki ključno vplivajo na nadaljnje delo s psom in naj bi jih torej pričeli učiti prvi dan, ko je pes z nami, bi izbrala:
• samokontrola
• igra
• targeting
• pozornost
• hoja na popuščenem povodcu
• zavedanje zadnjega dela telesa
• odpoklic
• sedi
• prostor
• stoj
• prinašanje
• skakanje
• naprej.
V točno tem vrstnem redu. Učenje trikcev je zabavno, naštete vaje pa so osnova, na kateri lahko gradimo kar koli; in čas za učenje osnov je, ko je pes mlad. Takrat ne učimo perfekcije in bržkone večina vedenj sploh ne bo na povelju. Ključnega pomena je, da ta vedenja pričnemo učiti mladička. Naredimo si načrt, določimo metode in beležimo uspehe na poti, ki sproti krmarijo delo.

Med t. i. toolbox exercises pa bi dala vaje:
• watch
• touch
• go to mat
• follow
• sendaway
• wait
• stand.
V točno tem vrstnem redu. Iz teh osnovnih legokock namreč lahko sestavljamo katera koli druga vedenja; brez njih je učenje drugih vedenj manj učinkovito.

Smisel učenja naj ne bo C&T za stotine nam všečnih vedenj, ampak v vsakdanjem življenju stabilen, samozavesten pes. Tak pes nam bo za mimogrede v veselje tudi v izbranem pasjem športu. Šolanje bo steklo, kadar bomo videli celo sliko in ne le tega, da se bo pes usedel, ko mu bomo poveljevali sedi. To se lahko napifla vsak pes; umetnost pa je doseči, da bo to vedenje zanesljivo in v brezpogojnih korelacijah z drugimi vedenji. Cilj šolanja naj bo, da bo naša komunikacija s psom tako samoumevna, da ne bomo potrebovali povelj, da bi se razumeli. Pot spoznavanja je pot učenja; brez učenja ni nič.

Vaja za odpoklic: food circuit

Ljudje me največkrat vprašajo, kako naj psa odvadijo vlečenja na povodcu ter kako naj ga naučijo, da bo prišel na klic. Vaj za hojo na popuščenem povodcu je kar nekaj; vaji Kay Laurence in Turid Rugaas sta delovali prav pri vseh psih, s katerimi sem delala. Od discipliniranosti vodnika je odvisno, v kolikšnem času bosta hojo na popuščenem povodcu osvojila; vaji se da natančno opisati in vaditi po enoznačnem vzorcu, rezultat je zagotovoljen in raven uspešnosti visoka na zelo velikem vzorcu pasje populacije.

Z odpoklicem je drugače, zanj ne obstaja ena sama, vselej enaka, enoznačno opisljiva vaja. Tudi časovna enota, ki prinese za vodnika opazen napredek, je bistveno daljša kot pri hoji na popuščenem povodcu. Odpoklic je odsev odnosa med vodnikom in psom, ki se razvija skozi številne druge vaje oz. skozi delo s psom nasploh; kadar pri odpoklicu nekaj škripa, je to znak, da moramo temeljito premisliti celoten potek šolanja oz. našega dela s psom. Logika je jasna: pes, ki mu je sodelovanje z vodnikom v užitek, ki ima z vodnikom urejen odnos, bo k vodniku vselej z veseljem prišel, saj mu izkušnje (in pes je v prvi vrsti bitje izkušenj) govorijo, da je vodnikova bližina najbolj luštna stvar na svetu. Če bomo psa šolali s tem temeljnim vodilom, da smo torej za psa najbolj zanimivo bitje na svetu, nam ne more spodleteti ne glede na konkretne šolske vaje, ki jih bomo s psom delali.

Kljub temu pa na srečo mnogih vodnikov obstajajo tudi ciljane vaje, torej vaje s posebnim poudarkom prav na odpoklicu. Vaja Kay Laurence looking at you je primarno sicer vaja za pozornost na vodnika, a elementi, ki jih psu privzgaja, so tudi elementi dobrega odpoklica oz. prihajanja k vodniku. Joanna Hill pa je oblikovala izjemno učinkovito, na odpoklic fokusirano vajo, ki jo je poimenovala food circuit.

Pes ne bo pričel po par ponovitvah vaje prihajati k vodniku v brezhibnem odpoklicu, je pa zagotovo res, kar pravi Joanna: »This exercise can improve your dog's recall dramatically.« Vajo večkrat ponavljamo vsak dan v najrazličnejših okoliščinah, idealna priložnost so denimo sprehodi. Po sto in sto ponovitvah bomo psu privzgojili med drugim mišični spomin, ki ga bo usmerjal v vodnikovo bližino. Vaja je po mojih izkušnjah za pse izjemno zanimiva zato, ker je energična (ni statična), ker je treba za priboljškom skočiti (ga loviti) ter poiskati (izvohati). Vaja je za psa zanimiva do te mere, da se jo da uporabiti celo kot nagrado, denimo pri heelworku. Zagotovo je izredno zanimiv način interakcije med vodnikom in psom in da preverjeno odlične rezultate tako pri odpoklicu kot pri hoji poleg.

Vir in © copyright: Joanna Hill, The motivation movie, 2002.

Tema za off-topic vprašanja

Možnost komentiranja prispevkov o pasjem šolanju sem vključila, da se lahko pogovarjamo o obravnavani temi in šolanju nasploh. Da bodo teme pregledne tudi za tiste, ki bodo brali za tekočimi debatami, naj bodo, prosim, tule vprašanja in ideje, ki niso neposredno povezani s prispevkom.

Sekvenčni trening

Ena temeljnih oblik treninga za canine freestyle je sekvenčni trening; psa navaja na različna sestavljanja posameznih vedenj v večje enote, je odlična vaja za utrjevanje naučenih vedenj in pozornosti psa na vodnika. Za sekvenčni trening je potrebnega veliko psičkovega potrpljenja, zato ga nikdar ne izvajamo na začetku treninga, ko je pes prepoln energije. Najprej ga utrudimo z učenjem novih vedenj, sledijo sekvence. Učenje sekvenc je za psa naporno, zato ne vadimo predolgo, največ 10 minut. Sledi spet trening posameznih vaj, pri katerih nagrajujemo vsako izvedbo; sekvenčnemu treningu, pri katerem je nagrajevanja v bistvu malo, naj torej sledi učenje, pri katerem je nagrajevanja veliko. Ker je frekvenca nagrajevanja majhna, nagrajujemo z več priboljški, in sicer s tolikimi, kolikor vedenj je do dvojnega klika pes izvedel.

Za začetek si izberemo tri vedenja, ki jih pes odlično obvlada. Ni pomembno, da bo sekvenca izpadla všečno, saj sekvenčni trening ni sestavljanje koreografije, ampak trening za povezovanje vedenj. Predpogoj je, da pes ta vedenja res izvrstno obvlada. Izbrana tri vedenja sestavljamo v različne sheme (glej sliko), in sicer tako, da je pes nagrajen vsakič pri drugi vaji. S tem preprečimo, da bi pes pričel delati bližnjice do vaje, pri kateri je nagrajen.

Če pes v sekvenci ABC vajo C naredi narobe, za vedenjem C ne kliknemo dvojno in ne nagradimo. Sekvenco naredimo še enkrat kot celoto in potem potrdimo. Če pes ne naredi vaje A ali B, ne kliknemo enojno, ampak gremo naprej k naslednjemu vedenju v sekvenci. Napake pri vajah v sekvenci pa pomenijo, da pes vaje ne zna dovolj dobro, zato vajo izoliramo in treniramo posebej. Vaj nikdar ne treniramo v sekvenci, kajti smisel sekvence je sestavljanje večjih enot in ne trening posameznih elementov!

A = obrat v levo pred vodnikom
B = skok čez vodnikovo desno nogo
C = okrog vodnika naprej z vstopom na vodnikovi desni

Nagradimo vsako vedenje posebej
A, dvojni klik + 1 priboljšek
B, dvojni klik + 1 priboljšek
C, dvojni klik + 1 priboljšek

Sestavimo dve vedenji
A, enojni klik -> B, dvojni klik + 2 priboljška
B, enojni klik -> C, dvojni klik + 2 priboljška
C, enojni klik -> A, dvojni klik + 2 priboljška

Sestavimo tri vedenja
A, enojni klik -> B, enojni klik -> C, dvojni klik + 3 priboljški
B, enojni klik -> C, enojni klik -> A, dvojni klik + 3 priboljški
C, enojni klik -> A, enojni klik -> B, dvojni klik + 3 priboljški

Vaje za vodnika: tajming pri klikanju, enojni in dvojni klik

Trening z Attilo se je vedno začel z vajami ogrevanja; za vodnika in za psa. Najprej smo naredili nekaj vaj za čim natančnejši tajming pri klikanju, za enojni in za dvojni klik. Nekateri so želeli vaje podajanja žog kar preskočiti, a Attila je bil neizprosen in nam je vsak dan za dobro jutri odpredaval, da moramo v filigranske detajle razviti svoje motorične spretnosti rokovanja s klikerjem, če želimo ujeti in oblikovati filigransko natančna pasja vedenja. Klikanje mora potekati avtomatično, samodejno, naše reakcije morajo biti takojšnje in ne da na to posebej mislimo. Zato: vaja, vaja, vaja!

Tajming pri klikanju je najlažje vaditi z žogo, ki si jo podajamo; če smo sami, pa žogo mečemo ob tla, steno ali kak drug predmet, ki se ga žoga mora dotakniti. Uporabljamo različno velike žoge, ki letijo in padajo različno hitro. Meni se zdi posebej zabavno metanje kamenčkov v vodo, pri čemer klikam njihov štrbunk na vodno gladino. Kliker imejmo vedno v roki, saj večkrat ko bomo kliknili, bolj tekoč bo naš klik in spretneje ga bomo uporabili pri šolanju. Zelo pomembno je, da tekoče klikamo z obema rokama, saj je to, v kateri roki imamo kliker, odvisno od psičkove pozicije pri vaji.

Vaja za dvojni klik
Delamo v parih; partnerju vržemo žogo. Označujemo konec vedenja, zato z dvojnim klikom označimo trenutek, ko jo partner ujame. Klika tisti, ki vrže.

Če smo sami, žogo lahko vržemo ob steno ali tla in z dvojnim klikom označimo trenutek, ko se žoga dotakne stene ali tal.

Vaja za enojni in dvojni klik
Delamo v parih; partnerju vržemo žogo, in sicer tako, da se na polovici najine razdalje žoge odbije od tal, potem jo partner ujame. Dotik žoge s tlemi označimo z enojnim klikom, trenutek, ko jo partner ujame, pa z dvojnim klikom. Klika tisti, ki vrže. Istočasno je to lahko tudi vaja za označevanje vedenj s kontinuiteto; enojni klik krepi vedenje, ki se po kliku nadaljuje (žoga nadaljuje z gibanjem), dvojni klik pa krepi pozicijo, z njim se torej vedenje konča (partner ujame žogo, ki obmiruje). Če smo sami, žogo vržemo ob tla tako, da se potem odbije še ob steno ali kak drug predmet.

Enojni klik in dvojni klik

Canine freestyle koreografija je sestavljena iz številnih vedenj, v dobrih koreografijah pes v par minutah izvede na desetine razlučnih vedenj; katalog osnovnih vedenj za CF obsega več kot 100 vaj. To, da psa naučiš posamezno vedenje, je pravzaprav še najlažji del in od psa in vodnika zahteva nekaj časa in potrpežljivosti. Naučiti pa se da skoraj vsakega psa skoraj čisto vse. Že Bob Bailey je dejal, da je »training a mechanical skill«. Vedenja sestaviti v krajše in potem vse daljše nize pa je ta težji del posla in tu se začne umetnost. Umetnost je sestavljati nize vedenj in umetnost je, da tak nastop ne razpade na prezentacijo posameznih trikcev, ampak deluje kot koherentna celota.

Na seminarju z Attilo Szkukalekom se nismo ukvarjali s posameznimi vedenji, ne s hojo ob vodniku in ne z učenjem trikcev, ampak smo štartali na točki, ko več vedenj sestaviš v večjo enoto, t. i. sekvenco. Teorija pravi, da psu daš ključ, da vedenje izvede, pa še en ključ za drugo vedenje, pa tretji ključ za tretje vedenje. Na koncu klikneš in daš psu nagrado. V praksi pa je navadno precej drugače, saj prej ali slej v nizu psa, ki je vajen, da izvedbi vaje sledita klik in nagrada, odsotnost klika zmede. Tudi če predhodno posamezne vaje vadimo po shemah variabilnega nagrajevanja, da torej psa nagradimo recimo za tretjo, pa potem za peto izvedbo vaje, je psičkovo dojemanje bistveno drugačno, če ponavljamo eno samo vedenje ali pa če v nize sestavljamo več različnih vedenj, ki si sledijo tesno skupaj, tako rekoč drug za drugim (brez povezovalnega vmesnega poleg).

V situacijah s kompleksnimi, sestavljenimi vedenji, je še bolj kot sicer pomembno, da je naša komunikacija s psom jasna in da so signali, ki prihajajo od nas, nedvoumni. Vsaka vaja ima začetek, trajanje in konec. Začetek vaje jasno definira ključ, navadno besedno ali telesno povelje, s katerim pri psu sprožimo vedenje. Konec vedenja naj označi t. i. končni oz. nagradni signal (ang. reward signal, terminal bridge), ki mu sledi nagrada. Vmes pa imamo pri kontinuiranih vedenjih (poleg) ali sestavljenem nizu vedenj več možnosti, da psu sporočimo, da je na pravi poti. Klasična teorija pravi, da uporabljamo signal za nadaljevanje, denimo »še še še« ali »priiiden«, s katerim psa spodbujamo, naj nadaljuje, ker bo nagrada zdaj zdaj prišla. Attila ima rad še bolj čisto komunikacijo, zato vedenja označuje samo s klikerjem, govorne signale pa ima rezervirane za ključe, ki sprožajo vedenja, torej izključno za povelja.

Za označevanje končnih vedenj uporablja dvojni klik (ang. double click), ki je terminalni signal in napoveduje nagrado, ki dvojnemu kliku sledi. Za označevanje posameznih ponovitev istega vedenja ali različnih vedenj znotraj niza pa uporablja enojni klik (ang. single click). Prvi dan sem bila odločno proti takemu domnevno komplikatorskemu sistemu, moja psica je bila navajena na enojni klik in tega sem se nameravala držati. A prav kmalu sem ugotovila, da medtem ko drugi sekvence sestavljajo hitro in tekoče, jaz psici z neoznačevanjem vmesnih vedenj ne dajem nobenih jasnih navodil za delo; psica je bila frustrirana in zmedena. Zato sem jo zvečer naklikala na dvojni klik in se resnično nisem mogla načuditi, kako tekoče sva potem delati dalje.

Enojni klik uporabljamo za označevanje pravilno izvedenega predhodno naučenega vedenja, ki mu sledi nova ponovitev istega vedenja ali nova ponovitev drugega vedenja. Enojnemu kliku ne sledi nagrada. Če se pes zmoti oz. z izvedenim vedenjem nismo zadovoljni, to označimo le z odsotnostjo klika. Zadnje vedenje v nizu enakih vedenj ali zadnje vedenje v sekvenci sestavljenih vedenj pa označimo z dvojnim klikom. Dvojni klik je vedno terminalen, tj. končen, vedno mu tudi sledi nagrada, en košček hrane, jackpot hrane ali igra kot nagrada. Dvojni klik se uporablja tudi pri učenju novih vedenj, in sicer takrat, kadar klasično klikeraštvo predvideva enojni klik. V komunikaciji s psom so dvojni klik, enojni klik ali odsotnost klika naše edino sporočilo psu glede izvedenega vedenja, torej služijo označevanju vedenj; besedni ali telesni signali pa so zgolj ključi, ki vedenja sprožajo, jih pa ne označujejo. Pes, ki pričakuje besedo kot sprožilec vedenj in klik kot komentar vedenja, bo vedenja izvajal bolj natančno in suvereno kot pes, ki bo moral besedo v enem kontekstu razumeti kot signal, ki sproži vedenje, v drugem primeru pa kot navodilo glede že izvedenega vedenja.

Izjemno me je presenetila uporabnost enojnega klika za potrjevanje dolgo trajajočih vedenj, denimo pri vaji poleg. Psico med hojo z enojnimi kliki potrjujem za pravilno vedenje, a kliku ne sledi nagrada; ko narediva pričakovano dolg niz, vedenje zaključim z dvojnim klikom, ki pa mu sledi nagrada. Ta sistem se mi je bistveno bolje obnesel kot spodbujanje z vmesnim »priiidna«, za psa je očitno jasnejši, za vodnika pa preprostejši, ker je mehanski.

V sestavljanju sekvenc enojno in dvojno klikanje izgleda denimo takole.
A = obrat v levo pred vodnikom
B = skok čez vodnikovo desno nogo
C = okrog vodnika naprej z vstopom na vodnikovi desni
A, enojni klik –> B, enojni klik –> C, dvojni klik + nagrada

Meni se je razlika v natančnosti in mirnosti izvedbe vaj pokazala že pri treh različnih vedenjih, sestavljenih v sekvenco. Enojni klik za vsakim vedenjem psa na nek način pomiri oz. potrdi, da je vse ok, da delo tako, kot pričakujemo, da pa se igramo dalje. Ko v sekvenco sestavimo 10 ali 20 vedenj, je delo brez vmesnega enojnega klika konfuzno za psa in za vodnika – pes je frustriran v pričakovanju, kaj se gremo, vodnik pa mora misliti na podaljševanje s »priiiden«, za katerega pravzaprav ni jasno, kdaj naj ga sploh izrečemo (med samo vajo, med dvema vajama?), ter poleg tega psa še voditi. Klikanje komunikacijo poenostavi za oba.

Presrečna sem, da se je Attila tako prisrčno namuzljivo nasmejal, ko sem mu prvi dan omenila, da ne bom dvojno klikala, ampak da bom v sekvencah potrjevala s »priiiden«. Dal mi je misliti, da ima svoje razloge, da je v trening CF uvedel dvojni klik. Ko sem potem v sekvenčnem treningu vodila svojo torpedno hitro psico, seveda ni bilo časa za noben moj »priiiden«, natančnost psičkinih vedenj pa je bila obratno sorazmerna s številom vedenj v sekvenci – več vedenj ko sva nanizali, bolj šlampasto so bila izvedena. Ko sem ubogala Attilo in za vsakim pravilno izvedenim vedenjem enkrat kliknila, se je psica skulirala in bila pripravljena plesati, kakor sem ji dirigirala, tudi deset minut skupaj. Torej: enojni klik za »ok si naredila, gremo dalje«, dvojni klik pa za »ok si naredila, konec je, evo nagrade«.

Valentinovi višnjevi piškoti

sestavine
60 g margarine, masla ali druge maščobe
150 g polnozrnate moke
100 g višenj
voda po potrebi

priprava
Maščobo stopimo, dodamo višnje in zmiksamo. Stresemo v posodo z moko. Dobro zmešamo, po potrebi dodamo tekočino in zgnetemo v gladko zmes. Testo pustimo na hladnem počivati eno uro. Potem ga razvaljamo na debelino 0,5 cm in izrežemo piškote v obliki srca. V pečici, ogreti na 180 ˚C, jih pečemo 20 minut, dokler niso hrustljavo zapečeni. Iz navedenih sestavin dobimo en velik pladenj piškotov.

Kako se je vse skupaj začelo, 1. del: Ivan Pavlov


Komentiranje prispevkov

V želji, da bi se v pogovorih o izkušnjah in pogledih na šolanje s klikerjem naučili več ali si izmenjali stališča, sem dodala možnost komentiranja prispevkov. Lepo prosim, da se držite obravnavane teme. Komentarji bodo moderirani in v primeru, da bodo napisani nerazumljivo ali žaljivo, izbrisani, njihov avtor pa blokiran. Možnost objave imajo avtorji, ki se predstavijo z imenom ali vzdevkom; anonimni prispevki ne bodo objavljeni.

Zadnje dni mi v ušesih kar naprej odzvanja prijeten klikeraški pozdrav, katerega avtor je Morten Egtvedt: happy clicking!

If there ever comes a day when we can't be together
keep me in your heart, I'll stay there forever.
(Winnie the Pooh)

Syndicate content