Toiminnallinen ehdollistuminen (operantti): vahvistus, rangaistus ja oppiminen
Toiminnallinen ehdollistuminen (operantti): miten vahvistus, rangaistus ja uupuminen muokkaavat käyttäytymistä ja oppimista — teoriat, esimerkit (Skinner, Thorndike) ja käytännön sovellukset.
Toiminnallinen ehdollistuminen (operantti) on eräs oppimisen muoto, jossa yksilö muuttaa käyttäytymistään sen seurausten (tulosten) vuoksi. Oppija oppii, että tietyt teot johtavat tiettyihin seurauksiin, ja käyttäytyminen muuttuu sen mukaisesti.
Mitä seuraukset voivat olla?
Seuraus voi olla eri tavoin muokkaava:
- Vahvistus: positiivinen tai palkitseva tapahtuma. Tämä saa aikaan sen, että käyttäytymistä esiintyy useammin.
- Rangaistus: negatiivinen tai rankaiseva tapahtuma. Tämä saa aikaan sen, että käyttäytymistä esiintyy harvemmin.
- Uupuminen (extinktio): mitään selkeää seurausta ei tapahdu, joten käyttäytymisellä ei ole palkitsevia seurauksia. Kun käyttäytymisellä ei ole seurauksia, sen esiintyminen vähenee vähitellen.
Neljä perusmuotoa: positiivinen/negatiivinen vahvistus ja rangaistus
Operanttisessa ehdollistumisessa termit "positiivinen" ja "negatiivinen" eivät tarkoita moraalista arvoa, vaan viittaavat siihen, lisätäänkö jotain vai poistetaanko jotain:
- Positiivinen vahvistaminen (usein vain "vahvistaminen") tapahtuu silloin, kun tietynlaisesta käyttäytymisestä palkitaan. Tämä lisää käyttäytymisen esiintymistiheyttä. Skinnerin laatikkokokeessa palkkio on ruokaa, kun rotta painaa vipua.
- Esimerkki ihmisestä: luokanopettaja kehuu oppilasta, joka vastaa oikein — oppilas osallistuu jatkossakin aktiivisemmin.
- Negatiivinen vahvistuminen (joskus "pakeneminen") tapahtuu, kun vastenmielinen ärsyke poistetaan. Tämä lisää käyttäytymisen esiintymistiheyttä. Skinnerin laatikkokokeessa oli kova ääni, joka poistettiin, kun rotta painoi vipua.
- Esimerkki ihmisestä: kipua lievittävä lääke otetaan ja kipu häviää — henkilö oppii ottaa lääkkeen samanlaisessa tilanteessa.
- Positiivinen rangaistus tapahtuu, kun lisätään ärsykettä, jonka seurauksena käyttäytyminen tapahtuu harvemmin. Esimerkkinä ärsykkeistä voi olla kova ääni, sähköisku (rotta) tai selkäsauna (lapsi).
- Positiivinen rangaistus voi nopeasti vähentää ei-toivottua käyttäytymistä, mutta sillä on usein sivuvaikutuksia, kuten pelkoa tai aggressiota.
- Negatiivinen rangaistus tapahtuu, kun ärsyke otetaan pois, jolloin käyttäytyminen tapahtuu harvemmin. Esimerkkinä voidaan mainita, että lapsen lelu otetaan pois sen jälkeen, kun lapsi on käyttäytynyt ei-toivotulla tavalla.
- Tällainen rangaistus voi olla tehokas, mutta sen pitää olla selkeä, ennustettava ja oikeassa suhteessa käytökseen.
Oppimisen mekanismit ja muut ilmiöt
Operanttioppimisessa on useita ilmiöitä, jotka vaikuttavat käyttäytymisen muotoutumiseen:
- Vahvistusaikataulut: jatkuva vahvistaminen (esim. joka kerta palkitaan) tuottaa nopean oppimisen, mutta heikomman pysyvyyden; osittaiset (intermittense) vahvistusaikataulut (kiinteät tai muuttuvat, suhteeseen tai aikaan perustuvat) voivat johtaa vastustuskykyisempään oppimiseen ja eri reagointitaajuuksiin.
- Muokkaus (shaping): halutun monimutkaisen käytösmallin opettaminen tapahtuu palkitsemalla vähitellen läheneviä suorituksia.
- Yleistyminen ja erottelu (generalisaatio ja diskriminaatio): oppija voi yleistää vahvistetun käyttäytymismuodon samanlaisiin tilanteisiin tai oppia erottamaan, milloin vahvistus on mahdollista.
- Uupuminen (extinktio): jos vahvistus lakkaa, käyttäytyminen vähitellen heikkenee. Usein esiintyy aluksi jopa lisääntynyttä yrittämistä (extinction burst) ennen laskua.
- Spontaani palautuminen: jopa extinktiojakson jälkeen käyttäytyminen voi tilapäisesti palata, jos ärsyke tai tilanne toistuu.
Historia ja erot klassiseen ehdollistumisen kanssa
Toiminnallisen ehdollistumisen idean kuvasi ensimmäisenä Edward Thorndike (»law of effect»), ja sitä kehitti ja analysoi laajasti B.F. Skinner. Skinnerin tutkimuksissa käytettiin mm. Skinnerin laatikkoa, jossa eläimen käyttäytymistä ja sen seurauksia voitiin tarkasti kontrolloida ja mitata.
Operantti ehdollistuminen eroaa Pavlovin klassisesta ehdollistumisesta: operantti ehdollistuminen käsittelee vapaaehtoista tai tarkoituksellista käyttäytymistä, jota ohjaavat seuraukset (vahvisteet ja rangaistukset). Klassinen ehdollistuminen puolestaan liittyy automaattisiin reaktioihin tai refleksinomaisiin vasteisiin, jotka opitaan yhdistämällä ärsykkeitä (esim. ärsyke A ennustaa ärsykettä B).
Käytännön sovellukset ja eettiset näkökohdat
Operanttia ehdollistumista hyödynnetään laajasti kasvatuksessa, eläinten koulutuksessa, psykoterapiassa (esim. käyttäytymisterapiassa) ja työelämän motivoimisessa. Tehokkaat käytännöt perustuvat johdonmukaisuuteen, oikea-aikaisuuteen ja sopiviin vahvisteisiin.
Rangaistusten käyttöön liittyy eettisiä ja käytännöllisiä ongelmia: ne voivat aiheuttaa pelkoa, välttelevää käyttäytymistä tai vahvistaa ei-toivottuja tunteita. Siksi tutkijat ja käytännön tekijät suosivat usein positiivisia vahvisteita sekä negatiivisen rangaistuksen (esim. seurauksen poistaminen) huolellista ja oikeasuhteista käyttöä.
Yhteenveto
Toiminnallinen ehdollistuminen selittää, miten käyttäytyminen muokkautuu seurauksien avulla: vahvistukset lisäävät, rangaistukset vähentävät ja uupuminen poistaa käyttäytymistä. Käsitteen keskeisiä piirteitä ovat vahvistamisen ja rangaistuksen muodot (positiivinen/negatiivinen), vahvistusaikataulut, muokkaus sekä erot klassiseen ehdollistumiseen. Historiallisesti Thorndike ja Skinner ovat olleet merkittäviä hahmoja tämän tutkimusalueen kehityksessä.
Thorndiken vaikutuksen laki
Operanttista ehdollistumista, jota joskus kutsutaan välineoppimiseksi, tutki ensimmäisenä Edward L. Thorndike (1874-1949). Hän havainnoi kissojen käyttäytymistä, kun ne yrittivät paeta kotitekoisista palapelilaatikoista. Kun kissat laitettiin laatikoihin, kesti kauan ennen kuin ne pääsivät pakenemaan. Kokemuksen myötä onnistuneita reaktioita tapahtui useammin, jolloin kissat pääsivät pakenemaan lyhyemmässä ajassa. Thorndike esitti vaikutuksen laissa teorian, jonka mukaan tyydyttäviä seurauksia aiheuttavat käyttäytymismallit toistuvat yleensä, ja epämiellyttäviä seurauksia aiheuttavat käyttäytymismallit toistuvat harvemmin. Lyhyesti sanottuna jotkin seuraukset vahvistivat käyttäytymistä ja jotkin seuraukset heikensivät käyttäytymistä. Thorndike tuotti ensimmäiset tunnetut oppimiskäyrät tällä menettelyllä.
B.F. Skinner (1904-1990) laati yksityiskohtaisemman analyysin operanttisesta ehdollistumisesta. Skinner keksi operanttisen ehdollistumisen kammion, jonka avulla hän pystyi mittaamaan reaktionopeutta keskeisenä riippuvaisena muuttujana. Hän käytti vivun painallusten tai näppäinten nokkimisen tallentamista.
Operantin ehdollistamisen periaatteet:
- Syrjintä, yleistäminen ja kontekstin merkitys.
- Oppiminen tapahtuu kontekstissa.
- Suurin osa käyttäytymisestä on ärsykekontrolloitua: tietty reaktio tapahtuu vain silloin, kun asianmukainen ärsyke on läsnä.
- Ärsykekontrolli on tehokasta, vaikka ärsykkeellä ei olisi merkitystä vastaajalle.
- Sammuminen: Operanttinen käyttäytyminen sammuu, kun vahvistaminen loppuu.
- Vahvistukset tulevat vasta, kun oikea vastaus on annettu, eikä niitä välttämättä tule silloinkaan. Käyttäytyminen ei heikkene ja sammu tämän vuoksi.
- Tulokset riippuvat osittain siitä, kuinka usein vahvistusta saadaan.
- Vahvistusten aikataulut: Vahvistusten ajoitus on ratkaisevan tärkeää.
- Kiinteä aikaväli: Vahvistimia tarjotaan kiinteinä aikaväleinä edellyttäen, että asianmukainen vaste saadaan aikaan.
- Vaihteleva aikaväli: käyttäytymistä vahvistetaan sen keskimääräisen ajan perusteella, joka on kulunut edellisestä vahvistuksesta. Suhdeaikataulut: perustuvat vahvistusten ja reaktioiden väliseen suhteeseen.
- Kiinteä aikaväli: Vahvistusta annetaan tietyn määrän reaktioiden jälkeen. Erikoistapausta, jossa vahvistus annetaan jokaisen vastauksen jälkeen, kutsutaan jatkuvaksi vahvistukseksi.
- Vaihteleva aikaväli: Toimitusvahvistus perustuu tiettyyn keskimääräiseen vastausmäärään.
Kysymyksiä ja vastauksia
K: Mitä on operantti ehdollistaminen?
V: Operantti ehdollistuminen on oppimisen muoto, jossa yksilö muuttaa käyttäytymistään käyttäytymisen seurausten (tulosten) vuoksi.
K: Mitkä ovat operantin ehdollistumisen neljä kontekstia?
V: Operantin ehdollistumisen neljä kontekstia ovat positiivinen vahvistus, negatiivinen vahvistus, positiivinen rangaistus ja negatiivinen rangaistus.
K: Miten positiivinen vahvistaminen toimii?
V: Positiivinen vahvistaminen tapahtuu, kun tietystä käyttäytymismuodosta annetaan palkkio, joka lisää käyttäytymisen esiintymistiheyttä.
K: Miten negatiivinen vahvistaminen toimii?
V: Negatiivinen vahvistaminen tapahtuu, kun vastenmielinen ärsyke poistetaan, mikä lisää käyttäytymisen esiintymistiheyttä.
K: Miten positiivinen rangaistus toimii?
V: Positiivinen rangaistus tapahtuu, kun lisätään ärsykettä, jonka seurauksena käyttäytymistä esiintyy harvemmin.
K: Miten negatiivinen rangaistus toimii? V: Negatiivinen rangaistus tapahtuu, kun ärsyke otetaan pois, jolloin käyttäytyminen tapahtuu harvemmin.
K: Kuka löysi operanttisen ehdollistumisen ensimmäisenä?
V: Edward Thorndike löysi ensimmäisenä operanttisen ehdollistumisen, ja B.F. Skinner analysoi sitä myöhemmin.
Etsiä