De term Operante Conditionering komt je vast bekend voor. Naast klassieke conditionering vormt ook operante conditionering de theoretische basis voor veel psychotherapeutische interventies in het hier-en-nu. In deze blog nemen we je mee in de vraag wat er gebeurt tijdens het proces van operante conditionering. Op gedetailleerde wijze bespreken we deze vorm van gedragsbeïnvloeding. Daarnaast bespreken we hoe deze principes van invloed zijn op ons leven en op psychotherapeutische behandelingen in het hier-en-nu. Oftewel: Operante conditionering – Vroeger en Nu.
In deze blog lees je onder meer:
- Wat er gebeurt tijdens het proces van operante conditionering;
- De eerste onderzoeken naar operante conditionering;
- Verschillende vormen van bekrachtiging;
- De invloed van bekrachtigingsschema’s;
- Hoe bedrijven gebruikmaken van operante conditionering;
- Hoe gedragstherapeutisch behandelingen gebruikmaken van operante conditionering.
Wat gebeurt er tijdens het proces van operante conditionering
Operante conditionering gaat over de vraag hoe (toekomstig) gedrag beïnvloed wordt door de gevolgen van eerder uitgevoerd gedrag. En meer specifiek: door de positieve, dan wel negatieve gevolgen van het gedrag. Simpel gezegd: levert gedrag positieve gevolgen op, dan zal het in frequentie toenemen. Levert gedrag negatieve gevolgen op, dan zal het in frequentie afnemen.
Het volgende filmpje maakt op een leuke manier duidelijk dat we bereid zijn in ons gedrag ver te gaan als we weten dat er een positieve beloning op volgt.
De eerste onderzoeken naar operante conditionering
Hoewel operante conditionering vooral geassocieerd wordt met het werk van Skinner, borduurde het werk van Skinner vooral voort op de onderzoeken van Thorndike. Edward Thorndike was een Amerikaanse psycholoog die naar leren en hoe die leereffecten ons gedrag beïnvloeden. Zijn onderzoek richtte zich met name op dieren.
Thorndike voerde experimenten uit in zogenaamde “puzzleboxes”. Oftewel experimentele puzzelkisten waarin hij dieren, waaronder katten, plaatste. Deze kisten hadden mechanismen waarmee de dieren een bepaalde handeling moesten uitvoeren om te ontsnappen. Vaak ging dat over het indrukken van een pedaal of het overhalen van een hendel. Thorndike zag dat de dieren na verloop van tijd sneller werden in het uitvoeren van deze handelingen om te ontsnappen, en dit gedrag werd beïnvloed door de gevolgen.
Op deze manier kwam Thorndike tot zijn zogenaamde “Law of Effect”. Deze wet van effect stelt dat gedrag dat wordt gevolgd door positieve uitkomsten (beloningen) waarschijnlijk zal worden herhaald, terwijl gedrag dat wordt gevolgd door negatieve uitkomsten (straffen) minder waarschijnlijk zal worden herhaald. Deze wet legt de basis voor het begrip van operante conditionering, waarin de gevolgen van gedrag bepalen of het gedrag wordt versterkt of afgezwakt.
Naast de Law of Effect formuleerde Thorndike ook de “Law of Readiness”. Dit houdt in dat een organisme eerder geneigd is een handeling uit te voeren als het fysiologisch en psychologisch klaar is om dat te doen. Ook dit is in therapie relevant, omdat de omgeving soms iets van een cliënt kan vragen waar die fysiek of mentaal helemaal niet toe in staat is. Denk bijvoorbeeld aan de behandeling van kinderen of van mensen met LVB.
Skinner
Zoals gezegd, borduurde Skinner voort op het werk van Thorndike. Een belangrijk aspect van Skinners werk was de ontwikkeling en het gebruik van de zogenaamde “operant conditioning chamber”, ook wel bekend als de “Skinner Box”. In deze gecontroleerde omgeving plaatste Skinner dieren, meestal ratten of duiven, die specifieke gedragingen konden uitvoeren om beloningen te ontvangen. Het is belangrijk om op te merken dat Skinner zich richtte op min of meer vrijwillige en actieve gedragingen van het dier. Dit in tegenstelling tot het werk van Pavlov en de klassieke conditionering, waarbij vooral meer reflexmatige reacties (en reflexmatige gedragingen) worden onderzocht. De dieren in de Skinner-boxen probeerden dus invloed op hun omgeving uit te oefenen, vandaar ook de term Operante conditionering (“behavior to operate upon the envorinment”).
Skinner was een zogenaamde behaviorist, oftewel een aanhanger van de psychologische stroming die de nadruk legt op observeerbaar gedrag en de invloed van omgevingsfactoren op gedrag. Skinner was geïnteresseerd in het begrijpen van gedragsverandering en leren zonder veel aandacht te schenken aan interne mentale processen.
In het verlengde van Thorndike onderzocht Skinner de invloed van verschillende schema’s van bekrachtiging, waaronder continue bekrachtiging (oftewel beloning bij elke keer dat het gedrag optreedt) en partiële bekrachtiging (beloning treedt slechts af en toe op). Skinner kwam tot de ontdekking dat partiële bekrachtiging vaak veel effectiever bleek in het voortduren van gedrag. Dit zullen we hieronder verder toelichten.
Daarnaast ontwikkelde Skinner de concepten “shaping” en “chaining”. Shaping houdt in dat complex gedrag stapsgewijs wordt aangeleerd door het belonen van gedrag dat steeds dichter bij het gewenste gedrag komt. Chaining gaat over het aanleren van een reeks gedragingen die samen een complex gedrag vormen. Elk gedrag in de ketting dient als een signaal voor het volgende gedrag.
Chaining verwijst naar het aanleren van een reeks gedragingen die samen een complex gedrag vormen. Elk gedrag in de ketting dient als een signaal voor het volgende gedrag.
Ook ontdekte Skinner dat het aanleren van dit operante gedrag “context”-afhankelijk is. Als dieren geleerd hebben dat gedrag en een bepaalde context tot een beloning leidt, betekent dat niet automatisch dat ze dat gedrag in een andere context zullen herhalen. Hiermee introduceerde hij de Sd in de functieanalyse.
Operante conditionering en de functieanalyse
Om het effect van operante conditionering overzichtelijk weer te geven, wordt gebruik gemaakt van een zogenaamde functieanalyse. Met een functieanalyse brengen we in kaart wat het geobserveerde gedrag is (de R), wat de bekrachtigende consequenties van het gedrag zijn (Sr, oftewel de reinforcing Stimulus) en in welke context het uitgevoerde gedrag tot deze consequenten leidt (de Sd, oftewel de Stimulus discriminative). Bij de bekrachtigende stimuli (Sr) wordt onderscheid gemaakt tussen positieve bekrachtigers, oftewel bekrachtigers die het gedrag zullen doen toenemen; hiervoor wordt de term Sr-pos gebruikt. Daarnaast kennen we ook bekrachtigers die het gedrag zullen doen afnemen, oftewel negatieve bekrachtigers; hiervoor gebruiken we de term Sr-neg. Schematisch ziet dit er als volgt uit:
Voor meer informatie over het opstellen van functieanalyses verwijzen we naar de pagina over functieanalyse.
Verschillende vormen van positieve bekrachtiging
We maken dus onderscheid tussen positieve en negatieve bekrachtigers. Positieve bekrachtigers zorgen ervoor dat gedrag in frequentie toeneemt. Het visje dat een dolfijn ontvangt, nadat ze een bepaalde truc vertoont, wordt in dat opzicht beschouwd als een positieve bekrachtiger. Door deze positieve bekrachtiger (het visje) zal de dolfijn het gedrag vaker vertonen. Het optreden van negatieve bekrachtigers na een bepaald gedrag zorgt ervoor dat dat gedrag (verder) afneemt. Het toedienen van een schok nadat een kat een bepaald gedrag heeft uitgevoerd, zal ervoor zorgen dat het gedrag af zal nemen.
Positieve bekrachtigers van gedrag zijn op hun beurt weer onder te verdelen in drie vormen. Door het gedrag kan ten eerste iets prettigs toenemen, zoals het verkrijgen van een koekje nadat een bepaald gedrag is uitgevoerd. Een tweede positieve gevolg is dat iets negatiefs afneemt, zoals het verdwijnen van spanning nadat alcohol wordt gedronken. Tot slot kan door een bepaald gedrag iets negatiefs worden voorkomen. Zoals het voorkomen van afwijzing door je niet in sociaal contact te begeven. Hetgeen wat door het gedrag toe- of afneemt, wordt genoteerd als een S+ of een S-. Waarbij een S+ staat voor iets positiefs, oftewel een positieve stimulus en een S- staat voor iets negatiefs, oftewel een negatieve stimulus. Snoep of een compliment wordt door de meeste kinderen ervaren als een S+, oftewel iets positiefs. Een klap, uitgelachen worden of een onvoldoende op een toets wordt in dat opzicht vaak ervaren als een S-, oftewel iets negatiefs. Voor de notatie van de toename, afname of het uitblijven van de S+ of S- wordt gebruik gemaakt van aanvullende tekens. Namelijk van een + voor een toename, een – voor een afname en een ~ voor het uitblijven ervan. En deze worden geplaatst vóór de S+ of de S-. Een toename van iets prettigs wordt zodoende genoteerd als een +S+. Hierbij staat de + voor de S+ dus voor de toename en staat de S+ voor iets positiefs. Oftewel: +S+, toename van iets positiefs. Een afname van iets negatiefs wordt zodoende genoteerd als een -S-. Hierbij staat de – voor de S- voor de afname en staat de S- voor iets negatiefs. Oftewel: -S-, afname van iets negatiefs. Tot slot wordt het uitblijven van iets negatiefs dus genoteerd als ~S-. Hierbij staat de ~ voor het uitblijven van iets en staat de S- voor iets negatiefs. Oftewel: ~S-, uitblijven van iets negatiefs.
Al deze drie vormen, oftewel +S+, -S- en ~S-, worden positieve bekrachtigers genoemd. Omdat ze er voor zorgen dat gedrag in stand wordt gehouden of toeneemt.
Vormen van negatieve bekrachtiging
Naast positieve bekrachtigers bestaan er dus ook negatieve bekrachtigers. Deze negatieve bekrachtigers worden in een functieanalyse genoteerd als een Sr-neg. Oftewel negatieve reinforcing Stimuli. Net zoals er drie vormen van positieve bekrachtigers bestaan, zijn er ook drie vormen van negatieve bekrachtigers. Een toename van iets negatiefs, zoals toediening van een elektrische schok, zorgt er doorgaans voor dat een bepaald gedrag in frequentie afneemt. Op vergelijkbare wijze wordt dat genoteerd als +S-, oftewel toename van iets negatiefs. Ook kan door een bepaald gedrag iets positiefs afnemen. Het verlies van geld nadat het is vergokt door online poker is een voorbeeld van een afname van iets positiefs. Dit wordt genoteerd als -S+. Tot slot kan iets positiefs door een bepaald gedrag niet optreden. Een voorbeeld hiervan is het uitblijven van waardevolle diploma’s door overmatig veel te spijbelen. Deze drie typen bekrachtigers, oftewel, +S-, -S+ en ~S-, worden dus gezien als negatieve bekrachtigers. En zullen er dus doorgaans voor zorgen dat gedrag in frequentie zal afnemen.
Verschillende factoren zijn van belang bij de invloed van een bepaalde bekrachtiger op gedrag. Zo is de tijd tussen het uitvoeren van het gedrag en het moment waarop de consequentie ervan plaatsvindt, van invloed. Zo is het directe effect van afname van spanning (Sr-pos: -S-) meteen na het in de armen snijden voor cliënten met automutilatie van meer invloed dan de schaamte voor littekens (Sr-neg: +S-) die mogelijk pas jaren later zal worden ervaren.
De invloed van bekrachtigingsschema’s
Niet alleen de vorm van bekrachtiging (positief of negatief) is van invloed op de snelheid waarmee (nieuw) gedrag wordt aangeleerd. Ook de frequentie van optreden van deze bekrachtigers is van invloed. De manier en frequentie waarop de bekrachtigers worden toegediend, worden ook wel bekrachtigingsschema’s genoemd. Ook deze schema’s hebben invloed op hoe snel een bepaald gedrag wordt aangeleerd en het voortduren als de beloning uitblijft. Er zijn in hoofdlijnen twee typen bekrachtingsschema’s te onderscheiden: continue bekrachtiging en partiële bekrachtiging. Deze begrippen zullen we je hieronder verder toelichten:
- Continue bekrachtiging:
- Bij continue bekrachtiging wordt het gewenste gedrag consequent beloond elke keer dat het voorkomt. Dit betekent dat elke correcte respons direct wordt gevolgd door bekrachtiger (positief dan wel negatief).
- Continue bekrachtiging leidt vaak tot het snel aanleren van (nieuw) gedrag. Het organisme leert snel de associatie tussen het gedrag en de beloning, waardoor het gedrag snel wordt versterkt.
- Een belangrijk nadeel van continue bekrachtiging is echter dat het ook leidt tot snellere uitdoving van het gedrag als de bekrachtiging wordt stopgezet. Als de beloning stopt, zal het gedrag sneller afnemen.
- Partiële bekrachtiging:
- Bij partiële bekrachtiging wordt het gewenste gedrag niet consequent beloond. Er zijn verschillende manieren waarop partiële bekrachtiging kan worden toegepast, namelijk via vaste ratio, variabele ratio, vaste interval en variabele interval schema’s.
- Vaste Ratio (VR): Bekrachtiging vindt plaats na een vast aantal responsen. Bijvoorbeeld, een VR4-schema houdt in dat elke vierde respons wordt beloond.
- Variabele Ratio (VR): Bekrachtiging vindt plaats na een variabel aantal responsen. Bijvoorbeeld, een VR4-schema houdt in dat de bekrachtiging plaatsvindt na gemiddeld elke vierde respons, maar het exacte aantal kan variëren.
- Vaste Interval (VI): Bekrachtiging vindt plaats na een vast tijdsinterval. Bijvoorbeeld, een VI2-schema houdt in dat bekrachtiging plaatsvindt na elke twee minuten.
- Variabele Interval (VI): Bekrachtiging vindt plaats na een variabel tijdsinterval. Bijvoorbeeld, een VI2-schema zou betekenen dat bekrachtiging plaatsvindt na gemiddeld elke twee minuten, maar het exacte tijdsinterval kan variëren.
- Partiële Bekrachtiging leidt tot langduriger en resistenter gedrag. Organismen blijven het gedrag vertonen, zelfs als de beloning niet consistent is, omdat ze niet precies weten wanneer de beloning zal plaatsvinden.
- Toepassing en Effectiviteit:
- De keuze tussen continue en partiële Bekrachtiging hangt af van de specifieke doelstellingen en context van het gedragsonderwijs.
- Partiële Bekrachtiging wordt vaak toegepast in realistische situaties, omdat het beter bestand is tegen uitsterven wanneer de beloning niet altijd beschikbaar is.
- Variabele ratio-schema’s worden over het algemeen beschouwd als het meest effectief bij het handhaven van gedrag over de lange termijn.
Operante conditionering en het bedrijfsleven
Commerciële bedrijven kennen deze conditioneringsprincipes ook. En weten daarmee goed hoe ze consumentengedrag kunnen beïnvloeden. Dit doen ze op veel verschillende manieren. Bedrijven bieden bijvoorbeeld “spaarsystemen” aan, waarbij je met punten direct beloond wordt voor het doen van een aankoop. Die punten zijn na herhaalde aanschaf van spullen in te ruilen tegen een cadeau. Ook het aanbieden van zogenaamde “tijdelijke kortingsacties” geven je het idee dat je beloond wordt als je de aanschaf specifiek nu doet. En zullen je sneller aanzetten tot het doen van de aankoop. Dat de kortingsactie daarna het hele jaar doorloopt, merk jij daarna niet meer op.
Tot slot maken bedrijven, waaronder gokbedrijven, op een slimme/sluwe manier gebruik van gedragsbeïnvloeding door middel van de eerder genoemde partiële bekrachtiging. Gemiddeld per een zoveelste poging wordt je beloond voor je ingelegde geld, maar je weet nooit precies wanneer. Ook social media-bedrijven maken hier gebruik van. Ook op social-media weet je namelijk nooit precies wanneer je een door jouw gewenste post, foto of filmpje aantreft, maar eens in de zoveel tijd tref je weer een leuke post. Waardoor je naar social media blijft kijken.
Operante conditionering en (gedrags)therapie
Ook in therapie wordt veelvuldig gebruikgemaakt van de principes van operante conditionering, met name in de gedragstherapie. Ik zal hieronder een aantal voorbeelden van de toepassing van operante conditionering bij een aantal specifieke stoornissen met je doornemen:
- Gedragsactivering bij depressie: Gedragsactivering bij depressie richt zich op het doorbreken van de vicieuze cirkel van depressief gedrag door positieve activiteiten te bevorderen. Door het geleidelijk aan opbouwen en uitbreiden van deze activiteiten merkt cliënt dat deze bekrachtigend werken. Waardoor na verloop van tijd de waardering in het leven terugkomt.
- Aanpassing van de omgeving en Token Economy bij ADHD. Aanpassing van de omgeving gaat over het creëren van een ruimte waarmee gewenst gedrag wordt bevorderd. Een context waarin afleiding is geminimaliseerd, zal bij kinderen en volwassenen met ADHD sneller tot het gewenste gedrag leiden van met aandacht een taak afronden.
Ook kan een therapeut in een klasomgeving een Token Economy instellen voor kinderen met ADHD. Kinderen kunnen tokens verdienen voor specifiek gewenst gedrag, zoals aandachtig luisteren, taken voltooien of rustig gedragen. Deze tokens kunnen vervolgens worden ingewisseld voor beloningen, zoals extra gametijd, kleine cadeautjes of privileges. Deze vorm van positieve versterking moedigt het gewenste gedrag aan.
- Contingentie Management en Aversieve Conditionering bij middelenverslaving: Contingentie management (CM) is een vorm van gedragstherapie voor verslaving waarbij positieve bekrachtiging wordt toegepast op basis van het behalen van specifieke doelen, zoals nuchter blijven of het voltooien van bepaalde behandelingsstappen. Voorbeelden hiervan zijn de volgende: cliënten kunnen beloningen verdienen, zoals vouchers, kortingen, of andere tastbare voordelen, wanneer ze schone drugstests behalen of deelnemen aan therapiezittingen. Deze positieve versterking verhoogt de motivatie voor nuchterheid en therapietrouw.
- Aversieve Conditionering daarentegen is het toepassen van negatieve consequenties op ongewenst gedrag om gedragsverandering te bevorderen. Dit kan het creëren van een onplezierige ervaring zijn bij het vertonen van bepaald gedrag. Een voorbeeld hiervan is het gebruik van het medicijn Antabus. Dit middel zorgt ervoor dat binnen 5 tot 10 minuten na alcoholgebruik nare klachten optreden, zoals benauwdheid, een misselijk gevoel, hoofdpijn en hartkloppingen.
- Tot slot worden de principes van operante conditionering ook veel toegepast bij opvoedingsproblemen. Gewenst gedrag van het kind wordt beloond en ongewenst gedrag wordt opgevolgd door een ongewenste prikkel. Met name bij het beïnvloeden van het ongewenste gedrag is het van belang dat het ongewenste gedrag wordt afgekeurd en niet het kind zelf. Een mooi voorbeeld hiervan zien we in onderstaande video van Jo Frost:
Kennis van deze leertheorieën zal je helpen om je behandeling scherper vorm te geven. Tijdens de Basiscursus Cognitieve Gedragstherapie (Basiscursus CGT) en de Vervolgcursus Cognitieve Gedragstherapie (Vervolgcursus CGT) gaan we daar dieper op in. Mocht je je dit ook eigen willen maken, dan ben je van harte welkom!