Condicionament instrumental

Un altre Terme per a Condicionament Operatiu

El condicionament instrumental és un altre terme per a l' acondicionament operatiu , un procés d'aprenentatge descrit per primera vegada per BF Skinner . En condicionament instrumental, el reforçament o el càstig s'utilitzen per augmentar o disminuir la probabilitat que un comportament es produeixi de nou en el futur.

Exemples d'acondicionament instrumental

Per exemple, si un estudiant és recompensat amb elogis cada vegada que aixeca la mà a la classe, és més probable que torni a aixecar la mà en el futur.

Si també se li regaja quan parla de tornada, es torna menys probable que interrompi la classe. En aquests exemples, el professor utilitza un reforç per enfortir el comportament i el càstig de manejar per debilitar el comportament de conversa fora de lloc.

El condicionament instrumental també s'utilitza sovint en entrenament amb animals. Per exemple, l'entrenament d'un gos per donar-li la mà implicaria oferir una recompensa cada vegada que es produeixi el comportament desitjat.

Una breu història de condicionament instrumental

El psicòleg EL Thorndike va ser un dels primers a observar l'impacte del reforç en experiments amb pits de trencaclosques amb gats. Durant aquests experiments, Thorndike va observar un procés d'aprenentatge que ell va anomenar "aprenentatge de prova i error".

Els experiments van consistir a col·locar a un gat famolenc en una caixa de trencaclosques i, per tal d'alliberar-se, el gat havia d'esbrinar com escapar. Thorndike llavors va assenyalar el temps que va dur als gats a alliberar-se a cada assaig experimental.

Inicialment, els gats s'ocupaven de mètodes d'escapament ineficaços, rascant i cavant als costats o a la part superior de la caixa. Finalment, la prova i l'error conduiran els gats a empènyer o tirar amb èxit la ruta d'escapament. Després de cada assaig successiu, els gats es van dedicar cada vegada menys als comportaments d'escapament ineficaços i van respondre més ràpidament amb les accions d'escapament correctes.

Thorndike es va referir a les seves observacions com la Llei d'efecte . La força d'una resposta augmenta quan se segueix immediatament un "satisfactori" (reforç). D'altra banda, les accions que segueixen els efectes desagradables són més propensos a debilitar-se.

En els experiments de la caixa del trencaclosques de Thorndike, escapar de la caixa era més satisfactòria. Cada vegada que els gats van escapar amb èxit de la caixa, el comportament que immediatament va precedir a l'escapament es va veure reforçat i reforçat.

El treball de Thorndike va tenir un gran efecte en la investigació posterior de BF Skinner sobre el condicionament operatiu . Skinner fins i tot va crear la seva pròpia versió de les caixes de trencaclosques de Thorndike a les quals es va referir com una càmera operant, també coneguda com a caixa Skinner .

Com funciona l'acondicionament instrumental

Skinner va identificar dos tipus de comportaments clau. El primer tipus és el comportament dels enquestats. Són simplement accions que es produeixen reflexivament sense cap aprenentatge. Si toqueu alguna cosa calent, us respondreu immediatament a la mà. El condicionament clàssic se centra en aquests comportaments dels enquestats. En els experiments clàssics de Pavlov amb els gossos , el comportament dels enquestats va salivar a la presentació dels aliments. Tanmateix, formant una associació entre el so d'una campana i la presentació dels aliments, Pavlov va poder entrenar els gossos per salivar de manera senzilla al so d'aquesta campana.

Skinner es va adonar que, si bé el condicionament clàssic podria explicar com els comportaments enquestats podrien conduir a l'aprenentatge, no podrien donar compte de tot tipus d'aprenentatge. En lloc d'això, va suggerir que es tractava de les conseqüències d'accions voluntàries que conduïen a la major quantitat d'aprenentatge.

El segon tipus de comportaments és el que Skinner va referir a comportaments operants. Va definir aquests com qualsevol comportament voluntari que actua sobre el medi ambient per crear una resposta. Aquests són els comportaments voluntaris que estan sota el nostre control conscient. També són accions que es poden aprendre. Les conseqüències de les nostres accions tenen un paper important en el procés d'aprenentatge.

Reforç i càstig

Skinner va identificar dos aspectes clau del procés de condicionament operant. El reforç serveix per augmentar el comportament mentre el càstig serveix per disminuir el comportament.

També hi ha dos tipus de reforç i dos tipus de càstig diferents. El reforç positiu consisteix a presentar un resultat favorable, com ara donar a un nen un bon tracte després de netejar la seva habitació. El reforç negatiu implica l'eliminació d'un estímul desagradable, com dir-li a un nen que si menja totes les patates, no tindrà que menjar el bròquil. Atès que el nen considera que el bròquil té una conseqüència desagradable i menjar les patates condueix a l'eliminació d'aquesta conseqüència indesitjable, el menjar les patates es veu reforçat negativament.

El càstig positiu significa aplicar un esdeveniment desagradable després d'un comportament. L'atrapament, per exemple, és un exemple comú de càstig positiu. Aquest tipus de càstig sovint es coneix com a càstig per aplicació. Una conseqüència negativa s'aplica directament per reduir el comportament no desitjat.

El càstig negatiu implica llevar-se alguna cosa agradable després d'un comportament. Per exemple, si un nen no pot netejar la seva habitació, els seus pares podrien dir-li que no pot anar al centre comercial amb els seus amics. L'eliminació de l'activitat desitjable actua com un punisher negatiu del comportament anterior.