Què és l'condicionat operant i com funciona?

Com el reforçament i el càstig modifiquen el comportament

El condicionament operatiu (de vegades anomenat condicionament instrumental ) és un mètode d'aprenentatge que es produeix a través de recompenses i càstigs per al comportament. A través del condicionament operant, es fa una associació entre un comportament i una conseqüència d'aquest comportament.

Per exemple, quan una rata de laboratori premeu un botó blau, rep un pellet de menjar com a recompensa, però quan premeu el botó vermell rep un suau descàrrega elèctrica.

Com a resultat, aprèn a prémer el botó blau però evita el botó vermell.

Però el condicionament operant no és només una cosa que es porta a terme en entorns experimentals mentre que entrenen animals de laboratori; també juga un paper poderós en l'aprenentatge quotidià. El reforç i el càstig tenen lloc gairebé tots els dies en entorns naturals, així com en entorns més estructurats, com ara sessions d'aula o de teràpia.

Fem una ullada més profunda a com es va descobrir el condicionament operant, l'impacte que tenia sobre la psicologia i com s'utilitza per canviar comportaments antics i ensenyar-ne de nous.

Història de l'acondicionament operatiu

El condicionament operatiu va ser encunyat pel conductista BF Skinner , per la qual cosa de vegades el podríeu sentir com el condicionament Skinnerian. Com a conductista, Skinner creia que no era realment necessari mirar pensaments i motivacions interns per explicar el comportament. En lloc d'això, va suggerir que només cal considerar les causes externes i observables del comportament humà.

A través de la primera part del segle XX, el conductisme s'havia convertit en una força important dins de la psicologia. Les idees de John B. Watson van dominar aquesta escola de pensament des del principi. Watson es va centrar en els principis del condicionament clàssic , una vegada que va suggerir que podia prendre qualsevol persona independentment del seu rerefons i formar-los com a qualsevol cosa que triés.

Quan els primers conductistes havien centrat els seus interessos en l'aprenentatge associatiu, Skinner estava més interessat en com les conseqüències de les accions de les persones influien en el seu comportament.

Skinner va utilitzar el terme operant per referir-se a qualsevol "comportament actiu que actua sobre el medi ambient per generar conseqüències". En altres paraules, la teoria de Skinner va explicar com adquirirem la gamma de comportament apresos que exhibim cada dia.

La seva teoria va estar fortament influenciada pel treball del psicòleg Edward Thorndike , que havia proposat el que anomenava la llei d'efecte . Segons aquest principi, és probable que es repeteixin les accions seguides pels resultats desitjables, mentre que els seguits per resultats no desitjats tenen menys possibilitats de repetir-se.

El condicionament operatiu es basa en una premissa bastant senzilla: les accions que se segueixen amb el reforç es reforçaran i tindran més possibilitats de tornar-se a produir en el futur. Si explica una història divertida a la classe i tothom riu, és probable que tingui més probabilitats de dir-ho novament en el futur. Si aixeca la mà per formular una pregunta i el vostre professor elogia el vostre comportament educat, tindreu més possibilitats d'aixecar la mà la propera vegada que tingui una pregunta o comentari.

Com que el comportament va ser seguit de reforç, o un desig desitjable, es reforcen les accions anteriors.

A la inversa, les accions que comporten càstigs o conseqüències indesitjables es veuran afeblits i tindran menys possibilitats de produir-se en el futur. Si tornes a dir la mateixa història en una altra classe, però ningú riu d'aquesta vegada, tindreu menys probabilitats de tornar a repetir la història en el futur. Si escriu una resposta a classe i el vostre professor us renya, potser no tindreu possibilitats d'interrompre la classe.

Tipus de comportament

Skinner va distingir entre dos tipus diferents de comportaments

Tot i que el condicionament clàssic podria explicar els comportaments dels enquestats, Skinner es va adonar que no podia explicar un gran aprenentatge. En canvi, Skinner va suggerir que l'acondicionament operant tenia molta més importància.

Skinner va inventar diferents dispositius durant la seva infància i va posar aquestes habilitats a treballar durant els seus estudis sobre condicionament operant.

Va crear un dispositiu conegut com una càmera de condicionament operant, avui sovint referida com a caixa Skinner . La cambra era essencialment una caixa que podia contenir un animal petit, com ara una rata o un colom. El quadre també contenia una barra o clau que l'animal podria pressionar per rebre una recompensa.

Per fer un seguiment de les respostes, Skinner també va desenvolupar un dispositiu conegut com a gravadora acumulativa. El dispositiu registra les respostes com a moviment ascendent d'una línia de manera que es puguin llegir les taxes de resposta mirant el pendent de la línia.

Components de condicionament operant

Hi ha diversos conceptes clau en el condicionament operant.

Reforç en condicionament operatiu

El reforç és qualsevol esdeveniment que reforci o augmenti el comportament que segueix. Hi ha dos tipus de reforçadors:

  1. Els reforços positius són esdeveniments o resultats favorables que es presenten després del comportament. En situacions que reflecteixen un reforç positiu, una resposta o comportament es veu reforçada per l'addició d'alguna cosa, com l'elogi o una recompensa directa. Per exemple, si fas un bon treball en el treball i el teu administrador us dóna un avantatge.
  2. Els reforçadors negatius impliquen l'eliminació d'esdeveniments o resultats desfavorables després de mostrar un comportament. En aquestes situacions, una resposta es veu reforçada per l'eliminació d'alguna cosa que es considera desagradable. Per exemple, si el vostre fill comença a cridar al mig de la botiga de queviures, però s'atura una vegada que li lliuri un regal, tindrà més probabilitats de donar-li un cop de mà la propera vegada que comenci a cridar. La vostra acció va conduir a l'eliminació de la condició desagradable (el nen cridant), reforçant negativament el vostre comportament.

En ambdós casos de reforç, el comportament augmenta.

Càstig en condicionament operant

El càstig és la presentació d'un esdeveniment o resultat advers que provoca una disminució del comportament que segueix. Hi ha dos tipus de càstig:

  1. El càstig positiu , de vegades anomenat càstig per aplicació, presenta un esdeveniment o resultat desfavorable per debilitar la resposta que segueix. L'atrapat per la mala conducta és un exemple de càstig per aplicació.
  2. El càstig negatiu , també conegut com a càstig per eliminació, es produeix quan es treu un esdeveniment o resultat favorable després d'un comportament. L'eliminació del videojoc d'un nen després del mal comportament és un exemple de càstig negatiu.

En ambdós casos de càstig disminueix el comportament.

Horaris de reforç

El reforç no és necessàriament un procés senzill i hi ha una sèrie de factors que poden influir en la rapidesa i l'aprenentatge de les coses noves. Skinner va descobrir que quan i amb quina freqüència es reforçaven els comportaments, va jugar un paper en la velocitat i la força de l'adquisició. En altres paraules, el temps i la freqüència de reforç van influir en com es van aprendre noves conductes i quants comportaments es van modificar.

Skinner va identificar diversos horaris de reforç que van afectar el procés de condicionament operant:

  1. El reforç continu implica el lliurament d'un reforç cada vegada que es produeixi una resposta. L'aprenentatge tendeix a produir-se amb relativa rapidesa, però la taxa de resposta és força baixa. L'extinció també es produeix molt ràpidament una vegada que s'atura el reforç.
  2. Les programacions de ràtios fixes són un tipus de reforç parcial. Les respostes només es veuen reforçades després d'haver-se produït un nombre específic de respostes. Això normalment condueix a una taxa de resposta bastant constant.
  3. Els horaris d'interval fix són una altra forma de reforç parcial. El reforç es produeix només després d'un cert interval de temps que ha transcorregut. Les taxes de resposta continuen sent bastant estables i comencen a augmentar a mesura que s'apropa el temps de reforç, però lentament immediatament després del reforç.
  4. Els horaris de les ràtios variables també són un tipus de reforç parcial que implica un comportament reforçat després d'una variada quantitat de respostes. Això condueix tant a una alta taxa de resposta com a taxes d'extinció lenta.
  5. Els horaris d'intervals variables són la forma final de reforç parcial descrit per Skinner. Aquest cronograma consisteix a lliurar el reforç després d'haver transcorregut un període de temps variable. Això també condueix a una velocitat de resposta ràpida i una taxa d'extinció lenta.

Exemples d'acondicionament operatiu

Podem trobar exemples de condicionament operant en el treball que ens envolta. Tingueu en compte el cas dels nens que completen les tasques per guanyar una recompensa d'un pare o un professor, o els empleats que acaben els projectes per rebre elogis o promocions.

Alguns exemples més de condicionament operant en acció:

En alguns d'aquests exemples, la promesa o la possibilitat de recompenses causa un augment del comportament, però també es pot utilitzar l'acondicionament operatiu per disminuir un comportament. L'eliminació d'un resultat desitjable o una aplicació de resultat negativa es pot utilitzar per disminuir o prevenir comportaments no desitjats. Per exemple, es pot dir que un nen perdrà els privilegis de recessos si parlen de torn a la classe. Aquest potencial de càstig pot conduir a una disminució de les conductes disruptives.

Una paraula de

Tot i que el conductisme pot haver perdut gran part del domini que va mantenir durant la primera part del segle XX, l'acondicionament operant continua sent una eina important i sovint utilitzada en el procés d'aprenentatge i modificació del comportament. De vegades, les conseqüències naturals provoquen canvis en el nostre comportament. En altres casos, les recompenses i els càstigs poden ser conscientment incorregudes per crear un canvi.

El condicionament operatiu és una cosa que vostè pot reconèixer immediatament en la seva pròpia vida, ja sigui en el seu enfocament d'ensenyar als seus fills un bon comportament o en la formació del gos de la família per deixar de mastegar les seves sabatilles favorits. L'important que cal recordar és que, amb qualsevol tipus d'aprenentatge, de vegades pot passar temps. Tingueu en compte el tipus de reforç o càstig que pot funcionar millor per a la vostra situació única i avaluar quin tipus de calendari de reforç podria portar als millors resultats.

> Fonts:

> Coon, D & Mitterer, JO. Psicologia: Un Viatge. Belmont, CA: Wadsworth; 2014.

> Domjan, M. Els principis d'aprenentatge i comportament, setena edició. Stamford, CT; Cengage Learning; 2015.