Què és un calendari de reforç?

Quin impacte tenen els horaris de reforç sobre l'aprenentatge?

El condicionament operatiu és un procés d'aprenentatge en el qual s'adquireixen i modifiquen noves conductes a través de la seva associació amb conseqüències. Reforçar un comportament augmenta la probabilitat que torni a produir-se en el futur, mentre que castigar un comportament disminueix la probabilitat que es repeteixi. En el condicionament operant , els horaris de reforç són un component important del procés d'aprenentatge.

Quan i amb quina freqüència reforçar un comportament pot tenir un impacte dramàtic sobre la força i la velocitat de la resposta.

Què és un calendari de reforç?

Llavors, què és exactament un calendari de reforç i com funciona en el procés de condicionament? Un calendari de reforç és bàsicament una regla que indica quines instàncies d'un comportament es veuran reforçades. En alguns casos, es pot reforçar un comportament cada cop que es produeixi.

De vegades, pot ser que un comportament no es vegi reforçat.

Es pot utilitzar un reforç positiu o un reforç negatiu , depenent de la situació. En ambdós casos, l'objectiu del reforç és sempre enfortir el comportament i augmentar la probabilitat que torni a produir-se en el futur.

Podeu comprendre millor com funcionen els horaris de reforç pensant en l'aprenentatge tant en situacions d'aprenentatge natural com en situacions de formació més estructurades.

En els entorns del món real, els comportaments probablement no es veuran reforçats cada vegada que es produeixin. Per a situacions en què intenteu entrenar i reforçar una acció, com ara l'aula, l'esport o la formació d'animals, podeu optar per seguir un calendari específic de reforç.

Com veureu a continuació, alguns horaris són els més adequats per a determinats tipus de situacions de formació. En alguns casos, la formació pot requerir que comenci amb un cronograma i es canviï a un altre una vegada que s'hagi impartit el comportament desitjat. Alguns horaris de reforç poden ser més eficaços en situacions específiques.

Hi ha dos tipus d'horaris de reforç:

Horaris de reforç continu

En el reforç continu, el comportament desitjat es reforça cada cop que es produeix. Aquest calendari s'utilitza millor durant les etapes inicials d'aprenentatge per tal de crear una forta associació entre el comportament i la resposta.

Per exemple, imagineu que esteu tractant d'ensenyar un gos a treure la mà. Durant les etapes inicials d'aprenentatge, probablement s'adhereix a un horari de reforç continu per tal d'ensenyar i establir el comportament. Podeu començar agafant la pota de l'animal, realitzant el moviment tremolant, dient "Shake", i després oferint una recompensa cada vegada que feu aquesta seqüència de passos. Finalment, el gos començarà a realitzar l'acció pel seu compte, i pot optar per seguir reforçant cada resposta correcta fins que el comportament estigui ben establert.

Una vegada que la resposta s'adjunta fermament, el reforç normalment es canvia a un calendari de reforç parcial.

Horaris parcials de reforç

En el reforç parcial o intermitent, la resposta es reforça només una part del temps . Els comportaments coneguts s'adquireixen més lentament amb reforç parcial, però la resposta és més resistent a l' extinció .

Per exemple, penseu en el nostre exemple anterior on estaveu entrenant un gos per sacsejar. Encara que inicialment utilitzeu un programa continu, el reforçament de cada instància del comportament no sempre pot ser realista. Finalment, podeu decidir canviar a un calendari parcial on proporcioneu reforços després de tantes respostes o després d'haver transcorregut tant temps.

Hi ha quatre horaris de reforç parcial:

Els horaris de ràtios fixos són aquells en què la resposta només es reforça després d'un nombre determinat de respostes. Aquest cronograma produeix un elevat i constant ritme de resposta amb només una breu pausa després del lliurament del reforç. Un exemple d'un pla de ràtio fix seria lliurar un pellet d'aliment a una rata després de prémer una barra cinc vegades.

Els calendaris de la ràtio variable es produeixen quan es reforça una resposta després d'un nombre imprevisible de respostes. Aquest calendari crea un elevat índex de resposta. Els jocs d'apostes i loteries són bons exemples d'una recompensa basada en un calendari de ràtios variables. En un entorn de laboratori, això podria implicar lliurar pastilles alimentàries a una rata després d'una barra de premsa, una altra vegada després de quatre premses de barra, i un tercer pellet després de dues premses de barra.

Els horaris d'interval fix són aquells en què la primera resposta només es recompensa després d'haver transcorregut un temps determinat. Aquest calendari provoca altes quantitats de resposta al final de l'interval, però molt més lent respondre immediatament després del lliurament del reforç. Un exemple d'això en una configuració de laboratori reforçaria una rata amb un pellet de laboratori per a la primera barra de premsa després d'haver transcorregut un interval de 30 segons.

Els horaris d'intervals variables es produeixen quan es recompensa una resposta després d'haver transcorregut un temps imprevisible. Aquest cronograma produeix un ritme de resposta lent i constant. Un exemple d'això seria el lliurament d'un pellet alimentari a una rata després de la primera barra prement després d'un interval d'un minut, un altre pellet per a la primera resposta després d'un interval de cinc minuts i un tercer pellet d'aliment per a la primera resposta després d'un interval de tres minuts.

Com trieu un calendari de reforç?

Decidir quan reforçar un comportament pot dependre d'una sèrie de factors. En els casos en què esteu tractant específicament d'ensenyar un comportament nou, un programa continu és sovint una bona opció.

Una vegada que s'ha après el comportament, és preferible canviar a un calendari parcial.

A la vida quotidiana, els calendaris parcials de reforç es produeixen amb molta més freqüència que els continus. Per exemple, imagina si has rebut algun tipus de recompensa cada vegada que has aparegut per treballar a temps. En el seu lloc, aquestes recompenses generalment es basen en un calendari de reforç parcial molt menys previsible. No només aquests horaris són molt més realistes i fàcils d'implementar, sinó que també tendeixen a produir taxes de resposta més alts i menys susceptibles a l'extinció.

De manera realista, reforçar un comportament cada cop que es produeix pot ser difícil i requereix molta atenció i recursos. Els horaris parcials no només tendeixen a conduir a comportaments més resistents a l'extinció, sinó que també redueixen el risc que el subjecte es sacie. Si el reforç que s'utilitza ja no és desitjat o recompensat, el subjecte pot deixar de dur a terme el comportament desitjat.

Per exemple, imagineu que esteu tractant d'ensenyar un gos a seure. Si utilitzeu el menjar com a recompensa, el gos podria deixar de dur a terme l'acció una vegada que estigui ple. En aquests casos, una cosa així com lloança o atenció podria ser un reforç més eficaç.

Una paraula de

El condicionament operatiu pot ser una poderosa eina d'aprenentatge. L'horari de reforç utilitzat durant el procés de formació i manteniment pot tenir una influència important en la rapidesa amb què s'adquireix un comportament, la força de la resposta i la freqüència amb què es mostra el comportament. Per determinar quin horari és preferible, és important tenir en compte diferents aspectes de la situació, inclòs el tipus de comportament que s'està ensenyant i el tipus de resposta que es requereix.

> Fonts:

> Cooper, J, Heron, T, & Heward, W. Anàlisi del comportament aplicat . Nova Jersey: Pearson Education; 2007.

> Nevid, JS. Fonaments de la psicologia: conceptes i aplicacions. Boston, MA: Cengage Learning; 2016.