- Antecedents de el condicionament operant
- Conceptes bàsics de el condicionament operant
- - Reforç
- reforç positiu
- reforç negatiu
- reforçadors primaris
- reforçadors secundaris
- - Contingència de tres termes
- - Càstig
- càstig positiu
- càstig negatiu
- - Extinció
- - Generalització
- - Discriminació
- Programes de reforç
- Programes de reforç continu
- Programes de reforç intermitent
- Programes de raó fixa
- Programes de raó variable
- Programes d'interval fix
- Programes d'interval variable
- canvi conductual
- Aproximacions successives o moldejament
- encadenament
- referències
El condicionament operant o condicionament instrumental és un tipus d'aprenentatge on el comportament es controla amb les conseqüències. Es basa en la idea que els comportaments que es reforcen tendeixen a mostrar-se en més ocasions, mentre que els comportaments que són castigats s'extingeixen.
Quina és la diferència entre el condicionament operant i el condicionament clàssic? En el condicionament operant, una resposta voluntària és seguida per un reforçador. D'aquesta manera, la resposta voluntària (per exemple, estudiar per a un examen) és més probable que es realitzi en el futur.
Caixa de Skinner
A contra, en el condicionament clàssic un estímul s'activa automàticament una resposta involuntària. Per exemple, el menjar que veu un gos produeix que produeixi saliva.
El condicionament operant pot descriure com un procés que intenta modificar el comportament mitjançant l'ús de l'reforç positiu i negatiu. Mitjançant el condicionament operant, un individu fa una associació entre un comportament particular i una conseqüència. exemples:
- Els pares recompensen les bones qualificacions d'un nen amb dolços o algun altre premi.
- Un mestre premia aquells estudiants que són tranquils i educats. Els estudiants s'adonen que a l'comportar-se així reben més punts.
- Un aliment es dóna a un animal cada vegada que pressiona una palanca.
BF Skinner (1938) va encunyar el terme condicionament operant. Skinner va identificar tres tipus de respostes o operants:
- Operants neutrals: respostes de l'entorn que no augmenten ni disminueixen la probabilitat que es repeteixi un comportament.
- Reforçadors: respostes de l'entorn que incrementen la probabilitat de repetició d'un comportament. Els reforçadors poden ser positius o negatius.
- Càstigs: respostes de l'entorn que disminueixen la probabilitat que es repeteixi un comportament. El càstig afebleix el comportament.
Antecedents de el condicionament operant
Thorndike va ser el primer a reconèixer que el condicionament inclou alguna cosa més que una resposta i un reforçador. La resposta es dóna en presència d'uns estímuls determinats, considerant-tres esdeveniments: l'estímul, la resposta i la conseqüència de la resposta o reforçador.
Edward Thorndike. By: Popular Science Monthly Volume 80
Aquesta estructura facilita l'associació entre l'estímul i la resposta. En la seva llei de l'efecte, Thorndike va afirmar que les respostes que vagin seguides de conseqüències reforçants, tindran més probabilitat d'ocurrència quan l'estímul torni a aparèixer.
Per contra, aquelles respostes que són seguides de conseqüències negatives, tindran una menor probabilitat d'ocurrència quan l'estímul torni a aparèixer. La llei de l'efecte és l'antecedent de el condicionament operant o condicionament instrumental, com era nomenat per Thorndike.
Per a Skinner, psicòleg de l'conductisme, el condicionament era l'enfortiment de les conductes segons les conseqüències que anteriorment s'haguessin obtingut.
Skinner
En aquesta línia, hi ha dues formes de condicionament:
- El clàssic o pavlovià: es basa en l'associació d'estímuls incondicionats i condicionats, sent les respostes controlades pels estímuls antecedents.
- El condicionament operant: els estímuls conseqüents o reforçadors fan que s'emeti una conducta determinada. Skinner explica que si la conducta és seguida d'un reforçador positiu, augmentaria la probabilitat d'emissió d'aquesta conducta en un futur. A contra, si una resposta no va seguida d'un reforçador o aquest reforçador és negatiu, la probabilitat d'emetre aquesta conducta en un futur serà menor.
Rata en caixa de Skinner
Conceptes bàsics de el condicionament operant
- Reforç
És el responsable de l'emissió de respostes, és a dir, de la probabilitat que succeeixin, sigui més o menys en un futur. És un estímul reforçant i conseqüent, ja que es dóna un cop s'ha produït la resposta.
És impossible saber si un reforçador determinat influeix en la conducta fins que no es presenta de manera contingent amb una resposta i es comprova que el comportament canvia a conseqüència de l'reforçador.
Hi ha dos tipus de reforç: positiu i negatiu. Tots dos tenen la mateixa finalitat d'augmentar la probabilitat que la resposta s'emeti en situacions futures. A més, per Skinner els reforçadors es defineixen per mitjà de les conductes que són observables i mesurables.
reforç positiu
El reforç positiu reforça un comportament proporcionant una conseqüència que un individu troba gratificant. Per exemple, donar menjar a un gos després que se sent. En aquest cas s'estaria reforçant el comportament de seure.
reforç negatiu
L'eliminació d'un reforçador desagradable també pot enfortir un comportament. Això es coneix com a reforç negatiu perquè és l'eliminació d'un estímul advers per a l'animal o la persona el que fa que el comportament es condicioni.
El reforç negatiu reforça el comportament perquè deté o elimina una experiència desagradable.
Per exemple, si un nen és maltractat a casa i quan surt al carrer no té aquest maltractament, estaria sent reforçat el comportament de sortir al carrer.
reforçadors primaris
Serien tots aquells reforçadors bàsics que no necessiten de cap història de condicionament prèvia per a funcionar com a tals. Alguns exemples serien l'aigua, el menjar i el sexe.
reforçadors secundaris
Els reforçadors secundaris si estarien basats en històries prèvies de condicionament gràcies a l'associació amb estímuls incondicionats. Alguns exemples serien els diners i les qualificacions.
- Contingència de tres termes
Font: Joshua Seong / Verywell
És el model bàsic de el condicionament operant i està format per tres components: l'estímul discriminatiu, la resposta i l'estímul reforçador.
Un estímul discriminatiu seria aquell que va a indicar a l'subjecte que el reforçador està disponible, assenyalant que si porta a terme una determinada conducta podrà obtenir aquest reforçador. En contraposició tenim l'estímul delta o estímuls que indiquen que la conducta no va a portar a l'obtenció de cap tipus de reforçador.
La resposta seria la conducta que realitzarà el subjecte, l'execució el portarà o no a l'obtenció de l'estímul reforçador.
Un estímul reforçador és el responsable de l'emissió de la conducta, ja que gràcies a la seva aparició la probabilitat d'emissió d'una resposta augmentarà o disminuirà en el futur.
- Càstig
El càstig també es mesura pels seus efectes en la conducta de l'subjecte. En canvi, a diferència de l'reforç, el que es pretén és la disminució o supressió d'una determinada conducta.
Un càstig redueix la probabilitat d'emissió d'una conducta en situacions posteriors. No obstant això, no elimina la resposta ja que si l'amenaça de càstig disminueix, la conducta pot tornar a aparèixer.
En el càstig també ha dos tipus o procediments diferents, càstig positiu i càstig negatiu.
càstig positiu
Aquest implica la presentació d'un estímul aversiu després de la realització d'un determinat comportament. És donat de manera contingent a la resposta donada pel subjecte.
Per exemple, quan es posa líquid en les ungles dels nens per evitar la onicofàgia. El nen assaboreix el mal gust de el líquid (càstig positiu) i es redueix la probabilitat que torni a menjar-se les ungles.
càstig negatiu
Consisteix en l'eliminació d'un estímul com a conseqüència d'un determinat comportament, és a dir, consisteix en la retirada d'un estímul positiu després de la realització d'una determinada conducta.
Per exemple, si es retira l'ús de la videoconsola a un nen quan ha suspès un examen.
- Extinció
En l'extinció es deixa d'emetre una resposta pel fet que el reforçador ja no apareix. Aquest procés es basa en deixar de proporcionar el reforçador corresponent que s'espera aconseguir i que ha fet que aquest comportament es mantingui al llarg de el temps.
Quan una resposta s'extingeix, l'estímul discriminatiu passa a ser estímul d'extinció. Aquest procés no s'ha de confondre amb l'oblit, que és donat quan la força d'un comportament disminueix al no haver estat emès en un període de temps.
Per exemple, si no es dóna diners a un nen tot i que es queixi constantment, s'extingiria el comportament de queixar-se.
- Generalització
Davant d'una situació o estímul determinat es condiciona una resposta, que pot aparèixer davant altres estímuls o situacions semblants.
- Discriminació
Aquest procés és l'oposat a el de generalització, en ell es respon de manera diferent segons l'estímul i el context.
Programes de reforç
Skinner també va establir gràcies a les seves investigacions diversos programes de reforç, entre els quals hi ha els programes de reforçament continu i els programes de reforçament intermitent.
Programes de reforç continu
Estan basats en el reforçament constant de la resposta cada vegada que es presenti, és a dir, cada vegada que el subjecte executi la conducta desitjada obtindrà un estímul reforçador o positiu.
Programes de reforç intermitent
En canvi, aquí el subjecte no sempre obté el reforçador a l'realitzar la conducta desitjada. Aquests es defineixen en base a el nombre de respostes donades o a l'interval de temps transcorregut entre respostes, donant lloc a diferents procediments.
Programes de raó fixa
En aquests programes el reforçador es proporciona quan el subjecte genera respostes fixes i constants. Per exemple, en un programa de raó 10 la persona obté el reforçador després d'haver realitzat deu respostes quan es presenta l'estímul.
Programes de raó variable
Aquest es construeix igual que l'anterior, però en aquest cas el nombre de respostes que el subjecte ha de donar per obtenir el reforçador és variable.
El reforçador seguiria depenent de el nombre de respostes emeses pel subjecte però amb una raó variable, gràcies a la qual s'evita que el subjecte arribi a predir quan obtindrà el reforçador.
Programes d'interval fix
En els programes d'interval l'obtenció de l'reforçador no depèn de el nombre de respostes que el subjecte doni, sinó que està determinat pel temps transcorregut. En conseqüència es reforça la primera resposta produïda després d'haver passat un període de temps determinat.
En els programes d'interval fix el temps entre reforçador i reforçador és sempre el mateix.
Programes d'interval variable
En aquests programes el reforçador s'obté després d'un temps, tot i que el temps és diferent per a cada reforçador rebut.
canvi conductual
Aproximacions successives o moldejament
El moldejament consisteix en el canvi conductual a través del moldejament de conductes o el reforç diferencial d'aproximacions successives.
Per modelar una conducta concreta es segueixen una sèrie de passos. En primer lloc s'identifica quina és la conducta inicial que es pretén modelar per saber a quin es vol arribar.
Després, es delimiten els possibles reforçadors que es van a emprar i es separa en passos o etapes el procés per arribar a la conducta final, reforçant cada etapa o aproximació successiva fins arribar a l'última.
Amb aquest procediment dinàmic es van transformant tant les conductes com les seves conseqüències. En aquest sentit, es reforcen les aproximacions successives cap a una conducta objectiu.
No obstant això, perquè es pugui dur a terme, cal partir d'una conducta prèvia que ja realitzi el subjecte, per així anar reforçant a poc a poc les seves conductes fins arribar a la meta.
encadenament
Amb ell es forma una nova conducta a partir de la descomposició en passos o seqüències més senzilles, reforçant cada resposta donada en cada un dels passos per així portar a l'establiment d'una resposta més complexa en el repertori conductual de l'subjecte.
Es poden arribar a formar cadenes llargues de respostes utilitzant reforçadors condicionats, adoptant una unitat funcional i l'establiment porta a l'adquisició i definició d'una destresa particular.
referències
- Condicionament operant. Recuperat de wikipedia.org
- Condicionament operant. Recuperat de e-torredebabel.com.
- Recuperat de biblio3.url.
- Llei de l'efecte. Recuperat de wikipedia.org.
- Extinció. Recuperat de wikipedio.org.
- Domjan, M. Principis d'aprenentatge i conducta. Paranimf. 5a edició.