Programas de reforzamiento y conductas de elección

Download Report

Transcript Programas de reforzamiento y conductas de elección

Programas de reforzamiento y
conductas de elección
Ps. Rafael Cendales Reyes
Universidad El Bosque
Programas de reforzamiento
• Los programas de reforzamiento son "reglas",
que determinan cuándo seguirá la entrega o
presentación contingente de un reforzador a
la presentación de una respuesta o conducta.
Reforzamiento continuo
• Se refuerza cada respuesta dada. Una
operante que alcanza su tasa máxima es
mantenida en toda su fuerza sólo si se la
continúa reforzando. Las operantes obtenidas
por este tipo de reforzamiento se extinguen
rápidamente cuando se descontinúa el
reforzamiento.
Reforzamiento intermitente
• La operante es reforzada ocasionalmente. Las
operantes obtenidas mediante este tipo de
Reforzamiento tardan mucho más en
extinguirse.
Reforzamiento de razón
Reforzamiento de intervalo
Reforzamiento de Razón
Sólo se refuerza la conducta después de un número de
respuestas. Se utiliza un contador.
 Programa de Razón Fija: El número de respuestas requeridas
para el reforzamiento deben ser constante. Ej: que paguen por
la venta de cada 5 celulares. Cuando se grafica su curva muestra
frecuentes pausas.
 Programa de Razón Variable: El número de respuestas
requeridas para el reforzamiento deben ser Variable. Nos
proporciona una alta tasa de respuestas sin pausas apreciables,
su curva es más regular Ej: juegos de azar (por eso sontan
adictivos)
Reforzamiento de Intervalo
• La respuesta sólo es reforzada después de cierto tiempo .Se utiliza
un tomador de tiempo (cronometro). Generalmente produce
menor tasa que en los de razón.
 Programa de intervalo Fijo: Se refuerza después que haya pasado un
intervalo fijo de tiempo a partir del último reforzamiento.
Ocasiona que no haya respuestas inmediatamente después del
reforzamiento, pero la tasa aumenta gradualmente y alcanza su
máximo inmediatamente antes del próximo reforzamiento. Cuando se
grafica no es constante.
 Programa de intervalo Variable: Una respuesta es reforzada después
de un intervalo de tiempo que puede variar, por ejemplo desde
segundos, hasta horas, a partir del último reforzamiento. La tasa es
relativamente constante
Conducta de elección
• Los experimentos en los que se mide una sola
respuesta ignoran parte de la riqueza y
complejidad de la conducta.
• Incluso en una situación simple, los organismos
realizan diversas actividades y continuamente
eligen entre alternativas posibles.
• La situación de elección más sencilla es una que
contiene dos alternativas de respuesta, cada una
de las cuales es seguida por un reforzador de
acuerdo con su propio programa de
reforzamiento.
Programa de reforzamiento múltiple
• Consiste en dos o más programas
independientes, los cuales se presentan al
organismo en forma sucesiva, cada uno de
ellos en presencia de un estímulo
característico. Los programas múltiples son
programas combinados, en los que se agrega
un estímulo discriminativo característico.
Programa concurrente
• Están formados, también, por dos o más
programas. A diferencia del múltiple, los
programas no son sucesivos, sino simultáneos; es
decir, que el sujeto puede emitir dos respuestas
distintas que se refuerzan simultáneamente por
programas independientes, pero paralelos en el
tiempo. Los reforzamientos previstos en cada
programa son independientes entre sí. Este tipo
de programa se utiliza cuando se desea reforzar
más de una respuesta a la vez.
Medidas de la conducta de elección
• Tasa relativa de respuestas:
C1/(C1+C2)
C1: Conducta en la opción 1
C2: Conducta en la opción2
• Tasa relativa de reforzamiento:
r1/(r1+r2)
r1: Conducta en la opción 1
r2: Conducta en la opción2
La ley de igualación
• De acuerdo a las investigaciones de R. J.
Herrnstein, la tasa relativa de respuestas en
una alternativa igualaba a la tasa relativa de
reforzamiento obtenida en esa alternativa.
C1/(C1+C2)= r1 / (r1+r2)
C1/C2 = r1/r2
Subigualación, sobreigualación y sesgo
de respuesta
• Forma generalizada de la ley de igualación (Baum, 1974)
C1/C2 = p (r1/r2)s
S= sensibilidad de la conducta de elección a las tasas relativas de
reforzamiento para las alternativas de respuesta.
P= sesgo o preferencia de respuesta.
• Subigualación: menor sensibilidad de la conducta
de elección a las tasas relativas de reforzamiento.
• Sobreigualación: mayor sensibilidad de la
conducta de elección a las tasas relativas de
reforzamiento.
Mecanismos de la ley de igualación
• Igualación y maximización de las tasas de
reforzamiento
– Maximización molecular: Se elige la alternativa de
respuesta que tenga mayor probabilidad de ser
reforzada en el momento.
– Maximización molar: Se distribuyen las respuestas
entre varias alternativas de modo que se maximice la
cantidad de reforzamiento que obtienen a largo plazo.
– Mejoramiento: las respuestas se distribuyen de tal
manera que se mejoren las tasas locales de
reforzamiento .
Taller
• Imagine que se divierte con un juego de video en el que
puede presionar botones para hacer que sucedan cosas en la
pantalla. Hay dos botones que puede presionar y las
consecuencias sobre la pantalla (los reforzadores) están
programadas de acuerdo a dos programas de reforzamiento
distintos. Con base en lo anterior:
– Llene el valor faltante para satisfacer la ley de igualación
en los dos escenarios que se presentan abajo.
Izquierda
Derecha
Respuestas
25
20
Reforzadores
100
x
Izquierda
Derecha
Respuestas
x
80
Reforzadores
12
96
• Suponga ahora que la respuesta es reforzada
con un programa IF5¨ en el lado izquierdo y
con un programa IF20¨ en el lado derecho.
Según la ley de igualación, ¿qué porcentaje de
cantidad total de tiempo debería dedicarse al
lado izquierdo y al lado derecho?
• Digamos que tenemos dos programas
concurrentes y que los reforzadores se
distribuyen de la siguiente manera r1=65% y
r2=35%. Dado lo anterior, ¿Qué valores
tendríamos para R1 y R2 si ocurriese un total
de 200 respuestas?
Elección compleja
• En la vida, las elecciones importantes implican un
beneficio pequeño a corto plazo contra un
beneficio mayor pero más demorado. Éste es en
esencia el problema del autocontrol.
• Para estudiarlo, se ha usado el programa de
reforzamiento encadenado-concurrente. En éste,
una vez el participante ha hecho su elección, se
queda con ésta, lo que involucra una elección con
compromiso
Eslabón de elección
A
B
Eslabón
Terminal
Programa de
reforzamiento 1
Programa de
reforzamiento 2
Estudios sobre el autocontrol
• De acuerdo a las investigaciones de Rachlin y
Green, las recompensas cambian a favor de la
recompensa demorada grande a medida que se
exige que los participantes esperen más tiempo
para recibir cualquiera de las recompensas
después de hacer su elección.
• Si las recompensas son entregadas poco después
de una respuesta de elección, los sujetos
prefieren la recompensa pequeña e inmediata.
Reducciones del valor y explicaciones
del autocontrol
• El valor de un reforzador se reduce según el
tiempo que tenga que esperarse para
recibirlo.
• Función de descuento del valor:
V=M/(1+KD)
V=valor de un reforzador
M= magnitud de la recompensa
D= demora de la recompensa
K= parámetro de la tasa de descuento
Funciones de descuento del valor e
impulsividad de la conducta humana
• Diversos estudios demuestran que la función
de descuento de la recompensa (K) mide una
característica importante de la conducta que
es pertinente para el autocontrol en una
amplia variedad de situaciones.
Taller
• Describa una situación en la que a alguien le
resultara difícil mostrar autocontrol .
• ¿Cuáles son los dos reforzadores en esa
situación? ¿Cómo difieren su valor?
• ¿Qué reforzador ocurre con una demora más
corta?
• ¿Qué tácticas podrían alentar el autocontrol
en esa situación?
• Considere el valor percibido de obtener 100
dólares hoy. En la tabla de abajo, indique qué
tan valiosos serían los 100 dólares para usted
si recibe el dinero hoy, mañana en 30 días, en
150 días o en 300 días a partir de ahora.
Grafique los resultados.
Demora de la entrega en días
0
1
30
150
300
Valor percibido de $100