Post on 23-Jan-2016
Domjan 7Condicionamiento
Instrumental: mecanismos motivacionales
Profa: Carolina Mora
En el aprendizaje instrumental es importante conocer la función que desempeñan los tres elementos participantes: estímulo discriminativo, respuesta y reforzador
La estructura asociativa del condicionamiento instrumental
La noción de asociación es fundamental para describir cómo los organismos aprenden relaciones entre eventos en el área del aprendizaje Asociativo
Teorías sobre la asociación en el condicionamiento instrumental
• asociación estímulo-respuesta (E-R)
• asociación entre el estímulo y el reforzador o consecuencia (E-C)
• asociación entre la respuesta y la consecuencia (R-C).
Cuyo ejemplo más representativo es la ley del efecto de Thorndike.. El condicionamiento instrumental implica el establecimiento de una relación E-R , entre la respuesta instrumental (R) y los estímulos contextuales (E) que están presentes cuando la respuesta es reforzada
Primera teoría: la asociación estímulo-respuesta (E-R)
(R) Respuesta instrumental: presionar un pedal que abre el mecanismo
(E) Estímulos contextuales: caja
en estas teorías la función del reforzador es fortalecer la asociación E-R.
El reforzador en sí mismo no es codificado como parte de la estructura asociativa, sino que es una especie de “fortalecedor” que facilita la formación de dicha asociación E-R.
asociación estímulo-respuesta (E-R)
(R) Respuesta instrumental: presionar un pedal que abre el mecanismo
(E) Estímulos contextuales: caja
(ER) Reforzador: Comida
cuando se refuerza una respuesta en presencia de un estímulo, el estímulo también se aparea explícitamente con el reforzador permitiendo el establecimiento de una asociación entre ambos.
Segunda Teoría: la asociación entre el estímulo y el reforzador (E-C)
Los hábitos son cosas que hacemos de manera automática , de la misma forma cada vez y sin pensar
Constituyen el 45% del comportamiento humano
Desde esta teoría, los hábitos surgen cuando la gente utiliza de manera repetida una conducta en un contexto particular, para conseguir una meta.
Una vez que se adquiere el hábito se realizan sin mediación de una meta, más bien se convierte en una reacción automática al contexto de estímulo en que se obtuvo previamente la meta
Los hábitos y la asociación estímulo-respuesta (E-C)
La visión anterior, esta siendo utilizada para explicar comportamientos como el uso de drogas:
Consumir una droga de abuso se considera una conducta instrumental que en principio es reforzada por los aspectos positivos de la experiencia . Sin embargo, con el uso repetido, el consumo se vuelve un hábito en el sentido de que llega a ser una reacción automática a las señales del contexto que provocan la conducta de búsqueda de droga sin considerar sus consecuencias
Los hábitos y la asociación estímulo-respuesta (E-C)
Este modelo también se ha usado para explicar conductas como la infidelidad, la alimentación y las apuestas compulsivas.
La teoría de los dos procesos de Rescorla y Solomon (1967)
Supone que existen dos tipos distintos de aprendizaje: el condicionamiento pavloviano y el instrumental y ambos son interdependiente
Condicionamiento clásico
Condicionamiento instrumental
interdependencia
Prueba de tranferencia pavloviana instrumental
Fases descripción
Condicionamiento instrumental estándar
La presión de una palanca de se refuerza con comida
Condicionamiento pavloviano
Se saca la palanca de respuestas de la caja experimental y se empareja el tono con comida
Transferencia pavloviana instrumental
Se permite nuevamente presionar la palanca y se presenta periódicamente el EC (tono).
La tasa de respuesta de presión de la palanca se incrementa cuando se presenta el EC
Cómo se prueba que una asociación pavloviana E-C influye en la conducta instrumental?
ENCampana
EIComida
RISalivación
La presentación
La presentación del EC pavloviano para la comida incrementa la tasa de respuesta instrumental para la comida
El EC influye o motiva la respuesta instrumental
Asuntos inconclusos en la prueba de transferencia pavloviana
A los investigadores le ha preocupado mucho la posibilidad de que los resultados de los experimentos de transferencia pavloviana se deban a que los EC provocan RC manifiestas que interfieren o se suman a la conducta requerida para obtener el reforzamiento instrumental
La teoría de los 2 procesos asume que el condicionamiento clásico media en la conducta instrumental, por medio del condicionamiento de emociones positivas o negativas
= =
=
= =
= =Más motivación para presionar la palanca
Valencia emocional
positiva
Condicionamiento clásico
ECmujer
EI RISenos grandes excitación
Condicionamiento operante
ED C.O consecuenciaMujer (otra mujer) el coquetea excitación ella le responde riéndose
Transferencia pavloviana instrumental
ED C.O ConsecuenciaMujer el coquetea más mayor excitaciónSenos grandes frecuente o intensamente cuando ella le responde riéndose
Condicionamiento clásico
ECCuchillo
EI RIHerida temor
Condicionamiento operante
ED C.O consecuenciaLadrón huida escape ante el temor de ser agredido
Transferencia pavloviana instrumental
ED C.O ConsecuenciaLadrón huida más escapa más rápidamente porque experimentaQue usa rápida mayor temor a ser agredido con el cuchillo cuchillo
Tercera teoría: la asociación entre la respuesta (R) y la consecuencia (C).
La intuición sugiere que la conducta instrumental implica asociaciones R-C.
• Nos peinamos esperando que eso mejore nuestra apariencia
• Vamos al cine porque esperamos que la película resulte entretenida
• Abrimos el refrigerador anticipando que eso nos permite obtener algo de comer
La suposición de que existen asociaciones R-C se ha apoyado en los trabajos que muestran que los cambios en el reforzador afectan a la respuesta instrumental incluso cuando estos cambios se realizan después de que la respuesta haya sido ya aprendida
la técnica conocida como devaluación de la consecuencia está basada en la idea de que, si en el condicionamiento instrumental se establece una asociación R-C, cualquier cambio en el valor de la consecuencia tras el aprendizaje debería llevar a un cambio en la respuesta.
Así, cuando la consecuencia fuera devaluada tras el condicionamiento, debería encontrarse una reducción en la respuesta que produce la consecuencia devaluada.
La asociación entre la respuesta y la consecuencia (R-C).
En la primera se reforzó a las ratas por empujar una varita vertical a la derecha o a la izquierda
Las respuestas en una dirección eran reforzadas con bolitas de comida y las respuestas en la dirección contraria eran reforzadas con un sorbo de una solución dulce
Se realizó un experimento en 3 fases.
En la segunda fase: una vez que quedaron bien establecidas las dos respuestas, se sacó la vara y se realizó el procedimiento de devaluación, asociando uno de los reforzadores con cloruro de litio para condicionar la aversión al reforzador
+
La tercera fase fue idéntica a la fase inicial, con la excepción de que la respuesta de presión de palanca no fue seguida por reforzador alguno. Las ratas en la condición apareada dieron menos respuestas que las ratas de la condición no apareada. El cambio en el valor de la consecuencia después del aprendizaje inicial no debiera de haber tenido efectos sobre la respuesta en el caso de que el aprendizaje hubiera sido E-R. El encontrar ese efecto sugiere que la consecuencia forma parte de lo que el sujeto aprende en el condicionamiento instrumental.
Más probableMenos probable
Antecedentes de la regulación conductual
Thorndike describía a un reforzador como un estímulo que produce un estado satisfactorio de cosas
Teoría de la respuesta consumatoria
La teoría de las respuestas consumatoria constituyó una innovación, pues cambio la busqueda de los reforzadores de tipos especiales de estímulos a tipos especiales de respuesta.
La teoría supuso que las respuestas consumatorias (como masticar y tragar) son reforzantes porque implican la consumación o completamiento de una secuencia conductual instintiva
La sacarina, funciona como un reforzador eficaz aunque no tenga valor nutritivo y no pueda satisfacer una necesidad biológica
El principio de Premack
Este principio parte de dos supuestos.
1. si a un sujeto se le da acceso libre a dos actividades dedicará un tiempo determinado a cada una de ellas y ese porcentaje de tiempo reflejará el grado de preferencia de esa actividad (principio de probabilidad diferencial)
2. una actividad preferida (A) se volverá el reforzador de la actividad menos preferida (B) si el acceso a la actividad (A) depende de la ejecución de la actividad menos preferida.
70%
20%10%
El principio de Probabilidad Diferencial
Impongo una contingencia instrumental: sólo te dejo jugar con tu video juego (conducta preferida) si te portas bien con tus hermanos (conducta no preferida)
La hipótesis de la privación de la respuesta
Lo importante no es la probabilidad diferencial de las conductas (cuáles se repiten más y cuáles se repiten menos), sino el estado de privación de una determinada conducta. Puede que en el estado natural, la conducta de correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usar como respuesta reforzadora
Quiero que dejes de ver a ese hombre horrible!!!. Lo tienes
prohibido!!!
Nadie me impedirá ver a mi
príncipe
Regulación conductual y el punto de éxtasis conductual
Un individuo tiene que comer, respirar , beber, alimentarse, mantenerse caliente, etc. Todas esas actividades tienen que ocurrir en proporciones particulares. Uno no desea comer en exceso o exageradamente poco, ejercitarse de más o casi nada
Punto de éxtasis conductual: si los organismos tienen la libertad para distribuir sus respuestas entre las alternativas de las que disponen, lo harán de la forma en que les resulte más cómoda u óptima
Imposición de una contingencia ambiental
Si dejamos a un sujeto libre, se quedará en el punto de éxtasis conductual. Eso puede ser malo. p.e estudiar poco, fumar mucho…)
El terapeuta quiere modificar esa distribución de conductas haciendo que se aparten del punto de deleite. Como?. Mediante reforzamientos y castigos
Curva de demanda: relación beneficio/coste
La sensibilidad al precio se llama elasticidad. Si los caramelos son caros, la gente no los compra (producto elástico)Si la gasolina es cara, se compra igualmente porque no existe otro sustituto (producto no elástico
Caramelos -----------------Gasolina ---------------------
Curva de demanda: relación beneficio/coste
La cantidad de cigarrillos fumados disminuye si el terapeuta pide al paciente que “pague” 1 dólar por cada cigarrillo que fumeY más todavía si son 5 dólares…
Curva de demanda: relación beneficio/coste
Disponibilidad de Sustitutos
Cuando hay disponible un producto (o conducta) que sustituye a otro que se ha vuelto “caro”, entonces podemos abandonar el producto caro y pasar al sustituto
Un ejemplo con productos
Disponibilidad de SustitutosLlevarla al cine, implica pagar las
entradas, comprar refrescos, cotufas y
chucherias
Hola, Hola, Mi vida!!!, ya llegué, traje unos DVD
buenísimos!!!
Un ejemplo con conductas
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Disponibilidad de Sustitutos
Usemos el mismo principio en el tratamiento de las adicciones a las drogas
Se fija un costo alto para el uso de las drogas (multas, penas de cárcel, daño físico y psíquico
Se emplea un reforzador que sustituye a la droga pero NO es una droga (falta encontrar ese sustituto)
Eso hace que la demanda a la droga sea más elástica: al aumentar la droga se consume menos droga y más el sustituto que hemos buscado
Factores que influyen en la elasticidad de la demanda
Rango de precios:
Los productos baratos suelen seguir vendiéndose bien aunque suban de precio
El doble de 5 Bs.F es 10. B.s FEl doble de 5.000 Bs.F es 10.000 B.s F
Nivel de ingreso:
Un coste elevado no significa mucho para quien es rico.
Igualmente, cuanto más respuestas o tiempo tengan disponibles los sujetos serán menos sensibles a las subidas de coste
Factores que influyen en la elasticidad de la demanda
Algunos problemas con la aproximación de la regulación conductual
El punto de éxtasis se formula desde una visión molar (como un conjunto y a lo largo de un período amplio. Sin embargo, esta demostrado que es importante cómo se alcanza ese punto de deleite (pautas de elección en los cambios de una conducta a otra, desde un punto de vista más molecular
Le respondo o no le respondo?
MOLAR MOLECULAR
El valor “reforzante” de una conducta puede cambiar según si es obligada o no?
Al principio una conducta A puede ser agradable, pero cuando la utilizo para reforzar otra conducta B, estoy imponiendo la conducta A. ¿cómo sé si sigue siendo tan agradable como al principio?
Algunos problemas con la aproximación de la regulación conductual
Me encanta tocar la guitarra
Situación A
Qué hace sentada?, tiene que tocar la guitarra para que los clientes se diviertan
Situación B
Contribuciones de la aproximación de la regulación conductual
Antes se pensaba en los reforzadores como tipos especiales de estímulos, desde la aproximación de la regulación conductual, la causa del reforzamiento está en la forma en que el flujo libre, natural, de la conducta se ve alterada por las contingencias instrumentales
Cantar 1 hora Cantar 15 horas
Ahora,. El entrenamiento instrumental ya no sirve para “fijar” o “eliminar” una conducta, sino que crea una nueva distribución de conductas en general
Contribuciones de la aproximación de la regulación conductual
Contribuciones de la aproximación de la regulación conductual
Una respuesta reforzadora no tiene nada inherentemente distinto de una respuesta instrumental: no proporciona ningún beneficio especial, por ejemplo fisiológico (ej. Hacer ejercicio vs comer caramelo).Simplemente, el que una conducta sea reforzadora va a depender de los papeles que les asigne el terapeuta
Quiero que dejes de ver a ese hombre horrible!!!. Lo tienes
prohibido!!!
Nadie me impedirá ver a mi
príncipe
Contribuciones de la aproximación de la regulación conductual
Ha contribuido a ver el condicionamiento instrumental como un sistema, en vez de como elementos aislados. Al cambiar un solo elemento, el sistema entero cambia
E R ERD