Para vivir mejor PSICOLOGÍA

El condicionamiento instrumental

Por el Lic. Mariano Vega Botter. Neuropsicólogo.

10/06/2018 -

He decidido escribir este artículo porque me parece importante que sepamos cómo se maneja nuestra conducta en referencia a los reforzadores de las mismas como es el Estímulo-Respuesta (E-R). Cómo la ciencia ha ido avanzando para poder reconocer y conocer los tipos de estímulos y respuestas que dicta nuestro cerebro para manejarnos en la vida cotidiana. Muchas veces nos preguntamos el porqué de un tipo de reacción en una situación especial y por qué la misma persona tiene una reacción conductual muy diferente a otro tipo de situación en la que nos presentamos. La verdad que es apasionante conocer el manejo de nuestro cuerpo a través de nuestro cerebro en combinación de nuestro organismo, sistemas motores y sistemas psíquicos. Ya hablamos alguna vez que no se separa la mente de nuestro cuerpo; todo lo contrario; tanto mente como cuerpo es algo holístico, gestáltico, un todo y no se puede separar. Todas estas situaciones de preguntas, curiosidades e investigaciones es lo que los llevó a los diferentes autores a estudiar la conducta humana realizando todo tipo de experimentos con animales, podemos nombrar autores como Thorndike, Skinner, que han sido pioneros del condicionamiento instrumental o condicionamiento clásico.

Entonces vayamos a conocer cómo nuestro cerebro a través de sus procesos de información crea una gran cantidad de esquemas mentales que producen un efecto de un mapeo mental como si  fuese un GPS. Es lo que nos permite con esa función que nos transmite el cerebro poder accionar nuestro cuerpo con su sistema motor y tener conductas relacionadas a la información que recibimos desde nuestro cerebro.

Un estudiante estudiará para obtener mejores notas. Este tipo de conducta se utiliza porque ha servido previamente como instrumento para conseguir lo mismo y recibe el nombre de “conducta instrumental”.  

Primeras investigaciones sobre Condicionamiento Instrumental

Es recomendable citar como uno de los investigadores de las conductas instrumentales, a Thorndike. Su intención original era estudiar la inteligencia animal, pero terminó asociando que en el humano se producía una conducta similar.

Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal debía aprender cómo salir de la caja.

Los resultados son obvios, con la repetición el animal cada vez tarda menos tiempo en repetir la acción que abre la caja. Sin embargo hay que hacer una puntualización, Thorndike no explicaba que los animales comprendieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como una asociación Estímulo-Respuesta.

Es decir, un gato por ejemplo daba muchas respuestas al introducirlo en la caja, alguna de estas respuestas (de casualidad) abrían la caja, por lo tanto el animal poco a poco iría aprendiendo esta asociación y comenzaría a dar con mayor frecuencia el tipo de respuestas encaminadas a volver a abrirla. Yo no entiendo cómo se abre la puerta de mi auto con el comando a distancia…pero cada vez que quiero abrirla aprieto el botón porque es lo que he aprendido.

Este ejemplo es muy sencillo y sin darnos cuenta lo hacemos todos los días con nuestro auto y aquí está la explicación del porqué del mecanismo estímulo-respuesta. El auto no es ningún animal pero el que acciona el botón de la llave donde se hace la apertura del vehículo está en nuestras manos y de esa forma tenemos una conducta instrumental porque la puerta se abre si aprieto el botón. Lo instrumental está en las veces que aprieto el botón (las llaves del auto) (estímulo) y la respuesta está en la acción de la apertura de la puerta (respuesta) que ni siquiera uno se pregunta por qué accionamos del mismo modo siempre. Es apasionante estudiar estas acciones que son cotidianas pero que si una persona lo piensa detenidamente se preguntará por qué ocurre y cuando lo descubre y/o averigua se siente asombrada del funcionamiento de nuestra mente.

Ley del efecto: Si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica un aprendizaje E-R.

Procedimientos

Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:

Estímulo apetitivo: Una consecuencia placentera.

Estímulo aversivo: Una consecuencia molesta.

Contingencia positiva: La respuesta instrumental proporciona el estímulo (un chico corta el césped y recibe dinero).

Contingencia negativa: La respuesta instrumental evita el estímulo (cierro la ventana y no entra lluvia).

Y ahora los 4 procedimientos de los programas de reforzamiento de la conducta instrumental.

Reforzamiento positivo: Un padre le regala una muñeca a su hija cuando hace los deberes. La respuesta instrumental produce un estímulo apetitivo. Por lo tanto existe contingencia positiva entre la respuesta y el estímulo.

Castigo: Un jefe te llama la atención por llegar tarde a una reunión. La respuesta instrumental produce un estímulo aversivo, o sea, una situación molesta. Y ojo: aquí también se produce una contingencia positiva entre la respuesta y el estímulo. (Llegar tarde produce que el jefe se enoje con vos pero también sabes que cobrarás tu sueldo).

Reforzamiento negativo: Se trata de un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estímulo aversivo.

Hay dos tipos de reforzamiento negativo:

A) Escape: Se presenta el estímulo aversivo pero puede ser eliminado por la respuesta instrumental. Se puede escapar del sonido molesto de un aparato musical apagándolo. Se produce la conducta del escape.

B) Evitación: Implica la programación de un estímulo aversivo para ser presentado en algún momento del futuro. La gente pone a punto su auto para evitar tener problemas en su viaje de vacaciones. Conducta de evitación.

Entrenamiento de omisión: La respuesta instrumental previene la presentación de un estímulo apetitivo. Se le dice a un niño que se vaya a su habitación cuando ha hecho algo malo no porque la habitación sea algo aversivo sino para evitar estímulos apetitivos como ver la televisión o usar la computadora y que lo llamen sus amigos estando en el living de su casa, no así en la habitación. El entrenamiento de omisión también recibe el nombre de “reforzamiento diferencial de otras  conductas” o recuerdo (RDO). El RDO refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente a la anterior. Por ejemplo; sos un gran conductor y podrías correr carreras pero también serías un gran trabajador como taxista, aquí siempre se hace presente el RDO de su impecable manejo y que sus conductas totalmente diferenciadas le transmiten un estímulo apetitivo.

Elementos fundamentales

El condicionamiento instrumental consta de 3 elementos claves:

- Una respuesta.

- Una consecuencia (el reforzador).

- Relación (o contingencia) entre la respuesta y la consecuencia.

RESPUESTA – RELACIÓN O CONTINGENCIA – CONSECUENCIA O REFORZADOR

Los experimentos de Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro.

Es decir, repeticiones de la misma respuesta. Sin embargo esto no significa que el condicionamiento instrumental no pueda producir también respuestas creativas o variables. Aquí se habla literalmente de lo que nos conducimos diariamente de forma automática pero también esperando tener otra conducta con la misma respuesta instrumental hacia un futuro creativo e imaginativo (proyección).

Los organismos pueden aprender a obtener reforzamiento en una situació n donde se requiere hacer algo nuevo. Por lo tanto la variabilidad de la respuesta puede ser la base para el reforzamiento instrumental.

Sistemas de conducta y limitaciones

De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podrí a encontrar comida, su sistema de alimentación se activa y se dedica a otras actividades relacionadas con la comida.

De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementará n con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentación está activado en ausencia de condicionamiento instrumental. Esto suena un poco complejo pero se entiende con el siguiente ejemplo:

Cuando un hámster tiene comida suficiente y se dedica a otras actividades como el autocuidado (lavarse, echarse, etc), pero cuando está hambriento su sistema de conducta se centra en otras actividades como comer. Por lo tanto podemos concluir que el autocuidado no está́ relacionado con su sistema de conducta de la alimentación y que el reforzamiento de comida podrí a producir incrementos en actividades como cavar y escarbar pero no en el autocuidado.

Sistemas de conducta y limitaciones

Cantidad y naturaleza del reforzador

Las dos características están muy relacionadas. Tener un reforzador más grande o más sabroso (en el caso de la comida) provocará respuestas más intensas en los sujetos. Si el estímulo es mayor de lo esperado, producirá condicionamiento excitatorio.

Si por el contrario el estímulo es menor de lo esperado, producirá condicionamiento inhibitorio. Si trabajas por 100 pesos la hora durante 4 meses y el quinto mes te siguen pagando lo mismo, será menos emocionante que trabajar 4 meses a 80 pesos la hora y luego a partir del quinto mes subirte a 90 pesos. Es probable que los trabajadores del segundo grupo sean más productivos.

Aunque vean que las cifras son menores, la naturaleza del reforzador instrumental indica que han elevado el monto de pago al quinto mes y que en el primer grupo le siguen pagando lo mismo en  los meses subsiguientes, a este grupo no le creará un reforzamiento instrumental en la conducta de trabajo aunque vean que siempre le pagan lo mismo.

-  Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva.

- Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor.

- Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento y sólo un cambio en la magnitud de la recompensa para los grupos de cambio.

- Contraste conductual simultáneo: Efectos de contraste conductual (contraste positivo y negativo) que está n producidos por frecuentes cambios entre una condición de recompensa favorable y una desfavorable, con cada condición de recompensa asociada a su propio estímulo distintivo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otras situaciones.

Dos tipos de relaciones entre una respuesta y un reforzador

a) Relación temporal (o contigüidad temporal): Tiempo que transcurre entre la respuesta y el reforzador. En la “Contigüidad temporal” el reforzador se entrega inmediatamente después de la respuesta.

b) Relación causal (o contingencia respuesta-reforzador): Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.

Efectos de la contigüidad temporal o relación temporal

El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta instrumental facilita el aprendizaje. Hay varios factores que explican por qué el condicionamiento instrumental es tan sensible a la demora del  reforzamiento:

A. Una demora larga hace que el sujeto no sepa cuál de sus respuestas haya sido la que ha producido el reforzador. Es decir, la rata levanta una palanca pero pasan 30 segundos hasta que se  muestra una bolita de comida, durante estos 30 segundos la rata sigue haciendo otras cosas como pueden ser saltar, morder, etc., de repente surge la bolita y la rata ya no asocia la bolita con la  palanca inicial ya que despué s ha seguido dando una serie de respuestas (saltar, morder, etc.) y no sabe cuál de ellas ha sido la que ha propiciado la salida de la bolita.

B. Para resolver este problema se entrega un reforzador condicionado o secundario inmediatamente después de la respuesta instrumental y que ha sido asociado previamente con el reforzador. Por ejemplo en el adiestramiento verbal de animales se dice “bueno” o “eso es” y cuando termine la exhibición se le dará la comida.

C. Otra manera de resolver el problema es mediante un “procedimiento de marcado” de la respuesta instrumental correcta. Experimento en ratas. Una caja con un brazo negro y otro blanco.  El blanco es la respuesta correcta, el grupo de ratas que daba la respuesta correcta se dividió en 2 subgrupos, uno de estos subgrupos era extraído de la caja en el momento de entrar en el brazo blanco y llevado a otra caja a esperar la comida. El otro subgrupo no era extraído de la caja, sino que esperaba a recibir la comida en ella durante 60 segundos.

Se demostró que el grupo que era “extraído” (marcado) de la caja, tenía un porcentaje de respuestas correctas superior en experimentos posteriores que el grupo que no había sido extraído. Es decir, hay que hacer algo inmediatamente después de la respuesta instrumental para que el animal se percate de que lo que acaba de hacer es la elección correcta.

La contingencia respuesta-reforzador o relación causal

Repite lo anterior al principio del apartado pero añade que: aunque la relación causal sea perfecta, el condicionamiento no ocurrirá si el reforzamiento es demorado durante demasiado tiempo. El animal no sabrá cual conducta instrumental le reforzará su conducta para su alimentación. 

 
Compartí
esta nota

También te puede interesar