Motivación y Aprendizaje

INTRODUCCIÓN

En el capítulo anterior nos hemos centrado principalmente en ver el recorrido que ha hecho el estudio de la motivación desde su papel inicial en la conducta innata, hasta su participación fundamental en la base de la conducta aprendida. En ese trayecto, se ha estudiado cómo inicialmente el impulso motivacional hacía referencia a reacciones instintivas y, posteriormente, se comenzó a centrar en aquellos estados internos de necesidad que se activaban ante la aparición de una carencia en el organismo y cuyo principal objetivo consistía en motivar el comienzo de determinadas conductas para corregir ese déficit, es decir, conseguir un equilibrio.

Ya se ha visto que inicialmente el estudio de la conducta aprendida fue de la mano de los trabajos de Skinner sobre el papel central del refuerzo en la conducta. Así las posturas conductistas defendían que aunque hubi era causas internas que determinaran la conducta, sin lugar a dudas eran las causas externas a la persona las que la producían. Al suavizarse ese planteamiento inicial, se empieza a introducir el concepto de incentivo como el aspecto motivador del reforzador (Hull), en cuanto que «atraía al su jeto o tiraba de él hacia la meta», se puede observar que la fuerza se encontraba en el estímulo. Posteriormente, desde una perspectiva más cognitiva de las investigaciones sobre aprendiza je animal, la teoría del incentivo desarrollada por Dickinson et al. (1995) mantiene que la dirección hacia un a meta es fruto de la interacción entre estados emocionales y expectativas cognitivas o, en otras palabras, entre las consecuencias de la conducta y su valor en ese momento para la persona en concreto.

Como podemos comprobar, se ha dado un paso más al considerar que el aspecto motivador del incentivo ya no solo se halla en el objeto a conseguir sino que principalmente, también y sobre todo, en las expectativas que se crea el propio sujeto acerca de ese objeto; dichas expectativas son las que le llevan a actuar. Con esto se viene a decir que au nque un objeto atractivo incitaría a la acción, sería la manera en que percibiese el sujeto esa atracción lo que realmente le motivaría a emitir la conducta. En esa nueva consideración de la noción de incentivo el compon ente de la motivación juega un papel fundamental (el premio de unos días sin trabajar no tendría ningún valor de incentivo para un grupo de jubil ados, pero lo poseería para los empleados de unos grandes almacenes). Es sabido que la motivación determina aquello que se ejecuta e, incluso, aquello que se aprende.

A lo largo de este capítulo vamos a ver cómo se adquiere y desencadena la conducta motivada y se va a estud iar cómo las características sensoriales de los estímulos externos al organismo van a llevar a que el sujeto se encuentre moti vado a realizar ciertas conductas para la consecución de dichos estímulos (Elliot y Dweck, 2005), y, en el lado opuesto, cómo el nivel motivacional va a determinar las ejecuciones y que realicemos o no una conducta ante un mismo estímulo. Igualmente, se tratará cómo las diferentes formas de presentar un premio o un estímulo aversivo influyen en la conducta motivada. En primer lugar se profundizará en todas las condiciones del premio que pueden actuar de incentivo para el sujeto, según sus propias expectativas al respecto y que afectan a la conducta motivada; as imismo vamos a comprobar cómo y de qué manera los estímulos que consideramos desagradable motivan al sujeto a la acción.

Terminaremos explicando un comportamiento compa rtido con muy pocas especies ya que es propio del ser humano: la conducta imitativa, a través de la cuál aprendemos imitando las conductas de las demás, sin tener que recurrir a la ejecución por ensayo y error de todo el repertorio de conductas. Haremos un recorrido por las distintas formas que se ha considerado el estudio de la imitación para profundizar, finalmente, en los elementos del aprendizaje observacional y, dentro de él los componentes de la motivación, que llevan al individuo a adquirir determinadas conductas a través de la imitación de las mismas en un modelo, en este sentido, los aspectos motivacionales y cognitivos ocuparán un lugar central.

LA MOTIVACIÓN EN LA CONDUCTA APRENDIDA

La motivación responde a la pregunta del porqué actuamos, dejamos de actuar o seguimos obsti nada e incansablemente actuando. Es una pregunta esencial en psicología, ya que si desconocemos qué nos lleva a funcionar, cómo lo hacemos y cómo mantenemos una conducta en el tiempo, difícilmente podremos llegar a desvelar el psiquismo humano. Todos sabemos que cuando estamos motivados para hacer algo, no vemos los problemas del camino o, al menos, nos sentimos capaces de superar los o relativizarlos, pero cuando nos falta esa activación, cua lquier cosa nos es imposible de consegu ir aunque se halle al alca nce de nuestra mano. Sabemos que por medio del aprendizaje se aprende qué respuesta se debe dar en cada momento, pero es a través de la motivación cómo se obtiene la fuerza para emitir esas respuestas. De esta forma, la motivación dirige la conducta pero también la energiza o instiga en el sentido que la intensifica y, así, conforme estemos más o menos motivados, daremos más respuestas y más rápid as o nos mantendremos más tiempo emiti endo esa respuesta (Miquelon y Vallerand, 2006).

En el capítulo anterior se hacía referencia a los factores del ambiente que nos llevan a dar una determinada respuesta, a su repetición y, finalmente, a su incorporación en el repertorio de conductas del sujeto. También se mencionó escuetamente el concepto de incentivo para hacer referencia a un enfoque nu evo en el estudio del aprendizaje de la conducta motivada y, desde estos planteamientos, se dan cabida a los aspectos cognitivos en la adquisición de la conducta. En esta línea, el incentivo se refiere a la manera en que afecta en la conducta motivada de cada sujeto la estimulación externa. Según la teoría del incentivo, hay objetos en el ambiente hacia los cuales es atraído el organismo (Bolles, 1978) y así «tiran » de él, pero, recuérdese y téngase siempre presente, que esa atracción depende fundamentalmente del propio sujeto en cuanto a su historia personal con el reforzador y a las expectativas que se crea sobre la situación.

Ya conocemos cómo a través del condicionamiento clásico se establecía el condicionamiento de segundo orden y aludimos al caso del dinero y los halagos. Pues bien, por ese mismo procedimiento es por el que se adquieren y explican las propiedades hedóni cas de los estímulos que incentivan al organismo a realizar la conducta: un estímulo originariamente neutro al asociarse en el tiempo a otro que provoca automáticamente una situación, puede llegar a provocar esa misma respuesta. Muy sucintamente el proceso es el siguiente:

En primer lugar, por condicionamiento clásico los objetos del ambiente adquieren propiedades hedón icas, tanto agradables como aversivas. Mediante condicionamiento clásico se aprende a anticipar los estímulos ambientales que están a punto de producirse. Recuerde cómo la aparición del investigador en el experi mento de Pavlovprovocaba que el animal empezara a sa livar. En esa situación también se aprendía el valor de esos estímulos para el sujeto, lo que da lugar a una tendencia motivacional, en cuanto que provoca conductas de acercamiento o alejamiento; por ejemplo, una misma sinfo nía puede evocar recuerdos diferentes a distintas personas.
En segundo lugar, por condicionamiento operante el sujeto emite respuestas vo luntarias para acceder a esos estímulos o huir de ellos, según sean las características hedón icas de dichos estímulos reforzadores.

Constatamos, entonces, que el compo nente motivacional hace que el sujeto se sienta atraído o, por el contrario, sienta repulsión por las características del estímulo y realice las conductas que le lleven a su consecución o rechazo. La motivación basada en la anticipación de esas propiedades del reforzador se denomina motivación de incentivo que al encontrarse regulada por el ambiente es aprendida por condicionamiento operante, si bien por condicionamiento clásico los estímulos adquieren sus características hedónicas. A través del condicionamiento operante se configura nu estra conducta dirigida a una meta, siendo los estímulos agradables los que provocan las conductas de aproximación a esa meta y los estímulos aversivos los que inducen las conductas de evitación, las cuales son igualmente adaptativas para la supervivencia. El valor de incentivo que depende de las expectativas del sujeto funciona,entonces, por sus características hedónicas, dado que tendemos a acercarnos a aquello que nos reporta consecuencias agradables, y a alejarnos de aquello que nos produce consecuencias desagradables. Insistimos en que el valor de incentivo depende de las expectativas del sujeto que percibe ese estímulo. En definitiva, es la experiencia hedóni caproducida por las propiedades sensoriales de los estímulos lo que refuerza la conducta motivada extrín secamente, realizando aquellas conductas que nos crean expectativas sobre el premi o y evitando las que nos conducen al fracaso.

Por lo indicado hasta este momento, es fácil deducir que la motivación regulada por el ambiente es fruto del aprendizaje, ya que aprendemos las consecuencias de nuestras respuestas, de tal forma que los agentes externos según nuestras expectativas «despiertan» nuestra motivación para realizar o no la conducta; es el caso en el que nos encontramos cuando nos afa namos en aprender un idioma para consegu ir mejores condiciones laborales.

La motivación de incentivo se basa en las expectativas o en la anticipación de las propiedades hedónicas de los reforzadores. Ya veremos cómo el incremento o el descenso del reforzador durante la adquis ición de una conducta puede afectar sobremanera a la ejecució n. Esto sugiere que la conducta instrumental se encuentra motivada por las expectativas de un reforzador con unas características determinadas que dependen de un aprendizaje previo. Supongamos que a un trabajador le conceden dos días de vacaciones cuando cumple los objetivos programados en su plan de trabajo; si por esos mismos logros pasan a otorgarle solo un día, su nivel de motivación puede verse afectado por cambiar el valor de incentivo del premio o las expectativas acerca del premio para el sujeto (en ambos casos se trata de un estímulo deseable), e, incluso sus ejecuciones posteriores variarán más que las de aquel otro empleado al que siempre se le concedió un día único por los objetivos cumplidos.

LOS NIVELES DE MOTIVACIÓN ANTE LA PRESENCIA DE UN REFORZADOR

Se ha insistido en la diferencia existente entre el reforzador en sí y su aspecto motivador, ya que es indudable que el valor de incentivo que el sujeto adjud ica a los estímulos externos depende, en gran medida, de las expectativas que se cree con respecto a él y su historia de reforzadores previa. Ambos aspectos determinarán la actuación última.

Solamente la idea de que tal conducta llevará a tal premio, puede hacer que la conducta se realice de forma más motivada. Así, se pueden aprender respuestas tanto anticipando los premios que conlleve su ejecució n, como las consecuencias negativas (Bandura, 1977; Cofer, 1972). En definitiva, las características del reforzador facilitan la ejecución por las expectativas que crean y, por eso, el valor de incentivo es aprendido, como ya hemos visto.

Debe quedar claro, y hemos insistido sobremanera en ello, que el valor del objeto no se encuentra en sí mismo, sino en el sujeto que lo percibe e interpreta (Huertas, 2006). Supongamos que el premio principal de un concurso televisivo es un apartamento en la playa, no tendrá el mismo valor ese premio para un co ncursante que posea un cha let magnífico a la oril la del mar, que para aquel otro que no pueda permitirse veranear; en ambos casos es el mismo objeto (reforzador), pero sin embargo es percibido e interpretado con un valor diferente por cada uno de los competidores.

El valor de incentivo es la experiencia subjetiva de las características motivacional es que posee el reforzador para el sujeto y que le llevan a actuar. Para ser más didácticos, vamos a denominarlo incentivo.

El incentivo siempre precede a la ejecución creando una expectativa de futuras consecuencias buenas o malas sobre la conducta. El valor de incentivo no causa la conducta, pero afecta a la probabilidad de que se repita la respuesta en cuanto que «es una señal situacional que marca la posibilidad de que una conducta produzca o no consecuencias de recompensa o castigo, y este conocimiento sobre el valor de incentivo se aprende mediante la experiencia » (Reeve, 2003, pág. 132). En el modelo de incentivo se destaca la asociación de los estímulos con placer o dolor e, igualmente, los esfuerzos del organismo por alcanzar metas que atraen o repelen (Mayor y Tortosa, 2005).

Conviene dejar claro desde el inicio la diferencia entre recompensa, castigo e incentivo, dado que el estudio de la MEse basa en la discriminación entre estos tres conceptos:

Una recompensa es un objeto ambiental agradable que se da al final de una secuencia conductual y su objetivo es el incremento de esa conducta (aprobar una oposición después ele haberla preparado con ahínco). Nuestra conducta depende en gran medida de las recompensas por el valor motivacional que conlleva n. No solo se actúa para obtener recompensas materiales las recompensas sociales ti enen un gran peso en la ejecución de nuestros comportamientos. El trabajar, practicar deporte o, incluso, nuestros hábitos alimenticios depende de las recompensas que nos aporten (por ejemplo, si adelgazar peso se ve reforzado por la aprobación social, uno se sentirá más motivado a continuar con esa conducta).
Un castigo es un objeto ambiental desagradable que se da al fin al de una secuencia conductual y su fin alidad es reducir la probabilidad de que se vuelva a emitir esa respuesta (una condena despu és de cometer una conducta delictiva).
Un incentivo es la expectativa que se crea ante aquel objeto ambiental que se conoce de antemano que se va a conseguir si se realiza determinada ejecución y, en este sentido, atrae o no a la persona a realizarla. Es el componente motivacional de la acción, y por eso depende de la experiencia perso nal y las expectati vas al respecto.

Planteados estos tres elementos, se puede comprobar que la misma recompensa actúa como reforzador porque se dispensa despu és de la acción e incrementa su probabilidad de repetición y, también, funciona como incentivo dado que nos permite anticipar las consecuencias favorables de la ejecución de la conducta lo que nos motiva para emitir la conducta de aproxi mación. Si gui endo ese mismo mecanismo, un estímulo aversivo puede actuar como castigo e incentivo aversivo: como castigo su objetivo es la disminución de la conducta, mientras que como incentivo aversivo crea expectativas que provocan que no se emita la respu esta para no sufrir las consecuencias desagradables.

Para ver la diferencia entre recompensa e incentivo, pensemos en una situación de laboratorio en la que se enseña a un gru po de ratas a correr por un corredor recto para conseguir una recompensa consistente en una bolita de comida. Conforme se practi can más ensayos, las ratas realizan menos conductas exploratorias y se diri gen más rápidamente hacia la meta para alca nzar la recompensa. D e esta forma se va conso lidando y aprendiendo la relación respuesta-reforzador y, así, el animal repite la acción al ir aprendiendo que al realizar la conducta obtendrá la bo lita de comi da. Supo ngamos ahora que los sujetos experimentales se dividen en dos grupos:

Grupo A: se les priva de alimento diez horas antes del experimento.
Grupo B: se les permite acceder libremente a la comida.

A partir de este momento, se podría comprobar un comportamiento diferencial de ambos gru pos aunque la conducta de correr por el corredor se encontraba igualmente conso lidada: el grupo A correrá significativa mente más rápido que el gru po B, por las expectati vas que se crean ante el valor de incentivo del reforzador para esos sujetos. Puede observa rse que el mismo estímulo crea expectativas distintas. Aunque el ejemplo planteado es de motivación y aprendizaje animal, podría decirse igualmente de la motivación humana, recuerde el caso del con curso te levi sivo expuesto en la página anterior.

Comprobamos, así, que los incentivos difieren de los reforzadores en su momento de aparición y en cómo motivan el comportamiento. Mientras que el reforzador al darse al fin al de la respu esta determina que se vuelva a emitir, el incentivo, al adelantarse a esa respu esta, establece la fuerza o la debilidad con la que se va a emitir e, incluso, que no se produzca. Un ejemplo que se nos puede venir inmedi atamente a la mente es el del vendedor que aparte de su salario lleva comisión sobre las ventas que realice, por eso se muestra mu cho más solícito con los clientes.

Por lo visto hasta el momento se puede afirmar que el valor de incentivo afecta a la ejecució n, porque «distrae » la atención del proceso de aprendizaje hacia las conductas necesarias para obtener la reco mpensa cuanto antes. Así, se pasa de busca r el domini o de la tarea a conseguir los límites que establece la reco mpensa para ser recibida, por eso las teorías del incentivo se han desarrollado a partir de los efectos que tienen las condiciones de reforzamiento sobre la ejecución (D elamater, 200 7); de esa forma, no se estudia por aprender sin o para saca r buenas notas.

Consecuencias motivacionales del premio

Las expectativas positivas que crea una recompensa sobre la acción que la provoca, van a llevar a que se incremente el número de veces que se emita esa respuesta para obtener los beneficios esperados. Es más, el saber que a determinada conducta le siguen ciertas consecuencias favorables para el organismo, le va a motivar a repetir la respuesta para conseguir el premio e, incluso, se va a dar esa respu esta más rápidamente co nforme ese estímulo posea más valor motivacional para la persona que ejecuta la acción. Aun que son bastantes los elementos que afectan a la motivación de incentivo cuando se está aprendi endo una conducta que es premi ada, va mos a pasar a estudiar los más importantes:

La contingencia premio-conducta motivada.
Los efectos en la motivación en la magnitud del premio.
La detección de causalidad.
Las consecuencias motivacionales por la demora del premio.

Contingencia premio-conducta motivada

Hasta ahora cuando hablábamos de la adquisición de conductas, indicamos que lo que motivaba al sujeto a realizar repetidamente una conducta eran las expectativas creadas por lo que había conseguido las veces anteriores al realizar dicha conducta, y habíamos planteado contextos en los que siempre que realizaba esa acción, obtenía un reforzador. En las situaciones expuestas hasta el momento, se había empleado lo que se conoce como un programa de refuerzo continuo porque la conducta emitida era reforzada todas las veces que se realizaba. Las relaciones de contingencia que se pueden establecer entre el premio y la conducta motivada son un factor muy importante para predecir la conducta.

Pero la vida no es tan fácil ni de lejos y todos sabemos, y hemos sufrido, el que no siempre por hacer lo mismo en circunstancias similares obtenemos los mismos resultados. Baste solo con observar durante breves momentos la vida diaria para que pronto comprobemos que no siempre es así: la misma ejecución unas veces se premia y otras no. Esto se produce en situaciones tan simples y cotidianas como, por ejemplo, el chiste que contamos ayer a la familia fue muy aplaudido, y hoy ante los amigos no ha despertado ni una carcajada. Asimismo, haciendo el mismo esfuerzo y dedicando las mismas horas al estudio de dos asignaturas, una de ellas se aprueba y la otra se suspende, con lo cual en una se obtiene la recompensa esperada y en la otra no, afectando estos resultados a nuestro nivel de motivación para preparar la recuperación de la asignatura en la que se ha fallado.

Sucintamente se puede decir que cuando la ejecución de la conducta motivada no siempre es contingente con las expectativas que se habían creado al respecto, nos encontramos ante lo que se denomina un programa de refuerzo parcial, es decir, la emisión de la respuesta no tiene en todas las ocasiones las consecuencias que se deseaban. Este tipo de programas se pueden complicar hasta situaciones experimentales realmente sofisticadas, pero no es el momento de entrar en ello, por lo que vamos a profundizar exclusivamente en los programas de refuerzo parcial simple, que son aquellos en los que el sujeto solo debe emitir un tipo de respuesta.

Los programas de refuerzo simple se pueden llevar a cabo de dos maneras diferentes:

bien manipulando el número de respuestas que se tiene que emitir para recibir el premio o,
bien se puede establecer que el premio se dispense después de un período de tiempo determinado.

Cuando se ha acordado que el sujeto debe ejecutar la respuesta un número de veces señalado previamente antes de recibir el premio, nos encontramos ante un programa de refuerzo de razón. En estos programas el sujeto emite la respuesta, y la tiene que repetir hasta que la realice las veces que se haya determinado previamente para que reciba el premio.

Si lo que planteamos es una situación en la que solo daremos el premio cuando haya transcurrido un tiempo acordado previamente, nos encontramos ante un programa de refuerzo de intervalo. En esta situación el sujeto, aunque ejecute repetidamente la respuesta, solo tendrá disponible el premio ante aquella respuesta pasado el tiempo que se haya estipulado previamente y, a partir de ahí, empezará a contar nuevamente otro intervalo de tiempo.

Un ejemplo de programa de razón es el que se emplea para controlar la «conducta de pica» (respuesta de ingerir alimentos compulsivamente cada cierto tiempo producto de estados de ansiedad, como al dejar de fumar o cuando se prepara un examen). A través de un autorregistro (mediciones en tablas de observación que realiza uno de su propia conducta), se puede saber el número de veces que ocurre la conducta y las situaciones en que se produce. A partir de esos datos, se puede establecer que el sujeto reciba el premio cada diez veces que haya conseguido controlar el impulso de comer. También podríamos haber diseñado que la rata solo tuviera acceso a la comida cuando oprimiera cuatro veces la palanca en la caja de Skinner, o que al vendedor de enciclopedias que trabaja a comisión, solo se le diese la gratificación por cada veinte unidades vendidas. Hasta hace poco tiempo junto con la compra de algunos periódicos se entregaban cupones que cuando se conseguía un número determinado de ellos, se regalaba una camiseta o, incluso, una vajilla. Todas estas situaciones se denominan programas de razón fija porque en todas ellas se dispensa el premio emitidas un número predeterminado de respuestas. Con los programas de razón se produce una tasa de respuestas consistente con una característica, la respuesta se interrumpe temporalmente nada más recibir el reforzador, lo que se conoce como pausa post-reforzamiento, pasada esta pausa la respuesta vuelve a emitirse con vigor.

Existe otra situación de refuerzo parcial en la que también se tiene en cuenta el número de respuestas y que se denomina: programa de razón variable. En ella el número de respuestas que debe emitir el sujeto para obtener el premio varía de un ensayo a otro según una programación previ a. En este tipo de programa el sujeto establece unas expectativas de la situación que provocan que se produzca una tasa de respu esta constante, pero cuanto más elevado sea el número medio de respuestas que debe dar para recibir el premio, mayor será la cantidad de respuestas que emita el sujeto. Los programas de razón variable son los que operan en las máquinas tragaperra s; ello explicael vigor y la persistencia de esta conducta «obsesiva », en la que el individuo sigue incesantemente repiti endo la acción de introducir monedas aunque no aparezca el premio.

Ahora vamos a ver aquellas otras situaciones de programas de intervalo en las que se permite el acceso al premio al emitir la respuesta pasado un tiempo determinado. Mientras transcurre ese intervalo de tiempo, el sujeto puede estar motivado para ejecutar la respuesta y realizarla, pero solo recibirá el premio cuando haya pasado el periodo preestablecido y emita la conducta correcta mente; a partir de que se responda se empezará a contabilizar el tiempo para administrar la recompensa en el próximo ensayo. A medida que se va adquiriendo la respu esta, lógicamente el sujeto va aprendi endo la situación y adecuando sus expectativas, lo que le lleva a predecir la aparición del premio y provoca que, anteriormente a él no emita la actividad, pero al aproximarse la fin alización del plazo de tiempo, el sujeto incremente significativamente su número de respuestas.

Un buen ejemplo de programa de intervalo es la eva luación durante el curso académico escolar ya que conforme se acerca la fecha del examen, el alumno estará motivado para incrementar sus horas de estudio y, una vez realizada la prueba, dejará de estudiar unos días hasta que empiece a prepa rar la próxima eva luació n. Si trabajamos con un programa de intervalo para conseguir disminuir las manifestaciones disruptivas de un niño en cl ase, tendrá que conseguir no hacer ninguna conducta de llamada de atención que perturbe a sus compañeros en un periodo de tiempo determinado, y así conseguirá el premio (una pegatina en su cuaderno, por ejemplo). En ambos casos se ha presentado una si tuación en la que las expectativas para acceder al estímulo apetitivo se ajustan a un tiempo fijo establecido previamente, por lo que se denomina programa de intervalo fijo.

En otras ocasiones se puede manipular un intervalo de tiempo medio, que se varía de un ensayo a otro. En estos programas de intervalo variable la tasa de respuestas es más estable y la cantidad de respu estas se ve influenciada por la duración del interva lo, debido a que al sujeto le es difícil crearse unas expectativas sobre la situación. Un ejemplo se puede observar durante una cacería en la que el cazador puede obtener su presa después de esperar pacientemente, o más apropiado sería decir «desesperar», entre los matorrales en algunas ocasiones y, en otras, el «pobre animal» puede aparecer inmed iatamente, ajeno a su destino.

Comparando los dos tipos de programa, razón e intervalo, puede concluirse que en ambos se puede encontrar un patrón de actuación característico: siendo en los de razón dónde se emiten mayor número de respuestas, ya que depende del sujeto el recibir el reforzador; mientras que en los de intervalo se producen pausas después de recibir los premios, pues el sujeto se crea claramente expectativas sobre la situación y el acceso al reforzador y aprende que, independientemente de su conducta, hasta que no transcurra un tiempo determinado no podrá obtener el premio.

Efecto en la motivación de la magnitud del premio

Se ha observado que la cantidad y la calidad del premio afectan a la motivación, en el sentido de que producen más motivación de incentivo y, a su vez, ese nivel motivacional afecta más a la ejecución de una conducta que a su aprendizaje (Figura 7.4). De esta forma se ha comprobado que la ejecución de la conducta motivada aumenta conforme se incrementa la magnitud o cantidad del estímulo reforzante por las expectativas que conlleva. Se pondrá más interés y esfuerzo y, por lo tanto, se hará mejor un trabajo si con ello se consigue un ascenso que si no es así. Pero un aspecto fundamental, y a tener siempre en cuenta, es que para establecer la cantidad óptima de un premio habrá que conocer la historia previa del sujeto, dado que es el factor que nos permitirá conocer las expectativas que se crea rán ante dicho premio. Así, cometeríamos un error al premiar con ir al ci ne a un niño que ha cuidado de su hermanita, cuando sus padres lo llevan todos los fines de semana. Si la gratifi cación que se da a un empleado por el trabajo realizado fuera del horario habitual es menor de lo esperado, aun siendo un dinero extra, provocará que no se desee realizar en sucesivas ocasiones.

En relación a esta variable, inicialmente Crespi (1942) probó de forma experimental, y muchos estudios posteriores lo confirman, que los cambios en la magnitud o en la calidad del premio, durante la adquisición de una conducta, provocan cambios en la conducta motivada, de tal forma que producen efectos exagerados en ella. Esto es lo que se conoce como efecto de contraste, y es uno de los parámetros en donde más claramente se puede observar el peso de la motivación sobre el aprendizaje.

Se denomina efecto de contraste conductual positivo, también llamado efecto de elación, al hecho por el que si a un sujeto experimental se le ha entrenado con una magnitud de recompensa determinada y luego esta se incrementa, el sujeto se hallará más motivado y su número de respuestas au mentará y el tie mpo que tarda en emitirlas disminuirá. Se ha comprobado que aquellos sujetos a los que se les agranda la magnitud del premio a lo largo de un experimento, elevan el número de respuestas dadas por encima de aquellos otros sujetos a los que se les dispensó el premio de mayor magnitud desde el inicio del experimento.

El efecto de contraste conductual negativo es conocido igualmente como efecto de depresión, y es el caso contrario. Si a lo largo del experimento se disminuye la magnitud de la recompensa, los sujetos se encontrarán menos motivados para responder de tal forma que pasarán a responder menos o peor; y, asimismo, se ha demostrado que cuando se desciende la magnitud de la recompensa realizando la misma actuación, los sujetos responden por debajo de aquellos otros a los que se les dio siempre ese reforzador pequeño. En este tipo de contraste se produce frustración primaria que se caracteriza por una seri e de reacciones emocionales desagradables y disruptivas y una dismi nución de la eficacia conductual. En el contraste conductual negativo se produce frustración primaria, generada por obtener menos incentivo del que se esperaba en función de la historia de reforzamiento anterior (Amsel, 1962).

Ambos efectos tienen que ver con las reacciones emocionales que se producen en el sujeto ante el cambio en las expectativas que se crean sobre la situación de incentivo. Esta afirmación se sustenta en aquellos estudios en los que se ha observado un cambio rápido en la ejecución al variar la magnitud del premio durante un experimento, lo que nos indica que esas diferencias de ejecución se deben a diferencias en la motivación y no son conductuales, puesto que los ca mbios en el aprendizaje se producen más gradualmente (Figura 7.5).

El efecto de los tipos de contraste es una variable muy importante a considerar y nos confirma, una vez más, en aquello que venimos in sistiendo repetidamente a lo largo del capítulo: si no conocemos la experiencia previa del sujeto con el reforzador puede que no tenga los efectos que nosotros pensamos a priori.

Una situación considerada de contraste es el denominado aprendizaje latente en el que se aprende una conducta sin recompensa, lo que produce una ejecución escasa pero, sin embargo, cuando esa misma conducta pasa a ser reforzada, se emite rápidamente.

Supongamos que una profesora premia a Luís por hacer los deberes bin y a Juan no, como es esperable observamos que Lu ís realiza la tarea más rápido que Juan, pero si la profesora empieza a premiar a este último, Juan hará los deberes tan rápido como Luís. El hecho pone de reli eve, una vez más, que el premio no influye tanto en el aprendizaje como en la ejecución que, a su vez, depende directamente de la motivación.

En cuanto a la calidad del premio, en líneas generales se puede admitir que la conducta motivada aumenta conforme se incrementa la calidad del premio. Así, por ejemplo, el deportista correrá más para llegar primero a meta, conforme la carrera tenga más proyección internacional. También se ha hallado el efecto de elación y de depresión con las variaciones en la ca lidad del premio, afectando inmedi atamente a la ejecución de la conducta por las expectativas creadas previamente.

Detección de causalidad

Cuando se produce un emparejamiento accidental de una conducta con un premi o, se ti ende a crear unas expectativas de la situación en el sujeto que aumentan la probabilidad de que se repita esa respu esta, aunque en este caso el valor de incentivo no condu zca a nada. En ese contexto no se da contingencia puesto que la respuesta en dichas circunstancias no es la causante del premi o, pero, sin embargo, el sujeto los liga y tiende a repetirlo, es lo que se ha denominado conducta supersticiosa.

La conducta supersticiosa se comparte con muchos animales y en el ser humano también se produce creándose expectativas «fa lsas» al respecto. Así, por ejemplo, a quien le salió genial un examen un día que llevaba unos calcetines rojos, siempre se los ponía para exa minarse, y esos calcetines alca nzaron el va lor de incentivo para tener más posibilidades de realizarlo bien. Hizo una bono loto en martes y acertó, a partir de ahí no hay martes que no la cumplimente. Igualmente, hemos visto perplejos las colas que se organizan todas las Navi dades en ciertas administraciones de lotería, o en la que cayó «el gordo » el año anterior e, incl uso, hasta hemos formado paciente y esperanzadamente parte de ellas. De la misma forma si premi amos a un perro por traernos la pelota y, ocasionalmente, al empezar a correr hace una vuelta sobre sí mismo, tenderá a repetirla siempre que juguemos con él a la pelota. También se puede producir un emparejamiento accidental con un estímulo aversivo, y se producen conductas supersticiosas muy arraigadas como no pasar por debajo de una esca lera porque trae mala suerte… Todas estas acciones son ejemplos de cómo un reforzador sigue de cerca una acción y, aunque no la provoque, se crean fu ertes expectativas erróneas al respecto, y se tiende a repetir aunque el reforzamiento no se deba directamente a los hechos.

Consecuencias motivacionales por la demora del premio

En líneas generales, puede deci rse que el aprendizaje es mejor cuando el premi o se aplicainmediatamente a la realización de la respuesta y, asimismo, que demoras en el acceso al premi o retardan la ejecución, debido a que no se establece cla ramente la asociación entre ambos elementos: conducta motivada-premio. También, se ha explicado este hecho po rque durante el retraso en la administración del reforzador, el sujeto puede realizar otras conductas que pasen a ser premiadas y, con ello, el sujeto no discrimine tan fácilmente la situación de aprendizaje, es decir, se interfiere la asociación conducta motivada-premio. Si a un niño pequeño que acaba de hacer una torre de tres cubos no le decimos inmediatamente «bien, muy bien » (reforzador secundario social), es muy posible que cuando se lo digamos, coincida con que el pequeño haya dado un manotazo a la construcción (que es como suele concluir la edificación), con lo que no estaríamos reforzando la conducta deseada al no emplear bien el premi o, sino que se fortalecería la respu esta de vol car la torre. La importancia de la inmedi atez en la entrega del premio ante la realización de la conducta deseada queda también patente en el adiestramiento de mascotas.

En un principio se creyó que la demora en la aplicación del premio afectaba tanto a la adquisición de la conducta que, a partir de un determinado periodo de tiempo, el aprendizaje se hacía imposible. Posteriormente se ha comprobado que no es exactamente así, dado que en la propia situación aparecen estímulos de marcaje o estímulos marca que actú an como reforzadores secundarios para que se emita la respuesta, aunque no se encuentre el premi o disponible; y estos reforzadores secundarios sí son contin gentes con la conducta motivada, con lo que minimizan los efectos de la demora del premio.

En el caso del ser humano, los reforzadores verbales, por ejemplo, actúan como marcas que permiten demoras prolongadas del premio sin que afecten a la ejecución de la conducta; así a un niño con problemas de hiperactividad que se le está enseñando a recoger su habitación, se le dará un reforzador cada vez que recoja un objeto. Posteriormente, ava nzando en el programa se le dirá «bien, muy bien » cada vez que recoja un objeto y solo se le dará el premio cuando haya colocado toda la habitación y finalmente, solo tendrá acceso a él cuando ordene el cuarto durante una semana.

Nos vamos a detener en el estudio de un efecto importante que se produce ante la demora del premio y que ti ene que ver con las expectativas que se crea n al respecto. Se ha comprobado que la demora del premi o produce que se redu zca su valor de incentivo, lo que ha venido a llamarse descuento de la demora. Por todo lo expu esto hasta ahora, es comprensible que los reforzado res desarrollen más valor de incentivo si se administran inmediatamente; lo que no está claro es cómo va afectando el aplazamiento del premio. Los estudios que han intentado acl arar este aspecto, trabajan con reforzado res de distinta magnitud y distinta demora.

En un principio se pensaba que un premio que se demorara más tiempo pero de gran magnitud, se seguía prefiri endo durante todo el plazo de la demora, sobre otro premio que se dispensara con mayor inmedi atez pero de menor magnitud. Sin embargo, se ha comprobado que aunque inicialmente se hubiera elegido un premio muy demorado de gran magnitud por encima de otro menos demorado y menos interesante, cuando se empieza a aproximar el plazo de cumplimiento del premio inferior que se dispensaba antes, los sujetos pasan a preferir éste por ser más inmed iato, dado que su nivel motivacional se dispara, y renuncian a seguir esperando el de mayor magnitud.

Imaginémonos, por ejemplo, que una empresa ofrece a sus empleados por cumplir sobradamente los objetivos de novi embre dos posibles gratificaciones o premios: un fin de semana en un parador nacional al final de ese mes, u ocho días en un hotel de lujo en la playa durante las vacaciones de verano. Si bien es posible que la mitad de los empleados eligiera las vacaciones en el hotel para el verano, conforme se acerque el fin de mes y los empleados que eligieron la recompensa inmediata empezaran a comentar sobre el fin de semana en el parador, un porcentaje significativo de los que demoraron el premi o, cambiarían su nivel de motivación y pasarían a solicitar el poder ir al parador.

Mazur (2001) ha demostrado que el valor de incentivo de un reforzador demorado aumenta en una proporción creciente por unidad de tiempo conforme disminuye la demora. El margen de tiempo en el que se cambia el criterio de decisión y se pasa a preferir el reforzador más inmedi ato, se denomina margen de vulnerabilidad, porque durante ese tiempo se tienen reacciones más impulsivas y menos ada ptativas. En líneas genera les se puede afirmar que el margen de vulnerabilidad depende tanto de la magnitud y la demora del reforzador, como del autocontrol y la impulsividad del sujeto (Myerson et al., 2003). El saber popular ti ene el di cho «pan para hoy, hambre para mañana», que se podría aplicar perfectamente a esta situación ya que se refi ere a la preferencia de lo inmediato.

Piense en el esfuerzo que supone la adherencia a un programa de adelgazamiento en el que la persona está motivada para no comer ciertos alimentos con el objeto de conseguir bajar peso. En este caso, el reforzador a largo plazo consiste en subirse a la balanza y pesar menos, sin embargo un reforzador inmedi ato es comerse unos pasteles. Es evidente que el valor de incentivo del reforza dor demorado debería ser más po tente que el placer fugaz que produce comerse un pastel, no obstante, como las consecuencias aparecen demoradas en comparación con la inmed iatez del dulce, provoca que tenga menos valor de incentivo, lo que conlleva saltarse la dieta. Puede comprobarse que el manejo de la contigüidad temporal es vital en programas de autocontrol como en el caso que acabamos de describir, pero igualmente con el tratamiento de las adicciones.

Los niveles de motivación y ejecución

Se ha comprobado que cuanto más intensa es la motivación en una tarea, mejor es la ejecución del sujeto y, asimismo, más tiempo tarda en dejar de emitir la respuesta aunque no reciba el reforzador ante su ejecución. Aunqula afirmación anterior se puede decir en líneas genera les que es correcta, existen una seri e de variables que pueden perturbar esa relación, como son, por un lado, el nivel de dominio de la tarea por parte del sujeto y, por el otro, su propia percepción del dominio de la tarea. También se ha comprobado que cambios en las necesidades del sujeto provocan incrementos en las expectativas sobre el premio; por ejemplo, cuando no se ha podido tomar el café del desayuno, porque nos levantamos con el tiempo justo y llegábamos tarde al trabajo, el de las doce nos sabrá mejor.

La conducta motivada ante la retirada del premio

Hay situaciones en las que la apanc1on de una conducta determinada provoca que desapa rezca el premio. En este sentido, el valor de incentivo que posee el reforzador para el sujeto determina que no se ejecute la conducta para que no se retire el estímulo agradable. Ese tipo de entrenamiento se denomina de omisión y su objetivo es suprimir una conducta. Al futbolista que se le saca del terreno de juego por hacer una entrada fuerte a un compañero mientras el resto sigue jugando, se le está aplicando la pérdida de la oportunidad de recibir el premio, o a la persona a quien se «invita» a salir de una discoteca por tener un comportamiento no deseable, como armar jaleo; en ambos casos se está uti lizando una técnica de omisión que es mu y frecuente como técnica para actuar sobre la conducta. Pero para que realmente esa acción fuese eficaz, se debería insistir sobre otras conductas más deseables, por ejemplo, si hace un pase correcto o el entrar a un compañero saltando para no pisarle en el caso del futbolista.

En un principio, cuando se diseñó la normativa del carné de conducir por puntos, al conductor se le retiraban determinados puntos cuando cometía una infracción, y además esa resta de puntos se realizaba inmed iatamente para que se produjera una asociación clara entre infracción y estímulo aversivo. Cuando antes del 2006 se enviaba la multa a casa después de un par de meses de haber cometido la infracción, el conductor se enfadaba por tener que pagar ese dinero, dado que la asociación anteriormente mencionada no se establecía claramente para futuros comportamientos por la demora excesiva entre la conducta y sus consecuencias. Si a esto añad imos que el exceso de ve locidad no se castiga ba siempre, sino que dependía de que hubiera un agente cerca y detectara el comportamiento, la conducta de infringir las normas de circulación presentaba una motivación más alta que la de respetar dichas normas, por lo que era difícil que desaparecieran este tipo de conductas. Seguro que el lector está pensando en estos momentos que tampoco hay un agente cerca cada vez que cometemos una infracción con el carné por puntos, y tiene razón; pero si bien es verdad que no se computan todas las infracciones que realiza un conductor, cada vez que se detecta un comportamiento disruptivo afecta a las conductas posteriores al restar puntos, lo que actuaría como marcaje del estímulo aversivo y atenuaría los efectos de la demora.

La conducta motivada ante estímulos aversivos

Se pueden establecer dos situaciones en las que se emplea un estímulo desagradable pero con consecuencias diferentes sobre la ejecución: escape/evitación y castigo.

En la situación de escape/evitación, la aparición de la conducta tiene como efecto que desaparezca el estímulo desagradable o que no llegue a presentarse y, en ese caso, el valor de incentivo llevará a ejecutar la conducta para no sufrir los efectos del estímulo desagradable.

En la situación de castigo, la respuesta provoca que aparezca un estímulo aversivo, por lo que la adquisición de expectativas al respecto debería llevar a no ejecutar la conducta. Como se ha indicado anteriormente, en esta situación no se refuerza la respuesta sino que se castiga.

La huida

La situación de escape se denomina ta mbién de reforzamiento negativo dado que la consecuencia de la ejecución de la conducta es la retirada del estímulo aversivo. A medida que el sujeto va adquiriendo la conducta, ejecutará más rápidamente la respuesta para evitar o escapar del estímulo desagradable. Las expectativas que crea el sujeto ante la situación es lo que le permite no sufrir las consecuencias del estímulo desagradable. Si nos sentó mal la comida de un restaurante evitaremos vo lver a entrar (evitación), o dejaremos de comer si nos está sentando mal el alimento (escapar). No es lo mismo no pasar por una zona oscura y poco co ncurrida para evitar el peligro palpable o posibles sustos, que escapar a toda ve locidad de un ladrón; al igual que no es semejante no comer callos porque me sientan mal que comerlos y tomar bi carbon ato para aliviar sus efectos y facilitar la digestión.

La principal diferencia entre el escape y la evitación es:

En una situación de escape, aparece el estímulo aversivo y el sujeto se encuentra motivado a escapar de él para no sufrir sus consecuencias.
En una situación de evitación se hace uso de los denominados estímulos discriminativos que avisan de la próxima aparición del estímulo aversivo, lo que posibilita el no sufrirlo. De esta forma, en los primeros ensayos en una situación experimental de evitación, el sujeto padecerá el estímulo aversivo y al emitir la respuesta escapará de él, pero con la presencia de un estímulo discr iminativo que le avise de la situación, a medida que avancen los ensayos, aprenderá que ese estímulo discriminativo, le avisa de la aparición del estímulo aversivo y así no tendría que sufrir las consecuencias del estímulo aversivo. Por ejemplo,imagin e que se introduce a una rata en una jaula en la que apretando una palanca puede escapar de una pequeña desca rga eléctrica, pues bien si se enciende una luz previamente del inicio de la descarga, el animal anticipará la respuesta antes de la aparición de la descarga, evitando de esta forma sus consecuencias.
El condicionamiento de escape/evitación es enormemente adaptativo dado que el objetivo de este tipo de situaciones es el incremento de la respuesta motivada con el empleo de un estímulo aversivo. En esa línea, comparte con la recompensa el motivar a la realización de la respuesta, pero difiere de ella en que se emplea un reforzador aversivo. La reducción de un estímulo aversivo produce la conducta de huida o escape, mientras que su prevención da lugar a la conducta de evitación. Podemos comprobar que en estos casos el reforzador aversivo, motiva al sujeto para actuar (apagamos la alarma del reloj en el momento que empi eza a sonar para evitar su sonido estridente).

Imaginemos que Juan pertenece a una empresa famili ar que arregla relojes carrillón a domicilio. La empresa considera que Juan emplea demas iado tiempo en cada repa ración y se lo ha confirmado un cliente que ha llamado para protestar, porque estuvo mu cho tiempo hablando por el móvil y ha dejado pi ezas sin ajustar. La empresa para evitar esa situación decide li mitar el tiempo de las reparaciones y le advierte que cada vez que emplee más de dos horas, la siguiente vez se enca rgará de arreglar un relojsu izo que, por su maqu inaria compleja, ningún empleado quiere realizar. La respuesta de Juan puede evitar que se produzca el estímulo que para él es aversivo. En el ejemplo se está trabajando con una situación de escape. Pero sigamosimagin ando y suponga mos que para evitar la ho lgazanería de ju an la empresa le in forma que le va a colocar un cronómetro que le informa del tiempo transcurrido y, por tanto, del restante para finalizar la tarea en el plazo establecido. Con ese estímulo discriminativo puede contro lar el tiempo restante con lo que le será más fácil evitar el estímulo aversivo.

Con el ejemplo de Juan se ha podido comprobar cómo se le ha motivado para que realice la respuesta correcta, pero recuerde que dijimos que la base del condicionamiento operante era que se debía emitir una respu esta para ser reforzada y así incrementar su frecuencia, mientras que el objetivo del escape/evitación es que no apa rezca el reforzador, es decir, al emitir la respuesta antes de que aparezca el estímulo aversivo se contraviene de alguna manera al principi o general del condicionamiento operante.

Se han intentado dar diferentes explicaciones a este hecho, vamos a exponer sucintamente la más importante: la teoría de los dos factores. O. H. Mowrer (1957) propuso la teoría de los dos factores para indicar que la conducta de escape se adquiere por una fase de condicionamiento clásico y otra de condicionamiento operante. Inicialmente el sujeto recibe el reforzador aversivo (un a descarga), y el estímulo discrimi nativo (una luz) se condiciona clásicamente a la respuesta de miedo. De este modo, aunque la desca rga no llegue a aparecer, la luz hace las veces de reforzador aversivo, por lo que se emitirá la respuesta para escapar del miedo. La respuesta se refuerza por la reducción del miedo.

Por otra parte, se ha comprobado que no se puede condicionar cualquier respuesta de escape, sino que el organismo muestra conductas defensivas propias de la especie, que le lleva a emitirlas en situ aciones de pel igro. Este tipo de respuestas son las que el sujeto emite en circunstancias de pe ligro y no las operantes en sí (ante un fu ego, sí huye instintivamente y no se da saltos o palmadas, por ejemplo).

Investigaciones posteriores se inclin an a dar una interpretación cognitiva, incidi endo en las expectativas que se crea el sujeto ante la situación. Esta postura defiende que la evitación se produce por las expectativas de actuar que elabora el sujeto ante la situación. Posiblemente seala intervención de los tres elementos lo que dé una explicación más completa de los mecanismos subyacentes de la evitación: la intervención del dualismo condicionamiento cl ás ico-operante defendido por la teoría de los dos factores, las reacciones defensivas propias de la especie y las expectativas de actuar.

El castigo

En el castigo la ejecución de la respuesta provoca la aparición de un estímulo aversivo, por lo que es básicamente un procedimiento para red ucir la aparición de una conducta, tanto en su intensid ad como en su frecuencia. Pero atención: recuérdese que en el ca pítulo 6 se defini ó el reforzador como aquel estímulo que aumentaba la probabilidad de una respuesta y, por ello, debe quedar claro desde el principio que en el castigo no hay refuerzo porque el sujeto crea expectativas de la situación que le llevan a no responder, ya que su respuesta implicaría recibir el estímulo aversivo. La finalidad del castigo es la no emisión de la conducta. En este sentido, castigo se opone a refuerzo. Por otra parte, debemos distinguir el castigo de la situación de evitación/escape ya que el objetivo del castigo es, como acaba mos de indicar, motivar para dejar de emitir una conducta y en la situación de escape o en la evitación, sin embargo, el sujeto se encuentra motivado a dar aquella respuesta con la que evita o en la que escapa del estímulo aversivo.

Inicialmente se pensó que el castigo solo motivaba la desaparición temporal de la conducta pero no la eliminaba, por lo que se han llevado a cabo muchos estudios para comprobar la efectividad real del castigo y para investigar las condiciones en las que se podía aplicar. Fruto de esos trabajos se han establecido un a seri e de variables que, dentro de unos límites, afecta n a los resultados del castigo:

Intensidad del estímulo aversivo. Los estudios con animales y humanos han demostrado que la eficacia del castigo depende de su intensidad e, inicialmente al menos, se debe presentar en su «máxima» intensidad para alca nzar mayores niveles de motivació n. Experimentalmente se ha comprobado que se producirá menor supresión de la conducta si se utiliza al principio un castigo suave y se va incrementando grad ualmente su intens idad hasta tal punto que, intensidades altas posteriores, no su rten los resultados previstos. Igualmente se sabe que un castigo débi l tiene poco efecto sobre la conducta que se pretende eliminar y, en cualquier caso, dicho efecto es transitorio.
Duración del estímulo desagradable. Cuanto más prolongado dentro de un os límites sea el castigo, mayor efecto supresor tendrá.
Contingencia del castigo. Para que sea efi caz siempre se debe administrar el castigo ante la conducta inadecuada; esto es, siempre se debe producir la contingencia. Si no se aplicade forma continua el estímulo aversivo, la respuesta tardará más en suprimirse. Se ha demostrado que con programas de castigos intermitentes la conducta persiste durante más ensayos. Los delincuentes que delinquen una y otra vez, y son puestos en libertad inmed iata mente, tienen mayor posibilidad de repetir la conducta por las expectativas que desarrollan sobre los efectos de sus actos.
Efecto de la demora. Esta variable influye sobremanera en el grado de supresión de la respuesta. Para que sea efi caz un castigo debe aplicarse de inmediato. Demoras entre la emisión de la respuesta y la aplicación del estímulo desagradable, producen menor supres ión de la respuesta. Si a un cachorro se le regaña por comerse una zapati lla, pasadas unas horas del «desastre» , el animal no aprenderá las consecuencias de su conducta.
Disponibilidad de una respuesta alternativa. La disponibilidad de una fuente alternativa de premi o au menta enormemente el efecto supresor del castigo. Es decir, si a la vez que castigamos una respuesta, motivamos a que realice el sujeto otra conducta premiada, la probabilidad de ocurrencia de la respuesta castigada, disminuirá drásticamente.

Si se manipulan bien las variables expuestas se podrán control ar los efectos del estímulo desagradable sobre la supres ión de la conducta y, así, este procedimiento será efi caz. No obstante, su mal empleo o su utilización constante provocan ansiedad en el que lo padece. Asimismo, se ha comprobado que cuando se vive en un ambiente dónde se emplea continuamente el castigo para eliminar conductas, posteriormente también se recurrirá con más frecuencia a él en las interacciones con los demás; un o se hace finalmente más agres ivo (Montes et al., 201 O). Esta consecuencia es tan impo rtante que convi ene tomar buena nota de ella.

Tal y como indica Reeve (20 1O) el castigo provoca cuatro tipos de efectos: el efecto primario consistente en la supres ión de la conducta que se pretende castigar, el efecto físico que aba rca aquellas consecuencias físicas directas (el dolor en muchos casos), el efecto social que implicaría las reacciones sociales y quizá jurídicas por la conducta castigada e, incluso, las secuelas sociales del castigo a otras personas próximas a la persona castigada (si un político comete un acto de prevaricación, recae los efectos de ese castigo a su grupo po lítico y a su fa mili a) y, finalmente los efectos secundarios. El castigo provoca seis efectos secundarios:

Conductas emocionales apa rejadas a los efectos del castigo (miedo, rabia…).
Conductas de escape y huida (se intenta escapar de la persona que inflige el castigo).
Sustitución de la respuesta castigada por otra igualmente no deseada (se castiga a un niño por gritar y empi eza a dar patadas).
Facilitación de la respuesta que provoca que la conducta castigada se incremente (s i se le castiga por gritar, grita más).
Supresión generalizada de las conductas semejantes y así el castigo se generaliza a otras conductas (s i se regaña a un niño por gritar, deja de hablar). Y,
Modelamiento negativo, el mode lado es una forma de aprendizaje consistente en aprender una conducta al observar su ejecución en otra persona y las consecuencias que conlleva (se verá posteriormente); el modelado negativo se refiere al modelado de conductas no deseadas en ambientes naturales (en las conductas delictivas, un lad rón aprende de otro, porque observa que las consecuencias de su conducta son más beneficiosas, el botín, que el castigo que puede recibir por ello, la condena.

Una situación a señalar con secuelas muy dañ inas para el que la padece es aquella en la que se expone a un sujeto a estímulos aversivos de los que no se puede escapar. En esos casos se produce un estado que se deno mina indefensión aprendida e induce, fundamentalmente, a que no se sepa responder ante otras situaciones. Genéricamente, la indefensión aprendida provoca un retraso en futuros aprendizajes si se reciben previamente contingencias incontro lables. Cuando un sujeto muestra indefensión aprendida se considera incapaz de evitar otras situ aciones desagradables y, en genera l, se ve inepto para dar solución a cualquier situación con la que se tenga que enfrentar. Este caso justifica el comportamiento de la persona que sufre malos tratos al sentirse incapaz de escapar de la situación posterior.

De todas las teorías explicativas al respecto, la más completa es la de las expectativas que se crea el sujeto acerca de la falta de control sobre los eventos que, además, transfiere a otras situacio nes (en el sigui ente capítulo se verá más detalladamente).

LOS NIVELES DE MOTIVACIÓN EN LA EXTINCIÓN

Si la ejecución de una conducta no va seguida del estímulo esperado, la intensidad de la respuesta decrece y su probabilidad disminuye hasta que llega un momento en que desaparece. En esta situación denominada de extinción, la motivación del sujeto por ejecutar la conducta desciende, dado que ya no está incentivado para realizarla. No se nos puede pasar por alto que en la vida diaria la extinción puede ser tan adaptativa como la adquisición, ya que es lógico pensar que si una conducta deja de recibir las consecuencias que provocaba su repetici ón, es más económico dejar de responder. Si, por ejemplo, la ratita en la caja de Skinner aprieta la pal anca pero no recibe premio por ello, después de varios ensayos cambiarán sus expectativas sobre la situación y dejará de responder. E igualmente cesa rán las rabietas del niño, que utiliza como «potente arma» para salirse con la suya, si se le deja de prestar atención.

Inicialmente cuando desaparece el estímulo apetitivo, el sujeto incrementa tanto el número como la magnitud de sus respu estas debido a su nivel de motivación y, a su vez, aparece una reacción emocional intensa de frustración por la falta de las consecuencias esperables de su conducta, que en algunos casos produce agresividad. Aunque durante la extinción la respu esta deja de emitirse, no qu iere decir que ésta haya desaparecido completamente. Ilustrando el ejemplo de la rabieta, cuando al niño inicialmente se le deja de hacer caso, perseguirá a los padres por toda la casa «gritando e, incluso, subirá los decibelios».

Una forma de medir la extinción es comprobando las veces que el sujeto da la respu esta cuando no se presenta el estímulo apetitivo. Así, por resistencia a la extinción se entiende el número de veces que se sigue emitiendo la respuesta aunque las consecuencias de di cha conducta no se presenten, debido al nivel motivacional alca nzado durante la adquisición de la respuesta. Las variables que afectan a la extinción se miden por los efectos que producen en dicha resistencia. Las más destacables son:

La contingencia estímulo reforzante-conducta motivada empleada en la fase de adquisición es determinante de la resistencia a la extinción que manifieste la conducta. La diferencia en adquisición de la respuesta entre los programas de refuerzo continuo y los programas de refuerzo parcia l, que ya hemos visto que provocaban adquisiciones diferenciales de la respuesta, es mucho más pronunciada cuando se compara su efecto sobre la extinción de la respuesta. De esta forma, una conducta que se ha adquirido consiguiendo siempre el premio ante su ejecución, se extinguirá más rápidamente porque se cambiarán antes las expectativas sobre la posible ejecución, que una conducta que se haya adquirido recibiendo ante su ejecución unas veces el premio y otras no. Con programas de refuerzo parcial la extinción se produce más lentamente que con reforzamiento continuo. Veamos, como ya hemos estudiado, una conducta que se premia en todos los ensayos, se adquiere antes que aquella otra en la que se dispensa el premio solo en algunas ocasiones; sin embargo, el nivel motivacional de la conducta premiada continuamente desciende rápidamente cuando deja de administrarse el premio y se extingue más deprisa.
Si el aprendizaje se ha efectuado en distintos ambientes, la extinción es más difícil dado que se han creado más expectativas en distintas claves contextuales.
El efecto de la magnitud de la recompensa depende de la cantidad de veces que se haya ejecutado la conducta, de tal forma que a igual magnitud un entrenamiento largo provoca mayor resistencia a la extinción, mientras que un entrenamiento breve produce menor resistencia.
La demora del premio durante la adquisició n provoca mayor resistencia a la extinción cuando se han empleado demoras diferentes mientras se aprendía la conducta; es decir, distintas demoras del premio, enl entecen la extinción de la conducta. En el caso de haber utilizado la misma demora,entonces dicha variable no afecta a la extinción.

LA ACTIVIDAD COMO MOTIVADORA DE LA CONDUCTA

Hasta este momento hemos visto que el reforzador se definía como aquel estímulo que incrementaba la probabilidad de una respuesta. También hemos estudiado que actúa como reforzador todo aquello que disminuye la necesidad biológica del sujeto, y a ese tipo de motivo se le conoce como motivo innato (el capítulo 4 está dedicado a ello). Pero por condicionamiento clásico comprobamos que se podía establecer un condicionamiento de segundo orden en el que un EC producía una RC por estar emparejado con aquel, cuyas propiedades motivadoras eran adquiridas (el El en ese nuevo condicionamiento había actuado de EC en un condicionamiento previo).

Ahora vamos a exponer otros planteamientos que indican que no solo los estímulos pueden actu ar como reforzadores de una conducta, sino la propia actividad puede comportarse como reforzadora si motiva la repetición de otra conducta.

David Premack (1971) elaboró la teoría de la probabilidad condicionada, también conocida como principio de Premack, en la que mantiene que puede actuar como reforzador cualquier actividad cuya probabilidad de ocurrencia sea mayor que la de la conducta exigida. Premack postula que cuando una conducta se hace contingente con otra, la más probable servirá de reforzador a la menos probable, pero no al contrario, es decir, dadas dos respuestas cualesquiera, la respuesta más probable puede motivar al sujeto para emitir la respuesta menos probable. Creó una situación experimental (1971) en la que una rata sed ienta a través de una rueda de actividad podía acceder a la bebida, así la sed se convirtió en el reforzador de correr, en estas circunstancias la rata corría para saciar la sed (la conducta de beber actuaba de reforzador); posteriormente invirti ó el proceso, en este caso la rata tenía acceso continuo al agua por lo que no tenía la necesidad de entrar en la rueda de actividad, pues bien, ahorala rata bebía y después corr ía, el correr se había convertido en reforzador de la conducta de beber. Con la situación experimental se comprueba que activi dades con alta probabilidad refuerzan las actividades de baja probabilidad. Al observar el porcentaje de tiempo que un sujeto dedica a una actividad, podemos comprobar sus preferencias que, obviamente, son subjetivas. Ahoraimagine una situación en la que se ofrece a un grupo de personas que elijan entre dos tipos de actividades: pintar un cuadro o escribir un cuento, como es de esperar y según sus gustos personales, unas escogen pintar y otros escribir; para aquellas personas que prefieren pintar, el pintar se convi erte en una actividad reforzante, mientras que para las personas que prefieren escribir, la escritura se convi erte en lo reforzante. Como se puede observar lo reforzante es la actividad que facilita el estímulo reforzador (por ejemplo, comer, beber, escapar, jugar…), y no es el estímulo, como habíamos visto hasta ahora, lo que es reforzante en sí (caramelos, agua), este estímulo pasará a ser una parte de la conducta consumatoria.

La teoría de Premack tiene gran repercusión en la psicología, dado que permite que siempre se pueda encontrar un motivo para el aprendizaje de una conducta nueva. Basta con fijarse en el repertorio de conductas del sujeto y emplear aquella que realice con más frecuencia, para reforzar la que se desee que adquiera. Así un niño con autismo con el que es difícil interaccionar por su propia patología, si se observa que mira continuamente las láminas de un li bro (conducta más frecuente), se puede emplear éste como reforzador cuando presente respuestas de aproximación al adulto (conducta muy poco frecuente).

Timberlake y Allison (1974) propusieron la hipótesis de la privación de la respuesta al comprobar que también podían actuar como reforzadores aquellas conductas del sujeto que ocurrían con menor frecuencia, siempre y cuando esa conducta poco frecuente estuviese restringida (comer helados). Según los autores, observando la actividad de los organismos es posible predecir cuándo la oportunidad de emitir una actividad se convertirá en reforzadora de otra, e, incluso, postulan que se puede comprobar que una actividad de poca probabilidad de ocurrencia, se puede convertir en reforzadora de otra de mayor frecuencia. En posteriores investigaciones, estos mismos autores desarrollaron su hipótesis inicial al comprobar que, en condiciones normales, los sujetos emiten el menor número de respuestas contingentes para sacar el máximo provecho a los reforzadores o, lo que es lo mismo, se busca emitir el menor número de respuestas para conseguir el reforzador. De esta forma, cualquier actividad, sea más o menos frecuente, se puede convertir en reforzadora de otra, lo que han denominado teoría de la distribución conductual, convirtiéndose la hipótesis de la privación de la respuesta en un caso particular de esta nueva teoría.

La hipótesis de la distribución conductual curiosamente surgió en el campo de la economía y viene a indicar que lo que se pretende es que a través de reforzadores adecuados, el sujeto llegue a tener un a adaptación correcta de su tiempo y actividades. En este sentido, parte de que los organismos hacen una distribución ele sus actividades que les resulta lo más agradable posible, por lo que pretenden mantenerla frente a los cambios; así si se perturba ese «plan de actividades óptimo», el sujeto deberá cambiar su conducta para volver a regular ese cambio. Desde di cha teoría se plantea que como los organismos hacen una distribución adaptativa de sus actividades, lo que se intenta, durante el condicionamiento, es romper dicha distribución para condicionar la realización de una tarea previa del sujeto, a la ejecución que se desea implantar. Así durante el condicionamiento, se redistribuye el tiempo de una forma diferente a como había hecho el propio sujeto, por lo que, dentro de la situación que se le impone, se pretende que llegue a su propia distribución adaptativa. Por ejemplo, si un niño dedica más tiempo a jugar a la conso la que a estudiar y deseamos que lógicamente sea al contrario, habrá que cambiarle esa distribución de su tiempo y el niño estudiará para poder acceder a lo que realmente quiere.

Desde aquí podemos afirmar que con la manipulación de los reforzadores se puede intervenir en la conducta, a través de su nivel de motivación, y no siempre el sujeto es consciente de ello.

LA MOTIVACIÓN Y EL APRENDIZAJE OBSERVACIONAL

Hasta ahora hemos estudiado el aprendizaje como una experiencia directa del sujeto con su medio, pero es una realidad innegable que los seres humanos aprenden comportamientos no solo al ejecutarlos sino también, y quizá principalmente, por ver realizarlos a los demás y observar las consecuencias que tienen en el otro. El término imitación proviene del griego mimesis que hacía referencia al aprendizaje a través de la imitación de conductas y de modelos abstractos en los estilos literarios.

Aunque la imitación no es una actividad exclusivamente del hombre dado que se ha observado en pájaros, ratas, gatos, delfines, perros y principalmente en monos, sí se ha comprobado una relación directa entre nivel cognitivo y grado de imitación. De tal manera que está demostrado que a mayor complejidad del sistema nervioso, no solo aumenta el número de conductas imitativas, sino también su calidad y sus mecanismos de control. Lo que es incuestionable para todos los estudiosos del tema es su valor supervivencia! y la economía que supone un aprendizaje de este tipo, pues si la capacidad de aprendizaje se redujera a la experiencia directa con la situación, la posibilidad de adquisiciones de nuevas conductas se vería seriamente limitada. Imaginemos que tuviéramos que aprender todo desde el principio sin que nos sirviera la experiencia de los demás, o, extremando la situación, que tuviéramos que ser atropellados para aprender que no se cruza con el semáforo en rojo.

En el ser humano es tan importante la imitación, que de este fenómeno se han aprovechado todas las culturas y, por ello, se han utilizado modelos para implantar conductas ecológicamente válidas. Si bien esos modelos que juegan un papel fundamental en la conformación de la conducta y la modificación de las normas sociales, pueden ser muy diferentes en unos med ios y otros. Pero hagamos un inciso y vayamos al caso contrario, en cuanto al establecimiento de modelos socialmente perniciosos y al peligro que encierran. Pensemos durante un momento en la televisión como medio de comunicación de masas que indudablemente crea corrientes de opinión, y provoca patrones a segu ir, y reflexionemos en aquellos «programas basura» que crean una gran expectación, y en los que se da importantes cantidades de dinero para que asistan a un plató cierto tipo de individuos que cometieron hechos delictivos. Retransmitiendo la entrevista se refuerza esa conducta puesto que se recibe dinero por asistir a contarlo y, lo que es peor, se muestra un modelo no deseable para la sociedad, pero que no es tratado como tal (no se muestra rechazo, sino que se le da popularidad).

Como hemos visto la imitación tiene gran incidencia en los aspectos sociales, y se la ha denominado dentro de la psicología como aprendizaje observacional, social o modelado dada la influencia que posee el modelo para el sujeto que observa, pero también ha recibido otros nombres como aprendizaje vicario, por no tener los sujetos experiencia directa sino mediatizada por un mode lo, y aprendizaje sin ensayo, al no precisar ningún tipo de realización motora. Aunque toda la terminología al respecto se puede considerar equivalente, nosotros vamos a emplear el término de aprendizaje observacional (AO).

Es indudable el papel que desempeñala imitación en el desarrollo de la conducta humana: un bebé inicia sus balbuceos como respuesta a los de sus padres y en esa interacción mutua se produce el avance de sus potencialidades, luego copia a sus hermanos de mayor edad, y aprende de sus compañeros de juego, en la adolescencia imita a sus amigos y ya adulto reproduce modelos sociales. Elentorno fa miliar es un modelo tan determinante en el desarrollo de la personalidad, que tendemos a repetir conductas observadas en la infa ncia aunque en su momento no se estuviera de acuerdo con ellas; en ocasiones, cuando se crece en un ambiente de violencia o alcoholismo, se tiende a reproducir esos mismos modelos en la madurez (Connolly y Goldberg, 1999; Patró y Limaña, 2005). Pero el papel de la imitación no se delimita a este bosquejo superficia l, sino, por el contrario, va más allá, dando cuenta de gran cantidad de adquisiciones en las que a veces, incluso, se mezcla la ejecución de la conducta con la observación de esa misma conducta en un modelo (en el juego del ajedrez a la vez que se compite, se aprenden estrategias del adversario).

Tentativas explicativas de la imitación

Un primer intento por dar explicación a la imitación se proporciona desde las teorías instintivistas que ya hemos visto y que consideraban la capacidad de imitar como una tendencia innata o instintiva. De ese modo, la influencia que ejercía un modelo sobre un observador se debía a que éste se encontraba dotado de un instinto imitativo y, así, el hombre reprodu cía de forma inconsciente la conducta de los demás por una propensión innata a ello. D esde estos planteamientos se trata de una conducta de copi a, con lo que se limita sobremanera las posibilidades del aprendizaje observacional.

Como ya hemos visto en el capítulo anterior, desde el conductismo se rechazó la posibilidad de plantear la imitación como un instinto ya que suponía la existencia de un impulso interno entre el estímulo (conducta de otro) y la respu esta (imitar la conducta), pasando a considerarse una conducta aprendi da en términos asociacionistas.

Posteriormente se busca dar una explicación a este comportamiento desde el condicionamiento clás ico. Para dicho condicionamiento, la úni cacondición necesaria y suficiente para la aparición y mantenimiento de la conducta de imitación es la contigüidad espacio-temporal entre la situación observada y la posibi lidad de emitir la respuesta a imitar. La imitación se produciría por el condicionamiento pavloviano de verbalizaciones, respuestas motoras o emocionales y estímulos sociales simil ares, que adquirirían la capacidad motivacional por asociación. Todas las teorías asociacionistas explican có mo la conducta aprendida previamente puede ser provocada por la acción de otros, pero no dan cuenta adecuadamente de la manera en que se adquieren respuestas nuevas.

Desde los planteamientos del condicionamiento operante se consi dera que para producirse la imitación es preciso que exista un sujeto motivado al que se refu erce y un observador, lo que significa, en otras palabras, que para aprenderse la conducta debe ser reforzada y, para ello, ti ene que ser ejecutada. De esta forma, las conductas que correspondan a las acciones del modelo se reforza rán pero no aquellas divergentes, convirtiéndose la conducta de los demás en señal para efectu ar la propia respu esta y seleccionando uno mismo, de su propio repertorio, aquellas respuestas del modelo que son reforzadas. Se establece la imi tación como una contingencia

Ed - - - - - - R - - - - - - Ref

Ed, conducta a imitar que actúa como estímulo discriminativo

R, respuesta imitada

Ref, reforzador

Este modelo presenta tres limitaciones: en cuanto que la respuesta debe existir previamente en el repertorio de conductas de la persona que imita, dado que está sobradamente comprobado que se puede ampliar el repertorio de conductas a través de la imi tación; en cuanto que se exige que exista un reforzador para que se adquiera la conducta, ya que se aprenden la conducta observándo la sin necesidad de un reforzador; y, por último, en cuanto que considera que se debe ejecutar la conducta una vez observada, cuando se ha comprobado que existe la imitación demorada.

Posteriormente, el modelo operante establece el co ncepto de imitación generalizada para explicar la conducta imitativa sin un refuerzo contingente, dado que es el modelo quien recibe el reforza dor, no el observador. Se llega a suponer que si se recompensa consistentemente la reproducción del modelo, la similitud conductual entre la conducta del modelo y la propia adquiere propiedades reforzantes secundarias. Por tanto, tenderemos a mani festar una frecuencia alta de determinadas conductas imi tativas, que por su va lor de recompensa se verán fo rtalecidas y mantenidas aún no habiendo sido reforzadas externamente. El problema que plantea ese tipo de teorías es su insuficiencia para explicar la aparición de conductas imitati vas, en aquellas situ aciones en que no se dispensa refu erzo ni al modelo ni al observador.

Justificaciones cognitivas del aprendizaje observacional

La explicación cognitiva de la imitación parte de que el modelo expuesto anteriormente de estímulo-respu esta es escaso, por lo que recurre a representaciones cognitivas por parte del observador de la conducta del mode lo; mientras que el mode lo realiza la acción surgen procesos simbó li cos, antes de efectuarse ningún tipo de respuesta y sin necesidad de ningún reforzador. En este contexto, el refuerzo pasaría a definirse como el cambio en la conducta de los observadores en función de la observación de las consecuencias que acompa ñan a las actuaciones de los demás.

El máximo representante de esta postura es Albert Bandura (1925-) quien elaboró la teoría del aprendizaje social (1977), que ti ene como punto principal considerar que el ser humano se encuentra fundamentalmente inmerso en un medi o social por lo que gran parte de lo que aprende lo consigue al observar la conducta de los demás y, a través de esa observación, además de adqu irir creencias, conocimientos, reglas, etc… , aprende la utilidad de ciertas conductas por las consecuencias que conllevan.

La teoría del aprendizaje social fue posteriormente ampliada, pasándose a denominar teoría social cogni ti va (1986) que parte de tres supuestos:

Las interacciones recíprocas. Según Bandura la conducta se explica según el mode lo de reciprocidad tri ád ica en el que la conducta, los factores cognitivos y elentorno son factores determinantes y se influyen mutuamente. El modelo de reciprocidad diádica no implica que las influencias siempre tengan igual peso, es decir, a veces un elemento determina en mayor manera el aprendizaje que otro. Por ejemplo, cuando a una persona se le permite elegir entre dos tipos de conductas, los factores perso nales tendrán más peso, mientras que en el caso de una situación de peligro, los ambienta les determinarán la conducta; no obstante, la mayoría de las veces el comportamiento es fruto de la interacción de los tres elementos. Veámos lo con un ejemplo, supo nga que quiere aprender a jugar al mus y que un jugador avezado se ofrece a enseñarle las distintas jugadas (el medio influye en sus cogniciones), vd a su vez hace preguntas (s us cog niciones determinan su conducta), yento nces, el experto le vu elve a explicar sus dudas (la conducta influye en el medio). Finalmente, el jugador experto determina qué es lo que tiene que enseñarle para que pueda jugar sin problemas al mus (e l medi o determina las cognicio nes que determi nan, a su vez, la conducta), vd. decide empezar a jugar e intentar no quedar como un novato (la conducta influye en las cogniciones), y de vez en cuando vu elve a preguntar al juga dor experto (las cognicio nes influyen en la conducta, que influye en el medio).
El aprendizaje directo y el aprendizaje vica rio. Bandura considera que el aprendizaje implica un procesamiento de la información en el que los datos delentorno y del in dividuo se analizan y procesa n, as imismo establece dos ti pos de aprendizaje, el directo en el que se aprenden las consecuencias de la propia conducta y aquel en el que se aprende vicariamente. D e forma vicaria se acelera el aprendizaje dado que se evita tener que ejecutar todo ti po de conductas para aprenderlas y, generalmente, las acti vidades co mplejas se mejoran en gran parte por observación (se juega al ajedrez practicándolo y sobre todo observando otras partidas).
El aprendizaje y el desempeño. Como ya se ha indicado, no siempre que se aprende una conducta se ejecuta.

La teoría social cognitiva considera el AO como una «representación mental y elaborada de un sujeto que ha observado a un modelo, que ejecuta alguna conducta o sufre las consecuencias de alguna acción, sin que sea preciso que el observador realice esa conducta». D e esta forma, desde su postura socio-cognit iva considera que el reforzador sí influye en el AO, pero a través de una mediación cognitiva ejerciendo una «influencia antecedente más que consecuente» (Bandura, 1977, pág. 3 7). La forma de actuación sería la siguiente: una persona ve el reforzador que recibe el modelo, lo que provoca su foca lización atencional hacia esas conductas y la aparición de expectativas sobre los pos ibles efectos del reforzador, lo que le incita a un incremento de la retención de lo aprendido, aumentando la posibilidad de su codificación. En otras palabras, la anticipación del reforzador es uno de los factores que pueden influir en que se observen determinadas cosas, y otras pasen desapercibidas. Para Bandura el esquema de funcionamiento del refuerzo vi cario es el expuesto a continuación (considérese que el refu erzo lo recibe el modelo pero actúa sobre el observador).

Según la teoría el refuerzo se estima como un factor que facil ita el proceso de aprendizaje, pero no es una condición imprescin dible. Se considera que la explicación que se da desde las teorías operantes, para las que es imprescindi ble que se dispense un reforzador, es un caso especial de AO. La diferencia entre ambas pos iciones se encuentra en la distinción entre aprendizaje y ejecución, dado que para la ejecución es preciso la aparición del reforzador, pero para la adquisición de respu estas de imitación es importante la contigü id ad estimular e, igualmente, de los procesos simbó licos asociados a la misma. No todo lo que se observa se ejecuta, aunque sí se puede aprender.

Bandura apela a la existencia de cuatro procesos in terrelacionados que influyen marcadamente en el grado y contenido del aprendizaje:

Procesos atencionales.
Procesos de retención.
Procesos de reproducción motora.
Procesos de motivación.

Los dos primeros procesos están implicados en la ad quisición de la conducta modelada, mientras que los dos últimos tendrán más que ver con su ejecución.

Procesos atencionales

En estos procesos se considera que la atención que se presta a los acontecimientos relevantes del medi o es necesaria para que sean percibidos de forma significat iva, ya que hay que tener en cuenta que la estimulación contigua por sí sola no produce siempre la adquisición de respuestas. Se considera esencial la foca lización y mantenimiento de un foco atencional para la adquisición de conductas imitativas, con el fin de que el observador discrimine entre las claves relevantes e irrevelantes de la conducta del modelo. Las principales variables que determinan esa focalización son:

Las propiedades físicas del estímulo. Las características físicas de un objeto como su tamaño, forma y color, así como las características más cognitivas como la intensidad, la viveza y la novedad, son fundamentales para centrar la atención. Los estímulos de modelado deben presenta rse de forma que no excedan la capacidad de atención del sujeto, de igual forma, el grado de discriminación de los estímulos de modelado y su presentación real oimaginaria determinan el nivel de AO. Fíjese como los juguetes de los niños pequeños son todos de colores llamativos. Igualmente los anunciantes estudian cuidadosamente aquellas características del estímulo que puedan incitar a su compra. También es particularmente importante la complejidad del estímulo, porque dificulta la atención sobre la conducta observada.
Las características del modelo. El grado de competencia, el prestigio social, la edad, el sexo y el estatus social o étnico, determinan la atención que se preste a un modelo. El valor afectivo de los modelos puede incrementar el AO al provocar y mantener una conducta atencional más fuerte. De este hecho dan buena cuenta las agencias publicitarias cuando contratan a personajes populares para anunciar un producto de consumo, pues se ha comprobado que las ventas se «disparan».
Las características del observador. La percepción del grado de dificultad de la tarea por parte del observador aumentará su atención. Variables como el nivel de dependencia, la autoestima, las aptitudes o el estatus sociocultural pueden determinar por sí mismas a lo que se es capaz de atender.

Procesos de retención

Consisten en codificar y transformar la información observada para poder almacenarla en la memoria y repasarla cognitiva mente, es decir si se desea reproduci r una conducta sin la presencia del estímulo modelador externo, el sujeto además de haberle prestado atención debe retener de forma simbólica esos estímulos originales. Para ello, Bandura alude a dos sistemas de representación: en imágenes y palabras.

El sistema de mediaciónimaginativa, que transforma los estímulos de modelado en imágenes. Este sistema de almacenamiento es importante en tareas que no se descri ben fácilmente con palabras. Por ejemplo una escena de una película que hay que repetir.
El código de mediación verbal (que convierte las secuencias de conductas presentadas por el modelo en cód igos verba les). Este tipo de almacenamiento se emplea principalmente en ta reas cognitivas como cuando repeti mos unas instrucciones que nos acaba de dar.

Así cuando las experiencias se han codificado en imágenes o palabras para su representación en la memoria, funcionan como mediadoras para la recuperación, actualización y reproducción de las pautas de conductas imitadas. Los cód igosimaginativos y verbales tienen la función de representar de forma simbólica en la memoria las respuestas imitativas, actuando de guías para la reproducción posterior de la conducta observada y dando cuenta, ta mbién, de la retención a largo plazo de los estímulos de modelado aun cuando el modelo no esté presente.

Durante la exposición a los estímulos, el observador de forma acti va se ded ica a codif icar, clas ificar y reorganizar los elementos en esquemas más fa mili ares y, por tanto, más fácilmente recordados. Una de las variables determinante del proceso de retención lo constituyen todas aquellas operaciones de repetición que estabilizan y fo rtalecen las respuestas adquiri das (repetir inmedi atamente un ejercicio que ha realizado el profesor de gimnas ia en nuestra presencia). Otra variable influyente es el repaso encubierto, dado que incrementa la retención de respuestas ya adquirida 1 sobre todo en tareas que cuentan con funciones simbó li cas (repetir mentalmente cómo el profesor ha ejecutado el ejercicio). Los procesos de retención son lo menos estud iados hasta el momento.

Procesos de reproducción motora

Consisten en poner en juego lo atendido y almacenado cognitivamente por lo que resultan imprescindibles para la puesta en práctica de la respuesta adquiri da e implican la utilización de las representaciones simbólica de los patrones modelados para diri gir la ejecución real de las respuestas (Bandu ra, 1986; Carral y Bandura, 1982 y 1985). La tasa y el nivel de AO se encuentran en parte determinados, a ese nivel motor, por la disponibil idad de respu estas componentes necesarias. Por eso en muchos casos, los patrones de la conducta observada se retienen en forma de representación, pero no se pueden reproducir conductualmente por limitaciones fís icas. Es evidente que aunque se observe una conducta con atención y se retengan los pasos para su ejecución, son precisas una seri e de capacidades físicas para poderlos reproducir (por más que vea mos a Nadal jugando al tenis, es difícil que « le quitemos» el puesto); pero también es necesario, e igualmente importante, que el observador se sienta capaz de poder hacerlo y no se ponga sus propias limitaciones. Por ejemplo, cuando nos enfrentamos a una materia de estudio que nuestros compañeros dicen que es muy difícil, podemos plantearla como un reto y ponernos más intensamente con ella o, por el contrario, cogerla con miedo y tener peores resultados. En definiti va, hay conductas que se adquieren por su observación pero cuando nos fijamos en actividades complejas, hace falta la combinación del aprendizaje observacional, la práctica inducida y la retroa limentación correctiva (vemos cómo se juega al futbol, jugamos con un entrenador que nos indica cómo hacerlo y, a su vez, nos corrige las actuaciones).

Procesos motivacionales

La motivación establece lo que se atiende, se reti ene, se aprende y se ejecuta, por ello los procesos motivacionales son los enca rgados de determinar la transformación del aprendizaje en ejecución. Una persona puede adquirir y retener una conducta observada e, incluso, puede poseer las habilidades necesarias para su repetición, pero no lo hará si no se le propician las condiciones motivacio nales favorables, es decir, si consi dera que va a obtener una consecuencia agradable por ejecutar la conducta observada, y, en este caso, pasaría rápidamente del aprendizaje a la ejecución, por el contrario, si pi ensa que el beneficio va a ser desagradable, aunque aprenda la conducta, no se sentirá motivado para ejecutarla. Pero es más, las variables motivacionales no solo contro lan las ejecucio nes, sino también el aprendizaje al ejercer un control se lecti vo sobre los estímulos a los que más probablemente se atenderá e, igualmente, facilitan la retención selectiva.

Considerando las características moti vacionales del incentivo, se puede comprender que desempeña un importante papel tanto en la adquisición, como en la actualización de la conducta de imitación. Durante la adquisición, sus efectos se canalizan a través de la anti cipación de las pos ibles consecuencias de una acción determinada. Para la actualización o repetición de las conductas imitativas, el incentivo será condición necesaria y suficiente, ya que las consecuencias anticipadas se establecen a través del reforzador experimentado (bien directamente o bien a partir de las conductas de los demás). Visto así, el incentivo puede actuar por medio de varias funciones para producir ca mbios psico lógicos en los observadores. Pasemos a deta llar esas funciones principales del incentivo:

Función informativa: durante el aprendizaje de una conducta observada, el sujeto va notando los efectos que las respuestas producen, observando los resultados de las acciones y así desarrollando hipótesis sobre cuáles son las respuestas más apropiadas. De esta forma, el sujeto anti cipa el futuro sin haberlo experimentado con anteriori da d.
Función motivacional: al representarse simbó1icamente las consecuencias previsibles, éstas se convierten en motivaciones reales de la conducta, y, de esa manera, la mayor parte de las acciones se encuentran bajo el control del carácter anticipatorio. Es lo que se conoce como auto incentivo, puesto que se relaciona con las expectativas que desarrolla el sujeto sobre las posibili dades de reforzamiento asociadas a la realización de la conducta previamente observada. El autoincentivo depende, también, de factores personales del propio sujeto, es decir de có mo vive el sujeto ese incentivo. Por ejemplo, la mayoría de los polít icos gustan de ser conocidos e imitan conductas de otros que lo son, sin embargo otras personas prefi eren hacer su trabajo de una forma más «discreta».
Función de acrecentamiento del estímulo: la observación de las consecuencias de la conducta del modelo aporta una discriminación de las conductas apropiadas o inadecuadas en ambientes diferentes. Si observamos que una persona llega antes por un camino porque es menos co nocido y hay menos atascos, elegiremos ese recorrido antes que el habitual.

Ahora bien, una misma conducta puede tener consecuencias diferentes en función de las situaciones donde se manifi este, de las personas a las que se dirija y el momento en que se realice. Cuando se observa cómo se recompensa a alguien por cierta conducta, en un contexto determinado, pero se le ignora o castiga por ese mismo ti po de conducta en una situación diferente, se obtiene información discriminativa acerca de los aspectos del medio que van a determinar consecuencias de recompensa o castigo. De esta manera se adquieren in formaciones que sirven de guía para posteriores acciones. Un aplauso al fin al de la ópera es imitable, pero ese mismo aplauso en mitad de la interpretación no es tan recomendable.

A modo de resumen se puede decir que la capaci dad que posee el ser humano de aprender observando las consecuencias de la conducta de los demás, nos facilita desarrollar patrones de comportamientos sin neces idad de realizarlos directamente, lo que economiza enormemente la adquisición de conductas. A través del aprendizaje observacional aprendemos a motivarnos para realizar ciertas conductas y aprendemos, ta mbién, las respuestas emocionales y afectivas ante determinadas situaciones. Esa conducta vicaria se almacena de forma simbó lica lo que permite pronosticar las consecuencias de dicha conducta, y nos puede llevar a modificarla, si se requiere para obtener los res ultados deseados.

En el siguiente capítulo se va a estudiar todo lo referente a los aspectos cognitivos subyacentes a la motivación para, con ello, conseguir una visión más completa de los efectos de la motivación sobre el ser humano.

Última actualización el 19/10/2022

← Motivación y Conducta Adaptativa 19/10/2022

Motivación y Cognición 19/10/2022 →