El razonamiento probabilístico
Introducción
En este tema se estudian los juicios que se enmarcan dentro del razonamiento inductivo, es decir, aquellos que se realizan en condiciones de incertidumbre.
En las situaciones de la vida cotidiana la información de que disponemos raramente nos permite extraer conclusiones inequívocamente ciertas. Sin embargo, diariamente emitimos juicios y tomamos decisiones bajo estas condiciones
El razonamiento inductivo, no ofrece conclusiones derivadas directamente de la información contenida en las premisas sino que avanza información nueva que solamente es más o menos probable.
En los juicios probabilísticas no cabe, pues, hablar de validez sino de fuerza inductiva de los argumentos.
Nociones básicas de probabilidad
El modelo normativo que sirve de referencia a estos juicios es la Teoría de la probabilidad y, más concretamente, su desarrollo bayesiano.
La probabilidad de un suceso (probabilidad objetiva) puede calcularse según la teoría clásica de dos formas:
Atendiendo al nº de resultados favorables frente al total de resultados posibles (Probabilidad de ocurrencia de un evento del que se conocen todos sus resultados posibles = nº de resultados a favor/nº total de resultados)
Atendiendo a la frecuencia relativa del suceso en un nº elevado de observaciones. (Probabilidad de ocurrencia de un evento tras repetir un gran nº de veces el experimento = nº de ocurrencias del evento / nº total de ocurrencias)
Sin embargo, estos modos tradicionales de calcular la probabilidad de un suceso no son válidos para la mayoría de las situaciones reales (se postularon para los juegos de azar)
En la vida diaria, normalmente no se pueden asignar esta clase de probabilidades objetivas porque desconocemos la frecuencia de los sucesos (no disponemos de un nº elevado de observaciones) y las alternativas no son equiprobables (los resultados posibles no se producen con igual probabilidad).
Para dar solución a todos estos problemas la TEORÍA BAYESIANA tiene en cuenta las probabilidades subjetivas de los sucesos. En resumen, dicha teoría:
Tiene en cuenta todos los axiomas de la Teoría de la Probabilidad.
Contempla las probabilidades subjetivas (a diferencia de la teoría clásica que parte sólo de datos empíricos)
Permite estimar la probabilidad de un suceso nuevo a partir de las probabilidades a priori y las probabilidades condicionales de los nuevos datos (diagnosticidad del dato).
Por todo ello, la teoría bayesiana es especialmente adecuada para estudiar los juicios humanos en situaciones de incertidumbre. En síntesis, el teorema de Bayes sirve para calcular la probabilidad a posteriori de un suceso aplicando la fórmula:
P(H/D)= Prob. a priori a favor de la hipótesis P(H) x prob. condicionada del dato P(D/H)
Prob. a favor P(D/H)x P(H) + prob. en contra P(D/H’)xP(H’)
Siguiendo el ejemplo de la Pág. 326.
P(H/D)=probabilidad de la hipótesis supuesto un dato: Prob de obtener plaza, habiendo sacado un 8,6 en el examen. Es una prob. estimada o prob. a posteriori.
P(H)=probabilidad a priori a favor de al hipótesis: Prob. a priori de conseguir el puesto de trabajo sin tener experiencia práctica (0.05). Es una prob. Objetiva a favor
P(D/H)=probabilidad del dato cuando se cumple la hipótesis: prob. de obtener buena nota en el examen y conseguir el trabajo (0.98). Es una prob. a favor (igual que la anterior) pero condicionada al dato. Depende de la fiabilidad del dato (diagnosticidad del dato).
P(H’)=Probabilidad de la hipótesis alternativa: Prob. a priori de no conseguir el puesto de trabajo sin tener experiencia previa (0.95). Es una Prob. objetiva en contra.
P(D/H’)= probabilidad del dato cuando se cumple la hipótesis alternativa: prob. de obtener buena nota en el examen y no conseguir el trabajo (0.10). Es una prob. condicionada al dato pero en contra de la hipótesis. No tiene porque ser complementaria de la P(D/H) porque ambas son probabilidades subjetivas.
Enfoque de los heurísticos de razonamiento
Son muchos los resultados experimentales que demuestran que el razonamiento humano no emite sus juicios siguiendo las normas estadísticas. Al contrario, se observa una tendencia conservadora que lleva a menudo a equiparar las probabilidades estimadas a las probabilidades a priori.
Para explicar estos errores sistemáticos la investigación se reorienta dentro del marco de la Teoría de La Racionalidad Restringida (Simon. 1983). Según la misma, debido a las limitaciones en el sistema de procesamiento, las personas no buscan emitir juicios exactos sino alcanzar cierta satisfacción en sus decisiones.
Por ello razonan a partir de modelos simplificados sin necesidad de procesar todos los datos.
Estas estrategias simplificadas son los llamados heurísticos, reglas de andar por casa o atajos que utilizan los sujetos de forma espontánea.
Tversky y Kahneman defienden el uso de estos heurísticos en lugar de las leyes de la probabilidad en el juicio de los eventos cotidianos.
Tres heurísticos son, en concreto los más utilizados:
Heurístico de representatividad
Consiste en asignarle probabilidad a un suceso en función de su pertenencia a una clase. Es decir, se trata de juzgar la probabilidad de que A pertenezca a un conjunto B, fijándose en la semejanza entre A y los miembros de B.
El juicio, por tanto, se basa en determinar si el suceso u objeto en cuestión es representativo de una clase (juicio de representatividad). Si se decide que lo es, se juzgará que es probable que pertenezca a esa clase (juicio por representatividad).
El juicio de representatividad se realiza comparando las semejanzas que tiene el caso con el prototipo de su categoría. (P ej. Foto de persona con rasgos de alemán).
Una vez realizado este juicio, la asignación de probabilidades se realiza por la representatividad del suceso (asignación de probabilidad de que el individuo de la foto sea alemán)
Esta forma de razonar es adecuada en la mayoría de las ocasiones, ya que permite dar respuestas rápidas a las situaciones habituales, permitiendo un importante ahorro cognitivo. No obstante, como quiera que las variables que influyen en la semejanza son distintas a las que afectan a la probabilidad, se producen sesgos en el razonamiento como consecuencia de ignorar información relevante desde un punto de vista estadístico (tamaño de la muestra, probabilidades a priori, diagnosticidad del dato, etc.)
Estos sesgos y su mecanismo de acción son:
Insensibilidad al tamaño de la muestra. Cuando se conoce la frecuencia real de un suceso se espera que este aparezca igualmente en nº pequeño de observaciones.
Por ejemplo, en el Problema de los hospitales, los sujetos consideran que los días en los que se ha dado un 60% de nacimientos de varones, serán los mismos en un hospital grande (con 45 nacimientos por día) y en uno pequeño (con sólo 15 nacimientos por día). Ello ocurre porque el resultado del 60% se considera representativo de la frecuencia conocida de nacimiento de varones y mujeres (en torno al 50%).
El sesgo de insensibilidad al tamaño de la muestra da lugar a un error conocido como la falacia del jugador que consiste en creer que la equiprobabilidad se manifestará en un nº reducido de observaciones.
Así, el jugador de ruleta, estima que ha de salir “rojo” tras varios resultados “negro”.
También este sesgo provoca la generalización a partir de muestras pequeñas (de muy pocos datos) si estas se consideran representativas; si bien, ello ocurre cuando los sujetos estiman que la clase de sucesos u objetos es homogénea.
Por ejemplo a los sujetos que se les pregunta por características de un mineral encontrado en una isla exótica, generalizan a partir de los datos que se les proporcionan, pero no hacen lo mismo cuando se les pregunta por las características de las personas que viven en la isla, a pesar de haberles ofrecido una descripción concreta (obesos).
Insensibilidad a las probabilidades a priori. Es la tendencia de los sujetos a asignar probabilidad a un suceso teniendo sólo en cuenta la información nueva proporcionada, cuando esta se considera representativa. Es decir, se desconoce la frecuencia real del suceso dejándose llevar por una información representativa.
Por ejemplo, se enjuicia que una persona es ingeniero o abogado basándose sólo en la descripción ofrecida, sin tener en cuenta la probabilidad a priori a favor de una u otra opción (la proporción es de 30 a 70).
Insensibilidad a la capacidad predictiva del dato (diagnosticidad). Las probabilidades de presencia del dato en ausencia de la hipótesis P(D/H’) se ignoran, es decir, no se tiene en cuenta la probabilidad de que el dato no prediga la hipótesis.
Como ya se ha dicho, esta probabilidad no es complementaria de P(D/H) y por tanto hay que conocerla y tenerla en cuenta
Por ejemplo, la probabilidad de que llueva no puede deducirse de que Laura lleve paraguas, pues ella lleva casi siempre paraguas (P D/H`= 0,95).
En todos estos casos, al igual que cuando se pide un juicio predictivo sobre el rendimiento de un alumno o de una empresa, las personas se suelen fijar sólo en la información ofrecida sin preguntarse por la fiabilidad del dato.
Falacia de Conjunción. Los sujetos consideran más probable la conjunción de dos sucesos que cada uno por separado, aunque según las leyes estadísticas es justamente al contrario.
La probabilidad de que Linda (pág. 340) sea feminista y cajera en un banco se considera mayor que la de que sea sólo cajera o feminista, tras ofrecer una descripción pormenorizada.
Este resultado ha sido explicado apelando a la mala interpretación del enunciado o a la confusión de probabilidad condicionada y de probabilidad de la intersección, sin embargo, variando el enunciado del problema se ha vuelto a en encontrar el mismo efecto.
La información más detallada se considera más representativa.
El efecto está relacionado con la construcción de escenarios (heurístico de accesibilidad), ya que un escenario supone una situación compleja y detallada, en la que lo habitual es la conjunción de sucesos.
Insensibilidad a la regresión a la media Es otro efecto estadístico que es sistemáticamente ignorado. Los sujetos esperan que las puntuaciones extremas se mantengan en eventos relacionados, por la semejanza entre sí de los dos sucesos.
Se considera que un hijo alto es representativo de un padre alto.
Aún cuando se de información explícita de este efecto, los sujetos continúan ignorándolo Por ejemplo (Pág. 342), los sujetos ofrecen explicaciones que ignoran este efecto, cuando se les plantea la disminución en el redimiendo de un aprendiz de vuelo tras una práctica exitosa (“se ha confiado después de haber sido felicitado”, etc.)
Heurístico de accesibilidad
En tareas de recuerdo los sujetos realizan la estimación de frecuencias de un suceso basándose en la información más fácilmente recuperable (Accesibilidad), esto es, la que mejor recuerdan.
En tareas de predicción de acontecimientos los sujetos estiman la probabilidad de un acontecimiento en función de su facilidad para imaginarlo (Simulación).
Ambos heurísticos están influidos por factores que inciden en la memoria, pero que no son determinantes para la probabilidad. Por ejemplo, la recencia, la saliencia, la familiaridad o el impacto influyen en la accesibilidad de un suceso, pero no lo hacen más probable.
Los sesgos a que dan lugar estos factores y sus mecanismos de acción son parecidos a los producidos por la representatividad:
Se ignoran las probabilidades a priori. Cuando se dispone de información reciente impactante, aunque esta contradiga la información sobre la frecuencia real de un suceso conocido, esta se tendrá en cuenta sin pensar en su relevancia estadística.
Por ejemplo, se tiende a pensar que un accidente de avión es más probable después de tener noticia de que se ha producido uno.
En el plano social este efecto da lugar al sesgo egocéntrico, Consistente en pensar que las propias creencias son mayoritarias en la población (hay una mayoría de católicos, si nosotros lo somos, etc.). Este sesgo no se produce intencionadamente, sino que se presenta porque nuestras ideas son más accesibles.
Se ignora la capacidad predictiva del dato: consiste en fijarse sólo en la información que está presente en una situación concreta, olvidándose del resto. Como ya se ha dicho, no tener en cuenta la probabilidad del dato cuando no se cumple la hipótesis (P D/H`) dejándose llevar por la mayor accesibilidad de la información presente, supone no tener en cuenta la diagnosticidad del dato, es decir, su capacidad para predecir si se cumplirá la hipótesis o la hipótesis alternativa.
Algunos de los sesgos más estudiados a los que da lugar este efecto son:
Sesgo de explicación: Un hecho explicado, o tan sólo imaginado, es considerado más probable porque a la hora de asignar frecuencias a las distintas alternativas el suceso es más fácilmente recordado. Por ejemplo (Pág. 345), después de pedir a unos sujetos que explicasen por qué determinado candidato electoral debía resultar elegido, estos asignaron mayor probabilidad de éxito electoral a dicho candidato, incluso sin necesidad de explicación, tan sólo con haber imaginado el escenario de triunfo electoral. Los sujetos acomodan sus expectativas a los resultados explicados o imaginados.
Sesgo retrospectivo: Cuando sabemos que un evento ha sucedido, consideramos que hubiésemos hecho una estimación más alta de ese resultado. Por ejemplo (Pág. 345), se preguntó a unos sujetos qué cosas, de una lista ofrecida, era probable que ocurriesen en el próximo viaje de Nixon a China y, posteriormente a haberse producido este, se les volvió a preguntar por las mismas. Los sujetos cambiaron sus estimaciones iniciales ajustándolas a lo que realmente había sucedido.
Sesgo de la correlación ilusoria: Cuando dos sucesos altamente significativos o distintivos se asocian, dicha asociación queda establecida en la memoria y es más accesible y fácil de recordar, por lo que se estima mucho más frecuente de lo que en realidad es. Ello ocurre, por ejemplo, en la creación de estereotipos sociales (asociación de una etnia con el delito).
Heurístico de anclaje y ajuste
Consiste en sesgar el juicio hacía un valor inicial (anclaje) obtenido de un cómputo parcial e incluso tomado al azar (no representativo), e ir ajustándolo a medida que se añade nueva información.
Por ejemplo, se pidió a los sujetos que estimaran la proporción de población negra en EE.UU. mostrando previamente un nº al azar y cada grupo ajustó su juicio a los valores iniciales ofrecidos.
Otra tarea propuesta, consistió en pedir a un grupo de sujetos que calculase el resultado de una multiplicación ofreciéndoles una serie de números en orden ascendente, mientras que a otro grupo se le presentaban los mismos números en orden descendente. Como quiera que los sujetos debían responder rápidamente sin tiempo a efectuar las operaciones, el grupo ascendente ajustó su juicio a los números iniciales (más bajos) mientras que el descendente lo hizo a valores más altos.
Crítica de los heurísticos
Flexibilidad: es su gran virtud, pero también su problema.
El mismo heurístico se utiliza en situaciones muy diferentes sin poder determinarse cuáles son sus condiciones de aplicación. De este modo no se puede predecir cuál heurístico se aplicará en una situación concreta. Posiblemente se utilicen sucesivamente, considerando primero la información más accesible y seleccionando luego la más representativa.
Pero además, distintos heurísticos se utilizan para explicar la misma situación. De este modo, algunos sesgos pueden ser debidos tanto a uno como a otro heurístico.
Por ejemplo, la falacia de conjunción puede atribuirse a la representatividad de la información, pero también a la construcción de escenarios y, por tanto, al heurístico de simulación.
El mejor definido de los tres heurísticos es el de representatividad, seguido del de accesibilidad y por último el de anclaje, que podría deberse a la accesibilidad del punto de partida o a estrategias seguidas tras la aplicación de los heurísticos de accesibilidad y representatividad.
Falta de validez externa: Los estudios con heurísticos se desarrollan en situaciones artificiales de laboratorio, muy alejadas de las condiciones naturales.
En el contexto natural el sujeto dispone de datos menos limitados, más redundantes y tiene la posibilidad de buscar la información según sus propios criterios.
El laboratorio, reproduce la situación ideal descrita por el teorema de Bayes (hipótesis complementarias).
Sin embargo en la vida real no se dispone de todas las hipótesis y mucho menos estas son complementarias. El individuo tiene que echar mano de su conocimiento previo del mundo.
Falta de precisión del juicio: Los resultados a los que da lugar el uso de heurísticos no coinciden con las predicciones del modelo Bayesiano.
Sin embargo, esta crítica puede ser más bien un argumento a favor ya que en situaciones naturales, a menudo, no hay modo de contrastar con precisión la probabilidad de que se de uno u otro resultado.
Por tanto, los juicios en la vida real se establecen bien por consenso social, bien por su relación coste beneficio con la meta conseguida.
Desde este punto de vista, los heurísticos proporcionarían estrategias más adecuadas que la norma estadística.
Enfoque de los modelos mentales
La teoría de los modelos mentales de Johnson-Laird y Byrne, (1991)
Según esta teoría, los sujetos no razonan de modo diferente cuando se enfrentan a problemas deductivos o inductivos. A partir de las premisas, construyen los modelos mentales que servirán de base a la conclusión. Si hay algún modelo mental en el que esta se cumpla, la conclusión será posible, si se cumple en la mayoría, será probable y si se cumple en todos será necesaria
A diferencia de lo que ocurre con los problemas de razonamiento deductivo, en los problemas inductivos basta con que la conclusión sea probable para darla por buena.
Dado que el juicio se debe realizar en función del nº de modelos que apoyen o contradigan la conclusión, esta no será correcta si no se revisa una cantidad suficiente de posibles modelos alternativos.
Si embargo, debido a las limitaciones de la memoria de trabajo, el sujeto no puede atender un nº elevado de modelos, por lo que evalúa la frecuencia de los modelos a favor y en contra utilizando ilusiones cognitivas que sesgan el juicio.
Por ejemplo, asume que las conclusiones que aparecen en la mayoría de los modelos revisados son las más probables.
Dado que existe una tendencia a representar explícitamente sólo la información verdadera (y esta, con un criterio económico), los modelos no representan adecuadamente las distintas alternativas, produciéndose sesgos.
Los estudios de razonamiento probabilístico se han centrado en los efectos producidos por el orden de presentación de la información y la congruencia o incongruencia de las fuentes.
En cuanto al orden de presentación de la información (contexto previo), los modelos mentales se van actualizando a medida que se producen nuevas entradas, ya que la información nueva se va integrando en los modelos ya existentes.
La congruencia o incongruencia de las distintas fuentes de información también influye en la construcción de los modelos mentales. La integración de la información representativa y la probabilística (o cuantitativa) depende de la congruencia que exista entre ambas. Cuando estas dos fuentes son incongruentes el sujeto desatiende la información probabilística, basando su juicio en la información meramente representativa.
Sin embargo, La teoría de los modelos mentales rechaza el uso del heurístico de representatividad puesto que la información congruente se va integrando en la construcción de los modelos, ya sea esta información representativa o cuantitativa (probabilística).
Además, se ha comprobado que los tiempos de solución son mayores cuando se presenta información incongruente aunque esta sea representativa. Ello va en contra de la perspectiva de los heurísticos que defiende que la aplicación de los mismos sería una estrategia rápida (se usa o no se usa).
La Teoría de los modelos mentales sí reconoce que ante una incongruencia la información que prima es la representativa, pero aún en este caso se ralentiza la construcción de los modelos.
La facilidad para construir algunos modelos mentales o la rapidez con la que se pueden evocar, provocan que el sujeto se centre sólo en algunos de estos modelos sin tener en cuenta el resto. Esta explicación de la Teoría de los modelos mentales está muy próxima al heurístico de accesibilidad.
En un experimento (Pág. 353) realizado para contrastar si las personas se centran en los modelos mentales que se derivan directamente de la información explícita contenida en las premisas, a los sujetos se les planteó la elección entre dos marcas de coche que no se recuerdan, pero de las que se conocen algunas características (consumo y averías mecánicas). Para resolver el problema, a los sujetos se les pide que seleccionen información adicional, encontrándose el resultado de que la mayoría prefieren la información que se deriva directamente de la enunciada en las premisas (información sobre la marca x).
La explicación que los investigadores ofrecen es que el elemento central de la información condiciona la construcción de los modelos.
Una explicación alternativa sería que las personas basasen su respuesta en los modelos en los que se da una similitud entre las premisas y la conclusión (lo cual estaría muy próximo al heurístico de representatividad).
La teoría de los modelos mentales probabilísticos. Gigerenzer, Hoffrage y Kleinbölting (1991)
Cuando los problemas se presentan como estimación de frecuencias y no cómo probabilidad de un suceso aislado, los sesgos de razonamiento decrecen.
En problemas en los que el sujeto puede tomar una decisión a partir de sus conocimientos, esta teoría defiende que se procede a la construcción de un Modelo Mental Local en el que se asocia la tarea con el conocimiento disponible.
En cambio, cuando el conocimiento del sujeto no es suficiente, la persona realiza inferencias a partir de un Modelo Mental Probabilístico. En este caso el sujeto construye un marco de inferencia con:
una clase de referencia, la población de sucesos sobre la que trata el problema (Ej. Pág. 358: ciudades de Alemania)
una variable sobre la que se emite el juicio (Ej. nº de habitantes de una ciudad)
una red de claves de probabilidad de sucesos relacionados con la variable que covarían con ella (Ej. tener un equipo en 1ª; ser capital de provincia).
Razonamiento y calibración
En el mismo marco teórico (Teoría de los Modelos Mentales Probabilísticos), se ha estudiado también el grado de confianza que los sujetos asignan a sus propios juicios (calibración)
Este juicio de segundo orden suele presentar un sesgo de sobreconfianza en los sujetos que se atribuyen una excesiva proporción de aciertos.
Las tareas experimentales para estudiar la calibración consisten en suministrar a los sujetos una serie de preguntas con dos alternativas (Ej. Pág. 356 ¿qué ciudad tiene más habitantes?) y, posteriormente pedirles que asignen un porcentaje de confianza a cada respuesta emitida.
Comparando la proporción real de aciertos y la asignación de confianza los resultados muestran que los sujetos sólo aciertan en un 80% de los casos en los que aseguran estar totalmente seguros de las respuestas.
Las explicaciones de este sesgo son varias:
se genera más evidencia a favor de la Hipótesis que en contra
se atribuye fiabilidad absoluta a la memoria por falta de retroalimentación en la vida diaria (esto puede influir en tareas de reconocimiento, pero no en las de reconstrucción de la información)
influyen factores motivacionales como la ilusión de control
el tipo de tarea (el sujeto calibra mejor cuando se le pide asignar un rango de resultados que cuando se le pide asignar confianza a un sólo evento)
Los autores de la Teoría de los Modelos Mentales Probabilísticos plantean críticas a la técnica habitualmente seguida para medir la calibración (un suceso único: que la respuesta sea correcta).
Cuando la pregunta sobre calibración trata de la frecuencia relativa de aciertos el sesgo desaparece.
A fin de explicar especialmente los resultados sobre calibración Gingerenzer y col. desarrollan
La teoría de los modelos mentales probabilísticos a partir de la construcción del marco de inferencia (Ver de nuevo Ej. Pág. 358)
La teoría asume que los sujetos basan su respuesta en una de las claves de probabilidad que covarían con la variable (aquella a la que conceden más validez), y que la confianza asignada a la respuesta iguala a la de la clave elegida.
Ello explicaría algunos errores de calibración cuando se pregunta con trampa sugiriendo una clave de mucha confianza (Ej. ciudad más al oeste: Liverpool o Edimburgo)
Sin embargo no explicaría otros fenómenos observados, como la asignación de altas probabilidades de acierto a tareas más difíciles y sin trampa.
La teoría de los modelos mentales no alude a la calibración para dar cuenta del sesgo de sobreconfianza. Para este enfoque la sobreconfianza se debería a la necesidad de satisfacción de los sujetos que seleccionarían los modelos mentales que conducen a conclusiones más creíbles o deseables, sin buscar contraejemplos, tendiendo por tanto a pensar que la conclusión es fiable.
Con tareas difíciles aumentan el nº de modelos que se ignoran, lo cual redunda en un aumento de la confianza.
Preguntas de examen
Concepto de heurístico de representatividad en el razonamiento probabilístico. Ilustre con un ejemplo la “insensibilidad al tamaño de la muestra” de la que se obtiene los datos.
Explique la falacia de la conjunción y desarrolle un ejemplo
Describa la falacia del jugador y explique por qué se considera que es el resultado del heurístico de representatividad.
Describa con un ejemplo el sesgo de razonamiento probabilístico que pone de manifiesto la insensibilidad a la capacidad predictiva del dato.
Describa con un ejemplo el sesgo de razonamiento probabilístico que pone de manifiesto la insensibilidad a las probabilidades a priori.
Describa con un ejemplo el heurístico de razonamiento probabilístico de anclaje y ajuste.
¿Cómo explica la Teoría de los Modelos Mentales el sesgo de sobreconfianza en el razonamiento probabilístico?