Búsqueda visual e integración de atributos

Un objeto pero muchos atributos: el problema de la integración

El sistema visual analiza distintas dimensiones del entorno por medio de módulos diversos y vías especializadas.

Interactuamos con objetos significativos que se segregan unos de otros, y en los que se combinan de forma apropiada diversos atributos individuales. La cuestión de cómo esto se consigue se denomina el “problema de la integración”.

Cuando percibimos objetos en la vida real, éstos no sólo poseen propiedades visuales sino también otras de carácter sensorial -sonido o tacto-.

Así pues, no sólo existe el problema de cómo se integran las propiedades visuales, sino también cómo lo hacen las distintas modalidades sensoriales.

Evidencias experimentales sobre la separabilidad de la información relativa a la identidad y la posición

En los primeros momentos de una breve presentación visual están disponibles el color, la identidad y la posición pero su integración no es suficientemente estable como para que el informe sea preciso. En ocasiones, la información categorial o de identidad puede influir en la selección. Los sujetos cometen errores de posición recordando qué letra era, pero no exactamente dónde estaba. Los efectos de interferencia observados parecen diferir según las demandas de la tarea.

Dislexia atencional

Shallice y Warrington: los pacientes pueden leer palabras completas perfectamente pero cometen imprecisiones cuando se les pide que digan selectivamente letras sueltas situadas en un lugar especifico dentro de una palabra. Las letras que decían no eran errores aleatorios, sino de posición: decían una letra que estaba presente en la palabra pero en un lugar equivocado. Pueden acceder a las identidades de las letras pero no integrarlas en un lugar correcto.

Un último hallazgo fue cuando se les presentaron varios palabras simultáneamente, los pacientes las mezclaban entre sí. Las letras no se mezclaban aleatoriamente sino que conservaban su posición en la palabra. Estos se denomina errores de migración. (Ejemplo: win fed = fin fed).

Hay contradicción entre el hallazgo de que cuando se necesita informar de una sola letra, el disléxico atencional tiene dificultades para discriminar según la posición y cuando se le muestran varias palabras, las letras migran según la posición que tienen en la palabra.

Evidencia neurofisiológica de la existencia de códigos independientes

Disponemos de la existencia de dos vías de análisi de la información visual: la vía ventral que se encarga de analizar qué es un objeto (color, forma, y características de forma temprana) y combinar objetos en fases posteriores. La segunda vía, la dorsal, se encarga de analizar dónde está un objeto.

Algunos autores establecieron que la función de la vía dorsal es guiar las acciones. Creían que en lugar de haber una corriente para el qué y otra para el dónde, ambas corrientes se dedican al qué y al cómo. Así mismo, otros colaboradores establecieron que la vía dorsal se puede diferenciar en dos sistemas funcionales distintos: la corriente dorso-dorsal (control de las acciones) y corriente ventro-dorsal (organiza las acciones).

Juntando todas las piezas

Todas las evidencias hacen hincapié en la importancia que tiene conocer y explicar cómo se combinan con precisión distintos atributos pertenecientes a un mismo objeto en una presentación visual para controlar la respuesta. Treisman y Gelade propusieron la primera versión de la teoría de la integración de características (TIC).

La propuesta de Coltheart

Coltheart propuso una teoría cognitiva de la memoria icónica capaz de predecir el resultado de interferencia sobre la respuesta. También explicó la eficacia diferencial de la posición y de la identidad a la hora de seleccionar información en una presentación visual breve. La identidad de un elemento se almacena en un momento temprano de la presentación estimular, esta representación era relativamente estable y decaía más lentamente que los atributos físicos de la letra como el color y la posición.

La información física o episódica es inestable y decae rápidamente si no se procesa adicionalmente. Este procesamiento posterior requiere integrar la información semántica y episódica, es decir, el qué y el dónde mediante algo en lo que denomina “monitor léxico”.

A menos que estas dos fuentes de información se estabilicen juntas, la información de identidad desaparece y no se puede recordar.

El modelo de Coltheart explica el efecto de las diferencias categoriales en el IP, cuando las entradas léxicas se hallan próximas desde el punto de vista semántico dentro de la misma categoria, hay varias entrads que compiten por la atención del monitor léxico, el cual debe decidir según la información física cuál es la letra target y por tanto, qué entrada estabilizar. Cuando hay diferencia de categoria entre el target y los distractores la decisión es más sencilla.

Según Coltheart, los pacientes con dislexia atencional tienen problemas en el monitor léxico. Los errores de migración son también consecuencia de una mala integración entre el lugar donde se encuentran las letras y lo que son éstas. En este modelo, todas las letras se procesan hasta una fase de postcategorial, pero la selección se basa en la info. física.

Búsqueda visual con atención focal

Coltheart propuso el concepto del monitor léxico para explicar el desempeño en tareas en las que se utilizaban presentaciones breves con máscara basadas en la memoria icónica.

Sin embargo, la información visual suele persistir en el tiempo. Por tanto, existe otro interrogante: ¿cómo busca la atención un target específico en un campo visual desorganizado?

La Teoría de la Integración de Características (TIC)

La TIC es un modelo sobre la percepción de los objetos. Parte del principio de que las características sensoriales se codifican automáticamente en un estadio preatencional, en paralelo y sin necesidad de atención focal. Se codifican mediante diversos “módulos especializados” cada uno formando un “mapa de características” para las dimensiones que codifica.

La detección de las características individuales representadas en los mapas se producía preatencionalmente en paralelo. Sin embargo, esas características codificadas por separado debían combinarse con precisión en un conjunto. La conjunción o combinación se podía hacer de tres maneras:

las características codificadas podian encajar en marcos predecibles de objetos según el conocimiento almacenado. Por ejemplo esperamos que el cielo sea azul y la hierba verde.
La atención podía realizar su tarea de selección en un “mapa maestro de posiciones” que representa dónde se encuentran todas las características. El contenido de dicho archivo puede realizarse posteriormente para reconocer el objeto comparándolo con los conocimientos almacenados.
Si no se usa la atención, las características podían seguir combinándose entre sí y aunque dicha combinación fuera correcta a veces, a menudo no lo sería produciendo una conjunción ilusoria.

Evidencia a favor de la TIC

Los primeros experimentos realizados por Treissman y Gelade mostraron que cuando los sujetos buscaban un target definido mediante una conjunción de propiedades. El tiempo de búsqueda se incrementó linealmente en relación con el número de items no target o distractores que hubiera en la presentación. Cuando lo que se buscaba era un target definido por una única característica, el tiempo de búsqueda es independiente del número de distractores. Treisman propuso que la característica exclusiva “atraía” la atención hasta su emplazamiento. A veces, se denomina a esto como efecto saliencia atencional.

La teoría del enganche atencional: búsqueda visual y semejanza visual

Duncan y colaboradores elaboraron una teoría distinta de la búsqueda visual y la atención que destacaba el papel de la semejanza, no solo entre targets sino tmabién entre no targets. La semejanza constituye un potente factor de agrupamiento y según la facilidad que tengan los targets y los distractores para organizarse en grupos independientes, la búsqueda visual será más o menos eficiente.

Los experimentos de Beck revelaron que las formas que son más semejantes en sus características resultan más difíciles de agrupar.

Los experimentos de Duncan y colaboradores mostraron que en las condiciones en las que todos los distractores eran homogéneos, las respuestas ante la ausencia del target podían ser incluso más rápidas que las que detectaban su presencia. Denominaron a este fenómeno selección a nivel de la presentación en su totalidad y sugirieron que la búsqueda visual del target se basaba en este caso en un rechazo rápido del grupo distractor.

A medida que aumenta la diferencia entre targets y distractores, lo hace también la eficiencia de la búsqueda. Asimismo, conforme aumenta la semejanza entre distractores, es más eficiente la búsqueda del target. Estos dos factores interactuan: la semejanza target/no target y no target/no target. Por tanto, esta teoría tiene más que ver con la relación entre targets y distractores y con la manera de segregar la información por grupos perceptivos que con mapas de representación espacial.

La representación espacial de los atributos en mapas de características es muy importante dentro de la TIC. Se clasificó la teoría de Duncan y colaboradores como de posición NO especial y sin embargo se consideró la TIC como de posición especial. La posición en el espacio se halla intimamente relacionada con la atención: no sólo la información de la posición facilita la atención selectiva sino que está implicada en el deterioro de la misma.

Filtrado en función del movimiento

Driver y McLeod descubrieron que resultaba más sencillo buscar un target en movimiento que un target estacionario, siempre y cuando fuera fácil discriminar entre las formas de los targets y los no targets. Sin embargo, cuando resultaba difícil discriminar las formas, era más sencillo buscar un target estacionario.

TIC: el estado de la cuestión en 1993

Treissman aborda una serie de cuestiones, propone la existencia de una jerarquía de características. Distingue entre características de definición de superficie (color, luminancia, movimiento relativo) y características de definición de la forma (orientación y tamaño). Esta autora demostró que se pueden detectar en paralelo las distintas características de definición de forma a partir de elementos de definición de superficie.

En la discusión de los experimentos de Duncan, Treisman sugirió que existían conexiones inhibitorias desde los mapas de características hacia el mapa maestro de posiciones. La ventaja de que existan conexiones inhibitorias es que si sabemos que queremos buscar un círculo rojo, podemos inhibir cualquier cosa que no sea roja ni circular. Asimismo, si sabemos que los distractores son azules y cuadrados, podemos inhibir todo lo que sea azul y de forma cuadrada. Cuanto más se asemejen los targets a los distractores y cuanto más dispares sean los distractores entre sí, menos eficiente será la estrategia inhibidora.

Última actualización el 13/09/2022

← La naturaleza de la atención visual 13/09/2022

Atención auditiva y crossmodal 13/09/2022 →