Procesamiento Visual

Introducción

La percepción de la forma ocupa un lugar central. El reconocimiento de los objetos puede estar basado en diferentes características, como el color o la textura de sus superficies, pero es la forma el determinante principal del reconocimiento.

Las investigaciones de Hubel y Wiesel

Hubel y Wiesel trataron de extender la investigación de los campos receptivos a las células de la corteza estriada y encontraron diferentes clases de células que tenían diferentes tipos de campos receptivos. Clasificaron estas células en tres clases con el nombre de células simples, complejas e hipercomplejas.

Tipos de células

Las células simples

Se caracterizan por tener campos receptivos con una forma más complicada que las células ganglionares o las del núcleo geniculado del tálamo cuyos campos receptivos son circulares. La organización de los campos receptivos continúa teniendo la estructura antagónica centro-contorno en la que tanto uno como otro puede ser excitador (on) o inhibidor (off). Un punto de luz proyectado sobre una zona excitadora (on) es un estímulo suficiente para aumentar la tasa de disparo de una célula y un punto de luz proyectado sobre una zona inhibidora (off) disminuyen la tasa de disparo.

Cuando los estímulos son mayores que un punto de luz la respuesta de la célula aumenta de forma lineal a medida que aumenta la cantidad de luz que cae sobre una zona excitadora o disminuye a medida que aumenta la cantidad de luz que cae sobre una zona inhibidora. Esta naturaleza lineal de la respuesta es una de las características principales de las células simples.

El estímulo óptimo para una célula simple es aquel que mejor se ajusta a la forma de su campo receptivo y la geometría de los campos receptivos da lugar a diferentes tipos de células simples. La mayor parte tienen campos receptivos alargados y responden preferentemente a líneas o bordes de una determinada orientación y posición en la retina. Unas tienen un área excitadora en un lado y otra área inhibidora en el otro lado por lo que responden preferentemente a bordes de luminancia formados por la transición de luz a oscuridad; por ello se les llama a veces detectores de bordes. Otras células presentan campos receptivos con una zona central alargada, que puede ser excitadora o inhibidora, flanqueada a uno y otro lado por zonas antagónicas. Estas células responden preferentemente a líneas claras u oscuras de una determinada orientación y posición en la retina y son a veces llamadas detectores de líneas o detectores de barras. El tamaño de los campos receptivos de las células simples depende de su posición en la retina con relación a la fóvea. En la zona de la fóvea los campos receptivos son más pequeños que en la periferia.

Las células complejas

Fueron las primeras en ser descubiertas por Hubel y Wiesel probablemente porque son las más abundantes en la corteza visual estriada. Las células complejas comparten con las células simples la cualidad de responder solamente a líneas que tienen una orientación específica, pero presentan unas diferencias importantes respecto a las células simples:

Tienen campos receptivos algo más grandes que las células simples.
No responden de forma específica a la posición de una línea dentro del campo receptivo. Cualquier posición dentro del campo receptivo es capaz de provocar la excitación de estas células.
Son muy sensibles al movimiento de las líneas que sirven de estímulo. Si una línea orientada adecuadamente se mueve a lo largo del campo receptivo, la respuesta de la célula compleja es máxima y se mantiene desde el momento en que el estímulo entra en el campo visual hasta que lo abandona.
La respuesta de las células complejas no es lineal respecto a la cantidad de luz recibida, al contrario que la respuesta de las células simples.

Las células hipercomplejas

Parecían poseer un campo receptivo más selectivo que las células complejas. La característica fundamental de este tipo de células consiste en una disminución de su respuesta cuando la longitud de la línea que la estimula aumenta por encima de un límite. Este tipo de células suele denominarse célula con inhibición final porque sabemos que esta característica de responder a líneas con terminación no está exclusivamente asociada a células que presentan características complejas sino también a células simples. Hoy se tiende a pensar que las anteriormente llamadas células hipercomplejas son grupos particulares tanto de células simples como complejas que presentan una sensibilidad gradual a la presencia de una terminación.

La arquitectura de la corteza estriada

Los métodos que se han utilizado han sido muy variados y han avanzado considerablemente desde que Hubel y Wiesel comenzaron a investigar. Los principales resultados fueron los siguientes:

Organización retinotópica→ la corteza estriada preserva la topografía propia de la retina en el sentido de que áreas que son adyacentes en la retina proyectan sobre áreas en la corteza que también son adyacentes. La diferencia entre las relaciones métricas de la representación en la corteza y ene l estímulo se conoce con el nombre de magnificación cortical y es una distorsión característica de la representación retinotópica de la corteza estriada debida a que la zona central de la retina ocupa un área más amplia en la corteza que la zona periférica. Esta distorsión es una consecuencia de la mayor densidad de receptores existente en el centro de la retina en comparación con la periferia y está relacionada con el análisis de que la corteza visual realiza en el centro de la retina que es más detallado que en la periferia.
Columnas de dominio ocular → La organización de la corteza estriada en columnas relacionadas con el dominio ocular fue una de las primeras características de su arquitectura que fue descubierta. Si se introduce un electrodo en la corteza estriada de forma perpendicular a su superficie, puede comprobarse que todas las células a lo largo de esa trayectoria responden de forma preferente a la estimulación presentada a un determinado ojo y no lo hacen, o lo hacen en menor medida, a la estimulación presentada al otro ojo. Si el electrodo se introduce de forma oblicua a la superficie, tan en paralelo a la misma como sea posible, el predominio de un ojo sobre el otro en la excitación de las células alterna. Primero predomina un ojo y luego otro y la secuencia alternante se repiten a lo largo de la trayectoria. Estos resultados ponen de manifiesto una organización de la corteza en columnas, cada una de ellas formada por conjuntos de células que responden a un ojo con preferencia al otro y todas ellas organizadas de forma alternante respecto al ojo dominante.
Columnas de orientación → La preferencia por una determinada orientación permanece constante si la penetración del electrodo de registro es perpendicular a la superficie de la corteza. Todas las capas de la corteza desde la superficie hasta la sustancia blanca muestran preferencia por una determinada orientación excepto la capa 4 que no muestra preferencia de orientación. Si la penetración del electrodo se hace de forma paralela a la superficie, aparece una secuencia regular de cambios en la preferencia por la orientación de forma que cada vez que el electrodo avanza unas 50 micras se produce un cambio en la preferencia por la orientación de unos 10 grados de ángulo bien en el sentido de las agujas del reloj bien en sentido contrario. Esta distribución del cambio hace que en un espacio de aproximadamente un milímetro el cambio de preferencia en la orientación sea de unos 180 grados.
Organización modular→ Hubel y Wiesel propusieron una organización funcional de la corteza estriada que resumía las preferencias oculares y de orientación. Según Hubel, las 6 capas de la corteza están organizadas en módulos o hipercolumnas que se distribuyen de forma perpendicular a la superficie. Las dimensiones de los módulos varían de una capa a otra pero la organización funcional es la misma.

Las investigaciones de Hubel y Wiesel han demostrado también que la organización de la corteza visual estriada no sólo depende de factores ligados a la herencia sino también de factores relacionados con el medio ambiente. Estudiando el comportamiento de las células de la corteza estriada de gatos pequeños en condiciones normales y en condiciones de privación visual pudieron comprobar que, si bien existen células que responden selectivamente a la orientación en los recién nacidos, existen también periodos críticos en las primeras semanas de maduración durante los cuales es necesaria la estimulación ambiental para lograr un desarrollo normal en el funcionamiento de las células de la corteza estriada. El periodo crítico no es el mismo para todas las propiedades de la estimulación visual que son procesadas por la corteza estriada. En el caso de la sensibilidad a la orientación el periodo crítico oscila entre la primera y la quinta semana de vida. El periodo crítico para el dominio ocular en más tardío, oscilando entre la quinta y la décima semana de vida. El periodo crítico está relacionado con el nivel que ocupan las células en el sistema visual y tiene lugar antes para aquellas células que ocupan un nivel más bajo en el mismo ya que su maduración es un requisito necesario para el desarrollo de células que operan a un nivel más alto.

Aproximación psicofísica

El análisis de la frecuencia espacial

Para Hubel y Wiesel lo que hacen las células de la corteza estriada es responder de forma selectiva a características estimulares simples tales como la orientación y el movimiento de líneas y bordes. Estas células son detectores de características.

Esta interpretación parece la más simple y la más inmediatamente ligada a los hechos experimentales. Un análisis más detallado del problema revela un conjunto de dificultades importantes relacionadas con esta interpretación. Suponer que el análisis más elemental del patrón estimular que realiza el cerebro lo hace en términos de líneas y bordes requeriría una teoría de la percepción capaz de mostrar que todo el conjunto de formas y objetos que somos capaces de percibir es analizable o se puede descomponer en términos de líneas y bordes. No se trata de negar la existencia de células que responden preferentemente a líneas de una determinada orientación, se trata de preguntarse si esa respuesta representa el nivel más elemental de análisis de los objetos que el sistema visual realiza.

La teoría de la frecuencia espacial surgió como una alternativa a la teoría de los detectores de características. El núcleo central de esta teoría sostiene que el análisis más elemental de los objetos que realiza el sistema visual es en términos de componentes de frecuencia espacial. Para esta teoría el patrón estimulas debe ser considerado como una onda compleja de intensidad luminosa que es analizada por el cerebro en términos de sus componentes elementales de frecuencia espacial. Las células de la corteza estriada llevan a cabo ese análisis de componentes porque actúan como filtros espaciales que responden selectivamente a una determinada banda de frecuencias espaciales con preferencia a otras frecuencias.

El concepto de frecuencia espacial

Por muy complejas que sea una onda, existe siempre la posibilidad de analizarla en términos de componentes simples llamados ondas sinusoidales. El eje horizontal del gráfico de la onda representa el espacio estimular cuyos cambios en intensidad están representadnos en el eje vertical. El estímulo varía en intensidad a lo largo de la dimensión horizontal con oscilaciones suaves de zonas claras y oscuras de igual amplitud que se repiten en intervalos iguales. Este tipo de estímulo recibe el nombre genérico de enrejado. En un enrejado sinusoidal las transiciones entre las zonas claras y las oscuras son suaves y continuas. Cuando estas transiciones son bruscas, el enrejado se denomina de onda cuadrada. Las ondas sinusoidales son los elementos más simples en que podemos analizar una onda, los enrejados sinusoidales son los estímulos más simples que podemos utilizar para estudiar la sensibilidad del sistema visual a la frecuencia espacial.

Onda sinusoidal

Onda cuadrada

Todo enrejado sinusoidal se caracteriza por cuatro parámetros fundamentales:

La frecuencia espacial
La amplitud
La fase
La orientación

La frecuencia espacial de un enrejado viene dada por la anchura de las zonas claras y oscuras que lo componen. Un enrejado en el quelas zonas claras y oscuras son anchas tendrá menos frecuencia espacial que un enrejado en el que las zonas son estrechas ya que el número de ciclos por unidad de distancia en la onda asociada al enrejado será mayor en el segundo caso que en el primero. La unidad de distancia que se utilizar normalmente es el grado de ángulo visual. El concepto de ángulo visual es sencillo y nos permite relacionar todas las medidas con el observador. En el caso de la frecuencia espacial se utiliza el número de ciclos por grado de ángulo visual (c/gav), porque esta medida nos indica directamente las características espaciales del estímulo que llega al observador independientemente del tamaño del estímulo o de la distancia a la que se encuentre.

La amplitud de onda de un enrejado es la mayor o menor intensidad luminosa de sus zonas claras u oscuras. Un concepto importante derivado de la amplitud es el de contraste que hace referencia a la diferencia entre zonas claras y zonas oscuras y que se define así:

Contraste = (Imax – Imin) / (Imax + Imin)

Donde Imax es el punto de máxima intensidad e Imin el punto de mínima intensidad luminosa en el enrejado. Se puede ver claramente que el contraste será igual a cero cuando Imax sea igual a Imin y será igual a uno cuando Imin sea cero. Por tanto, el índice de contraste oscila entre cero –cuando no hay diferencias de intensidad luminosa y tenemos un campo uniforme de luz- y uno, cuando la diferencia entre las zonas sea máxima.

La fase de un enrejado se refiere a la posición de la oscilación de la onda sinusoidal en un momento determinado que sirve de punto de referencia. La fase se mide en grados en relación con ese punto de referencia. La onda sinusoidal es el punto en que comienza, está en fase de 0 0 , también llamada fase seno porque es el punto de comienzo de la inflexión en sentido positivo. Si la onda comenzara en el punto de su máximo valor positivo de amplitud se diría que está en fase de 90 o , también llamada fase coseno. Si comenzara en el punto de comienzo de la inflexión en sentido negativo estaría en fase de 180 o llamada fase antiseno y si lo hiciera en el punto mínimo valor de amplitud estaría en fase de 270 o llamada fase anticoseno. La fase es una medida de posición y puede variar entre 0 y 360 grados.

La orientación de un enrejado se refiere al grado de desviación de la vertical que presentan sus zonas claras y oscuras. Se suele expresar en grados a partir de la vertical y en sentido contrario al de las agujas del reloj.

El análisis de Fourier

La teoría de análisis de ondas está buen establecida en física y por lo tanto podemos utilizar esa teoría para investigar la validez y el alcance de esta concepción estimular en la percepción visual. Fourier propuso su teorema fundamental sobre las ondas que dice que cualquier onda, tengo la forma que tenga, se puede expresar de manera única como la superposición (suma) de ondas sinusoidales de frecuencias y amplitudes definidas.

El primer componente es que llamado fundamental que consiste en una onda sinusoidal de igual frecuencia y amplitud que la onda cuadrada. El resto de los componentes se llaman armónicos cuya frecuencia es un múltiplo impar de la frecuencia fundamental y cuya amplitud varía en función de su orden. El segundo componente corresponde al tercer armónico y tiene tres veces la frecuencia del fundamental y un tercio de su amplitud., el tercer componente corresponde al quinto armónico y tiene cinco veces la frecuencia del fundamental y un quinto de su amplitud.

Cada nuevo armónico que se añade contribuye al total una amplitud cada vez más pequeña, por lo que en la práctica la síntesis de una onda cuadrada puede aproximarse de forma bastante satisfactoria utilizando un pequeño conjunto de armónicos aunque en teoría el número de componentes sinusoidales de una onda cuadrada sea infinito.

De la misma forma que una onda cuadrada, la onda compleja correspondiente a la imagen de un objeto puede ser analizada en sus componentes fundamentales. Los componentes de frecuencia espacial baja proporcionan información sobre los aspectos globales de la imagen, mientras que los de alta frecuencia la proporcionan de los detalles.

El análisis de Fourier como modelo

La importancia para el estudio de la percepción de la forma es de carácter meramente instrumental. El análisis Fourier nos proporciona un instrumento de análisis del estímulo útil pero sin una significación psicológica particular. Cabe preguntarse si el sistema visual tiene filtros diferencialmente sintonizados a un determinado rango de frecuencias espaciales con preferencia a otras. Si éste fuera el caso, entonces cabe pensar que la corteza visual se comporta como un analizados Fourier que, a través del funcionamiento de esos filtros, descompone el patrón estimular en sus elementos constituyentes de frecuencia espacial. Esta idea se puede entender mejor por analogía con la forma en que se procesa el color en la retina. El caso que ahora nos ocupa se trata de asumir la existencia de un conjunto de receptores que responden diferencialmente a distintas frecuencias espaciales de modo que las frecuencias espaciales altas serían procesadas por canales diferentes a los que procesan las frecuencias espaciales medias y bajas.

Evidencia experimental

La evidencia experimental más relevante a factor de la existencia de filtro de frecuencia espacial es de carácter psicofísico. La psicofísica es la parte de la investigación psicológica que trata de establecer relaciones entre las características físicas de los estímulos y la experiencia consciente de las personas utilizando métodos comportamentales. La característica principal de los métodos comportamentales es que en lugar de utilizar técnicas invasoras, analizan cuidadosamente la ejecución del sujeto en tareas muy precisas que permiten hacer inferencias sobre la naturaleza de los procesos que intervienen en la tarea. Se han utilizado tareas de detección para medir el umbral de contraste de los sujetos y ha sido el comportamiento del sistema en situaciones de umbral el que ha permitido inferir la existencia de diferentes filtros de frecuencia espacial.

El umbral de contraste es el contraste mínimo necesario para distinguir un enrejado sinusoidal de una escena de luminancia homogénea. Para poder determinar la cantidad de contraste necesaria para determinar el umbral es frecuente utilizar el método de ajuste como método psicofísico. En este método el sujeto experimental controla el contraste hasta que el enrejado resulta mínimamente perceptible. Como valor de contraste correspondiente al umbral suele tomarse el que es capaz de producir un porcentaje de respuestas correctas determinado.

La función de sensibilidad al contraste (FSC)

Si realizamos un experimento psicofísico del medición del umbral de contraste utilizando un variado número de enrejados sinusoidales de diferentes frecuencias espaciales podemos obtener la función de la sensibilidad al contraste de un observador determinado. La sensibilidad al contraste es el valor recíproco del umbral de contraste ya que la sensibilidad al contraste de una persona será mayor cuento menor sea el valor de contraste de su umbral. La función de sensibilidad al contraste es la función que relaciona la sensibilidad al contraste con la frecuencia espacial de los enrejados utilizados.

La función de sensibilidad al contraste permite caracterizar la sensibilidad de un determinado sistema visual. Si el experimento de determinación de umbral de contraste se hiciera en condiciones de visión escotópica la sensibilidad a todas las frecuencias sería mucho menor pero afectaría más a las altas que a las bajas frecuencias porque al faltar la contribución de los conos se perdería al agudeza visual que permite percibir los detalles de un objeto.

Predicciones a partir de la FSC

Campell y Robson utilizaron la FSC de sus sujetos experimentales para comparar su sensibilidad a las ondas cuadradas con su sensibilidad a las ondas sinusoidales. El fundamento lógico de sus investigaciones consistía en suponer que, si el sistema visual posee filtros sintonizados a diferentes frecuencias espaciales y realiza un análisis del patrón estimular en términos de componentes sinusoidales, entonces la respuesta correspondiente al umbral de detección de un enrejado de onda cuadrada está determinada por la respuesta de los filtros a los distintos componentes sinusoidales de la onda cuadrada. Si comparamos el umbral de detección de una onda cuadrada de 26 c/gav con el de una onda sinusoidal de la misma frecuencia no debe haber ninguna diferencia porque en ambos casos el sistema visual está respondiendo únicamente a una onda sinusoidal de 26 c/gav. Si comparamos el umbral de detección de una onda cuadrada de 2 c/gav con el de una onda sinusoidal de la misma frecuencia, entonces el umbral para la detección de la onda cuadrada debe ser más bajo, es decir la sensibilidad más alta, que para la onda sinusoidal porque la onda cuadrada tendrá, además del componente fundamental de 2 c/gav, un armónico de 6 c/gav cuyo umbral de detección es más bajo que el correspondiente al fundamental según la FSC.

Campell y Robson comprobaron que predicciones como éstas eran confirmadas por los datos experimentales y concluyeron que el sistema visual está dotado de filtros sintonizados a rangos determinados de frecuencia espacial.

Los posefectos de frecuencia espacial

Si miramos durante un tiempo prolongado a una superficie un color fundamental, por ejemplo rojo, y luego cambiamos la mirada hacia una superficie blanca, veremos la superficie blanca coloreada con el matiz complementario, el verde. A este fenómeno sensorial se le denomina posefecto de color. El posefecto tiene lugar porque los receptores que responden al rojo, debido a la exposición prolongada al estímulo, pierden sensibilidad y se adaptan, es decir se hacen menos sensibles al estímulo. Así, cuando la mirada se centra en la luz blanca, los receptores del rojo responden con menor intensidad que los de su oponente, el verde. Los posefectos constituyen un fenómeno que proporciona buena información sobre la existencia y naturaleza de distinto tipo de receptores. En el estudio de los filtros espaciales se ha aplicado también la lógica subyacente a los posefectos para poder inferir la existencia de múltiples filtros espaciales.

Blakemore y Campbell confirmaron experimentalmente la aparición de baches de sensibilidad en la zona de las frecuencias utilizadas en la fase de adaptación de sus experimentos mientras que la sensibilidad para las frecuencias que no habían sufrió adaptación permanecía sin cambio. Estos datos claramente favorecen la existencia de canales múltiples en el procesamiento de la frecuencia espacial.

Manipulación de la fase de los enrejados

Otro tipo de experimento favorable a la existencia de múltiples canales o filtros en el procesamiento de la frecuencia espacial ha utilizado el hecho de que la síntesis de dos ondas sinusoidales que están en la misma fase produce una onda compleja cuya amplitud es igual a la suma de las amplitudes de los componentes sinusoidales; pero la síntesis de dos ondas sinusoidales cuyos componentes tienen una diferencia de fase de 180 o produce una onda compleja cuya amplitud es igual a la diferencia de las amplitudes componentes.

El razonamiento de Graham y Nachmias fue el siguiente: si el sistema visual funciona de acuerdo con un modelo de canal único en el que el estímulo se procesa como una totalidad, el estímulo correspondiente a la onda A será más fácil de detectar que el correspondiente a la onda B ya que el contraste es mayor en A que en B. sin embargo, si el sistema visual analiza el estímulo respondiendo diferencialmente a sus componentes sinusoidales, entonces los dos estímulos mostrarán el mismo umbral de detección ya que la amplitud y frecuencia de sus componentes es la misma. Los resultados mostraron que el umbral de detección era igual para los dos estímulos.

La aproximación computacional

El esbozo primario

El propósito de la primera fase, llamada esbozo primario, es hacer explícitos tanto los cambios de intensidad de la imagen que proporcionan las vías visuales, como la distribución de esos cambios en la escena y su organización geométrica. La descripción explícita de esos cambios se hace especificando las características primitivas simbólicas de la imagen que, según Marr, son cuatro: bordes, barras, terminaciones y manchas y los parámetros fundamentales de cada una de esas características primitivas que son: posición, tamaño, orientación y contraste. El punto de partida de esa fase es la imagen bidimensional proporcionada por los receptores visuales que representa la distribución de luminancia de la escena y que es una representación analógica de la misma. El resultado final es una representación simbólica formada por los cuatro tipos de características mencionadas que describen los cambios de intensidad y que, organizadas en conjuntos resultantes de la aplicación de principios de agrupamiento, servirán como descripción básica a los restantes niveles de procesamiento. Para Marr, el sistema visual se hace simbólico muy pronto, en la primera fase de procesamiento, dando lugar a una descripción de la imagen considerablemente reducida en comparación con la imagen original pero que sigue conservando los aspectos importantes necesarios para el análisis de la imagen. Marr asume que las superficies constitutivas de las imágenes visuales son estables, tienen un alto grado de homogeneidad y las transiciones de luminancia dentro de ellas tienden a ser suaves y no bruscas. Estos supuestos generales permiten orientar el funcionamiento del sistema en esta primera fase.

El esbozo primario incluye dos subfases. En la primera, llamada esbozo primario bruto, Marr estudió los procesos que permiten pasar de la descripción analógica proporcionada por la distribución de luminancia que describe la escena, a la descripción simbólica basada en las características primitivas. La segunda, llamada esbozo primario completo, está dedicada a la exposición de los principios de organización que permiten agrupar las características primitivas en conjuntos y zonas que estructuran la escena.

El esbozo primario bruto

El punto de partida del procesamiento visual es la imagen más simple que pueden producir el conjunto de nuestros receptores: una representación bidimensional de los distintos niveles de intensidad luminosa que tienen los puntos que la componen. Es una representación monocromática, monocular y estática.

El esbozo primario bruto tiene como objetivo proporcionar una descripción de los cambios de luminancia existentes en la imagen en diferentes escalas y clasificar los que sean relevantes en las cuatro categorías de características primitivas que hemos mencionado antes. Tanto Marr como la mayor parte de los investigadores en inteligencia artificial han prestado especial atención a la clasificación de los bordes.

Bases fisiológicas del esbozo primario bruto

Marr también prestó atención a los aspectos relacionados con la realización física de procesos en el cerebro humano. Especialmente se interesó por los mecanismos capaces de realizar el cómputo de los puntos de cruce de cero. Marr pensó que el campo receptivo de las células ganglionares y de las células del núcleo geniculado lateral del tálamo muestra características similares a las del operador utilizado por ellos. Marr asumió que las células del núcleo geniculado que forman que, un conjunto de células con centro off y entorno on estén alineadas y adyacentes a un conjunto alineado de células con centro on y entorno off , forman la base para lograr el cómputo de los puntos de cruce de cero.

Siempre que ambas filas de células estén activas simultáneamente se producirá la presencia de puntos de cruce de cero entre ellas. Si otro conjunto de células en un nivel de procesamiento superior recibe información de ambas células y solamente dispara cuando ambas están activas, estas células Y actuarán como verdaderos detectores de puntos de cruce de cero. Si a su vez estas células están sintonizadas a orientaciones diferentes y se organizan entre sí en alineamientos de una determinada orientación, tendremos la base para la detección de segmentos de puntos de cruce de cero que forman en la teoría de Marr la base sobre la cual se lleva a cabo el cómputo de las características primitivas.

Valoración de la teoría de Marr

La teoría de Marr fue la primera teoría computacional de la visión que se propuso con carácter general y que trató de organizar las principales contribuciones que las investigaciones en inteligencia artificial habían aportado al campo de la percepción visual. Más problemática para la teoría de Marr y Hildreth nunca ofrecieron un algoritmo preciso y otras aportaciones posteriores parecen preferibles. Sin embargo es conveniente recalcar que la principal aportación de Marr fue la nueva forma de pensar que introdujo al teorizar sobre la percepción visual apuntando a los problemas centrales que toda teoría debe resolver en cada nivel de procesamiento.

Última actualización el 13/09/2022

← Percepción del color 13/09/2022

Percepción del espacio 13/09/2022 →