Teoría de reconocimiento por componentes

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 12:54 10 ago 2019 por Aosbot (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.

La teoría de reconocimiento por componentes, o teoría de RBC,[1]​ es un proceso de abajo hacia arriba propuesto por Irving Biederman en 1987 para explicar el reconocimiento de objetos. De acuerdo con la teoría de RBC, podemos reconocer los objetos separándolos en geones (las partes componentes principales del objeto). Biederman sugirió que los geones se basan en formas tridimensionales básicas (cilindros, conos, etc.) que se pueden ensamblar en varias disposiciones para formar un número virtualmente ilimitado de objetos.[2]

Geones

La teoría del reconocimiento por componentes sugiere que hay menos de 36 geones que se combinan para crear los objetos que vemos en la vida cotidiana.[3]​ Por ejemplo, cuando miramos una taza, la dividimos en dos componentes: “cilindro” y “mango”. Esto también funciona para objetos más complejos, que a su vez están compuestos por un número mayor de geones. Los geones percibidos se comparan con los objetos en nuestra memoria almacenada para identificar qué es lo que estamos viendo. La teoría propone que cuando vemos objetos buscamos dos componentes importantes. Bordes: esto nos permite mantener la misma percepción del objeto, independientemente de la orientación de visualización. Concavidades: El área donde se encuentran dos bordes. Esto nos permite observar la separación entre dos o más geones.

Analogía entre discurso y objetos

En su propuesta de RBC, Biederman hace una analogía acerca de la composición del habla y los objetos que ayuda a apoyar su teoría. La idea es que se necesitan unos 44 fonemas individuales o "unidades de sonido" para componer cada palabra en el idioma inglés, y solo unos 55 son necesarios para componer cada palabra en todos los idiomas. Aunque pueden existir pequeñas diferencias entre estos fonemas, todavía hay un número discreto que conforma todos los idiomas.

Se puede usar un sistema similar para describir cómo se perciben los objetos. Biederman sugiere que de la misma manera que el habla está compuesta por fonemas, los objetos están compuestos por geones, y como hay una gran variedad de fonemas, también hay una gran variación de geones. Es más fácil comprender cómo 36 geones pueden componer la suma de todos los objetos, cuando la suma de todo el lenguaje y el habla humana se compone de solo 55 fonemas.

Invariancia punto de vista

Uno de los factores más definitorios de la teoría del reconocimiento por componentes es que nos permite reconocer objetos sin importar el ángulo de visión; Esto se conoce como invariancia del punto de vista. Se propone que la razón de este efecto son las propiedades de borde invariante de los geones.[4]

Las propiedades del borde invariante son las siguientes:

  • Curvatura (varios puntos de una curva)
  • Líneas paralelas (dos o más puntos que siguen la misma dirección)
  • Co-terminación (el punto en el que dos puntos se encuentran y por lo tanto dejan de continuar)
  • Simetría y asimetría
  • Co-linealidad (puntos que se ramifican desde una línea común)

Nuestro conocimiento de estas propiedades significa que al ver un objeto o geón, podemos percibirlo desde casi cualquier ángulo. Por ejemplo, al ver un ladrillo, podremos ver conjuntos horizontales de líneas paralelas y verticales, y al considerar dónde se encuentran estos puntos (co-terminación) podemos percibir el objeto.

Fortalezas de la teoría

El uso de geones como primitivos estructurales da como resultado dos ventajas clave. Debido a que los geones se basan en propiedades de objetos que son estables en todo el punto de vista ("punto de vista invariante"), y todos los geones son discriminables entre sí, una sola descripción de geón es suficiente para describir un objeto desde todos los puntos de vista posibles. La segunda ventaja es que se logra una considerable economía de representación: un conjunto relativamente pequeño de geones forma un simple "alfabeto" que puede combinarse para formar objetos complejos. Por ejemplo, con solo 24 geones, hay 306 mil millones de combinaciones posibles de 3 geones, lo que permite reconocer todos los objetos posibles.

Además, algunas investigaciones sugieren que la capacidad de reconocer los geones y las estructuras compuestas de los geones puede desarrollarse en el cerebro desde los cuatro meses de edad, lo que la convierte en una de las habilidades fundamentales que los bebés utilizan para percibir el mundo.[5]

Evidencia experimental

  • Los participantes muestran una notable capacidad para reconocer objetos a pesar del ruido visual, siempre que los geones sean visibles.
  • La eliminación de información de relación de características (relaciones entre geones) perjudica el reconocimiento de objetos.
  • Sin cebado visual si se utilizan diferentes geones entre las pruebas

Debilidades

La teoría de RBC no es en sí misma capaz de comenzar con una fotografía de un objeto real y producir una descripción de geones y relaciones del objeto; La teoría no intenta proporcionar un mecanismo para reducir las complejidades de las escenas reales a formas de geones simples. La teoría de RBC también es incompleta, ya que los geones y las relaciones entre ellos no podrán distinguir muchos objetos reales. Por ejemplo, una pera y una manzana se distinguen fácilmente por los humanos, pero carecen de las esquinas y los bordes necesarios para que la teoría de RBC reconozca que son diferentes. Sin embargo, Irving Biederman ha argumentado que la teoría de RBC es el modo "preferido" de reconocimiento de objetos humanos, con un proceso secundario que controla objetos que no son distinguibles por sus geones. Además, afirma que esta distinción explica la investigación que sugiere que los objetos pueden o no ser reconocidos igualmente bien con cambios en el punto de vista.

Referencias

  1. Sternberg, Robert J. (2006): Cognitive Psychology. 4th Ed. Thomson Wadsworth.
  2. Biederman, I. (1987) Recognition-by-components: a theory of human image understanding. Psychol Rev. 1987 Apr;94(2):115-147.
  3. Eyseneck, M W. Keane, M T, 2010. ‘’Cognitive Psychology: A Students Handbook.’’ 6th Edition. Hove: Psychology Press
  4. Biederman, I. (2000). Recognizing depth-rotated objects: A review of recent research and theory. Spatial Vision, 13, 241–253.
  5. Haaf, R., Fulkerson, A., Jablonski, B., Hupp, J., Shull, S., Pescara-Kovach, L. (2003). Object recognition and attention to object components by preschool children and 4-month-old infants. Journal of Experimental Child Psychology, 86(2), 108-123.