Tesauro

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Tesauro.

Tesauro es la lista de palabras o términos controlados empleados para representar conceptos.

Proviene del latín thesaurus (‘tesoro’), y este a su vez del griego clásico thesauros (θησαυρός, ‘almacén’, ‘tesorería’). Es utilizado en literatura como thesaurus, thesauri o tesoro para referirse a los diccionarios, como por ejemplo el Tesoro de la lengua castellana o española de Covarrubias, de 1611.

Adquiere al menos dos significados relacionados, en el campo de la literatura y en el campo de la biblioteconomía o ciencias de la información.

En literatura[editar]

Tesauro es una lista de palabras con significados similares sinónimos, habitualmente acompañada por otra lista de antónimos. Un ejemplo sería un tesauro dedicado a un campo especializado, que contiene la jerga que se emplea en dicho campo del conocimiento. En el mundo de habla inglesa, es clásico el Tesauro de Roget, cuya función es, según su autor, además de ayudar al escritor a encontrar la palabra que exprese mejor su pensamiento, también estimular su intelecto y sugerirle palabras o ideas relacionadas.

En biblioteconomía y ciencias de la información[editar]

Tesauro es un sistema de organización del conocimiento, en forma de lista, que contiene los «términos» controlados empleados para representar los conceptos, temas o contenidos de los documentos, con miras a efectuar una normalización terminológica que permita mejorar el canal de acceso y comunicación entre los usuarios y las Unidades de Información (entiéndase unidad de información como: biblioteca, archivo o centro de documentación). El Tesauro posee un signo de representación linguístico, un vocabulario controlado y una sintaxis poscoordinada. Aunque en la práctica tradicional se habla de unitérminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a términos o descriptores compuestos, es decir, descriptores que se componen de dos o más palabras.

Los términos que conforman el tesauro se interrelacionan entre ellos bajo tres modalidades de relación:

  1. Relaciones jerárquicas: Establecen subdivisiones que generalmente reflejan estructuras de TODO/Parte.
  2. Relaciones de equivalencia: Controlan la sinonimia, homonimia, antonimia y polisemia entre los términos.
  3. Relaciones asociativas: Mejoran las estrategias de recuperación y ayudan a reducir la polijerarquía entre los términos.

Es un intermediario entre el lenguaje que encontramos en los documentos (lenguaje natural) y el que emplean los especialistas de un determinado campo del saber (lenguaje controlado). Aunque los incluye, las entradas de un tesauro no deben ser consideradas sólo como una lista de sinónimos.

Contenido[editar]

En líneas generales, un tesauro comprende lo siguiente:

  1. Una lista de términos preferentes, ordenados en forma alfabética, temática y jerárquica.
  2. Una lista de sinónimos de esos términos preferentes, llamados descriptores, con la leyenda «úsese (término preferente)» o una indicación similar.
  3. Una jerarquía o relaciones entre los términos. Esto se expresa con la identificación de «términos más generales» y «términos más específicos».
  4. Las definiciones de los términos, en caso de ambiguedad, para facilitar la selección de los mismos por parte del usuario
  5. Y un conjunto de reglas para usar el tesauro.

Se puede establecer una profundidad de la jerarquía, indicado por niveles de importancia de los niveles preferidos. A mayor profundidad, mayor especificidad.

Descriptores[editar]

Un descriptor es cada uno de los términos o expresiones escogidos entre un conjunto de sinónimos o cuasi sinónimos para representar (en calidad de término preferente) generalmente de manera unívoca, un concepto susceptible de aparecer con cierta frecuencia en los documentos indizables, y en las consultas que se realicen. El descriptor corresponde normalmente a la etiqueta de un concepto, y es la unidad mínima de significado que integra un tesauro o una lista de descriptores. Suele acompañarse de una nota de alcance o, menos usualmente, de una definición en los casos que el mero registro del término puede provocar problemas de ambigüedad en su interpretación. El descriptor es el término por el cual efectivamente se indizará (por eso se llama también término de indización), y por el cual se recuperarán los documentos referidos a su temática.

Ejemplo de uso de tesauro modificado[editar]

Se reproduce aquí parte de la sección alfabética de un tesauro impreso. Nótese que los términos preferidos están en mayúscula (en este caso, la palabra «AUTOMÓVIL»):

Auto: úsese Automóvil
Autómata
Automatismo
AUTOMÓVIL
Término más general: medios de transporte
Término(s) subordinado(s):
sedán
coupé
todo terreno
Bicicleta
Camión
Carro: úsese Automóvil
Coche: úsese Automóvil
Motocicleta
etc.

En la sección temática del tesauro, encontraremos agrupados los temas, habitualmente de lo más general a lo más específico:

Medios de transporte
Medios de transporte terrestre
Automóvil
sedán
coupé
todo terreno
Medios de transporte aéreo
Medios de transporte marítimo

Se debe tener en cuenta que los tesauros no tienen por qué ser completos, en el sentido de abarcar todo el conocimiento. Generalmente se limitan a un área temática específica, y desde un cierto ángulo en particular. Es así que existen innumerables tesauros específicos. Como ejemplo de estos, podemos citar el Tesauro de la Propiedad Industrial (en español), el MeSH o encabezamientos temáticos médicos (en lengua inglesa), y a Agrovoc (tesauro multilingüe de términos de agricultura).

En rigor de verdad, no es la función de un tesauro definir las palabras (esta función es propia del diccionario). Sin embargo, muchos tesauros contienen definiciones de los términos que emplean, con el fin de que el usuario del tesauro no tenga dudas al seleccionar un término.

Se debe tener en cuenta que ha habido un gran cambio al aparecer la posibilidad de tesauros digitales, porque las jerarquías y las relaciones hacen que muchas limitaciones de los tesauros impresos hayan desaparecido. Por ejemplo, es posible buscar casi instantáneamente los términos de un tesauro usando un motor de búsqueda, o simplemente recorrer las jerarquías en línea, o también usar la función de «mapeo» al término preferido en forma automática, introduciendo el usuario el término en lenguaje natural, siendo el programa informático el que relaciona este término con la lista de términos preferidos, y realiza posteriormente la búsqueda en la base de datos empleando los términos preferidos.

Dentro del software libre para la gestión de tesauros,taxonomías, ontologías, etc. podemos mencionar TemaTres. Este software permite gestionar nuestro propio tesauro, o trabajar de manera colaborativa en el desarrollo del mismo. Brinda diferentes posibilidades y tiene en cuenta todos los elementos que debe poseer un Tesauro para cumplir con las normas de calidad. Entre los elementos que permite incluir se encuentran: URI del vocabulario, idioma, fecha de creación y de la última actualización, palabras claves, tipología de lenguaje (por ejemplo un Tesauro estructurado), cobertura temática, cantidad de términos que incluye, cantidad de relaciones entre términos, cantidad de términos equivalentes, cantidad de notas (de alcance, históticas, biográfica y privadas) y API del vocabulario).

Ejemplo de pantalla de navegación en TemaTres, en el Tesauro Trabajo Social.

Ej tesauro TS

Se puede ver el tesauro completo en: http://vocabularyserver.com/ts/

Obras de uso general[editar]

Ejemplos de tesauros especializados[editar]

Véase también[editar]

Bibliografía[editar]

Enlaces externos[editar]