Léxico

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Léxico es el conjunto de palabras que conforman un determinado lecto y, por extensión, también se denomina así a los diccionarios que los recogen.[1] En un sentido amplio, el concepto es extendible a los lenguajes de programación.

Las disciplinas que se ocupan del léxico son varias: lexicografía, semántica, semiótica, pragmática, filosofía del lenguaje.

Función del léxico[editar]

El vocabulario de un idioma refleja el medio físico y social de sus hablantes porque es un inventario de las ideas, los intereses y las ocupaciones de la comunidad. Las lenguas se adaptan a las preocupaciones, los intereses y las vivencias de los hablantes. Conocer una lengua es conocer el léxico, saber usarlo, y también conocer y saber utilizar las reglas que controlan la combinación correcta de los elementos. Las situaciones sociales son muy diversas, conocer una lengua es conocer las convenciones sociales que controlan el uso de ella en distintas situaciones. Los miembros de una comunidad usan las palabras, en general, con el mismo significado; de otro modo resultaría muy difícil el entendimiento. El comportamiento lingüístico es una parte del conjunto de modelos sociales de conducta que caracterizan a los grupos humanos: cada uno de ellos tiene unas costumbres y unas convenciones distintas.

Clasificación del léxico[editar]

Según el origen y la difusión[editar]

El léxico puede clasificarse desde el punto de vista de su origen histórico o amplitud de uso en:

  • Patrimonial, (la palabra ha evolucionado normalmente dentro del idioma) o préstamo (extranjerismos que se clasifican según la lengua de procedencia)
  • Pasivo (forma parte sólo de la comprensión del hablante) o activo (lo usa habitualmente)
  • Cultismo, estándar, coloquialismo o vulgarismo según el Registro lingüístico empleado
  • Dialectalismo (si pertenece al habla propia de una región)
  • Jerga o argot (si forma parte del habla de un grupo social determinado, por clase, edad o profesión)

Según la función[editar]

Desde el punto de vista de la función:

  • Categorías léxicas, formada por la clase de palabras con referente que constituyen una clase abierta en principio ampliable por cualquiera de los procesos de formación de palabras.
  • Categorías funcionales, formada por las palabras con función puramente gramatical que permiten especificar las relaciones entre los intervinientes en una predicación verbal. Forman una clase cerrada.

Procesos de formación de palabras[editar]

Las palabras que forman parte de las categorías léxicas pueden combinarse entre sí para dar lugar a nuevas palabras, para ello las lenguas del mundo usan diversos procedimientos:

Clases de unidades léxicas[editar]

Según su naturaleza, las unidades del léxico pueden distinguirse entre:

  • Categorías léxicas o abiertas: Son aquellas que poseen carácter referencial (es decir, las que designan procesos, propiedades, acciones o entidades). Se caracterizan por formar un inventario abierto (es decir que no existe un número específico y limitado para estas unidades). Los sustantivos, los verbos y los adjetivos son representantes canónicos de este tipo de unidades léxicas.
  • Categorías funcionales o cerradas: Son aquellas que sólo poseen significado gramatical (es decir, que son fundamentales para la generación de una oración pero que, sin embargo, no tienen significado referencial). Se caracterizan por formar un inventario cerrado. Las conjunciones y los artículos son representantes de este tipo de unidad.

Clases de rasgos léxicos[editar]

Las unidades léxicas distinguen tres tipos de rasgos (no todos los modelos gramaticales utilizan los mismos rasgos léxicos. Lo que se da a continuación es una generalización):

  • Rasgos formales: Contienen información sobre el tipo de palabra de la que se trata (sustantivo, verbo, preposición), sobre el contexto sintáctico en el que pueden aparecer y sobre el tipo de flexión (regular o irregular) que requieren.
  • Rasgos semánticos: Contienen información sobre la estructura argumental requerida por una unidad léxica (un verbo como "destruir" requiere un agente que destruya y un tema a ser destruido), sobre las propiedades inherentes de cada unidad (un nombre como "niño" tiene rasgos [+humano] [+contable] etc.).
  • Rasgos fonológicos: Contiene la información necesaria para asignarle representación fonética a la unidad.

El léxico en la traducción automática[editar]

En un diccionario tradicional típico, las entradas se identifican mediante una forma base o "canónica" de la palabra. Esta forma canónica varía según el idioma: los verbos en inglés se representan mediante la raíz no flexionada, mientras en francés o español se representan con el infinitivo del verbo. Además de la definición estos diccionarios tradicionales incluyen en cada entrada información adicional como la pronunciación, la categoría gramatical o su etimología.

El léxico o diccionario empleado en la traducción automática presenta algunas diferencias, al compararlo con uno tradicional. Algunos programas de traducción automática cuentan únicamente con diccionarios de formas flexionadas, es decir, listas de palabras con todas las formas e información gramaticales correspondientes. Un léxico de esta forma contendría las palabras comer, comida, comiendo, comido por separado, como unidades diferenciadas. Esta aproximación no es nada eficiente en lenguas como el español, que posee una flexión rica y compleja. En estos casos, el léxico suele proporcionar una raíz a partir de la cual el componente morfológico se encargará de generar las formas apropiadas.

Este léxico para la traducción automática debe suministrar la información necesaria para el análisis sintáctico y semántico:

  • categoría gramatical (nombre, verbo, etc.)
  • rasgos de subcategorización, subcategoría del apartado anterior (verbo transitivo o intransitivo, sustantivo masculino o femenino, etc.)
  • información semántica (nombre animado, verbo que exige un sujeto animado, etc.)

A menudo estos dos últimos tipos de información se emplean conjuntamente a la hora de definir, por ejemplo, una subcategoría en términos de restricciones de selección. Esta información ayuda a determinar el contexto en el que pueden aparecer las palabras. Así, por ejemplo, el verbo amar restringe la selección de su sujeto, de manera que éste debe ser animado.

Además, un léxico empleado en la traducción automática debe aportar información relativa a la correspondencia entre las unidades léxicas de distintas lenguas. Debido a la complejidad que puede entrañar esta tarea, muchos sistemas optan por establecer una separación entre dos tipos de información: por un lado, la información necesaria para el análisis o producción de textos en una lengua particular y, por otro lado, la información relativa a las correspondencias léxicas entre dos pares de lenguas. Estas correspondencias incluyen las condiciones en las que se produce la equivalencia:

  • categorías gramaticales (bote: verbo o nombre)
  • categorías semánticas (banco: asiento o establecimiento que realiza negocios con dinero)
  • contexto sintáctico (tratar una enfermedad o tratar de conseguir algo)

Referencias[editar]

Véase también[editar]