Lingüística de corpus

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La lingüística de corpus es un área de la lingüística que se ocupa de la recopilación y análisis de corpus lingüísticos, es decir, de conjuntos de datos lingüísticos recolectados criteriosamente para ser objeto de investigación lingüística. Originalmente se elaboraban a mano; en la actualidad, los corpus se recopilan de manera automática.

Los partidarios de la lingüística de corpus consideran que el análisis lingüístico fiable se da de manera óptima en muestreos recopilados en contextos naturales y con mínima interferencia experimental. Existen visiones divergentes respecto del valor de las anotaciones de corpus, desde John Sinclair[1] que sostiene que se deben tomar un mínimo de anotaciones y permitir que los textos "hablen por sí mismos", hasta otros como el equipo Survey of English Usage (del University College de Londres)[2] que sostienen que la anotación implica un camino hacia un máximo de comprensión y rigor lingüísticos.

Véase también[editar]

Referencias[editar]

  1. Sinclair, J. 'The automatic analysis of corpora', in Svartvik, J. (ed.) Directions in Corpus Linguistics (Proceedings of Nobel Symposium 82). Berlin: Mouton de Gruyter. 1992.
  2. Wallis, S. 'Annotation, Retrieval and Experimentation', in Meurman-Solin, A. & Nurmi, A.A. (ed.) Annotating Variation and Change. Helsinki: Varieng, [University of Helsinki]. 2007.e-Published

Enlaces externos[editar]