Ley de Zipf

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Ley de Zipf en diferentes lenguas
Gráficas de ranking versus la frecuencia de las primeras 10 millones de palabras en 30 Wikipedias (descargas de octubre del 2015) en una representación logarítmica en los dos ejes.

La llamada ley de Zipf, formulada en la década de 1940 por George Kingsley Zipf, lingüista de la Universidad de Harvard, es una ley empírica según la cual en una determinada lengua la frecuencia de aparición de distintas palabras sigue una distribución que puede aproximarse por

donde Pn representa la frecuencia de la n-ésima palabra más frecuente y el exponente a es un número real positivo, en general ligeramente superior a 1.[1] Esto significa que el segundo elemento se repetirá aproximadamente con una frecuencia de 1/2 de la del primero, el tercer elemento con una frecuencia de 1/3 y así sucesivamente. Una ley no empírica, pero más precisa, derivada de los trabajos de Claude Shannon fue descubierta por Benoît Mandelbrot.

La ley de Zipf se cumple para la mayoría de las lenguas, inclusive para lenguas no naturales como el esperanto[2] .

Véase también[editar]

Referencias[editar]

  1. Montemurro, Marcelo A. (15 de noviembre de 2001). «Beyond the Zipf–Mandelbrot law in quantitative linguistics» (pdf). Physica A: Statistical Mechanics and its Applications (en inglés) 300: 567–578. Consultado el 2 de octubre de 2016. 
  2. Bill Manaris, Luca Pellicoro, George Pothering, Harland Hodges (13 de febrero de 2006). «Investigating esperanto's statistical proportions relative to other languages using neural networks and Zipf's law». : 102–108, Innsbruck: Artificial Intelligence and Applications.

Enlaces externos[editar]