Ley de Zipf

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La llamada Ley de Zipf, formulada en la década de 1940 por George Kingsley Zipf, lingüista de la Universidad de Harvard, es una ley empírica según la cual, por ejemplo, en una lengua, la frecuencia de aparición de distintas palabras sigue una distribución que puede aproximarse por

P_n \sim 1/n^a

donde Pn representa la frecuencia de una palabra ordenada n-ésima y el exponente a es próximo a 1. Esto significa que el segundo elemento se repetirá aproximadamente con una frecuencia de 1/2 de la del primero, y el tercer elemento con una frecuencia de 1/3 y así sucesivamente. Una ley no empírica, pero más precisa, derivada de los trabajos de Claude Shannon fue descubierta por Benoît Mandelbrot.

La ley de Zipf se cumple para la mayoría de las lenguas, inclusive para lenguas no naturales como el esperanto[1] .

Ley de Zipf en diferentes lenguas
Graficas del ranking versus la frecuencia de las primeras 10 millones de palabras en 30 Wikipedias (descargas de octubre del 2015) en una representación logarítmica en los dos ejes.

Véase también[editar]

Enlaces externos[editar]