Ley de Benford

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La ley de Benford, también conocida como la ley del primer dígito, asegura que, en gran variedad de conjuntos de datos numéricos que existen en la vida real, la primera cifra es 1 con mucha más frecuencia que el resto de los números. Además, según crece este primer dígito, más improbable es que se encuentre en la primera posición. La ley también asegura cierta frecuencia para los siguientes dígitos.

Esta ley se puede aplicar a muchos hechos relacionados con el mundo natural o con elementos sociales: facturas, artículos en revistas, números de puerta, precios, número de habitantes, tasas de mortalidad, longitud de los ríos.[1]

Historia[editar]

En 1881 el astrónomo y matemático Simon Newcomb observó que las primeras páginas de las tablas de logaritmos estaban manifiestamente más usadas que las finales. Dedujo que aparentemente los dígitos iniciales de los números (al menos los utilizados en su trabajo por quienes habían consultado las tablas) no son equiprobables, sino que el 1 aparece como dígito inicial más frecuente, seguido del 2, etc. hasta el 9 que es el menos frecuente. Mediante un breve e ingenioso razonamiento, aunque sin presentar realmente un argumento formal ni fórmula matemática, Newcomb enunció verbalmente una relación o ley logarítmica: “la ley de probabilidad de la ocurrencia de números es tal que las mantisas de sus logaritmos son equiprobables”[2]​ de la que derivó probabilidades para el valor del primer dígito más significativo:

Dígito d P(d)
1 0,301
2 0,176
3 0,125
4 0,097
5 0,079
6 0,067
7 0,058
8 0,051
9 0,046

Sin embargo, no presentó evidencia estadística para esta distribución de los dígitos.[3]

En 1938, y de manera independiente, el físico Frank Benford observó el mismo fenómeno en las tablas de logaritmos y realizó una comprobación empírica sobre un total de 20.229 números agrupados en 20 muestras de gran diversidad: áreas fluviales, constantes y magnitudes físicas y químicas, funciones matemáticas e incluso números de direcciones de personas y tomados de portadas de revistas.[1]​ A partir de los resultados empíricos Benford postuló una “ley de los números anómalos” para la probabilidad de que el primer dígito sea d. Esta ley logarítmica se conoce como “ley de Benford”.

Formulación matemática[editar]

Diremos que un un conjunto de números cumple la ley de Benford si, al escribirlo en notación decimal, la primera cifra significativa es d con probabilidad . Con primera cifra significativa nos referimos al primer dígito (el más a la izquierda) distinto de 0.

Podemos formular una ley para las dos primeras cifras: la probabilidad de que las dos primeras cifras no nulas sean igual a n (n = 10,..., 99) es igual a ( log10(n+1) − log10(n) ). De un modo similar se puede enunciar una ley para las tres primeras cifras, para las cuatro primeras cifras, etc.

Para el caso de una sucesión {an}, se dice que es Benford si cumple con las probabilidades antes descritas a largo plazo, es decir, si para cada d=1, ..., 9.[4]

Las sucesiones surgidas de ecuaciones en recurrencia lineales cumplen (bajo hipótesis bastante generales) la ley de Benford. Esto en particular incluye a las sucesiones del tipo (progresiones geométricas), siempre que no sea una potencia de 10.[4]

Algunas propiedades[editar]

La ley de Benford es la única distribución de probabilidad para el primer dígito que resulta invariante por escalas. Esto significa que si tomamos un conjunto de datos que cumple con la ley de Benford y los multiplicamos a todos por una constante k, los números resultantes siguen verificando la ley. Recíprocamente, si un conjunto de números tiene esa propiedad sobre la aparición del primer dígito (la frecuencia de aparición de cada dígito como primera cifra significativa no cambia al multiplicarlos por una constante) entonces cumple la ley de Benford.[3]

Para saber cuál es el primer dígito de un número n, lo que se hace es dividir a n entre 10k-1 (donde k es el número de cifras que tiene n) y observar en cuál de los intervalos [1,2), [2,3), ..., [9,10) cae ese resultado. Podemos pensar al resultado de esa división como una variable aleatoria con dominio [1,10). Una propiedad que caracteriza a la ley de Benford es la siguiente: una variable aleatoria X con recorrido [1,10) sigue la ley de Benford si y solo si se distribuye uniformemente en [0,1].[5]

Explicación[editar]

La propiedad de invariancia de escala puede dar una explicación intuitiva para el porqué del cumplimiento de la ley de Benford para ciertos tipos de datos. Por ejemplo, si medimos la longitud de todos los ríos y arroyos del mundo, la frecuencia de aparición del primer dígito no debería ser distinta si medimos en metros, yardas, pies u otra medida de longitud. Como la única distribución que cumple con ser invariante respecto al cambio de escala, parecería lógico que sea la ley seguida por estos datos.

El hecho de que la primera cifra sea la cifra 1 con mayor frecuencia que las demás, puede ser entendido si tenemos en cuenta que comenzamos a contar desde 1 (1, 2, 3,...) hasta llegar al 9, momento en que cada cifra tiene la misma probabilidad. Pero de 10 a 19 sólo tenemos como primera cifra el 1, y sólo cuando llegamos al 99 todos las cifras tendrán la misma probabilidad de nuevo.

Los tipos de muestras que lo cumplen pueden venir de muy diferentes lugares. En general para datos ordinales que en algún momento se acaban (números de casas), la distribución ya es exponencial. Para el número de la última casa de la calle, la distribución también es exponencial así como para los valores de bolsa, y esto es sabido desde el concepto de exponencial. El asunto del primer número es tomar la distribución de la primera década (1-9), que será exponencial, y montar encima el de la primera década pero de un orden superior (10-90), y así consecutivamente. Total que siempre resultarán exponenciales.

Por supuesto, existen listas que no cumplen la dicha ley, pero parece ser que si se toman términos al azar de varias listas no-Benford en número suficiente para formar otra lista heterogénea, esta si tiende a cumplirla, dada una longitud suficiente.[6]

Aplicaciones[editar]

Mark Nigrini en su tesis de doctorado (1992) da una idea de cómo utilizar la ley de Benford para encontrar engaños en las declaraciones al fisco. Continuaría luego escribiendo varios artículos sobre el tema. Esta aplicación fue la que dio "fama" a una ley estadística que hasta ese momento solo se veía como una curiosidad.[5]​ Aplicaciones similares han sido realizadas para estudiar otras variables económicas.[7][8]

Otras aplicaciones han sido propuestas en diversas áreas, incluyendo genética[9]​ y fraudes en elecciones[10]​ (aunque la utilidad en este caso fue cuestionada).[11]

Referencias[editar]

  1. a b Paenza, Adrián (3 de mayo de 2009). «La ley de Benford». Página 12. Consultado el 8 de julio de 2017. 
  2. Newcomb, Simon (1881). «Note on the Frequency of Use of the Different Digits in Natural Numbers». American Journal of Mathematics 4 (1): 39-40. doi:10.2307/2369148. Consultado el 8 de julio de 2017. 
  3. a b Hill, Theodore (1995). «The Significant-Digit Phenomenon». American Mathematical Monthly 102 (4): 322-327. Consultado el 8 de julio de 2017. 
  4. a b Miller; Takloo-Bighash (2006). «Applications of Probability: Benford's Law and Hypothesis Testing». An invitation to modern theory number (en inglés). Princeton University Press. pp. 216-221. 
  5. a b Caputi, María (2016). «Ley de Benford o ley del primer dígito significativo». Ley de Benford (Trabajo final del Diploma de Matemática). Uruguay: Universidad de la República - ANEP. 
  6. «Explicación: ¿por qué funciona la ley de Benford en el mundo real?». Estadística para todos. 
  7. T. Worstall. «Greece Was Lying About Its Budget Numbers». Forbes. 
  8. Tarek elSehity; Erik Hoelzl; Erich Kirchler (2005). «Price developments after a nominal shock: Benford's Law and psychological pricing after the euro introduction». International Journal of Research in Marketing 22 (4): 471-480. Consultado el 8 de julio de 2017. 
  9. James L. Friarand; Terrance Goldman; Juan Pérez–Mercader (2012). «Genome Sizes and the Benford Distribution». Plos One 7 (5). doi:10.1371/journal.pone.0036624. Consultado el 8 de julio de 2017. 
  10. S.Battersby (24 de junio de 2009). «Statistics hint at fraud in Iranian election». New Scientist. Consultado el 8 de julio de 2017. 
  11. Joseph Deckert; Mikhail Myagkov; Peter C. Ordeshook (2010). «The Irrelevance of Benford’s Law for Detecting Fraud in Elections». University of Oregon and California Institute of Technology. Consultado el 8 de julio de 2017. 

Enlaces externos[editar]