Función de distribución

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 18:51 3 jun 2020 por Juan Mayordomo (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.
Función de Distribución Acumulativa para la distribución normal en la siguiente imagen
Función de Densidad de Probabilidad para varias distribuciones normales. El trazo rojo distingue la distribución normal estándar.

En la teoría de la probabilidad y en estadística, la función de distribución acumulada (FDA, designada también a veces simplemente como función de distribución o FD) o función de probabilidad acumulada asociada a una variable aleatoria real: X (mayúscula) sujeta a cierta ley de distribución de probabilidad, es una función matemática de la variable real: x (minúscula); que describe la probabilidad de que X tenga un valor menor o igual que x.
Intuitivamente, asumiendo la función f como la ley de distribución de probabilidad, la FDA sería la función con la recta real como dominio, con imagen del área hasta aquí de la función f, siendo aquí el valor x para la variable aleatoria real X.
La FDA asocia a cada valor x, la probabilidad del evento: «la variable X toma valores menores o iguales a x».
El concepto de FDA puede generalizarse para modelar variables aleatorias multivariantes definidas en


Para cada número real x, una FDA está dada por la siguiente definición:[1]

En lenguaje matemático Interpretación
Una función de nombre F le asigna a cada valor real x, el de la probabilidad de que una variable aleatoria X asuma un valor inferior o igual a x.

La probabilidad de que X se sitúe en un intervalo (ab] (abierto en a y cerrado en b) es F(b) − F(a) si a ≤ b.

La FDA de una probabilidad definida sobre el espacio boreliano es la función que a todo real le asocia

Acumulada y distribuida

Es convención usar una F mayúscula para una FDA, en contraste con la f minúscula usada para una función de densidad de probabilidad (FDP) o para una función de probabilidad.

La función distribución puede obtenerse a partir de la función de probabilidad respectiva. La FDA en el caso de una variable aleatoria X discreta, puede establecerse como:

Para una variable aleatoria X continua, la FDA y la FDP están relacionadas mediante:

Debe observarse que una definición del tipo «menor o igual», '≤' podría sustituirse por estrictamente «menor» '<'. Esto produciría una función diferente, pero cualquiera de las funciones F puede deducirse a partir de la otra f.
También se podría cambiar por una determinada por mayor (>) en lugar de menor '<' y deducir las propiedades de esta nueva función.
Solo es preciso ajustar las formulaciones y definiciones a lo pretendido en cada caso.
En países de lengua inglesa, una convención es usar una desigualdad de este tipo en lugar de una desigualdad estricta (<), por ejemplo.

Ejemplos

F(x) = 0, si x < 0;
F(x) = x, si 0 ≤ x ≤ 1;
F(x) = 1, si x > 1.

Si X toma solo los valores 0 y 1, con igual probabilidad (X sigue una distribución de Bernoulli con p = 1/2). Entonces su FDA viene dada por

F(x) = 0, si x < 0;
F(x) = 1/2, si 0 ≤ x < 1;
F(x) = 1, si x ≥ 1.

Notación

Cuando hay más de una variable aleatoria y se vuelve necesario explicitar una diferencia entre las funciones, se designa la FDA de la variable aleatoria X por .

Función de distribución acumulada inversa (función cuantil)

La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su acumulada.
Si la FDA F es estrictamente creciente y continua, su inversa está definida es el único número real tal que .
Solo en tales casos queda así definida la función de distribución inversa o función cuantil. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición. Lamentablemente, la distribución carece, en general, de inversa. Se puede definir, para , la inversa generalizada de la función distribución:

Sea una variable aleatoria con valores en y su función de distribución. Se llama función cuantil de a la función de en , denotada por , que a hace corresponder: .
La inversa de la pda se denomina función cuantil.

La inversa de la pda puede emplearse para trasladar resultados obtenidos para la distribución uniforme a otras distribuciones.

Propiedades útiles de la inversa de pda

  1. es no-decreciente
  2. si y solo si
  3. Si tiene una distribución entonces, está distribuida como . Esto se emplea en para la generación aleatoria de números con el método de muestreo de transformada inversa.
  4. Si es una colección de variables independentes aleatoriamente distribuidas -definida en el mismo espacio muestral, entonces existen variables aleatorias tales que está distribuida como y como probabilidad 1 para todo .
  • Ejemplo 1: La mediana es .
  • Ejemplo 2: Sea . Se denominará al 95.º percentil.

Por convención, podemos decidir que es el menor de los valores posibles de y es el mayor; pueden ser eventualmente infinitos.

Propiedades

Si X es una variable aleatoria discreta, para la que los valores x1, x2, …, tienen probabilidades p1, p2, etc., la FDA de X será discontinua en los puntos xi y constante entre ellos.

Si la FDA F de X es continua, entonces X es una variable aleatoria continua; si se dice de F que es absolutamente continua, entonces existe una función Integral de Lebesgue f(x) tal que

para todos los números reales a y b. (La primera de las dos igualdades no sería correcta en general si no se hubiera dicho que una distribución es continua.
La continuidad de la distribución implica que P(X = a) = P(X = b) = 0, de modo que una diferencia entre "<" y "≤" deja de ser importante en este contexto). Una función f es igual a la derivada de F (casi en toda parte), y es llamada función de densidad de probabilidad de la distribución de X.

Para cualquier función de distribución , debe ser:

  • es no decreciente (creciente o constante):
  • es continua a la derecha:
  • , con , y

Se cumplen las siguientes propiedades, que permiten tratar con los diferentes tipos de desigualdades, y que se aplican a funciones de distribución de variables aleatorias discretas:

En caso de las variables aleatorias continuas, valen las siguientes propiedades:

  • es continua en todos los puntos (en caso de las variables aleatorias discretas era solo continua a la derecha)

La prueba de Kolmogórov-Smirnov está basada en funciones de distribución acumulada y puede ser usada para ver si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal.
Muy relacionada con la prueba de Kuiper, la cual es útil si el dominio de la distribución es cíclico como por ejemplo en días de la semana. Por ejemplo podemos usar el test de Kuiper para ver si el número de tornados varía durante el año o si las ventas de un producto oscilan día a día o por día del mes.

Véase también

Referencias

  1. Monti, K.L. (1995). «Folded Empirical Distribution Function Curves (Mountain Plots)». The American Statistician 49: 342-345. JSTOR 2684570. 

Bibliografía

Estadística

Puede considerarse el artículo sobre Estadística matemática para completar algunos tópicos.