Función de distribución

De Wikipedia, la enciclopedia libre
(Redirigido desde «Función Distribuición Acumulada»)
Saltar a: navegación, búsqueda
Función de Distribución Acumulativa para la distribución normal en la siguiente imagen.
Función de Densidad de Probabilidad para varias distribuciones normales. El trazo rojo distingue la distribución normal estándar.

En la teoría de la probabilidad y en estadística, la Función de Distribución Acumulada (FDA, designada también a veces simplemente como FD) asociada a una variable aleatoria real: X (mayúscula) sujeta a cierta ley de distribución de probabilidad, es una función matemática de la variable real: x (minúscula); que describe la probabilidad de que X tenga un valor menor o igual que x .
Intuitivamente, asumiendo la función f como la ley de distribución de probabilidad, la FDA sería la función con la recta real como dominio, con imagen del área hasta aquí de la función f, siendo aquí el valor x para la variable aleatoria real X.
La FDA asocia a cada valor x, la probabilidad del evento: "la variable X toma valores menores o iguales a x".
El concepto de FDA puede generalizarse para modelar variables aleatorias multivariantes definidas en


Para cada número real x, una FDA está dada por la siguiente definición:[1]

En lenguaje matemático Interpretación
Una función de nombre "F" le asigna a cada valor real x, el de la probabilidad de que una variable aleatoria X asuma un valor inferior o igual a x.

La probabilidad de que X se sitúe en un intervalo ]ab] (abierto en a y cerrado en b) es F(b) − F(a) si a ≤ b.

La FDAde una probabilidad definida sobre el espacio boreliano es la función que a todo real le asocia

Acumulada y Distribuida[editar]

Es convención usar una F mayúscula para una FDA, en contraste con la f minúscula usada para una Función de Densidad de Probabilidad (FDP) y/o para una Función de Probabilidad.

La función distribución puede obtenerse a partir de la función de probabilidad respectiva. La FDA en el caso de una variable aleatoria X discreta, puede establecerse como:

Para una variable aleatoria X continua, la FDA y la FDP están relacionadas mediante:

Debe observarse que una definición del tipo "menor o igual", '≤' podría sustituirse por estrictamente "menor" '<'. Esto produciría una función diferente, pero cualquiera de las funciones F puede deducirse a partir de la otra f.
También se podría cambiar por una determinada por mayor (>) en lugar de "menor" '<' y deducir las propiedades de esta nueva función.
Sólo es preciso ajustar las formulaciones y definiciones a lo pretendido en cada caso.
En países de lengua inglesa, una convención es usar una desigualdad de este tipo en lugar de una desigualdad estricta (<), por ejemplo.

Ejemplos[editar]

F(x) = 0, si x < 0;
F(x) = x, si 0 ≤ x ≤ 1;
F(x) = 1, si x > 1.

Si X toma sólo los valores 0 y 1, con igual probabilidad (X sigue una distribución de Bernoulli con p = 1/2). Entonces su FDA viene dada por

F(x) = 0, si x < 0;
F(x) = 1/2, si 0 ≤ x < 1;
F(x) = 1, si x ≥ 1.

Notación[editar]

Cuando hay más de una variable aleatoria y se vuelve necesario explicitar una diferencia entre las funciones, se designa la FDA de la variable aleatoria X por .

Función de Distribución Acumulada Inversa (Función Cuantil)[editar]

La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su acumulada.
Si la FDA F es estrictamente creciente y continua, su inversa está definida es el único número real tal que .
Sólo en tales casos queda así definida la función de distribución inversa o función cuantil. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición. Lamentablemente, la distribución carece, en general, de inversa. Se puede definir, para , la inversa generalizada de la función distribución:

Sea una variable aleatoria con valores en y su función de distribución. Se llama función cuantil de a la función de en , denotada por , que a hace corresponder: .
La inversa de la pda se denomina función cuantil.

La inversa de la pda puede emplearse para trasladar resultados obtenidos para la distribución uniforme a otras distribuciones.

Propiedades útiles de la inversa de pda[editar]

  1. es no-decreciente
  2. si y sólo si
  3. Si tiene una distribución entonces, está distribuida como . Esto se emplea en para la generación aleatoria de números con el método de muestreo de transformada inversa.
  4. Si es una colección de variables independentes aleatoriamente distribuidas -definida en el mismo espacio muestral, entonces existen variables aleatorias tales que está distribuida como y como probabilidad 1 para todo .
  • Ejemplo 1: La mediana es .
  • Ejemplo 2: Sea . Se denominará al 95avo percentil.

Por convención, podemos decidir que es el menor de los valores posibles de y es el mayor; pueden ser eventualmente infinitos.

Propiedades[editar]

Si X es una variable aleatoria discreta, para la que los valores x1, x2, ... tienen probabilidades p1, p2 etc., , la FDA de X será discontinua en los puntos xi y constante entre ellos.

Si la FDA F de X es continua, entonces X es una variable aleatoria continua; si se dice de F que es absolutamente continua, entonces existe una función Integral de Lebesgue f(x) tal que

para todos los números reales a y b. (La primera de las dos igualdades no sería correcta en general si no se hubiera dicho que una distribución es continua.
La continuidad de la distribución implica que P(X = a) = P(X = b) = 0, de modo que una diferencia entre "<" y "≤" deja de ser importante en este contexto.) Una función f es igual a la derivada de F (casi en toda parte), y es llamada Función de densidad de probabilidad de la distribución de X.

Para cualquier función de distribución , debe ser:

  • es no decreciente (creciente o constante):
  • es contínua a la derecha:
  • , con , y

Se cumplen las siguientes propiedades, que permiten tratar con los diferentes tipos de desigualdades, y que se aplican a funciones de distribución de variables aleatorias discretas:

En caso de las variables aleatorias continuas, valen las siguientes propiedades:

  • es continua en todos los puntos (en caso de las variables aleatorias discretas era sólo continua a la derecha)

La Prueba de Kolmogórov-Smirnov está basada en funciones de distribución acumulada y puede ser usada para ver si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal.
Muy relacionada con la prueba de Kuiper, la cual es útil si el dominio de la distribución es cíclico como por ejemplo en días de la semana. Por ejemplo podemos usar el test de Kuiper para ver si el número de tornados varía durante el año o si las ventas de un producto oscilan día a día o por día del mes.

Véase también[editar]

Referencias[editar]

  1. Monti, K.L. (1995). «Folded Empirical Distribution Function Curves (Mountain Plots)». The American Statistician 49: 342-345. JSTOR 2684570. 

Bibliografía[editar]

Estadística[editar]

Puede considerarse el artículo sobre Estadística matemática para completar algunos tópicos.