Función de distribución

En la teoría de la probabilidad y en estadística, la función de distribución acumulada (FDA, designada también a veces simplemente como función de distribución o FD) o función de probabilidad acumulada asociada a una variable aleatoria real: X (mayúscula) sujeta a cierta ley de distribución de probabilidad, es una función matemática de la variable real: x (minúscula); que describe la probabilidad de que X tenga un valor menor o igual que x.
Intuitivamente, asumiendo la función f como la ley de distribución de probabilidad, la FDA sería la función con la recta real como dominio, con imagen del área hasta aquí de la función f, siendo aquí el valor x para la variable aleatoria real X.
La FDA asocia a cada valor x, la probabilidad del evento: «la variable X toma valores menores o iguales a x».
El concepto de FDA puede generalizarse para modelar variables aleatorias multivariantes definidas en $\mathbb {R} ^{n}$

Para cada número real x, una FDA está dada por la siguiente definición:^[1]

En lenguaje matemático	Interpretación
$F(x)=\operatorname {P} (X\leq x),$	Una función de nombre F le asigna a cada valor real x, el de la probabilidad de que una variable aleatoria X asuma un valor inferior o igual a x.

La probabilidad de que X se sitúe en un intervalo (a, b] (abierto en a y cerrado en b) es F(b) − F(a) si a ≤ b.

\mathbb {P} (a<X\leq b)\ =\ F_{X}(b)-F_{X}(a).

La FDA de una probabilidad $\mathbb {P}$ definida sobre el espacio boreliano ${\mathcal {B}}(\mathbb {R} )$ es la función $\ F$ que a todo real $x$ le asocia

F(x)=\mathbb {P} ([-\infty ,x]).

Acumulada y distribuida

Es convención usar una F mayúscula para una FDA, en contraste con la f minúscula usada para una función de densidad de probabilidad (FDP) o para una función de probabilidad.

La función distribución puede obtenerse a partir de la función de probabilidad respectiva. La FDA en el caso de una variable aleatoria X discreta, puede establecerse como:

$F(x)=\sum _{x_{i}\leq x}^{}f(x_{i})$

Para una variable aleatoria X continua, la FDA y la FDP están relacionadas mediante:

$F(x)=\int _{-\infty }^{x}f(t)\,dt$

Debe observarse que una definición del tipo «menor o igual», '≤' podría sustituirse por estrictamente «menor» '<'. Esto produciría una función diferente, pero cualquiera de las funciones F puede deducirse a partir de la otra f.
También se podría cambiar por una determinada por mayor (>) en lugar de menor '<' y deducir las propiedades de esta nueva función.
Solo es preciso ajustar las formulaciones y definiciones a lo pretendido en cada caso.
En países de lengua inglesa, una convención es usar una desigualdad de este tipo ≤ en lugar de una desigualdad estricta (<), por ejemplo.

Ejemplos

La FDA de una variable aleatoria: X, uniformemente distribuida en el intervalo unitario [0, 1] queda definida por:

F(x) = 0, si x < 0;

F(x) = x, si 0 ≤ x ≤ 1;

F(x) = 1, si x > 1.

Si X toma solo los valores 0 y 1, con igual probabilidad (X sigue una distribución de Bernoulli con p = 1/2). Entonces su FDA viene dada por

F(x) = 0, si x < 0;

F(x) = 1/2, si 0 ≤ x < 1;

F(x) = 1, si x ≥ 1.

Notación

Cuando hay más de una variable aleatoria y se vuelve necesario explicitar una diferencia entre las funciones, se designa la FDA de la variable aleatoria X por $\operatorname {F} _{X}(x)$ .

Función de distribución acumulada inversa (función cuantil)

La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su acumulada.
Si la FDA F es estrictamente creciente y continua, su inversa está definida $F^{-1}(y),y\in [0,1]$ es el único número real $x$ tal que $F(x)=y$ .
Solo en tales casos queda así definida la función de distribución inversa o función cuantil. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición. Lamentablemente, la distribución carece, en general, de inversa. Se puede definir, para $y\in [0,1]$ , la inversa generalizada de la función distribución:

F^{-1}(y)=\inf _{x\in \mathbb {R} }\{F(x)\geq y\}.

Sea $X$ una variable aleatoria con valores en $\mathbb {R}$ y $F_{X}$ su función de distribución. Se llama función cuantil de $X$ a la función de $[0,1]$ en $\mathbb {R}$ , denotada por $Q_{X}$ , que a $u\in [0,1]$ hace corresponder: $\displaystyle Q_{X}(u)=\inf\{x\;:\;F_{X}(x)\geq u\}\;$ .
La inversa de la pda se denomina función cuantil.

La inversa de la pda puede emplearse para trasladar resultados obtenidos para la distribución uniforme a otras distribuciones.

Propiedades útiles de la inversa de pda

$F^{-1}$ es no-decreciente
$F^{-1}(F(x))\leq x$
$F(F^{-1}(y))\geq y$
$F^{-1}(y)\leq x$ si y solo si $y\leq F(x)$
Si $Y$ tiene una distribución $U[0,1]$ entonces, $F^{-1}(Y)$ está distribuida como $F$ . Esto se emplea en para la generación aleatoria de números con el método de muestreo de transformada inversa.
Si $\{X_{\alpha }\}$ es una colección de variables independentes aleatoriamente distribuidas $F$ -definida en el mismo espacio muestral, entonces existen variables aleatorias $Y_{\alpha }$ tales que $Y_{\alpha }$ está distribuida como $U[0,1]$ y $F^{-1}(Y_{\alpha })=X_{\alpha }$ como probabilidad 1 para todo $\alpha$ .

Ejemplo 1: La mediana es $F^{-1}(0.5)$ .
Ejemplo 2: Sea $\tau =F^{-1}(0.95)$ . Se denominará $\tau$ al 95.º percentil.

Por convención, podemos decidir que $Q_{X}(0)$ es el menor de los valores posibles de $X$ y $Q_{X}(1)$ es el mayor; pueden ser eventualmente infinitos.

Propiedades

Si X es una variable aleatoria discreta, para la que los valores x₁, x₂, …, tienen probabilidades p₁, p₂, etc., la FDA de X será discontinua en los puntos x_i y constante entre ellos.

Si la FDA F de X es continua, entonces X es una variable aleatoria continua; si se dice de F que es absolutamente continua, entonces existe una función Integral de Lebesgue f(x) tal que

F(b)-F(a)=\operatorname {P} (a\leq X\leq b)=\int _{a}^{b}f(x)\,dx

para todos los números reales a y b. (La primera de las dos igualdades no sería correcta en general si no se hubiera dicho que una distribución es continua.
La continuidad de la distribución implica que P(X = a) = P(X = b) = 0, de modo que una diferencia entre "<" y "≤" deja de ser importante en este contexto). Una función f es igual a la derivada de F (casi en toda parte), y es llamada función de densidad de probabilidad de la distribución de X.

Para cualquier función de distribución $F$ , debe ser:

$0\leq F(x)\leq 1$
$F$ es no decreciente (creciente o constante): $x_{1}<x_{2}\Rightarrow F(x_{1})\leq F(x_{2})$
$F(-\infty )=\lim _{x\to -\infty }F(x)=0$
$F(+\infty )=\lim _{x\to +\infty }F(x)=1$
$F$ es continua a la derecha: $F(a^{+})=\lim _{x\to a^{+}}F(x)=F(a)$
$\operatorname {P} (x=a)=F(a)-F(a^{-})$
$\operatorname {P} (a<x\leq b)=F(b)-F(a)$ , con $a,b\in \mathbb {R}$ , y $a<b$

Se cumplen las siguientes propiedades, que permiten tratar con los diferentes tipos de desigualdades, y que se aplican a funciones de distribución de variables aleatorias discretas:

$\operatorname {P} (X<b)=F(b^{-})$
$\operatorname {P} (X>a)=1-F(a)$
$\operatorname {P} (X\geq a)=1-F(a^{-})$
$\operatorname {P} (a<X<b)=F(b^{-})-F(a)$
$\operatorname {P} (a\leq X<b)=F(b^{-})-F(a^{-})$
$\operatorname {P} (a\leq X\leq b)=F(b)-F(a^{-})$

En caso de las variables aleatorias continuas, valen las siguientes propiedades:

$F$ es continua en todos los puntos (en caso de las variables aleatorias discretas era solo continua a la derecha)
$\operatorname {P} (x=a)=\int _{a}^{a}f(x)\,dx=0$
$\operatorname {P} (a\leq X\leq b)=\operatorname {P} (a\leq X<b)=\operatorname {P} (a<X\leq b)=\operatorname {P} (a<X<b)=\int _{a}^{b}f(x)\,dx=F(b)-F(a)$

La prueba de Kolmogórov-Smirnov está basada en funciones de distribución acumulada y puede ser usada para ver si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal.
Muy relacionada con la prueba de Kuiper, la cual es útil si el dominio de la distribución es cíclico como por ejemplo en días de la semana. Por ejemplo podemos usar el test de Kuiper para ver si el número de tornados varía durante el año o si las ventas de un producto oscilan día a día o por día del mes.

Véase también

Referencias

↑ Monti, K.L. (1995). «Folded Empirical Distribution Function Curves (Mountain Plots)». The American Statistician 49: 342-345. JSTOR 2684570.

Bibliografía

Estadística

Puede considerarse el artículo sobre Estadística matemática para completar algunos tópicos.

Datos: Q386228
Multimedia: Cumulative distribution functions / Q386228

[Monti-1] Monti, K.L. (1995). «Folded Empirical Distribution Function Curves (Mountain Plots)». The American Statistician 49: 342-345. JSTOR 2684570.

[1]