Función de distribución

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Función de Distribución Acumulativa para la distribución normal en la siguiente imagen.
Función de Densidad de Probabilidad para varias distribuciones normales. El trazo rojo distingue la distribución normal estándar.

En la teoría de la probabilidad y en estadística, una función de distribución acumulada (fda) describe la probabilidad de que una variable aleatoria real X sujeta a cierta ley de distribución de probabilidad, se sitúe en la zona de valores menores o iguales a x.
Intuitivamente, asumiendo la función f como la ley de distribución de probabilidad, la fda sería la función con la recta real como dominio, con imagen del área hasta aquí de la función f, siendo aquí el valor x para la variable aleatoria real X.
La fda asocia a cada valor x, la probabilidad del evento: "la variable X toma valores menores o iguales a x".
Las Funciones de Distribución Acumulativa se emplean también para especificar la distribución de variables aleatorias multivariantes.


Para cada número real x, una fda está dada por la siguiente definición:[1]

En lenguaje matemático En Español
F(x) = \operatorname{P}(X\leq x), Una función de nombre "F" le asigna a cada valor real x, el de la probabilidad de que una variable aleatoria X asuma un valor inferior o igual a x.

La probabilidad de que X se sitúe en un intervalo ]ab] (abierto en a y cerrado en b) es F(b) − F(a) si a ≤ b.


\mathbb P(a< X\leq b)\ =\ F_X(b)-F_X(a).

La fda de una probabilidad \mathbb P définida sobre el espacio boréliano \mathcal B(\R) es la función \  F que a todo real  x le asocia


F(x)=\mathbb P(]-\infty, x]).

Acumulada y Distribuida[editar]

Es convención usar una F mayúscula para una fda, en contraste con la f minúscula usada para una Función de Densidad de Probabilidad y/o para una Función de Probabilidad.

La función distribución puede obtenerse a partir de la función de probabilidad respectiva. La fda en el caso de una variable aleatoria X discreta, puede establecerse como:

F(x) = \sum_{x_i \leq x}^{}f(x_i)

Para una variable aleatoria X contínua, fda surge como:

F(x) = \int_{-\infty}^{x}f(t)\,dt

Debe observarse que una definición del tipo "menor o igual", '≤' podría sustituirse por estrictamente "menor" '<'. Esto produciría una función diferente, pero cualquiera de las funciones F puede deducirse a partir de la otra f.
También se podría cambiar por una determinada por mayor (>) en lugar de "menor" '<' y deducir las propiedades de esta nueva función.
Sólo es preciso ajustar las formulaciones y definiciones a lo pretendido en cada caso.
En países de lengua inglesa, una convención es usar una desigualdad de este tipo en lugar de una desigualdad estricta (<), por ejemplo.

Ejemplos[editar]

Como ejemplo, se supone que X está uniformemente distribuida en el intervalo unitario [0, 1]. En ese caso una fda está dada por:

F(x) = 0, si x < 0;
F(x) = x, si 0 ≤ x ≤ 1;
F(x) = 1, si x > 1.

Para otro ejemplo, suponiendo que X toma sólo los valores 0 y 1, con igual probabilidad (X sigue una distribución de Bernoulli con p = 1/2). Entonces una fda está dada por

F(x) = 0, si x < 0;
F(x) = 1/2, si 0 ≤ x < 1;
F(x) = 1, si x ≥ 1.

Notación[editar]

Cuando hay más de una variable aleatoria y se vuelve necesário explicitar una diferencia entre las funciones, se representa una fda de la variable aleatoria X por \operatorname{F}_{X}(x).

Función de Distribución Acumulada Inversa (Función Cuantil)[editar]

La función cuantil de una variable aleatoria (o de una ley de probabilidad) es la inversa de su acumulada.
Si la FDA F es estrictamente creciente y continua, su inversa está definida  F^{-1}( y ), y \in [0,1] es el único número real  x tal que  F(x) = y .
Sólo en tales casos queda así definida la función de distribución inversa o función cuantil. Pero una función de distribución se mantiene constante en todo intervalo en el cual la variable aleatoria no puede tomar valores. Es por esto que se introduce la siguiente definición. Lamentablemente, la distribución carece, en general, de inversa. Se puede definir, para  y \in [0,1] , la inversa generalizada de la función distribución:


F^{-1}(y) = \inf_{x \in \mathbb{R}} \{ F(x) \geq y \}.

Sea X una variable aleatoria con valores en {R} y F_X su función de distribución. Se llama función cuantil de X a la función de ]0,1[ en {R}, denotada por Q_X, que a u\in ]0,1[ hace corresponder: \displaystyle Q_X(u) = \inf\{x\;:\; F_X(x)\geq u\}\;.
La inversa de la pda se denomina función cuantil.

La inversa de la pda puede emplearse para trasladar resultados obtenidos para la distribución uniforme a otras distribuciones.

Propiedades útiles de la inversa de pda[editar]

  1. F^{-1} es no-decreciente
  2. F^{-1}(F(x)) \leq x
  3. F(F^{-1}(y)) \geq y
  4. F^{-1}(y) \leq x si y sólo si y \leq F(x)
  5. Si Y tiene una distribución U[0, 1] entonces, F^{-1}(Y) está distribuida como F. Esto se emplea en para la generación aleatoria de números con el método de muestreo de transformada inversa.
  6. Si \{X_\alpha\} es una colección de variables independentes aleatoriamente distribuidas F-definida en el mismo espacio muestral, entonces existen variables aleatorias Y_\alpha tales que Y_\alpha está distribuida como U[0,1] y F^{-1}(Y_\alpha) = X_\alpha como probabilidad 1 para todo \alpha.
  • Ejemplo 1: La mediana es F^{-1}( 0.5 ).
  • Ejemplo 2: Sea  \tau = F^{-1}( 0.95 ) . Se denominará  \tau al 95avo percentil.

Por convención, podemos decidir que Q_X(0) es el menor de los valores posibles de X y Q_X(1) es el mayor; pueden ser eventualmente infinitos.

Propiedades[editar]

Si X es una variable aleatoria discreta, entonces se la obtiene de los valores x1, x2, ... con probabilidad p1, p2 etc., y una fda de X será discontínua en los puntos xi y constante entre ellos.

Si una fda F de X es contínua, entonces X es una variable aleatoria contínua; si se dice de F que es absolutamente contínua, entonces existe una función Integral de Lebesgue f(x) tal que

F(b)-F(a) = \operatorname{P}(a\leq X\leq b) = \int_a^b f(x)\,dx

para todos los números reales a y b. (La primera de las dos igualdades no sería correcta en general si no se hubiera dicho que una distribución es contínua.
La continuidad de la distribución implica que P(X = a) = P(X = b) = 0, de modo que una diferencia entre "<" y "≤" deja de ser importante en este contexto.) una función f es igual a la derivada de F (casi en toda parte), y es llamada Función de densidad de probabilidad de la distribución de X.

Para cualquier función de distribución F, debe ser:

  • 0 \le F(x) \le 1
  • F es no decreciente (creciente o constante): x_1 < x_2 \Rightarrow F(x_1) \le F(x_2)
  • F(-\infty) = \lim_{x \to -\infty} F(x) = 0
  • F(+\infty) = \lim_{x \to +\infty} F(x) = 1
  • F es contínua a la derecha: F(a^+) = \lim_{x \to a^+}F(x) = F(a)
  • \operatorname{P}(x=a) = F(a) - F(a^-)
  • \operatorname{P}(a < x \le b) = F(b) - F(a), con a,b \in \mathbb{R}, y a < b

Se cumplen las siguientes propiedades, que permiten tratar con los diferentes tipos de desigualdades, y que se aplican a funciones de distribución de variables aleatorias discretas:

  • \operatorname{P}(X < b) = F(b^-)
  • \operatorname{P}(X > a) = 1 - F(a)
  • \operatorname{P}(X \ge a) = 1 - F(a^-)
  • \operatorname{P}(a < X < b) = F(b^-) - F(a)
  • \operatorname{P}(a \le X < b) = F(b^-) - F(a^-)
  • \operatorname{P}(a \le X \le b) = F(b) - F(a^-)

En caso de las variables aleatorias contínuas, valen las siguientes propiedades:

La Prueba de Kolmogórov-Smirnov está basada en funciones de distribución acumulada y puede ser usada para ver si dos distribuiciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal.
Muy relacionada con la prueba de Kuiper, la cual es útil si el domínio de la distribución es cíclico como por ejemplo en días de la semana. Por ejemplo podemos usar el test de Kuiper para ver si el número de tornados varía durante el año o si las ventas de un producto oscilan día a día o por día del mes.

Véase también[editar]

Referencias[editar]

  1. Monti, K.L. (1995). «Folded Empirical Distribution Function Curves (Mountain Plots)». The American Statistician 49:  pp. 342–345. 

Bibliografía[editar]

Estadística[editar]

Puede considerarse el artículo sobre Estadística matemática para completar algunos tópicos.