Distribución hipergeométrica

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Distribución hipergeométrica
Parámetros N \in \{0,1,2,\dots\}
m \in \{0,1,2,\dots,N\} n \in \{0,1,2,\dots,N\}\,
Dominio \scriptstyle{k\, \in\, \max{(0,\, n+m-N)},\, \dots,\, \min{(m,\, n )}}\,
Función de probabilidad (fp) {{{m \choose k} {{N-m} \choose {n-k}}}\over {N \choose n}}
Media n m\over N
Moda \left \lfloor \frac{(n+1)(m+1)}{N+2} \right \rfloor
Varianza n(m/N)(1-(m/N))(N-n)\over (N-1)
Coeficiente de simetría \frac{(N-2m)(N-1)^\frac{1}{2}(N-2n)}{[nm(N-m)(N-n)]^\frac{1}{2}(N-2)}
Curtosis

 \left[\frac{N^2(N-1)}{n(N-2)(N-3)(N-n)}\right] \cdot\left[\frac{N(N+1)-6N(N-n)}{m(N-m)}\right.

+\left.\frac{3n(N-n)(N+6)}{N^2}-6\right]
Función generadora de momentos (mgf) \frac{{N-m \choose n} \scriptstyle{\,_2F_1(-n, -m; N - m - n + 1; e^{t}) } }
                         {{N \choose n}}  \,\!
Función característica \frac{{N-m \choose n} \scriptstyle{\,_2F_1(-n, -m; N - m - n + 1; e^{it}) }}
{{N \choose n}}

En teoría de la probabilidad la distribución hipergeométrica es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. Supóngase que se tiene una población de N elementos de los cuales, d pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la probabilidad de obtener x (0 \le x \le d) elementos de la categoría A en una muestra sin reemplazo de n elementos de la población original.

Propiedades[editar]

La función de probabilidad de una variable aleatoria con distribución hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual a

P(X=x)=\frac{{d \choose x}{{N-d \choose n-x}}}{{N \choose n}},

donde N es el tamaño de población, n es el tamaño de la muestra extraída, d es el número de elementos en la población original que pertenecen a la categoría deseada y x es el número de elementos en la muestra que pertenecen a dicha categoría. La notación {a \choose x} hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar x elementos de un total a.

El valor esperado de una variable aleatoria X que sigue la distribución hipergeométrica es

E[X]=\frac{nd}{N}

y su varianza,

Var[X]=\bigg(\frac{N-n}{N-1}\bigg)\bigg(\frac{nd}{N}\bigg)\bigg( 1-\frac{d}{N}\bigg).

En la fórmula anterior, definiendo

p = \frac{d}{N}

y

q = 1-p\,,

se obtiene

Var[X]=npq\frac{N-n}{N-1}.

La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.

Enlaces externos[editar]