Log-normal
Función de densidad de probabilidad
Función de distribución de probabilidad Parámetros
μ
∈
R
,
{\displaystyle \mu \in \mathbb {R} ,}
σ
>
0
{\displaystyle \sigma >0}
Dominio
x
∈
(
0
,
∞
)
{\displaystyle x\in (0,\infty )}
Función de densidad (pdf)
1
x
σ
2
π
exp
(
−
(
ln
x
−
μ
)
2
2
σ
2
)
{\displaystyle {\frac {1}{x\sigma {\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)}
Función de distribución (cdf)
Φ
(
ln
(
x
)
−
μ
σ
)
{\displaystyle \Phi \left({\frac {\ln(x)-\mu }{\sigma }}\right)}
Media
exp
(
μ
+
σ
2
2
)
{\displaystyle \exp \left(\mu +{\frac {\sigma ^{2}}{2}}\right)}
Mediana
exp
(
μ
)
{\displaystyle \exp(\mu )}
Moda
exp
(
μ
−
σ
2
)
{\displaystyle \exp(\mu -\sigma ^{2})}
Varianza
e
2
μ
+
σ
2
(
e
σ
2
−
1
)
{\displaystyle e^{2\mu +\sigma ^{2}}\left(e^{\sigma ^{2}}-1\right)}
Coeficiente de simetría
(
e
σ
2
+
2
)
e
σ
2
−
1
{\displaystyle \left(e^{\sigma ^{2}}+2\right){\sqrt {e^{\sigma ^{2}}-1}}}
Entropía
log
2
(
σ
e
μ
+
1
2
2
π
)
{\displaystyle \log _{2}\left(\sigma e^{\mu +{\frac {1}{2}}}{\sqrt {2\pi }}\right)}
En probabilidad y estadística , la distribución normal logarítmica es una distribución de probabilidad continua de una variable aleatoria cuyo logaritmo está normalmente distribuido . Es decir, si
X
{\displaystyle X}
es una variable aleatoria con una distribución normal, entonces
exp
(
X
)
{\displaystyle \operatorname {exp} (X)}
tiene una distribución log-normal, es decir
e
X
∼
Lognormal
(
μ
x
,
σ
x
2
)
{\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu _{x},\sigma _{x}^{2})}
.
Log-normal también se escribe log normal o lognormal o distribución de Tinaut .
Una variable puede ser modelada como log-normal si puede ser considerada como un producto multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.
Una variable aleatoria positiva
X
{\displaystyle X}
tiene una distribución lognormal con parámetros
μ
{\displaystyle \mu }
y
σ
{\displaystyle \sigma }
y escribimos
X
∼
Lognormal
(
μ
,
σ
2
)
{\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})}
, si el logaritmo natural de
X
{\displaystyle X}
sigue una distribución normal con media
μ
{\displaystyle \mu }
y varianza
σ
2
{\displaystyle \sigma ^{2}}
, esto es
ln
(
X
)
∼
N
(
μ
,
σ
2
)
{\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})}
Sean
Φ
{\displaystyle \Phi }
y
ϕ
{\displaystyle \phi }
las funciones de distribución acumulada y de densidad de una normal estándar
N
(
0
,
1
)
{\displaystyle N(0,1)}
, entonces la función de densidad de probabilidad de la distribución log-normal está dada por:
f
X
(
x
)
=
d
d
x
P
[
X
≤
x
]
=
d
d
x
P
[
ln
(
X
)
≤
ln
(
x
)
]
=
d
d
x
Φ
(
ln
x
−
μ
σ
)
=
ϕ
(
ln
x
−
μ
σ
)
d
d
x
(
ln
x
−
μ
σ
)
=
ϕ
(
ln
x
−
μ
σ
)
1
σ
x
=
1
σ
x
2
π
exp
(
−
(
ln
x
−
μ
)
2
2
σ
2
)
{\displaystyle {\begin{aligned}f_{X}(x)&={\frac {d}{dx}}\operatorname {P} [X\leq x]={\frac {d}{dx}}\operatorname {P} [\ln(X)\leq \ln(x)]={\frac {d}{dx}}\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)\\&=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {d}{dx}}\left({\frac {\ln x-\mu }{\sigma }}\right)=\phi \left({\frac {\ln x-\mu }{\sigma }}\right){\frac {1}{\sigma x}}\\&={\frac {1}{\sigma x{\sqrt {2\pi }}}}\exp \left(-{\frac {(\ln x-\mu )^{2}}{2\sigma ^{2}}}\right)\end{aligned}}}
Función de Distribución[ editar ]
La función de distribución acumulada es
F
X
(
x
)
=
Φ
(
ln
x
−
μ
σ
)
{\displaystyle F_{X}(x)=\Phi \left({\frac {\ln x-\mu }{\sigma }}\right)}
donde
Φ
{\displaystyle \Phi }
es la función de distribución acumulada de una normal estándar
N
(
0
,
1
)
{\displaystyle N(0,1)}
.
La expresión anterior también puede ser escrita como
1
2
[
1
+
erf
(
ln
x
−
μ
σ
2
)
]
=
1
2
erfc
(
−
ln
x
−
μ
σ
2
)
{\displaystyle {\frac {1}{2}}\left[1+\operatorname {erf} \left({\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)\right]={\frac {1}{2}}\operatorname {erfc} \left(-{\frac {\ln x-\mu }{\sigma {\sqrt {2}}}}\right)}
Log-normal Multivariada [ editar ]
Si
X
∼
N
(
μ
,
Σ
)
{\displaystyle {\boldsymbol {X}}\sim N({\boldsymbol {\mu }},{\boldsymbol {\Sigma }})}
es una distribución normal multivariada entonces
Y
=
exp
(
X
)
{\displaystyle {\boldsymbol {Y}}=\exp({\boldsymbol {X}})}
tiene una distribución lognormal multivariante con media
E
[
Y
]
i
=
e
μ
i
+
1
2
Σ
i
i
{\displaystyle \operatorname {E} [{\boldsymbol {Y}}]_{i}=e^{\mu _{i}+{\frac {1}{2}}\Sigma _{ii}}}
y matriz de covarianza
Var
(
Y
)
i
j
=
e
μ
i
+
μ
j
1
2
(
Σ
i
i
+
Σ
j
j
)
(
e
Σ
i
j
−
1
)
{\displaystyle \operatorname {Var} ({\boldsymbol {Y}})_{ij}=e^{\mu _{i}+\mu _{j}{\frac {1}{2}}(\Sigma _{ii}+\Sigma _{jj})}\left(e^{\Sigma _{ij}}-1\right)}
Si
X
∼
Lognormal
(
μ
,
σ
2
)
{\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})}
entonces la variable aleatoria
X
{\displaystyle X}
cumple algunas propiedades.
La media de
X
{\displaystyle X}
es
E
[
X
]
=
e
μ
+
σ
2
2
{\displaystyle \mathrm {E} [X]=e^{\mu +{\frac {\sigma ^{2}}{2}}}}
La varianza de
X
{\displaystyle X}
es
Var
(
X
)
=
(
e
σ
2
−
1
)
e
2
μ
+
σ
2
{\displaystyle \operatorname {Var} (X)=\left(e^{\sigma ^{2}}-1\right)e^{2\mu +\sigma ^{2}}}
.
La distribución log-normal, la media geométrica , y la desviación estándar geométrica están relacionadas. En este caso, la media geométrica es igual a
exp
(
μ
)
{\displaystyle \exp(\mu )}
y la desviación estándar geométrica es igual a
exp
(
σ
)
{\displaystyle \exp(\sigma )}
.
Si una muestra de datos determina que proviene de una población distribuida siguiendo una distribución log-normal, la media geométrica de la desviación estándar geométrica puede utilizarse para estimar los intervalos de confianza tal como la media aritmética y la desviación estándar se usan para estimar los intervalos de confianza para un dato distribuido normalmente.
Límite de intervalo de confianza
log
geométrica
3σ límite inferior
μ
−
3
σ
{\displaystyle \mu -3\sigma }
μ
g
e
o
/
σ
g
e
o
3
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{3}}
2σ límite inferior
μ
−
2
σ
{\displaystyle \mu -2\sigma }
μ
g
e
o
/
σ
g
e
o
2
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }^{2}}
1σ límite inferior
μ
−
σ
{\displaystyle \mu -\sigma }
μ
g
e
o
/
σ
g
e
o
{\displaystyle \mu _{\mathrm {geo} }/\sigma _{\mathrm {geo} }}
1σ límite superior
μ
+
σ
{\displaystyle \mu +\sigma }
μ
g
e
o
σ
g
e
o
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }}
2σ límite superior
μ
+
2
σ
{\displaystyle \mu +2\sigma }
μ
g
e
o
σ
g
e
o
2
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{2}}
3σ límite superior
μ
+
3
σ
{\displaystyle \mu +3\sigma }
μ
g
e
o
σ
g
e
o
3
{\displaystyle \mu _{\mathrm {geo} }\sigma _{\mathrm {geo} }^{3}}
Donde la media geométrica
μ
g
e
o
=
exp
(
μ
)
{\displaystyle \mu _{\mathrm {geo} }=\exp(\mu )}
y la desviación estándar geométrica
σ
g
e
o
=
exp
(
σ
)
{\displaystyle \sigma _{\mathrm {geo} }=\exp(\sigma )}
Los primeros momentos son:
μ
1
=
e
μ
+
σ
2
/
2
{\displaystyle \mu _{1}=e^{\mu +\sigma ^{2}/2}}
μ
2
=
e
2
μ
+
4
σ
2
/
2
{\displaystyle \mu _{2}=e^{2\mu +4\sigma ^{2}/2}}
μ
3
=
e
3
μ
+
9
σ
2
/
2
{\displaystyle \mu _{3}=e^{3\mu +9\sigma ^{2}/2}}
μ
4
=
e
4
μ
+
16
σ
2
/
2
{\displaystyle \mu _{4}=e^{4\mu +16\sigma ^{2}/2}}
o de forma general:
μ
k
=
e
k
μ
+
k
2
σ
2
/
2
.
{\displaystyle \mu _{k}=e^{k\mu +k^{2}\sigma ^{2}/2}.}
Inferencia Estadística[ editar ]
Estimación de parámetros[ editar ]
Para determinar los estimadores por máxima verosimilitud de la distribución lognormal con parámetros
μ
{\displaystyle \mu }
y
σ
2
{\displaystyle \sigma ^{2}}
, podemos utilizar el mismo método que se utilizó para estimar los parámetros de una distribución normal . Notemos que
L
(
μ
,
σ
)
=
∏
i
=
1
n
1
x
i
φ
μ
,
σ
(
ln
x
i
)
{\displaystyle L(\mu ,\sigma )=\prod _{i=1}^{n}{\frac {1}{x_{i}}}\varphi _{\mu ,\sigma }(\ln x_{i})}
donde
φ
{\displaystyle \varphi }
denota la función de densidad de la distribución normal
N
(
μ
,
σ
2
)
{\displaystyle N(\mu ,\sigma ^{2})}
entonces la función logarítmica de verosimilitud es
L
(
x
1
,
x
2
,
.
.
.
,
x
n
;
μ
,
σ
)
=
−
∑
i
ln
x
i
+
L
N
(
ln
x
1
,
ln
x
2
,
.
.
.
,
ln
x
n
;
μ
,
σ
)
{\displaystyle {\mathcal {L}}(x_{1},x_{2},...,x_{n};\mu ,\sigma )=-\sum _{i}\ln x_{i}+{\mathcal {L}}_{N}(\ln x_{1},\ln x_{2},...,\ln x_{n};\mu ,\sigma )}
Dado que el primer término es constante respecto a
μ
{\displaystyle \mu }
y
σ
{\displaystyle \sigma }
, ambas funciones logarítmicas de verosimilitud,
L
{\displaystyle {\mathcal {L}}}
y
L
N
{\displaystyle {\mathcal {L}}_{N}}
, obtienen su máximo con el mismo
μ
{\displaystyle \mu }
y
σ
{\displaystyle \sigma }
, por lo tanto, utilizando los estimadores por máxima verosimilitud son idénticos a los de la distribución normal para observaciones
ln
x
1
,
ln
x
2
,
…
,
ln
x
n
{\displaystyle \ln x_{1},\ln x_{2},\dots ,\ln x_{n}}
μ
^
=
∑
k
ln
x
k
n
,
σ
2
^
=
∑
k
(
ln
x
k
−
μ
^
)
2
n
.
{\displaystyle {\widehat {\mu }}={\frac {\sum _{k}\ln x_{k}}{n}},\qquad {\widehat {\sigma ^{2}}}={\frac {\sum _{k}{\left(\ln x_{k}-{\widehat {\mu }}\right)^{2}}}{n}}.}
Para una
n
{\displaystyle n}
finita, estos estimadores son in sesgados.
Distribución log-normal ajustada a datos de lluvias máximas diarias por año.[ 1]
En la hidrología , se utiliza la distribución log-normal para analizar variables aleatorias como valores máximos de la precipitación y la descarga de ríos,[ 2] y además para describir épocas de sequía.[ 3]
La imagen azul ilustra un ejemplo del ajuste de la distribución log-normal a lluvias máximas diarias ordenadas, mostrando también la franja de 90% de confianza , basada en la distribución binomial . Las observaciones presentan los marcadores de posición , como parte del análisis de frecuencia acumulada .
Distribución relacionada[ editar ]
Si
X
∼
N
(
μ
,
σ
2
)
{\displaystyle X\sim \ N(\mu ,\sigma ^{2})}
es una distribución normal entonces
e
X
∼
Lognormal
(
μ
,
σ
2
)
{\displaystyle e^{X}\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})}
.
Si
X
∼
Lognormal
(
μ
,
σ
2
)
{\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})}
entonces
ln
(
X
)
∼
N
(
μ
,
σ
2
)
{\displaystyle \ln(X)\sim N(\mu ,\sigma ^{2})}
.
Si
X
m
∼
Lognormal
(
μ
,
σ
m
2
)
,
m
=
1...
n
¯
{\displaystyle X_{m}\sim \operatorname {Lognormal} (\mu ,\sigma _{m}^{2}),\ m={\overline {1...n}}}
son variables independentes log-normalmente distribuidas con el mismo parámetro μ y permitiendo que varíe σ, y
Y
=
∏
m
=
1
N
X
m
{\displaystyle Y=\prod _{m=1}^{N}X_{m}}
, entonces Y es una variable distribuida log-normalmente como:
Y
∼
Lognormal
(
μ
,
∑
m
σ
m
2
)
{\displaystyle Y\sim \operatorname {Lognormal} \left(\mu ,\sum _{m}\sigma _{m}^{2}\right)}
.
Si
X
∼
Lognormal
(
μ
,
σ
2
)
{\displaystyle X\sim \operatorname {Lognormal} (\mu ,\sigma ^{2})}
entonces
X
α
∼
Lognormal
(
α
μ
,
α
2
σ
2
)
{\displaystyle X^{\alpha }\sim \operatorname {Lognormal} (\alpha \mu ,\alpha ^{2}\sigma ^{2})}
para
α
≠
0
{\displaystyle \alpha \neq 0}
.
Se puede usar software o programa de computadora para el ajuste de una distribución de probabilidad , incluyendo la lognormal, a una serie de datos:
Easy fit Archivado el 23 de febrero de 2018 en Wayback Machine ., "data analysis & simulation"
MathWorks Benelux (enlace roto disponible en Internet Archive ; véase el historial , la primera versión y la última ).
ModelRisk , "risk modelling software"
Ricci distributions, fitting distrubutions with R , Vito Ricci, 2005
Risksolver, automatically fit distributions and parameters to samples
StatSoft distribution fitting Archivado el 30 de agosto de 2012 en Wayback Machine .
CumFreq [2] , libre sin costo, incluye la distribución normal, la lognormal , raíz-normal, cuadrado-normal, e intervalos de confianza a base de la distribución binomial
Calculadora Distribución log-normal
↑ CumFreq, software for cumulative frequency analysis and probability distribution fitting [1]
↑ Oosterbaan, R.J. (1994). «Chapter 6 Frequency and Regression Analysis» . En Ritzema, H.P., ed. Drainage Principles and Applications, Publication 16 . Wageningen, The Netherlands: International Institute for Land Reclamation and Improvement (ILRI). pp. 175-224. ISBN 90-70754-33-9 .
↑ Burke, Eleanor J.; Perry, Richard H.J.; Brown, Simon J. (2010). «An extreme value analysis of UK drought and projections of change in the future». Journal of Hydrology 388 : 131. doi :10.1016/j.jhydrol.2010.04.035 .