Diferencia entre revisiones de «Criterio de información de Akaike»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Ivanpares (discusión · contribs.)
Sin resumen de edición
Ivanpares (discusión · contribs.)
Línea 13: Línea 13:


Dado un conjunto de modelos candidatos para los datos, el modelo preferido es el que tiene el valor mínimo AIC. Por lo tanto AIC no sólo recompensas bondad de ajuste, pero también incluye un penalti, que es una función creciente del número de parámetros estimados. Esta penalización desalienta overfitting (aumentando el número de parámetros libres en el modelo mejora la bondad del ajuste, sin importar el número de parámetros libres en el proceso de generación de datos).
Dado un conjunto de modelos candidatos para los datos, el modelo preferido es el que tiene el valor mínimo AIC. Por lo tanto AIC no sólo recompensas bondad de ajuste, pero también incluye un penalti, que es una función creciente del número de parámetros estimados. Esta penalización desalienta overfitting (aumentando el número de parámetros libres en el modelo mejora la bondad del ajuste, sin importar el número de parámetros libres en el proceso de generación de datos).

== Referencia ==
<references/>
*{{Citation |first=Hirotugu |last=Akaike |authorlink=Hirotugu Akaike |year=1974 |title=A new look at the statistical model identification |journal=IEEE Transactions on Automatic Control |volume=19 |issue=6 |pages=716–723 |doi=10.1109/TAC.1974.1100705 |mr=0423716 }}.
*{{Citation |last=Akaike |first=Hirotugu |authorlink=Hirotugu Akaike |year=1980 |chapter=Likelihood and the Bayes procedure |title=Bayesian Statistics |editor-first=J. M. |editor-last=Bernardo |editorlink=José-Miguel Bernardo |editor2=et al. |location=Valencia |publisher=University Press |pages=143–166 |isbn= }}.
*{{Citation |last=Anderson |first=D. R. |year=2008 |title=Model Based Inference in the Life Sciences |publisher=Springer |isbn= }}.
*{{Citation |last=Brockwell |first=Peter J. |last2=Davis |first2=Richard A. |year=1987 |title=Time Series: Theory and Methods |edition= |publisher=Springer |isbn=0387964061 }}.
*{{Citation |last=Brockwell |first=Peter J. |last2=Davis |first2=Richard A. |year=1991 |title=Time Series: Theory and Methods |edition=2nd |publisher=Springer |isbn=0387974296 }}. &nbsp; Republished in 2009: ISBN 1441903194
*{{Citation |last=Burnham |first=K. P. |last2=Anderson |first2=D. R. |year=2002 |title=Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach |edition=2nd |publisher=Springer-Verlag |isbn=0-387-95364-7 }}.
*{{Citation |last=Burnham |first=K. P. |last2=Anderson |first2=D. R. |year=2004 |url=http://www.sortie-nd.org/lme/Statistical%20Papers/Burnham_and_Anderson_2004_Multimodel_Inference.pdf |title=Multimodel inference: understanding AIC and BIC in Model Selection |journal=Sociological Methods and Research |issn= |publisher= |volume=33 |issue= |pages=261–304 |doi= }}.
*{{Citation |last=Cavanaugh |first=J. E. |year=1997 |title=Unifying the derivations of the Akaike and corrected Akaike information criteria |journal=Statistics and Probability Letters |volume=31 |issue= |pages=201–208 |doi= }}.
*{{Citation |last=Claeskens |first=G. |first2=N. L. |last2=Hjort |year=2008 |title=Model Selection and Model Averaging |publisher=Cambridge |isbn= }}.
*Fang, Yixin (2011). "[http://www.jds-online.com/file_download/278/JDS-652a.pdf Asymptotic equivalence between cross-validations and Akaike Information Criteria in mixed-effects models]", ''Journal of Data Science'', 9:15-21.
*{{Citation |last=Hurvich |first=C. M. |last2=Tsai |first2=C.-L. |year=1989 |title=Regression and time series model selection in small samples |journal=[[Biometrika]] |issn= |volume=76 |issue= |pages=297–307 |doi= }}.
*Lukacs, P.M., et al. (2007). "Concerns regarding a call for pluralism of information theory and hypothesis testing", ''Journal of Applied Ecology'', 44:456–460. {{doi|10.1111/j.1365-2664.2006.01267.x}}.
*{{Citation |last=McQuarrie |first=A. D. R. |last2=Tsai |first2=C.-L. |year=1998 |title=Regression and Time Series Model Selection |publisher=World Scientific |isbn=981-02-3242-X }}.
*{{Citation |last=Sugiura |first=N. |year=1978 |title=Further analysis of the data by Akaike’s information criterion and the finite corrections |journal=[[Communications in Statistics]] - Theory and Methods |volume=A7 |issue= |pages=13–26 |doi= }}.
*{{Citation |last=Takeuchi |first=K. |year=1976 |title=??? |language=Japanese |trans_chapter=Distribution of informational statistics and a criterion of model fitting |journal=Suri-Kagaku (Mathematical Sciences) |volume=153 |issue= |pages=12–18 |doi= }}.
*{{Citation |last=Yang |first=Y. |year=2005 |title=Can the strengths of AIC and BIC be shared? |journal=Biometrika |issn= |volume=92 |issue= |pages=937–950 |doi= }}.

Revisión del 03:03 27 jul 2013

El criterio de información de Akaike (AIC) es una medida de la calidad relativa de un modelo estadístico, para un conjunto dado de datos. Como tal, el AIC proporciona un medio para la selección del modelo.

AIC maneja un trade-off entre la bondad de ajuste del modelo y la complejidad del modelo. Se basa en la entropía de información: se ofrece una estimación relativa de la información perdida cuando se utiliza un modelo determinado para representar el proceso que genera los datos.

AIC no proporciona una prueba de un modelo en el sentido de probar una hipótesis nula , es decir AIC puede decir nada acerca de la calidad del modelo en un sentido absoluto. Si todos los modelos candidatos encajan mal, AIC no dará ningún aviso de ello.

Definición

En el caso general, la AIC es

donde k es el número de parámetros en el modelo estadístico , y L es el máximo valor de la función de probabilidad para el modelo estimado.

Dado un conjunto de modelos candidatos para los datos, el modelo preferido es el que tiene el valor mínimo AIC. Por lo tanto AIC no sólo recompensas bondad de ajuste, pero también incluye un penalti, que es una función creciente del número de parámetros estimados. Esta penalización desalienta overfitting (aumentando el número de parámetros libres en el modelo mejora la bondad del ajuste, sin importar el número de parámetros libres en el proceso de generación de datos).

Referencia

  • Akaike, Hirotugu (1974), «A new look at the statistical model identification», IEEE Transactions on Automatic Control 19 (6): 716-723, MR 0423716, doi:10.1109/TAC.1974.1100705 ..
  • Akaike, Hirotugu (1980), «Likelihood and the Bayes procedure», en Bernardo, J. M.; et al., eds., Bayesian Statistics, Valencia: University Press, pp. 143-166 ..
  • Anderson, D. R. (2008), Model Based Inference in the Life Sciences, Springer ..
  • Brockwell, Peter J.; Davis, Richard A. (1987), Time Series: Theory and Methods, Springer, ISBN 0387964061 ..
  • Brockwell, Peter J.; Davis, Richard A. (1991), Time Series: Theory and Methods (2nd edición), Springer, ISBN 0387974296 ..   Republished in 2009: ISBN 1441903194
  • Burnham, K. P.; Anderson, D. R. (2002), Model Selection and Multimodel Inference: A Practical Information-Theoretic Approach (2nd edición), Springer-Verlag, ISBN 0-387-95364-7 ..
  • Burnham, K. P.; Anderson, D. R. (2004), «Multimodel inference: understanding AIC and BIC in Model Selection», Sociological Methods and Research 33: 261-304 ..
  • Cavanaugh, J. E. (1997), «Unifying the derivations of the Akaike and corrected Akaike information criteria», Statistics and Probability Letters 31: 201-208 ..
  • Claeskens, G.; Hjort, N. L. (2008), Model Selection and Model Averaging, Cambridge ..
  • Fang, Yixin (2011). "Asymptotic equivalence between cross-validations and Akaike Information Criteria in mixed-effects models", Journal of Data Science, 9:15-21.
  • Hurvich, C. M.; Tsai, C.-L. (1989), «Regression and time series model selection in small samples», Biometrika 76: 297-307 ..
  • Lukacs, P.M., et al. (2007). "Concerns regarding a call for pluralism of information theory and hypothesis testing", Journal of Applied Ecology, 44:456–460. doi 10.1111/j.1365-2664.2006.01267.x.
  • McQuarrie, A. D. R.; Tsai, C.-L. (1998), Regression and Time Series Model Selection, World Scientific, ISBN 981-02-3242-X ..
  • Sugiura, N. (1978), «Further analysis of the data by Akaike’s information criterion and the finite corrections», Communications in Statistics - Theory and Methods, A7: 13-26 ..
  • Takeuchi, K. (1976), «???», Suri-Kagaku (Mathematical Sciences) (en japanese) 153: 12-18 ..
  • Yang, Y. (2005), «Can the strengths of AIC and BIC be shared?», Biometrika 92: 937-950 ..