Raíz del error cuadrático medio

De Wikipedia, la enciclopedia libre

La raíz del error cuadrático medio (RECM) o raíz de la desviación cuadrática media (RDCM) (en inglés: root-mean-square deviation, RMSD, o root-mean-square error, RMSE) es una medida de uso frecuente de las diferencias entre los valores (valores de muestra o de población) predichos por un modelo o un estimador y los valores observados. La RECM representa la raíz cuadrada del segundo momento de la muestra de las diferencias entre los valores previstos y los valores observados o la media cuadrática de estas diferencias. Estas desviaciones se denominan residuos cuando los cálculos se realizan sobre la muestra de datos que se utilizó para la estimación y se denominan errores (o errores de predicción) cuando se calculan fuera de la muestra. La RECM sirve para agregar las magnitudes de los errores en las predicciones para varias veces en una sola medida de poder predictivo. La RECM es una medida de precisión, para comparar errores de predicción de diferentes modelos para un conjunto de datos en particular y no entre conjuntos de datos, ya que depende de la escala.[1]

La RECM es siempre no negativa, y un valor de 0 (casi nunca alcanzado en la práctica) indicaría un ajuste perfecto a los datos. En general, una RECM más baja es mejor que una más alta. Sin embargo, las comparaciones entre diferentes tipos de datos no serían válidas porque la medida depende de la escala de los números utilizados.

La RECM es la raíz cuadrada del promedio de errores cuadrados. El efecto de cada error en la RECM es proporcional al tamaño del error cuadrado; por lo tanto, los errores mayores tienen un efecto desproporcionadamente grande en la RECM. Por lo tanto, la RECM es sensible a los valores atípicos.[2][3]

Fórmula[editar]

La RECM de un estimador con respecto al parámetro estimado , se define como la raíz cuadrada del error cuadrático medio:

Para un estimador insesgado, la RECM es la raíz cuadrada de la varianza, conocida como desviación estándar.

La RECM de los valores predichos para t veces la regresión de la variable dependiente , con variables observadas T veces, se calcula para T diferentes predicciones como la raíz cuadrada de la media de los cuadrados de las desviaciones:

(Para las regresiones sobre datos transversales, el subíndice t se sustituye por i y T se sustituye por n.)

En algunas disciplinas, la RECM se utiliza para comparar diferencias entre dos cosas que pueden variar, ninguna de las cuales se acepta como "estándar". Por ejemplo, cuando se mide la diferencia media entre dos series de tiempo y , la fórmula es:

Referencias[editar]

  1. Hyndman, Rob J.; Koehler, Anne B. (2006). «Another look at measures of forecast accuracy». International Journal of Forecasting 22 (4): 679-688. doi:10.1016/j.ijforecast.2006.03.001.  Parámetro desconocido |citeseerx= ignorado (ayuda)
  2. Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). «Components of information for multiple resolution comparison between maps that share a real variable». Environmental Ecological Statistics 15 (2): 111-142. doi:10.1007/s10651-007-0043-y. 
  3. Willmott, Cort; Matsuura, Kenji (2006). «On the use of dimensioned measures of error to evaluate the performance of spatial interpolators». International Journal of Geographic Information Science 20: 89-102. doi:10.1080/13658810500286976.