Transformación de datos

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, la transformación de datos se efectúa para asegurarse así de que tienen una distribución normal (un remedio para los valores atípicos, fallas de la normalidad, la linealidad, y homocedasticidad), lo que normalmente se hace para preparar los datos para el análisis de regresión,[1] ya que este análisis asume los datos son lineales, normales y homoscedásticos. Esto también se conoce como la transformación de la linealidad. Un buen indicador de los datos con una distribución normal es el sesgo en el rango de -0,8 a 0,8 y curtosis en el rango de -3,0 a 3,0.

Pequeñas muestras de una de población con valores atípicos son un problema, porque los intervalos de confianza que producen a menudo están fuera de centro y son muy estrechos. El intervalo de confianza será mayor que la tasa de captura de estos intervalos. Si el tamaño de la muestra es demasiado pequeña o los datos están sesgados se puede intentar una de estas transformaciones: logarítmica, raíz cuadrada o inversa.

Referencias[editar]

  1. Swift, Ronald S. (2002). Cómo mejorar las relaciones con los clientes. Pearson Educación. p. 172. ISBN 9702601924.