Proxy (estadística)

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En estadística, una variable proxy es algo que de por sí no tiene gran interés, pero de la cual se pueden obtener otras de mucho interés. Para que esto sea posible, la variable proxy debe poseer una fuerte correlación, pero no necesariamente lineal o positiva, con el valor inferido. No tiene ningún valor si los datos no se ajustan a alguna relación (los datos se representan en una nube de certidumbre).

Ejemplos[editar]

El Producto Interno Bruto per cápita se usa con frecuencia como un proxy de medida del nivel de vida o de la calidad de vida.

Cuando se procesan recolecciones de datos sociales, el género del encuestado es una variable importante. Como el género comúnmente dicta como uno responde, la lectura de los muestreos generales, hacen hincapié sobre los datos en sexo y edad de los encuestados, y se usan como un proxy para género. En muchas encuestas generales, la proporción de individuos transexuales y de transgéneros es baja, haciendo a la muestra y a la correlación razonablemente buena.

También, el país originario o lugar de nacimiento puede llegar a usarse como un proxy en clasificación de humanos o razas.

Véase también[editar]

Referencias[editar]

  • Trenkler, Götz; Peter Stahlecker (1996). «Dropping variables vs. use of proxy variables in linear regression». Journal of Statistical Planning and Inference (NORTH-HOLLAND) 50 (1):  pp. 65–75. doi:10.1016/0378-3758(95)00045-3.