Análisis web

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

El análisis web es un conjunto de técnicas relacionadas con el análisis de datos relativos al tráfico en un sitio web con el objetivo de entender su tráfico como punto de partida para optimizar diversos aspectos del mismo.

Existen dos categorías de análisis web: off-site y on-site. Los análisis web off-site hacen referencia a mediciones web y análisis independientes de si se es el dueño del sitio web o se le da mantenimiento. Esto incluye la medición de la audiencia potencial (oportunidad), participación de voz (visibilidad) y zumbidos (comentarios) de acerca de lo que está pasando en Internet como un todo.

Los análisis web on-site miden la ruta de un visitante una vez que se ingresa a un sitio de internet de propiedad de la persona que realiza el análisis. Esto incluye conversiones; por ejemplo qué páginas de llegada alientan a las personas a hacer una compra. Las mediciones de análisis web on-site comparan indicadores de desempeño clave y lo usan para mejorar un sitio web o la respuesta de la audiencia frente a una campaña de mercadeo.

Históricamente, el análisis web ha hecho referencia a la medición de visitantes on-site. Sin embargo, en años recientes se ha producido la convergencia de ambos aspectos, principalmente debido a que los vendedores están produciendo herramientas que abarquen ambas categorías.

Fuentes de información[editar]

Las fuentes de información de Web Analytics son:

  1. Herramientas de Web Analytics.
  2. Servidores de Publicidad online.
  3. Herramientas de mercadeo por correo electrónico (envío masivo de correos electrónicos).
  4. Bases de datos corporativas, de clientes, proveedores, etc.

Herramientas[editar]

Las herramientas de análisis web son las encargadas de capturar y procesar la información del sitio web, para proveer información sobre el comportamiento de los usuarios en el sitio: el sitio del que proceden, qué hacen en el sitio, por qué páginas navegan, durante cuánto tiempo, cuántas veces revisitan el sitio, de que país son, qué tipo de conexión de internet tienen, en qué punto abandonan el sitio, en qué paso de un proceso de alta desisten, etc.

Las herramientas de Web Analytics pueden basarse en diferentes plataformas tecnológicas:

Analizadores de ficheros de logs[editar]

Son programas que analizan los logs de los servidores proporcionando información sobre “quién”, “cuándo” y “cómo” los visita. Sus principales ventajas son:

  • Los servidores siempre producen ficheros de logs, con lo que la información está siempre disponible.
  • Los servidores capturan la totalidad de los accesos al sitio.
  • La información normalmente reside en los propios servidores y tiene un formato estandarizado. Esto facilita la migración de unas herramientas a otras.
  • Los ficheros de logs almacenan información sobre las peticiones fallidas, mientras que con otras técnicas, ésta se pierde.

Etiquetado de páginas[editar]

Este método, más reciente que el anterior, está basado en la incorporación de un script a cada una de las páginas de un sitio. Cada vez que una página es visitada, este script se comunica con una base de datos a la que comunica la impresión de la página junto con, potencialmente, datos adicionales procedentes de las cookies. Esta técnica cuenta con las siguientes ventajas:

  • Potencialmente, puede capturarse información no disponible en los ficheros de logs e, incluso, modificarla sin más que cambiar los scripts.
  • El etiquetado de páginas puede realizarse aun en casos en que los dueños del sitio no dispongan acceso (por estar alojado en servidores ajenos, por ejemplo) a los logs del servidor.

Sistemas híbridos[editar]

Algunas empresas han desarrollado soluciones que combinan ambas soluciones agregándose las ventajas individuales de las mismas.

Packet Sniffing[editar]

El “Packet sniffer” se agrega entre la computadora del usuario y el servidor del sitio por ello tiene una capacidad de captura de información óptima, capturando toda información que se genere, siendo esta una Page View o no.

Ventajas[editar]

La principal ventaja de packet sniffing en cuanto a la recolección de datos es el hecho de que toda la información es capturada, se haya generado o no una Pageview, se haya completado la descarga del contenido o no.

  • Alta performance.
  • Escalabilidad.
  • Fácil implementación.
  • No hay que setear nada para analizar el clickstream.

Factores económicos[editar]

El análisis de los ficheros de logs suele realizarse internamente. La adquisición del software necesario exige un desembolso único inicial, aunque existen también excelentes analizadores gratuitos.

Sin embargo, el análisis de los datos procedentes del etiquetado de las páginas suele (subcontratarse) a empresas que pueden exigir pagos periódicos dependiendo del nivel de servicio.

La alternativa más adecuada depende del conocimiento técnico interno del propietario del sitio, de la profundidad del análisis que requiera, del proveedor, el volumen de tráfico, etc.

Definiciones clave[editar]

No hay definiciones aprobadas globalmente acerca de los análisis web aun cuando los organismos de la industria han estado tratando de concordar definiciones que sean útiles y definitivas por algún tiempo. Las principales organizaciones que han brindado aportes en esta área han sido Jicwebs(Industry Committee for Web Standards)/ABCe (Auditing Bureau of Circulations electronic, UK and Europe), WAA (Web Analytics Association, US) y en una menor proporción IAB (Interactive Advertising Bureau). Esto no evita que la siguiente lista sea una guía útil, sufriendo sólo de un poco de ambigüedad. Ambos, WAA y los ABCe proporcionan más listas definitivas para aquellos que están declarando sus estadísticas usando las métricas definidas por alguno de ellos.

  • Hit: Una petición de un archivo hacia el servidor web. Está disponible sólo en logs de análisis. El número de hits recibidos por un sitio web es citado frecuentemente para deducir su popularidad, pero este número es extremadamente engañoso y sobrestima dramáticamente la popularidad. Una sola página web generalmente consiste en múltiples (a veces docenas) de archivos, cada uno de los cuales es contado como un hit aun cuando una sola página es descargada, por lo cual el número de hits es realmente un número arbitrario más que refleja la complejidad de páginas individuales en el sitio web que la popularidad real del sitio web. El número total de visitantes o páginas vistas proporciona una apreciación más realista y precisa de popularidad.
  • Página vista: Una petición por un archivo cuyo tipo es definido como una página en el log de análisis. En dicho log, la vista de una sola página puede generar múltiples hits así como todos los recursos requeridos para ver la página (imágenes, archivos .js y .css) también son solicitados por el servidor web.
  • Visita / Sesión: Una serie de peticiones del mismo cliente identificado de manera única en un rango de tiempo, a veces 30 minutos. Un visitante contiene una o más páginas vistas.
  • Primera visita / Primera sesión: Una visita de un usuario que no ha ingresado al sitio con anterioridad.
  • Visitante / Visitante único / Usuario único: El cliente identificado de manera única generando peticiones hacia el sitio web (log de análisis) o viendo páginas (etiquetado de páginas) en un período determinado (por ejemplo, dia, semana o mes). Un visitante único cuenta una sola vez en la escala de tiempo. Un visitante puede hacer múltiples visitas. La identificación se hace respecto de la computadora del visitante, no la persona, generalmente vía cookies y/o IP+User Agent. Es por ello que la misma persona visitando desde dos computadoras distintas contará como dos visitantes únicos.
  • Visitante repetido: Un visitante que ha llegado al sitio en una oportunidad anterior. El periodo entre su última visita y la actual es medido en días.
  • Nuevo visitante: Un visitante que no ha hecho visita previa alguna. Esta definición crea un cierto nivel de confusión, y es a veces sustituido con análisis de primeras visitas.
  • Impresión: Es cada vez que un anuncio carga en la pantalla de un usuario. Cada vez que uno ve un aviso, eso es una impresión.
  • Singleton: El número de visitas donde sólo una página es vista. Mientras que esto no es una métrica útil por sí mismo, el número de singletons es indicador de varias formas de fraude de clics así como es siendo usado para calcular la tasa de abandonos y en algunos casos para identificar robots autómatas.
  • Tasa de abandono: El porcentaje de visitas donde el visitante ingresa y sale en la misma página sin visitar otras páginas en el sitio.
  • Porcentaje de salida: El porcentaje de usuarios que salen de una página.
  • Tiempo de visibilidad: El tiempo en que en una sola página (o un blog, o anuncio publicitario) es visto.
  • Duración de la sesión: Cantidad promedio de tiempo que los visitantes pasan en el sitio cada vez que ellos lo visitan. Esta métrica puede ser complicada por el hecho de que los programas de análisis no pueden medir la duración de la vista de la última página.
  • Duración de la vista de página / Tiempo en página: Cantidad de tiempo promedio que los visitantes pasan en cada página del sitio. Así como ocurre con la duración de la sesión, esta métrica es complicada por el hecho de que los programas de análisis no pueden medir la duración de la vista de la última página.
  • Profundidad de página / Páginas vistas por sesión: La profundidad de la página es el número promedio de páginas vistas que un visitante consume antes de terminar su sesión. Es calculando dividiendo el número total de páginas vistas entre el número total de sesiones, y es llamado también páginas vistas por sesión.
  • Frecuencia / Sesión única - La frecuencia mide cuán seguido los visitantes llegan a un sitio. Es calculado dividiendo el número total de sesiones (o visitas) entre el número total de visitantes únicos. A veces es usado para medir la lealtad de la audiencia.
  • Ruta de clics - La secuencia de hiperenlaces que uno o más visitantes del sitio web siguen en un sitio dado.

Enlaces externos[editar]