Visualización de datos

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

La visualización de datos (data visualization, en inglés) es el proceso de búsqueda, interpretación, contrastación y comparación de datos que permite un conocimiento en profundidad y detalle de los mismos de tal forma que se transformen en información comprensible para el usuario.

Este término surgió a raíz del nacimiento de la web 2.0, en la que la abundancia de datos provoca complejidad en su búsqueda e interpretación, lo que da lugar a la necesidad de un mecanismo que permita facilitar la comprensión y asimilación de la información. Esto se debe a que en la actualidad los procedimientos que engloban la visualización de datos son varios. En primer lugar es necesario analizar los datos para compendiar aquellos útiles para el conocimiento del tema y descartar los inconexos. En segundo lugar es necesario interpretar los datos seleccionados de tal forma que sean comprensibles de forma exacta y detallada. Antes de continuar es imprescindible contrastar estos datos con otros vinculados y estudiar todos ellos para no cometer errores y saber discernir los verdaderamente significativos para lograr el fin último, es decir, facilitar la comprensión del usuario. El último paso en este proceso es saber comunicar la información obtenida, de tal forma que el usuario adquiera los conocimientos necesarios para comprender correctamente los datos facilitados. Para conseguir este fin, el propio creador de la visualización debe tener muy clara la información que desea comunicar, para que le resulte más sencillo transmitírsela a otras personas a través de las observaciones y cotejos oportunos de los datos constituyentes de la visualización.

Utilidad de la visualización de datos[editar]

La visualización es una herramienta para ayudar al análisis y no un sustituto de la habilidad analítica. Tampoco es un sustituto de las estadísticas, es más, el gráfico puede resaltar las diferencias o correlaciones entre los puntos de datos. Disponer de una buena herramienta no es suficiente; como indica Enrique Rodríguez también es necesario que se disponga de conocimientos de negocio, estadística, teoría del color, composición gráfica, story-telling e inteligencia emocional.

Las visualizaciones de datos, y más si estas se basan en herramientas gratuitas online con plantillas, no hacen todo el trabajo de forma automática. El éxito de una visualización se basa, entre otras variables, en la comprensión de nuestros datos que por lo general requiere una combinación de habilidades de análisis, estadística y experiencia en la limpieza de datos. No hay todavía un perfil determinado de visualizadores de datos; hoy en día encontramos desde diseñadores hasta ingenieros, pasando por psicólogos, periodistas y profesionales de la comunicación y el marketing en general.

Según Pere Rovira, la visualización de datos nos ayuda a elaborar mejores cuadros de mando, y en general a comunicar el significado de los datos de la manera más adecuada para cada interlocutor. Así mismo, en ámbitos como las redes sociales, donde se tratan grandes cantidades de datos, cree que esta visualización nos ayuda a generar conocimiento.

Las formas de presentar los datos son muy diversas; los gráficos clásicos son los siguientes:[1]

  • Tabla: sirven para mostrar números, siempre se pueden trabajar y hacerlas más fáciles de descodificar a primera vista (con colores, explicación previa).
  • Gráfico de Barra: un gráfico de barra o columna hace énfasis en la comparación entre elementos en un período de tiempo específico.
  • Gráficos de Línea: un gráfico de línea muestra las relaciones de los cambios en los datos en un período de tiempo.
  • Gráfico Circular: también conocido como pie en inglés. Se utiliza para mostrar cómo diferentes partes representan un total.
  • Gráficos de Dispersión: los gráficos de Dispersión o Scatter Plot son útiles para mostrar la relación entre diferentes puntos de datos. Este tipo de gráfico utiliza valores numéricos para ambos ejes en lugar de utilizar categorías en alguno de los ejes como en los gráficos anteriores.
  • Gráfico de Burbujas: un gráfico de Burbujas o Bubble chart es una variación de un gráfico de dispersión en el que los puntos de datos se reemplazan por burbujas y el tamaño de las burbujas representa una dimensión adicional de los datos.
  • Treemap: consiste en un tipo de representación gráfica de datos jerárquicos en forma de rectángulos que ocupan el total del espacio de forma proporcional al valor de una variable.
  • Gráficos Sociales: un gráfico social es como un mapa global que muestra con quién se relacionan las personas. Estos gráficos constan de nodos (personas) y flechas (relaciones) que conectan los nodos.
  • Palabras: puedes utilizar nubes de palabras o tags para analizar y descubrir tendencias.
  • Infografías: las infografías son más elaboradas y buenas cuando se utiliza los datos para compartir información, difundirla y generar discusión, sobre todo con el objetivo de generar tráfico y enlaces para un sitio web.

Herramientas[editar]

Existen multitud de herramientas útiles para llevar a cabo el proceso de visualización de datos. Entre ellas, se pueden destacar las siguientes:

LightningChart[editar]

LightningChart es un complemento para Microsoft Visual Studio,[2] se utiliza para implementar visualizaciones de datos en aplicaciones desarrolladas en WPF y Windows Forms. Popular por su fluidez,[3] soporta gráficos con más de mil millones de puntos de datos al mismo tiempo, actualizados en tiempo real.[4] Posee una librería con más de 100 tipos de gráficos diferentes y personalizables, en 2D y 3D. Sus componentes para la visualización de datos son utilizados en programas y aparatos en todo tipo de campos e industrias.[5]

SAS Visual Analytics[editar]

SAS Visual Analytics proporciona mayores capacidades analíticas a partir de cualquier cantidad de datos, permitiendo llevar a cabo análisis de datos exploratorios. Sin necesidad de crear subconjuntos o muestras de datos. Gracias a sus funciones high-performance, puede utilizar todos sus datos, volúmenes grandes o pequeños, para obtener conocimientos precisos de forma mucho más rápida de lo que era posible hasta ahora.

Tableau[editar]

Tableau Software es una de las herramientas de visualización de datos más utilizadas actualmente por los usuarios, debido en esencia a la facilidad de uso de todas sus funciones. Aunque en principio existe una versión de pago, se pude utilizar también de forma gratuita obteniendo gráficos profesionales sin la necesidad de pagar, pero con limitaciones a la hora de introducir un exceso de datos. Debido a la sencillez y rapidez de manejo, la hace accesible a todo el mundo sin la necesidad de dominar la programación. Por todo esto se la considera la herramienta líder de visualización de datos

Permite crear informes, tableros de control y gráficos de diferentes tipos y formas que se van cambiando en tiempo real, a medida que vas introduciendo los datos. También, nos da la posibilidad de añadir información extra, como inserción de documentos o sitios web, que acompañarán a los datos.[6] [7]

QlikView[editar]

Al igual que Tableau, QlikView es bastante fácil de manejar y permite utilizar e introducir gran cantidad de datos, que pueden proceder de diferentes formatos. Una vez introducidos se pueden manipular y organizar libremente según como se quieran presentar, para conseguir el objetivo final, que es obtener una forma atractiva de visualizar cantidades de datos. Entre sus características más destacadas está la de poseer los datos integrados en el propio cuadro de mandos, posibilitando trabajar con ellos sin la necesidad de estar conectado al origen de donde proceden. Uno de los puntos fuertes de QlikView es que no es necesario dominar la herramienta, al ser bastante intuitiva.

Gephi[editar]

Es un programa de código abierto[8] para la visualización y consulta de grafos. Además, Gephi permite manejar grafos grandes con buena calidad, algo no común en este tipo de herramientas. Gephi[9] da la posibilidad al usuario de agrupar nodos del grafo, colorearlos, dotarlos de tamaños proporcionales a indicadores, etc. Su objetivo principal es ayudar a los analistas de datos a hacer hipótesis, aislar estructuras de datos o descubrir patrones de una forma intuitiva. Entre sus características, incluye el análisis dinámico de datos, la creación de cartografía y el uso de métricas preestablecidas.

Finalmente, se pueden exportar los resultados vía PDF o SVG, este último con la posibilidad de ser reusado en otro software con la finalidad que se prefiera. Si se necesita alguna característica adicional, se puede hacer uso de Plugins, como si se tratara de un navegador.

Many Eyes[editar]

Es una herramienta gratuita[10] creada por la empresa IBM que ofrece 2 posibilidades: navegar entre datos ya existentes o usar los creados por uno mismo. Many Eyes[11] permite la conversación alrededor de una visualización, es decir, los usuarios pueden aportar sus opiniones sobre los gráficos y proponer otros enfoques a partir de los mismos datos. Con esto se consigue enriquecer al máximo el contenido y sacar provecho a los datos para poder entenderlos de la mejor manera posible. Otro aspecto interesante de esta aplicación es su ámbito público, ya que no se puede utilizar de forma privada. El procedimiento es muy sencillo, ya que se basa en subir los datos y elegir un tipo de visualización. Después el sistema realiza sus cálculos y ofrece los resultados.

Google Fusion Table[editar]

Es una aplicación web de visualización de datos experimentales para recoger, visualizar y compartir tablas de datos. Se trata de un servicio web proporcionado por google desde 2009 para la gestión de datos o Mapeo Web, que permite el almacenamiento de datos en tablas visibles y descargables entre los usuarios de Internet -exportados en formato de archivo-, a través de gráficos circulares, gráficos de barras, diagramas de dispersión, líneas de tiempo, y mapas geográficos (Google Maps). The Guardian aplica Fusion Tables en El DataBlog Guardián, y para producir visualizaciones utilizando el API, por lo que ha recibido el premio de Periodismo en Línea en Reino Unido. Otros medios que aplican Fusion Tables son el Palm Beach Post en Florida, el Texas Tribune, y el LA Times en California.

Quadrigram[12] [13] [14] [15] [editar]

Es un software de programación visual que se ejecuta en el propio navegador, que permite construir y compartir de manera sencilla proyectos interactivos de visualización de datos mediante un sistema de módulos interconectados, aplicando una operación o un control al flujo de datos de cada módulo, que permite personalizar, iterar y prototipar soluciones interactivas basadas en datos extraídos de procesos de análisis. La aplicación contiene una colección de ejemplos de plantillas predesarrolladas para monitorizar, analizar, investigar y comunicar con datos, fácilmente transformables en un proyecto personalizado para analizar datos. Se pueden crear visualizaciones de datos interactivas y combinables, eligiendo entre un amplio abanico de herramientas. El programa cuenta con más de 50 tipos de gráficos interactivos, desde barras hasta sistemas más complejos de árboles o pictogramas. El uso de plantillas de gráfico, texto e imagen también permite publicar el trabajo de forma sencilla como una página web o en el propio servidor de Quadrigram. Además, la plataforma permite exportar y descargar los proyectos como código fuente original, para después editar libremente y subir a servidores, y ofrece cuentas para diversos tipos de usuarios, pudiéndose probar gratis durante un mes.

Nodebox[16] [17] [18] [editar]

Es una herramienta de código abierto para el sistema operativo Mac OS X. Esta aplicación está diseñada para crear gráficos en 2D, tanto estáticos como dinámicos. Nodebox utiliza el código de programación Python lo que puede ser una desventaja frente a otros programas por tener que conocer dicho código. Su gran capacidad te permite trabajar con gran cantidad de datos. Además, sus archivos se pueden exportar a diferentes tipos de formatos, como PDF o a película QuickTime. Los documentos de Nodebox se crean gracias a nodos conectados entre sí.

R[19] [20] [editar]

Es una herramienta estadística de código abierto desarrollada por los Laboratorios Bell. Se ejecuta en variedad de plataformas como Mac, UNIX o Windows. Está centrada en la creación de gráficos estadísticos y el análisis de datos. Es un programa muy potente que puede soportar grandes volúmenes de datos y librerías extensas. R es una herramienta muy compleja ya que se requieren conocimientos de programación para utilizarla. Esta herramienta utiliza el lenguaje R, similar al lenguaje S también desarrollado por laboratorios Bell. Los usuarios avanzados también pueden hacer uso del lenguaje C para tareas más complejas. R tiene su propio formato de documentación tanto en línea como en papel.

Infogr.am[21] [editar]

Es un servicio de Internet para crear y compartir visualización de datos tanto para expertos como principiantes. Permite crear infografías, visualizaciones de información y esquemas de representación de datos de forma útil y llamativa. Es una forma de desarrollar las ideas a través de gráficas con iconos, flechas y colores.

Es una herramienta que dispone de un archivo para compartir trabajos de todo tipo con otras personas. Las infografías se pueden subir, marcar por temas e ideas además de archivar las imágenes que ocupan mucho espacio a través de códigos. Esto proporciona más velocidad siempre que el programa funcione correctamente.

D3 Data Driven Documents[22] [23] [editar]

Es una herramienta de narración visual, una biblioteca de JavaScript para la manipulación de documentos basados en datos. D3 permite enlazar datos a un Modelo en Objetos para la Representación de Documentos (DOM) y aplicar transformaciones en el documento. Es un programa de código abierto que posibilita exponer las capacidades de los estándares web como HTML, SVG y CSS. Supone un gasto mínimo, es rápido y permite comportamientos dinámicos de interacción y animación. Facilita la reutilización a través de componentes o plugins y funciona con cualquier navegador moderno, incluyendo sistemas como Android y iOS .

Referencias[editar]

  1. Vialcanet, Gemma (15 de enero de 2014). «Visualización de Datos: ¿Qué dicen los Expertos?». Digital Business Intelligence. Consultado el 4 de junio de 2015. 
  2. «LightningChart® SDK - Microsoft Visual Studio». marketplace.visualstudio.com (en inglés estadounidense). Consultado el 2017-05-29. 
  3. Team, iFour. «Top 10 charting controls for DOT NET software development companies». blog.ifourtechnolab.com. Consultado el 2017-05-29. 
  4. Arction Oy (2016-05-18), WPF chart 1 Billion Data Points Scrolling Plot, consultado el 2017-05-29 
  5. «Case studies - Arction». Arction (en inglés estadounidense). Consultado el 2017-05-29. 
  6. http://www.doctormetrics.com/2012/08/29/herramientas-visualizacion-datos/#.VTS_MvysU40
  7. http://www.e-interactive.es/blog/visualizacion-de-datos-10-potentes-herramientas-que-debes-conocer/#axzz3XpwG9LzT
  8. http://ealmeida.blogspot.com.es/2010/04/gephi-una-herramienta-para.html
  9. http://e-volution.cc/2014/06/19/gephi-la-plataforma-open-source-para-graficos/
  10. http://www.ticbeat.com/tecnologias/5-herramientas-gratuitas-crear-infografias/
  11. http://www.theproject.ws/es/toolab/entrada/many-eyes-compartiendo-la-visualizacion-de-datos
  12. http://wwwhatsnew.com/2013/04/17/quadrigram-para-el-tratamiento-y-la-visualizacion-interactiva-de-datos/
  13. http://www.bestiario.org/quadrigram-project/
  14. http://tecnologia.elpais.com/tecnologia/2013/04/18/actualidad/1366307245_640876.html
  15. http://www.quadrigram.com/
  16. http://softlibre.barrapunto.com/article.pl?sid=10/09/01/0939242
  17. http://vectoralia.com/arte_generativo_con_python/
  18. http://www.e-interactive.es/blog/visualizacion-de-datos-10-potentes-herramientas-que-debes-conocer/#axzz3Xt5mB1b4
  19. http://www.r-project.org/about.html
  20. https://www.nodebox.net/node/documentation/concepts/concepts.html
  21. http://www.ticbeat.com/bigdata/14-herramientas-para-una-visualizacion-de-datos-atractiva/
  22. http://d3js.org/
  23. http://www.e-interactive.es/blog/visualizacion-de-datos-10-potentes-herramientas-que-debes-conocer/#axzz3Y0lZKhPk

Contenido adicional[editar]