Wikipedia:Proyecto educativo/Fundamentos tecnológicos del e-learning/Aula 3/Grupo 15

De Wikipedia, la enciclopedia libre
Ir a la navegación Ir a la búsqueda

Integrantes del grupo y tema[editar]

A continuación debéis indicar los cuatros nombres de usuario que tenéis cada miembro del grupo, para que podamos controlar vuestras ediciones y ayudaros. Debéis sustituir los usuarios de ejemplo con el usuario de cada componente del grupo:

Tema escogido por el grupo: Análisis de datos

Acuerdos y fases para la elaboración de un artículo en la Wikipedia[editar]

Una vez establecido el grupo de trabajo en torno a una temática de interés común, a continuación se muestran las indicaciones para el establecimiento explícito de acuerdos entre los integrantes y la atribución de responsabilidades según las diferentes fases del trabajo:

  1. Fase de acuerdos iniciales. Distribución del trabajo entre los participantes del grupo, estableciendo los roles de cada uno, las tareas a realizar y su temporización. Primer acuerdo sobre los elementos del artículo a modificar y/o completar en el espacio de “Taller”.
  2. Fase de documentación sobre la temática. Incluye la profundización sobre la temática mediante una búsqueda e identificación de fuentes relevantes.
  3. Fase de análisis y síntesis individual de la información de relevancia a ser incorporada en el artículo. Esta redacción puede realizarse de manera privada o directamente en el “Taller” para que todos los integrantes del grupo puedan ir haciendo un seguimiento del avance del artículo.
  4. Fase de publicación en el taller de todas las secciones/párrafos del artículo acordados por cada uno de los participantes. Se debe utilizar la “Lista de control” para verificar que se respetan los criterios formales de publicación de la Wikipedia.
  5. Fase de revisión. En base a una versión cuasi definitiva del artículo, cada participante del grupo debe realizar una revisión general para asegurar que el texto respeta una estructura, estilo y lenguaje coherentes y que los contenidos han sido desarrollados en su totalidad. Cuando todos los miembros del grupo hayan revisado y verificado la información aportada, se podrá rellenar el documento “Lista de control”, para entregar al docente vía correo electrónico con las explicaciones necesarias en cada casilla. Con este documento, el profesor podrá indicar al grupo las mejoras a realizar antes de la entrega.
  6. Fase de verificación. Cuando se realicen los cambios indicados por el docente y se disponga de la versión definitiva, se deberá escribir nuevamente al profesor para pedir su autorización para publicar.
  7. Fase de publicación. Una vez recibida la autorización del profesor, se puede proceder a la publicación en Wikipedia párrafo a párrafo, no todo a la vez.
Tarea Responsable Semana 1 Semana 2 Semana 3 Semana 4
Seguimiento del trabajo en grupo (monitorear y alertar posibles retrasos) Macapag X X X X
Elementos del artículo a modificar todos X
Documentación todos de manera individual X X
Análisis y síntesis todos de manera individual X
Publicación en el taller todos X
Revisión todos X
Verificación Starchild82 X
Notificación al profesor Flutelab X
Publicación en Wikipedia Clasetic X

Edición del texto a integrar en el "tema" seleccionado de Wikipedia[editar]

A partir de aquí el grupo escribe/edita el texto que, una vez verificado por el/la profesor/a, será publicado en el artículo principal del tema seleccionado en la Wikipedia.

El análisis de datos es un proceso que consiste en inspeccionar,[1]limpiar y transformar datos con el objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Los datos se coleccionan y analizan para indagar en cuestiones, probar conjeturas o probar la invalidez de teorías.[2]

Se centra en la inferencia estadística, la cual permite tomar una decisión de forma sencilla con un nivel de confianza determinado.[3]​ Los datos se extraen y categorizan para identificar y analizar datos y patrones de comportamiento, y las técnicas aplicadas varían según los requisitos que busca una organización. Algunas herramientas utilizadas para el análisis de datos incluyen KNIME , R y tableros de viualización (como Power BI o Qlik View, Tableau o Sas Visual Analytics). Estos proyectan en tiempo real los datos en formato visual.[4][5][6][7][8][9][10]

Antecedentes[editar]

El análisis de datos, en su estudio de la estructura de grandes conjuntos, es moderno pero los métodos de análisis son de larga data. Quien introdujo por primera vez el método de análisis de factores fue Ch. Spearman en 1904 (concepto de factor).[11]​ La primera definición conocida de análisis de datos se remonta al año de 1962, cuando el matemático John Wilder Tukey, predijo el efecto de la computación en el análisis de datos definiéndolo como: "(los) Procedimientos para analizar datos, (las) técnicas para interpretar los resultados de dichos procedimientos, (las) formas de planear la recolección de datos para hacer el análisis más fácil, más preciso o más exacto, y toda la maquinaria y los resultados de las estadísticas (matemáticas) que se aplican al análisis de datos." [12]

Tipos de Análisis[editar]

Puede dividirse de acuerdo con el tipo de información que estudia en: análisis cuantitativo y cualitativo. El primero, examina la relación entre información cuantificable; El segundo, examina la relación de información no numérica en contextos situacionales y estructurales. [13]

También puede dividirse de acuerdo al objetivo en: análisis exploratorio (ADE) y análisis confirmatorio (ADC). El primero, busca vínculos y relaciones entre los datos; El segundo, se enfoca en comprobar las hipótesis formuladas respecto a un conjunto de información. [14]

Pasos para hacer un análisis de datos[editar]

1.Definir las preguntas correctas: deben ser claras, precisas y medibles para calificar o descalificar posibles soluciones a un problema o a una oportunidad determinada.

2.Determinar prioridades de medición: para lo cual es necesario:

  • Precisar qué es lo que se va a medir y según esto determinar los datos que se necesitan
  • Precisar cómo medir, esto es particularmente importante en la etapa de recolección de datos para respaldar o desacreditar el análisis que se desarrollará posteriormente.

3.Recolectar los datos: con la pregunta establecida y sus requerimientos de medición determinados, viene la recopilación de datos para lo cual se debe considerar:

  • Información de bases de datos existentes
  • Un sistema de registro, almacenamiento y gestión de datos para que puedan ser trabajados y compartidos por miembros del equipo a cargo.
  • Encuesta aplicada a técnica cuantitativa (observación y entrevistas).

4.Analizar los datos: se integra lo anterior y se aplica el uso y manipulación de un conjunto de datos para el uso analítico planificado, con el fin de encontrar relaciones, tendencias, discrepancias o vacíos, para luego categorizar y filtrar la información de acuerdo a las variables de interés. Se va comprobando y contrastando, identificando errores y aciertos para depurar. En esta etapa se debe construir un modelo analítico, aplicando herramientas de modelado predictivo como Python, Scala, R y SQL.

5.Interpretar resultados: para esto se deben realizar algunos cuestionamientos:

  • ¿Los datos responden a la pregunta inicialmente planteada?; ¿Cómo responden?
  • ¿Los datos permiten una argumentación clara para defender una objeción?
  • ¿Existe algo que no se consideró?¿Se identificaron las conclusiones con facilidad o con limitaciones?

Si la interpretación se logra fundamentar con las respuestas de estas preguntas es porque se logró desarrollar y llegar a una conclusión efectiva. Con este paso terminado se puede tomar decisiones y acciones.[15][16]

Técnicas de Análisis[editar]

En la era digital la importancia del análisis de datos ha aumentado debido a los altos volúmenes de información que pueden obtenerse, también conocidos como Macrodatos o Big Data. A continuación se describen las técnicas de análisis más relevantes:[17]

  • Aprendizaje de máquinas o Machine Learning: el objetivo de esta técnica es que los sistemas aprendan.
  • Pronóstico o Forecast: esta técnica determina comportamientos futuros. El objetivo es reducir la incertidumbre con base en datos históricos.
  • Minería de datos o Data Mining: esta técnica se enfoca en modelar y descubrir conocimiento por propósitos predictivos en lugar de obtenerlo por propósitos descriptivos, mientras que la inteligencia empresarial incluye análisis de datos que se apoyan en agregación, con el enfoque en información empresarial.[18]
  • Modelos de series de tiempo o Time Series Models: técnica que busca determinar tendencias y comportamientos cíclicos y estacionales en pro de la toma de decisiones.
  • Algoritmos o Algorithms: técnica para la creación de modelos.
  • Muestreos o Sampling: técnica para la selección de muestras.
  • Análisis de correlaciones: técnica de análisis estadístico para determinar si existe relación entre dos variables y qué tan fuerte es dicha relación.[19]
  • Análisis de regresión: técnica de análisis estadístico que permite analizar la relación entre dos (regresión simple) o más variables (regresión múltiple).[20]
  • Visualización de datos: técnica que ofrece una forma efectiva y rápida de transmitir y analizar información mediante el lenguaje visual.[21]
  • Análisis de sentimiento: técnica que busca identificar y extraer información sobre aspectos subjetivos relacionados con las emociones humanas. Intenta determinar la actitud de un sujeto o un grupo respecto de un tema.

Bibliografía[editar]

  • Adèr, H.J. (2008). Chapter 14: Phases and initial steps in data analysis. In H.J. Adèr & G.J. Mellenbergh (Eds.) (with contributions by D.J. Hand), Advising on Research Methods: A consultant's companion (pp. 333–356). Huizen, the Netherlands: Johannes van Kessel Publishing.
  • Tabachnick, B.G. & Fidell, L.S. (2007). Chapter 4: Cleaning up your act. Screening data prior to analysis. In B.G. Tabachnick & L.S. Fidell (Eds.), Using Multivariate Statistics, Fifth Edition (pp. 60–116). Boston: Pearson Education, Inc. / Allyn and Bacon.
  • Adèr, H.J. & Gideon J. Mellenbergh (with contributions by D.J. Hand) (2008). Advising on Research Methods: A consultant's companion. Huizen, the Netherlands: Johannes van Kessel Publishing.
  • ASTM International (2002). Manual on Presentation of Data and Control Chart Analysis, MNL 7A, ISBN 0-8031-2093-1
  • S.Chekanov. "Numeric Computation and Statistical Data Analysis on the Java Platform", Springer 2016. ISBN 978-3-319-28531-3
  • Juran, Joseph M.; Godfrey, A. Blanton (1999). Juran's Quality Handbook. 5th ed. New York: McGraw Hill. ISBN 0-07-034003-X
  • Lewis-Beck, Michael S. (1995). Data Analysis: an Introduction, Sage Publications Inc, ISBN 0-8039-5772-6
  • Pyzdek, T, (2003). Quality Engineering Handbook, ISBN 0-8247-4614-7
  • Richard Veryard (1984). Pragmatic data analysis. Oxford : Blackwell Scientific Publications. ISBN 0-632-01311-7
  • Tabachnick, B.G. & Fidell, L.S. (2007). Using Multivariate Statistics, Fifth Edition. Boston: Pearson Education, Inc. / Allyn and Bacon, ISBN 978-0-205-45938-4

Referencias[editar]

  1. «El proceso de análisis de datos - Marketing Analítico». Marketing Analítico. 1 de marzo de 2017. Consultado el 6 de noviembre de 2018. 
  2. Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0. 
  3. Hernández Martín-Logroño, Zenaida (2012). Métodos de análisis de datos: apuntes. Métodos estadísticos I. Universidad de la Rioja. Servicio de Publicaciones. ISBN 978-84-615-7579-4. 
  4. Visualización de Datos: Definición, Importancia y Oportunidades
  5. End to End Data Science
  6. Paradis, Emmanuel traducido por Jorge A. Ahumada (2002). «R para Principiantes» (pdf). 
  7. ¿Qué es Power BI?
  8. Diseñado para usos ilimitados
  9. ¿Qué es Tableau?
  10. SAS® Products, Technology & Solutions
  11. Ambapour, Samuel (1 de abril de 2003). «Introduction à l’analyse des données» (pdf). L'INS Congo (Bureau d'Application des Methodes Statiques et Informatiques) (en francés). Archivado desde el original el 13 de noviembre de 2009. Consultado el 22 de diciembre de 2018. 
  12. John Tukey-The Future of Data Analysis-July 1961 La traducción es del inglés "Procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which aply to analysis data."
  13. Fernández, Pita; Díaz, Pértegas. «Investigación cuantitativa y cualitativa». Consultado el 18 de octubre de 2020. 
  14. «Análitica de datos». Consultado el 18 de octubre de 2020. 
  15. «Análitica de datos». Consultado el 18 de octubre de 2020. 
  16. «Análisis de datos». Consultado el 18 de octubre de 2020. 
  17. Galeros Juárez, Héctor Francisco (2019). «Tendencias tecnológicas en análisis de datos: patrones a gran escala o pistas específicas de gran valor, la simbiosis entre Big Data y Small Data». Revista académica ECO (Guatemala: Cara PArens de la Universidad Rafael Landivar) (20): 67-80. ISSN 2075-888X. Consultado el 16 de octubre de 2020. 
  18. Exploring Data Analysis(en inglés)
  19. Alquicira, José (25 de mayo de 2017). «Análisis de correlación». Conogasi, Conocimiento para la vida. Consultado el 17 de octubre de 2020. 
  20. Pardo Merino, Antonio; Ruiz Díaz, Miguel Ángel (2005). «18». Análisis de datos con SPSS 13 Base. Madrid, España: McGraw-Hill Interamericana. p. 341. ISBN 9788448145361. Consultado el 17 de octubre de 2020. 
  21. Rouse, Margaret (marzo de 2020). «Visualización de datos». TechTarget. Consultado el 17 de octubre de 2020. 

Enlaces externos[editar]