Diferencia entre revisiones de «Análisis de datos»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
m Revertidos los cambios de Nuria19961 (disc.) a la última edición de SeroBOT
Etiqueta: Reversión
Línea 31: Línea 31:


*Basados en redes neuronales.
*Basados en redes neuronales.

Se pueden aplicar fórmulas o modelos matemáticos (conocidos como algoritmos) a los datos para identificar relaciones entre las variables; por ejemplo, utilizando correlación o causalidad.<ref>{{Citation|last=Ben-Ari|first=Mordechai|title=First-Order Logic: Formulas, Models, Tableaux|date=2012|url=http://dx.doi.org/10.1007/978-1-4471-4129-7_7|work=Mathematical Logic for Computer Science|pages=131–154|place=London|publisher=Springer London|doi=10.1007/978-1-4471-4129-7_7|isbn=978-1-4471-4128-0|access-date=2021-05-31}}</ref><ref>{{Cite book|last=Ernest.|first=Sosa|title=Causation|date=2011|publisher=Oxford Univ. Press|isbn=978-0-19-875094-9|oclc=767569031}}</ref> En términos generales, se pueden desarrollar modelos para evaluar una variable específica basada en otras variables contenidas en el conjunto de datos, con algún error residual dependiendo de la precisión del modelo implementado (por ejemplo, Datos = Modelo + Error).<ref>{{cite book|title=Data Science from Scratch. First Principles with Python|url=https://qualified.one/books/data-science-from-scratch-first-principles-with-python/|publisher=O'Reilly|date=2019|ISBN=9781492041139|}}</ref>
<ref>{{Cite journal|title=Figure 2. Variable importance by permutation, averaged over 25 models.|url=http://dx.doi.org/10.7554/elife.22053.004|access-date=2021-05-31|website=dx.doi.org|doi=10.7554/elife.22053.004}}</ref>

La estadística inferencial incluye la utilización de técnicas que miden las relaciones entre variables particulares. Por ejemplo, el análisis de regresión puede utilizarse para modelar si un cambio en la publicidad (variable independiente X) proporciona una explicación de la variación en las ventas (variable dependiente Y). En términos matemáticos, Y (ventas) es una función de X (publicidad). Puede describirse como:

<math>
Y = a\times X + b + error(),
</math>

donde el modelo está diseñado de manera que <math>a</math> y <math>b</math> minimizan el error cuando el modelo predice <math>Y</math> para un rango dado de valores de <math>X</math>. Los analistas también pueden intentar construir modelos que sean descriptivos de los datos, con el objetivo de simplificar el análisis y comunicar los resultados.<ref>{{Cite journal|last=Nwabueze|first=JC|date=2008-05-21|title=Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal|url=http://dx.doi.org/10.4314/jonamp.v9i1.40071|journal=Journal of the Nigerian Association of Mathematical Physics|volume=9|issue=1|doi=10.4314/jonamp.v9i1.40071|issn=1116-4336}}</ref>


==Véase también==
==Véase también==

Revisión del 15:23 8 nov 2021

El análisis de datos es un proceso que consiste en inspeccionar,[1]limpiar y transformar datos con el objetivo de resaltar información útil, para sugerir conclusiones y apoyo en la toma de decisiones. El análisis de datos tiene múltiples facetas y enfoques, que abarca diversas técnicas en una variedad de nombres, en diferentes negocios, la ciencia, y los dominios de las ciencias sociales. Los datos se coleccionan y analizan para indagar en cuestiones, probar conjeturas o refutar teorías.[2]

Se centra en la inferencia estadística, la cual permite tomar una decisión de forma sencilla con un grado de confianza determinado,[3]​ identificando, analizando tanto datos como patrones de comportamiento. Las técnicas de este análisis varían según las necesidades de la organización así como también las soluciones tecnológicas,tales comoKNIME , R y tableros de viualización (como Power BI o Qlik View, Tableau o Sas Visual Analytics). Estos proyectan en tiempo real los datos en formato visual.[4][5][6][7][8][9][10]

Antecedentes

El análisis de datos, en su estudio de la estructura de grandes conjuntos, es moderno pero los métodos de análisis son de larga data. Quien introdujo por primera vez el método de análisis de factores fue Ch. Spearman en 1904 (concepto de factor).[11]​La primera definición se remonta al año de 1961, cuando el matemático John Wilder Tukey, predijo el efecto de la computación en el análisis definiéndolo como: "(los) Procedimientos para analizar datos, (las) técnicas para interpretar los resultados de dichos procedimientos, (las) formas de planear la recolección de datos para hacer el análisis más fácil, más preciso o más exacto, y toda la maquinaria y los resultados de las estadísticas (matemáticas) que se aplican al análisis." [12]

Tipos de Análisis

Puede dividirse de acuerdo con el tipo de información que estudia en: análisis cuantitativo y cualitativo. El primero, examina la relación entre información cuantificable; El segundo, examina la relación de información no numérica en contextos situacionales y estructurales. [13]

También puede dividirse de acuerdo al objetivo en: análisis exploratorio (ADE) y análisis confirmatorio (ADC). El primero, busca vínculos y relaciones entre los datos; El segundo, se enfoca en comprobar las hipótesis formuladas respecto a un conjunto de información. [14]

Métodos de análisis

Son varios los enfoques presentados, sin pretender ser una metodología estricta sino más bien inicial o para exploración de campo, podemos mencionar las siguientes.[15]

Análisis factorial lineal

  • Análisis de componentes principales.
  • Análisis de correspondencia binaria.
  • Análisis de correspondencia múltiple.
  • Análisis discriminante.

Análisis no lineal de los datos

  • Basados en núcleos:
  • Análisis de componentes principales del núcleo.
  • Análisis discriminante del núcleo.
  • Basados en redes neuronales.

Se pueden aplicar fórmulas o modelos matemáticos (conocidos como algoritmos) a los datos para identificar relaciones entre las variables; por ejemplo, utilizando correlación o causalidad.[16][17]​ En términos generales, se pueden desarrollar modelos para evaluar una variable específica basada en otras variables contenidas en el conjunto de datos, con algún error residual dependiendo de la precisión del modelo implementado (por ejemplo, Datos = Modelo + Error).[18][19]

La estadística inferencial incluye la utilización de técnicas que miden las relaciones entre variables particulares. Por ejemplo, el análisis de regresión puede utilizarse para modelar si un cambio en la publicidad (variable independiente X) proporciona una explicación de la variación en las ventas (variable dependiente Y). En términos matemáticos, Y (ventas) es una función de X (publicidad). Puede describirse como:

donde el modelo está diseñado de manera que y minimizan el error cuando el modelo predice para un rango dado de valores de . Los analistas también pueden intentar construir modelos que sean descriptivos de los datos, con el objetivo de simplificar el análisis y comunicar los resultados.[20]

Véase también

Referencias

  1. «El proceso de análisis de datos - Marketing Analítico». Marketing Analítico. 1 de marzo de 2017. Consultado el 6 de noviembre de 2018. 
  2. Judd, Charles; McCleland, Gary (1989). Data Analysis. Harcourt Brace Jovanovich. ISBN 0-15-516765-0. 
  3. Hernández Martín-Logroño, Zenaida (2012). Métodos de análisis de datos: apuntes. Métodos estadísticos I. Universidad de la Rioja. Servicio de Publicaciones. ISBN 978-84-615-7579-4. 
  4. Visualización de Datos: Definición, Importancia y Oportunidades
  5. End to End Data Science
  6. Paradis, Emmanuel traducido por Jorge A. Ahumada (2002). «R para Principiantes» (pdf). 
  7. ¿Qué es Power BI?
  8. Diseñado para usos ilimitados
  9. ¿Qué es Tableau?
  10. SAS® Products, Technology & Solutions
  11. Ambapour, Samuel (1 de abril de 2003). «Introduction à l’analyse des données» (pdf). L'INS Congo (Bureau d'Application des Methodes Statiques et Informatiques) (en francés). Archivado desde el original el 13 de noviembre de 2009. Consultado el 22 de diciembre de 2018. 
  12. John Tukey-The Future of Data Analysis-July 1961 La traducción es del inglés "Procedures for analyzing data, techniques for interpreting the results of such procedures, ways of planning the gathering of data to make its analysis easier, more precise or more accurate, and all the machinery and results of (mathematical) statistics which aply to analysis data."
  13. Fernández, Pita; Díaz, Pértegas. «Investigación cuantitativa y cualitativa». Consultado el 18 de octubre de 2020. 
  14. «Análitica de datos». Consultado el 18 de octubre de 2020. 
  15. Crucianu, Michel; Asselin de Beauville, Jean-Pierre; Boné, Romuald (2004). Hermès - Lavoisier, ed. Méthodes factorielles pour l'analyse des données [Métodos factoriales para el análisis de datos.]. Hermès Science (en francés). p. 288. ISBN 978-2-7462-0921-3. 
  16. Ben-Ari, Mordechai (2012), «First-Order Logic: Formulas, Models, Tableaux», Mathematical Logic for Computer Science (London: Springer London): 131-154, ISBN 978-1-4471-4128-0, doi:10.1007/978-1-4471-4129-7_7, consultado el 31 de mayo de 2021 .
  17. Ernest., Sosa (2011). Causation. Oxford Univ. Press. ISBN 978-0-19-875094-9. OCLC 767569031. 
  18. Data Science from Scratch. First Principles with Python. O'Reilly. 2019. ISBN 9781492041139. 
  19. «Figure 2. Variable importance by permutation, averaged over 25 models.». dx.doi.org. doi:10.7554/elife.22053.004. Consultado el 31 de mayo de 2021. 
  20. Nwabueze, JC (21 de mayo de 2008). «Performances of estimators of linear model with auto-correlated error terms when the independent variable is normal». Journal of the Nigerian Association of Mathematical Physics 9 (1). ISSN 1116-4336. doi:10.4314/jonamp.v9i1.40071. 

Enlaces externos