Ir al contenido

Pandas (software)

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 12:00 22 nov 2019 por 195.77.128.147 (discusión). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.
Pandas
Información general
Tipo de programa biblioteca de Python
Autor Wes McKinney
Desarrollador
  • Wes McKinney
  • J. Brock Mendel
  • Joris Van den Bossche
  • Jeff Reback
Licencia licencia BSD
Información técnica
Programado en Python
Versiones
Última versión estable 2.2.210 de abril de 2024
Enlaces

En Computación y Ciencia de datos, pandas es una biblioteca de software escrita como extensión de NumPy para manipulación y análisis de datos para el lenguaje de programación Python. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales. Es un software libre distribuido bajo la licencia BSD versión tres cláusulas.[1]​ El nombre deriva del término "datos de panel", término de econometría que designa datos que combinan una dimensión temporal con otra dimensión transversal.[2]

Características de la biblioteca

  • Tipo de datos DataFrame para manipulación de datos con indexación integrada.
  • Herramientas para leer y escribir datos entre estructuras de dato en-memoria y formatos de archivo variados.
  • Alineación de dato y manejo integrado de datos faltantes.
  • Reestructuración y segmentación de conjuntos de datos.
  • Segmentación vertical basada en etiquetas, indexación elegante, y segmentación horizontal de grandes conjuntos de datos.
  • Inserción y eliminación de columnas en estructuras de datos.
  • Agrupación predefinida en la biblioteca lo que permite realizar cadenas de operaciones dividir-aplicar-combinar sobre conjuntos de datos.
  • Mezcla y unión de datos.
  • Indexación jerárquica de ejes para trabajar con datos de altas dimensiones en estructuras de datos de menor dimensión.
  • Funcionalidad de series de tiempo: generación de rangos de fechas y conversión de frecuencias, desplazamiento de ventanas estadísticas y de regresiones lineales, desplazamiento de fechas y retrasos.[3]

La biblioteca ha sido altamente optimizada en cuanto a rendimiento, con caminos de código crítico escritos en Cython o en C.[4]

Historia

Su principal desarrollador, Wes McKinney, empezó a desarrollar Pandas en el año 2008 mientras trabajaba en AQR Capital por la necesidad que tenía de una herramienta flexible de alto rendimiento para realizar análisis cuantitativo en datos financieros. Antes de dejar AQR convenció a la administración de la empresa de distribuir esta biblioteca bajo licencia de código abierto. Otro empleado de AQR, Chang Ella, se unió en 2012 al esfuerzo de desarrollo de la biblioteca.[cita requerida]

Véase también

Referencias

  1. «License – Package overview – pandas 0.21.1 documentation». pandas. 12 de diciembre de 2017. Consultado el 13 de diciembre de 2017. 
  2. Using Econometrics: A Practical Guide. Pearson. 2016. pp. 346, 465. ISBN 013418274X. 
  3. «pandas.date_range – pandas 0.21.1 documentation». pandas. 12 de diciembre de 2017. Consultado el 13 de diciembre de 2017. 
  4. «Python Data Analysis Library – pandas: Python Data Analysis Library». pandas. Consultado el 13 de noviembre de 2017. 

Enlaces externos