Sqoop

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Apache Sqoop
sqoop.apache.org
Apache Sqoop logo.svg
Información general
Desarrollador(es) Apache Software Foundation
Última versión estable 1.4.6
11 de mayo de 2015 (2 años, 6 meses y 10 días)
Género gestión de datos
Programado en Java
Sistema operativo multi plataforma
Plataforma Máquina virtual Java
Licencia Apache License 2.0
Estado actual Activo
[editar datos en Wikidata]

Sqoop es una aplicación con interfaz de línea de comando para transferir datos entre bases de datos relacionales y Hadoop.[1]​ Soporta cargas incrementales de una solatabla o de una consulta SQL en formato libre así como trabajos almacenados que pueden ser ejecutados múltiples veces para importar las actualizaciones realizadas en una base de datos desde la última importación. Las importaciones también pueden soler poblar tablas en Hive o HBase.[2]​ Las exportaciones pueden utilizarse para transferir datos desde Hadoop hacia a una base de datos relacional. El nombre Sqoop viene de fusionar las palabras sql y hadoop. Sqoop se convirtió en un proyecto Apache de nivel superior en marzo de 2012.[3]​ Sqoop viene con una amplia documentación para usuarios y desarrolladores[4]

Pentaho incluye pasos de conexión como código abierto basados en Sqoop, Sqoop Import[5]​ y Sqoop Export, en su suite ETL de integración de datos a partir de la versión 4.5 del software.[6][7]Microsoft utiliza un conector basado en Sqoop para facilitar la transferencia de datos entre SQL Server y Hadoop.[8]Couchbase, Inc. también ofrece un conector Couchbase Server-Hadoop mediante Sqoop.[9]

El API de extensión de Sqoop permite desarrollar nuevos conectores con otras bases de datos y así manejar las pequeñas diferencias que puede haber en el lenguaje de consultas de un proveedor de bases de datos específico.[4]

Referencias[editar]

  1. «Hadoop: Apache Sqoop». Consultado el 7 de junio de 2016. 
  2. «Apache Sqoop - Overview». Consultado el 7 de junio de 2016. 
  3. «Apache Sqoop Graduates from Incubator». Consultado el 7 de junio de 2016. 
  4. a b «Sqoop Documentation (v1.4.6)». Consultado el 8 de junio de 2016. 
  5. «Sqoop Import». Pentaho. 10 de diciembre de 2015. Consultado el 7 de junio de 2016. «The Sqoop Import job allows you to import data from a relational database into the Hadoop Distributed File System (HDFS) using Apache Sqoop.» 
  6. «Sqoop Export». Pentaho. 10 de diciembre de 2015. Consultado el 7 de junio de 2016. «The Sqoop Export job allows you to export data from Hadoop into an RDBMS using Apache Sqoop.» 
  7. «Big Data Analytics Vendor Pentaho Announces Tighter Integration with Cloudera; Extends Visual Interface to Include Hadoop Sqoop and Oozie». Database Trends and Applications (dbta.com). 27 de julio de 2012. Consultado el 7 de junio de 2016. «Pentaho’s Business Analytics 4.5 is now certified on Cloudera’s latest releases, Cloudera Enterprise 4.0 and CDH4. Pentaho also announced that its visual design studio capabilities have been extended to the Sqoop and Oozie components of Hadoop.» 
  8. «Microsoft SQL Server Connector for Apache Hadoop». Consultado el 7 de junio de 2016. 
  9. «Couchbase Hadoop Connector». Consultado el 7 de junio de 2016.