KNIME

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 03:34 25 dic 2019 por InternetArchiveBot (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.
KNIME
KNIME - The Open Analytics Platform
25MB
Información general
Tipo de programa Minería de datos
Desarrollador KNIME.com AG
Lanzamiento inicial 28 de julio de 2006
Licencia GPL
Estado actual Estable
Información técnica
Programado en Java
Plataformas admitidas Java
Versiones
Historial de versiones 4.0 (27 de junio de 2019)
Enlaces

KNIME (o Konstanz Information Miner) es una plataforma de minería de datos que permite el desarrollo de modelos en un entorno visual. Está construido bajo la plataforma Eclipse.

Historia

Fue desarrollado originalmente en el departamento de bioinformática y minería de datos de la Universidad de Constanza, Alemania, bajo la supervisión del profesor Michael Berthold. En la actualidad, la empresa KNIME.com GmbH, radicada en Zúrich, Suiza, continúa su desarrollo además de prestar servicios de formación y consultoría.

Características

KNIME está desarrollado sobre la plataforma Eclipse y programado, esencialmente, en java. Está concebido como una herramienta gráfica y dispone de una serie de nodos (que encapsulan distintos tipos de algoritmos) y flechas (que representan flujos de datos) que se despliegan y combinan de manera gráfica e interactiva.

Los nodos implementan distintos tipos de acciones que pueden ejecutarse sobre una tabla de datos:

  • Manipulación de filas, columnas, etc., como muestreos, transformaciones, agrupaciones, etc.
  • Visualización (histogramas, etc.).
  • Creación de modelos estadísticos y de minería de datos, como árboles de decisión, máquinas de vector soporte, regresiones, etc.
  • Validación de modelos, como curvas ROC, etc.
  • Scoring o aplicación de dichos modelos sobre conjuntosa nuevos de datos.
  • Creación de informes a medida gracias a su integración con BIRT.

El carácter abierto de la herramienta hace posible su extensión mediante la creación de nuevos nodos que implementen algoritmos a la medida del usuario. Además, existe la posibilidad de utilizar de llamar directa y transparentemente a Weka y o de incorporar de manera sencilla código desarrollado en R o python/jython.

KNIME integra diversos componentes para aprendizaje automático y minería de datos a través de su concepto de fraccionamiento de datos (data pipelining) modular. La interfaz gráfica de usuario permite el montaje fácil y rápido de nodos para preprocesamiento de datos (ETL: extracción, transformación, carga), para el análisis de datos y modelado y visualización. KNIME es desde 2006 utilizado en la investigación farmacéutica,[1]​ pero también se utiliza en otras áreas, como: análisis de datos de cliente de CRM, inteligencia de negocio y análisis de datos financieros.

Licencia y soporte

KNIME es una herramienta de software libre que puede ser descargada y utilizada gratuitamente bajo los términos de la licencia GPLv3 con una excepción que permite que otros usuarios utilicen el bien definido nodo de API para añadir extensiones de propiedad[2]​ Esto también permite a los proveedores comerciales de software agregar envolturas enlazando sus herramientas hacia KNIME.

La compañía que lo desarrolla ofrece, adicionalmente, la posibilidad de contratar servicios de soporte en varios niveles, además de brindar servicios de consultoría y formación.

Referencias

  1. Abhishek Tiwaria and Arvind K.T. Sekhar: Workflow based framework for life science informatics, Computational Biology and Chemistry, Volume 31, Issues 5–6, Pages 305–319, Elsevier, October 2007.
  2. KNIME 2.1.0 lanzado (released, en inglés) Archivado el 17 de abril de 2010 en Wayback Machine.

Herramientas relacionadas

  • Weka - algoritmos de aprendizaje automático que se pueden integrar en KNIME.
  • RapidMiner - programa informático para el análisis y la minería de datos.
  • Neural Designer - herramienta de minería de datos basada en la técnica de las redes neuronales.
  • ELKI - marco de minería de datos con muchos algoritmos de agrupamiento (clustering).

Véase también

Enlaces externos