Apache Droids

De Wikipedia, la enciclopedia libre

Apache Droids es un proyecto de la Apache Software Foundation, actualmente en estado de incubación, que se dedica a la creación de un framework para la definición de web crawlers. Estos robots para la búsqueda de información en línea se construyen por medio de elementos genéricos tales como:

Características[editar]

  • Adaptabilidad. Completo control por medio de archivos de propiedades.[1]
  • Multihilo. Un robot controla a varios "trabajadores" (hilos) que realizan la labor real.
  • Respeto de robots.txt. Por defecto, Droids respeta las directrices de robot.txt.
  • Limitación de recursos. Es posible configurar el número de hilos concurrentes que un robot pueda distribuir entre sus "trabajadores", así como el tiempo de retardo entre las peticiones.
  • Dinámica basada en Spring Framework. Las propiedades mencionadas son inyectadas a la configuración Spring.
  • Dinámica extendible. La configuración Spring emplea el configurador de Apache Cocoon y su registro dinámico, facilitando así la extensión de los robots.

Referencias[editar]

Véase también[editar]