Diferencia entre revisiones de «Araña web»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Página reemplazada por «vuestraputamadre wikipedia».
Camilo (discusión · contribs.)
m Revertidos los cambios de 79.146.70.108 a la última edición de SassoBot
Línea 1: Línea 1:
Una '''araña web''' (o '''araña de la web''') es un programa que inspecciona las páginas del [[World Wide Web]] de forma metódica y automatizada. Uno de los usos más frecuentes que se les da consiste en crear una copia de todas las páginas web visitadas para su procesado posterior por un [[motor de búsqueda]] que indexa las páginas proporcionando un sistema de búsquedas rápido. Las arañas web suelen ser [[bot]]s (el tipo más usado de éstos).
vuestraputamadre wikipedia

Las arañas web comienzan visitando una lista de [[URL]]s, identifica los [[hiperenlace]]s en dichas páginas y los añade a la lista de URLs a visitar de manera recurrente de acuerdo a determinado conjunto de reglas. La operación normal es que se le da al programa un grupo de direcciones iniciales, la araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas. Luego descarga estas páginas nuevas, analiza sus enlaces, y así sucesivamente.

Entre las tareas más comunes de las arañas de la web tenemos:

* Crear el índice de una máquina de búsqueda.
* Analizar los enlaces de un sitio para buscar links rotos.
* Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

==Enlaces externos==
* [http://www.robotstxt.org/wc/robots.html The Web Robots Page] (en inglés)
* [http://crawlers.110mb.com/ Crawlers website] (en español)
* [http://recuperacionorganizacioninformacionacces.net78.net/aranas_web_(crawlers)/aranas_web_(crawlers)_introduccion.html Arañas Web (crawlers)] (en español)


[[Categoría:Internet]]

[[ca:Aranya web]]
[[cy:Ymgripiwr gwe]]
[[de:Webcrawler]]
[[en:Web crawler]]
[[eu:Web crawler]]
[[fi:Hakurobotti]]
[[fr:Robot d'indexation]]
[[he:זחלן רשת]]
[[it:Crawler]]
[[ja:クローラ]]
[[lt:Interneto robotai]]
[[nds-nl:Webkroeper]]
[[nl:Spider]]
[[no:Søkerobot]]
[[pl:Robot internetowy]]
[[ru:Поисковый робот]]
[[sv:Spindel (internet)]]
[[ta:சிலந்திகள் (தேடுபொறி)]]
[[uk:Пошуковий робот]]
[[zh:網路蜘蛛]]

Revisión del 01:11 3 jul 2009

Una araña web (o araña de la web) es un programa que inspecciona las páginas del World Wide Web de forma metódica y automatizada. Uno de los usos más frecuentes que se les da consiste en crear una copia de todas las páginas web visitadas para su procesado posterior por un motor de búsqueda que indexa las páginas proporcionando un sistema de búsquedas rápido. Las arañas web suelen ser bots (el tipo más usado de éstos).

Las arañas web comienzan visitando una lista de URLs, identifica los hiperenlaces en dichas páginas y los añade a la lista de URLs a visitar de manera recurrente de acuerdo a determinado conjunto de reglas. La operación normal es que se le da al programa un grupo de direcciones iniciales, la araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas. Luego descarga estas páginas nuevas, analiza sus enlaces, y así sucesivamente.

Entre las tareas más comunes de las arañas de la web tenemos:

  • Crear el índice de una máquina de búsqueda.
  • Analizar los enlaces de un sitio para buscar links rotos.
  • Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

Enlaces externos