Ir al contenido

Diferencia entre revisiones de «Araña web»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
SassoBot (discusión · contribs.)
m robot Añadido: cy:Ymgripiwr gwe
Página reemplazada por «vuestraputamadre wikipedia».
Línea 1: Línea 1:
vuestraputamadre wikipedia
Una '''araña web''' (o '''araña de la web''') es un programa que inspecciona las páginas del [[World Wide Web]] de forma metódica y automatizada. Uno de los usos más frecuentes que se les da consiste en crear una copia de todas las páginas web visitadas para su procesado posterior por un [[motor de búsqueda]] que indexa las páginas proporcionando un sistema de búsquedas rápido. Las arañas web suelen ser [[bot]]s (el tipo más usado de éstos).

Las arañas web comienzan visitando una lista de [[URL]]s, identifica los [[hiperenlace]]s en dichas páginas y los añade a la lista de URLs a visitar de manera recurrente de acuerdo a determinado conjunto de reglas. La operación normal es que se le da al programa un grupo de direcciones iniciales, la araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas. Luego descarga estas páginas nuevas, analiza sus enlaces, y así sucesivamente.

Entre las tareas más comunes de las arañas de la web tenemos:

* Crear el índice de una máquina de búsqueda.
* Analizar los enlaces de un sitio para buscar links rotos.
* Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo.

==Enlaces externos==
* [http://www.robotstxt.org/wc/robots.html The Web Robots Page] (en inglés)
* [http://crawlers.110mb.com/ Crawlers website] (en español)
* [http://recuperacionorganizacioninformacionacces.net78.net/aranas_web_(crawlers)/aranas_web_(crawlers)_introduccion.html Arañas Web (crawlers)] (en español)


[[Categoría:Internet]]

[[ca:Aranya web]]
[[cy:Ymgripiwr gwe]]
[[de:Webcrawler]]
[[en:Web crawler]]
[[eu:Web crawler]]
[[fi:Hakurobotti]]
[[fr:Robot d'indexation]]
[[he:זחלן רשת]]
[[it:Crawler]]
[[ja:クローラ]]
[[lt:Interneto robotai]]
[[nds-nl:Webkroeper]]
[[nl:Spider]]
[[no:Søkerobot]]
[[pl:Robot internetowy]]
[[ru:Поисковый робот]]
[[sv:Spindel (internet)]]
[[ta:சிலந்திகள் (தேடுபொறி)]]
[[uk:Пошуковий робот]]
[[zh:網路蜘蛛]]

Revisión del 01:11 3 jul 2009

vuestraputamadre wikipedia