Diferencia entre revisiones de «Araña web»
Apariencia
Contenido eliminado Contenido añadido
m robot Añadido: cy:Ymgripiwr gwe |
Página reemplazada por «vuestraputamadre wikipedia». |
||
Línea 1: | Línea 1: | ||
vuestraputamadre wikipedia |
|||
Una '''araña web''' (o '''araña de la web''') es un programa que inspecciona las páginas del [[World Wide Web]] de forma metódica y automatizada. Uno de los usos más frecuentes que se les da consiste en crear una copia de todas las páginas web visitadas para su procesado posterior por un [[motor de búsqueda]] que indexa las páginas proporcionando un sistema de búsquedas rápido. Las arañas web suelen ser [[bot]]s (el tipo más usado de éstos). |
|||
Las arañas web comienzan visitando una lista de [[URL]]s, identifica los [[hiperenlace]]s en dichas páginas y los añade a la lista de URLs a visitar de manera recurrente de acuerdo a determinado conjunto de reglas. La operación normal es que se le da al programa un grupo de direcciones iniciales, la araña descarga estas direcciones, analiza las páginas y busca enlaces a páginas nuevas. Luego descarga estas páginas nuevas, analiza sus enlaces, y así sucesivamente. |
|||
Entre las tareas más comunes de las arañas de la web tenemos: |
|||
* Crear el índice de una máquina de búsqueda. |
|||
* Analizar los enlaces de un sitio para buscar links rotos. |
|||
* Recolectar información de un cierto tipo, como precios de productos para recopilar un catálogo. |
|||
==Enlaces externos== |
|||
* [http://www.robotstxt.org/wc/robots.html The Web Robots Page] (en inglés) |
|||
* [http://crawlers.110mb.com/ Crawlers website] (en español) |
|||
* [http://recuperacionorganizacioninformacionacces.net78.net/aranas_web_(crawlers)/aranas_web_(crawlers)_introduccion.html Arañas Web (crawlers)] (en español) |
|||
[[Categoría:Internet]] |
|||
[[ca:Aranya web]] |
|||
[[cy:Ymgripiwr gwe]] |
|||
[[de:Webcrawler]] |
|||
[[en:Web crawler]] |
|||
[[eu:Web crawler]] |
|||
[[fi:Hakurobotti]] |
|||
[[fr:Robot d'indexation]] |
|||
[[he:זחלן רשת]] |
|||
[[it:Crawler]] |
|||
[[ja:クローラ]] |
|||
[[lt:Interneto robotai]] |
|||
[[nds-nl:Webkroeper]] |
|||
[[nl:Spider]] |
|||
[[no:Søkerobot]] |
|||
[[pl:Robot internetowy]] |
|||
[[ru:Поисковый робот]] |
|||
[[sv:Spindel (internet)]] |
|||
[[ta:சிலந்திகள் (தேடுபொறி)]] |
|||
[[uk:Пошуковий робот]] |
|||
[[zh:網路蜘蛛]] |
Revisión del 01:11 3 jul 2009
vuestraputamadre wikipedia