Diferencia entre revisiones de «Wayback Machine»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
Sin resumen de edición
Sin resumen de edición
Etiquetas: Edición desde móvil Edición vía web móvil
Línea 1: Línea 1:

{{Ficha de sitio web
| nombre
| nombre
| logotipo = [[Archivo:Internet Archive Wayback Machine logo.png|190px|Wayback Machine logo]]
| logotipo = [[Archivo:Internet Archive Wayback Machine logo.png|190px|Wayback Machine logo]]

Revisión del 19:15 7 sep 2020

| nombre | logotipo = Wayback Machine logo | captura = | pie = | url = archive.org | eslogan = | comercial = Sí | tipo = Archivo | registro = No | idioma = inglés | propietario = | creador = Brewster Kahle
Bruce Gilliat | adoptada por = Internet Archive | lanzamiento = 1996 | relanzamiento = | ingresos = | estado actual = en línea }} Wayback Machine es un servicio y una base de datos que contiene copias de una gran cantidad de páginas o sitios de Internet. Si por alguna razón algún sitio no está disponible momentáneamente o ha sido borrado del servidor de origen, es posible consultar una réplica vía "Wayback Machine". Como consecuencia de este proyecto, también se puede consultar la historia o modificaciones de las páginas a través del tiempo.

Características

El servicio Wayback Machine funciona de una manera simple: basta teclear la dirección (URL) de una página web para ver cuál es la última copia que hay guardada en el archivo.[1]​ Si queremos ver cómo era hace un tiempo una página en cuestión, entonces Wayback machine nos pedirá en qué fecha y año queremos visitar la página. Existe un calendario en la parte superior de la pantalla, que permite ver gráficamente las capturas a lo largo del tiempo. La longitud de las barras del gráfico indica en qué meses se hicieron más copias.

Lo que hace este sitio para almacenar todo el contenido de la página web es muy simple pero ingenioso: almacena solo el contenido html del código fuente y no guarda las imágenes sino solo el código; por eso, cuando un servidor de imágenes elimina alguna imagen del sitio web original, ésta no es reproducida, sino que se marca como un error 404. En 2012 contenía 10 petabytes de información y crecía en torno a 20 terabytes por mes, [2]​ en octubre de 2019 su almacenamiento sobrepasó los 20 petabytes.[3]

Sin embargo Wayback Machine está lejos de ser una copia completa de internet pues varios sitios evitan su indexación y grabación de información, como por ejemplo usando el archivo robots.txt con: User-agent: ia_archiver Disallow: /

Wayback CDX Server API

Desde noviembre de 2015 Wayback Machine cuenta con un servicio de indexado de capturas de páginas que permite, rápidamente, conocer el historial de grabado para cada URL tanto en formato propio como en formato JSON.[4]​ Dicho servicio es un proyecto en fase beta denominado Wayback CDX Server API y cuyo código fuente y manual de uso está alojado en GitHub.[5]

Incidencias

A lo largo de su historia la Wayback Machine, ha presentado una serie de incidencias,[6]​ de las cuales las más importantes han sido las siguientes:

  • En enero de 2017 desarrollaron un complemento, tanto para el navegador Chromium como Google Chrome,[7]​ que permite guardar la página web que se está visualizando, buscar si esa paǵina ha sido guardada anteriormente en la Wayback Machine e incluso permite hacer una búsqueda rápida en Twitter, entre otras funcionalidades. El complemento está debidamente catalogado en la Chrome Web Store.[8]

Referencias

  1. Ibáñez, Álvaro (29 de enero de 2011). «Wayback Machine: la máquina del tiempo de las páginas web se renueva» (html). RTVES. Archivado desde el original el 30 de enero de 2011. Consultado el 8 de junio de 2020. 
  2. Minard, Jonathan (25 de octubre de 2012). «10,000,000,000,000,000 Bytes Archived» (html). Archive Org (en inglés). Consultado el 14 de febrero de 2018. «Documentation of the unplugged presentation "10 Petabytes Archived!" on October 25, 2012 at the Internet Archive Featuring presentations by Brewster Kahle, Robert Miller, Kristine Hanna, Alexis Rossi, Dave Marvit, and Roger Macdonald, with live music by Jeff Kaplan (guitar), and Don Knuth (organ).» 
  3. «The Whole Earth Web Archive» [El archivo de la web de la Tierra entera] (html). Internet Archive (en inglés). 30 de octubre de 2019. Consultado el 28 de abril de 2020. «We hope the WEWA project helps provide enhanced access to archived material otherwise hard to find and browse in the massive 20+ petabytes of the Wayback Machine.» 
  4. Leetaru, Kalev (16 de noviembre de 2015). «How Much Of The Internet Does The Wayback Machine Really Archive?» (html). Forbes (en inglés). Archivado desde el original el 1 de diciembre de 2015. Consultado el 14 de febrero de 2018. «The complete history of all snapshots ever recorded by the Archive for the homepage of each website was requested using the Wayback CDX Server API through November 5, 2015. While this only reflects snapshots of homepages, rather than sites as a whole, it nonetheless captures a key metric of how often the Archive is crawling each site.» 
  5. Wayback CDX Server API - BETAWayback CDX Server API - BETA en Wayback Machine (archivado el 7 de febrero de 2016).
  6. Real Academia Española. «incidencia : Acontecimiento que sobreviene en el curso de un asunto o negocio y tiene con él alguna conexión.». Diccionario de la lengua española (23.ª edición). Consultado el 8 de junio de 2020. 
  7. Graham, Mark (13 de enero de 2017). «Wayback Machine Chrome extension now available» [Complemento Wayback Machine ahora disponible para Chrome] (html). Internet Archive (en inglés). Consultado el 8 de junio de 2020. «For example a 2013 Harvard study found that 49% of the URLs referenced in U.S. Supreme Court decisions are now dead. Those decisions affect everyone in the U.S., and the evidence the opinions are based on is disappearing.» 
  8. Wayback Machine Offered by: Internet Archive (Archive.org)

Enlaces externos