El Internet Archive es o una ENORME cantidad de información o una organización sin ánimo de lucro cuya misión es proporcionar “acceso universal a todo el conocimiento”. O ambos. Como parte de su misión, el Internet Archive ha estado rastreando la red durante 20 años, haciendo copias de páginas web y preservándolas para la posteridad. Hoy en día, los servidores del IA guardan aproximadamente 280.000 millones de páginas web de 1.500 millones de sitios. Sigue leyendo para descubrir cómo puedes acceder a este sorprendente recurso que ofrece una ventana a la historia de Internet.
¿Qué es el Internet Archive?
El Internet Archive fue fundado por Brewster Kahle, un ingeniero informático que ayudó a desarrollar WAIS (Wide Area Information System), una interfaz de línea de órdenes precursora de la World Wide Web. Kahle y otros fundaron WAIS, Inc., para comercializar la tecnología de búsqueda de texto; sus clientes incluían a la campaña presidencial de Ross Perot de 1992, la EPA, la Biblioteca del Congreso, el Departamento de Energía, el Wall Street Journal y la Enciclopedia Británica.
WAIS, Inc., fue vendido a AOL en 1995 (motivo por el que es probable que nunca hayas oído hablar de ella) y Kahle fundó entonces el Internet Archive y el motor de búsqueda Alexa (no confundir con el Alexa de Amazon).
La parte más visible de esta masiva librería es el Wayback Machine (que los fans del Dr. Peabody y Sherman seguro que reconocerán). Permite a periodistas, investigadores y a curiosos nostálgicos buscar en versiones antiguas de páginas web, incluso si la página ya no existe en la web. Así que si quieres ver cómo era Yahoo en octubre de 1996, o ver capturas WhiteHouse.gov a lo largo del tiempo, aquí lo puedes hacer.
También permite enviar la URL de una página web para que sea archivada, y obtener una URL que seguirá funcionando incluso si la página se borra o se mueve de su sitio original. Estos links permanentes son cada vez más importantes. Las URLs han ganado una aceptación cada vez mayor para citas de trabajos de estudiantes, tesis doctorales, publicaciones de investigaciones científicas o incluso expedientes judiciales y opiniones. Un error del tipo “404 – not found” es un gran problema en un documento legal, y la Wayback Machine ayuda a evitar estos problemas. La Wayback Machine puede buscar en copias archivadas de páginas perdidas, dada su URL errante.
Para hacer la búsqueda de una página perdida incluso más fácil, hay una extensión disponible para Chrome, y un addon para Firefox. Una vez instalados, automáticamente busca en el IA cada vez que te encuentras con un error de “página no encontrada” que tu navegador puede devolverte cuando intentas entrar en una página web (en términos tecnológicos, esos errores pueden ser los números 404, 408, 410, 451, 500, 502, 503, 504, 509, 520, 521, 523, 524, 525, o 526). Si las copias archivadas de la página son encontradas, una ventana de notificación te permite elegir si quieres explorarlas o no.
¡Pero Espera, Hay Más!
Además de páginas web, el Internet Archive está constantemente buscando libros en su base de datos, de forma similar a lo que hace Google Books. También mantiene copias de videojuegos antiguos (y los emuladores necesarios para jugar a juegos de Atari en PC), programas, música, películas, vídeos y GIFs animados. La base central deel Internet Archive está localizada en la que fue sede de la Cuarta Iglesia de Cristo, Científico, un edificio neoclásico con columnas griegas en Funston Avenue, en el Distrito Richmond District de San Francisco, California. En octubre de 2016, el IA contaba con 15 petabytes de datos. Un petabyte es nada menos que un millón de gigabytes. Wow.
Merece la pena navegar por las “Top Colecciones del Archivo”, donde encontrarás una curación de colecciones relacionadas con una amplia variedad de temas, como Old Time Radio, MS-DOS Games, The Grateful Dead, revistas antiguas y docenas de temas esotéricos. ¡Cuéntanos que has encontrado allí!