El libro de medio billón de páginas
(y 4)

José Antonio Millán

Y a todas estas: ¿qué contiene la Internet? Respuesta: cualquier cosa... Recientemente he leído esta cínica frase: "Alguien dijo que si un millón de monos golpearan una máquina de escribir durante mil años acabarían por escribir las obras de Shakespeare. La Web demuestra que esto no es así". Yo añadiría que muchos otros medios lo demuestran también: ¿cuál es el porcentaje de excelsitud entre los 50.000 libros que se editan anualmente en España, los miles de números de periódicos y revistas, las horas de radio y televisión?

Sea como fuere, hay aspectos que hacen que valga la pena conservar lo que hay en la Internet, y conservar lo más posible. ¿Por qué? Pensemos por un momento: ¿cómo saber qué es lo realmente valioso de los contenidos que hoy nos circundan, en cualquier soporte? La respuesta es: ¡vaya usted a saber! El ejercicio de ver qué queda de los autores más vendidos de hace veinte (o cien años) ya es de por sí una lección de humildad. Las bibliotecas resolvieron ya hace años este espinoso problema mediante un sencillo artificio: el depósito legal, que hace que reciban (por lo menos en teoría) un ejemplar de cada publicación para su preservación. ¿Por qué no hacer lo mismo con la Web?

Y otro argumento: para los estudios sociológicos, antropológicos, lingüísticos o culturales, cualquier material es aprovechable. Hoy en día estudiamos los graffitti de las letrinas de Pompeya por la información que bindan sobre el latín vulgar: ¡qué no daríamos por poder oír una conversación de la época...! Pues bien: muchos rincones de la web actual, incluso desdeñables según parámetros culturales, pueden ser una mina para el investigador futuro...

Un tercer argumento para preservar la web es la inmensa volatilidad de los enlaces. Hace unos años se calculó que la duración media de cualquier enlace era de 44 días [1], y las cosas no parece que hayan mejorado mucho desde entonces (frente a 4,2 millones de sitios accesibles que examinó Inktomi en febrero del 2000 [2], otros 0,7 millones eran inalcanzables). Es decir: es posible que una información a la que ya accedimos, o que nos han referenciado correctamente [3], haya desaparecido de la Web, por muerte de su servidor, o sencillamente por traslado.

En la conciencia de todos estos problemas, hace seis años Brewster Kahle puso en marcha el proyecto The Internet Archive [4], con el propósito de preservar las mayores porciones posibles no sólo de la Web, sino tambien de grupos de discusión o newsgroups. Por el momento ya ha almacenado 14’5 terabytes, de los que la mayor parte son páginas web conseguidas por el rastreo mediante arañas, aunque también se admitan donaciones. Distintas instituciones y archivos hacen uso del proyecto; por ejemplo: la Smithsonian Institution ha estudiado allí los sitios web de elecciones de EEUU de 1996, que si no habrían desaparecido para siempre...

* * *

Bien: llegados aquí tenemos pleno derecho a imaginarnos la Web como un hormiguero transparente, donde cientos de miles de páginas nacen y mueren cada día, surcado por las arañas (de los buscadores, de las ciberniñeras, de los supragobiernos, de los proyectos de preservación), que devoran y regurgitan ordenadamente su contenido; donde cada segundo tres mil personas arrojan una petición al dios de las palabras, esperando encontrar su camino; en el que mentes aviesas, okupas y multinacionales colocan señuelos textuales para confundirles y atraerles... Y al tiempo, no dejemos de ver en ella la biblioteca, el libro gigantesco, que estamos empezando a pensar cómo hojear.

En palabras de Steve Jones, compilador del volumen Doing Internet Research. Critical Issues and Methods for Examining the Net [5]: "la Internet es un ‘tipo distinto de objeto’ (si es que constituye, en realidad, un objeto), y estudiarlo requiere un ‘cambio consciente de foco’".

Ojalá estas páginas hayan contribuido a la tarea de crear un nuevo foco para un nuevo medio.

[1] http://www.sciam.com/0397issue/
0397kahle.html

[2] Inktomi Web Map, http://www.inktomi.com/webmap.htm

[3] Incluyendo, ¡ay!, muchas de las referencias de este artículo...

[4] http://www.archive.org

[5] Londres, Sage, 1999.

Última versión, 2 de octubre del 2000.

[Parte cuatro de cuatro.]

uno, dos, tres y cuatro

El libro de medio billón de páginas (y 4)

El libro de medio billón de páginas
(y 4)