Versión en archivo de texto

Una cuarta parte de todas las páginas web que existieron entre 2013 y 2023 ya no son accesibles

Por REDACCIÓN
10 junio, 2024

Internet, con sus cientos de miles de millones de páginas indexadas, actúa como un vasto repositorio de la vida moderna. Sin embargo, a pesar de que usuarios de todo el mundo dependen de la web para acceder a libros, imágenes, noticias y otros recursos, este contenido a veces desaparece. Un nuevo análisis del Pew Research Center revela lo efímero que puede ser el contenido en línea.

Según el estudio, una cuarta parte de todas las páginas web que existieron entre 2013 y 2023 ya no son accesibles. Este fenómeno se debe principalmente a la eliminación o retiro de páginas individuales en sitios que de otro modo siguen funcionando. Para contenido más antiguo, la tendencia es aún más pronunciada: el 38% de las páginas web que existían en 2013 ya no están disponibles en la actualidad, en comparación con el 8% de las páginas de 2023.

El estudio abarcó varios espacios en línea, incluyendo sitios gubernamentales y de noticias, así como la sección de “Referencias” de las páginas de Wikipedia. De estos análisis se desprenden varios hallazgos clave:

  1. Sitios de noticias y gobierno:
  2. Wikipedia:
  3. Redes sociales:

Definiendo la inaccesibilidad

Para este estudio, la inaccesibilidad se definió como páginas que ya no existen en su servidor de origen o cuyos servidores han dejado de funcionar, mostrando errores como “404 Not Found”. Otros factores de inaccesibilidad, como cambios en el contenido de la página o dificultades de acceso para personas con discapacidades visuales, quedaron fuera del alcance de esta investigación.

El enfoque adoptado se centró en una medición conservadora, considerando páginas como inaccesibles solo si devolvían uno de los nueve códigos de error que indican de manera definitiva que la página o su servidor de alojamiento ya no existen o han dejado de funcionar.

Metodología

El análisis se realizó mediante la recopilación de una muestra aleatoria de aproximadamente un millón de páginas web de los archivos de Common Crawl, un servicio de archivo de internet que recopila instantáneas periódicas de la web. Se revisaron páginas recopiladas cada año desde 2013 hasta 2023, verificando su accesibilidad en octubre de 2023.

Vía

https://laboratoriodeperiodismo.org/una-cuarta-parte-de-todas-las-paginas-web-que-existieron-entre-2013-y-2023-ya-no-son-accesibles/


Regresar al índice | Acerca de este sitio