Una cuarta parte de todas las páginas web que existieron entre 2013 y 2023 ya no son accesibles ====================================================== Por REDACCIÓN 10 junio, 2024 Internet, con sus cientos de miles de millones de páginas indexadas, actúa como un vasto repositorio de la vida moderna. Sin embargo, a pesar de que usuarios de todo el mundo dependen de la web para acceder a libros, imágenes, noticias y otros recursos, este contenido a veces desaparece. Un nuevo análisis del Pew Research Center revela lo efímero que puede ser el contenido en línea. Según el estudio, una cuarta parte de todas las páginas web que existieron entre 2013 y 2023 ya no son accesibles. Este fenómeno se debe principalmente a la eliminación o retiro de páginas individuales en sitios que de otro modo siguen funcionando. Para contenido más antiguo, la tendencia es aún más pronunciada: el 38% de las páginas web que existían en 2013 ya no están disponibles en la actualidad, en comparación con el 8% de las páginas de 2023. El estudio abarcó varios espacios en línea, incluyendo sitios gubernamentales y de noticias, así como la sección de “Referencias” de las páginas de Wikipedia. De estos análisis se desprenden varios hallazgos clave: 1. Sitios de noticias y gobierno: □ El 23% de las páginas de noticias contienen al menos un enlace roto. □ El 21% de las páginas gubernamentales también presentan enlaces rotos. □ Los sitios de noticias, independientemente de su nivel de tráfico, son igualmente propensos a tener enlaces rotos. □ Las páginas de gobiernos locales tienen una mayor incidencia de enlaces rotos. 2. Wikipedia: □ El 54% de las páginas de Wikipedia tienen al menos un enlace en la sección de “Referencias” que apunta a una página inexistente. □ Este hallazgo subraya cómo incluso las plataformas educativas y de referencia no son inmunes a la decadencia digital. 3. Redes sociales: □ El análisis de casi cinco millones de tuits publicados entre marzo y abril de 2023 mostró que casi uno de cada cinco tuits ya no era visible tres meses después de haber sido publicado. □ En el 60% de los casos, la desaparición se debió a que la cuenta fue privada, suspendida o eliminada. En el 40% restante, el tuit específico fue eliminado mientras la cuenta permanecía activa. □ Los tuits en turco o árabe tienen más probabilidades de desaparecer que aquellos en otros idiomas. ## Definiendo la inaccesibilidad Para este estudio, la inaccesibilidad se definió como páginas que ya no existen en su servidor de origen o cuyos servidores han dejado de funcionar, mostrando errores como “404 Not Found”. Otros factores de inaccesibilidad, como cambios en el contenido de la página o dificultades de acceso para personas con discapacidades visuales, quedaron fuera del alcance de esta investigación. El enfoque adoptado se centró en una medición conservadora, considerando páginas como inaccesibles solo si devolvían uno de los nueve códigos de error que indican de manera definitiva que la página o su servidor de alojamiento ya no existen o han dejado de funcionar. ## Metodología El análisis se realizó mediante la recopilación de una muestra aleatoria de aproximadamente un millón de páginas web de los archivos de Common Crawl, un servicio de archivo de internet que recopila instantáneas periódicas de la web. Se revisaron páginas recopiladas cada año desde 2013 hasta 2023, verificando su accesibilidad en octubre de 2023. ## Vía https://laboratoriodeperiodismo.org/una-cuarta-parte-de-todas-las-paginas-web-que-existieron-entre-2013-y-2023-ya-no-son-accesibles/