Reddit ha intensificado sus esfuerzos para proteger su contenido de las empresas de inteligencia artificial que acceden a él sin el consentimiento de los usuarios. En un movimiento significativo, la plataforma ha decidido bloquear el acceso de Internet Archive, impidiendo que esta pueda archivar sus páginas a través de la conocida Wayback Machine.
Según indican diversos medios, Reddit está preocupado por cómo estas empresas han estado aprovechándose de un vacío legal para extraer información de sus publicaciones. La preocupación radica en que las versiones archivadas por la Wayback Machine pueden estar siendo utilizadas para llevar a cabo el scraping, es decir, la recolección automatizada de datos. Ante esta situación, Reddit ha implementado restricciones que limitan el acceso de Internet Archive, permitiendo únicamente que se indexe la página principal de su sitio web. Esto significa que los detalles de publicaciones, comentarios e información de perfiles ya no estarán disponibles para archivarse.
Este cambio en la política de Reddit no es un acontecimiento aislado. En el pasado, la compañía ya había intentado bloquear el scraping automatizado modificando su protocolo robots.txt. Aunque originalmente se declaró que Internet Archive no se vería afectada por esto, la reciente decisión indica una clara evolución en la postura de Reddit hacia la preservación de su contenido.
Un portavoz de Reddit comentó que, aunque Internet Archive ofrece un servicio valioso al internet, ha habido casos en los que las empresas de IA han violado las políticas de diversas plataformas, incluyendo la de Reddit, utilizando datos extraídos de la Wayback Machine.
La Wayback Machine es una herramienta fundamental que permite archivar sitios web, funcionando como una biblioteca digital extensa que ayuda a preservar contenido en línea. Esto es especialmente importante para materiales que pueden ser antiguos o pertenecen a sitios que ya no están activos. Sin embargo, con la restricción impuesta por Reddit, la disponibilidad de contenido de la plataforma en Internet Archive se verá notablemente reducida.
Es pertinente recordar que Reddit ha entablado acuerdos con gigantes como Google y OpenAI para que utilicen su contenido en el entrenamiento de sus modelos de inteligencia artificial. No hace mucho, Reddit también presentó una demanda contra Anthropic, acusando a la empresa de haber accedido a sus datos sin autorización, un caso que resalta aún más la tensión entre plataformas y empresas de IA.
Recientemente, Internet Archive se vio envuelta en controversias al reportar un hackeo que resultó en la filtración de datos de millones de usuarios, lo que dejó la herramienta fuera de servicio durante varios días. Hasta el momento, ni la plataforma ni su fundador, Brewster Kahle, han emitido una declaración sobre la nueva política de restricción de Reddit.
Con estos cambios, la batalla por el control y el acceso a la información en línea se intensifica, planteando preguntas sobre la ética y la responsabilidad en el uso de datos en la era digital.
Gracias por leer Columna Digital, puedes seguirnos en Facebook, Twitter, Instagram o visitar nuestra página oficial. No olvides comentar sobre este articulo directamente en la parte inferior de esta página, tu comentario es muy importante para nuestra área de redacción y nuestros lectores.


