La plataforma ArXiv, reconocida como un valioso repositorio abierto de investigaciones prepublicadas, está intensificando sus esfuerzos para regular el uso indebido de modelos de lenguaje amplios (LLMs) en trabajos científicos. Aunque los documentos se encuentran en el sitio antes de ser revisados por pares, ArXiv ha alcanzado una estatura crucial en la diseminación de investigaciones en disciplinas como la informática y las matemáticas. Además, se ha convertido en una fuente de datos sobre las tendencias en la investigación científica.
Para abordar el creciente fenómeno de trabajos de baja calidad generados por inteligencia artificial, ArXiv ha implementado medidas como exigir que los nuevos autores obtengan el aval de un investigador establecido. El repositorio, que fue gestionado por Cornell durante más de dos décadas, ha decidido convertirse en una organización sin fines de lucro. Este cambio le permitirá recaudar más fondos para abordar cuestiones como la calidad de los trabajos publicados.
En un movimiento reciente, Thomas Dietterich, presidente de la sección de informática de ArXiv, anunció que, si se encuentra evidencia clara de que los autores no verificaron los resultados generados por LLM, esto comprometería la confianza en el documento. Pruebas irrefutables podrían incluir referencias fabricadas y comentarios generados tanto por los autores como por el modelo de lenguaje. Ante tales evidencias, los autores podrían enfrentar una prohibición de un año en la plataforma, seguida de la exigencia de que futuras presentaciones sean aceptadas primero por un medio revisado de forma reputada.
Es importante señalar que esta regulación no prohíbe el uso de modelos de lenguaje, sino que exige que los investigadores asuman la responsabilidad total del contenido, independientemente del método de elaboración. Así, si se copian y pegan contenidos inapropiados, plagiados o erróneos provenientes de LLM, los autores serán considerados responsables.
Dietterich aclaró que se aplicará una regla de “una sola oportunidad”, aunque los moderadores deberán señalar el problema y los presidentes de sección tendrán la tarea de confirmar las evidencias antes de imponer sanciones. Los autores también tendrán la opción de apelar cualquier decisión tomada en su contra.
Investigaciones recientes, revisadas por pares, han identificado un aumento en la aparición de citas fabricadas en la investigación biomédica, fenómeno que se atribuye en parte a la influencia de los LLM. Sin embargo, cabe mencionar que no sólo los científicos han caído en este tipo de errores, sino que varios individuos ajenos a la investigación también han utilizado citas que resultaron ser ficticias.
Este enfoque de ArXiv refleja una creciente preocupación en la comunidad científica sobre la integridad y la calidad de la investigación en un mundo donde las herramientas de inteligencia artificial continúan evolucionando. La fecha de publicación de esta información es 16 de mayo de 2026, y los desarrollos posteriores pueden haber influido en esta situación.
Gracias por leer Columna Digital, puedes seguirnos en Facebook, Twitter, Instagram o visitar nuestra página oficial. No olvides comentar sobre este articulo directamente en la parte inferior de esta página, tu comentario es muy importante para nuestra área de redacción y nuestros lectores.
![[post_title]](https://columnadigital.com/wp-content/uploads/2026/05/ArXiv-sancionara-autores-por-uso-excesivo-de-IA-1140x570.jpg)

