Las marcas de medios en línea, incluidos Yahoo, Quora y Medium, están dando un nuevo paso para evitar que las compañías de IA copien y usen su contenido para capacitar modelos sin su permiso.
Los editores, incluida la empresa matriz de CNET, Ziff Davis, vea esta nueva herramienta, llamada RSLcomo otra forma de garantizar que los grandes desarrolladores de IA no usen su trabajo sin pago o compensación, un problema que ya ha llevado a una gran cantidad de demandas.
RSL, que significa licencias realmente simples, se inspira en Sindicación realmente simpleun estándar web desde hace mucho tiempo que proporciona actualizaciones de contenido actualizadas y automáticas en un formato legible por computadora. Al igual que RSS, RSL está abierto, descentralizado y puede funcionar con casi cualquier contenido en línea, incluidas páginas web, videos y conjuntos de datos.
En este momento, cuando el robot de Internet de una compañía de IA, conocido como rastreador, quiere absorber la información en un sitio, tiene que pasar por robots.txt, que actúa como una entrada básica o una puerta sin entrada. Las empresas de IA tienen encontró formas alrededor de robots.txt o lo ignoró por completo y tener posteriormente ha sido demandado. El objetivo de RSL es ser una capa de tecnología más robusta para tratar con los rastreadores de IA, que ahora representan Más de la mitad de todo el tráfico de Internet. (Divulgación: Ziff Davis, la empresa matriz de CNET, en abril presentó una demanda contra OpenAi, alegando que infringió los derechos de autor de Ziff Davis en la capacitación y la operación de sus sistemas de IA).
«RSL se basa directamente en el legado de RSS, proporcionando la capa de licencia faltante para Internet AI-First», dijo Tim O'Reilly, CEO de O'Reilly Media, en un comunicado de prensa. «Asegura que los creadores y editores que alimentan la innovación de IA no sean solo parte de la conversación, sino que compensan bastante el valor que crean».
Las marcas que han firmado en RSL incluyen Reddit, People, Internet Brands, Fastly, Wikihow, O'Reilly, Daily Beast, MIT Press, Miso, Adweek, Ranker, Evolve Media y Raptive.
«Si la IA está capacitada en el trabajo de nuestros escritores, entonces debe pagar ese trabajo», dijo el CEO Medium Tony Stubblebine en un comunicado de prensa. «En este momento, la IA se ejecuta en contenido robado. Adoptar este estándar RSL es cómo obligaremos a esas compañías de IA a pagar lo que usan, dejar de usarlo o apagar».
El advenimiento de RSL se produce cuando el tráfico web en línea se ha cratado con cambios en Google y la preponderancia de la IA. Las respuestas integradas generadas por la IA de Google en la parte superior de Google Search han sido criticado por editores Al quitar los clics potenciales, habrían recibido de otra manera. Google sostiene que envían las descripciones de IA «Haga clic de mayor calidad«Para los sitios, las personas que están más comprometidas y permanecen en los sitios por más tiempo. Los chatbots de IA como ChatGPT también ayudan con la investigación y la síntesis, lo que significa que las personas no tienen que saltar por varios sitios para reunir piezas de información de la misma manera que antes. Infactivo.
«La adopción generalizada del estándar RSL protegerá la integridad del trabajo original y acelerará un marco mutuamente beneficioso para editores y proveedores de IA», dijo el CEO de Ziff Davis, Vivek Shah.
En respuesta, los editores están demandando a las compañías de IA o entendiendo acuerdos de licencia. En otros casos, los sitios están recurriendo a servicios como Tollbit, cuyo objetivo es cargar rastreadores de IA cada vez que solicitan examinar el contenido de un sitio. Las redes de entrega de contenido como CloudFlare, que ayudan a garantizar que las personas tengan acceso rápido a los sitios en línea, son Bloqueando los rastreadores de IA directamente.
El cofundador de RSL, Eckart Walther, dijo que el estándar RSL y los esfuerzos como ese por Cloudflare son complementarios, con muchas de las mismas compañías de medios que participan en ambas. Walther comparó las herramientas como Cloudflare con los gorilas que protegen un sitio web de los rastreadores no deseados, mientras que RSL solo permite que el rastreador comprenda las reglas y el precio de la admisión. «Estos métodos de compensación también pueden funcionar juntos. Por ejemplo, un editor puede querer cobrar por rastrearse su contenido, y luego también requiere un pago de regalías cada vez que el contenido sea utilizado por un modelo de IA para responder a una pregunta», dijo Walther en un correo electrónico a CNET.




