• Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions
sábado, diciembre 27, 2025
No Result
View All Result
Corresponsal 360
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
No Result
View All Result
Corresponsal 360
No Result
View All Result
Home Tecnología

Un cofundador del campeón europeo de la IA 'open source' usó millones de libros con copyright cuando trabajaba en los modelos de Meta

by Team
diciembre 27, 2025
in Tecnología
0
Un cofundador del campeón europeo de la IA 'open source' usó millones de libros con copyright cuando trabajaba en los modelos de Meta


La IA nos ofrece modelos cada vez más potentes y capaces, pero ¿de dónde provienen los datos que hacen todo eso posible? Documentos judiciales, correos internos y testimonios de antiguos empleados, revelados recientemente por el medio francés Mediapart, arrojan nueva luz sobre una práctica ya conocida como el uso masivo de libros pirateados para entrenar modelos de lenguajepero también sobre la participación en la misma de quien hoy es una figura central de la IA europea.

El corazón del escándalo: LibGen y los modelos LLaMA

En el centro de las revelaciones se encuentra Biblioteca Génesisconocida como Biblioteca Génesis (LibGen)una 'biblioteca no autorizada' que reúne millones de libros protegidos por derechos de autoraccesibles sin autorización de los titulares legales.

Según la investigación de MediaparteMeta habría recurrido de forma reiterada a LibGen para entrenar su familia de modelos Llamadestinados a competir con sistemas como ChatGPT. Los documentos analizados indican que las descargas comenzaron en octubre de 2022alcanzando un volumen estimado en 70 terabytes de datoses decir, decenas de millas de libros digitalizados.

El uso de estas fuentes no habría sido marginal ni accidental. Correos electrónicos internos y fragmentos de código que sugieren la práctica fue conocida y discutida dentro de los equipospese a las dudas expresadas por algunos empleados sobre su legalidad.

La responsabilidad de la dirección de Meta

Las revelaciones no se limitan a iniciativas individuales. Según los documentos judiciales, la dirección de Meta estaba informada: algunos archivos sugieren incluso que Mark Zuckerberg respaldó el uso de estos conjuntos de datos, en un contexto donde adquirir licencias legales para millones de libros habría supuesto costes astronómicos y largos plazos de negociación.

El laboratorio FAIR, dirigido entonces por el reconocido investigador Yann LeCunaparece como el espacio donde se toman muchas de estas decisiones. Tras el lanzamiento de LLaMA, Meta habría sido considerada brevemente regularizar el acceso a contenidos licenciadosantes de volver a recurrir a fuentes 'gratuitas'.


Las tecnológicas empezaron a bajar torrents con miles de libros y nacieron los chatbots. De aquellos polvos estos lodos

Guillaume Lample, de Meta a Mistral AI

Uno de los nombres que emergen con fuerza es el de Guillaume Lampeentonces investigador en el laboratorio FAIR (Fundamental AI Research) de Meta y hoy cofundador y director científico de Mistral AI.

De acuerdo con los documentos revelados durante el juicio que enfrenta a Meta con varios autores, entre ellos el escritor Richard Kadrey, Guillaume Lample. Habría impulsado activamente el uso de LibGen. dentro de Meta. En intercambios internos, citados por Mediapart, se le atribuye la afirmación de que «todo el mundo usa LibGen»mencionando a OpenAI, Google y DeepMind como ejemplos.

Cuando otros empleados plantearon la necesidad de consultar al departamento legal, Lample habría respondido que no habia hecho preguntasasumiendo que se trataba de una práctica común en el sector.

Mistral AI y sus promesas de transparencia bajo sospecha

El interés mediático por Guillaume Lample no se explica solo por su pasado en Meta: En 2023, fundó Mistral AI.una start-up francesa que se convirtió en tiempo récord en uno de los actores más influyentes del ecosistema europeo de la IA, con una valoración multimillonaria.

Desde su creación, Mistral AI ha defendido una estrategia basada en datos 'de alta calidad' y acuerdos de licenciafirmando alianzas con instituciones como la AFP, el INA o la Biblioteca Nacional de Francia.

Sin embargo, ex empleados de Meta citados por Mediapart sostienen que LibGen también pudo haber sido utilizado en las primeras fases de desarrollo. del modelo Mistral 7Baunque No existe por ahora prueba documental que lo confirme. La empresa, tras ser contactada por Mediapart, asegura sus modelos con

«Información públicamente disponible, conjuntos de datos licenciados y datos sintéticos generados internamente».

Un debate que va más allá de lo tecnológico

Este caso se inscribe en un conflicto más amplio: tanto en Estados Unidos como en Europa, autores, editoriales y artistas multiplican las demandas judiciales contra empresas de IA, acusándolas de apropiarse de obras protegidas sin compensación.

Las revelaciones sobre Meta y LibGen muestran que el problema no es marginal, sino estructural. Entrenar grandes modelos de lenguaje requiere cantidades colosales de datos, y el acceso legal a ese material choca con los intereses económicos y la velocidad del mercado.

En última instancia, todo se resume a una pregunta: ¿Puede la innovación tecnológica justificarse a costa de los derechos de los creadores?

Vía | Mediaparte

Imagen | Marcos Merino mediante IA

En Genbeta | Pidieron a ChatGPT que escribiera un libro de 'Juego de Tronos'. El resultado fue tan bueno que acabará en los tribunales

Tags: 39opencampeóncofundadorconCopyrightcuándodeleuropeolibroslosMetamillonesmodelossource39trabajabauso
Team

Team

Next Post
Canarialicitya nuevos ecógrafos para la Atención Hospitalaria

Canarialicitya nuevos ecógrafos para la Atención Hospitalaria

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Recomendada

Trekkings con base en Lodges en Perú | Senderos Andinos

Treks basados en la cabaña en Perú | Senderos andinos

5 meses ago
MP detecta indicios criminales en la muerte del niño Édgar Gadiel Alvarado Castellanos

MP detecta indicios criminales en la muerte del niño Édgar Gadiel Alvarado Castellanos

11 horas ago

Noticias populares

  • «EVOLARA: TU SEGUNDO VUELO»

    «EVOLARA: TU SEGUNDO VUELO»

    0 shares
    Share 0 Tweet 0
  • 15 lugares para visitar en la Antártida no puede permitirse perderse

    0 shares
    Share 0 Tweet 0
  • Banco de semillas liderado por indígenas protege la biodiversidad del Amazonas – Latin America News Dispatch

    0 shares
    Share 0 Tweet 0
  • La Inteligencia Artificial Gran Aporte al Turismo en la Región de Los Lagos

    0 shares
    Share 0 Tweet 0
  • INFORME: Los demócratas pusieron al corrupto fiscal general de Obama, Eric Holder, a cargo de examinar a los candidatos a vicepresidente para Kamala Harris | The Gateway Pundit

    0 shares
    Share 0 Tweet 0

Sobre nosotras

Bienvenido a corresponsal360.com ¡El objetivo de corresponsal360.com es brindarle las mejores fuentes de noticias para cualquier tema! Nuestros temas se seleccionan cuidadosamente y se actualizan constantemente, ya que sabemos que la web se mueve rápido y nosotros también lo intentamos.

Categoría

  • Blog
  • Cultura
  • Deportes
  • Noticias
  • Política
  • Salud
  • Tecnología
  • Turismo

Mensajes recientes

  • ¿Cómo vivían en el Imperio Romano?
  • Los científicos fabrican material que puede transformarse en cualquier cosa con solo tirar de una cuerda
  • La elegancia italiana se vuelve más deportiva.
  • Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions

Copyright © 2024 Corresponsal360.com | All Rights Reserved.

No Result
View All Result
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura

Copyright © 2024 Corresponsal360.com | All Rights Reserved.