
A veces en tecnología malinterpretamos nuestra historia. Por ejemplo, porque linux eventualmente mercantilizó las guerras de Unix, y debido a que Apache y Kubernetes se convirtieron en las tuberías estándar de la web, asumimos que la “apertura” es una fuerza inevitable de la naturaleza. La narrativa es reconfortante; también está mayoritariamente mal.
Al menos, no es completamente correcto en la forma en que a veces suponen los defensores.
Cuando fuente abierta gana, no es porque sea moralmente superior o porque “muchos ojos hacen que todos los insectos sean superficiales” (Ley de Linus). Domina cuando una tecnología se convierte en una infraestructura que todos necesitan pero en la que nadie quiere competir.
Mire el mercado de sistemas operativos para servidores. Linux ganó porque el sistema operativo se convirtió en una mercancía. No había ninguna ventaja competitiva en construir un kernel propietario mejor que el de su vecino; el valor subió en la pila hasta las aplicaciones. Entonces, empresas como Google, Facebook y Amazon invirtieron recursos en Linux, compartiendo efectivamente el costo de mantenimiento de las cosas aburridas para poder competir en las cosas interesantes donde los datos y la escala son más importantes (búsqueda, gráficos sociales, servicios en la nube).
Esto nos lleva a la IA. Los defensores del código abierto señalan la explosión de modelos de “pesos abiertos” como Meta's Llama o la impresionante eficiencia de El movimiento de código abierto de DeepSeeky declaran que la era cerrada de OpenAI y Google ya ha terminado. Pero si nos fijamos en el dinero real que cambia de manos, los datos cuentan una historia diferente y mucho más interesante, una con una interacción continua entre el código abierto y el cerrado.
Perder 25 mil millones de dólares
Un informe reciente y fascinante de Frank Nagle (Fundación Harvard/Linux) titulado “El papel latente de los modelos abiertos en la economía de la IA«intenta cuantificar esta desconexión. El equipo de Nagle analizó datos de OpenRouter y encontró una asombrosa ineficiencia en el mercado. Los modelos abiertos de hoy logran rutinariamente el 90% (o más) del rendimiento de los modelos cerrados, mientras que su funcionamiento cuesta aproximadamente una sexta parte. En un entorno económico puramente racional, las empresas deberían abandonar GPT-4 por Llama 3 en masa.
Nagle estima que al seguir con modelos cerrados costosos, el mercado global está dejando aproximadamente 24.800 millones de dólares sobre la mesa al año. La conclusión académica es que se trata de una falla temporal del mercado, resultado de la “asimetría de información” o la “confianza en la marca”. La implicación es que una vez que los CIO se den cuenta de que están pagando de más, cambiarán al código abierto y los gigantes propietarios caerán.
No apuestes por ello.
Para entender por qué las empresas están felizmente “desperdiciando” 24 mil millones de dólares, y por qué la IA probablemente seguirá siendo un híbrido de código abierto y servicios cerrados, tenemos que dejar de mirar la IA a través de la lente del desarrollo de software de la década de 1990. Como he escrito, El código abierto no salvará la IA porque la física de la IA es fundamentalmente diferente de la física del software tradicional.
La prima de conveniencia
A principios de la década de 2010, vimos una “ineficiencia” similar con el auge de la computación en la nube. Puede descargar exactamente el mismo software de código abierto que vendía AWS (MySQL, Linux, Apache) y ejecutarlo usted mismo de forma gratuita. Sin embargo, como Observé que los desarrolladores y las empresas acudieron en masa a la nube.pagando una prima enorme por el privilegio de no administrar el software ellos mismos.
La comodidad triunfa sobre la libertad de código. Cada vez.
La “pérdida” de 24 mil millones de dólares que Nagle identifica no es dinero desperdiciado; es el precio de la conveniencia, la indemnización y la confiabilidad. Cuando una empresa paga OpenAI o Anthropic, no solo está comprando generación de tokens. Están comprando un acuerdo de nivel de servicio (SLA). Están comprando filtros de seguridad. Están comprando la posibilidad de demandar a alguien si la modelo alucina algo difamatorio.
No puedes demandar a un repositorio de GitHub.
Aquí es donde el argumento de que “la apertura gana” se vuelve realidad. En la pila de IA, los pesos de los modelos se están convirtiendo en “trabajo pesado indiferenciado”, la infraestructura aburrida que todos necesitan pero que nadie quiere administrar. La capa de servicio (los bucles de razonamiento, la integración, la cobertura aérea legal) es donde reside el valor. Es probable que esa capa permanezca cerrada.
La 'comunidad' que no era
Hay un problema estructural más profundo con la analogía de “Linux de la IA”. Linux ganó porque aprovechó una gran comunidad descentralizada de contribuyentes. El barrera de entrada por contribuir a un modelo de lenguaje grande (LLM) es mucho mayor. Puede corregir un error en el kernel de Linux en una computadora portátil. No se puede arreglar una alucinación en un modelo de 70 mil millones de parámetros sin acceso a los datos de entrenamiento originales y a un grupo de cómputo que cuesta más de lo que cualquier desarrollador individual puede permitirse, a menos que seas Elon Musk o Bill Gates.
También está en juego una inversión de talento. En la era Linux, los mejores desarrolladores estaban dispersos, lo que hacía del código abierto la mejor manera de colaborar. En la era de la IA, el talento escaso (los investigadores que entienden las matemáticas detrás de la magia) se está acumulando dentro de los jardines amurallados de Google y OpenAI.
Esto cambia la definición de «abierto». Cuando Meta lanza Llama, la licencia es casi irrelevante debido a las barreras para ejecutar y probar ese código a escala. No te están invitando a co-crear la próxima versión. Esta es una distribución de “fuente disponible”, no un desarrollo de código abierto, independientemente de la licencia. El ciclo de contribución de los modelos de IA se ha roto. Si la “comunidad” (invocamos esa palabra nebulosa con demasiada naturalidad) no puede parchear, entrenar o bifurcar eficazmente el modelo sin millones de dólares en hardware, entonces el modelo no es verdaderamente abierto en el sentido que importa para la sostenibilidad a largo plazo.
Entonces, ¿por qué Meta, Mistral y DeepSeek lanzan estos potentes modelos de forma gratuita? Como he escrito durante años, El código abierto es egoísta.. Las empresas contribuyen al código abierto no por caridad, sino porque mercantiliza el producto de un competidor y al mismo tiempo libera recursos para pagar más por sus productos patentados. Si la capa de inteligencia se vuelve gratuita, el valor pasa a las plataformas propietarias que utilizan esa inteligencia (convenientemente, Meta posee algunas de ellas, como Facebook, Instagram y WhatsApp).
Dividir el mercado en abierto y cerrado
Nos dirigimos hacia una futuro híbrido y desordenado. La distinción binaria entre abierto y propietario se está disolviendo en un espectro de pesos abiertos, datos abiertos (raros) y servicios completamente cerrados. Así es como veo que la pila se sacude.
Los modelos base estarán abiertos. La diferencia entre GPT-4 y Llama 3 ya es insignificante para la mayoría de las tareas comerciales. Como muestran los datos de Nagle, la velocidad de recuperación se está acelerando. Así como no paga por una pila TCP/IP, pronto tampoco pagará por la generación de tokens sin procesar. Esta área estará dominada por jugadores como Meta y DeepSeek que se benefician del caos del ecosistema.
El dinero real pasará a la capa de datos, que seguirá cerrada. Es posible que tenga el modelo, pero si no tiene los datos de propiedad para afinarlo para diagnósticos médicos, descubrimientos legales o logística de la cadena de suministro, el modelo es un juguete. Las empresas protegerán sus conjuntos de datos con mucha más ferocidad que nunca protegieron su código fuente.
La capa de razonamiento y agencia también permanecerá cerrada, y ahí es donde se esconderán los ingresos de alto margen. No se trata de generar texto; se trata de hacer cosas. Los agentes que pueden navegar de forma autónoma por su instancia de Salesforce, negociar un contrato o actualizar su sistema ERP serán propietarios porque requieren integraciones complejas y estrechamente acopladas y protecciones de responsabilidad.
Las empresas también pagarán por las herramientas que garanticen que no filtren accidentalmente propiedad intelectual o generen discursos de odio, cosas como observabilidad, seguridad y gobernanza. El modelo puede ser gratuito, pero las barandillas le costarán.
siguiendo el dinero
El informe de Frank Nagle identifica correctamente que los modelos abiertos son técnicamente competitivos y económicamente superiores en el vacío. Pero los negocios no suceden en el vacío. Sucede en una sala de juntas donde el riesgo, la conveniencia y la velocidad dictan las decisiones.
La historia del código abierto no es una línea recta hacia la apertura total. Es una línea irregular donde el código se vuelve gratuito y los servicios se vuelven caros. La IA no será diferente. El futuro es el mismo de siempre: componentes abiertos que impulsan servicios cerrados.
Los ganadores no serán los puristas ideológicos. Los ganadores serán los pragmáticos que tomen los modelos abiertos y gratuitos, los envuelvan en datos propietarios y protocolos de seguridad y los vendan a la empresa a un precio superior. Esa brecha de 24 mil millones de dólares simplemente se reasignará a las empresas que resuelvan el problema de la “última milla” de la IA: un problema que el código abierto, a pesar de todas sus muchas virtudes, nunca ha sido particularmente bueno en resolver.




