
Fuera de fuegos artificiales y al fuego
Sin embargo, mi comienzo con el Qwen alojado de Cerebras no fue lo mismo que experimenté (por mucho más dinero) en Fuegos artificialesotro proveedor. Inicialmente, el Qwen de Cerebras ni siquiera funcionó en mi CLI. Tampoco parecía funcionar en Código de ROO o cualquier otra herramienta que supiera usar. Después de tomar un informe de errores, Cerebras me dijo que era mi código. Mi mismo CLI que funcionó en fuegos artificiales, para Claude, para GPT-4.1 y GPT-5, para O3, para Qwen alojado por Qwen/Alibaba, dijo Cerebras. Para ser justos, mi registro incluyó artefactos engañosos cuando las cerebras fragmentaron la transmisión, sacando partes de la corriente como mensajes (que las cerebras aún lo hacen en ocasiones). Sin embargo, este ha sido generalmente su enfoque. No arregle su llamada compatibilidad de OpenAI: guíe y/o adapte al cliente. Tomé el desafío y adapté mi CLI, pero fueron muchas soluciones. Este fue un contraste masivo con los fuegos artificiales. Tuve problemas con los fuegos artificiales cuando comenzó y les mostró mi salida de depuración; Inmediatamente reconocieron el problema (ocasionalmente escupía llamadas de herramientas nativas corruptas en lugar de salida al estilo Operai) y lo arreglaron durante la noche. Las cerebras afirmaron repetidamente que su infraestructura funcionaba perfectamente y las solicitudes fueron exitosas, en contradicción directa con la mayoría de los comentarios sobre su discordia.
Sintiendo que finalmente había descifrado la nuez después de tres semanas de pruebas y adaptaciones de encendido y apagado, tomé una segunda cuenta de Cerebrase Code Max cuando la ventana se abrió nuevamente. Esto fue después de descubrir que durante parte del tiempo, las cerebras me habían cobrado por una cuenta máxima, pero me dieron una cuenta profesional. Lo arreglaron y no ofrecieron compensación por los días en que mi servicio se estableció en Pro, no Max, y es difícil de probar porque su consola analítica está rota, en parte porque proporciona mediciones a tiempo local, pero los límites están en UTC.
Entonces hice los cálculos. Una cuenta de Cerebrase Code Max está limitada a 120 millones de tokens por día a un costo equivalente a cuatro veces que la de una cuenta Pro Cerebrase Code Pro. La cuenta Pro es de 24 millones de fichas por día. Si multiplica eso por cuatro, obtienes 96 millones de tokens. Sin embargo, la cuenta Pro está limitada a 300k tokens por minuto, en comparación con 400k para el máximo. Usar cerebras es un poco frustrante. Durante 10 a 20 segundos, realmente vuela, luego golpeas la tapa en las fichas por minuto, y arroja 429 errores (demasiadas solicitudes) hasta que el minuto sube. Si su herramienta de codificación es inteligente, solo volverá a intentarlo con un retroceso exponencial. Si no, romperá la corriente. Entonces, si hubiera comprado cuatro cuentas profesionales, podría haber tenido 1,200,000 TPM en teoría, un valor mucho mejor que la cuenta máxima.




