
Gemini 3 de Google finalmente está aquí y estamos impresionados con los resultados, especialmente cuando se trata de crear juegos simples.
Gemini 3 Pro es un modelo impresionante y los primeros puntos de referencia lo confirman.
Por ejemplo, encabeza la clasificación de LMArena con una puntuación de 1501 Elo. También ofrece razonamiento a nivel de doctorado con puntuaciones máximas en el último examen de la humanidad (37,5% sin el uso de ninguna herramienta) y GPQA Diamond (91,9%).
Los resultados de la vida real también respaldan estos números.
Pietro Schirano, quien creó MagicPath, una herramienta de codificación de vibraciones para diseñadores, dice que estamos entrando en una nueva era con Gemini 3.
En sus pruebas, Gemini 3 Pro creó con éxito un editor LEGO 3D de una sola vez. Esto significa que un solo mensaje es suficiente para crear juegos simples en Gemini 3, lo cual es un gran problema si me preguntas.
Le pedí a Gemini 3 Pro que creara un editor LEGO 3D.
De una sola vez, logró lograr la interfaz de usuario, la lógica espacial compleja y toda la funcionalidad.Estamos entrando en una nueva era. pic.twitter.com/Y7OndCB8CK
– Pietro Schirano (@skirano) 18 de noviembre de 2025
Los LLM han sido tradicionalmente malos con los juegos, pero Gemini 3 muestra algunas mejoras en esa dirección.
También es sorprendente en los juegos.
Recreó el antiguo juego de iOS llamado Ridiculous Fishing a partir de solo un mensaje de texto, incluidos efectos de sonido y música. pic.twitter.com/XIowqGt4dc– Pietro Schirano (@skirano) 18 de noviembre de 2025
Esto se alinea con las afirmaciones de Google de que Gemini 3 Pro redefine el razonamiento multimodal con un 81% en MMMU-Pro y un 87,6% en los puntos de referencia Video-MMMU.
«También obtiene una puntuación de 72,1% en SimpleQA Verified, lo que muestra un gran progreso en la precisión de los hechos», Google anotado en una publicación de blog.
«Esto significa que Gemini 3 Pro es altamente capaz de resolver problemas complejos en una amplia gama de temas como ciencias y matemáticas con un alto grado de confiabilidad».
Gemini 3 es impresionante en mis primeras pruebas, pero el cumplimiento sigue siendo un problema
He estado usando Claude Code durante un año y ha sido de gran ayuda con mis proyectos Flutter/Dart.
Gemini 3 es un modelo mejor que Claude Sonnet 4.5, pero hay algunas áreas en las que Claude brilla.
Hasta ahora, ningún modelo se ha acercado al Código Claude, especialmente en cuanto a adherencia, y Gemini 3 no es una excepción.
Una de las áreas es la adherencia.
Personalmente, encontré que Claude Code es mejor para seguir instrucciones. Asimismo, Claude Code también es una CLI mejor que Gemini 3 Pro, lo que le da una ventaja sobre la competencia.
Para todo lo demás, Gemini 3 es una mejor opción, especialmente si has estado usando Gemini 2.5 Pro.
Si utiliza LLM, le recomiendo que utilice Sonnet 4.5 para tareas habituales y Gemini 3 Pro para consultas complejas.
¡Es temporada de presupuesto! Más de 300 CISO y líderes de seguridad han compartido cómo planifican, gastan y priorizan para el próximo año. Este informe recopila sus conocimientos, lo que permite a los lectores comparar estrategias, identificar tendencias emergentes y comparar sus prioridades de cara al 2026.
Descubra cómo los principales líderes están convirtiendo la inversión en un impacto mensurable.






