Ya sabes cómo dicen: «¡No es una competencia!» Bueno, no dejes que te mientan; Todo es una competencia, especialmente cuando se trata de IA. Rara vez hay un día en el que no estoy probando capacidades de IA entre varios chatbots, y casi siempre me sorprenden los resultados. Algunas plataformas son realmente mejores que otras, al menos para algunas tareas.
Este viaje comenzó con Notas sobre mi iPhone 17 Pro Max. Por lo general, me gusta grabar entrevistas en un teléfono inteligente Android como el Google Pixel 10 Pro plegable, donde la fantástica aplicación Grabadora captura de manera experta cada expresión y, en la transcripción, hace un hábil trabajo al separar y etiquetar a cada hablante.
Gemini 3 Pro se pone los guantes
En los últimos meses he estado impresionado con las capacidades de Google Geminiespecialmente los últimos modelos 3 Pro, y cómo parece manejar casi cualquier solicitud inmediata con aplomo.
Ahora que tenía la idea, tenía que descubrir cómo hacer que Gemini escuchara la grabación. Reproducir el audio en los parlantes de mi iPhone y pedirle a Gemini que escuchara estaba fuera de lugar porque me preocupaba qué tan bien, digamos, mis micrófonos de escritorio podrían captar el sonido que sale de los parlantes del iPhone. Además, estaba en la oficina y no quería que la gente escuchara la conversación privada (hasta que publiqué una historia).
Primero, descubrí que podías descargar el archivo de audio desde Notes. En la reproducción, debajo de los tres puntos, hay un botón Compartir que me permite enviar por aire el archivo de audio a mi MacBook Pro de 14 pulgadas. Viene como un archivo MPEG-4 (M4A).
Allá por Géminis 3 Proseleccioné el signo «+» en el campo del mensaje, elegí el archivo de audio M4A y agregué este breve mensaje: «Escuche esto, transcríbalo y asegúrese de identificar a los diferentes hablantes».
No hubo ida y vuelta. Germini 3 Pro rápidamente comenzó a escupir la transcripción completa con los oradores identificados como «Entrevistador» y el nombre y título de mi tema. Vale la pena señalar aquí que esto es lo único en lo que Gemini 3 Pro inexplicablemente se equivocó por completo. Aunque mi sujeto deletreó su nombre al final de la charla, Géminis eligió uno diferente. Aparte de eso, sin embargo, Géminis identificó perfectamente cuándo era yo o el sujeto quien hablaba. Y la precisión fue realmente impresionante.
Para estar completo, le pedí a Gemini 3 Pro que corrigiera la identificación de mi sujeto y me incluyera como «entrevistador». Una vez solucionado eso, utilicé felizmente la transcripción para ayudarme a impulsar mi historia completa.
En este rincón, ChatGPT
Sin embargo, naturalmente tenía curiosidad por saber si ChatGPT 5.1 (con una cuenta Plus) podría realizar la misma tarea.
En la ventana del mensaje ChatGPT, seleccioné el archivo de audio e ingresé exactamente el mismo mensaje. ChatGPT me dijo, «Definitivamente puedo transcribir audio, pero no puedo acceder ni reproducir el archivo .m4a directamente desde la ubicación a la que hizo referencia».
Lo que siguió fue un extenso intercambio en el que ChatGPT siguió sugiriéndome diferentes formas de cargar el archivo, incluida transformarlo en un archivo zip. No importa lo que hiciera, ChatGPT mostraba el archivo de audio en la ventana de aviso, pero no podía escucharlo.
Al parecer, en esta pequeña competencia, Gemini 3 Pro es el vencedor, convirtiendo un problema frustrante en una victoria fácil. Cuanto menos se diga sobre lo inútil que es ManzanaCuanto mayor sea la transcripción de las notas, mejor.

Los mejores portátiles empresariales para todos los presupuestos
Siga TechRadar en Google News y agréganos como fuente preferida para recibir noticias, reseñas y opiniones de nuestros expertos en sus feeds. ¡Asegúrate de hacer clic en el botón Seguir!
Y por supuesto también puedes sigue a TechRadar en TikTok para noticias, reseñas, unboxings en forma de video y reciba actualizaciones periódicas de nuestra parte en WhatsApp también.




