• Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions
jueves, diciembre 25, 2025
No Result
View All Result
Corresponsal 360
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura
No Result
View All Result
Corresponsal 360
No Result
View All Result
Home Tecnología

Tuve un gran problema con la transcripción de audio: Gemini lo resolvió y ChatGPT no

by Team
diciembre 5, 2025
in Tecnología
0
Tuve un gran problema con la transcripción de audio: Gemini lo resolvió y ChatGPT no


Ya sabes cómo dicen: «¡No es una competencia!» Bueno, no dejes que te mientan; Todo es una competencia, especialmente cuando se trata de IA. Rara vez hay un día en el que no estoy probando capacidades de IA entre varios chatbots, y casi siempre me sorprenden los resultados. Algunas plataformas son realmente mejores que otras, al menos para algunas tareas.

Este viaje comenzó con Notas sobre mi iPhone 17 Pro Max. Por lo general, me gusta grabar entrevistas en un teléfono inteligente Android como el Google Pixel 10 Pro plegable, donde la fantástica aplicación Grabadora captura de manera experta cada expresión y, en la transcripción, hace un hábil trabajo al separar y etiquetar a cada hablante.

Sin embargo, llegué a esta entrevista solo con mi iPhone. Sé que dentro de Notas, una aplicación que uso obsesivamente en mi iPhone y en mi escritorio (tengo casi 2500 notas), hay capacidades de grabación de audio escondidas debajo del ícono de archivo adjunto (un clip).

te puede gustar

Notes hace un buen trabajo al grabar audio y encontré mi grabación de 20 minutos perfectamente capturada en una nota. Se incluía lo que parecía ser una transcripción útil. Un escaneo rápido confirmó su precisión, pero había un gran problema: no etiquetaba los parlantes; todo mezclado en un largo soliloquio. Esto haría difícil escanear y separar las citas de mi sujeto de mis propias consultas y observaciones.

Me resigné a volver a escuchar, durante la cual agregué mis propias etiquetas… hasta que tuve un pensamiento diferente: ¿Y si Gemini pudiera ayudar?

Gemini 3 Pro se pone los guantes

En los últimos meses he estado impresionado con las capacidades de Google Geminiespecialmente los últimos modelos 3 Pro, y cómo parece manejar casi cualquier solicitud inmediata con aplomo.

Ahora que tenía la idea, tenía que descubrir cómo hacer que Gemini escuchara la grabación. Reproducir el audio en los parlantes de mi iPhone y pedirle a Gemini que escuchara estaba fuera de lugar porque me preocupaba qué tan bien, digamos, mis micrófonos de escritorio podrían captar el sonido que sale de los parlantes del iPhone. Además, estaba en la oficina y no quería que la gente escuchara la conversación privada (hasta que publiqué una historia).

Regístrese para recibir noticias de última hora, reseñas, opiniones, ofertas de alta tecnología y más.

Primero, descubrí que podías descargar el archivo de audio desde Notes. En la reproducción, debajo de los tres puntos, hay un botón Compartir que me permite enviar por aire el archivo de audio a mi MacBook Pro de 14 pulgadas. Viene como un archivo MPEG-4 (M4A).

Allá por Géminis 3 Proseleccioné el signo «+» en el campo del mensaje, elegí el archivo de audio M4A y agregué este breve mensaje: «Escuche esto, transcríbalo y asegúrese de identificar a los diferentes hablantes».

Géminis escucha y transcribe

(Crédito de la imagen: futuro)

No hubo ida y vuelta. Germini 3 Pro rápidamente comenzó a escupir la transcripción completa con los oradores identificados como «Entrevistador» y el nombre y título de mi tema. Vale la pena señalar aquí que esto es lo único en lo que Gemini 3 Pro inexplicablemente se equivocó por completo. Aunque mi sujeto deletreó su nombre al final de la charla, Géminis eligió uno diferente. Aparte de eso, sin embargo, Géminis identificó perfectamente cuándo era yo o el sujeto quien hablaba. Y la precisión fue realmente impresionante.

te puede gustar

Para estar completo, le pedí a Gemini 3 Pro que corrigiera la identificación de mi sujeto y me incluyera como «entrevistador». Una vez solucionado eso, utilicé felizmente la transcripción para ayudarme a impulsar mi historia completa.

En este rincón, ChatGPT

Sin embargo, naturalmente tenía curiosidad por saber si ChatGPT 5.1 (con una cuenta Plus) podría realizar la misma tarea.

En la ventana del mensaje ChatGPT, seleccioné el archivo de audio e ingresé exactamente el mismo mensaje. ChatGPT me dijo, «Definitivamente puedo transcribir audio, pero no puedo acceder ni reproducir el archivo .m4a directamente desde la ubicación a la que hizo referencia».

Lo que siguió fue un extenso intercambio en el que ChatGPT siguió sugiriéndome diferentes formas de cargar el archivo, incluida transformarlo en un archivo zip. No importa lo que hiciera, ChatGPT mostraba el archivo de audio en la ventana de aviso, pero no podía escucharlo.

Al parecer, en esta pequeña competencia, Gemini 3 Pro es el vencedor, convirtiendo un problema frustrante en una victoria fácil. Cuanto menos se diga sobre lo inútil que es ManzanaCuanto mayor sea la transcripción de las notas, mejor.


Círculo morado con las palabras Mejores portátiles empresariales en blanco.

Los mejores portátiles empresariales para todos los presupuestos

Nuestras mejores opciones, basadas en pruebas y comparaciones del mundo real

Siga TechRadar en Google News y agréganos como fuente preferida para recibir noticias, reseñas y opiniones de nuestros expertos en sus feeds. ¡Asegúrate de hacer clic en el botón Seguir!

Y por supuesto también puedes sigue a TechRadar en TikTok para noticias, reseñas, unboxings en forma de video y reciba actualizaciones periódicas de nuestra parte en WhatsApp también.




Tags: AUDIOChatGPTconGeminigranproblemaresolviótranscripciónTuve
Team

Team

Next Post
Las embajadas occidentales presionan para que se liberen los cuerpos de la violencia electoral

Las embajadas occidentales presionan para que se liberen los cuerpos de la violencia electoral

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Recomendada

La última adquisición de Meta sugiere planes de hardware más allá de gafas y auriculares

La última adquisición de Meta sugiere planes de hardware más allá de gafas y auriculares

3 semanas ago
¿Un respiro para las marcas de viajes o un dolor de cabeza inducido por la tecnología?

¿Un respiro para las marcas de viajes o un dolor de cabeza inducido por la tecnología?

6 días ago

Noticias populares

  • «EVOLARA: TU SEGUNDO VUELO»

    «EVOLARA: TU SEGUNDO VUELO»

    0 shares
    Share 0 Tweet 0
  • 15 lugares para visitar en la Antártida no puede permitirse perderse

    0 shares
    Share 0 Tweet 0
  • Banco de semillas liderado por indígenas protege la biodiversidad del Amazonas – Latin America News Dispatch

    0 shares
    Share 0 Tweet 0
  • La Inteligencia Artificial Gran Aporte al Turismo en la Región de Los Lagos

    0 shares
    Share 0 Tweet 0
  • INFORME: Los demócratas pusieron al corrupto fiscal general de Obama, Eric Holder, a cargo de examinar a los candidatos a vicepresidente para Kamala Harris | The Gateway Pundit

    0 shares
    Share 0 Tweet 0

Sobre nosotras

Bienvenido a corresponsal360.com ¡El objetivo de corresponsal360.com es brindarle las mejores fuentes de noticias para cualquier tema! Nuestros temas se seleccionan cuidadosamente y se actualizan constantemente, ya que sabemos que la web se mueve rápido y nosotros también lo intentamos.

Categoría

  • Blog
  • Cultura
  • Deportes
  • Noticias
  • Política
  • Salud
  • Tecnología
  • Turismo

Mensajes recientes

  • 8 películas de terror Ho-Ho que se transmiten en Shudder
  • Sampaoli rescata a Renan Lodi para Atlético Mineiro
  • El año del trauma comercial de Trump en Europa – POLITICO
  • Home
  • Contact Us
  • Disclaimer
  • Privacy Policy
  • Terms & Conditions

Copyright © 2024 Corresponsal360.com | All Rights Reserved.

No Result
View All Result
  • Home
  • Noticias
  • Tecnología
  • Deportes
  • Política
  • Salud
  • Turismo
  • Cultura

Copyright © 2024 Corresponsal360.com | All Rights Reserved.