
El auge de las herramientas de inteligencia artificial (IA) hizo que Lei Zhu reconsiderara su papel en la bioinformática.Crédito: Lei Zhu
Cuando comencé mis estudios de posgrado, lo primero que tenía que hacer era elegir una dirección de investigación. El laboratorio al que me incorporé se centró en dos áreas principales: ensayos funcionales y bioinformática. Esto fue hace más de una década, y el flujo de trabajo típico involucraba a investigadores en bioinformática analizando grandes conjuntos de datos para identificar genes asociados con fenotipos o enfermedades específicas, que luego se entregarían al equipo de ensayos funcionales para su validación.
En aquel momento, la bioinformática era un campo nuevo y prometedor, así que elegí este camino sin dudarlo. Pero no tenía experiencia en programación, por lo que fue difícil comenzar. Comencé a estudiar lenguajes de programación: primero Perl, luego R y Python.
Mirando hacia atrás, estoy contento con mi elección. Fue una época emocionante, y el rápido crecimiento de las tecnologías de alto rendimiento y las nuevas técnicas (como la transcriptómica y la genómica, y más tarde la biología unicelular) me brindaron muchos datos con los que trabajar. Resolver problemas biológicos a través del código que escribí me dio una sensación de autoestima.
Luego surgieron las herramientas de inteligencia artificial (IA), incluidas ChatGPT, Manus y Grok. Su capacidad para escupir código funcional amenazaba con convertirme en redundante, pero al principio no me preocupé porque El código generado por IA a menudo contiene errores que solo aparecen durante las pruebas y requieren depuración manual. Sin embargo, los nuevos modos de operación «agentes» podían cambiar las reglas del juego. Esto permite que herramientas como Manus primero generen código y luego lo ejecuten directamente en la nube, creando un bucle sin interrupciones: desde que yo hago preguntas hasta que la herramienta escribe y ejecuta el código y luego recibo los resultados. Fue entonces cuando comencé a preocuparme: en esta era de la IA, ¿sigo siendo necesario?
Las herramientas de inteligencia artificial actuales pueden escribir código de manera eficiente para realizar análisis biológicos. Sólo necesito cargar mis datos y proporcionar un mensaje simple, como: «Suponga que es un experto en bioinformática». ¿Podrías crear diez elementos visuales para representar diferentes datos según tu comprensión del conjunto de datos anterior? Muestre las tramas una por una, con una breve introducción. La IA proporciona las respuestas que necesito y, en ocasiones, supera mis expectativas. Entonces, ¿cuál es mi papel en este proceso?
Lo descubrí durante un estudio sobre el cáncer de pulmón. Teníamos cientos de perfiles de expresión genética de tejidos tumorales y le pedí a la IA que configurara el análisis. Funcionó rápidamente e incluso produjo un informe ordenado. Los resultados preliminares parecían fantásticos, casi demasiado buenos. La IA identificó una diferencia estadísticamente significativa en los niveles de expresión genética antes y después de un momento específico. Pero a medida que profundicé, vi que, a mitad del estudio, el laboratorio había cambiado la forma en que se recopilaban los datos. El modelo había captado esa diferencia, no debida a la biología. Lo que parecía un gran avance en realidad era sólo un artefacto. Una vez que me ajusté a ese cambio, la diferencia se volvió menos dramática pero reflejó la biología real.
Me di cuenta de que mi función había pasado del guión a la supervisión. Lo que importa ahora es formular la pregunta con claridad, detectar problemas que la computadora no puede ver y asumir la responsabilidad de la respuesta.
Los mejores consejos para los supervisores de IA
La gente me dice que podría hacer que la IA sea más inteligente «poniendo más contexto en el mensaje», pero mi IA siempre parece hacerse la tonta. No importa cuán detallada sea mi solicitud, siempre encuentra formas de malinterpretarla. En los últimos años, he desarrollado algunos métodos para comprobar su funcionamiento.
Crear un conjunto de validación. Mantenga un pequeño conjunto de datos que comprenda bien (un subconjunto de datos previamente publicados o validados manualmente, por ejemplo) como control positivo. Antes de aplicar una nueva canalización generada por IA a sus datos, pruébela en este conjunto. Si la IA produce resultados inesperados o inconsistentes, sabrá inmediatamente que es necesario perfeccionar el mensaje o el algoritmo.
Mezcla los datos. Los modelos de IA pueden fácilmente sobreajustar los datos o dejarse influenciar por artefactos técnicos, como ocurrió durante el estudio del cáncer de pulmón. Para probar si un hallazgo es biológicamente significativo, mezcle las etiquetas de las muestras, altere ligeramente los valores o introduzca ruido sintético. Si el patrón «significativo» persiste, probablemente sea un artefacto, más que una señal verdadera.
Subconjunto del análisis. Si un conjunto de datos es lo suficientemente grande, le pediré a la IA que realice el mismo análisis en subconjuntos aleatorios del mismo. La coherencia entre los subconjuntos aumenta la confianza: si los resultados varían enormemente de un subconjunto a otro, es posible que el hallazgo no se sostenga.




