
La inteligencia artificial para operaciones de TI (AIOps) se ha convertido en un tema candente, a menudo descrito como el futuro de la resiliencia de TI. Sin embargo, muchas discusiones terminan en el nivel de estrategia sin entrar en detalles sobre cómo construirla realmente. El valor real de AIOps proviene de la implementación de un monitoreo predictivo que se integra con las pilas de monitoreo empresarial existentes, aplica el aprendizaje automático a los datos operativos y automatiza tanto el análisis como la respuesta.
Este artículo proporciona una inmersión profunda en esos mecanismos: integrar AIOps con herramientas de monitoreo empresarial, crear modelos de aprendizaje automático que aprendan de los registros del sistema y la telemetría y automatizar la correlación de alertas para un análisis de causa raíz más rápido. A lo largo del camino, exploraremos canales de transmisión de datos, modelos de detección de anomalías y marcos de automatización que hacen que el monitoreo predictivo sea viable.
La mayoría de las empresas cuentan actualmente con un ecosistema de herramientas de monitoreo sólidas, como Dynatrace o AppDynamics para el rendimiento de las aplicaciones, Splunk o ELK para registros y Prometheus para métricas. ¿La buena noticia? Ninguno de ellos es reemplazado por AIOps. Los estira.




