‘AIOps’ o cómo gestionar eficazmente las operaciones IT con analítica avanzada

AIOps (del inglés, Artificial Intelligence for IT Operations) tiene como objetivo general garantizar la disponibilidad del servicio y la optimización de los recursos, bien sean humanos (técnicos de operaciones IT) o físicos (stock hardware y su capacidad). Técnicas como enriquecimiento de tickets, detección de anomalías o análisis de causalidad, todas ellas basadas en herramientas de analítica avanzada ML/AI, son claves para la construcción de herramientas predictivas. Resulta fácil imaginar múltiples soluciones para automatización de procesos, actualmente, llevados a cabo de manera manual por los equipos IT: categorización de incidencias, identificación causa-raíz, mantenimiento predictivo, etc. Para ello, es necesario garantizar la disponibilidad de datos de calidad que aseguren la trazabilidad y completitud de los mismos, a través de un datalake convenientemente estructurado y en continua actualización.

Cada día, son más las empresas que demuestran estar consiguiendo trasladar la inversión en AIOps en un impacto importante en su negocio con independencia del sector en el que operan (energía, banca, telco...). AIOps permite, por un lado, el enriquecimiento de la información vinculada a una incidencia, más granular con más detalle, y la asignación automática de incidencias al mejor grupo resolutor. Esto se consigue procesando la información semántica disponible en los tickets registrados, y activando, a continuación, el correspondiente motor de recomendación que permita seleccionar de manera automática el mejor equipo para resolver esa incidencia. La combinación de datos enriquecidos con eventos y logs registrados por los distintos sistemas IT (bases de datos, middleware...), junto a la explotación de técnicas de ML y Big Data, posibilita también la detección de anomalías, la correlación entre incidencias, así como la predicción del número de eventos y sus correspondientes tickets que se pueden suceder en el tiempo; siendo elementos clave para ofrecer un mantenimiento preventivo de sistemas de forma automática para evitar fallos a futuro. Para ello, cualquier plataforma AIOps que proporcione las funcionalidades debe incorporar un adecuado interfaz de visualización que permita acceder a información aumentada (pre y postincidente) y contribuir a una mejor toma de decisiones. Siempre abstrayendo al mismo tiempo al supervisor de la complejidad de las tecnologías base en la que dichas herramientas confían.