Cada vez mais os ambientes de tecnologia usam a IA para prevenir paradas não programadas dos serviços de TI e, em casos excepcionais, identifica-las e resolvê-las com a máxima eficácia. É a hora do AIOps.
Mais sistemas, muito mais dados, mais consumidores conectados, mais complexidade e muito mais riscos. Tempo, que é um recurso precioso para os profissionais de TI, está cada vez mais escasso, atropelado pelo ritmo da transformação digital. As operações de TI ficam na berlinda, incluindo a complexidade do ambiente de monitoração que podem resultar em demora na hora de identificar e resolver potenciais crises ou falhas.
As falhas nos serviços de TI impactam diretamente a eficiência operacional e custam muito caro para as empresas. O Gartner estima o custo médio do tempo de inatividade de TI em R$ 22.400 por minuto. Como consequência as empresas procuram maneiras de evitar essas interrupções.
É nesse contexto que as empresas recorrem ao AIOps, aplicando machine learning e data science para resolver problemas, aprimorar e/ou substituir parcialmente todas as principais funções da operação de TI. Estudos indicam que o uso de AIOps e ferramentas de monitoração de experiência digital aumentará de 5% em 2018 para 30% em 2023 nas grandes empresas.
A maneira como pensamos sobre isso é: Quais são as tarefas que exigem um humano e o que podemos automatizar? Podemos oferecer uma enorme quantidade de automação porque aprendemos com o comportamento humano. No passado, quando um problema acontecia, como um humano o consertava? Podemos automatizar essa sequência de etapas se o problema acontecer novamente.
“A Inteligência Artificial ajuda, num primeiro momento, a ter visibilidade e controle para reduzir o número de paradas não programadas de TI que impactam os negócios das empresas. Com seu uso e aprendizado, a IA vai conhecer como o ambiente funciona, apoiar a remediação e prevenção de possíveis incidentes”, explica João Cerqueira, diretor de consultoria de soluções para a América Latina da ServiceNow.
No caso da ServiceNow, a solução de Gerenciamento de Operações de TI (ITOM), que integra a Now Platform, é a base do AIOps. Sua missão é melhorar a visibilidade e o controle da TI, eliminando tarefas manuais e fornecendo diagnósticos em tempo real. “Para realmente tornar-se preditivo, primeiro é preciso tirar o urgente da frente do importante e depois transformar conhecimento em sabedoria”, afirma Cerqueira.
O “pulo do gato está em primeiro dar visibilidade à estrutura de TI para entender as relações entre os recursos de TI que formam seus serviços críticos de negócios. “Com um registro atualizado dos recursos de TI e uma compreensão profunda do impacto da mudança nos principais serviços dos negócios, você poderá identificar preventivamente possíveis interrupções”, explica.
“Nossa experiência demonstra que com o uso da IA, eliminamos 99% dos ruídos e sobram só os 1% que realmente fazem a diferença. Usamos a nossa tecnologia dentro de casa e, no nosso caso, já eliminamos 2/3 das nossas paradas críticas”, diz Cerqueira.
A média, segundo Cerqueira, é eliminar 70% das paradas não programadas a partir do uso do ITOM, “mas temos casos de cliente eliminando 80%”, afirma. Em empresas usando DevOps, o tempo de preparação de novos ambientes de TI cai de 7 dias para menos de 10 minutos.
O efeito colateral de uma plataforma de AIOps é mudar o perfil do trabalho da equipe de TI, já que libera uma parte do tempo que era alocada em trabalho reativo para eliminar as causas de paradas críticas. “O time passa a ficar focado em arquitetura de sistemas e outras coisas estratégicas”, diz Cerqueira.