Otimização de Pipelines CI/CD no GitLab: Uma Abordagem Utilizando Aprendizado de Máquina para Caching Preditivo

Autores

  • Diogo Henrique da Silva Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas Gerais - Campus Muzambinho.
  • Paulo César dos Santos

Palavras-chave:

DevOps, GitLab, CI/CD, Aprendizado de Máquina, Otimização de Cache

Resumo

A otimização de pipelines de Integração e Entrega Contínua (CI/CD) é um desafio central em ambientes DevOps, onde
o tempo de build de imagens Docker in Docker (DinD) representa um gargalo crítico. A gestão de cache, é uma das
principais estratégias para mitigar a lentidão, porém, é tipicamente manual, reativa. A proposta deste trabalho é analisar
a viabilidade da aplicação de Aprendizado de Máquina para transformar a decisão baseada em suposições em uma ação
preditiva e otimizada. A abordagem consiste em desenvolver um modelo capaz de decidir, com base nos metadados de
uma alteração de código, se a estratégia mais eficiente é utilizar o cache existente ou realizar um build limpo. Para
validar a abordagem, foi construído um laboratório experimental com GitLab e Docker, onde um pipeline automatizado
executa builds em ambos os cenários e coleta métricas detalhadas. Como resultado principal, foi gerado um dataset
estruturado, validando a viabilidade da coleta e estabelecendo a base para o futuro treinamento de um modelo de
classificação para otimização de pipelines.

Downloads

Publicado

04-12-2025