Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/8644
Título: Práticas de SRE aplicadas à infraestrutura de rede : impactos da aplicação de práticas de SRE na identificação e resposta a incidentes em infraestrutura de TI.
Autor(es): Moreira, Daniel Pinto
Orientador(es): Cavalcanti, Carlos Frederico Marcelo da Cunha
Membros da banca: Sica, Fernando Cortez
Oliveira, Ricardo Augusto Rabelo
Cavalcanti, Carlos Frederico Marcelo da Cunha
Palavras-chave: Site reliability engineering - SRE
Redes de computadores
Resiliência - redes de computadores
Data do documento: 2025
Referência: MOREIRA, Daniel Pinto. Práticas de SRE aplicadas à infraestrutura de rede : impactos da aplicação de práticas de SRE na identificação e resposta a incidentes em infraestrutura de TI. 2025. 58 f. Monografia (Graduação em Ciências da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2025.
Resumo: A crescente complexidade das infraestruturas de redes corporativas, somada à dependência de serviços críticos e distribuídos, exige novas abordagens para garantir disponibilidade, confiabilidade e eficiência operacional. Nesse contexto, o presente trabalho investiga a aplicação de práticas de SRE (Site Reliability Engineering) em redes de médio porte, com foco na detecção e resposta a incidentes. O estudo adota como base os pilares da observabilidade — métricas, logs e traces — e implementa ferramentas consolidadas no mercado, como Zabbix, Graylog e Grafana, para compor um ecossistema de monitoramento proativo. A metodologia incluiu o mapeamento do ambiente, a definição de indicadores e objetivos de nível de serviço (SLIs e SLOs), a instrumentação da infraestrutura e a coleta de dados, permitindo análises comparativas e a identificação de oportunidades de automação e eliminação de tarefas repetitivas (TOIL). Os resultados obtidos demonstraram que a integração de práticas de SRE contribuiu para a redução do tempo de indisponibilidade, aumento da capacidade de resposta das equipes de TI e maior resiliência da rede diante de incidentes inesperados. Além disso, o trabalho reforça a importância do uso de relatórios de disponibilidade e análises pós-incidente (postmortem) como mecanismos de aprendizado contínuo e aprimoramento dos processos. Conclui-se que a adoção de SRE em ambientes de médio porte é viável e traz impactos significativos na maturidade da gestão de infraestrutura, servindo como referência para futuras implementações em contextos similares.
Resumo em outra língua: The increasing complexity of corporate network infrastructures, combined with the reliance on critical and distributed services, demands new approaches to ensure availability, reliability, and operational efficiency. In this context, this work investigates the application of Site Reliability Engineering (SRE) practices in medium-sized networks, focusing on incident detection and response. The study is grounded on the pillars of observability — metrics, logs, and traces — and implements well-established tools such as Zabbix, Graylog, and Grafana to build a proactive monitoring ecosystem. The methodology involved environment mapping, definition of Service Level Indicators (SLIs) and Service Level Objectives (SLOs), infrastructure instrumentation, and data collection, enabling comparative analyses and the identification of opportunities for automation and toil reduction. The results demonstrated that integrating SRE practices contributed to reducing downtime, enhancing the response capacity of IT teams, and strengthening network resilience against unexpected incidents. Furthermore, the work highlights the relevance of availability reports and postmortem analyses as mechanisms for continuous learning and process improvement. It is concluded that adopting SRE in medium-sized environments is feasible and significantly impacts infrastructure management maturity, serving as a reference for future implementations in similar contexts.
URI: http://www.monografias.ufop.br/handle/35400000/8644
Aparece nas coleções:Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
MONOGRAFIA_PráticasSREAplicadas.pdf2,13 MBAdobe PDFVisualizar/Abrir


Os itens na BDTCC estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.