Pular para o conteúdo principal

SRE Analyst | Mid (Hybrid São Paulo/SP)

Descrição da vaga

.

Responsabilidades e atribuições

  • Monitorar continuamente o ambiente produtivo, acompanhando fila de chamados e alertas via ferramentas de gestão;
  • Analisar e atuar em incidentes de Nível 1, garantindo rápida identificação e tratativa inicial de problemas;
  • Executar procedimentos operacionais como restarts de serviços e ações de recuperação de ambiente;
  • Realizar análise de logs e métricas utilizando ferramentas de observabilidade para diagnóstico de falhas;
  • Atuar de forma proativa na detecção de incidentes e degradação de serviços;
  • Montar e liderar salas de crise, coordenando a comunicação e as ações para resolução de incidentes críticos;
  • Realizar escalonamento de incidentes para times internos e fornecedores quando necessário;
  • Acompanhar e garantir o follow-up de incidentes, mantendo stakeholders atualizados, incluindo níveis executivos;
  • Apoiar a estabilidade e disponibilidade de aplicações baseadas em microserviços e ambientes distribuídos;
  • Colaborar com times de desenvolvimento e operações na resolução de problemas e melhoria contínua do ambiente;
  • Contribuir para a evolução de práticas de SRE e cultura DevOps no dia a dia da operação;
  • Modelo híbrido (2 dias presenciais por semana).

Requisitos e qualificações

  • Experiência prévia em atuação como SRE, NOC ou Command Center;
  • Conhecimento em arquitetura de microserviços;
  • Experiência com pipelines e práticas de CI/CD;
  • Conhecimento em Kubernetes;
  • Experiência com cloud AWS;
  • Conhecimento em ferramentas de monitoramento e troubleshooting, como Dynatrace;
  • Conhecimento em sistemas operacionais Linux;
  • Vivência com cultura DevOps e práticas de SRE;
  • Experiência com gestão de incidentes e análise de logs;
  • Boa capacidade analítica e resolução de problemas;
  • Comunicação clara para interação com times técnicos e stakeholders;
  • Ensino superior completo.
  • Desejáveis: Experiência com ferramentas de ITSM (ex: ServiceNow); Vivência em ambientes de alta disponibilidade e missão crítica; Experiência com automação de rotinas operacionais; Conhecimento em práticas de observabilidade avançada (métricas, logs e traces); Experiência em condução de incidentes críticos e gestão de crises.

Informações adicionais

#hybrid

Etapas do processo

  1. Etapa 1: Cadastro
  2. Etapa 2: Mapeamento de Stack
  3. Etapa 3: Fit Cultural
  4. Etapa 4: Entrevista Líder
  5. Etapa 5: Oferta e Negociação
  6. Etapa 6: Contratação

Become a Compasser, be part of AI/R.

Compass UOL is a global firm and part of the AI Revolution Company, together transforming organizations using Artificial Intelligence, Generative AI, and other of today’s most advanced technologies.


We equip our team with proprietary and external AI-driven tools to design and build digital-native platforms, integrating cutting-edge technologies and enabling companies to innovate, transform their businesses, and drive success in their markets.

To achieve this, we attract and develop the best talent, creating opportunities that enhance people’s lives and highlight the positive impact of disruptive technologies.

We empower borderless talent and promote knowledge and opportunities in the latest market trends, driving significant personal and professional growth.

Join us and be part of the AI-driven revolution.