Site Reliability Engineer (SRE)
Missão do cargo
Atuar de forma preventiva, colaborativa e responsiva na resolução de incidentes, contribuindo para a excelência técnica, confiabilidade e satisfação do cliente.
Responsabilidades
Monitorar sistemas críticos com ferramentas como Datadog, Grafana, Zabbix, New Relic, AWS X-Ray, OpenTelemetry, PagerDuty e Rundeck
Automatizar respostas a incidentes usando AWS Lambda, Rundeck, Datadog Workflows
Criar dashboards inteligentes e alertas focados em performance e disponibilidade
Participar de incidentes e war rooms preventivos, acompanhando até a resolução
Apoiar times de pré-vendas com demonstrações técnicas de soluções de observabilidade
Colaborar com squads para definição de SLOs/SLIs e integração de IA/ML para predição de falhas
Contribuir com documentação, post-mortems e melhoria contínua em práticas de NOC
Requisitos técnicos
Experiência com ferramentas de observabilidade (Datadog, Grafana, Zabbix, New Relic, OpenTelemetry)
Vivência em ambientes AWS
Conhecimento em automação de respostas a incidentes (Lambda, Workflows, Rundeck)
Experiência com gestão de incidentes, ITIL e RCA
Familiaridade com tracing distribuído (X-Ray, OpenTelemetry)
Desejável conhecimento em infraestrutura como código para observabilidade
Formação e Certificações
Graduação completa ou em andamento em Ciência da Computação, Sistemas de Informação ou similares
Certificação obrigatória: AWS Cloud Practitioner
Desejáveis: Datadog, Zabbix, Grafana, AWS SysOps, ITIL Foundation
Benefícios
Para colaboradores CLT:
VR R$ 35,00/dia (Cartão Flash)
Plano de saúde e odontológico SulAmérica (sem desconto)
Seguro de vida SulAmérica
Gympass
Auxílio Educação
Treinamentos e Certificações AWS
Auxílio Creche
Assistência Cesta Natalidade
Day off no aniversário
Presente personalizado
Programa de indicação premiada (Indicou/Ganhou)
Para colaboradores PJ:
Treinamentos e Certificações AWS
Férias remuneradas
Gympass ;
Candidatar
Receba alerta de vagas da cidade
Curitiba