Site Reliability Engineer (SRE)
Venha ser nosso SRE e garanta a confiança dos nossos sistemas!
Estamos em busca de um Site Reliability Engineer (SRE) para se juntar ao nosso time e assegurar que nossos serviços e plataformas estejam sempre disponíveis, escaláveis e resilientes. Se você é apaixonado por tecnologia, adora automatizar processos e tem experiência em ambientes de alta disponibilidade, queremos te conhecer!
O que você vai fazer:
Desenvolver e implementar soluções para aumentar a confiabilidade e escalabilidade dos nossos sistemas.
Criar e manter pipelines de CI/CD para garantir implantações seguras e eficientes.
Monitorar e otimizar a performance das aplicações e da infraestrutura.
Automatizar processos operacionais para reduzir erros manuais e melhorar a eficiência.
Responder a incidentes críticos, liderando investigações e implementando soluções definitivas.
Trabalhar em colaboração com times de engenharia e produto para definir melhores práticas de arquitetura e SRE.
Implementar e gerenciar estratégias de gestão de capacidade e planejamento de crescimento da infraestrutura.
Garantir a segurança e conformidade das operações com as melhores práticas de proteção de dados e compliance.
O que esperamos de você:
Experiência com Cloud Computing (AWS, Azure, GCP e Huawei Cloud).
Conhecimento profundo de Kubernetes e orquestração de containers (Docker).
Experiência com Infrastructure as Code (IaC) – Terraform, Ansible, CloudFormation.
Conhecimento em monitoramento e observabilidade (Prometheus, Grafana, Datadog, ELK, OpenTelemetry e NewRelic).
Experiência com automação e Scripting (Bash, Python, Go ou similar).
Familiaridade com CI/CD e ferramentas como GitHub Actions, Jenkins, CodePipeline, ArgoCD e Spinnaker.
Experiência em bancos de dados SQL e NoSQL (PostgreSQL, MySQL, SQL, Oracle, MongoDB, Redis e Postgres).
Conhecimento em gestão de incidentes e resposta a falhas.
Experiência com práticas de segurança em DevOps (DevSecOps, Hardening, IAM).
Boa comunicação para colaboração entre equipes de desenvolvimento e operações.
Diferenciais que vão te destacar:
Experiência com Service Mesh (Istio, Linkerd, Consul).
Certificações em Cloud (AWS, Azure, GCP, Huawei Cloud).
Conhecimento em FinOps para otimização de custos na nuvem.
Experiência com chaos engineering para melhorar a resiliência dos sistemas.
Experiência com plataformas de API Gateway e controle de tráfego.
Candidatar
Receba alerta de vagas da cidade
São Paulo