Data Engineer

Mar 31, 2025 - Remoto, Editar

1. Sobre o desafio

Estamos em busca de uma pessoa Data Engineer para estruturas e otimizar nossa infraestrutura de dados, garantindo a escalabilidade e a confiabilidade do pipeline que alimenta análises sobre milhões de reuniões de vendas. Nosso objetivo é transformar grandes volumes de dados em aprendizados valiosos sobre o que funciona e o que não funciona quando se trata do mercado de vendas no Brasil e na América Latina.

Você será responsável por desenvolver e manter pipelines eficientes, garantir a qualidade e acessibilidade dos dados para o time de Data Science e Produto, e contribuir para a evolução contínua da arquitetura de dados da MeetRox.

Você fará parte de uma área em construção, então espere contribuir com as escolhas de tecnologia e como a área se desenvolve ao longo do tempo.

2. No que você irá trabalhar

Contribuir na construção e gerenciamento do Data Lake e no desenho de uma arquitetura de dados baseada no modelo de medalhão (bronze, silver, gold), considerando o uso futuro de Spark para processar grandes volumes de dados;

Desenhar, implementar e manter pipelines de dados que integrem diversas fontes como CRMs (ex.: Salesforce, HubSpot) e plataformas de comunicação (ex.: Slack, WhatsApp, Intercom, Zendesk) ao ecossistema da MeetRox, garantindo confiabilidade, escalabilidade e qualidade;

Automatizar processos de ingestão e transformação de dados, incluindo orquestração e monitoramento de pipelines (curto prazo: uso de Meltano; médio/longo prazo: adoção de ferramentas adicionais como Airflow ou dbt);

Criar e gerenciar estruturas de dados que facilitem o trabalho de analistas e cientistas de dados, fornecendo dados estruturados e otimizados para análise e modelagem;

Definir e implementar boas práticas de governança de dados;

Monitorar, diagnosticar e solucionar problemas relacionados a pipelines de dados e integrações;

Utilizar tecnologia de ponta para resolver problemas reais para pessoas reais.

3. O que buscamos

Habilidade em Python, SQL e Spark avançado para manipulação, limpeza e transformação de grandes volumes de dados;

Vivência prévia com arquiteturas de Data Lake e ferramentas de processamento distribuído (como Spark, Hadoop, etc.);

Experiência com ferramentas de orquestração de dados (Airflow, dbt, Luigi, Prefect, etc.) e/ou soluções de CI/CD para pipelines de dados;

Conhecimento em ambientes de cloud (AWS, GCP ou Azure), incluindo serviços de armazenamento, banco de dados e segurança;

Excelentes habilidades de comunicação - somos uma empresa remota, comunicação assíncrona e escrita clara são fundamentais;

Vontade de aprender e evoluir nas tecnologias que usamos, em um ambiente de inovação e constante mudança.

4. São diferenciais

Familiaridade com a estruturação de dados em camadas (bronze, silver, gold), bem como práticas de governança e catalogação de dados;

Experiência com engenharia de Machine Learning (MLOps), facilitando o deploy e a manutenção de modelos;

Vivência em startups de alto crescimento.

5. Sobre o time de dados

Você trabalhará diretamente com o CTO e a Principal Data Scientist, em um time pequeno, mas extremamente competente. Procuramos uma pessoa do bem, que valorize a criação de sistemas impactantes, sinta orgulho do que constrói e goste de colaborar, aprender e ensinar. Adoramos tecnologia, mas acreditamos que ela existe para servir as pessoas. Se você quer fazer parte da construção de uma startup em um ambiente com muita oportunidade de crescimento e aprendizado, queremos falar com você.

Candidatar

Receba alerta de vagas da cidade
Remoto

Perto de mim:Cidade Bairro

Data Engineer

Perto de mim: