Tech Lead | Machine Learning

Sobre a empresa
Legaltech brasileira que desenvolve software para buscar, emitir, analisar e gerenciar documentos oficiais usados por empresas. Ela automatiza burocracias envolvendo documentos públicos — como certidões, matrículas de imóveis, licenças, alvarás e registros — que normalmente precisam ser solicitados em vários órgãos públicos.



Resumo da Posição


Buscamos uma pessoa Tech de Machine Learning com forte experiência em NLP, Transformers e LLMs. A pessoa ideal terá conhecimento prático em desenvolvimento de modelos, pipelines de dados e boas práticas de engenharia de software. Contribuir com a inovação e melhoria contínua dos processos de desenvolvimento. Também, acompanhará pesquisas recentes em machine learning e contribuirá com o desenvolvimento de novos algoritmos e técnicas. Sendo assim, a pessoa será capaz de desenvolver estratégias de aprendizado de máquina para resolver problemas de negócios complexos.



Principais Responsabilidades e Atribuições


Avaliar e selecionar tecnologias e ferramentas apropriadas;


Coordenar o planejamento e execução das tarefas da equipe;


Participar de reuniões e alinhamentos estratégicos;


Realizar revisões de código e garantir a qualidade do software;


Resolver problemas e impasses técnicos;


Direcionar a equipe em decisões difíceis;


Fazer alinhamentos entre diferentes áreas da empresa para garantir os resultados pretendidos;


Participar ativamente de discussões estratégicas junto aos times de produto;


Desenvolver códigos para ajudar o time em entregas, acabar com gargalos e mostrar padrões a serem seguidos pela equipe de projeto para compreender os requisitos e comunicar resultados de teste de maneira eficaz;


Liderança de Projetos: Liderar equipes e projetos de machine learning, definindo metas, prazos e estratégias de execução;


Mentoria e Orientação: Orientar e treinar engenheiros de machine learning, compartilhando conhecimento e melhores práticas;


Definição de Estratégias de ML: Desenvolver estratégias de aprendizado de máquina para abordar problemas de negócios complexos e definir métricas de sucesso;


Otimização de Desempenho: Otimizar o desempenho dos modelos por meio de ajuste de hiperparâmetros, busca de grade e outras técnicas avançadas;


Exploração de Dados: Realizar análises exploratórias de dados (EDA) para descobrir insights e identificar características importantes para os modelos;


Implantação de Modelos em Produção: Implementar modelos em ambientes de produção, garantindo escalabilidade e manutenção;


Pesquisa e Desenvolvimento: Acompanhar pesquisas recentes em machine learning e contribuir com o desenvolvimento de novos algoritmos e técnicas;


Desenvolver, treinar e otimizar modelos baseados em Transformers e LLMs para tarefas de processamento de texto;


Construir pipelines robustos de pré-processamento e pós-processamento textual;


Aplicar boas práticas de engenharia de software em projetos de Machine Learning;


Trabalhar com dados estruturados e não estruturados, integrando modelos com bancos de dados e APIs;


Participar de decisões técnicas sobre arquitetura, versionamento de modelos, testes e deploy;


Colaborar com engenheiros de dados e outros times para escalar soluções em produção.



Requisitos e Qualificações


Experiência em arquitetura de software e design patterns;


Gestão de times/pessoas;


Domínio em tecnologias de cloud computing;


Python: Domínio avançado da linguagem, com foco em orientação a objetos, otimização de código e organização de projetos;


Machine Learning: Experiência com modelos como BERT, RoBERTa, GPT, Mistral, incluindo fine-tuning e uso em tarefas de NLP. Forte experiência com engenharia de prompt;


Processamento de Texto: Classificação e extração de entidades;


OCR: Experiência básica com ferramentas como Tesseract e Google Vision OCR;


Bancos de Dados (PostgreSQL): Manipulação de dados via SQL, integração com pipelines de ML;


Git/GitHub: Versionamento de código, revisão de PRs, uso em times colaborativos;


Debug e Testes: Capacidade de identificar e resolver bugs, criar testes automatizados com Pytest ou Unittest;


Padrões de Projeto: Aplicação de boas práticas de arquitetura e design patterns;


LLMs - (GPT, Mistral, Claude - Sonnet, etc ).




Desejável


Experiência com APIs RESTful e FastAPI;


Conhecimento em Docker e deploy de modelos em nuvem;


Familiaridade com ferramentas de prototipação como Streamlit;


Conhecimento em cloud (AWS, GCP);


Experiência com Agents baseados em LLMs;


Uso de MLflow, Weights & Biases, DVC ou ferramentas similares para monitoramento, versionamento e automação de experimentos;


MLOps, ou Machine Learning Operations, refere-se ao conjunto de práticas e ferramentas que automatizam e facilitam o ciclo de vida do machine learning, desde o desenvolvimento até a implantação e monitoramento dos modelos.



Soft Skills


Liderança;


Autonomia;


Comunicação;


Vontade de crescer;


Voz ativa;


Disrupção.



Regime de Contratação: CLT



Modalidade: Híbrido em Pinheiros (modelo híbrido com 4x presencial e 1x home office) - última sexta no mês é presencial. ;