Data Tech Lead
Extractta | São Paulo - SP | Híbrido
Estamos em busca de um(a) Tech Lead de Engenharia de Dados para liderar tecnicamente nosso time, organizar entregas, promover boas práticas e atuar como ponte com áreas de negócio.
Você será responsável por construir e otimizar pipelines em larga escala com AWS, Spark, Python e bancos SQL/NoSQL. Valorizamos experiência com Dataiku (desejável), liderança técnica e domínio em ambientes de dados complexos.
Se você gosta de desafios, autonomia e impacto, vem com a gente!
Faixa salarial
A combinar
Regime de contratação
CLT, PJ
Benefícios
- Liderar tecnicamente o time de engenharia de dados, promovendo boas práticas de desenvolvimento, qualidade e colaboração;
- Organizar e acompanhar as atividades do time, garantindo a priorização e entrega dos projetos conforme cronograma;
- Delegar tarefas com clareza e acompanhar o desenvolvimento individual e coletivo do time;
- Conduzir reuniões técnicas e de alinhamento com stakeholders internos e externos;
- Atuar como referência técnica na construção e sustentação de pipelines de dados eficientes e escaláveis;
- Promover a área de engenharia de dados dentro da organização, demonstrando impacto e oportunidades de melhoria;
- Desenvolver e otimizar processos de ETL para manipulação e transformação de grandes volumes de dados;
- Projetar e implementar arquiteturas de dados robustas, com foco em performance, segurança e escalabilidade;
- Garantir a governança dos dados e a automação dos fluxos de ingestão, transformação e disponibilização de dados;
- Construir soluções com AWS Glue, Apache Spark e Dataiku para processamento de dados em larga escala (terabytes);
- Desenvolver e manter modelos de dados relacionais e dimensionais para suporte à tomada de decisão;
- Criar e otimizar consultas SQL para extração, transformação e análise de dados;
- Gerenciar e otimizar o uso de bancos de dados SQL e NoSQL (como MongoDB, Cassandra, Redis e DynamoDB);
- Atuar com replicação de dados em tempo real utilizando AWS DMS e SQL CDC.
- Experiência sólida em engenharia de dados, com atuação em ambientes complexos e de grande volume;
- Capacidade comprovada de liderança técnica, com histórico de condução de times e projetos;
- Proficiência em Python, com domínio de bibliotecas voltadas à engenharia de dados (como Pandas, PySpark, etc.);
- Proficiência em SQL, incluindo otimização de queries e modelagem de dados;
- Experiência com ferramentas e serviços da AWS, especialmente Glue, Redshift, DMS e S3;
- Conhecimento aprofundado em Amazon Redshift (modelagem, tuning, administração e performance);
- Experiência prática com Apache Spark para processamento distribuído de dados;
- Conhecimento sólido em bancos NoSQL (MongoDB, Cassandra, Redis, DynamoDB);
- Vivência com replicação de dados em tempo real utilizando SQL CDC e AWS DMS;
- Forte experiência em modelagem de dados relacionais e dimensionais;
- Experiência anterior com organização de backlog técnico e gestão de demandas em times de dados;
- Boa capacidade de comunicação e influência junto a stakeholders técnicos e não técnicos.
- Experiência com Dataiku, incluindo desenvolvimento de fluxos, integração de fontes e automação;
- Certificações em serviços AWS (como AWS Certified Data Analytics – Specialty) ou em Dataiku;
- Conhecimentos em práticas de governança e qualidade de dados;
- Familiaridade com práticas DevOps para dados (CI/CD, versionamento, automações);
- Experiência em promover comunidades técnicas internas e treinamentos para capacitação do time.
A Extractta destaca-se no mercado como uma empresa especializada em tecnologia da informação dedicada a fornecer serviços profissionais e ferramentas avançadas com o objetivo de impulsionar e acelerar o crescimento do negócio de nossos clientes.
Com um forte enfoque em soluções orientada por dados, somos reconhecidos por nossa abordagem Data Driven, que nos permite entregar resultados excepcionais e impulsionar a inovação contínua.
Data Tech Lead
Extractta | São Paulo - SP | Híbrido
Descrição da vaga
Estamos em busca de um(a) Tech Lead de Engenharia de Dados para liderar tecnicamente nosso time, organizar entregas, promover boas práticas e atuar como ponte com áreas de negócio.
Você será responsável por construir e otimizar pipelines em larga escala com AWS, Spark, Python e bancos SQL/NoSQL. Valorizamos experiência com Dataiku (desejável), liderança técnica e domínio em ambientes de dados complexos.
Se você gosta de desafios, autonomia e impacto, vem com a gente!
Responsabilidades e atribuições
- Liderar tecnicamente o time de engenharia de dados, promovendo boas práticas de desenvolvimento, qualidade e colaboração;
- Organizar e acompanhar as atividades do time, garantindo a priorização e entrega dos projetos conforme cronograma;
- Delegar tarefas com clareza e acompanhar o desenvolvimento individual e coletivo do time;
- Conduzir reuniões técnicas e de alinhamento com stakeholders internos e externos;
- Atuar como referência técnica na construção e sustentação de pipelines de dados eficientes e escaláveis;
- Promover a área de engenharia de dados dentro da organização, demonstrando impacto e oportunidades de melhoria;
- Desenvolver e otimizar processos de ETL para manipulação e transformação de grandes volumes de dados;
- Projetar e implementar arquiteturas de dados robustas, com foco em performance, segurança e escalabilidade;
- Garantir a governança dos dados e a automação dos fluxos de ingestão, transformação e disponibilização de dados;
- Construir soluções com AWS Glue, Apache Spark e Dataiku para processamento de dados em larga escala (terabytes);
- Desenvolver e manter modelos de dados relacionais e dimensionais para suporte à tomada de decisão;
- Criar e otimizar consultas SQL para extração, transformação e análise de dados;
- Gerenciar e otimizar o uso de bancos de dados SQL e NoSQL (como MongoDB, Cassandra, Redis e DynamoDB);
- Atuar com replicação de dados em tempo real utilizando AWS DMS e SQL CDC.
Requisitos e qualificações
- Experiência sólida em engenharia de dados, com atuação em ambientes complexos e de grande volume;
- Capacidade comprovada de liderança técnica, com histórico de condução de times e projetos;
- Proficiência em Python, com domínio de bibliotecas voltadas à engenharia de dados (como Pandas, PySpark, etc.);
- Proficiência em SQL, incluindo otimização de queries e modelagem de dados;
- Experiência com ferramentas e serviços da AWS, especialmente Glue, Redshift, DMS e S3;
- Conhecimento aprofundado em Amazon Redshift (modelagem, tuning, administração e performance);
- Experiência prática com Apache Spark para processamento distribuído de dados;
- Conhecimento sólido em bancos NoSQL (MongoDB, Cassandra, Redis, DynamoDB);
- Vivência com replicação de dados em tempo real utilizando SQL CDC e AWS DMS;
- Forte experiência em modelagem de dados relacionais e dimensionais;
- Experiência anterior com organização de backlog técnico e gestão de demandas em times de dados;
- Boa capacidade de comunicação e influência junto a stakeholders técnicos e não técnicos.
Requisitos desejáveis
- Experiência com Dataiku, incluindo desenvolvimento de fluxos, integração de fontes e automação;
- Certificações em serviços AWS (como AWS Certified Data Analytics – Specialty) ou em Dataiku;
- Conhecimentos em práticas de governança e qualidade de dados;
- Familiaridade com práticas DevOps para dados (CI/CD, versionamento, automações);
- Experiência em promover comunidades técnicas internas e treinamentos para capacitação do time.
Faixa salarial
A combinar
Regime de contratação
CLT, PJ
Sobre a empresa
A Extractta destaca-se no mercado como uma empresa especializada em tecnologia da informação dedicada a fornecer serviços profissionais e ferramentas avançadas com o objetivo de impulsionar e acelerar o crescimento do negócio de nossos clientes.
Com um forte enfoque em soluções orientada por dados, somos reconhecidos por nossa abordagem Data Driven, que nos permite entregar resultados excepcionais e impulsionar a inovação contínua.