Profissional de Engenharia de Dados - SR
V8.Tech | São Paulo - SP | Remoto
Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Dados. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- 💰 Remuneração CLT compatível com o mercado;
- 💻 Trabalho 100% Remoto;
- 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;
- 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas: Alimentação, Refeição, Mobilidade, Educação, Saúde e Cultura;
- 🧡 Seguro de Vida (Caixa Econômica);
- 🚑 Plano de Saúde (Porto Seguro);
- 🦷 Plano Odontológico (Porto Seguro);
- 📊 PLR de acordo com a política da empresa;
- 😎 Zero dress code, vista-se como se sentir mais confortável;
- 🎂 Voucher no dia do aniversário;
- 📚 Parceria com escola de inglês;
- 💰 Programa de indicação #amigosv8.tech;
Responsável por Desenho e Implementação de pipelines de dados robustos e eficientes utilizando serviços AWS Glue, Athena, Redshift e EMR, garantindo processamento e análise de dados em grande escala. Implementação de práticas de governança de dados e conformidade utilizando serviços AWS, garantindo segurança, qualidade e consistência dos dados em toda a organização.
- Experiência prática com AWS Glue para automação de pipelines de ETL (Extração, Transformação e Carga).
- Sólidos conhecimentos na criação e gerenciamento de Jobs, Crawlers, e Data Catalog no Glue.
- Capacidade de transformar dados utilizando Glue e de integrar o Glue com outros serviços da AWS (como S3, Redshift e Athena).
- Familiaridade com a escrita de scripts em Python ou Scala para transformar dados dentro do Glue.
- Experiência no uso de Amazon Athena para consultas interativas em dados armazenados no Amazon S3 usando SQL.
- Habilidade em otimizar consultas no Athena para melhorar a performance e reduzir custos.
- Conhecimento sobre particionamento de dados, tabelas externas e como utilizá-los para aumentar a eficiência nas consultas.
- Experiência com análise de dados não estruturados e integração do Athena com AWS Glue para catalogação de dados.
- Profundo conhecimento em Amazon Redshift e experiência em otimização de desempenho de consultas e modelos de dados.
- Capacidade de modelar dados eficientemente no Redshift (design de esquemas, otimização de consultas, uso de sort keys, dist keys, e vacuum).
- Experiência em configuração e gerenciamento de clusters AWS EMR para processamento de grandes volumes de dados.
- Familiaridade com frameworks de processamento distribuído como Apache Spark, Hadoop e Hive, integrados ao EMR.
- Habilidade em otimizar e configurar jobs no EMR para garantir escalabilidade e performance no processamento de dados.
- Conhecimento sobre integração do EMR com outras ferramentas da AWS, como S3, Glue e Redshift.
- Experiência com integração de dados de diversas fontes (estruturadas e não estruturadas), com foco na criação de pipelines escaláveis e eficientes.
- Capacidade de lidar com grandes volumes de dados e garantir que os pipelines sejam otimizados para alta performance e baixo custo.
- Familiaridade com o uso de Apache Spark para processamento em larga escala de dados no EMR.
- Experiência em governança de dados e garantia de qualidade, incluindo auditoria, segurança, e controle de versões.
- Conhecimento sobre modelagem de dados e implementação de melhores práticas para garantir a consistência, integridade e escalabilidade das soluções.
- Capacidade de implementar estratégias de backup e recuperação eficientes para dados e pipelines.
Conhecimento em serviços de Dados de outras CLOUD será um diferencial.
- Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.
Profissional de Engenharia de Dados - SR
V8.Tech | São Paulo - SP | Remoto
Descrição da vaga
Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Dados. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!
Responsabilidades e atribuições
Responsável por Desenho e Implementação de pipelines de dados robustos e eficientes utilizando serviços AWS Glue, Athena, Redshift e EMR, garantindo processamento e análise de dados em grande escala. Implementação de práticas de governança de dados e conformidade utilizando serviços AWS, garantindo segurança, qualidade e consistência dos dados em toda a organização.
Requisitos e qualificações
- Experiência prática com AWS Glue para automação de pipelines de ETL (Extração, Transformação e Carga).
- Sólidos conhecimentos na criação e gerenciamento de Jobs, Crawlers, e Data Catalog no Glue.
- Capacidade de transformar dados utilizando Glue e de integrar o Glue com outros serviços da AWS (como S3, Redshift e Athena).
- Familiaridade com a escrita de scripts em Python ou Scala para transformar dados dentro do Glue.
- Experiência no uso de Amazon Athena para consultas interativas em dados armazenados no Amazon S3 usando SQL.
- Habilidade em otimizar consultas no Athena para melhorar a performance e reduzir custos.
- Conhecimento sobre particionamento de dados, tabelas externas e como utilizá-los para aumentar a eficiência nas consultas.
- Experiência com análise de dados não estruturados e integração do Athena com AWS Glue para catalogação de dados.
- Profundo conhecimento em Amazon Redshift e experiência em otimização de desempenho de consultas e modelos de dados.
- Capacidade de modelar dados eficientemente no Redshift (design de esquemas, otimização de consultas, uso de sort keys, dist keys, e vacuum).
- Experiência em configuração e gerenciamento de clusters AWS EMR para processamento de grandes volumes de dados.
- Familiaridade com frameworks de processamento distribuído como Apache Spark, Hadoop e Hive, integrados ao EMR.
- Habilidade em otimizar e configurar jobs no EMR para garantir escalabilidade e performance no processamento de dados.
- Conhecimento sobre integração do EMR com outras ferramentas da AWS, como S3, Glue e Redshift.
- Experiência com integração de dados de diversas fontes (estruturadas e não estruturadas), com foco na criação de pipelines escaláveis e eficientes.
- Capacidade de lidar com grandes volumes de dados e garantir que os pipelines sejam otimizados para alta performance e baixo custo.
- Familiaridade com o uso de Apache Spark para processamento em larga escala de dados no EMR.
- Experiência em governança de dados e garantia de qualidade, incluindo auditoria, segurança, e controle de versões.
- Conhecimento sobre modelagem de dados e implementação de melhores práticas para garantir a consistência, integridade e escalabilidade das soluções.
- Capacidade de implementar estratégias de backup e recuperação eficientes para dados e pipelines.
Requisitos desejáveis
Conhecimento em serviços de Dados de outras CLOUD será um diferencial.
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- 💰 Remuneração CLT compatível com o mercado;
- 💻 Trabalho 100% Remoto;
- 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;
- 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas: Alimentação, Refeição, Mobilidade, Educação, Saúde e Cultura;
- 🧡 Seguro de Vida (Caixa Econômica);
- 🚑 Plano de Saúde (Porto Seguro);
- 🦷 Plano Odontológico (Porto Seguro);
- 📊 PLR de acordo com a política da empresa;
- 😎 Zero dress code, vista-se como se sentir mais confortável;
- 🎂 Voucher no dia do aniversário;
- 📚 Parceria com escola de inglês;
- 💰 Programa de indicação #amigosv8.tech;
Sobre a empresa
- Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.