[Tech] Engenharia de Confiabilidade e DevOps Especialista

TOTVS | São Paulo - SP | Híbrido

Buscamos um(a) Engenheiro(a) de Confiabilidade e DevOps Espec. para ser a base da infraestrutura e das operações de engenharia dos nossos produtos de software. Nesta posição sênior, você atuará na otimização de todo o ciclo de vida de desenvolvimento de software (SDLC), construirá e manterá ambientes multi-cloud resilientes em AWS e GCP e aplicará princípios de SRE para manter nossos sistemas saudáveis, confiáveis e performáticos em escala. Você definirá os padrões de observabilidade, gestão de incidentes e gestão da mudança, unindo forte senso de engenharia ao uso de ferramentas de IA para resolver problemas operacionais complexos antes que cheguem aos nossos clientes.

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada pessoa colaboradora;
Programa +Saudáveis, que cuida de cada TOTVER com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;
Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para nossas pessoas colaboradoras;
Programa + Cuidado, programa de apoio pessoal para pessoas colaboradoras e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...
Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;
Plano de saúde e odontológico;
Vale refeição e / ou alimentação;
Vale transporte e fretados em algumas estações do metrô;
Licença maternidade e paternidade estendida;
Espaço de lactário;
Bicicletário;
Vestiário;
Seguro de vida;
Auxílio creche;
Previdência privada;
Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;
Gympass.

O QUE VOCÊ VAI FAZER:

Projetar, provisionar e manter infraestrutura e serviços de nuvem em AWS e GCP utilizando Infrastructure as Code (IaC).
Otimizar o SDLC e dar suporte às esteiras de deploy (CI/CD), promovendo práticas de gestão da mudança seguras, automatizadas e auditáveis.
Definir e governar políticas de infraestrutura e de desenvolvimento que protejam a confiabilidade e a segurança dos sistemas.
Implementar observabilidade nos sistemas (métricas, logs, traces, dashboards e alertas) para detectar problemas com antecedência e apoiar decisões.
Liderar a gestão de incidentes de ponta a ponta, automatizar a resposta a incidentes e produzir Blameless Post-Mortems que transformem falhas em melhorias sistêmicas.
Conduzir testes de carga, engenharia do caos e planejamento de capacidade para validar a resiliência e antecipar necessidades de escala.
Definir, acompanhar e reportar indicadores de confiabilidade (SLA, SLI, SLO, Error Budget) e objetivos de equipe (OKRs).
Aplicar conceitos de engenharia de software para automatizar operações e resolver problemas complexos de infraestrutura.
Produzir documentação técnica clara e apresentações eficazes para comunicar decisões e resultados às partes interessadas.

O QUE ESPERAMOS DE VOCÊ:

Graduação em Ciência da Computação, Engenharia ou área correlata (obrigatório).
Experiência em funções de SRE, DevOps ou engenharia de plataforma/infraestrutura.
Inglês em nível de trabalho (leitura, escrita e conversação).
Domínio dos conceitos de confiabilidade: SLA, SLI, SLO e Error Budget.
Experiência prática em gestão de incidentes e na elaboração de Blameless Post-Mortems.
Forte capacidade de colaboração e comunicação, com habilidade para redigir documentos claros e objetivos e realizar apresentações a públicos técnicos e não técnicos.
Plataformas de nuvem (AWS, GCP ou Azure).
Infrastructure as Code — ex.: Terraform, CloudFormation ou Pulumi.
Cultura e automação de CI/CD — ex.: Azure DevOps, GitHub Actions, GitLab CI, Jenkins ou ArgoCD.
Ferramentas de observabilidade — ex.: Datadog, OpenTelemetry, Prometheus, Grafana.
Contêineres e orquestração — Docker e Kubernetes.
Técnicas e ferramentas de testes de carga, engenharia do caos e planejamento de capacidade.
Linguagens de script/programação para automação — ex.: Python, Go ou Bash.
Domínio de ferramentas de IA para acelerar o trabalho de operações e engenharia.
Definição e reporte de indicadores e OKRs; boa produção de apresentações em PowerPoint ou Google Slides.

SERIA LEGAL SE TIVESSE:

Certificações AWS e GCP.
Pós-graduação/especialização em Engenharia de Software ou Arquitetura de Software.
Conhecimento de desenvolvimento seguro (DevSecOps).
Experiência em ambientes de produção de larga escala, alta disponibilidade e ritmo acelerado.
Experiência na definição de padrões de plataforma/confiabilidade entre múltiplos times de engenharia.

Como empresa líder em tecnologia somos um universo de pessoas inconformadas, movidas por inovação, autonomia, aprendizado e performance.

Juntos e juntas, criamos oportunidades, transformamos futuros e compartilhamos conhecimento. Aqui o seu desenvolvimento profissional acontece em um ambiente inclusivo, respeitoso e energizante. De gente pra gente!

Buscamos o crescimento sustentável. E usamos dados e IA para impulsionar resultados mais inteligentes e eficientes para os nossos clientes.

Vem com a gente inovar e construir o futuro da tecnologia.

#VemPraTOTVS #SomosTOTVS

Ver página da empresa

Enviar candidatura