[Tech] Engenharia de Confiabilidade e DevOps Especialista

TOTVS | São Paulo - SP | Híbrido

Buscamos um(a) Engenheiro(a) de Confiabilidade e DevOps Espec. para ser a base da infraestrutura e das operações de engenharia dos nossos produtos de software. Nesta posição sênior, você atuará na otimização de todo o ciclo de vida de desenvolvimento de software (SDLC), construirá e manterá ambientes multi-cloud resilientes em AWS e GCP e aplicará princípios de SRE para manter nossos sistemas saudáveis, confiáveis e performáticos em escala. Você definirá os padrões de observabilidade, gestão de incidentes e gestão da mudança, unindo forte senso de engenharia ao uso de ferramentas de IA para resolver problemas operacionais complexos antes que cheguem aos nossos clientes.

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

  • Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada pessoa colaboradora;
  • Programa +Saudáveis, que cuida de cada TOTVER com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;
  • Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para nossas pessoas colaboradoras;
  • Programa + Cuidado, programa de apoio pessoal para pessoas colaboradoras e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...
  • Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;
  • Plano de saúde e odontológico;
  • Vale refeição e / ou alimentação;
  • Vale transporte e fretados em algumas estações do metrô;
  • Licença maternidade e paternidade estendida;
  • Espaço de lactário;
  • Bicicletário;
  • Vestiário;
  • Seguro de vida;
  • Auxílio creche;
  • Previdência privada;
  • Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;
  • Gympass.
O QUE VOCÊ VAI FAZER:
  • Projetar, provisionar e manter infraestrutura e serviços de nuvem em AWS e GCP utilizando Infrastructure as Code (IaC).
  • Otimizar o SDLC e dar suporte às esteiras de deploy (CI/CD), promovendo práticas de gestão da mudança seguras, automatizadas e auditáveis.
  • Definir e governar políticas de infraestrutura e de desenvolvimento que protejam a confiabilidade e a segurança dos sistemas.
  • Implementar observabilidade nos sistemas (métricas, logs, traces, dashboards e alertas) para detectar problemas com antecedência e apoiar decisões.
  • Liderar a gestão de incidentes de ponta a ponta, automatizar a resposta a incidentes e produzir Blameless Post-Mortems que transformem falhas em melhorias sistêmicas.
  • Conduzir testes de carga, engenharia do caos e planejamento de capacidade para validar a resiliência e antecipar necessidades de escala.
  • Definir, acompanhar e reportar indicadores de confiabilidade (SLA, SLI, SLO, Error Budget) e objetivos de equipe (OKRs).
  • Aplicar conceitos de engenharia de software para automatizar operações e resolver problemas complexos de infraestrutura.
  • Produzir documentação técnica clara e apresentações eficazes para comunicar decisões e resultados às partes interessadas.
O QUE ESPERAMOS DE VOCÊ:
  • Graduação em Ciência da Computação, Engenharia ou área correlata (obrigatório).
  • Experiência em funções de SRE, DevOps ou engenharia de plataforma/infraestrutura.
  • Inglês em nível de trabalho (leitura, escrita e conversação).
  • Domínio dos conceitos de confiabilidade: SLA, SLI, SLO e Error Budget.
  • Experiência prática em gestão de incidentes e na elaboração de Blameless Post-Mortems.
  • Forte capacidade de colaboração e comunicação, com habilidade para redigir documentos claros e objetivos e realizar apresentações a públicos técnicos e não técnicos.
  • Plataformas de nuvem (AWS, GCP ou Azure).
  • Infrastructure as Code — ex.: Terraform, CloudFormation ou Pulumi.
  • Cultura e automação de CI/CD — ex.: Azure DevOps, GitHub Actions, GitLab CI, Jenkins ou ArgoCD.
  • Ferramentas de observabilidade — ex.: Datadog, OpenTelemetry, Prometheus, Grafana.
  • Contêineres e orquestração — Docker e Kubernetes.
  • Técnicas e ferramentas de testes de carga, engenharia do caos e planejamento de capacidade.
  • Linguagens de script/programação para automação — ex.: Python, Go ou Bash.
  • Domínio de ferramentas de IA para acelerar o trabalho de operações e engenharia.
  • Definição e reporte de indicadores e OKRs; boa produção de apresentações em PowerPoint ou Google Slides.
SERIA LEGAL SE TIVESSE:
  • Certificações AWS e GCP.
  • Pós-graduação/especialização em Engenharia de Software ou Arquitetura de Software.
  • Conhecimento de desenvolvimento seguro (DevSecOps).
  • Experiência em ambientes de produção de larga escala, alta disponibilidade e ritmo acelerado.
  • Experiência na definição de padrões de plataforma/confiabilidade entre múltiplos times de engenharia.
Como empresa líder em tecnologia somos um universo de pessoas inconformadas, movidas por inovação, autonomia, aprendizado e performance. 
Juntos e juntas, criamos oportunidades, transformamos futuros e compartilhamos conhecimento. Aqui o seu desenvolvimento profissional acontece em um ambiente inclusivo, respeitoso e energizante. De gente pra gente!
Buscamos o crescimento sustentável. E usamos dados e IA para impulsionar resultados mais inteligentes e eficientes para os nossos clientes. 
Vem com a gente inovar e construir o futuro da tecnologia.
#VemPraTOTVS #SomosTOTVS
Ver página da empresa

[Tech] Engenharia de Confiabilidade e DevOps Especialista

TOTVS | São Paulo - SP | Híbrido

Descrição da vaga

Buscamos um(a) Engenheiro(a) de Confiabilidade e DevOps Espec. para ser a base da infraestrutura e das operações de engenharia dos nossos produtos de software. Nesta posição sênior, você atuará na otimização de todo o ciclo de vida de desenvolvimento de software (SDLC), construirá e manterá ambientes multi-cloud resilientes em AWS e GCP e aplicará princípios de SRE para manter nossos sistemas saudáveis, confiáveis e performáticos em escala. Você definirá os padrões de observabilidade, gestão de incidentes e gestão da mudança, unindo forte senso de engenharia ao uso de ferramentas de IA para resolver problemas operacionais complexos antes que cheguem aos nossos clientes.

Responsabilidades e atribuições

O QUE VOCÊ VAI FAZER:
  • Projetar, provisionar e manter infraestrutura e serviços de nuvem em AWS e GCP utilizando Infrastructure as Code (IaC).
  • Otimizar o SDLC e dar suporte às esteiras de deploy (CI/CD), promovendo práticas de gestão da mudança seguras, automatizadas e auditáveis.
  • Definir e governar políticas de infraestrutura e de desenvolvimento que protejam a confiabilidade e a segurança dos sistemas.
  • Implementar observabilidade nos sistemas (métricas, logs, traces, dashboards e alertas) para detectar problemas com antecedência e apoiar decisões.
  • Liderar a gestão de incidentes de ponta a ponta, automatizar a resposta a incidentes e produzir Blameless Post-Mortems que transformem falhas em melhorias sistêmicas.
  • Conduzir testes de carga, engenharia do caos e planejamento de capacidade para validar a resiliência e antecipar necessidades de escala.
  • Definir, acompanhar e reportar indicadores de confiabilidade (SLA, SLI, SLO, Error Budget) e objetivos de equipe (OKRs).
  • Aplicar conceitos de engenharia de software para automatizar operações e resolver problemas complexos de infraestrutura.
  • Produzir documentação técnica clara e apresentações eficazes para comunicar decisões e resultados às partes interessadas.

Requisitos e qualificações

O QUE ESPERAMOS DE VOCÊ:
  • Graduação em Ciência da Computação, Engenharia ou área correlata (obrigatório).
  • Experiência em funções de SRE, DevOps ou engenharia de plataforma/infraestrutura.
  • Inglês em nível de trabalho (leitura, escrita e conversação).
  • Domínio dos conceitos de confiabilidade: SLA, SLI, SLO e Error Budget.
  • Experiência prática em gestão de incidentes e na elaboração de Blameless Post-Mortems.
  • Forte capacidade de colaboração e comunicação, com habilidade para redigir documentos claros e objetivos e realizar apresentações a públicos técnicos e não técnicos.
  • Plataformas de nuvem (AWS, GCP ou Azure).
  • Infrastructure as Code — ex.: Terraform, CloudFormation ou Pulumi.
  • Cultura e automação de CI/CD — ex.: Azure DevOps, GitHub Actions, GitLab CI, Jenkins ou ArgoCD.
  • Ferramentas de observabilidade — ex.: Datadog, OpenTelemetry, Prometheus, Grafana.
  • Contêineres e orquestração — Docker e Kubernetes.
  • Técnicas e ferramentas de testes de carga, engenharia do caos e planejamento de capacidade.
  • Linguagens de script/programação para automação — ex.: Python, Go ou Bash.
  • Domínio de ferramentas de IA para acelerar o trabalho de operações e engenharia.
  • Definição e reporte de indicadores e OKRs; boa produção de apresentações em PowerPoint ou Google Slides.

Requisitos desejáveis

SERIA LEGAL SE TIVESSE:
  • Certificações AWS e GCP.
  • Pós-graduação/especialização em Engenharia de Software ou Arquitetura de Software.
  • Conhecimento de desenvolvimento seguro (DevSecOps).
  • Experiência em ambientes de produção de larga escala, alta disponibilidade e ritmo acelerado.
  • Experiência na definição de padrões de plataforma/confiabilidade entre múltiplos times de engenharia.
Enviar candidatura
Enviar candidatura

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

  • Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada pessoa colaboradora;
  • Programa +Saudáveis, que cuida de cada TOTVER com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;
  • Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para nossas pessoas colaboradoras;
  • Programa + Cuidado, programa de apoio pessoal para pessoas colaboradoras e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...
  • Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;
  • Plano de saúde e odontológico;
  • Vale refeição e / ou alimentação;
  • Vale transporte e fretados em algumas estações do metrô;
  • Licença maternidade e paternidade estendida;
  • Espaço de lactário;
  • Bicicletário;
  • Vestiário;
  • Seguro de vida;
  • Auxílio creche;
  • Previdência privada;
  • Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;
  • Gympass.

Sobre a empresa

Como empresa líder em tecnologia somos um universo de pessoas inconformadas, movidas por inovação, autonomia, aprendizado e performance. 
Juntos e juntas, criamos oportunidades, transformamos futuros e compartilhamos conhecimento. Aqui o seu desenvolvimento profissional acontece em um ambiente inclusivo, respeitoso e energizante. De gente pra gente!
Buscamos o crescimento sustentável. E usamos dados e IA para impulsionar resultados mais inteligentes e eficientes para os nossos clientes. 
Vem com a gente inovar e construir o futuro da tecnologia.
#VemPraTOTVS #SomosTOTVS
Ver página da empresa