[Tech] Engenharia de Confiabilidade e DevOps Especialista
TOTVS | São Paulo - SP | Híbrido
Buscamos um(a) Engenheiro(a) de Confiabilidade e DevOps Espec. para ser a base da infraestrutura e das operações de engenharia dos nossos produtos de software. Nesta posição sênior, você atuará na otimização de todo o ciclo de vida de desenvolvimento de software (SDLC), construirá e manterá ambientes multi-cloud resilientes em AWS e GCP e aplicará princípios de SRE para manter nossos sistemas saudáveis, confiáveis e performáticos em escala. Você definirá os padrões de observabilidade, gestão de incidentes e gestão da mudança, unindo forte senso de engenharia ao uso de ferramentas de IA para resolver problemas operacionais complexos antes que cheguem aos nossos clientes.
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada pessoa colaboradora;
- Programa +Saudáveis, que cuida de cada TOTVER com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;
- Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para nossas pessoas colaboradoras;
- Programa + Cuidado, programa de apoio pessoal para pessoas colaboradoras e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...
- Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;
- Plano de saúde e odontológico;
- Vale refeição e / ou alimentação;
- Vale transporte e fretados em algumas estações do metrô;
- Licença maternidade e paternidade estendida;
- Espaço de lactário;
- Bicicletário;
- Vestiário;
- Seguro de vida;
- Auxílio creche;
- Previdência privada;
- Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;
- Gympass.
O QUE VOCÊ VAI FAZER:
- Projetar, provisionar e manter infraestrutura e serviços de nuvem em AWS e GCP utilizando Infrastructure as Code (IaC).
- Otimizar o SDLC e dar suporte às esteiras de deploy (CI/CD), promovendo práticas de gestão da mudança seguras, automatizadas e auditáveis.
- Definir e governar políticas de infraestrutura e de desenvolvimento que protejam a confiabilidade e a segurança dos sistemas.
- Implementar observabilidade nos sistemas (métricas, logs, traces, dashboards e alertas) para detectar problemas com antecedência e apoiar decisões.
- Liderar a gestão de incidentes de ponta a ponta, automatizar a resposta a incidentes e produzir Blameless Post-Mortems que transformem falhas em melhorias sistêmicas.
- Conduzir testes de carga, engenharia do caos e planejamento de capacidade para validar a resiliência e antecipar necessidades de escala.
- Definir, acompanhar e reportar indicadores de confiabilidade (SLA, SLI, SLO, Error Budget) e objetivos de equipe (OKRs).
- Aplicar conceitos de engenharia de software para automatizar operações e resolver problemas complexos de infraestrutura.
- Produzir documentação técnica clara e apresentações eficazes para comunicar decisões e resultados às partes interessadas.
O QUE ESPERAMOS DE VOCÊ:
- Graduação em Ciência da Computação, Engenharia ou área correlata (obrigatório).
- Experiência em funções de SRE, DevOps ou engenharia de plataforma/infraestrutura.
- Inglês em nível de trabalho (leitura, escrita e conversação).
- Domínio dos conceitos de confiabilidade: SLA, SLI, SLO e Error Budget.
- Experiência prática em gestão de incidentes e na elaboração de Blameless Post-Mortems.
- Forte capacidade de colaboração e comunicação, com habilidade para redigir documentos claros e objetivos e realizar apresentações a públicos técnicos e não técnicos.
- Plataformas de nuvem (AWS, GCP ou Azure).
- Infrastructure as Code — ex.: Terraform, CloudFormation ou Pulumi.
- Cultura e automação de CI/CD — ex.: Azure DevOps, GitHub Actions, GitLab CI, Jenkins ou ArgoCD.
- Ferramentas de observabilidade — ex.: Datadog, OpenTelemetry, Prometheus, Grafana.
- Contêineres e orquestração — Docker e Kubernetes.
- Técnicas e ferramentas de testes de carga, engenharia do caos e planejamento de capacidade.
- Linguagens de script/programação para automação — ex.: Python, Go ou Bash.
- Domínio de ferramentas de IA para acelerar o trabalho de operações e engenharia.
- Definição e reporte de indicadores e OKRs; boa produção de apresentações em PowerPoint ou Google Slides.
SERIA LEGAL SE TIVESSE:
- Certificações AWS e GCP.
- Pós-graduação/especialização em Engenharia de Software ou Arquitetura de Software.
- Conhecimento de desenvolvimento seguro (DevSecOps).
- Experiência em ambientes de produção de larga escala, alta disponibilidade e ritmo acelerado.
- Experiência na definição de padrões de plataforma/confiabilidade entre múltiplos times de engenharia.
Como empresa líder em tecnologia somos um universo de pessoas inconformadas, movidas por inovação, autonomia, aprendizado e performance.
Juntos e juntas, criamos oportunidades, transformamos futuros e compartilhamos conhecimento. Aqui o seu desenvolvimento profissional acontece em um ambiente inclusivo, respeitoso e energizante. De gente pra gente!
Buscamos o crescimento sustentável. E usamos dados e IA para impulsionar resultados mais inteligentes e eficientes para os nossos clientes.
Vem com a gente inovar e construir o futuro da tecnologia.
#VemPraTOTVS #SomosTOTVS
[Tech] Engenharia de Confiabilidade e DevOps Especialista
TOTVS | São Paulo - SP | Híbrido
Descrição da vaga
Buscamos um(a) Engenheiro(a) de Confiabilidade e DevOps Espec. para ser a base da infraestrutura e das operações de engenharia dos nossos produtos de software. Nesta posição sênior, você atuará na otimização de todo o ciclo de vida de desenvolvimento de software (SDLC), construirá e manterá ambientes multi-cloud resilientes em AWS e GCP e aplicará princípios de SRE para manter nossos sistemas saudáveis, confiáveis e performáticos em escala. Você definirá os padrões de observabilidade, gestão de incidentes e gestão da mudança, unindo forte senso de engenharia ao uso de ferramentas de IA para resolver problemas operacionais complexos antes que cheguem aos nossos clientes.
Responsabilidades e atribuições
O QUE VOCÊ VAI FAZER:
- Projetar, provisionar e manter infraestrutura e serviços de nuvem em AWS e GCP utilizando Infrastructure as Code (IaC).
- Otimizar o SDLC e dar suporte às esteiras de deploy (CI/CD), promovendo práticas de gestão da mudança seguras, automatizadas e auditáveis.
- Definir e governar políticas de infraestrutura e de desenvolvimento que protejam a confiabilidade e a segurança dos sistemas.
- Implementar observabilidade nos sistemas (métricas, logs, traces, dashboards e alertas) para detectar problemas com antecedência e apoiar decisões.
- Liderar a gestão de incidentes de ponta a ponta, automatizar a resposta a incidentes e produzir Blameless Post-Mortems que transformem falhas em melhorias sistêmicas.
- Conduzir testes de carga, engenharia do caos e planejamento de capacidade para validar a resiliência e antecipar necessidades de escala.
- Definir, acompanhar e reportar indicadores de confiabilidade (SLA, SLI, SLO, Error Budget) e objetivos de equipe (OKRs).
- Aplicar conceitos de engenharia de software para automatizar operações e resolver problemas complexos de infraestrutura.
- Produzir documentação técnica clara e apresentações eficazes para comunicar decisões e resultados às partes interessadas.
Requisitos e qualificações
O QUE ESPERAMOS DE VOCÊ:
- Graduação em Ciência da Computação, Engenharia ou área correlata (obrigatório).
- Experiência em funções de SRE, DevOps ou engenharia de plataforma/infraestrutura.
- Inglês em nível de trabalho (leitura, escrita e conversação).
- Domínio dos conceitos de confiabilidade: SLA, SLI, SLO e Error Budget.
- Experiência prática em gestão de incidentes e na elaboração de Blameless Post-Mortems.
- Forte capacidade de colaboração e comunicação, com habilidade para redigir documentos claros e objetivos e realizar apresentações a públicos técnicos e não técnicos.
- Plataformas de nuvem (AWS, GCP ou Azure).
- Infrastructure as Code — ex.: Terraform, CloudFormation ou Pulumi.
- Cultura e automação de CI/CD — ex.: Azure DevOps, GitHub Actions, GitLab CI, Jenkins ou ArgoCD.
- Ferramentas de observabilidade — ex.: Datadog, OpenTelemetry, Prometheus, Grafana.
- Contêineres e orquestração — Docker e Kubernetes.
- Técnicas e ferramentas de testes de carga, engenharia do caos e planejamento de capacidade.
- Linguagens de script/programação para automação — ex.: Python, Go ou Bash.
- Domínio de ferramentas de IA para acelerar o trabalho de operações e engenharia.
- Definição e reporte de indicadores e OKRs; boa produção de apresentações em PowerPoint ou Google Slides.
Requisitos desejáveis
SERIA LEGAL SE TIVESSE:
- Certificações AWS e GCP.
- Pós-graduação/especialização em Engenharia de Software ou Arquitetura de Software.
- Conhecimento de desenvolvimento seguro (DevSecOps).
- Experiência em ambientes de produção de larga escala, alta disponibilidade e ritmo acelerado.
- Experiência na definição de padrões de plataforma/confiabilidade entre múltiplos times de engenharia.
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- Universidade em Rede TOTVS, uma universidade Corporativa com conteúdos e certificações gratuitos para cada pessoa colaboradora;
- Programa +Saudáveis, que cuida de cada TOTVER com assessoria e ações voltadas para o bem estar em corpo, mente e finanças pessoais;
- Programa +Vantagens, a maior rede de descontos da América Latina, exclusivos para nossas pessoas colaboradoras;
- Programa + Cuidado, programa de apoio pessoal para pessoas colaboradoras e familiares, com orientações em diversas especialidades como: psicologia, serviço social, pet consultoria...
- Einstein Conecta, benefício de orientação médica online pelos médicos do Hospital Israelita Albert Einstein, totalmente gratuito;
- Plano de saúde e odontológico;
- Vale refeição e / ou alimentação;
- Vale transporte e fretados em algumas estações do metrô;
- Licença maternidade e paternidade estendida;
- Espaço de lactário;
- Bicicletário;
- Vestiário;
- Seguro de vida;
- Auxílio creche;
- Previdência privada;
- Escritório que estimula a criatividade e produtividade com ambientes para lanches, salas de jogos, mesas de bilhar e poltronas para relaxar;
- Gympass.
Sobre a empresa
Como empresa líder em tecnologia somos um universo de pessoas inconformadas, movidas por inovação, autonomia, aprendizado e performance.
Juntos e juntas, criamos oportunidades, transformamos futuros e compartilhamos conhecimento. Aqui o seu desenvolvimento profissional acontece em um ambiente inclusivo, respeitoso e energizante. De gente pra gente!
Buscamos o crescimento sustentável. E usamos dados e IA para impulsionar resultados mais inteligentes e eficientes para os nossos clientes.
Vem com a gente inovar e construir o futuro da tecnologia.
#VemPraTOTVS #SomosTOTVS