Engenheiro(a) de IA Generativa SR (LLM & RAG)

V8.Tech | São Paulo - SP | Remoto

Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Desenvolvimento. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

  • 💰 Remuneração CLT compatível com o mercado;  
  • 💻 Trabalho Remoto.
  • 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;  
  • 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas:  Alimentação, Refeição, Mobilidade, Educação Saúde e Cultura. 
  • 🧡 Seguro de Vida (Caixa Econômica)  
  • 🚑 Plano de Saúde (Porto Seguro)  
  • 🦷 Plano Odontológico (Porto Seguro)  
  • 📊 PLR de acordo com a política da empresa;  
  • 🎂 Voucher no dia do aniversário;  
  • 📚 Descontos exclusivos em escolas de idiomas, universidades, SESC, Etc;  
  • 💰 Programa de indicação #amigosv8.tech
  • Projetar, testar e evoluir prompts para diferentes casos de uso
  • Implementar e otimizar pipelines de RAG (retrieval + geração)
  • Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
  • Gerenciar contexto e uso de tokens (context window management)
  • Criar e manter saídas estruturadas (ex: JSON) com consistência
  • Realizar testes versionados de prompts e acompanhar evolução de performance
  • Definir e aplicar métricas de avaliação de qualidade das respostas
  • Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
  • Implementar estratégias para redução de alucinações (anti-hallucination)
  • Trabalhar em conjunto com times de backend e dados para integração das soluções
  • Experiência prática com:
    • Azure OpenAI Service
    • Azure AI Search
  • Conhecimento sólido em:
    • Estratégias de embeddings
    • Chunking de documentos
    • Context window management
    • Structured output (JSON)
  • Experiência com:
    • Testes de prompt versionados
    • Avaliação de qualidade de respostas de modelos
    • Otimização de uso de tokens
  • Domínio de técnicas de prompt engineering:
    • Design de system prompts robustos
    • Ajustes de temperature e top_p
    • Estratégias anti-hallucination
  • Experiência real implementando RAG em produção
  • Experiência com medição de custo por requisição (token usage / FinOps de IA)
  • Conhecimento básico de backend (APIs, integração de serviços)
  • Experiência com pipelines de:
    • Classificação
    • Sumarização
Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.
Ver página da empresa

Engenheiro(a) de IA Generativa SR (LLM & RAG)

V8.Tech | São Paulo - SP | Remoto

Descrição da vaga

Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Desenvolvimento. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!

Responsabilidades e atribuições

  • Projetar, testar e evoluir prompts para diferentes casos de uso
  • Implementar e otimizar pipelines de RAG (retrieval + geração)
  • Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
  • Gerenciar contexto e uso de tokens (context window management)
  • Criar e manter saídas estruturadas (ex: JSON) com consistência
  • Realizar testes versionados de prompts e acompanhar evolução de performance
  • Definir e aplicar métricas de avaliação de qualidade das respostas
  • Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
  • Implementar estratégias para redução de alucinações (anti-hallucination)
  • Trabalhar em conjunto com times de backend e dados para integração das soluções

Requisitos e qualificações

  • Experiência prática com:
    • Azure OpenAI Service
    • Azure AI Search
  • Conhecimento sólido em:
    • Estratégias de embeddings
    • Chunking de documentos
    • Context window management
    • Structured output (JSON)
  • Experiência com:
    • Testes de prompt versionados
    • Avaliação de qualidade de respostas de modelos
    • Otimização de uso de tokens
  • Domínio de técnicas de prompt engineering:
    • Design de system prompts robustos
    • Ajustes de temperature e top_p
    • Estratégias anti-hallucination

Requisitos desejáveis

  • Experiência real implementando RAG em produção
  • Experiência com medição de custo por requisição (token usage / FinOps de IA)
  • Conhecimento básico de backend (APIs, integração de serviços)
  • Experiência com pipelines de:
    • Classificação
    • Sumarização
Enviar candidatura
Enviar candidatura

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

  • 💰 Remuneração CLT compatível com o mercado;  
  • 💻 Trabalho Remoto.
  • 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;  
  • 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas:  Alimentação, Refeição, Mobilidade, Educação Saúde e Cultura. 
  • 🧡 Seguro de Vida (Caixa Econômica)  
  • 🚑 Plano de Saúde (Porto Seguro)  
  • 🦷 Plano Odontológico (Porto Seguro)  
  • 📊 PLR de acordo com a política da empresa;  
  • 🎂 Voucher no dia do aniversário;  
  • 📚 Descontos exclusivos em escolas de idiomas, universidades, SESC, Etc;  
  • 💰 Programa de indicação #amigosv8.tech

Sobre a empresa

Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.
Ver página da empresa