Engenheiro(a) de IA Generativa SR (LLM & RAG)

V8.Tech | São Paulo - SP | Remoto

Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Desenvolvimento. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!

Faixa salarial

A combinar

Regime de contratação

CLT

Benefícios

💰 Remuneração CLT compatível com o mercado;
💻 Trabalho Remoto.
🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;
🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas: Alimentação, Refeição, Mobilidade, Educação Saúde e Cultura.
🧡 Seguro de Vida (Caixa Econômica)
🚑 Plano de Saúde (Porto Seguro)
🦷 Plano Odontológico (Porto Seguro)
📊 PLR de acordo com a política da empresa;
🎂 Voucher no dia do aniversário;
📚 Descontos exclusivos em escolas de idiomas, universidades, SESC, Etc;
💰 Programa de indicação #amigosv8.tech

Projetar, testar e evoluir prompts para diferentes casos de uso
Implementar e otimizar pipelines de RAG (retrieval + geração)
Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
Gerenciar contexto e uso de tokens (context window management)
Criar e manter saídas estruturadas (ex: JSON) com consistência
Realizar testes versionados de prompts e acompanhar evolução de performance
Definir e aplicar métricas de avaliação de qualidade das respostas
Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
Implementar estratégias para redução de alucinações (anti-hallucination)
Trabalhar em conjunto com times de backend e dados para integração das soluções

Experiência prática com:
- Azure OpenAI Service
- Azure AI Search
Conhecimento sólido em:
- Estratégias de embeddings
- Chunking de documentos
- Context window management
- Structured output (JSON)
Experiência com:
- Testes de prompt versionados
- Avaliação de qualidade de respostas de modelos
- Otimização de uso de tokens
Domínio de técnicas de prompt engineering:
- Design de system prompts robustos
- Ajustes de temperature e top_p
- Estratégias anti-hallucination

Experiência real implementando RAG em produção
Experiência com medição de custo por requisição (token usage / FinOps de IA)
Conhecimento básico de backend (APIs, integração de serviços)
Experiência com pipelines de:
- Classificação
- Sumarização

Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.

Ver página da empresa

Enviar candidatura

Engenheiro(a) de IA Generativa SR (LLM & RAG)

V8.Tech | São Paulo - SP | Remoto

Descrição da vaga

Responsabilidades e atribuições

Projetar, testar e evoluir prompts para diferentes casos de uso
Implementar e otimizar pipelines de RAG (retrieval + geração)
Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
Gerenciar contexto e uso de tokens (context window management)
Criar e manter saídas estruturadas (ex: JSON) com consistência
Realizar testes versionados de prompts e acompanhar evolução de performance
Definir e aplicar métricas de avaliação de qualidade das respostas
Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
Implementar estratégias para redução de alucinações (anti-hallucination)
Trabalhar em conjunto com times de backend e dados para integração das soluções

Requisitos e qualificações

Experiência prática com:
- Azure OpenAI Service
- Azure AI Search
Conhecimento sólido em:
- Estratégias de embeddings
- Chunking de documentos
- Context window management
- Structured output (JSON)
Experiência com:
- Testes de prompt versionados
- Avaliação de qualidade de respostas de modelos
- Otimização de uso de tokens
Domínio de técnicas de prompt engineering:
- Design de system prompts robustos
- Ajustes de temperature e top_p
- Estratégias anti-hallucination

Requisitos desejáveis

Experiência real implementando RAG em produção
Experiência com medição de custo por requisição (token usage / FinOps de IA)
Conhecimento básico de backend (APIs, integração de serviços)
Experiência com pipelines de:
- Classificação
- Sumarização