Engenheiro(a) de IA Generativa SR (LLM & RAG)
V8.Tech | São Paulo - SP | Remoto
Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Desenvolvimento. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- 💰 Remuneração CLT compatível com o mercado;
- 💻 Trabalho Remoto.
- 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;
- 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas: Alimentação, Refeição, Mobilidade, Educação Saúde e Cultura.
- 🧡 Seguro de Vida (Caixa Econômica)
- 🚑 Plano de Saúde (Porto Seguro)
- 🦷 Plano Odontológico (Porto Seguro)
- 📊 PLR de acordo com a política da empresa;
- 🎂 Voucher no dia do aniversário;
- 📚 Descontos exclusivos em escolas de idiomas, universidades, SESC, Etc;
- 💰 Programa de indicação #amigosv8.tech
- Projetar, testar e evoluir prompts para diferentes casos de uso
- Implementar e otimizar pipelines de RAG (retrieval + geração)
- Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
- Gerenciar contexto e uso de tokens (context window management)
- Criar e manter saídas estruturadas (ex: JSON) com consistência
- Realizar testes versionados de prompts e acompanhar evolução de performance
- Definir e aplicar métricas de avaliação de qualidade das respostas
- Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
- Implementar estratégias para redução de alucinações (anti-hallucination)
- Trabalhar em conjunto com times de backend e dados para integração das soluções
- Experiência prática com:
- Azure OpenAI Service
- Azure AI Search
-
Conhecimento sólido em:
- Estratégias de embeddings
- Chunking de documentos
- Context window management
- Structured output (JSON)
-
Experiência com:
- Testes de prompt versionados
- Avaliação de qualidade de respostas de modelos
- Otimização de uso de tokens
-
Domínio de técnicas de prompt engineering:
- Design de system prompts robustos
- Ajustes de temperature e top_p
- Estratégias anti-hallucination
- Experiência real implementando RAG em produção
- Experiência com medição de custo por requisição (token usage / FinOps de IA)
- Conhecimento básico de backend (APIs, integração de serviços)
-
Experiência com pipelines de:
- Classificação
- Sumarização
Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.
Engenheiro(a) de IA Generativa SR (LLM & RAG)
V8.Tech | São Paulo - SP | Remoto
Descrição da vaga
Estamos em busca de uma pessoa dedicada e com vontade de fazer a diferença para atuar na área de Desenvolvimento. Se você ama tecnologia, gosta de desafios e acredita no poder da colaboração para alcançar grandes resultados, essa oportunidade é para você!
Responsabilidades e atribuições
- Projetar, testar e evoluir prompts para diferentes casos de uso
- Implementar e otimizar pipelines de RAG (retrieval + geração)
- Definir estratégias de chunking e embeddings para melhoria de recuperação de contexto
- Gerenciar contexto e uso de tokens (context window management)
- Criar e manter saídas estruturadas (ex: JSON) com consistência
- Realizar testes versionados de prompts e acompanhar evolução de performance
- Definir e aplicar métricas de avaliação de qualidade das respostas
- Ajustar parâmetros de inferência (temperature, top_p, etc.) conforme o caso de uso
- Implementar estratégias para redução de alucinações (anti-hallucination)
- Trabalhar em conjunto com times de backend e dados para integração das soluções
Requisitos e qualificações
- Experiência prática com:
- Azure OpenAI Service
- Azure AI Search
-
Conhecimento sólido em:
- Estratégias de embeddings
- Chunking de documentos
- Context window management
- Structured output (JSON)
-
Experiência com:
- Testes de prompt versionados
- Avaliação de qualidade de respostas de modelos
- Otimização de uso de tokens
-
Domínio de técnicas de prompt engineering:
- Design de system prompts robustos
- Ajustes de temperature e top_p
- Estratégias anti-hallucination
Requisitos desejáveis
- Experiência real implementando RAG em produção
- Experiência com medição de custo por requisição (token usage / FinOps de IA)
- Conhecimento básico de backend (APIs, integração de serviços)
-
Experiência com pipelines de:
- Classificação
- Sumarização
Faixa salarial
A combinar
Regime de contratação
CLT
Benefícios
- 💰 Remuneração CLT compatível com o mercado;
- 💻 Trabalho Remoto.
- 🕛 Horário de trabalho flexível: De acordo com área de atuação e política interna;
- 🍎 Flash - Cartão de Benefícios Flexíveis com todas as categorias habilitadas: Alimentação, Refeição, Mobilidade, Educação Saúde e Cultura.
- 🧡 Seguro de Vida (Caixa Econômica)
- 🚑 Plano de Saúde (Porto Seguro)
- 🦷 Plano Odontológico (Porto Seguro)
- 📊 PLR de acordo com a política da empresa;
- 🎂 Voucher no dia do aniversário;
- 📚 Descontos exclusivos em escolas de idiomas, universidades, SESC, Etc;
- 💰 Programa de indicação #amigosv8.tech
Sobre a empresa
Há 10 anos no mercado, a V8.Tech é uma empresa jovem, movida por tecnologia e inovação, que acelera a transformação digital. Ajudamos nossos clientes a revolucionarem seus negócios por meio da reestruturação e evolução, com foco na otimização de processos, tecnologia da informação, transformação digital e no crescimento em diversos setores. Atendemos diversos países na América Latina a partir de nosso escritório em São Paulo: Argentina, Colômbia, Peru e México.