Serviços › RAG e busca semântica

Conhecimento que o modelo realmente entende.

RAG (Retrieval-Augmented Generation) permite que seus agentes respondam com base em documentos reais, atualizados e específicos do seu negócio — sem precisar re-treinar nenhum modelo. A AIVAX organiza esse conhecimento em coleções.

95% precisão de incorporação

em extração de texto de PDFs, imagens, vídeos e áudios

PDF Imagem Vídeo Áudio Word Excel

Como funciona

Coleções: bibliotecas de conhecimento sob demanda.

Uma coleção é uma base de documentos convertidos em vetores semânticos. Quando um agente precisa de contexto, a AIVAX busca automaticamente os trechos mais relevantes e os injeta na janela de contexto do modelo — sem que você precise gerenciar embeddings ou índices vetoriais.

Você cria a coleção, insere os documentos e conecta ao seu AI Gateway. A partir daí, toda inferência tem acesso ao conhecimento certo, na hora certa.

1
Ingestão

Documentos de qualquer tipo são processados e convertidos em vetores semânticos

2
Indexação

Trechos relevantes são armazenados com metadados para recuperação precisa

3
Recuperação

Na inferência, a busca semântica encontra e injeta os trechos mais relevantes

4
Resposta fundamentada

O modelo responde com base em fatos reais do seu conteúdo

Tipos de conteúdo

Qualquer formato vira conhecimento estruturado.

Algoritmos proprietários de extração convertem diferentes tipos de mídia em informação textual com até 95% de precisão. Você não precisa pré-processar nada.

Documentos

PDFs, Word, Excel, PowerPoint, TXT — preservando estrutura, tabelas e formatação semântica.

Imagens

OCR avançado extrai texto de capturas, infográficos, diagramas e documentos escaneados.

Vídeos

Transcrição de áudio e análise de frames para indexar conteúdo audiovisual completo.

Áudios

Transcrição automática de podcasts, reuniões, treinamentos e chamadas gravadas.

Páginas web

Importe páginas e artigos diretamente por URL com limpeza automática de ruído.

Dados estruturados

JSON, CSV e respostas de API convertidos em chunks semânticos consultáveis.

Casos de uso

Quando o conhecimento certo muda tudo.

O RAG transforma documentos estáticos em respostas dinâmicas. Veja como diferentes organizações usam coleções para resolver problemas reais.

Suporte a conteúdo audiovisual

Uma plataforma de streaming indexou catálogos completos de filmes — diálogos, sinopses, metadados e resenhas. O assistente responde perguntas como "Em qual cena o protagonista menciona Paris?" com precisão de capítulo e timestamp.

Suporte técnico automatizado

Manuais de produto, guias de instalação e FAQs em uma coleção. O agente resolve 78% dos chamados sem escalar para humanos.

Pesquisa acadêmica

Centenas de artigos científicos indexados. Pesquisadores encontram referências cruzadas e conexões entre publicações em segundos.

Treinamento corporativo

Vídeos de onboarding, políticas internas e SOPs em uma coleção. Novos colaboradores têm respostas instantâneas sobre processos da empresa.

API de coleções

Ingerir, buscar e integrar com poucos endpoints.

A API de RAG é deliberadamente simples. Você cria uma coleção, insere documentos e faz buscas semânticas — ou conecta a coleção ao seu gateway para injeção automática.

  • Upload de documentos em qualquer formato
  • Busca semântica com score de relevância
  • Filtros por metadados e data de indexação
  • Integração nativa com AI Gateways
rag.sh curl
# Busca semântica
curl -X POST https://inference.aivax.net/api/v1/query \
  -H "Authorization: ak_sua_chave" \
  -H "Content-Type: application/json" \
  -d '{
    "terms": ["como reiniciar o módulo X?"],
    "collections": ["col_manuais_prod"],
    "top": 5,
    "minScore": 0.7
  }'

# Indexar um documento
curl -X PUT https://inference.aivax.net/api/v1/collections/col_manuais_prod/documents \
  -H "Authorization: ak_sua_chave" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": "Conteúdo do manual v2...",
    "name": "manual_v2",
    "metadata": {"version": "2.0", "lang": "pt"}
  }'

Próximo passo

Crie sua primeira coleção de conhecimento.

A documentação cobre criação de coleções, ingestão de documentos, parâmetros de busca e integração com gateways.