Documentos
PDFs, Word, Excel, PowerPoint, TXT — preservando estrutura, tabelas e formatação semântica.
Serviços › RAG e busca semântica
RAG (Retrieval-Augmented Generation) permite que seus agentes respondam com base em documentos reais, atualizados e específicos do seu negócio — sem precisar re-treinar nenhum modelo. A AIVAX organiza esse conhecimento em coleções.
em extração de texto de PDFs, imagens, vídeos e áudios
Como funciona
Uma coleção é uma base de documentos convertidos em vetores semânticos. Quando um agente precisa de contexto, a AIVAX busca automaticamente os trechos mais relevantes e os injeta na janela de contexto do modelo — sem que você precise gerenciar embeddings ou índices vetoriais.
Você cria a coleção, insere os documentos e conecta ao seu AI Gateway. A partir daí, toda inferência tem acesso ao conhecimento certo, na hora certa.
Documentos de qualquer tipo são processados e convertidos em vetores semânticos
Trechos relevantes são armazenados com metadados para recuperação precisa
Na inferência, a busca semântica encontra e injeta os trechos mais relevantes
O modelo responde com base em fatos reais do seu conteúdo
Tipos de conteúdo
Algoritmos proprietários de extração convertem diferentes tipos de mídia em informação textual com até 95% de precisão. Você não precisa pré-processar nada.
PDFs, Word, Excel, PowerPoint, TXT — preservando estrutura, tabelas e formatação semântica.
OCR avançado extrai texto de capturas, infográficos, diagramas e documentos escaneados.
Transcrição de áudio e análise de frames para indexar conteúdo audiovisual completo.
Transcrição automática de podcasts, reuniões, treinamentos e chamadas gravadas.
Importe páginas e artigos diretamente por URL com limpeza automática de ruído.
JSON, CSV e respostas de API convertidos em chunks semânticos consultáveis.
Casos de uso
O RAG transforma documentos estáticos em respostas dinâmicas. Veja como diferentes organizações usam coleções para resolver problemas reais.
API de coleções
A API de RAG é deliberadamente simples. Você cria uma coleção, insere documentos e faz buscas semânticas — ou conecta a coleção ao seu gateway para injeção automática.
# Busca semântica
curl -X POST https://inference.aivax.net/api/v1/query \
-H "Authorization: ak_sua_chave" \
-H "Content-Type: application/json" \
-d '{
"terms": ["como reiniciar o módulo X?"],
"collections": ["col_manuais_prod"],
"top": 5,
"minScore": 0.7
}'
# Indexar um documento
curl -X PUT https://inference.aivax.net/api/v1/collections/col_manuais_prod/documents \
-H "Authorization: ak_sua_chave" \
-H "Content-Type: application/json" \
-d '{
"contents": "Conteúdo do manual v2...",
"name": "manual_v2",
"metadata": {"version": "2.0", "lang": "pt"}
}'
Próximo passo
A documentação cobre criação de coleções, ingestão de documentos, parâmetros de busca e integração com gateways.