Moderação de conteúdo
Adicione workers que analisam entrada e saída em tempo real. Bloqueie, edite ou sinalize mensagens inapropriadas antes de chegarem ao usuário final — sem alterar o modelo.
Serviços › Gateways de IA
Um AI Gateway é o ponto central onde instruções, modelos, ferramentas e contexto se encontram. Você define as regras uma vez e cada interação segue esse roteiro — com precisão, consistência e governança.
O que é
A maioria das soluções de inferência te dá acesso a um modelo e deixa todo o resto com você. Um AI Gateway da AIVAX encapsula o comportamento do agente: as instruções fixas, o modelo escolhido, as coleções de conhecimento vinculadas, as ferramentas disponíveis, as regras de moderação e a validação de saída — tudo como configuração, não como código.
Quando alguém chama o endpoint do gateway, ele já sabe como se comportar. Você não precisa repassar o contexto toda vez.
Casos de uso
Do assistente de suporte ao agente de vendas — cada caso tem características diferentes, e o gateway cuida de cada um sem você precisar escrever um novo sistema.
Adicione workers que analisam entrada e saída em tempo real. Bloqueie, edite ou sinalize mensagens inapropriadas antes de chegarem ao usuário final — sem alterar o modelo.
Conecte coleções semânticas diretamente ao gateway. Cada inferência busca automaticamente os trechos mais relevantes e os injeta no contexto antes de chamar o modelo.
Use servidores MCP externos como ferramentas do seu gateway. Crie arquiteturas de agentes aninhados onde cada gateway delega tarefas especializadas a outros.
Carregue instruções especializadas sob demanda. O gateway decide quando acionar cada skill baseado no contexto da conversa — economiza tokens e aumenta precisão.
Truncamento automático de contexto, complexity routing entre modelos e caching de respostas repetidas. Pague menos sem sacrificar qualidade.
JSON Healing automático valida e corrige a saída até conformidade com seu schema — mesmo em modelos sem suporte nativo a structured output.
Pipeline de inferência
O pipeline do gateway é configurável: você escolhe quais etapas ativar, em qual ordem e sob quais condições. Não há "caixa-preta" — cada decisão é rastreável.
Integração
Crie o gateway no console, copie o slug e use qualquer biblioteca compatível com OpenAI. Nada muda no seu código exceto a URL base e o modelo — que agora é o identificador do seu gateway.
curl -X POST https://inference.aivax.net/v1/chat/completions \
-H "Authorization: ak_sua_chave" \
-H "Content-Type: application/json" \
-d '{
"model": "suporte-tecnico:a1b2",
"messages": [
{"role": "user", "content": "Qual o status do meu pedido?"}
]
}'
Workers
Workers são funções remotas chamadas pelo gateway em momentos específicos do pipeline. Você pode inspecionar, modificar ou bloquear qualquer mensagem sem alterar o endpoint principal.
Executam antes do modelo receber a mensagem. Use para: moderação de conteúdo, enriquecimento de contexto, roteamento condicional para diferentes gateways, autenticação e controle de rate limit por usuário.
Executam após o modelo gerar a resposta. Use para: redação de dados sensíveis, validação de conformidade, transformação de formato, logging estruturado para auditoria e disparo de ações externas via webhook.
Executam em paralelo sem bloquear a resposta. Use para: analytics em tempo real, indexação automática de conversas no RAG, notificações e integrações com CRM ou sistemas de suporte.
Próximo passo
A documentação cobre em detalhes cada parâmetro de configuração, workers e casos de uso avançados.