Coleções semânticas com injeção nativa de contexto.
AIVAX PLATFORM
Orquestre agentes, conhecimento e ações em uma única API.
A AIVAX consolida inferência, RAG, ferramentas agênticas, moderação, memória e canais de atendimento em uma camada única, pronta para operações enterprise.
- API única
- OpenAI-compatível para SDKs existentes
- Pipeline completo
- RAG, tools, skills, moderação e JSON healing
- Sem lock-in
- BYOK, webhooks, MCP e múltiplos canais
Endpoint central de inferência
Instrui o modelo, carrega contexto, aciona ferramentas e entrega respostas confiáveis.
Web, browser, código, memória, documentos e integrações.
Instruções especializadas carregadas sob demanda.
Moderação, validação JSON e hooks remotos em pipeline.
O que a AIVAX resolve
Menos peças soltas. Mais controle operacional.
Construir assistentes que respondem com contexto real, executam ações e operam em produção normalmente exige integrar vários provedores, pipelines de embedding, regras de moderação e canais distintos. A AIVAX reduz essa superfície operacional para uma camada única de configuração.
Sem AIVAX
- Infraestrutura de modelos dispersa
- RAG, memória e moderação tratados separadamente
- Maior custo operacional e mais pontos de falha
- Integrações duplicadas por canal ou SDK
Com AIVAX
- AI Gateway como núcleo de orquestração
- Ferramentas, skills e conhecimento em um fluxo coeso
- Entrega via API, widget e mensageria sem retrabalho
- Sem provisionar servidores ou pipelines de embedding isolados
Serviços da plataforma
Componentes pensados para operar em conjunto.
Cada serviço pode ser usado isoladamente, mas a maior vantagem da AIVAX está no pipeline integrado, com menos acoplamento manual e mais previsibilidade em produção.
AI Gateways
Defina instruções de sistema, modelo, parâmetros e pipelines de inferência em um endpoint compatível com chat/completions.
Inferência central ExplorarRAG
Coleções semânticas com recuperação de trechos relevantes e integração nativa com o contexto do agente.
ExplorarFerramentas
Pesquisa web, browser, código sandboxed, memória, geração de documentos, hospedagem de páginas e mais.
MCP e webhooks
Amplie a capacidade dos agentes com servidores MCP externos e funções personalizadas com callback seguro.
Skills
Carregamento sob demanda de instruções especializadas para reduzir consumo de tokens e aumentar precisão contextual.
JSON Healing
Validação e correção automática até conformidade com JSON Schema, mesmo em modelos sem suporte nativo.
Chat Clients
Widget web, Telegram e WhatsApp para levar o mesmo agente a múltiplos canais com menos fricção.
ExplorarWorkers e moderação
Hooks remotos e camada de segurança para controle de fluxo, inspeção e conformidade antes da entrega.
Como os serviços se integram
Um pipeline único para conhecimento, ação e governança.
A mensagem chega por API ou chat client, passa pelo AI Gateway e aciona, conforme necessário, contexto documental, ferramentas externas, skills e validações estruturais antes de retornar ao usuário.
Começando em minutos
Sem SDK proprietário. Sem lock-in.
A integração segue a mesma interface que muitas equipes já usam com OpenAI. Você cria um gateway, conecta uma coleção se precisar de RAG e publica o agente no canal desejado.
- Crie um AI Gateway com modelo, instruções e pipeline.
- Conecte uma coleção documental, se precisar de conhecimento fundamentado.
- Consuma pela API, pelo widget web ou por um canal de mensagens.
curl -X POST https://inference.aivax.net/v1/chat/completions \
-H "Authorization: sua_api_key" \
-H "Content-Type: application/json" \
-d '{
"model": "meu-agente:50c3",
"messages": [
{"role": "user", "content": "Olá!"}
]
}'
Modelo de custos
Pré-pago com planos de assinatura para diferentes estágios.
Você paga pelo que usa, sem surpresas. Escolha o plano que encaixa no seu estágio e escale quando precisar.
Para validar fluxos e publicar o primeiro agente sem custo.
- JSON Healing automático
- BYOK limitado
- Coleções RAG até 2
- Deep search
- Busca no Twitter/X
- Suporte prioritário
Para equipes em produção com volume, coleções e margem saudável.
- JSON Healing automático
- BYOK completo
- Coleções RAG ilimitadas
- Deep search 100/dia
- Busca no Twitter/X 1.000/dia
- Suporte prioritário
Para operação intensiva com escala alta, zero comissão e folga operacional.
- JSON Healing automático
- BYOK completo
- Coleções RAG ilimitadas
- Deep search 1.000/dia
- Busca no Twitter/X 10.000/dia
- Suporte dedicado
Próximos passos
Leve sua operação de IA para uma arquitetura menos fragmentada.
Explore a documentação, configure seu primeiro gateway e publique um agente com conhecimento, ferramentas e governança em minutos.