Serviços › Observabilidade
Visibilidade total sobre o que, quanto e como o seu modelo consome.
Acompanhe custos, chamadas e conversas em tempo real. A AIVAX registra cada inferência com modelo, SKU, tokens e recurso utilizado — para que você tenha controle financeiro e operacional completo sobre a sua plataforma de IA.
Custos discriminados
Cada real gasto, justificado por modelo e recurso.
Veja exatamente quanto cada modelo custa por período. A dashboard discrimina uso por modelo, SKU e recurso — gateways, RAG e chat clients separados, com detalhes de tokens de entrada, saída e cache.
- Filtragem por mês e janela de tempo customizada
- Discriminação por modelo, SKU e recurso utilizado
- Visão de créditos, saldo e plano contratado
- Gráfico de série temporal com múltiplos modelos
Histórico de uso
Cada chamada de API, com contexto completo.
Filtre por data, modelo ou recurso e veja o detalhamento exato de tokens consumidos, SKU cobrado e custo por requisição. Ideal para auditoria, chargebacks internos e controle de budget.
Monitoramento de conversas
Histórico completo de cada troca com o modelo.
Visualize conversas, mensagens, tokens consumidos e respostas do modelo por chamada. O monitoramento é opt-in — você escolhe ativar por gateway, respeitando a privacidade dos dados de cada cliente.
Qualidade e performance
Além do custo: latência, erros e eficiência.
A observabilidade vai além de quanto você gasta. Acompanhe a qualidade de cada modelo, identifique gargalos e optimize o uso antes que problemas cheguem aos seus usuários.
Latência p95
Acompanhe o percentil 95 de tempo de resposta por modelo e identifique quais gateways apresentam degradação de performance.
Taxa de erro
Monitore falhas de inferência, timeouts e respostas inválidas agrupadas por recurso, modelo e janela de tempo.
Custo por conversa
Calcule o custo médio por sessão de chat e por chamada de gateway, com drill-down até o nível de requisição individual.
Tokens por chamada
Identifique chamadas com contexto excessivo, optimize prompts de sistema e reduza custos sem perder qualidade de resposta.
Cache hit rate
Acompanhe quantas inferências aproveitam cache de tokens e quanto isso representa de economia acumulada por período.
Faturas consolidadas
Exporte relatórios de uso por período para faturamento interno, reports para stakeholders ou auditoria financeira.
Comece agora
Cada token tem uma história. Está na hora de lê-la.
A dashboard de observabilidade está disponível para todos os planos AIVAX, sem configuração adicional.