Serviços › Observabilidade

Visibilidade total sobre o que, quanto e como o seu modelo consome.

Acompanhe custos, chamadas e conversas em tempo real. A AIVAX registra cada inferência com modelo, SKU, tokens e recurso utilizado — para que você tenha controle financeiro e operacional completo sobre a sua plataforma de IA.

Custos discriminados

Cada real gasto, justificado por modelo e recurso.

Veja exatamente quanto cada modelo custa por período. A dashboard discrimina uso por modelo, SKU e recurso — gateways, RAG e chat clients separados, com detalhes de tokens de entrada, saída e cache.

  • Filtragem por mês e janela de tempo customizada
  • Discriminação por modelo, SKU e recurso utilizado
  • Visão de créditos, saldo e plano contratado
  • Gráfico de série temporal com múltiplos modelos

Histórico de uso

Cada chamada de API, com contexto completo.

Filtre por data, modelo ou recurso e veja o detalhamento exato de tokens consumidos, SKU cobrado e custo por requisição. Ideal para auditoria, chargebacks internos e controle de budget.

Monitoramento de conversas

Histórico completo de cada troca com o modelo.

Visualize conversas, mensagens, tokens consumidos e respostas do modelo por chamada. O monitoramento é opt-in — você escolhe ativar por gateway, respeitando a privacidade dos dados de cada cliente.

Recurso opt-in — ativado por gateway. Nenhuma conversa é armazenada sem consentimento explícito.

Qualidade e performance

Além do custo: latência, erros e eficiência.

A observabilidade vai além de quanto você gasta. Acompanhe a qualidade de cada modelo, identifique gargalos e optimize o uso antes que problemas cheguem aos seus usuários.

Latência p95

Acompanhe o percentil 95 de tempo de resposta por modelo e identifique quais gateways apresentam degradação de performance.

Taxa de erro

Monitore falhas de inferência, timeouts e respostas inválidas agrupadas por recurso, modelo e janela de tempo.

Custo por conversa

Calcule o custo médio por sessão de chat e por chamada de gateway, com drill-down até o nível de requisição individual.

Tokens por chamada

Identifique chamadas com contexto excessivo, optimize prompts de sistema e reduza custos sem perder qualidade de resposta.

Cache hit rate

Acompanhe quantas inferências aproveitam cache de tokens e quanto isso representa de economia acumulada por período.

Faturas consolidadas

Exporte relatórios de uso por período para faturamento interno, reports para stakeholders ou auditoria financeira.

Comece agora

Cada token tem uma história. Está na hora de lê-la.

A dashboard de observabilidade está disponível para todos os planos AIVAX, sem configuração adicional.