Visão geral do painel
O painel de monitoramento do ActiveMotion fornece visibilidade em tempo real do desempenho do agente em quatro dimensões: rendimento, latência, qualidade e custo. O painel de rendimento mostra o volume de solicitações, a taxa de resolução autônoma e a frequência de escalonamento em janelas de tempo configuráveis. O painel de latência exibe percentis de tempo de resposta para processamento de agentes, chamadas de ferramentas e resolução ponta a ponta. O painel de qualidade rastreia a precisão da cadeia de raciocínio, os sinais de satisfação do usuário e a categorização de erros. O painel de custos monitora o consumo de tokens, o volume de chamadas de ferramentas e a utilização da infraestrutura. Todos os painéis suportam filtragem por instância de agente, tipo de fluxo de trabalho, intervalo de tempo e categoria de resultado.
Alerta e resposta a incidentes
Os alertas são definidos usando um mecanismo de regras baseado em limites que avalia métricas em relação a linhas de base configuráveis. Regras de alerta padrão são fornecidas para padrões de degradação comuns: a taxa de resolução cai abaixo da linha de base histórica em mais de dez por cento, a latência média excede o limite do SLA, a taxa de erro aumenta acima de um por cento ou o consumo de token excede o orçamento projetado. Os alertas são direcionados para canais configuráveis, incluindo Slack, PagerDuty, email e endpoints de webhook. Cada alerta inclui contexto sobre a condição de acionamento, instâncias de agente afetadas e etapas de diagnóstico sugeridas. Para alertas críticos, ações automatizadas de mitigação podem ser configuradas, como interromper uma integração degradada ou rotear o tráfego para uma instância de agente substituto.
Registro em nível de rastreamento
Cada interação do agente produz um rastreamento distribuído que captura o caminho completo de execução, desde o recebimento da solicitação até o raciocínio, invocação de ferramenta, verificação e entrega de resposta. Os rastreamentos incluem metadados estruturados para cada período: tipo de operação, duração, resumos de entrada e saída e quaisquer erros ou novas tentativas. Os rastreamentos podem ser visualizados no explorador de rastreamento integrado ou exportados para plataformas de rastreamento externas, como Jaeger, Zipkin ou Datadog APM. O explorador de rastreamento oferece suporte à pesquisa por atributos de solicitação, filtragem por duração ou status de erro e comparação de rastreamentos em diferentes versões de agente para validar melhorias de desempenho.
Acompanhamento e relatórios de SLA
As definições de SLA são configuráveis por tipo de fluxo de trabalho e especificam métricas alvo para tempo de resolução, taxa de resolução autônoma, precisão e disponibilidade. O mecanismo de rastreamento de SLA avalia continuamente o desempenho real em relação às metas e mantém as porcentagens de conformidade em execução. Os relatórios de SLA semanais e mensais são gerados automaticamente e podem ser distribuídos às partes interessadas. Quando a conformidade do SLA tende a diminuir, alertas antecipados são acionados antes que o alvo seja realmente violado, dando às equipes de operações tempo para investigar e remediar. Os dados históricos do SLA são retidos para análise de tendências e planejamento de capacidade, ajudando as organizações a antecipar quando será necessária capacidade adicional do agente ou otimização do fluxo de trabalho.