Descripción general del panel
El panel de monitoreo de ActiveMotion brinda visibilidad en tiempo real del desempeño de los agentes en cuatro dimensiones: rendimiento, latencia, calidad y costo. El panel de rendimiento muestra el volumen de solicitudes, la tasa de resolución autónoma y la frecuencia de escalamiento en ventanas de tiempo configurables. El panel de latencia muestra percentiles de tiempo de respuesta para el procesamiento de agentes, llamadas de herramientas y resolución de un extremo a otro. El panel de calidad rastrea la precisión de la cadena de razonamiento, las señales de satisfacción del usuario y la categorización de errores. El panel de costos monitorea el consumo de tokens, el volumen de llamadas de herramientas y la utilización de la infraestructura. Todos los paneles admiten el filtrado por instancia de agente, tipo de flujo de trabajo, rango de tiempo y categoría de resultado.
Alertas y respuesta a incidentes
Las alertas se definen mediante un motor de reglas basado en umbrales que evalúa las métricas frente a líneas de base configurables. Se proporcionan reglas de alerta estándar para patrones de degradación comunes: la tasa de resolución cae por debajo de la línea de base histórica en más del diez por ciento, la latencia promedio excede el umbral del SLA, la tasa de error aumenta por encima del uno por ciento o el consumo de tokens excede el presupuesto proyectado. Las alertas se dirigen a canales configurables, incluidos Slack, PagerDuty, correo electrónico y puntos finales de webhook. Cada alerta incluye contexto sobre la condición desencadenante, instancias del agente afectado y pasos de diagnóstico sugeridos. Para alertas críticas, se pueden configurar acciones de mitigación automatizadas, como interrumpir una integración degradada o enrutar el tráfico a una instancia de agente alternativo.
Registro a nivel de seguimiento
Cada interacción del agente produce un seguimiento distribuido que captura la ruta de ejecución completa desde la recepción de la solicitud hasta el razonamiento, la invocación de la herramienta, la verificación y la entrega de la respuesta. Los seguimientos incluyen metadatos estructurados para cada tramo: el tipo de operación, la duración, los resúmenes de entrada y salida, y cualquier error o reintento. Los seguimientos se pueden ver en el explorador de seguimiento integrado o exportarse a plataformas de seguimiento externas como Jaeger, Zipkin o Datadog APM. El explorador de seguimiento admite la búsqueda por atributos de solicitud, el filtrado por duración o estado de error y la comparación de seguimientos entre diferentes versiones del agente para validar las mejoras de rendimiento.
Seguimiento e informes de SLA
Las definiciones de SLA se pueden configurar por tipo de flujo de trabajo y especifican métricas objetivo para el tiempo de resolución, la tasa de resolución autónoma, la precisión y la disponibilidad. El motor de seguimiento de SLA evalúa continuamente el rendimiento real frente a los objetivos y mantiene los porcentajes de cumplimiento en funcionamiento. Los informes SLA semanales y mensuales se generan automáticamente y se pueden distribuir a las partes interesadas. Cuando el cumplimiento del SLA tiene una tendencia a la baja, se activan alertas tempranas antes de que se incumpla el objetivo, lo que da a los equipos de operaciones tiempo para investigar y remediar. Los datos históricos de SLA se conservan para el análisis de tendencias y la planificación de capacidad, lo que ayuda a las organizaciones a anticipar cuándo se necesita capacidad adicional de agentes u optimización del flujo de trabajo.