Prezentare generală a tabloului de bord
Tabloul de bord de monitorizare ActiveMotion oferă vizibilitate în timp real asupra performanței agenților în patru dimensiuni: debit, latență, calitate și cost. Panoul de transfer afișează volumul solicitărilor, rata de rezoluție autonomă și frecvența de escaladare pe ferestre de timp configurabile. Panoul de latență afișează percentilele timpului de răspuns pentru procesarea agentului, apelurile de instrumente și rezoluția de la capăt la capăt. Panoul de calitate urmărește acuratețea lanțului de raționament, semnalele de satisfacție a utilizatorilor și clasificarea erorilor. Panoul de costuri monitorizează consumul de token, volumul apelurilor de instrumente și utilizarea infrastructurii. Toate panourile acceptă filtrarea după instanță de agent, tip de flux de lucru, interval de timp și categorie de rezultat.
Alertă și răspuns la incident
Alertele sunt definite folosind un motor de reguli bazat pe prag care evaluează valorile în raport cu liniile de bază configurabile. Sunt furnizate reguli standard de alertă pentru modelele comune de degradare: rata de rezoluție scade sub valoarea de referință istorică cu peste zece procente, latența medie depășește pragul SLA, rata de eroare crește peste un procent sau consumul de token depășește bugetul proiectat. Alertele direcționează către canale configurabile, inclusiv punctele finale Slack, PagerDuty, e-mail și webhook. Fiecare alertă include context despre condiția de declanșare, instanțele agentului afectat și pașii de diagnosticare sugerați. Pentru alertele critice, acțiunile automate de atenuare pot fi configurate, cum ar fi întreruperea circuitului unei integrări degradate sau direcționarea traficului către o instanță de agent de rezervă.
Înregistrare la nivel de urmărire
Fiecare interacțiune cu agent produce o urmărire distribuită care surprinde calea completă de execuție de la primirea cererii până la raționament, invocarea instrumentului, verificare și livrarea răspunsului. Urmările includ metadate structurate pentru fiecare interval: tipul operațiunii, durata, rezumatele de intrare și ieșire și orice erori sau reîncercări. Urmele pot fi vizualizate în exploratorul de urmărire încorporat sau exportate pe platforme externe de urmărire, cum ar fi Jaeger, Zipkin sau Datadog APM. Exploratorul de urmărire acceptă căutarea după atributele cererii, filtrarea după durată sau starea erorii și compararea urmelor din diferite versiuni de agent pentru a valida îmbunătățirile de performanță.
Urmărire și raportare SLA
Definițiile SLA sunt configurabile pentru fiecare tip de flux de lucru și specifică valorile țintă pentru timpul de rezoluție, rata de rezoluție autonomă, acuratețea și disponibilitatea. Motorul de urmărire a SLA evaluează continuu performanța reală față de obiective și menține procentele de conformitate în funcționare. Rapoartele SLA săptămânale și lunare sunt generate automat și pot fi distribuite părților interesate. Când respectarea SLA este în scădere, alertele de avertizare timpurie se declanșează înainte ca ținta să fie efectiv încălcată, oferind echipelor de operațiuni timp să investigheze și să remedieze. Datele istorice SLA sunt păstrate pentru analiza tendințelor și planificarea capacității, ajutând organizațiile să anticipeze când este necesară o capacitate suplimentară a agenților sau optimizarea fluxului de lucru.