Operace

Monitorování a pozorovatelnost

Přehled řídicího panelu

Monitorovací řídicí panel ActiveMotion poskytuje v reálném čase přehled o výkonu agentů ve čtyřech dimenzích: propustnost, latence, kvalita a náklady. Panel propustnosti zobrazuje objem požadavků, rychlost autonomního rozlišení a frekvenci eskalace v konfigurovatelných časových oknech. Panel latence zobrazuje percentily doby odezvy pro zpracování agentem, volání nástrojů a komplexní rozlišení. Panel kvality sleduje přesnost řetězce úvah, signály spokojenosti uživatelů a kategorizaci chyb. Panel nákladů sleduje spotřebu tokenů, objem volání nástrojů a využití infrastruktury. Všechny panely podporují filtrování podle instance agenta, typu pracovního postupu, časového rozsahu a kategorie výsledků.

Upozornění a reakce na incidenty

Výstrahy jsou definovány pomocí modulu pravidel založeného na prahu, který vyhodnocuje metriky oproti konfigurovatelným základním liniím. Pro běžné vzorce degradace jsou k dispozici standardní pravidla pro výstrahy: míra rozlišení klesne pod historickou základní linii o více než deset procent, průměrná latence překročí práh SLA, chybovost vyskočí nad jedno procento nebo spotřeba tokenů překročí plánovaný rozpočet. Upozornění směrují do konfigurovatelných kanálů včetně Slack, PagerDuty, e-mailu a koncových bodů webhooku. Každá výstraha obsahuje kontext o spouštěcí podmínce, instancích ovlivněných agentů a navrhovaných diagnostických krocích. Pro kritické výstrahy lze nakonfigurovat automatické zmírňující akce, jako je přerušení okruhu degradované integrace nebo směrování provozu do instance záložního agenta.

Protokolování na úrovni trasování

Každá interakce agenta vytváří distribuované trasování, které zachycuje kompletní cestu provedení od přijetí požadavku přes zdůvodnění, vyvolání nástroje, ověření a doručení odpovědi. Trasování zahrnuje strukturovaná metadata pro každý rozsah: typ operace, trvání, vstupní a výstupní souhrny a jakékoli chyby nebo opakování. Trasy lze prohlížet ve vestavěném průzkumníku trasování nebo exportovat do externích trasovacích platforem, jako je Jaeger, Zipkin nebo Datadog APM. Průzkumník trasování podporuje vyhledávání podle atributů požadavku, filtrování podle trvání nebo chybového stavu a porovnávání trasování mezi různými verzemi agentů za účelem ověření zlepšení výkonu.

Sledování a vykazování SLA

Definice SLA jsou konfigurovatelné podle typu pracovního postupu a určují cílové metriky pro dobu řešení, rychlost autonomního rozlišení, přesnost a dostupnost. Sledovací modul SLA nepřetržitě vyhodnocuje skutečný výkon v porovnání s cíli a udržuje běžná procenta shody. Týdenní a měsíční zprávy SLA jsou generovány automaticky a lze je distribuovat zainteresovaným stranám. Když je trend dodržování SLA klesající, spustí se včasné varování ještě před skutečným porušením cíle, což dává operačním týmům čas na prošetření a nápravu. Historická data SLA jsou uchovávána pro analýzu trendů a plánování kapacity, což organizacím pomáhá předvídat, kdy je potřeba další kapacita agentů nebo optimalizace pracovního postupu.