Słownik AI
Obserwowalność AI (AI observability)
AI observability, monitorowanie systemów AI, obserwowalność LLM, observability
Obserwowalność AI to ciągłe monitorowanie działania systemu AI na produkcji: kosztów, jakości odpowiedzi, błędów i opóźnień. Pozwala wykrywać degradację modelu i reagować, zanim odbije się ona na użytkownikach.
- Obserwowalność AI to monitorowanie systemu AI w produkcji: kosztów, jakości odpowiedzi, błędów i opóźnień (latencji).
- Różni się od ewaluacji: ewaluacja sprawdza model przed wdrożeniem na zestawach testowych, obserwowalność śledzi go w trakcie realnego działania.
- Pozwala wykryć wzrost halucynacji, skok kosztów inferencji czy spadek jakości i powiązać je z konkretną zmianą w systemie.
Obserwowalność AI to praktyka ciągłego śledzenia tego, jak system oparty na sztucznej inteligencji zachowuje się już po wdrożeniu, w realnym ruchu. Obejmuje rejestrowanie zapytań i odpowiedzi, pomiar kosztów oraz zużycia tokenów, czas reakcji (latencję), liczbę błędów i wskaźniki jakości generowanych treści. Celem jest uzyskanie pełnego wglądu w działanie systemu, tak by dało się szybko zauważyć, że coś przestało działać jak należy, i dojść do przyczyny.
Warto odróżnić ją od ewaluacji modeli. Ewaluacja to ocena na przygotowanych zestawach testowych, najczęściej przed wdrożeniem lub przy zmianie wersji, i odpowiada na pytanie „czy model jest wystarczająco dobry”. Obserwowalność działa później i ciągle — patrzy na to, co dzieje się podczas faktycznej inferencji na żywych danych, których nie da się w pełni przewidzieć na etapie testów. Oba podejścia się uzupełniają: dobre metryki ewaluacyjne stają się punktem odniesienia, względem którego obserwowalność wychwytuje późniejszą degradację.
W praktyce obserwowalność pozwala wcześnie wykryć wzrost liczby halucynacji, nagły skok kosztów po zmianie promptu czy spadek jakości po aktualizacji modelu, a następnie powiązać taki sygnał z konkretną zmianą w systemie. Dla organizacji jest to fundament governance AI: bez wiarygodnych danych o realnym działaniu modelu nie da się rzetelnie zarządzać ryzykiem ani rozliczać dostawców z jakości usługi.
Powiązane pojęcia