Kiedy agent jest właściwym wzorcem, a kiedy to droższy skrypt — checklist operatora

Najszybciej rosnącą pozycją w budżetach na AI jest dziś słowo „agent". Workflow, który rok temu nazywano automatyzacją, dostaje nową etykietę, a wraz z nią wyższy rachunek za tokeny i cieńszą ścieżkę audytu. Nasza teza jest prosta: większość rzeczy sprzedawanych jako „agentowe" to deterministyczne potoki w droższym, trudniejszym do skontrolowania przebraniu. Pytanie „kiedy wdrażać agenta AI" coraz częściej ma złą domyślną odpowiedź — „zawsze" — i to operator musi ją wyprostować.

Ten tekst nie tłumaczy, czym jest agent. Jest listą kontrolną dla osoby, która ma zatwierdzić budżet i podpisać się pod ryzykiem — czterema warunkami, które agent musi spełnić naraz, żeby jego niedeterminizm był wart ceny, oraz sygnałami, że lepiej zostać przy skrypcie.

Granica jest architektoniczna, nie marketingowa

Najczystsza definicja, jaką znamy, pochodzi z inżynierskiego materiału Anthropic „Building effective agents": workflow to system, w którym model i narzędzia są orkiestrowane przez z góry ustalone ścieżki w kodzie; agent to system, w którym to model w czasie działania sam decyduje o swoim procesie i o tym, których narzędzi użyje. Cała reszta różnic — koszt, przewidywalność, audytowalność — wynika z tego jednego rozstrzygnięcia: kto trzyma w ręku przebieg sterowania. Przy skrypcie trzymasz go Ty. Przy agencie oddajesz go modelowi.

Jest na to praktyczny test, który zawdzięczamy praktykom z tej dziedziny: czy potrafisz narysować schemat blokowy zadania, zanim model ruszy? Jeśli tak — masz workflow i agent niczego nie dokłada poza rachunkiem. Jeśli schemat zależy od tego, co model odkryje dopiero w trakcie — wtedy zaczyna się rozmowa o agencie.

Cztery warunki, które agent musi spełnić naraz

Agent zarabia na swój niedeterminizm tylko wtedy, gdy wszystkie cztery są prawdziwe jednocześnie. Brak choćby jednego to sygnał, że budujesz droższy skrypt.

1. Otwarta przestrzeń zadania. Liczby i kolejności kroków nie da się ustalić z góry, bo zależą od tego, co system napotka po drodze. Klasyfikacja maila po sztywnych regułach albo generowanie oferty z szablonu to nie jest otwarta przestrzeń — to potok z gałęziami. Debugowanie, w którym trzeba zebrać kontekst, postawić hipotezę i ją sprawdzić, już tak.

2. Realna orkiestracja narzędzi. Wartość bierze się z tego, że model w locie wybiera, łączy i ponawia wywołania narzędzi w kolejności, której nie znałeś wcześniej. Jeśli zawsze wołasz te same trzy API w tej samej kolejności, nie potrzebujesz modelu, który „decyduje" — potrzebujesz funkcji.

3. Człowiek w pętli, który naprawdę decyduje. Niedeterminizm ma sens, gdy jest punkt, w którym człowiek wnosi osąd niemożliwy do zakodowania regułą — akceptuje, koryguje, odrzuca z kontekstem. Jeśli „człowiek w pętli" sprowadza się do klikania „OK", to nie jest nadzór, tylko teatr, a agent dał Ci wyłącznie wyższy koszt.

4. Akceptowalny koszt błędu. To warunek, który najczęściej wywraca projekt. Błędy agenta się kumulują: przy dziesięciu krokach, z których każdy jest poprawny w 99 procentach, cały przebieg kończy się sukcesem w mniej niż dziewięciu przypadkach na dziesięć. Tam, gdzie pomyłka kosztuje minutę pracy, taki rozkład jest do zniesienia. Tam, gdzie kosztuje klienta, transakcję albo zgodność — nie jest, i to jest moment, w którym wracasz do deterministycznych granic. Ta sama logika kosztu błędu leży u podstaw ramy zarządzania ryzykiem AI NIST: im droższa pomyłka, tym mniej miejsca na niekontrolowaną swobodę.

Kiedy powiedzieć „nie" — i co zrobić zamiast

Reguła, którą powtarzają i dostawcy modeli, i praktycy budujący te systemy, brzmi: zacznij od najprostszego rozwiązania i dokładaj złożoność dopiero, gdy zadanie realnie jej wymaga. W praktyce sprowadza się to do trzech najczęstszych „nie":

„Agent" do procesu, który da się narysować. Jeśli przebieg jest stały, zbuduj workflow. Dostaniesz przewidywalny koszt tokenów, testowalność każdej ścieżki i log, który zniesie audyt — wszystko to, czego agent z definicji nie daje za darmo.
Agent dlatego, że „tak się teraz robi". Niedeterminizm to nie cecha premium, tylko kompromis: płacisz latencją, kosztem i trudniejszym debugowaniem za elastyczność, której być może nie potrzebujesz.
Agent bez granic i bez właściciela. Jeśli nie umiesz wskazać, co wolno mu zrobić samodzielnie, co tylko zaproponować, a czego nie ruszać — nie jesteś gotowy go uruchomić, niezależnie od tego, jak dobrze wypada na demie.

Najtrwalsze systemy, jakie widujemy w produkcji, są hybrydami: deterministyczny szkielet, który trzyma koszt i audyt, z wyspami agentowej swobody dokładnie tam, gdzie cztery warunki powyżej są spełnione — i nigdzie indziej.

Dlaczego to ma znaczenie

Private Equity

Dla funduszu „agentowość" w tezie inwestycyjnej spółki to pytanie o koszt i ryzyko, nie o nowoczesność. Jeśli marża ma rosnąć dzięki agentom, warto zapytać, które procesy naprawdę wymagają niedeterminizmu, a które przepłacają za skrypt w przebraniu — bo to różnica w rachunku za inferencję i w audytowalności, którą widać dopiero po transakcji. To ten sam rejestr ryzyka, który opisywaliśmy przy rządzonych agentach w przedsiębiorstwie, tylko czytany od strony „czy ten wzorzec w ogóle był potrzebny".

Enterprise

Dla dużej organizacji największym kosztem nie jest sam agent, lecz agent postawiony tam, gdzie wystarczał workflow — bo dokłada nieprzewidywalność do systemu, który i tak musi przejść przegląd ryzyka. Zanim zespół zacznie budować, warto przepuścić projekt przez cztery warunki i zapisać decyzję: dlaczego tu agent, a nie potok. Ten jeden akapit uzasadnienia jest tańszy niż pół roku utrzymywania niedeterminizmu, którego nikt nie potrzebował.

MŚP / średni rynek

Dla firmy średniej wielkości dobra wiadomość brzmi: większość najszybciej zwracających się automatyzacji to workflow, nie agent — i właśnie dlatego są tanie, przewidywalne i da się je uruchomić bez działu AI. Nie kupuj „agenta", bo tak nazywa to oferta dostawcy. Kup rozwiązanie problemu i pozwól, żeby to charakter zadania, a nie etykieta, rozstrzygnął, czy potrzebny jest niedeterminizm.

Jeden krok, który możesz zrobić w tym tygodniu

Weź jeden proces, który ktoś u Ciebie chce „zaagentyzować", i spróbuj narysować jego schemat blokowy na jednej kartce, zanim cokolwiek uruchomisz. Jeśli się udało — masz workflow i właśnie zaoszczędziłeś sobie rachunku za niedeterminizm. Jeśli schemat rozjeżdża się przy pierwszym „to zależy, co system znajdzie" — przejdź przez cztery warunki i sprawdź, czy spełnione są wszystkie, nie tylko ten, który brzmi najciekawiej.

Opisz swój przypadek

Jeśli masz proces, o którym ktoś mówi „zróbmy z tego agenta", a Ty nie jesteś pewny, czy to właściwy wzorzec, przynieś ten jeden proces i jego schemat. Zaczynamy od konkretu: rozstrzygamy, gdzie agent zarabia na swój koszt, a gdzie wystarczy skrypt — i jak to spiąć w usługach. Opisz swój przypadek: mailto:[email protected]?subject=Rozmowa%20z%20Aurora%20AI.