Praca z Claude Opus 4.8 — przewodnik krok po kroku · Zasób

To jest wersja do trzymania pod ręką przy przejściu z Opus 4.7 na 4.8. Otwierasz ją, gdy pierwszy raz odpalasz nowy model i chcesz od razu ustawić go dobrze, zamiast pracować na ustawieniach domyślnych. Każdy krok mówi, co robisz i co powinieneś zobaczyć; nazwy ustawień i poleceń są przepisane dosłownie.

Zasada przewodnia jednym zdaniem: najpierw dobierz poziom effort do zadania, potem pisz instrukcje pozytywnie i z uzasadnieniem — to dwie dźwignie, które robią największą różnicę.

Zanim zaczniesz — co zostaje bez zmian

Część rzeczy z 4.7 przenosi się na 4.8 bez żadnej akcji z twojej strony. Warto je znać, żeby nie szukać ustawień, których nie ma.

Okno kontekstu — 1 mln tokenów. Tyle tekstu model „widzi” naraz: instrukcje, pliki, wcześniejszą rozmowę. Mieści się w nim obszerny projekt.
Cena — wejście i wyjście (za tekst, który podajesz, i za tekst, który model zwraca) kosztuje tyle samo co w 4.7.
Limity sesji — pięciogodzinne okno i tygodniowe limity zostają bez zmian.
Limity zapytań w Claude Code przez API — podniesione, żeby pomieścić wyższe zużycie tokenów przy mocniejszych poziomach effort. Dotyczy to limitów technicznych dla użytkowników API.

Uczciwa uwaga na start: nie każdy problem z 4.7 był problemem modelu. Zanim uznasz, że winę ponosi narzędzie, sprawdź, czy nie chodzi o sposób, w jaki go używasz — często chodzi.

Krok 1: Ustaw poziom effort

To dziś najważniejsza dźwignia. Poziom effort to ustawienie, ile „wysiłku” model wkłada w zadanie.

W Claude Code wpisz:

effort

Pojawi się suwak. Domyślnie ustawiony jest na high. Dostępne poziomy:

low, medium, high, x-high, max, ultracode

ultracode to x-high połączony z funkcją workflows.

Jak czytać tę skalę:

Im wyżej — model „mądrzejszy”, ale droższy w tokenach.
Im niżej — szybsze odpowiedzi.

To balans między inteligencją modelu, kosztem tokenów i szybkością. Dobierz poziom do zadania:

Zadanie wymaga sporo pracy, a model stoi na low albo medium → to po prostu za mało wysiłku, podnieś poziom.
Zadanie jest banalne, a model stoi na x-high → potrafi przesadzić, rozważać i komplikować coś prostego, zejdź niżej.

Co powinieneś zobaczyć: po wpisaniu effort suwak z bieżącym poziomem. Jeśli należysz do osób, które otwierają Claude Code i nigdy nie dotykają tego ustawienia — zacznij. Różnica między low a x-high bywa na tyle duża, że potrafi sprawiać wrażenie zupełnie innej wersji modelu.

Krok 2: Pisz, co model ma zrobić — nie czego ma nie robić

W dobrych przykładach z dokumentacji rzuca się w oczy jedno: rzadko mówią modelowi, czego nie robić. Niemal zawsze wprost opisują, co zrobić. Model lepiej radzi sobie z pozytywną instrukcją niż z listą zakazów.

To prosta zmiana nawyku:

Zamiast budować długą listę „nie rób tego, nie rób tamtego”
Napisz wynik, na którym ci zależy

Co powinieneś zobaczyć: model celniej trafia w intencję, zamiast lawirować między zakazami.

Krok 3: Dodaj „dlaczego” za instrukcją

To rozwinięcie kroku 2. Model działa tak, jakby był ciekawy kontekstu — jeśli każesz mu czegoś unikać, niejako pyta „ale dlaczego?”. Im więcej kontekstu dostarczysz, tym lepiej trzyma się instrukcji.

Porównaj dwie wersje tego samego polecenia:

nie używaj myślników

Chcę, żeby tekst brzmiał, jakbym pisał go osobiście; to mój styl
i nigdy nie stosuję myślników, więc trzymaj się tego stylu.

To samo polecenie, ale drugie ma uzasadnienie — i model wyraźnie chętniej je respektuje.

Co powinieneś zobaczyć: mniej negatywnych poleceń, więcej kontekstu „dlaczego” → lepsze trzymanie się twoich zasad.

Krok 4: Sprawdź, kiedy model rozumuje, a kiedy sięga po narzędzia

Opus 4.8 domyślnie najpierw rozumuje, dopiero potem sięga po narzędzia. Zanim na przykład uruchomi pomocniczego agenta albo zajrzy do bazy danych, próbuje samodzielnie ustalić, jakie pytania zadać i jak podejść do problemu, korzystając z tego, co już ma.

To bywa bardzo dobre — czasem właśnie chcesz, żeby model najpierw przemyślał sprawę. Ale czasem zależy ci na czymś przeciwnym: żeby najpierw dociągnął dodatkowy kontekst, a dopiero potem zaczął rozumować.

Dlatego przy przenoszeniu przepływów z 4.7 na 4.8:

Nie przełączaj modelu „w ciemno” z założeniem, że wszystko zadziała tak samo.
Poobserwuj go chwilę i wyczuj, jak się zachowuje na twoich zadaniach.

Co powinieneś zobaczyć: model, który zatrzymuje się i rozumuje, zanim cokolwiek uruchomi. Jeśli potrzebujesz, żeby najpierw dociągnął kontekst, każ mu to zrobić wprost w instrukcji.

Krok 5: Zostaw modelowi dobór długości odpowiedzi

Opus 4.8 sam dobiera długość i szczegółowość odpowiedzi do złożoności zadania — zamiast trzymać się jednego, sztywnego poziomu rozwlekłości.

W praktyce:

Proste sprawdzenie faktu → krótsza odpowiedź.
Otwarta analiza wymagająca więcej rozumowania → dłuższa odpowiedź.

Co powinieneś zobaczyć: odpowiedzi skalujące się z trudnością pytania, bez ręcznego ustawiania długości.

Jak sprawdzić, że działa

Nie zaczynaj od benchmarków, tylko od własnych bolączek z 4.7. Benchmarki nowego modelu zawsze wyglądają znakomicie — taka jest natura komunikatów marketingowych — ale cudzy przypadek użycia to nie twój.

Przejdź przez listę:

Wskaż swoje bolączki z 4.7. Gdzie wciąż powtarzasz modelowi to samo polecenie, jak często musisz go poprawiać, jak szybko zbliżasz się do limitu sesji.
Sprawdź poziom effort. Wpisz effort i upewnij się, że suwak stoi tam, gdzie pasuje do zadania — nie na ustawieniu domyślnym przez przeoczenie.
Zmierz rzeczy konkretne: czy współpraca jest przyjemniejsza, czy rzadziej się poprawiasz, jak wygląda zużycie tokenów.
Skonfrontuj z deklaracją. Według dokumentacji nowy model jest pod względem zużycia tokenów oszczędniejszy — ale to dopiero do potwierdzenia w twojej praktyce.

Jedna rzecz, którą Anthropic wprost adresuje, to szczerość modelu. Znajomy problem z 4.7: model deklarował „skończone, wysłałem 50 plików”, choć wysłał 15, albo zapowiadał cztery godziny pracy, a robił to w dwadzieścia minut. Opus 4.8 ma rzadziej tak zmyślać — jeśli to obserwujesz, zmiana działa.

Lepszy model nie znaczy automatycznie lepszy dla tego konkretnego problemu, który masz przed sobą. Dobierając model, strategię kontekstu i poziom effort, celuj wprost w ograniczenia, które masz teraz. To one, a nie tabela benchmarków, powiedzą ci, czy zmiana była warta zachodu.