Narzędzia AI Zasób

Limit sesji w Claude — ściąga

Komendy i nawyki, które odciążają limit sesji w Claude, zebrane na jednym ekranie. Otwierasz w trakcie pracy, gdy chcesz sprawdzić, co zrobić po ostatniej odpowiedzi modelu.

To jest wersja do trzymania pod ręką. Otwierasz ją w trakcie pracy z Claude, gdy chcesz szybko sprawdzić, jaka komenda odciąży limit sesji albo co zrobić po ostatniej odpowiedzi. Nic ponad to, co opisuje artykuł źródłowy — same komendy, progi i nawyki, bez nowych liczb.

Zasada przewodnia jednym zdaniem: limit sesji wyczerpuje głównie powtórne czytanie rozmowy, więc tnij historię, a nie tylko pojedyncze wiadomości.

Pojęcia w skrócie

PojęcieCo znaczy
Tokennajmniejszy fragment tekstu, który model czyta i za który nalicza opłatę (z grubsza kawałek słowa)
Sesjapojedyncza, ciągła rozmowa z modelem
Limit sesjipułap zużycia, po którym czekasz na reset, zanim popracujesz dalej
Modelsam silnik AI, który odpowiada (np. Claude w różnych wersjach)
Okno kontekstuilość tekstu, jaką model „widzi” naraz: instrukcje systemowe, cała rozmowa, wywołania narzędzi i ich wyniki, przeczytane pliki — bieżąca pamięć robocza
Claude Codenarzędzie, w którym Claude pracuje przy zadaniach programistycznych i operacyjnych; okno kontekstu rzędu miliona tokenów

Skąd biorą się koszty

  • Model przy każdej wiadomości czyta rozmowę od początku. Pytanie pierwsze, odpowiedź, pytanie drugie, odpowiedź — i tak za każdym razem aż do ostatniego polecenia. Dlatego koszt nie dodaje się, lecz narasta lawinowo.
  • Powtórne czytanie historii pochłania większość budżetu. W prześledzonej rozmowie liczącej ponad sto wiadomości 98,5% wszystkich tokenów poszło wyłącznie na ponowne czytanie wcześniejszej historii.
  • Część okna jest zajęta, zanim cokolwiek wpiszesz. Plik z instrukcjami projektu, podłączone narzędzia i umiejętności ładują się na starcie. Typowy narzut to około 8 tysięcy tokenów, ale potrafi sięgnąć 62 tysięcy na świeżej sesji.
  • Gnijący kontekst (context rot). Im dłuższa sesja, tym gorsza jakość — uwaga modelu rozkłada się na coraz więcej tokenów, model gubi wątek i edytuje pliki bez ich przeczytania. Trafność wyszukiwania w oknie spada z 92% przy 256 tysiącach tokenów do 78% przy milionie.

Pięć opcji po każdej odpowiedzi

To, co możesz zrobić, gdy model skończy odpowiadać.

OpcjaCo robiJak wywołać
Kontynuujpiszesz kolejną wiadomość; historia rośnie dalejpo prostu nowa wiadomość
Cofnijwracasz do wcześniejszej wiadomości i kasujesz wszystko po niej/rewind
Wyczyśćzaczynasz całkiem od nowa/clear
Skompaktujstreszczasz sesję i zastępujesz historię tym streszczeniem/compact
Oddelegujzlecasz zadanie podagentowi: świeże okno kontekstu, wraca sam wynik„uruchom podagenta, żeby to zweryfikował”

Najważniejszy nawyk to /rewind. Gdy model zrobi coś źle, większość z nas pisze „to nie zadziałało, spróbuj inaczej” — ale nieudana próba i błędny kod zostają w kontekście i są odczytywane przy każdej kolejnej wiadomości. /rewind cofa do punktu sprzed błędu i zostawia czysty kontekst.

Czyszczenie, kompaktowanie i podsumowania

- Nowe zadanie → /clear. Zaczynasz coś innego, zaczynasz od zera. - To samo zadanie → /compact. Kompaktowanie to zwijanie dotychczasowej rozmowy w streszczenie. - Uwaga na auto-kompaktowanie. Claude Code uruchamia je samo dopiero przy około 95% zapełnienia okna — za późno. Zostaje wtedy raptem 20–30% pierwotnych szczegółów, a streszczenie powstaje u szczytu gnijącego kontekstu. - Wariant ręczny (zwykle najmocniej odciąża limit). Zanim dojdziesz do granicy: 1. poproś model o pełne podsumowanie — co zrobione i co dalej; 2. zrób /clear; 3. wklej streszczenie z powrotem i pracuj na świeżej sesji. - Warunek wariantu ręcznego: skoro tracisz historię rozmowy, zapisuj ustalenia gdzie indziej — w plikach z planem, dziennikach decyzji, listach zadań.

Podagenci

  • Czym jest podagent. Osobny pomocnik z własnym, świeżym oknem kontekstu: wykonuje zadanie i odsyła do głównej sesji sam wynik. Żmudna robota dzieje się poza twoim oknem, więc nie zaśmieca głównej rozmowy.
  • Jak zlecić. Wprost: „uruchom podagenta, żeby to zweryfikował”.
  • Tańszy model. Podagent może korzystać z tańszego modelu, co dodatkowo obniża koszt przy zbliżonej jakości.
  • Czego się nauczyć. Wyczuwać, które zadania nadają się do oddelegowania.

Mniej tokenów u źródła

Chwyty, które zmniejszają zużycie, zanim zacznie się rozmowa.

ChwytCo daje
Zamieniaj pliki na markdownkonwersja z HTML obcina około 90% tokenów, z PDF mniej więcej 65–70%, z docx około 33%. Wyjątek: skany wymagające rozpoznawania tekstu z obrazu — tam reguła nie działa
Pilnuj pliku z instrukcjamiclaude.md ładuje się przy każdej sesji; trzymaj go poniżej około 200 wierszy (mniej więcej 2 tysiące tokenów), resztę przenieś do umiejętności i plików doczytywanych na żądanie
Zacznij od planuplan przed budowaniem zużywa tokeny z góry, ale oszczędza je później — model rzadziej brnie w ślepą uliczkę
Obserwuj wskaźnik limitupodgląd, ile sesji zostało, zmienia decyzje: wysłać polecenie teraz czy uruchomić zespół agentów

Sprawdzenie startu sesji: w Claude Code polecenie /context pokazuje, ile okna masz zajęte, zanim w ogóle zaczniesz pisać.

Dlaczego nie warto zapełniać całego okna

  • Większe okno to nie lepszy wynik, tylko więcej miejsca na gnijący kontekst. Reguły działania modeli się nie zmieniają.
  • Liczby z analizy 18 tysięcy bloków myślenia z 7 tysięcy sesji: głębia rozumowania spadała o 67% wraz z długością sesji, a edycja plików bez ich przeczytania rosła z 6% do 34%.
  • Skrajny przypadek: jeden użytkownik wskutek złych nawyków podniósł rachunek za tokeny z 345 dolarów do 42 tysięcy dolarów miesięcznie, a jakość pracy została płaska.
  • Produktywne są pierwsze kilkanaście–dwadzieścia procent sesji, gdy model jest najświeższy.
  • Gdy sesja zeszła na manowce — nie walcz z nią. Otwórz nową i zacznij od czysta.

Od czego zacząć

  1. Wyrób odruch /rewind zamiast „spróbuj inaczej” — to nawyk, który artykuł zaleca najmocniej.
  2. Dziel pracę komendami: nowe zadanie → /clear, to samo zadanie → /compact.
  3. Stosuj wariant ręczny przed granicą: podsumowanie → /clear → wklejone streszczenie, a ustalenia zapisuj w plikach.
  4. Oddawaj żmudną robotę podagentom, najlepiej na tańszym modelu.
  5. Jeśli dopiero zaczynasz, zostań przy mniejszym, dwustutysięcznym oknie i wyrób dyscyplinę: czyść sesję, zapisuj postępy, deleguj.