Retour au glossaire
IA & LLM

Okno kontekstu

Maksymalna liczba tokenów, którą LLM może przetworzyć na wejściu — typowo 128K do 1M w 2026 r. Decyduje o wielkości dokumentów analizowanych w jednym wywołaniu.

Okno kontekstu to pamięć robocza LLM: maksymalna liczba tokenów (≈ ¾ słowa), które model może odczytać jednorazowo — instrukcje systemowe, historia rozmowy, wstrzyknięte dokumenty i wygenerowana odpowiedź razem. W 2026 r. rzędy wielkości to: Claude 200K do 1M tokenów, GPT-4 turbo 128K, Gemini 1M–2M, modele open-source 8K do 128K zależnie od wersji. 200K tokenów to około 150 000 słów, czyli cała książka.

Co to konkretnie zmienia: można wstrzyknąć 50-stronicową umowę, kompletny dossier prawne, kod źródłowy niewielkiej aplikacji lub kilka godzin transkrypcji audio do jednego promptu. Nie zastępuje to jednak RAG — przy 1M tokenów koszt eksploduje (kilka euro za zapytanie), latencja też (10–30 s), a jakość uwagi degraduje się powyżej pewnego progu. Zasada: dla stabilnych, powtarzalnych korpusów indeksujemy przez embeddings; do dogłębnej analizy pojedynczego dokumentu wykorzystujemy bezpośrednio duże okno kontekstu.

Strategie zarządzania kontekstem w produkcji: kompresja (streszczanie starej historii konwersacji), priorytetyzacja (najistotniejsze chunki na początku promptu, uwaga spada w środku), prompt caching (Anthropic, OpenAI) — by nie naliczać ponownie stabilnego kontekstu przy każdym wywołaniu, oszczędza typowo 50–90% kosztów na powtarzalnych promptach. Dla agenta AI wykonującego sekwencję działań zarządzanie oknem kontekstu to osobny temat projektowy, a nie oczywistość.

Rozmiary okna kontekstu w 2026

  • Claude (Anthropic): 200K standardowo, do 1M w wersjach enterprise — referencja w długiej analizie.
  • GPT-4o / GPT-5 (OpenAI): 128K — wystarczające w 90% przypadków, sweet spot cena/wydajność.
  • Gemini 1.5/2 (Google): 1M–2M — największy kontekst rynkowy, użyteczny dla wideo i audio.
  • Llama 3, Mistral: 8K do 128K w zależności od wersji — możliwe do self-hostingu, ograniczone.
Bezpłatny audyt · 48 h

Nie wiesz, gdzie tkwi problem?
Zaudytujemy Twoją stronę. Bezpłatnie.

5 osi pod lupą — SEO, GEO, wydajność, konwersja, tracking. Wyceniony raport PDF + 30 min omówienia w prezencie. Bez zobowiązań, bez karty kredytowej.

Zamów bezpłatny audyt

Raport w 48 h · 30 min omówienia w prezencie

  • SEO Google
  • GEO · ChatGPT, Perplexity
  • Wydajność i Core Web Vitals
  • Konwersja i UX
  • Tracking i analityka
Devis sous 48h

Nie chcesz dzwonić?
Opisz swój projekt
w 5 minut.

Un projet sur ce sujet ? Décrivez-le en 5 min, on vous renvoie une architecture, un chiffrage et un planning.

  • 1Opisujesz swoją potrzebę
  • 2My wyceniamy i uzasadniamy
  • 3Wycena trafia do Twojej skrzynki
Décrire mon projet

Bez zobowiązań · Odpowiedź w 48 h