Słownik AI

Słownik AI.

Pojęcia AI po polsku — krótko, konkretnie i bez żargonu. Każde hasło to jedna definicja gotowa do zacytowania.

Podstawy AI

Dane treningowe

Dane treningowe to zbiór przykładów, na których model uczy się zależności podczas treningu. Ich jakość, ilość i reprezentatywność bezpośrednio decydują o tym, jak trafnie model działa na nowych danych.

Generatywna AI (Generative AI)

Generatywna AI to klasa modeli, które tworzą nowe treści — tekst, obraz, dźwięk, wideo lub kod — na podstawie wzorców wyuczonych z danych, zamiast jedynie klasyfikować czy przewidywać wartości dla istniejących danych.

Inferencja

Inferencja to faza, w której nauczony model generuje wynik dla nowych danych wejściowych, na przykład odpowiada na pytanie lub klasyfikuje obraz. Odbywa się już bez zmiany parametrów, w odróżnieniu od treningu.

Model fundamentowy (foundation model)

Model fundamentowy to duży model wstępnie trenowany na szerokich, niespecjalizowanych danych, który stanowi bazę do dostrajania pod wiele różnych zadań zamiast budowania osobnego modelu dla każdego z nich.

Przetwarzanie języka naturalnego (NLP)

Przetwarzanie języka naturalnego (NLP) to dziedzina AI zajmująca się tym, jak maszyny rozumieją, analizują i generują ludzki język — od klasyfikacji tekstu i tłumaczenia po prowadzenie rozmowy. Duże modele językowe są jej współczesnym szczytem.

Sieć neuronowa

Sieć neuronowa to model uczenia maszynowego zbudowany z warstw połączonych jednostek (neuronów), które stopniowo przekształcają dane wejściowe i uczą się zależności, dostrajając wagi połączeń w trakcie treningu.

Sztuczna inteligencja (AI)

Sztuczna inteligencja (AI) to dziedzina informatyki zajmująca się systemami, które wykonują zadania zwykle wymagające ludzkiego myślenia: rozpoznają wzorce, podejmują decyzje i generują treść na podstawie danych.

Sztuczna inteligencja ogólna (AGI)

Sztuczna inteligencja ogólna (AGI) to hipotetyczny system dorównujący człowiekowi pod względem szerokości — radzący sobie z dowolnym zadaniem intelektualnym. Dzisiejsze systemy AI są wąskie: bardzo dobre w określonych zadaniach, ale nie uniwersalne.

Uczenie głębokie (deep learning)

Uczenie głębokie to poddziedzina uczenia maszynowego, w której wielowarstwowe sieci neuronowe samodzielnie wyodrębniają coraz bardziej złożone cechy z danych. Stanowi techniczny fundament dzisiejszych modeli językowych i generatywnych.

Uczenie maszynowe (ML)

Uczenie maszynowe (ML) to dział sztucznej inteligencji, w którym model wykrywa zależności w danych treningowych, zamiast działać według ręcznie zapisanych reguł, i na tej podstawie przewiduje wyniki dla nowych przypadków.

Wizja komputerowa (computer vision)

Wizja komputerowa to dziedzina sztucznej inteligencji, która uczy maszyny rozumieć obraz i wideo — wykrywać obiekty, klasyfikować sceny czy odczytywać tekst — zamiast traktować je jako surowe piksele.

Modele i architektura

Destylacja modelu (knowledge distillation)

Destylacja modelu to technika trenowania mniejszego modelu („ucznia”) tak, by naśladował większy model („nauczyciela”). Daje model mniejszy i tańszy w działaniu, zachowujący część jakości oryginału.

Kwantyzacja (quantization)

Kwantyzacja to obniżenie precyzji liczbowej wag modelu (np. z 16 do 8 lub 4 bitów), aby zmniejszyć jego rozmiar i przyspieszyć inferencję. Odbywa się to kosztem niewielkiego spadku jakości.

LLM (duży model językowy)

LLM to duży model językowy wytrenowany na ogromnych zbiorach tekstu, który przewiduje kolejne tokeny i dzięki temu generuje odpowiedzi, streszczenia czy kod w języku naturalnym.

Mały model językowy (SLM)

Mały model językowy (SLM) to kompaktowy model językowy, który można uruchomić na skromnym sprzęcie lub lokalnie. W zamian za mniejszą liczbę parametrów oferuje niższy koszt i większą kontrolę niż duże modele.

Mechanizm uwagi (attention)

Mechanizm uwagi pozwala modelowi ważyć, które tokeny wejścia są istotne przy generowaniu każdego elementu wyjścia. Jest rdzeniem architektury transformer i podstawą dzisiejszych modeli językowych.

Mieszanka ekspertów (Mixture of Experts, MoE)

Mieszanka ekspertów to architektura, w której każdy token trafia tylko do wybranego podzbioru wyspecjalizowanych podsieci (ekspertów). Pozwala zwiększyć liczbę parametrów modelu przy niższym koszcie obliczeń na token.

Model dyfuzyjny (diffusion model)

Model dyfuzyjny generuje obrazy lub wideo, ucząc się stopniowo usuwać szum z losowych danych aż do powstania spójnego wyniku. To architektura stojąca dziś za większością generatorów grafiki.

Model otwarty (open-weight / open-source)

Model otwarty to model, którego wagi są udostępnione publicznie i można go pobrać oraz uruchomić u siebie. To przeciwieństwo modeli zamkniętych, dostępnych tylko przez API dostawcy.

Model rozumujący (reasoning model)

Model rozumujący to model językowy, który przed udzieleniem odpowiedzi przeznacza dodatkową moc obliczeniową na wewnętrzne, krok po kroku rozumowanie. Sprawdza się w zadaniach wymagających wieloetapowej logiki, jak matematyka czy programowanie.

Multimodalność

Multimodalność to zdolność modelu do przetwarzania i łączenia różnych typów danych — tekstu, obrazów, dźwięku czy wideo — w obrębie jednego zapytania, zamiast pracy wyłącznie na tekście.

Okno kontekstowe

Okno kontekstowe to maksymalna liczba tokenów, którą model może przetworzyć naraz w jednym zapytaniu — łącznie z poleceniem, dołączonymi danymi i odpowiedzią. To, co wykracza poza ten limit, jest pomijane.

Parametry modelu

Parametry modelu to wewnętrzne wartości liczbowe (wagi), które model dostraja w trakcie treningu. To w nich zapisana jest wyuczona wiedza, a ich liczbę podaje się często w miliardach.

RLHF

RLHF to metoda dostrajania modelu, w której ludzie oceniają jego odpowiedzi, a model uczy się preferować te wyżej ocenione. Dzięki temu staje się bardziej pomocny i zgodny z oczekiwaniami użytkowników.

Token

Token to najmniejsza jednostka tekstu, na której pracuje model językowy — zwykle fragment słowa, całe słowo lub znak. Model przetwarza i generuje tekst właśnie w postaci ciągu tokenów.

Tokenizacja (tokenization)

Tokenizacja to proces dzielenia tekstu na tokeny — krótkie fragmenty, które model językowy potrafi przetworzyć. To krok wstępny, zamieniający surowy tekst na ciąg jednostek wejściowych modelu.

Transformer

Transformer to architektura sieci neuronowej oparta na mechanizmie uwagi (attention), która pozwala modelowi ważyć powiązania między wszystkimi tokenami w sekwencji. Jest podstawą dzisiejszych dużych modeli językowych.

Agenty i automatyzacja

Agent AI

Agent AI to system, który na bazie celu sam planuje kroki, używa narzędzi (np. wyszukiwarki, API, kodu) i wykonuje zadania w pętli — zamiast tylko odpowiadać na pojedyncze pytanie.

Agent kodujący (coding agent)

Agent kodujący to agent AI, który samodzielnie pisze, uruchamia i poprawia kod, działając w pętli z narzędziami programisty — czyta pliki, wykonuje polecenia, czyta błędy i wprowadza poprawki aż do osiągnięcia celu.

Agentowa AI (agentic AI)

Agentowa AI to paradygmat, w którym systemy AI samodzielnie planują i realizują wieloetapowe zadania prowadzące do celu, używając narzędzi i oceniając wyniki — zamiast tylko odpowiadać na pojedyncze zapytania.

Asystent AI

Asystent AI to aplikacja oparta na modelu językowym, która prowadzi rozmowę, odpowiada na pytania i pomaga w zadaniach — często z dostępem do danych firmy lub narzędzi przez wywoływanie narzędzi (tool use).

Copilot AI (asystent wbudowany)

Copilot AI to wspomagający tryb pracy wbudowany w narzędzie (np. edytor kodu, arkusz, edytor tekstu), który podpowiada w czasie rzeczywistym, gdy użytkownik wykonuje zadanie — model zwykle działa jako zdalna usługa, a copilot tylko sugeruje kolejny krok, bo pracę prowadzi człowiek.

MCP (Model Context Protocol)

MCP to otwarty protokół, który w ustandaryzowany sposób łączy modele językowe z zewnętrznymi narzędziami, danymi i usługami — przez jeden interfejs zamiast osobnej integracji dla każdej aplikacji.

Orkiestracja agentów

Orkiestracja agentów to koordynowanie wielu agentów AI tak, by wspólnie realizowali jeden cel — z podziałem zadań, przekazywaniem wyników i wspólnymi punktami kontroli.

Pamięć agenta (agent memory)

Pamięć agenta to mechanizm zachowywania informacji przez agenta AI między krokami i sesjami — od krótkotrwałego kontekstu bieżącego zadania po długotrwałą wiedzę zapisaną poza oknem kontekstowym.

Planowanie agentowe (agent planning)

Planowanie agentowe to zdolność agenta AI do rozłożenia celu na uporządkowane kroki i dobrania narzędzi, zanim zacznie działać, a potem korygowania planu w trakcie, zamiast reagować na ślepo krok po kroku.

System wieloagentowy (multi-agent system)

System wieloagentowy to układ, w którym kilka wyspecjalizowanych agentów AI współpracuje nad jednym zadaniem, dzieląc się rolami i przekazując sobie wyniki, zamiast polegać na jednym agencie ogólnego przeznaczenia.

Tool use (użycie narzędzi)

Tool use to zdolność modelu językowego do wywoływania zewnętrznych narzędzi — wyszukiwarki, API, kalkulatora czy kodu — gdy samo generowanie tekstu nie wystarcza do wykonania zadania.

Workflow agentowy

Workflow agentowy to proces, w którym agent AI realizuje zadanie w ustalonych krokach — planuje, używa narzędzi, sprawdza wynik i poprawia działanie — zamiast zwracać jedną odpowiedź.

Wywoływanie funkcji (function calling)

Wywoływanie funkcji to mechanizm, który pozwala modelowi językowemu wywołać zdefiniowaną funkcję lub API, generując ustrukturyzowane argumenty zgodne z jej schematem. To techniczna podstawa użycia narzędzi przez model.

Dane i wyszukiwanie

Baza wektorowa

Baza wektorowa to system, który przechowuje embeddingi i szybko znajduje wektory najbliższe zapytaniu według podobieństwa znaczeniowego — fundament wyszukiwania semantycznego i systemów RAG.

Chunking (dzielenie na fragmenty)

Chunking to dzielenie dokumentów na mniejsze fragmenty przed zamianą na embeddingi, tak aby do modelu trafiały spójne i trafne kawałki tekstu — kluczowy krok przygotowania danych dla RAG.

Company Knowledge File (CKF)

Company Knowledge File (CKF) to uporządkowany, wersjonowany zbiór wiedzy firmy: dane, słownik pojęć, źródła i ślad audytowy w jednym przenośnym pakiecie. Daje agentom AI spójny kontekst, a organizacji — historię zmian i dokumentację, którą da się utrzymywać.

Dane syntetyczne (synthetic data)

Dane syntetyczne to sztucznie wygenerowane przykłady, używane do trenowania lub oceny modeli, gdy realnych danych brakuje albo są wrażliwe. Wymagają kontroli jakości, bo mogą powielać i wzmacniać błędy źródła.

Embedding

Embedding to liczbowa reprezentacja tekstu (lub obrazu) w postaci wektora, w której bliskość wektorów oznacza podobieństwo znaczeniowe — podstawa wyszukiwania semantycznego i systemów RAG.

Etykietowanie danych (data labeling)

Etykietowanie danych to nadawanie surowym danym etykiet lub adnotacji opisujących prawidłową odpowiedź, dzięki którym mogą one uczyć lub oceniać model. To podstawa uczenia nadzorowanego i wiarygodnej ewaluacji.

Graf wiedzy (knowledge graph)

Graf wiedzy to uporządkowana sieć encji (osób, produktów, dokumentów) i relacji między nimi. Może stanowić oparcie dla odpowiedzi modelu — jako uzupełnienie lub alternatywa dla wyszukiwania wektorowego.

Potok danych (data pipeline)

Potok danych to uporządkowany ciąg kroków, którymi dane płyną od źródła przez pobranie, oczyszczanie i przetwarzanie aż do modelu lub bazy zasilającej RAG. Każdy etap przekazuje wynik kolejnemu, co czyni przepływ powtarzalnym.

RAG (Retrieval-Augmented Generation)

RAG to technika, w której model języka przed odpowiedzią wyszukuje fragmenty dokumentów i opiera na nich generację — dzięki temu odpowiada na podstawie konkretnych źródeł, a nie samej pamięci.

Reranking (przeszeregowanie wyników)

Reranking to drugi etap wyszukiwania, w którym osobny model porządkuje wstępne wyniki według faktycznej trafności, zanim najlepsze z nich trafią do modelu językowego. Podnosi jakość odpowiedzi w RAG.

Wyszukiwanie hybrydowe (hybrid search)

Wyszukiwanie hybrydowe łączy wyszukiwanie wektorowe (semantyczne) z dopasowaniem słów kluczowych, aby jednocześnie łapać sens pytania i dokładne terminy. Wyniki z obu metod scala się i często porządkuje rerankingiem.

Wyszukiwanie semantyczne

Wyszukiwanie semantyczne dopasowuje dokumenty do zapytania na podstawie znaczenia, a nie zgodności słów — wykorzystuje embeddingi i bazę wektorową, dzięki czemu znajduje trafne treści mimo innego słownictwa.

Praktyka i jakość

Benchmark AI (test porównawczy)

Benchmark AI to ustandaryzowany zestaw zadań do porównywania modeli na jednej skali — np. w rozumowaniu czy programowaniu. Wyniki bywają zawyżane i nie zawsze odzwierciedlają realne zastosowanie.

Ewaluacja modeli

Ewaluacja modeli to systematyczny pomiar jakości odpowiedzi modelu na ustalonym zbiorze przypadków i miarach. Pozwala porównywać wersje i wykrywać regresje zamiast oceniać na wyczucie.

Few-shot (uczenie z kilku przykładów)

Few-shot to technika, w której w samym poleceniu pokazujesz modelowi kilka przykładów poprawnych odpowiedzi, by pokierować jego zachowaniem bez trenowania. Działa w obrębie jednego zapytania.

Fine-tuning (dostrajanie)

Fine-tuning to dotrenowanie gotowego modelu na własnym zbiorze przykładów, by lepiej radził sobie z konkretnym zadaniem lub stylem. Zmienia wagi modelu, w odróżnieniu od promptowania.

Halucynacja

Halucynacja to sytuacja, w której model językowy generuje odpowiedź brzmiącą wiarygodnie, ale niezgodną z faktami lub źródłami. Wynika ze sposobu działania modelu, nie z jego awarii.

Inżynieria kontekstu (context engineering)

Inżynieria kontekstu to dobór, porządkowanie i ograniczanie wszystkiego, co trafia do okna kontekstowego modelu — instrukcji, danych, historii rozmowy i wyników narzędzi — tak, by model miał dokładnie to, czego potrzebuje do zadania.

LLM jako sędzia (LLM-as-a-judge)

LLM jako sędzia to użycie modelu językowego do oceniania odpowiedzi innego modelu według zadanych kryteriów. Jest szybsze i tańsze niż ocena ludzka, ale obciążone własnymi błędami i nastawieniami.

Nadmierne dopasowanie (overfitting)

Nadmierne dopasowanie to sytuacja, w której model zapamiętuje dane treningowe zamiast uczyć się ogólnych wzorców, przez co świetnie radzi sobie na danych znanych, a słabo na nowych, niewidzianych wcześniej.

Prompt engineering

Prompt engineering to praktyka formułowania poleceń dla modelu językowego tak, by uzyskać trafne i powtarzalne odpowiedzi. Obejmuje dobór instrukcji, przykładów i formatu wyjścia.

Prompt systemowy

Prompt systemowy to stała instrukcja ustawiana przed rozmową, która określa rolę, zasady i granice modelu. Obowiązuje przez całą sesję, niezależnie od kolejnych pytań użytkownika.

Rozszerzone myślenie (extended thinking / reasoning effort)

Rozszerzone myślenie to tryb, w którym model przed udzieleniem ostatecznej odpowiedzi generuje wewnętrzne rozumowanie. Wymienia większe opóźnienie i zużycie tokenów na wyższą trafność przy trudnych zadaniach.

Temperatura (parametr generacji)

Temperatura to parametr generacji, który steruje losowością odpowiedzi modelu. Niska wartość daje wyniki bardziej przewidywalne i powtarzalne, wysoka — bardziej różnorodne i mniej przewidywalne.

Uczenie w kontekście (in-context learning)

Uczenie w kontekście to zdolność modelu do dostosowania się do zadania na podstawie samych instrukcji i przykładów zawartych w prompcie, bez aktualizacji wag — efekt znika po zakończeniu rozmowy.

Zero-shot (bez przykładów)

Zero-shot to sposób polecenia, w którym prosisz model o wykonanie zadania, nie pokazując ani jednego rozwiązanego przykładu — opierasz się wyłącznie na samej instrukcji i wiedzy modelu z treningu.

Łańcuch promptów (prompt chaining)

Łańcuch promptów to rozbicie zadania na kolejne kroki promptowania, w których wynik jednego promptu zasila następny. Pozwala podzielić złożony proces na mniejsze, łatwiejsze do kontroli etapy.

Łańcuch rozumowania (chain of thought)

Łańcuch rozumowania to technika, w której model rozpisuje rozwiązanie krok po kroku, zanim poda odpowiedź. Pomaga w zadaniach wieloetapowych, takich jak liczenie czy logika.