Co to jest LLM (duży model językowy)?

Słownik AI

LLM (duży model językowy)

Large Language Model, duży model językowy

LLM to duży model językowy wytrenowany na ogromnych zbiorach tekstu, który przewiduje kolejne tokeny i dzięki temu generuje odpowiedzi, streszczenia czy kod w języku naturalnym.

Uczy się statystycznych wzorców języka z dużych zbiorów tekstu.
Działa przez przewidywanie kolejnego tokenu, a nie przez rozumienie faktów.
Jakość zależy od danych, liczby parametrów i sposobu dostrojenia.

LLM to model uczenia maszynowego trenowany na bardzo dużych zbiorach tekstu. W trakcie nauki dopasowuje miliardy parametrów tak, by jak najlepiej przewidywać kolejny token w sekwencji. Z tej prostej zasady wynika zdolność do pisania, tłumaczenia, streszczania i odpowiadania na pytania.

Warto pamiętać, że model operuje na prawdopodobieństwie, a nie na sprawdzonej wiedzy. Dlatego potrafi brzmieć pewnie, a mimo to się mylić — to zjawisko nazywamy halucynacją. W zastosowaniach firmowych LLM często łączy się z wyszukiwaniem dokumentów, żeby odpowiedzi miały oparcie w konkretnych źródłach.

Powiązane pojęcia

W przewodnikach

Powiązane artykuły