Słownik AI
LLM (duży model językowy)
Large Language Model, duży model językowy
LLM to duży model językowy wytrenowany na ogromnych zbiorach tekstu, który przewiduje kolejne tokeny i dzięki temu generuje odpowiedzi, streszczenia czy kod w języku naturalnym.
- Uczy się statystycznych wzorców języka z dużych zbiorów tekstu.
- Działa przez przewidywanie kolejnego tokenu, a nie przez rozumienie faktów.
- Jakość zależy od danych, liczby parametrów i sposobu dostrojenia.
LLM to model uczenia maszynowego trenowany na bardzo dużych zbiorach tekstu. W trakcie nauki dopasowuje miliardy parametrów tak, by jak najlepiej przewidywać kolejny token w sekwencji. Z tej prostej zasady wynika zdolność do pisania, tłumaczenia, streszczania i odpowiadania na pytania.
Warto pamiętać, że model operuje na prawdopodobieństwie, a nie na sprawdzonej wiedzy. Dlatego potrafi brzmieć pewnie, a mimo to się mylić — to zjawisko nazywamy halucynacją. W zastosowaniach firmowych LLM często łączy się z wyszukiwaniem dokumentów, żeby odpowiedzi miały oparcie w konkretnych źródłach.
Powiązane pojęcia
W przewodnikach
Powiązane artykuły