Słownik AI
Sieć neuronowa
neural network, sztuczna sieć neuronowa
Sieć neuronowa to model uczenia maszynowego zbudowany z warstw połączonych jednostek (neuronów), które stopniowo przekształcają dane wejściowe i uczą się zależności, dostrajając wagi połączeń w trakcie treningu.
- Składa się z warstw neuronów połączonych wagami.
- Wagi są dostrajane podczas treningu, aby zmniejszać błąd predykcji.
- Architektura transformera, na której opierają się LLM, to rodzaj sieci neuronowej.
Sieć neuronowa przetwarza dane przez kolejne warstwy, w których każdy neuron łączy sygnały z poprzedniej warstwy z przypisanymi im wagami. Te wagi to parametry modelu, a ich dostrajanie podczas treningu pozwala sieci coraz trafniej odwzorowywać zależności w danych.
Im więcej warstw, tym głębsza sieć i większa zdolność do wychwytywania złożonych wzorców, choć rośnie też zapotrzebowanie na dane i moc obliczeniową. Współczesne modele językowe opierają się na architekturze transformera, która jest szczególnym typem sieci neuronowej.
Powiązane pojęcia
Powiązane artykuły