Słownik AI
Dane treningowe
dane uczące, training data, zbiór treningowy
Dane treningowe to zbiór przykładów, na których model uczy się zależności podczas treningu. Ich jakość, ilość i reprezentatywność bezpośrednio decydują o tym, jak trafnie model działa na nowych danych.
- To materiał, z którego model wyciąga zależności w trakcie treningu.
- Błędy i luki w danych przenoszą się na zachowanie modelu.
- Reprezentatywność danych ogranicza ryzyko stronniczych wyników.
Dane treningowe to fundament każdego modelu uczenia maszynowego. Model nie zna świata poza tym, co znajdzie w tych przykładach, dlatego luki, błędy czy nadreprezentacja jednej grupy wprost przekładają się na jego późniejsze decyzje.
W praktyce projektowej dużą część pracy zajmuje przygotowanie i czyszczenie danych, a nie sam trening. Te same dane wykorzystuje się przy fine-tuningu, gdy dostosowujemy gotowy model do węższego zadania, a ich wpływ na jakość modelu sprawdzamy później w ewaluacji modeli.
Powiązane pojęcia
W przewodnikach