Dane uczące

Dane uczące to historyczny, często oznakowany zbiór danych używany do nauczenia modelu uczenia maszynowego wzorców, które później będzie stosował. Ich jakość, ilość i reprezentatywność w dużej mierze decydują o tym, jak dobrze model działa.

Model może być tylko tak dobry, jak dane, na których się uczy. W zastosowaniach przemysłowych dane uczące pochodzą zwykle z systemów archiwizacji danych i zapisów utrzymania ruchu, a pozyskanie wystarczającej liczby przykładów rzadkich awarii jest odwiecznym wyzwaniem. Dane muszą zostać oczyszczone, zsynchronizowane w czasie, oznaczone potwierdzonymi wynikami i uczynione reprezentatywnymi dla warunków, z jakimi model się zetknie. Stronnicze lub skąpe dane uczące prowadzą do kruchych modeli, a zmieniające się później warunki powodują dryft modelu.

Powiązane terminy