Träningsdata

Träningsdata är den historiska, ofta märkta, datamängd som används för att lära en maskininlärningsmodell de mönster den senare ska tillämpa. Dess kvalitet, kvantitet och representativitet avgör i hög grad hur väl modellen presterar.

En modell kan bara bli så bra som den data den lär sig från. I industriella tillämpningar hämtas träningsdata vanligtvis från historians och underhållsregister, och att få tillräckligt med exempel på sällsynta fel är en ständig utmaning. Data måste rensas, samordnas i tid, märkas med bekräftade utfall och göras representativ för de förhållanden modellen kommer att möta. Partisk eller gles träningsdata leder till sköra modeller, och ändrade förhållanden senare orsakar modellavvikelse.

Relaterade termer