Dati di addestramento

I dati di addestramento sono l'insieme di dati storici, spesso etichettati, utilizzato per insegnare a un modello di machine learning gli schemi che applicherà in seguito. La loro qualità, quantità e rappresentatività determinano in larga misura quanto bene il modello funzionerà.

Un modello può essere buono solo quanto i dati da cui apprende. Nelle applicazioni industriali, i dati di addestramento provengono tipicamente dagli storici di processo e dai registri di manutenzione, e ottenere un numero sufficiente di esempi di guasti rari è una sfida costante. I dati devono essere puliti, allineati nel tempo, etichettati con esiti confermati e resi rappresentativi delle condizioni che il modello affronterà. Dati di addestramento distorti o scarsi portano a modelli fragili, e il successivo mutare delle condizioni causa la deriva del modello.

Termini correlati