Dados de Treino
Os dados de treino são o conjunto de dados histórico, muitas vezes rotulado, usado para ensinar a um modelo de aprendizagem automática os padrões que mais tarde aplicará. A sua qualidade, quantidade e representatividade determinam em grande medida o desempenho do modelo.
Um modelo só pode ser tão bom como os dados com que aprende. Nas aplicações industriais, os dados de treino são tipicamente extraídos de historiadores e de registos de manutenção, e obter exemplos suficientes de falhas raras é um desafio perene. Os dados têm de ser limpos, alinhados no tempo, rotulados com resultados confirmados e tornados representativos das condições que o modelo enfrentará. Dados de treino enviesados ou escassos levam a modelos frágeis, e as condições em mudança mais tarde causam a deriva de modelo.