Tréninková data
Tréninková data jsou historická, často označená datová sada používaná k naučení modelu strojového učení vzorcům, které později uplatní. Jejich kvalita, množství a reprezentativnost do velké míry určují, jak dobře model funguje.
Model může být jen tak dobrý jako data, z nichž se učí. V průmyslových aplikacích se tréninková data obvykle čerpají z historizérů a záznamů údržby a získání dostatku příkladů vzácných poruch je věčnou výzvou. Data musí být vyčištěna, časově zarovnána, označena potvrzenými výsledky a učiněna reprezentativní pro podmínky, kterým bude model čelit. Zkreslená nebo řídká tréninková data vedou ke křehkým modelům a měnící se podmínky později způsobují posun modelu.