Koulutusdata
Koulutusdata on historiallinen, usein merkitty, aineisto, jolla koneoppimismallille opetetaan kuviot, joita se myöhemmin soveltaa. Sen laatu, määrä ja edustavuus määräävät pitkälti, kuinka hyvin malli suoriutuu.
Malli voi olla vain niin hyvä kuin data, josta se oppii. Teollisissa sovelluksissa koulutusdata vedetään tyypillisesti historioitsijoista ja kunnossapitokirjauksista, ja riittävän monien esimerkkien saaminen harvinaisista vioista on ikuinen haaste. Data on puhdistettava, kohdistettava ajassa, merkittävä vahvistetuilla lopputuloksilla ja tehtävä edustavaksi olosuhteista, joita malli kohtaa. Vinoutunut tai niukka koulutusdata johtaa hauraisiin malleihin, ja muuttuvat olosuhteet myöhemmin aiheuttavat mallin ajautumista.