Inference (strojové učení)
Inference je fáze, v níž se trénovaný model strojového učení používá k predikcím na nových, živých datech, na rozdíl od fáze tréninku, kdy se učí. V průmyslu inference často běží nepřetržitě na proudových datech ze senzorů.
Trénink a inference mají velmi odlišné nároky. Trénink je výpočetně náročný a prováděný periodicky; inference musí běžet opakovaně, často v reálném čase a někdy na omezeném edge hardwaru blízko zařízení. Latence, propustnost a náklady inference proto formují, jak a kde je model nasazen. Edge AI existuje právě k provozu inference lokálně pro rychlé, spolehlivé predikce bez putování dat do cloudu a zpět.