Inferens (maskininlärning)

Inferens är det skede då en tränad maskininlärningsmodell används för att göra prognoser på ny, live data, till skillnad från träningsskedet då den lär sig. I industrin körs inferens ofta kontinuerligt på strömmande sensordata.

Träning och inferens har mycket olika krav. Träning är beräkningstung och görs periodiskt; inferens måste köras upprepade gånger, ofta i realtid och ibland på begränsad edge-hårdvara nära utrustningen. Inferenslatens, genomströmning och kostnad formar därför hur och var en modell driftsätts. Edge-AI finns just för att köra inferens lokalt för snabba, tillförlitliga prognoser utan att skicka data fram och tillbaka till molnet.

Relaterade termer

Edge AI · Model Drift · Training Data