Inferenza (machine learning)

L'inferenza è la fase in cui un modello di machine learning addestrato viene utilizzato per fare previsioni su dati nuovi e in tempo reale, in contrapposizione alla fase di addestramento in cui il modello apprende. In ambito industriale, l'inferenza viene spesso eseguita in continuo su flussi di dati provenienti dai sensori.

Addestramento e inferenza hanno esigenze molto diverse. L'addestramento è oneroso dal punto di vista computazionale e viene eseguito periodicamente; l'inferenza deve essere eseguita ripetutamente, spesso in tempo reale e talvolta su hardware edge con risorse limitate, vicino alle apparecchiature. La latenza, il throughput e il costo dell'inferenza influenzano quindi come e dove un modello viene messo in esercizio. L'edge AI esiste proprio per eseguire l'inferenza in locale, garantendo previsioni rapide e affidabili senza inviare i dati avanti e indietro verso il cloud.

Termini correlati