Inférence (apprentissage automatique)
L'inférence est l'étape où un modèle d'apprentissage automatique entraîné est utilisé pour faire des prédictions sur de nouvelles données en direct, par opposition à l'étape d'entraînement où il apprend. En industrie, l'inférence s'exécute souvent en continu sur des flux de données de capteurs.
Entraînement et inférence ont des exigences très différentes. L'entraînement est gourmand en calcul et réalisé périodiquement ; l'inférence doit s'exécuter de façon répétée, souvent en temps réel et parfois sur un matériel de périphérie contraint, près de l'équipement. La latence, le débit et le coût de l'inférence façonnent donc comment et où un modèle est déployé. L'IA en périphérie existe précisément pour exécuter l'inférence localement, pour des prédictions rapides et fiables sans aller-retour des données vers le cloud.