Inferencia (aprendizaje automático)

La inferencia es la etapa en la que un modelo de aprendizaje automático ya entrenado se utiliza para hacer predicciones sobre datos nuevos y en vivo, a diferencia de la etapa de entrenamiento en la que aprende. En la industria, la inferencia suele ejecutarse de forma continua sobre datos de sensores en streaming.

El entrenamiento y la inferencia tienen exigencias muy distintas. El entrenamiento es intensivo en cómputo y se realiza de forma periódica; la inferencia debe ejecutarse repetidamente, a menudo en tiempo real y a veces en hardware de borde con recursos limitados, cerca del equipo. Por ello, la latencia, el rendimiento y el coste de la inferencia condicionan cómo y dónde se despliega un modelo. La IA en el borde existe precisamente para ejecutar la inferencia localmente y lograr predicciones rápidas y fiables sin enviar los datos de ida y vuelta a la nube.

Términos relacionados