Inferência (Aprendizagem Automática)

A inferência é a fase em que um modelo de aprendizagem automática treinado é usado para fazer previsões sobre dados novos e em direto, por oposição à fase de treino em que aprende. Na indústria, a inferência corre muitas vezes continuamente sobre dados de sensores em fluxo.

O treino e a inferência têm exigências muito diferentes. O treino é intensivo em computação e feito periodicamente; a inferência tem de correr repetidamente, muitas vezes em tempo real e por vezes em hardware de borda com recursos limitados, junto do equipamento. A latência, o débito e o custo da inferência moldam, portanto, como e onde um modelo é implantado. A IA de borda existe precisamente para executar a inferência localmente, para previsões rápidas e fiáveis sem fazer os dados viajarem até à nuvem e de volta.

Termos relacionados