Grundmodell (Foundation Model)
En grundmodell är en stor maskininlärningsmodell som tränats på breda data och kan anpassas till många efterföljande uppgifter i stället för att byggas för ett enda smalt problem. Inom industrin fungerar grundmodeller tränade på text-, sensor- eller bilddata som en återanvändbar bas för underhålls-, syn- och processtillämpningar.
Traditionella industriella modeller tränas från grunden för en enda uppgift – en modell per pumptyp, en klassificerare per defekt. En grundmodell förtränas i stället på ett mycket stort, allmänt dataset och finjusteras eller styrs sedan med prompter för specifika användningsområden, vilket fördelar den tunga träningskostnaden över många tillämpningar.
De mest kända exemplen är stora språkmodeller för text, men samma angreppssätt sprider sig till tidsseriebaserade sensordata och maskinseende, där en enda förtränad modell kan anpassas till nya tillgångar eller produktlinjer med relativt lite uppgiftsspecifika data.
För industriella team ligger lockelsen i återanvändning och snabbare driftsättning: mindre märkta data och mindre ingenjörsarbete per nytt användningsfall. Avvägningarna är modellstorlek, beräkningskostnad och behovet av att validera att en allmän modell beter sig korrekt på en specifik anläggnings utrustning och förhållanden.
Relaterade termer
Large Language Model (LLM) · Generative AI · Machine Learning (Industrial) · Neural Network