Základový model

Základový model je velký model strojového učení trénovaný na širokých datech, který lze přizpůsobit mnoha navazujícím úlohám, místo aby byl vytvořen pro jeden úzký problém. V průmyslu slouží základové modely trénované na textových, senzorových nebo obrazových datech jako znovupoužitelný základ pro aplikace v údržbě, strojovém vidění a procesech.

Tradiční průmyslové modely se trénují od nuly pro jedinou úlohu – jeden model na typ čerpadla, jeden klasifikátor na druh vady. Základový model je naproti tomu předtrénován na velmi rozsáhlém, obecném datovém souboru a poté doladěn nebo řízen pomocí promptů pro konkrétní použití, čímž se náročné náklady na trénink amortizují napříč mnoha aplikacemi.

Nejznámějšími příklady jsou velké jazykové modely pro text, ale stejný přístup se šíří i do senzorových dat v podobě časových řad a do strojového vidění, kde lze jediný předtrénovaný model přizpůsobit novým zařízením nebo výrobním linkám s relativně malým množstvím úlohově specifických dat.

Pro průmyslové týmy je lákadlem znovupoužitelnost a rychlejší nasazení: méně označkovaných dat a inženýrského úsilí na každý nový případ použití. Kompromisem je velikost modelu, výpočetní náklady a nutnost ověřit, že obecný model se správně chová na zařízení a podmínkách konkrétního závodu.

Související pojmy