Modelo fundacional

Un modelo fundacional es un modelo de aprendizaje automático de gran tamaño, entrenado con datos amplios, que puede adaptarse a muchas tareas posteriores en lugar de construirse para un único problema concreto. En la industria, los modelos fundacionales entrenados con datos de texto, sensores o imágenes sirven de base reutilizable para aplicaciones de mantenimiento, visión y procesos.

Los modelos industriales tradicionales se entrenan desde cero para una sola tarea —un modelo por tipo de bomba, un clasificador por defecto—. En cambio, un modelo fundacional se preentrena con un conjunto de datos muy grande y general y luego se ajusta o se orienta para usos específicos, amortizando el elevado coste de entrenamiento entre muchas aplicaciones.

Los ejemplos más conocidos son los grandes modelos de lenguaje para texto, pero el mismo enfoque se está extendiendo a los datos de sensores de series temporales y a la visión artificial, donde un único modelo preentrenado puede adaptarse a nuevos activos o líneas de producto con relativamente pocos datos específicos de la tarea.

Para los equipos industriales, el atractivo está en la reutilización y el despliegue más rápido: menos datos etiquetados y menos esfuerzo de ingeniería por cada nuevo caso de uso. Las contrapartidas son el tamaño del modelo, el coste de cómputo y la necesidad de validar que un modelo general se comporta correctamente con los equipos y las condiciones de una planta específica.

Términos relacionados