بيانات التدريب
بيانات التدريب هي مجموعة البيانات التاريخية، المعنونة غالبًا، المستخدمة لتعليم نموذج تعلّم آلي الأنماطَ التي سيطبّقها لاحقًا. وتحدّد جودتها وكميتها وتمثيليتها إلى حدّ كبير مدى جودة أداء النموذج.
لا يمكن لنموذج أن يكون أفضل من البيانات التي يتعلّم منها. وفي التطبيقات الصناعية، تُستمدّ بيانات التدريب عادةً من مسجّلات البيانات وسجلات الصيانة، والحصول على أمثلة كافية للأعطال النادرة تحدٍّ دائم. ويجب تنظيف البيانات ومحاذاتها زمنيًا ووسمها بنتائج مؤكَّدة وجعلها ممثّلة للظروف التي سيواجهها النموذج. وتؤدي بيانات التدريب المتحيّزة أو الشحيحة إلى نماذج هشّة، والظروف المتغيّرة لاحقًا تسبّب انحراف النموذج.