- منهج تعلم الآلة
- مقدمة في تعلم الآلة
- التعلم الخاضع للإشراف
- التعلم غير الخاضع للأشراف
- هندسة الميزات
- تقييم النموذج
- المسارات
- العمل مع البيانات النصية
- الملخص
هناك العديد من الدورات التدريبية المتاحة اليوم بناءً على التعلم الآلي Machine Learning لأن استخدام التعلم الآلي في الصناعة يتزايد بسرعة. لقد رأيت الكثير من الدورات التدريبية باهظة الثمن ولكن لا تزال لا تتضمن جميع المفاهيم المهمة التي تحتاج إلى معرفتها حول التعلم الآلي. لذلك، إذا كنت ترغب في التسجيل في أي دورة تدريبية بناءً على التعلم الآلي، فراجع دائمًا منهجها للتأكد من أنها تتضمن جميع مفاهيم التعلم الآلي المهمة. لإعطائك تفاصيل حول الموضوعات التي يجب أن تكون في دورة التعلم الآلي، سأقدم لك في هذه المقالة منهجاً كاملاً Complete Syllabus للتعلم الآلي.
منهج تعلم الآلة
فيما يلي جميع الموضوعات الرئيسية التي تساهم في منهج التعلم الآلي:
- مقدمة في تعلم الآلة Introduction to Machine Learning.
- التعلم الخاضع للإشراف Supervised Learning.
- التعلم غير الخاضع للأشراف Unsupervised Learning.
- هندسة الميزات Feature Engineering.
- تقييم النموذج Model Evaluation.
- المسارات Pipelines.
- العمل مع بيانات النص Working with Text Data.
دعنا الآن ننتقل إلى جميع الموضوعات المذكورة أعلاه لمنهج التعلم الآلي بإيجاز.
مقدمة في تعلم الآلة
قبل البدء بأي دورة، يجب أن تعرف ما هي وما هو نطاقها. لذلك لبدء التعلم الآلي، يجب أن تعرف ما هو التعلم الآلي وما هي المشاكل التي يمكن أن يحلها التعلم الآلي. فيما يلي موضوعات مقدمة إلى التعلم الآلي التي يجب أن تكون في منهج التعلم الآلي:
- ما هو تعلم الآلة؟
- لماذا نحتاج إلى التعلم الآلي؟
- المشكلات التي يمكن أن يحلها التعلم الآلي.
- أنواع البيانات التي تتعامل معها.
التعلم الخاضع للإشراف
مثل التعلم الآلي هو مجموعة فرعية من الذكاء الاصطناعي، فإن التعلم الخاضع للإشراف هو ايضا مجموعة فرعية من التعلم الآلي. يتضمن التعلم الآلي الخاضع للإشراف حل مشكلات التصنيف classification والانحدار regression. فيما يلي موضوعات التعلم الخاضع للإشراف التي يجب تناولها في منهج التعلم الآلي:
- ما هو التعلم الخاضع للإشراف؟
- التصنيف.
- الانحدار.
- خوارزميات التصنيف.
- خوارزميات الانحدار.
- مقاييس تقييم النموذج Model Evaluation Metrics للتصنيف والانحدار.
التعلم غير الخاضع للأشراف
التعلم غير الخاضع للإشراف هو مجموعة فرعية أخرى من التعلم الآلي. يستخدم التعلم غير الخاضع للإشراف لحل مشاكل التجميع clustering وتقليل الأبعاد dimensionality reduction. فيما يلي موضوعات التعلم غير الخاضع للإشراف التي يجب تغطيتها في منهج تعلم الآلة:
- ما هو التعلم غير الخاضع للإشراف؟
- المعالجة المسبقة Preprocessing وتحجيم مجموعات البيانات Scaling Datasets.
- تقليل الأبعاد Dimensionality Reduction.
- استخراج الميزات Feature Extraction.
- التعلم المنوع Manifold Learning.
- التجميع Clustering.
- خوارزميات التجميع Clustering Algorithms.
هندسة الميزات
تدور هندسة الوظائف حول استخدام المعرفة بمجال مجموعة البيانات لإنشاء أو استخراج تلك الميزات التي تجعل خوارزميات التعلم الآلي تعمل بدقة كبيرة. فيما يلي موضوعات هندسة الميزات التي يجب تناولها في منهج التعلم الآلي:
- الميزات الفئوية Categorical Features.
- ترميز واحد-ساخن One-hot-encoding.
- Binning والتقطيع Discretization.
- النماذج الخطية Linear Models والأشجار Trees.
- التفاعلات Interactions ومتعددة الحدود Polynomials.
- التحولات غير الخطية أحادية المتغير Univariate Nonlinear Transformations.
- اختيار الميزات Features Selection
تقييم النموذج
من المهم اختيار الميزات والمعلمات المناسبة لخوارزميات التعلم الآلي الخاصة بك. يساعد ذلك في تقييم أداء نماذج التعلم الآلي واختيار معايير أفضل. يُعرف هذا باسم “تقييم النموذج Model Evaluation “. فيما يلي موضوعات تقييم النموذج التي يجب تناولها في منهج التعلم الآلي:
- الضبط الزائد Overfitting والضبط الناقص Underfitting.
- المصادقة المتقاطعة Cross-Validation.
- بحث الشبكة Grid Search.
- مقاييس التقييم Evaluation Metrics.
- اختيار النموذج Model Selection.
- ضبط المعلمات الفائقة Hyperparameter Tuning.
المسارات
يتم استخدام مسارات (pipeline) التعلم الآلي للمساعدة في أتمتة عملية التعلم الآلي. إنهم يعملون من خلال السماح بتحويل سلسلة من البيانات وربطها معًا في نموذج يمكن اختباره وتقييمه لتحقيق نتيجة، سواء كانت إيجابية أو سلبية. فيما يلي موضوعات المسارات التي يجب تغطيتها في كل دورة تدريبية لتعلم الآلة:
- اختيار المعلمة Parameter Selection.
- بناء المسارات Building Pipelines.
- استخدام المسارات في شبكة البحث Using Pipelines in Grid Search.
العمل مع البيانات النصية
يقع العمل مع البيانات النصية في التعلم الآلي ضمن مجال معالجة اللغة الطبيعية natural language processing، وهو مجال مخصص للخوارزميات وطرق معالجة اللغات البشرية لأجهزة الحاسوب. فيما يلي موضوعات العمل مع البيانات النصية التي يجب تناولها في كل دورة تدريبية لتعلم الآلة:
- أنواع البيانات النصية Types of Textual Data.
- تحليل المشاعر Analyzing Sentiments.
- حقيبة الكلمات Bag of words.
- كلمات التوقف Stopwords.
- تردد المصطلح-معكوس تردد الوثيقة (TF-IDF)
- الترميز Tokenization.
- التجذيع Stemming.
- الليميتازيشن Lemmatization.
- نمذجة الموضوع Topic Modelling.
- تجميع المستندات Document Clustering.
الملخص
لذلك كانت هذه أهم الموضوعات التي يجب أن تكون في كل دورة تعلم الآلة سواء اونلاين او اوفلاين. لقد رأيت الكثير من الدورات التدريبية باهظة الثمن ولكن لا تزال لا تتضمن جميع المفاهيم المهمة التي تحتاج إلى معرفتها حول التعلم الآلي. لذلك، إذا كنت ترغب في التسجيل في دورة تدريبية تعتمد على التعلم الآلي، فراجع دائمًا منهجها للتأكد من أنها تتضمن جميع مفاهيم التعلم الآلي المهمة. آمل أن تكون قد أحببت هذه المقالة حول المنهج الكامل للتعلم الآلي.