المزيد من مقالات التعلم العميق......مقالات التعلم العميق

الفرق بين التصنيف متعدد الفئات والتصنيف متعدد التسميات في التعلم العميق

اقرأ في هذا المقال
  • المقدمة
  • ما هو التصنيف الثنائي؟
  • ما هو التصنيف متعدد الفئات؟
  • ما هو التصنيف متعدد التسميات؟
  • مثال واقعي لفهم الفرق بين التصنيف متعدد الفئات والتصنيف متعدد التسميات
  • اختبر معلوماتك (مقابلة اختبار)

المقدمة

أثناء حل عبارات مشكلة التصنيف باستخدام التعلم العميق، قد نتوصل بشكل أساسي إلى النوعين التاليين من مهام التصنيف:

  • التصنيف متعدد الفئات Multi-Class Classification.
  • التصنيف متعدد التسميات Multi-Label Classification.

كمقدمة قصيرة، في التصنيف متعدد الفئات، سيكون لكل إدخال فئة إخراج واحدة فقط، ولكن في التصنيف متعدد التسميات، يمكن أن يكون لكل مدخل فئات متعددة المخرجات.

لكن هذه المصطلحات، أي التصنيف متعدد الفئات والتصنيف متعدد التسميات، يمكن أن يربك حتى المطور المتوسط. لذا، في هذه المقالة، حاولت أن أعطيك حدسًا واضحًا وسهلاً بأمثلة عن هذه المصطلحات بطريقة مفصلة. إذا كنت من المتحمسين لعلم البيانات، فاقرأ هذه المقالة بالكامل وقم بتسريع رحلة علم البيانات الخاصة بك.

ما هو التصنيف الثنائي؟

في عبارات مشكلة التصنيف الثنائي binary classification، تأخذ أي عينات من مجموعة البيانات تسمية واحدة فقط من فئتين.

على سبيل المثال، دعنا نرى مثالاً لبيانات صغيرة مأخوذة من مجموعة بيانات تقييمات أمازون.

جدول يوضح مثال على بيان مشكلة التصنيف الثنائي

إذا نظرنا بعناية إلى الجدول، فسنرى أنه لا يمكننا تصنيف المراجعة review إلا على أنها إيجابية positive أو سلبية negative، أي نتيجتين محتملتين فقط. إذن، هذا مثال على بيان مشكلة التصنيف الثنائي.

ما هو التصنيف متعدد الفئات؟

لفهم التصنيف متعدد الفئات، أولاً سوف نفهم المقصود بالفئات المتعددة، ونجد الفرق بين الفئات المتعددة والفئة الثنائية.

الفئات المتعددة مقابل الفئة الثنائية هي مسألة عدد الفئات التي سيعمل المصنف على تصميمها. من الناحية النظرية، يعتبر المصنف الثنائي أقل تعقيدًا بكثير من المصنف متعدد الفئات، لذلك من الضروري إجراء هذا التمييز.

على سبيل المثال، يمكن لـ Support Vector Machine (SVM) بشكل بسيط أن يتعلم مستو فائق hyperplane واحد لتقسيم فئتين، ولكن 3 فئات أو أكثر تجعلها معقدة. في الشبكات العصبية، نستخدم عادةً دالة التشيط sigmoid لمهام التصنيف الثنائية بينما من ناحية أخرى، نستخدم تنشيط Softmax للفئات المتعددة باعتبارها الطبقة الأخيرة من النموذج.

بالنسبة للتصنيف متعدد الفئات، نحتاج إلى إخراج نموذج التعلم العميق لإعطاء دائمًا فئة واحدة بالضبط مثل فئة الإخراج.

على سبيل المثال، إذا كنا نصنع مصنفًا للحيوانات يصنف بين الكلب، والأرنب، والقط، والنمر، فمن المنطقي أن يتم اختيار واحدة من هذه الفئات فقط في كل مرة.

لضمان تحديد فئة واحدة فقط في كل مرة، نقوم بتطبيق دالة تنشيط Softmax في الطبقة الأخيرة ونستخدم الخطأ اللوغارتمي log loss لتدريب النموذج.

لذلك، بالنسبة لمجموعة بيانات معينة، فإن أي عينة تأتي من مجموعة البيانات تأخذ تسمية واحدة فقط من عدد الفئات. دعنا نرى مثالاً على بيانات صغيرة مأخوذة من مجموعة بيانات مراجعات الأفلام movies reviews.

جدول يوضح مثالاً على بيان مشكلة التصنيف متعدد الفئات

إذا نظرنا بعناية إلى الجدول، فسنرى أنه يمكننا فقط تصنيف تصنيف الفيلم من 2 إلى 5، أي أن كل فيلم سيكون له تصنيف واحد فقط (2 أو 3 أو 4 أو 5). هذا يعني أن العينات يمكن أن تحتوي على أكثر من نتيجتين مستهدفتين محتملتين. إذن، هذا مثال على بيان مشكلة التصنيف متعدد الفئات.

ما هو التصنيف متعدد التسميات؟

لفهم التصنيف متعدد التسميات، أولاً سوف نفهم المقصود بالتسميات المتعددة، ونجد الفرق بين التسمية المتعددة والتسمية الثنائية.

التسمية المتعددة مقابل التسمية الواحدة هي مسألة عدد الفئات التي يمكن أن ينتمي إليها كائن أو مثال. في الشبكات العصبية، عندما تكون التسمية الفردية مطلوبة، نستخدم طبقة softmax واحدة كطبقة أخيرة، ونتعلم توزيع احتمالية واحد يمتد عبر جميع الفئات. في حالة الحاجة إلى تصنيف متعدد التسميات، فإننا نستخدم sigmoid متعددة في الطبقة الأخيرة، وبالتالي نتعلم توزيعًا منفصلاً لكل فئة.

في بعض المشكلات، يمكن أن يحتوي كل إدخال على عدة فئات الإخراج المحددة، أو حتى لا تحتوي على أي منها. في هذه الحالات، نذهب إلى نهج مشكلة التصنيف متعدد الفئات.

على سبيل المثال، إذا كنا نبني نموذجًا يتنبأ بجميع الملابس التي يرتديها الشخص، فيمكننا استخدام نموذج تصنيف متعدد التسميات حيث يمكن أن يكون هناك أكثر من خيار واحد ممكن في وقت واحد.

لذلك، بالنسبة لمجموعة بيانات معينة، تأخذ أي عينات تأتي من مجموعة البيانات أكثر من تسمية واحدة من عدد الفئات المتاحة. دعونا نرى هذا المثال.

جدول يوضح مثالاً على بيان مشكلة التصنيف متعدد التسميات

إذا نظرنا بعناية إلى الجدول، فسنرى أن الفيلم قد يأخذ أكثر من نوع واحد، أي أن الفيلم يمكن أن يكون كوميديا وفانتازيا في نفس الوقت. هذا يعني أنه يمكن أن تحتوي العينات على أكثر من تسميتين محتملتين. إذن، هذا مثال على بيان مشكلة التصنيف متعدد التصنيفات.

مثال واقعي لفهم الفرق بين التصنيف متعدد الفئات والتصنيف متعدد التسميات

ضع في اعتبارك مثال الحياة الواقعية التالي لفهم الفرق بين هذين النوعين من التصنيف. لفهم الاختلاف الدقيق، آمل أن توضح الصورة أدناه الأمور تمامًا. دعونا نحاول فهم ذلك.

كما يمكنك معرفة المعلومات العامة التي تفيد بأنه بالنسبة لأي فيلم، تصدر المنظمة المسماة Central Board of Film Certification شهادة اعتمادًا على محتويات الفيلم.

على سبيل المثال، إذا نظرت في الصورة أعلاه ، فقد ترى أن هذا الفيلم قد تم تصنيفه على أنه شهادة “U/A” (بمعنى “التوجيه الأبوي للأطفال الذين تقل أعمارهم عن 12 عامًا). هذا ليس النوع الوحيد من الشهادات ولكن هناك أنواع أخرى من فئات الشهادات مثل:

  • A” (يقتصر على البالغين)، أو
  • U” (معرض عام غير مقيد)،

ولكن أثناء تصنيف الأفلام بناءً على ذلك، فمن المؤكد أنه لا يمكن تصنيف كل فيلم إلا بشهادة واحدة فقط من بين هذه الأنواع الثلاثة من الشهادات. باختصار، هناك فئات متعددة (على سبيل المثال، شهادات متعددة مخصصة للفيلم) ولكن يتم تعيين كل مثيل واحد فقط (على سبيل المثال، يتم تعيين شهادة واحدة فقط لكل فيلم في وقت واحد)، لذلك يتم تصنيف هذه المشكلات ضمن تصنيف متعدد الفئات.

مرة أخرى، إذا رأيت الصورة بعناية، فقد تم تصنيف هذا الفيلم إلى أنواع الكوميديا والرومانسية. لكن هناك اختلاف هذه المرة في أن كل فيلم من الأفلام يمكن أن يقع في مجموعة واحدة أو أكثر من الفئات المختلفة (على سبيل المثال، أكثر من نوع واحد). لذلك، يمكن تخصيص كل حالة بفئات متعددة (مثل أنواع متعددة)، لذلك يتم تصنيف هذه الأنواع من المشاكل ضمن بيان مشكلة التصنيف متعدد التسميات، حيث لدينا مجموعة من التسميات المستهدفة لكل عينة من العينات.

عظيم! بعد فهم هذا المثال بشكل صحيح، يمكنك الآن التمييز بسهولة بين عبارات المشكلة متعددة التسميات ومتعددة الفئات. مبروك على هذا!

اختبر معلوماتك (مقابلة اختبار)

في هذا القسم، قدمت بعض الأسئلة لاختبار معلوماتك فيما يتعلق بالموضوع الذي ناقشناه في هذه المقالة.

السؤال 1: مشاكل التصنيف متعددة الفئات لها فئات متعددة ولكن يتم تعيين كل حالة مرة واحدة فقط.

  • صح.
  • خطأ.

السؤال 2: مشاكل التصنيف متعددة التسميات لها كل حالة يمكن تخصيصها بفئات متعددة أو مجموعة من التسميات المستهدفة.

  • صح.
  • خطأ.
بواسطة
CHIRAG GOYAL
المصدر
Demystifying the Difference Between Multi-Class and Multi-Label Classification Problem Statements in Deep Learning

د. علاء طعيمة

كلية علوم الحاسوب وتكنولوجيا المعلومات / جامعة القادسية / العراق

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى