التعمق في التعلم العميققابلية التوسع والكفاءة والتطبيقات

الرؤية الحاسوبية

ستقرأ في هذا الفصل:
  • زيادة الصورة Image Augmentation
  • الضبط الدقيق Fine-Tuning
  • اكتشاف الكائنات والمربعات المحيطة Object Detection and Bounding Boxes
  • مربعات التحديد Anchor Boxes
  • كشف كائن متعدد القياسات Multiscale Object Detection
  • مجموعة بيانات اكتشاف الكائن The Object Detection Dataset
  • اكتشاف المربعات المتعددة ذو اللقطة الواحدة Single Shot Multibox Detection
  • شبكات CNN القائمة على المنطقة (R-CNNs) Region-based CNNs
  • التقطيع الدلالي ومجموعة البيانات Semantic Segmentation and the Dataset
  • الالتفاف المنقول Transposed Convolution
  • شبكات تلافيفية بالكامل Fully Convolutional Networks
  • نقل النمط العصبي Neural Style Transfer
  • تصنيف الصور (CIFAR-10) على Kaggle Image Classification (CIFAR-10) on Kaggle
  • تحديد سلالة الكلاب (ImageNet Dogs) على Kaggle Dog Breed Identification (ImageNet Dogs) on Kaggle

سواء كان التشخيص الطبي، أو المركبات ذاتية القيادة، أو مراقبة الكاميرا، أو المرشحات الذكية، فإن العديد من التطبيقات في مجال الرؤية الحاسوبية computer vision ترتبط ارتباطًا وثيقًا بحياتنا الحالية والمستقبلية. في السنوات الأخيرة، كان التعلم العميق هو القوة التحويلية للنهوض بأداء أنظمة الرؤية الحاسوبية. يمكن القول إن تطبيقات الرؤية الحاسوبية الأكثر تقدمًا تكاد لا تنفصل عن التعلم العميق. في ضوء ذلك، سيركز هذا الفصل على مجال الرؤية الحاسوبية، ويبحث في الأساليب والتطبيقات التي كان لها مؤخرًا تأثير في الأوساط الأكاديمية والصناعية.

في القسم 7 والقسم 8، درسنا العديد من الشبكات العصبية التلافيفية CNN التي يشيع استخدامها في الرؤية الحاسوبية، وقمنا بتطبيقها على مهام بسيطة لتصنيف الصور. في بداية هذا الفصل، سنصف طريقتين من الممكن أن تحسن تعميم النموذج، وهما زيادة الصورة image augmentation والضبط الدقيق fine-tuning، وتطبيقها على تصنيف الصور. نظرًا لأن الشبكات العصبية العميقة يمكن أن تمثل الصور بشكل فعال في مستويات متعددة، فقد تم استخدام هذه التمثيلات الطبقية layerwise representations بنجاح في العديد من مهام الرؤية الحاسوبية مثل اكتشاف الكائنات object detection والتجزئة الدلالية semantic segmentation ونقل النمط style transfer. باتباع الفكرة الرئيسية المتمثلة في الاستفادة من التمثيلات الطبقية في الرؤية الحاسوبية، سنبدأ بالمكونات والتقنيات الرئيسية لاكتشاف الكائنات. بعد ذلك، سوف نوضح كيفية استخدام الشبكات التلافيفية بالكامل للتجزئة الدلالية للصور. ثم نشرح كيفية استخدام تقنيات نقل الأنماط لإنشاء صور مثل غلاف هذا الكتاب. في النهاية، نختتم هذا الفصل بتطبيق مواد هذا الفصل والعديد من الفصول السابقة على مجموعتي بيانات رائعتين لقياس الرؤية الحاسوبية.

 

رابط الكتاب

المصدر
Dive into Deep Learning

د. علاء طعيمة

كلية علوم الحاسوب وتكنولوجيا المعلومات / جامعة القادسية / العراق

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى