الرؤية الحاسوبية

زيادة الصورة Image Augmentation
الضبط الدقيق Fine-Tuning
اكتشاف الكائنات والمربعات المحيطة Object Detection and Bounding Boxes
مربعات التحديد Anchor Boxes
كشف كائن متعدد القياسات Multiscale Object Detection
مجموعة بيانات اكتشاف الكائن The Object Detection Dataset
اكتشاف المربعات المتعددة ذو اللقطة الواحدة Single Shot Multibox Detection
شبكات CNN القائمة على المنطقة (R-CNNs) Region-based CNNs
التقطيع الدلالي ومجموعة البيانات Semantic Segmentation and the Dataset
الالتفاف المنقول Transposed Convolution
شبكات تلافيفية بالكامل Fully Convolutional Networks
نقل النمط العصبي Neural Style Transfer
تصنيف الصور (CIFAR-10) على Kaggle Image Classification (CIFAR-10) on Kaggle
تحديد سلالة الكلاب (ImageNet Dogs) على Kaggle Dog Breed Identification (ImageNet Dogs) on Kaggle

سواء كان التشخيص الطبي، أو المركبات ذاتية القيادة، أو مراقبة الكاميرا، أو المرشحات الذكية، فإن العديد من التطبيقات في مجال الرؤية الحاسوبية computer vision ترتبط ارتباطًا وثيقًا بحياتنا الحالية والمستقبلية. في السنوات الأخيرة، كان التعلم العميق هو القوة التحويلية للنهوض بأداء أنظمة الرؤية الحاسوبية. يمكن القول إن تطبيقات الرؤية الحاسوبية الأكثر تقدمًا تكاد لا تنفصل عن التعلم العميق. في ضوء ذلك، سيركز هذا الفصل على مجال الرؤية الحاسوبية، ويبحث في الأساليب والتطبيقات التي كان لها مؤخرًا تأثير في الأوساط الأكاديمية والصناعية.

في القسم 7 والقسم 8، درسنا العديد من الشبكات العصبية التلافيفية CNN التي يشيع استخدامها في الرؤية الحاسوبية، وقمنا بتطبيقها على مهام بسيطة لتصنيف الصور. في بداية هذا الفصل، سنصف طريقتين من الممكن أن تحسن تعميم النموذج، وهما زيادة الصورة image augmentation والضبط الدقيق fine-tuning، وتطبيقها على تصنيف الصور. نظرًا لأن الشبكات العصبية العميقة يمكن أن تمثل الصور بشكل فعال في مستويات متعددة، فقد تم استخدام هذه التمثيلات الطبقية layerwise representations بنجاح في العديد من مهام الرؤية الحاسوبية مثل اكتشاف الكائنات object detection والتجزئة الدلالية semantic segmentation ونقل النمط style transfer. باتباع الفكرة الرئيسية المتمثلة في الاستفادة من التمثيلات الطبقية في الرؤية الحاسوبية، سنبدأ بالمكونات والتقنيات الرئيسية لاكتشاف الكائنات. بعد ذلك، سوف نوضح كيفية استخدام الشبكات التلافيفية بالكامل للتجزئة الدلالية للصور. ثم نشرح كيفية استخدام تقنيات نقل الأنماط لإنشاء صور مثل غلاف هذا الكتاب. في النهاية، نختتم هذا الفصل بتطبيق مواد هذا الفصل والعديد من الفصول السابقة على مجموعتي بيانات رائعتين لقياس الرؤية الحاسوبية.

رابط الكتاب

المصدر