الرؤية الحاسوبيةمقالات الرؤية الحاسوبية

خارطة طريق الرؤية الحاسوبية

اقرأ في هذا المقال
  • كيف تتعلم الرؤية الحاسوبية؟
  • الخطوة 1: صقل مهاراتك في الرياضيات.
  • الخطوة 2 : تعلم لغة البرمجة.
  • الخطوة 3 : تعلم مكتبة OpenCV.
  • الخطوة 4 : تعلم أطر التعلم العميق.
  • الخطوة الخامسة : تعلم الشبكات العصبية التلافيفية (CNN).
  • الخطوة 6 : تعلم الشبكات العصبية المتكررة (RNN).
  • الخطوة 7 : العمل على المشاريع.
  • الاستنتاج

هل تريد أن تعرف كيف تتعلم الرؤية الحاسوبية (Computer Vision)؟ … إذا كانت الإجابة بنعم، فهذه المقالة مناسبة لك. في هذه المقالة، ستجد خارطة طريق الرؤية الحاسوبية خطوة بخطوة. إلى جانب ذلك، ستجد أيضًا بعض أفضل الموارد لتعلم الرؤية الحاسوبية.

الآن دون مزيد من اللغط، فلنبدأ:

كيف تتعلم الرؤية الحاسوبية؟

قبل أن أناقش خارطة طريق الرؤية الحاسوبية، دعنا نرى المهارات المطلوبة للرؤية الحاسوبية:

نطاق الرؤية الحاسوبية ينمو بسرعة. وفقًا لأحد التقارير، من المتوقع أن يزداد سوق الرؤية الحاسوبية من 10.9 مليار دولار أمريكي في عام 2019 إلى 17.4 مليار دولار أمريكي بحلول عام 2024، بمعدل نمو سنوي مركب بنسبة 7.8٪.

لذلك، لتعلم الرؤية الحاسوبية، يجب أن تكون لديك المهارات التالية:

  • مهارات الرياضيات.
  • مهارات البرمجة.
  • مكتبة OpenCV
  • أطر التعلم العميق
  • الشبكات العصبية التلافيفية (CNN)
  • الشبكات العصبية المتكررة (RNN)

الآن، دعنا ننتقل إلى خارطة طريق الرؤية الحاسوبية خطوة بخطوة:

الخطوة 1: صقل مهاراتك في الرياضيات.

الخطوة الأولى أو المهارة في الرؤية الحاسوبية هي المهارات الرياضية. يساعدك على فهم كيفية عمل خوارزميات الرؤية الحاسوبية.

في الاستخدام اليومي، تعتمد خوارزميات الرؤية الحاسوبية على المعلمات والمتغيرات. بدون أي فهم للرياضيات الأساسية، تنتهي البرمجة بسهولة بتخمين القيم

في الرياضيات، يجب أن تتعلم المواد التالية:

  • الاحتمالية والإحصاء.
  • الجبر الخطي.
  • حساب التفاضل والتكامل.

الخطوة 2 : تعلم لغة البرمجة

تحتاج إلى تطوير مهارات برمجة جيدة إذا كنت تريد أن تصبح خبيرًا في الرؤية الحاسوبية. هناك الكثير من لغات البرمجة المتاحة، والتي يمكنك الاختيار من بينها. لغات البرمجة الأكثر استخدامًا في الرؤية الحاسوبية هي:

  • Python.
  • R.
  • C.
  • Java.

لكن Python و R هما أكثر لغات البرمجة ملاءمة للرؤية الحاسوبية والتعلم العميق. أود أن أقترح عليك تعلم Python أو R.

لذا ، إذا كنت مبتدئًا ، فإنني أوصيك بتعلم لغة بايثون.

الخطوة 3 : تعلم مكتبة OpenCV

OpenCV (Open Source Computer Vision) هي مكتبة رؤية حاسوبية تحتوي على دوال متنوعة لإجراء عمليات على الصور أو مقاطع الفيديو.

تم تطويره في الأصل بواسطة Intel ولكن تم صيانته لاحقًا بواسطة Willow Garage وتديره الآن Itseez. هذه المكتبة متعددة المنصات وهي متوفرة بلغات برمجة متعددة مثل Python و C ++ وما إلى ذلك.

يجب أن تكون على دراية جيدة بمكتبة OpenCV.

الخطوة 4 : تعلم أطر التعلم العميق

يجب أن يكون لديك معرفة بأطر التعلم العميق.

الأُطر الأكثر شيوعًا للتعلم العميق:

  • TensorFlow.
  • Theano.
  • scikit learn.
  • PyTorch.
  • Keras.
  • DL4J.
  • Caffe.
  • Microsoft Cognitive Toolkit.

الآن ، دعونا نناقش بعض أُطر العمل بالتفصيل:

أ) Tensorflow:

Tensorflow هو الإطار الأكثر استخدامًا في التعلم الآلي والتعلم العميق. إنها مكتبة برامج مفتوحة المصدر. يتم استخدامه للحساب العددي باستخدام الرسم البياني لتدفق البيانات.

ب) Theano:

يساعدك Theano على تحديد العمليات الرياضية وتحسينها وتقييمها. LASAGNE و BLOCKS و KERAS مكتبات شائعة.

ج) scikit Learn:

إنه مبني على أعلى المكتبات الموجودة مثل NUMPY و SCIPY و MATPLOTLIB. لقد بدأت كبرنامج GOOGLE SUMMER OF CODE ولديها الآن 23000 Github commit.

الخطوة الخامسة : تعلم الشبكات العصبية التلافيفية (CNN)

تستخدم CNN لبناء غالبية خوارزميات الرؤية الحاسوبية.

الشبكة العصبية التلافيفية هي خوارزمية التعلم العميق. يستخدم للتعرف على الصور ومعالجة اللغة الطبيعية. تأخذ الشبكة العصبية التلافيفية (CNN) صورة لتحديد ميزاتها والتنبؤ بها.

يان ليكون والد الشبكة العصبية التلافيفية. وهو طالب لجيفري هيلتون. جيفري هيلتون هو والد الشبكات العصبية الاصطناعية.

خطوات الشبكة العصبية التلافيفية:

في الشبكة العصبية التلافيفية ، هناك بشكل أساسي الخطوات التالية:

  • عملية الالتفاف Convolution.
  • طبقة ReLU.
  • تجميع Pooling.
  • تسطيح Flattening.
  • اتصال كامل Full Connection.

الخطوة 6 : تعلم الشبكات العصبية المتكررة (RNN)

الشبكة العصبية المتكررة هي شبكة يمكنها فهم التسلسلات sequences والوقت time.

والتسلسلات ليست نصًا أو موسيقى فحسب ، بل يمكن أن تكون أيضًا مقاطع فيديو (مجموعة من الصور).

هذا يعني أن استخدام شبكات RNN و CNN معًا أمر ممكن ، وفي الواقع ، يمكن أن يكون الاستخدام الأكثر تقدمًا لـللرؤية الحاسوبية لدينا.

يمكننا استخدام RNN في تصنيف الحركة وتوليد الأفلام.

لذلك، يمكنك تعلم RNN للرؤية الحاسوبية.

الخطوة 7 : العمل على المشاريع.

بمجرد أن تتعلم جميع مهارات الرؤية الحاسوبية المطلوبة، ابدأ العمل في مشاريع الرؤية الحاسوبية. كلما زاد عملك في المشاريع، كلما تعلمت أكثر.

سأناقش بعض أفكار المشاريع على مستوى المبتدئين من أجل الرؤية الحاسوبية. ستساعدك هذه المشاريع على صقل مهاراتك في الرؤية الحاسوبية وتعزيز سيرتك الذاتية. أود أن أقترح عليك اختيار مشروع من هذه القائمة والبدء في العمل على هذا المشروع.

  • أداة عد الناس
  • كشف الألوان
  • تتبع الكائن في الفيديو
  • كشف المشاة
  • التعرف على إيماءات اليد
  • التعرف على المشاعر البشرية
  • كشف حارة الطريق
  • الماسح الضوئي لبطاقات العمل
  • التعرف على لوحة الترخيص
  • التعرف على الأرقام المكتوبة بخط اليد
  • تصنيف زهور Iris
  • كشف الوجه بالصور العائلية
  • ليجو بريك فايندر
  • كشف قناع الوجه

هذا كل شيء، فقط هذه المهارات مطلوبة لتصبح خبير الرؤية الحاسوبية. تهانينا ، إنها خطوتك الأولى نحو الرؤية الحاسوبية.

لكن الشيء الأكثر أهمية هو الاستمرار في تحسين مهاراتك من خلال العمل على المزيد والمزيد من التحديات.

كلما تدربت أكثر ، زادت المعرفة بالرؤية الحاسوبية التي ستكتسبها. لذلك بعد الانتهاء من هذه الخطوات ، لا تتوقف ، فقط ابحث عن تحديات جديدة وحاول حلها.

حان وقت الختام!

الاستنتاج

في هذه المقالة، لقد ناقشت كيف تتعلم الرؤية الحاسوبية؟. إذا كانت لديك أي شكوك أو استفسارات، فلا تتردد في سؤالي في قسم التعليقات. أنا هنا لمساعدتك.

كل التوفيق في حياتك المهنية!

تعلم سعيد!

المصدر
Computer Vision Roadmap

د. علاء طعيمة

كلية علوم الحاسوب وتكنولوجيا المعلومات / جامعة القادسية / العراق

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى