كتاب محولات الرؤية

تجمع محولات الرؤية Vision Transformers، أو اختصاراً ViTs، بين مجالين مؤثرين في الذكاء الاصطناعي: الرؤية الحاسوبية Computer Vision(CV) ومعالجة اللغة الطبيعية Natural Language Processing (NLP). يعمل نموذج المحول Transformer، الذي تم اقتراحه في الأصل في ورقة بحثية بعنوان “الانتباه هو كل ما تحتاجه Attention Is All You Need” بقلم فاسواني وآخرين في عام 2017، كأساس لمحولات الرؤية. تم تصميم المحولات كمعمارية شبكة عصبية تتفوق في التعامل مع البيانات المتسلسلة، مما يجعلها مثالية لمهام معالجة اللغة الطبيعية. تجلب محولات الرؤية المعمارية المبتكرة للمحولات إلى عالم الرؤية الحاسوبية.

في مجال الرؤية الحاسوبية، كانت الشبكات العصبية الالتفافية Convolutional Neural Networks (CNNs) تقليديًا النماذج المفضلة لمعالجة وفهم البيانات المرئية. ومع ذلك، حدث تحول كبير في السنوات الأخيرة مع ظهور محولات الرؤية ViTs. وقد أظهرت هذه النماذج، المستوحاة من نجاح المحولات في معالجة اللغة الطبيعية، إمكانات ملحوظة في مهام الرؤية الحاسوبية المختلفة. في هذا الكتاب، سوف نستكشف ما هي محولات الرؤية، وتطبيقاتها، وتنفيذ العديد من مشاريع محولات الرؤية باستخدام بايثون.

لقد حاولت قدر المستطاع ان اترجم المقالات والمشاريع الأكثر طرحاً في مجال محولات الرؤية مع الشرح المناسب والكافي، ومع هذا يبقى عملاً بشرياً يحتمل النقص، فاذا كان لديك أي ملاحظات حول هذا الكتاب، فلا تتردد بمراسلتنا عبر بريدنا الالكتروني.

نأمل ان يساعد هذا الكتاب كل من يريد ان يدخل في مجال محولات الرؤية ومساعدة القارئ العربي على تعلم هذا المجال. اسأل الله التوفيق في هذا العمل لأثراء المحتوى العربي الذي يفتقر أشد الافتقار إلى محتوى جيد ورصين في مجال التعلم الآلي والتعلم العميق وعلم البيانات. ونرجو لك الاستمتاع مع الكتاب ولا تنسونا من صالح الدعاء.

فهرست الكتاب:
0- مقدمة الى محولات الرؤية Introduction to Vision Transformers (ViT)
1- محولات الرؤية: ما هي وكيف تعمل Vision Transformers: What It Is & How It Works
2- مقارنة الشبكات العصبية الالتفافية ومحولات الرؤية Comparison of Convolutional Neural Networks (CNNs) and Vision Transformers (ViTs)
3- فهم محولات الرؤية مع تنسرفلو Understand Vision Transformers with TensorFlow
4-فهم محولات الرؤية مع تنسرفلو وكيراس Understanding Vision Transformers (ViT) with TensorFlow and Keras
5-التعرف على الأشياء باستخدام محولات الرؤية Object Detection using Vision Transformers
6-التعرف على الأرقام المكتوبة بخط اليد باستخدام محولات الرؤية Handwritten Digit Recognition using Vision Transformers
7-تصنيف الصور باستخدام محولات الرؤية Image Classification using Vision Transformers
8-تصنيف الأغذية باستخدام محولات الرؤية Food Classification using Vision transformers
9-تصنيف الصور الفضائية باستخدام محولات الرؤية Satellite Image Classification using Vision Transformers
10-تصنيف الصور الطبية باستخدام محولات الرؤية Medical Images Classification using Vision Transformers
11-اكتشاف فيروس كورونا باستخدام محولات الرؤية COVID-19 Detection using Vision Transformers
12-توليد التسمية التوضيحية للصور باستخدام محولات الرؤية Image Captioning Using Vision Transformers
13-تصنيف الصوت باستخدام محولات الرؤية Audio Classification Using Vision Transformers

د. علاء طعيمة

كلية علوم الحاسوب وتكنولوجيا المعلومات

جامعة القادسية / العراق

رابط تحميل الكتاب

د. علاء طعيمة سبتمبر 15, 2024

0 896 2 دقائق