An enhanced approach for fast vehicle detection using deep learning / by Eslam Haroun Fouda ; Supervision Prof. Hesham A. Hefny, Dr. Ahmed H. Mohamed.
Material type:
- text
- Unmediated
- volume
- طريقة محسنة للإكتشاف السريع للمركبات بإستخدام التعلم العميق [Added title page title]
- 005.31
- Issues also as CD.
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.02.M.Sc.2024.Es.E (Browse shelf(Opens below)) | Not for loan | 01010110091179000 |
Browsing المكتبة المركزبة الجديدة - جامعة القاهرة shelves Close shelf browser (Hides shelf browser)
No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | ||
Cai01.18.02.M.Sc.2023.Mo.U User preferences prediction in arabic using deep learning / | Cai01.18.02.M.Sc.2023.Os.E An enhanced approach for automated glaucoma diagnosis in retinal images / | Cai01.18.02.M.Sc.2024.Al.E. An Enhanced Machine Learning Approach For Detection of Radioactive Mineralization / | Cai01.18.02.M.Sc.2024.Es.E An enhanced approach for fast vehicle detection using deep learning / | Cai01.18.02.M.Sc.2024.Ha.I An intelligent algorithm for multicast routing in the internet of things / | Cai01.18.02.M.Sc.2024.Ma.D Deep learning approach for liver tumour diagnosis / | Cai01.18.02.M.Sc.2024.Ma.S Semantic expansion of short queries using domain ontology / |
Thesis (M.Sc)-Cairo University, 2024.
Bibliography: pages 114-124.
Detection is a crucial stage of Advanced Driver Assistance Systems (ADAS). Upon the detection of objects, vehicles, and persons, the self-driving car can make a decision to brake, accelerate, turn right, turn left, or take the right road and the correct lane to steer to. Object Detection appears in many practical applications such as face detection, people counting, online images, security, and video surveillance, many industrial applications, and particularly in the context of intelligence transportation systems like vehicle detection for autonomous driving, calculating vehicle speed, density, volume, traffic flow rate, traveling time or congestion level. Also, it can be applied for vehicle detection and tracking, parking area monitoring, road traffic monitoring and management, etc. Object detection is the problem of localizing and classifying multiple objects of different categories on roads. Computer vision goes a long way in achieving real-time performance to save time in transportation and achieve the best precision to save human spirits and to build small models to run on different edge devices. One of the best computer vision models in the field of object detection is the YOLO algorithm which has many versions. YOLO algorithm provides a good trade-off between the speed required for autonomous driving systems and the precision required for automatic parking systems.
In this thesis, for object detection, a single convolutional neural network is used. An enhanced object detector based on the YOLOv5 algorithm is proposed to detect objects of different classes. The enhanced YOLOv5 approach is used with three feature maps for detecting objects of different sizes. Several experiments are done to get knowledge about which factors affect the problem. The approach proposes a balanced distribution of the KITTI dataset classes to solve the problem of imbalanced data distribution. The new balanced data distribution helps the neural network to extract features from a large number of instances. Numerous samples of similar classes will make the trained model have a better effect and generalization ability between dataset classes and improve the YOLOV5 model precision.
In order to make a good tradeoff between speed and precision in model performance, a careful choice of model structure and input size is considered. To get more precise predicted localization boxes, an enhanced K-mean algorithm evolved with genetic algorithms is used to extract anchors and increase the positioning precision. The new anchor boxes take into consideration the whole dataset which increases the precision of all dataset classes. The results show that the enhanced YOLOv5 model achieves high performance on six classes (car, van, truck, pedestrian, cyclist, and tram) of the KITTI test set with a precision of 95.3% “mean average precision at 0.7 overlapping” (mAP@0.7) with a detection speed of 106 frames per second (FPS).
يعد اكتشاف الأشياء مرحلة حاسمة في أنظمة مساعدة السائق المتقدمة. عند اكتشاف الأشياء والمركبات والأشخاص، يمكن للسيارة ذاتية القيادة اتخاذ قرار باستخدام المكابح أو زيادة السرعة أو الانعطاف يمينًا أو يسارًا أو سلوك الطريق الأيمن والمسار الصحيح للتوجيه إليه. يظهر اكتشاف الكائنات في العديد من التطبيقات العملية مثل اكتشاف الوجه، وعد الأشخاص، والصور عبر الإنترنت، والأمن، والمراقبة بالفيديو، والعديد من التطبيقات الصناعية، وخاصة في سياق أنظمة النقل الاستخباراتية مثل اكتشاف المركبات للقيادة الذاتية، وحساب سرعة السيارة وكثافتها، الحجم أو معدل تدفق حركة المرور أو وقت السفر أو مستوى الازدحام. كما يمكن تطبيقه لاكتشاف المركبات وتتبعها، ومراقبة منطقة وقوف السيارات، ومراقبة حركة المرور على الطرق وإدارتها، وما إلى ذلك. اكتشاف الكائنات هو مشكلة تحديد وتصنيف كائنات متعددة من فئات مختلفة على الطرق. تقطع الرؤية الحاسوبية شوطًا طويلًا في تحقيق الأداء في الوقت الفعلي لتوفير الوقت في النقل وتحقيق أفضل دقة لإنقاذ الأرواح البشرية وبناء نماذج صغيرة للتشغيل على أجهزة متطورة مختلفة. واحدة من أفضل نماذج الرؤية الحاسوبية في مجال اكتشاف الأشياء هي خوارزمية أنت تنظر مرة واحدة التي لها إصدارات عديدة. توفر خوارزمية أنت تنظر مرة واحدة مقايضة جيدة بين السرعة المطلوبة لأنظمة القيادة الذاتية والدقة المطلوبة لأنظمة ركن السيارات الأوتوماتيكية.
في هذه الأطروحة، للكشف عن الكائنات، يتم استخدام شبكة عصبية تلافيفية واحدة. يُقترح كاشف كائن محسّن يعتمد على الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة لاكتشاف كائنات من فئات مختلفة. يتم استخدام نهج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن مع ثلاث خرائط ميزات لاكتشاف الكائنات ذات الأحجام المختلفة. يتم إجراء العديد من التجارب للحصول على المعرفة حول العوامل التي تؤثر على المشكلة. يقترح هذا النهج توزيعًا متوازنًا لفئات مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي لحل مشكلة التوزيع غير المتوازن للبيانات. يساعد التوزيع المتوازن الجديد للبيانات الشبكة العصبية على استخراج الميزات من عدد كبير من الحالات. ستجعل العينات العديدة من الفئات المماثلة النموذج المدرّب له تأثير أفضل وقدرة تعميم بين فئات مجموعة البيانات ويحسن دقة نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة.
من أجل إجراء مقايضة جيدة بين السرعة والدقة في أداء النموذج، يتم أخذ الاختيار الدقيق لبنية النموذج وحجم الإدخال في الاعتبار. للحصول على مربعات توطين متوقعة أكثر دقة، يتم استخدام خوارزمية متوسط عدد المحسنة التي تم تطويرها مع الخوارزميات الجينية لاستخراج المراسي وزيادة دقة تحديد المواقع. تأخذ مربعات الربط الجديدة في الاعتبار مجموعة البيانات بأكملها مما يزيد من دقة جميع فئات مجموعة البيانات. تظهر النتائج أن نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن يحقق أداءً عاليًا في ست فئات (السيارة والشاحنة والشاحنة والمشاة وراكبي الدراجات والترام) من مجموعة اختبار مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي بدقة 95.3%عند دقة تقاطع 0.7 مع سرعة اكتشاف تبلغ 106 إطارًا في الثانية.
Issues also as CD.
Text in English and abstract in Arabic & English.
There are no comments on this title.