000 09506namaa22004211i 4500
003 OSt
005 20250504101050.0
008 250503s2024 ua a|||frm||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a005.31
092 _a005.31
_221
097 _aM.Sc
099 _aCai01.18.02.M.Sc.2024.Es.E
100 0 _aEslam Haroun Fouda,
_epreparation.
245 1 3 _aAn enhanced approach for fast vehicle detection using deep learning /
_cby Eslam Haroun Fouda ; Supervision Prof. Hesham A. Hefny, Dr. Ahmed H. Mohamed.
246 1 5 _aطريقة محسنة للإكتشاف السريع للمركبات بإستخدام التعلم العميق /
264 0 _c2024.
300 _a124 leaves :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (M.Sc)-Cairo University, 2024.
504 _aBibliography: pages 114-124.
520 _aDetection is a crucial stage of Advanced Driver Assistance Systems (ADAS). Upon the detection of objects, vehicles, and persons, the self-driving car can make a decision to brake, accelerate, turn right, turn left, or take the right road and the correct lane to steer to. Object Detection appears in many practical applications such as face detection, people counting, online images, security, and video surveillance, many industrial applications, and particularly in the context of intelligence transportation systems like vehicle detection for autonomous driving, calculating vehicle speed, density, volume, traffic flow rate, traveling time or congestion level. Also, it can be applied for vehicle detection and tracking, parking area monitoring, road traffic monitoring and management, etc. Object detection is the problem of localizing and classifying multiple objects of different categories on roads. Computer vision goes a long way in achieving real-time performance to save time in transportation and achieve the best precision to save human spirits and to build small models to run on different edge devices. One of the best computer vision models in the field of object detection is the YOLO algorithm which has many versions. YOLO algorithm provides a good trade-off between the speed required for autonomous driving systems and the precision required for automatic parking systems. In this thesis, for object detection, a single convolutional neural network is used. An enhanced object detector based on the YOLOv5 algorithm is proposed to detect objects of different classes. The enhanced YOLOv5 approach is used with three feature maps for detecting objects of different sizes. Several experiments are done to get knowledge about which factors affect the problem. The approach proposes a balanced distribution of the KITTI dataset classes to solve the problem of imbalanced data distribution. The new balanced data distribution helps the neural network to extract features from a large number of instances. Numerous samples of similar classes will make the trained model have a better effect and generalization ability between dataset classes and improve the YOLOV5 model precision. In order to make a good tradeoff between speed and precision in model performance, a careful choice of model structure and input size is considered. To get more precise predicted localization boxes, an enhanced K-mean algorithm evolved with genetic algorithms is used to extract anchors and increase the positioning precision. The new anchor boxes take into consideration the whole dataset which increases the precision of all dataset classes. The results show that the enhanced YOLOv5 model achieves high performance on six classes (car, van, truck, pedestrian, cyclist, and tram) of the KITTI test set with a precision of 95.3% “mean average precision at 0.7 overlapping” (mAP@0.7) with a detection speed of 106 frames per second (FPS).
520 _aيعد اكتشاف الأشياء مرحلة حاسمة في أنظمة مساعدة السائق المتقدمة. عند اكتشاف الأشياء والمركبات والأشخاص، يمكن للسيارة ذاتية القيادة اتخاذ قرار باستخدام المكابح أو زيادة السرعة أو الانعطاف يمينًا أو يسارًا أو سلوك الطريق الأيمن والمسار الصحيح للتوجيه إليه. يظهر اكتشاف الكائنات في العديد من التطبيقات العملية مثل اكتشاف الوجه، وعد الأشخاص، والصور عبر الإنترنت، والأمن، والمراقبة بالفيديو، والعديد من التطبيقات الصناعية، وخاصة في سياق أنظمة النقل الاستخباراتية مثل اكتشاف المركبات للقيادة الذاتية، وحساب سرعة السيارة وكثافتها، الحجم أو معدل تدفق حركة المرور أو وقت السفر أو مستوى الازدحام. كما يمكن تطبيقه لاكتشاف المركبات وتتبعها، ومراقبة منطقة وقوف السيارات، ومراقبة حركة المرور على الطرق وإدارتها، وما إلى ذلك. اكتشاف الكائنات هو مشكلة تحديد وتصنيف كائنات متعددة من فئات مختلفة على الطرق. تقطع الرؤية الحاسوبية شوطًا طويلًا في تحقيق الأداء في الوقت الفعلي لتوفير الوقت في النقل وتحقيق أفضل دقة لإنقاذ الأرواح البشرية وبناء نماذج صغيرة للتشغيل على أجهزة متطورة مختلفة. واحدة من أفضل نماذج الرؤية الحاسوبية في مجال اكتشاف الأشياء هي خوارزمية أنت تنظر مرة واحدة التي لها إصدارات عديدة. توفر خوارزمية أنت تنظر مرة واحدة مقايضة جيدة بين السرعة المطلوبة لأنظمة القيادة الذاتية والدقة المطلوبة لأنظمة ركن السيارات الأوتوماتيكية. في هذه الأطروحة، للكشف عن الكائنات، يتم استخدام شبكة عصبية تلافيفية واحدة. يُقترح كاشف كائن محسّن يعتمد على الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة لاكتشاف كائنات من فئات مختلفة. يتم استخدام نهج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن مع ثلاث خرائط ميزات لاكتشاف الكائنات ذات الأحجام المختلفة. يتم إجراء العديد من التجارب للحصول على المعرفة حول العوامل التي تؤثر على المشكلة. يقترح هذا النهج توزيعًا متوازنًا لفئات مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي لحل مشكلة التوزيع غير المتوازن للبيانات. يساعد التوزيع المتوازن الجديد للبيانات الشبكة العصبية على استخراج الميزات من عدد كبير من الحالات. ستجعل العينات العديدة من الفئات المماثلة النموذج المدرّب له تأثير أفضل وقدرة تعميم بين فئات مجموعة البيانات ويحسن دقة نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة. من أجل إجراء مقايضة جيدة بين السرعة والدقة في أداء النموذج، يتم أخذ الاختيار الدقيق لبنية النموذج وحجم الإدخال في الاعتبار. للحصول على مربعات توطين متوقعة أكثر دقة، يتم استخدام خوارزمية متوسط عدد المحسنة التي تم تطويرها مع الخوارزميات الجينية لاستخراج المراسي وزيادة دقة تحديد المواقع. تأخذ مربعات الربط الجديدة في الاعتبار مجموعة البيانات بأكملها مما يزيد من دقة جميع فئات مجموعة البيانات. تظهر النتائج أن نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن يحقق أداءً عاليًا في ست فئات (السيارة والشاحنة والشاحنة والمشاة وراكبي الدراجات والترام) من مجموعة اختبار مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي بدقة 95.3%عند دقة تقاطع 0.7 مع سرعة اكتشاف تبلغ 106 إطارًا في الثانية.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 7 _aMachine learning
_2qrmak
653 0 _aObject Detector
_aKITTI
_aYOLO
_amAP
700 0 _aHesham A. Hefny
_ethesis advisor.
700 0 _aAhmed H. Mohamed
_ethesis advisor.
900 _b01-01-2024
_cHesham A. Hefny
_cAhmed H. Mohamed
_UCairo University
_FFaculty of Graduate Studies for Statistical Research
_DDepartment of Computer Science
905 _aShimaa
942 _2ddc
_cTH
_e21
_n0
999 _c171823