MARC details
000 -LEADER |
fixed length control field |
09506namaa22004211i 4500 |
003 - CONTROL NUMBER IDENTIFIER |
control field |
OSt |
005 - أخر تعامل مع التسجيلة |
control field |
20250504101050.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION |
fixed length control field |
250503s2024 ua a|||frm||| 000 0 eng d |
040 ## - CATALOGING SOURCE |
Original cataloguing agency |
EG-GICUC |
Language of cataloging |
eng |
Transcribing agency |
EG-GICUC |
Modifying agency |
EG-GICUC |
Description conventions |
rda |
041 0# - LANGUAGE CODE |
Language code of text/sound track or separate title |
eng |
Language code of summary or abstract |
eng |
-- |
ara |
049 ## - Acquisition Source |
Acquisition Source |
Deposit |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER |
Classification number |
005.31 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) |
Classification number |
005.31 |
Edition number |
21 |
097 ## - Degree |
Degree |
M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) |
Local Call Number |
Cai01.18.02.M.Sc.2024.Es.E |
100 0# - MAIN ENTRY--PERSONAL NAME |
Authority record control number or standard number |
Eslam Haroun Fouda, |
Preparation |
preparation. |
245 13 - TITLE STATEMENT |
Title |
An enhanced approach for fast vehicle detection using deep learning / |
Statement of responsibility, etc. |
by Eslam Haroun Fouda ; Supervision Prof. Hesham A. Hefny, Dr. Ahmed H. Mohamed. |
246 15 - VARYING FORM OF TITLE |
Title proper/short title |
طريقة محسنة للإكتشاف السريع للمركبات بإستخدام التعلم العميق / |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE |
Date of production, publication, distribution, manufacture, or copyright notice |
2024. |
300 ## - PHYSICAL DESCRIPTION |
Extent |
124 leaves : |
Other physical details |
illustrations ; |
Dimensions |
30 cm. + |
Accompanying material |
CD. |
336 ## - CONTENT TYPE |
Content type term |
text |
Source |
rda content |
337 ## - MEDIA TYPE |
Media type term |
Unmediated |
Source |
rdamedia |
338 ## - CARRIER TYPE |
Carrier type term |
volume |
Source |
rdacarrier |
502 ## - DISSERTATION NOTE |
Dissertation note |
Thesis (M.Sc)-Cairo University, 2024. |
504 ## - BIBLIOGRAPHY, ETC. NOTE |
Bibliography, etc. note |
Bibliography: pages 114-124. |
520 ## - SUMMARY, ETC. |
Summary, etc. |
Detection is a crucial stage of Advanced Driver Assistance Systems (ADAS). Upon the detection of objects, vehicles, and persons, the self-driving car can make a decision to brake, accelerate, turn right, turn left, or take the right road and the correct lane to steer to. Object Detection appears in many practical applications such as face detection, people counting, online images, security, and video surveillance, many industrial applications, and particularly in the context of intelligence transportation systems like vehicle detection for autonomous driving, calculating vehicle speed, density, volume, traffic flow rate, traveling time or congestion level. Also, it can be applied for vehicle detection and tracking, parking area monitoring, road traffic monitoring and management, etc. Object detection is the problem of localizing and classifying multiple objects of different categories on roads. Computer vision goes a long way in achieving real-time performance to save time in transportation and achieve the best precision to save human spirits and to build small models to run on different edge devices. One of the best computer vision models in the field of object detection is the YOLO algorithm which has many versions. YOLO algorithm provides a good trade-off between the speed required for autonomous driving systems and the precision required for automatic parking systems.<br/>In this thesis, for object detection, a single convolutional neural network is used. An enhanced object detector based on the YOLOv5 algorithm is proposed to detect objects of different classes. The enhanced YOLOv5 approach is used with three feature maps for detecting objects of different sizes. Several experiments are done to get knowledge about which factors affect the problem. The approach proposes a balanced distribution of the KITTI dataset classes to solve the problem of imbalanced data distribution. The new balanced data distribution helps the neural network to extract features from a large number of instances. Numerous samples of similar classes will make the trained model have a better effect and generalization ability between dataset classes and improve the YOLOV5 model precision. <br/>In order to make a good tradeoff between speed and precision in model performance, a careful choice of model structure and input size is considered. To get more precise predicted localization boxes, an enhanced K-mean algorithm evolved with genetic algorithms is used to extract anchors and increase the positioning precision. The new anchor boxes take into consideration the whole dataset which increases the precision of all dataset classes. The results show that the enhanced YOLOv5 model achieves high performance on six classes (car, van, truck, pedestrian, cyclist, and tram) of the KITTI test set with a precision of 95.3% “mean average precision at 0.7 overlapping” (mAP@0.7) with a detection speed of 106 frames per second (FPS). |
520 ## - SUMMARY, ETC. |
Summary, etc. |
يعد اكتشاف الأشياء مرحلة حاسمة في أنظمة مساعدة السائق المتقدمة. عند اكتشاف الأشياء والمركبات والأشخاص، يمكن للسيارة ذاتية القيادة اتخاذ قرار باستخدام المكابح أو زيادة السرعة أو الانعطاف يمينًا أو يسارًا أو سلوك الطريق الأيمن والمسار الصحيح للتوجيه إليه. يظهر اكتشاف الكائنات في العديد من التطبيقات العملية مثل اكتشاف الوجه، وعد الأشخاص، والصور عبر الإنترنت، والأمن، والمراقبة بالفيديو، والعديد من التطبيقات الصناعية، وخاصة في سياق أنظمة النقل الاستخباراتية مثل اكتشاف المركبات للقيادة الذاتية، وحساب سرعة السيارة وكثافتها، الحجم أو معدل تدفق حركة المرور أو وقت السفر أو مستوى الازدحام. كما يمكن تطبيقه لاكتشاف المركبات وتتبعها، ومراقبة منطقة وقوف السيارات، ومراقبة حركة المرور على الطرق وإدارتها، وما إلى ذلك. اكتشاف الكائنات هو مشكلة تحديد وتصنيف كائنات متعددة من فئات مختلفة على الطرق. تقطع الرؤية الحاسوبية شوطًا طويلًا في تحقيق الأداء في الوقت الفعلي لتوفير الوقت في النقل وتحقيق أفضل دقة لإنقاذ الأرواح البشرية وبناء نماذج صغيرة للتشغيل على أجهزة متطورة مختلفة. واحدة من أفضل نماذج الرؤية الحاسوبية في مجال اكتشاف الأشياء هي خوارزمية أنت تنظر مرة واحدة التي لها إصدارات عديدة. توفر خوارزمية أنت تنظر مرة واحدة مقايضة جيدة بين السرعة المطلوبة لأنظمة القيادة الذاتية والدقة المطلوبة لأنظمة ركن السيارات الأوتوماتيكية.<br/>في هذه الأطروحة، للكشف عن الكائنات، يتم استخدام شبكة عصبية تلافيفية واحدة. يُقترح كاشف كائن محسّن يعتمد على الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة لاكتشاف كائنات من فئات مختلفة. يتم استخدام نهج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن مع ثلاث خرائط ميزات لاكتشاف الكائنات ذات الأحجام المختلفة. يتم إجراء العديد من التجارب للحصول على المعرفة حول العوامل التي تؤثر على المشكلة. يقترح هذا النهج توزيعًا متوازنًا لفئات مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي لحل مشكلة التوزيع غير المتوازن للبيانات. يساعد التوزيع المتوازن الجديد للبيانات الشبكة العصبية على استخراج الميزات من عدد كبير من الحالات. ستجعل العينات العديدة من الفئات المماثلة النموذج المدرّب له تأثير أفضل وقدرة تعميم بين فئات مجموعة البيانات ويحسن دقة نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة.<br/><br/><br/><br/><br/>من أجل إجراء مقايضة جيدة بين السرعة والدقة في أداء النموذج، يتم أخذ الاختيار الدقيق لبنية النموذج وحجم الإدخال في الاعتبار. للحصول على مربعات توطين متوقعة أكثر دقة، يتم استخدام خوارزمية متوسط عدد المحسنة التي تم تطويرها مع الخوارزميات الجينية لاستخراج المراسي وزيادة دقة تحديد المواقع. تأخذ مربعات الربط الجديدة في الاعتبار مجموعة البيانات بأكملها مما يزيد من دقة جميع فئات مجموعة البيانات. تظهر النتائج أن نموذج الاصدار الخامس لخوارزمية أنت تنظر مرة واحدة المحسّن يحقق أداءً عاليًا في ست فئات (السيارة والشاحنة والشاحنة والمشاة وراكبي الدراجات والترام) من مجموعة اختبار مجموعة بيانات معهد تويوتا وكارازروهي التكنولجي بدقة 95.3%عند دقة تقاطع 0.7 مع سرعة اكتشاف تبلغ 106 إطارًا في الثانية. |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE |
Issues CD |
Issues also as CD. |
546 ## - LANGUAGE NOTE |
Text Language |
Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM |
Topical term or geographic name entry element |
Machine learning |
Source of heading or term |
qrmak |
653 #0 - INDEX TERM--UNCONTROLLED |
Uncontrolled term |
Object Detector |
-- |
KITTI |
-- |
YOLO |
-- |
mAP |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Hesham A. Hefny |
Relator term |
thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Ahmed H. Mohamed |
Relator term |
thesis advisor. |
900 ## - Thesis Information |
Grant date |
01-01-2024 |
Supervisory body |
Hesham A. Hefny |
-- |
Ahmed H. Mohamed |
Universities |
Cairo University |
Faculties |
Faculty of Graduate Studies for Statistical Research |
Department |
Department of Computer Science |
905 ## - Cataloger and Reviser Names |
Cataloger Name |
Shimaa |
942 ## - ADDED ENTRY ELEMENTS (KOHA) |
Source of classification or shelving scheme |
Dewey Decimal Classification |
Koha item type |
Thesis |
Edition |
21 |
Suppress in OPAC |
No |