MARC details
| 000 -LEADER |
| fixed length control field |
08250namaa22004331i 4500 |
| 003 - CONTROL NUMBER IDENTIFIER |
| control field |
OSt |
| 005 - أخر تعامل مع التسجيلة |
| control field |
20251015120907.0 |
| 008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION |
| fixed length control field |
251007s2024 ua a|||frm||| 000 0 eng d |
| 040 ## - CATALOGING SOURCE |
| Original cataloguing agency |
EG-GICUC |
| Language of cataloging |
eng |
| Transcribing agency |
EG-GICUC |
| Modifying agency |
EG-GICUC |
| Description conventions |
rda |
| 041 0# - LANGUAGE CODE |
| Language code of text/sound track or separate title |
eng |
| Language code of summary or abstract |
eng |
| -- |
ara |
| 049 ## - Acquisition Source |
| Acquisition Source |
Deposit |
| 082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER |
| Classification number |
005.6 |
| 092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) |
| Classification number |
005.6 |
| Edition number |
21 |
| 097 ## - Degree |
| Degree |
M.Sc |
| 099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) |
| Local Call Number |
Cai01.20.05.M.Sc.2024.Na.E |
| 100 0# - MAIN ENTRY--PERSONAL NAME |
| Authority record control number or standard number |
Nada Ayman Mostafa Shorim, |
| Preparation |
preparation. |
| 245 10 - TITLE STATEMENT |
| Title |
Enhancing text-based design pattern recommender / |
| Statement of responsibility, etc. |
by Nada Ayman Mostafa Shorim ; Supervision Prof. Mohammad El-Ramly, Dr. Hanaa Mobarz. |
| 246 15 - VARYING FORM OF TITLE |
| Title proper/short title |
تحسين توصية نمط التصميم القائم على النص |
| 264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE |
| Date of production, publication, distribution, manufacture, or copyright notice |
2024. |
| 300 ## - PHYSICAL DESCRIPTION |
| Extent |
57 Leaves : |
| Other physical details |
illustrations ; |
| Dimensions |
30 cm. + |
| Accompanying material |
CD. |
| 336 ## - CONTENT TYPE |
| Content type term |
text |
| Source |
rda content |
| 337 ## - MEDIA TYPE |
| Media type term |
Unmediated |
| Source |
rdamedia |
| 338 ## - CARRIER TYPE |
| Carrier type term |
volume |
| Source |
rdacarrier |
| 502 ## - DISSERTATION NOTE |
| Dissertation note |
Thesis (M.Sc)-Cairo University, 2024. |
| 504 ## - BIBLIOGRAPHY, ETC. NOTE |
| Bibliography, etc. note |
Bibliography: pages 54-57. |
| 520 #3 - SUMMARY, ETC. |
| Summary, etc. |
Design patterns enhance software engineering practices by improving software quality and accelerating development schedules. Selecting the right design pattern is critical, as an inappropriate choice can lead to code that is difficult to maintain. Conversely, a well-selected design pattern enhances software quality, simplifying maintenance, modification, and scalability. However, choosing the appropriate design pattern from textual descriptions poses a significant challenge, requiring deep knowledge of their functionalities and attributes. Existing approaches often lack accuracy or fail to handle diverse problem scenarios, limiting their practical applicability. To address this, we developed a recommendation system that applies Natural Language Processing and Machine Learning through text classification. The system was trained on data from the GOF book and evaluated using the largest dataset available including 95 problem scenarios from diverse sources. Two approaches were evaluated for design pattern selection. The first approach uses only the design patterns’ descriptions, while the second incorporates category information to narrow the search space before identifying the most suitable design pattern. Doc2Vec experiments showed 52.63% accuracy for the sequential approach, outperforming 22.1% for the single approach, demonstrating the effectiveness of sequential approach. Next, NLP and ML techniques are utilized. The approach included preprocessing steps such as stop word removal, tokenization, and stemming, applied to design pattern categories, design patterns, and problem scenarios. Feature extraction techniques such as Bag of Words, TF-IDF, Part of Speech, and Bigrams were then applied, enabling ML models to make predictions. The first approach achieved 72.63% accuracy using random forest with BoW and TF-IDF features, as well as logistic regression with POS and BoW features. The second approach improved accuracy to 74.74% by incorporating category-level classification followed by design pattern-level classification. We also evaluated generative AI models such as ChatGPT, Bard, and Gemini. ChatGPT achieved 88.42% accuracy, outperforming traditional approaches. Further testing on eight unseen cases yielded 75% accuracy for both our approach and ChatGPT, while Gemini achieved 62.5%. This work advances the field with a larger dataset, enhanced methods, and superior results, providing both academic and practical value. The second approach boosted accuracy by simplifying complexity and outperforming the first. |
| 520 #3 - SUMMARY, ETC. |
| Summary, etc. |
تعزز الأنماط التصميمية ممارسات هندسة البرمجيات من خلال تحسين جودة البرمجيات وتسريع جداول التطوير. يعد اختيار النمط التصميمي المناسب أمرًا بالغ الأهمية، حيث يمكن أن يؤدي الاختيار غير المناسب إلى كود يصعب صيانته. وعلى العكس، فإن الاختيار المدروس للنمط التصميمي يحسن جودة البرمجيات، مما يسهل صيانتها وتعديلها وتوسيعها. ومع ذلك، فإن اختيار النمط التصميمي المناسب من الأوصاف النصية يمثل تحديًا كبيرًا، ويتطلب معرفة عميقة بوظائفها وخصائصها. غالبًا ما تفتقر الأساليب الحالية إلى الدقة أو تفشل في التعامل مع سيناريوهات المشكلات المتنوعة، مما يحد من قابليتها للتطبيق العملي. لمعالجة ذلك، قمنا بتطوير نظام توصية يعتمد على معالجة اللغة الطبيعية والتعلم الآلي من خلال تصنيف النصوص. تم تدريب النظام على بيانات من كتاب GOF وتقييمه باستخدام أكبر مجموعة بيانات متاحة، بما في ذلك 95 سيناريو مشكلة من مصادر متنوعة. تم تقييم نهجين لاختيار الأنماط التصميمية. يعتمد النهج الأول على أوصاف الأنماط التصميمية فقط، بينما يستخدم النهج الثاني معلومات الفئة لتضييق نطاق البحث قبل تحديد النمط التصميمي الأنسب. أظهرت تجارب Doc2Vec أن النهج التسلسلي حقق دقة بلغت 52.63%، متفوقًا على النهج الفردي الذي سجل 22.1%، مما يوضح فعالية النهج التسلسلي. بعد ذلك، تم استخدام تقنيات معالجة اللغة الطبيعية والتعلم الآلي. تضمنت الطريقة خطوات المعالجة المسبقة مثل إزالة الكلمات الشائعة، والتجزئة، والجذر الصرفي، والتي تم تطبيقها على أوصاف الفئات والأنماط التصميمية وسيناريوهات المشكلات. تم تطبيق تقنيات استخراج الميزات، مثل حقيبة الكلمات (BoW)، وتكرار المصطلح العكسي (TF-IDF)، وأجزاء الكلام (POS)، وثنائيات الكلمات (Bigrams)، مما مكّن نماذج التعلم الآلي من إجراء التنبؤات. حقق النهج الأول دقة بلغت 72.63% باستخدام غابة عشوائية مع ميزات BoW وTF-IDF، بالإضافة إلى الانحدار اللوجستي مع ميزات POS وBoW. أما النهج الثاني فقد حسّن الدقة إلى 74.74% من خلال دمج التصنيف على مستوى الفئة أولاً، ثم التصنيف على مستوى الأنماط التصميمية. تم أيضًا تقييم نماذج الذكاء الاصطناعي التوليدي، مثل ChatGPT وBard وGemini. حقق ChatGPT دقة بلغت 88.42%، متفوقًا على الأساليب التقليدية. وأظهرت الاختبارات الإضافية على ثماني حالات جديدة لم تُعرض على نماذج الذكاء الاصطناعي من قبل دقة بلغت 75% لكل من نهجنا وChatGPT، بينما سجل Gemini نسبة 62.5%.. يساهم هذا العمل في تطوير المجال من خلال الاستفادة من مجموعة بيانات أكبر، وتحسين الأساليب، وتحقيق نتائج متقدمة، مما يوفر قيمة أكاديمية وعملية. وقد أدى النهج الثاني إلى تحسين الدقة من خلال تبسيط التعقيد وتفوقه على النهج الأول. |
| 530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE |
| Issues CD |
Issues also as CD. |
| 546 ## - LANGUAGE NOTE |
| Text Language |
Text in English and abstract in Arabic & English. |
| 650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM |
| Topical term or geographic name entry element |
Programming |
| 650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM |
| Topical term or geographic name entry element |
البرمجة |
| 653 #1 - INDEX TERM--UNCONTROLLED |
| Uncontrolled term |
Design Pattern |
| -- |
Software Engineering, |
| -- |
NLP |
| -- |
Machine Learning |
| 700 0# - ADDED ENTRY--PERSONAL NAME |
| Personal name |
Mohammad El-Ramly |
| Relator term |
thesis advisor. |
| 700 0# - ADDED ENTRY--PERSONAL NAME |
| Personal name |
Hanaa Mobarz |
| Relator term |
thesis advisor. |
| 900 ## - Thesis Information |
| Grant date |
01-01-2024 |
| Supervisory body |
Mohammad El-Ramly |
| -- |
Hanaa Mobarz |
| Universities |
Cairo University |
| Faculties |
Faculty of Computers and Artificial Intelligence |
| Department |
Department of Computer Sciences |
| 905 ## - Cataloger and Reviser Names |
| Cataloger Name |
Shimaa |
| Reviser Names |
Eman Ghareb |
| 942 ## - ADDED ENTRY ELEMENTS (KOHA) |
| Source of classification or shelving scheme |
Dewey Decimal Classification |
| Koha item type |
Thesis |
| Edition |
21 |
| Suppress in OPAC |
No |