TY  - BOOK
AU  - Nada Ayman Mostafa Shorim,
AU  - Mohammad El-Ramly
AU  - Hanaa Mobarz
TI  - Enhancing text-based design  pattern recommender
U1  - 005.6 
PY  - 2024///
KW  - Programming
KW  - Ø§ÙØ¨Ø±ÙØ¬Ø©
KW  - Design Pattern
KW  - Software Engineering
KW  - NLP
KW  - Machine Learning
N1  - Thesis (M.Sc)-Cairo University, 2024; Bibliography: pages 54-57; Issues also as CD
N2  - Design patterns enhance software engineering practices by improving software quality and accelerating development schedules. Selecting the right design pattern is critical, as an inappropriate choice can lead to code that is difficult to maintain. Conversely, a well-selected design pattern enhances software quality, simplifying maintenance, modification, and scalability. However, choosing the appropriate design pattern from textual descriptions poses a significant challenge, requiring deep knowledge of their functionalities and attributes. Existing approaches often lack accuracy or fail to handle diverse problem scenarios, limiting their practical applicability. To address this, we developed a recommendation system that applies Natural Language Processing and Machine Learning through text classification. The system was trained on data from the GOF book and evaluated using the largest dataset available including 95 problem scenarios from diverse sources. Two approaches were evaluated for design pattern selection. The first approach uses only the design patternsâ descriptions, while the second incorporates category information to narrow the search space before identifying the most suitable design pattern. Doc2Vec experiments showed 52.63% accuracy for the sequential approach, outperforming 22.1% for the single approach, demonstrating the effectiveness of sequential approach. Next, NLP and ML techniques are utilized. The approach included preprocessing steps such as stop word removal, tokenization, and stemming, applied to design pattern categories, design patterns, and problem scenarios. Feature extraction techniques such as Bag of Words, TF-IDF, Part of Speech, and Bigrams were then applied, enabling ML models to make predictions. The first approach achieved 72.63% accuracy using random forest with BoW and TF-IDF features, as well as logistic regression with POS and BoW features. The second approach improved accuracy to 74.74% by incorporating category-level classification followed by design pattern-level classification. We also evaluated generative AI models such as ChatGPT, Bard, and Gemini. ChatGPT achieved 88.42% accuracy, outperforming traditional approaches. Further testing on eight unseen cases yielded 75% accuracy for both our approach and ChatGPT, while Gemini achieved 62.5%. This work advances the field with a larger dataset, enhanced methods, and superior results, providing both academic and practical value. The second approach boosted accuracy by simplifying complexity and outperforming the first; ØªØ¹Ø²Ø² Ø§ÙØ£ÙÙØ§Ø· Ø§ÙØªØµÙÙÙÙØ© ÙÙØ§Ø±Ø³Ø§Øª ÙÙØ¯Ø³Ø© Ø§ÙØ¨Ø±ÙØ¬ÙØ§Øª ÙÙ Ø®ÙØ§Ù ØªØ­Ø³ÙÙ Ø¬ÙØ¯Ø© Ø§ÙØ¨Ø±ÙØ¬ÙØ§Øª ÙØªØ³Ø±ÙØ¹ Ø¬Ø¯Ø§ÙÙ Ø§ÙØªØ·ÙÙØ±. ÙØ¹Ø¯ Ø§Ø®ØªÙØ§Ø± Ø§ÙÙÙØ· Ø§ÙØªØµÙÙÙÙ Ø§ÙÙÙØ§Ø³Ø¨ Ø£ÙØ±ÙØ§ Ø¨Ø§ÙØº Ø§ÙØ£ÙÙÙØ©Ø Ø­ÙØ« ÙÙÙÙ Ø£Ù ÙØ¤Ø¯Ù Ø§ÙØ§Ø®ØªÙØ§Ø± ØºÙØ± Ø§ÙÙÙØ§Ø³Ø¨ Ø¥ÙÙ ÙÙØ¯ ÙØµØ¹Ø¨ ØµÙØ§ÙØªÙ. ÙØ¹ÙÙ Ø§ÙØ¹ÙØ³Ø ÙØ¥Ù Ø§ÙØ§Ø®ØªÙØ§Ø± Ø§ÙÙØ¯Ø±ÙØ³ ÙÙÙÙØ· Ø§ÙØªØµÙÙÙÙ ÙØ­Ø³Ù Ø¬ÙØ¯Ø© Ø§ÙØ¨Ø±ÙØ¬ÙØ§ØªØ ÙÙØ§ ÙØ³ÙÙ ØµÙØ§ÙØªÙØ§ ÙØªØ¹Ø¯ÙÙÙØ§ ÙØªÙØ³ÙØ¹ÙØ§. ÙÙØ¹ Ø°ÙÙØ ÙØ¥Ù Ø§Ø®ØªÙØ§Ø± Ø§ÙÙÙØ· Ø§ÙØªØµÙÙÙÙ Ø§ÙÙÙØ§Ø³Ø¨ ÙÙ Ø§ÙØ£ÙØµØ§Ù Ø§ÙÙØµÙØ© ÙÙØ«Ù ØªØ­Ø¯ÙÙØ§ ÙØ¨ÙØ±ÙØ§Ø ÙÙØªØ·ÙØ¨ ÙØ¹Ø±ÙØ© Ø¹ÙÙÙØ© Ø¨ÙØ¸Ø§Ø¦ÙÙØ§ ÙØ®ØµØ§Ø¦ØµÙØ§. ØºØ§ÙØ¨ÙØ§ ÙØ§ ØªÙØªÙØ± Ø§ÙØ£Ø³Ø§ÙÙØ¨ Ø§ÙØ­Ø§ÙÙØ© Ø¥ÙÙ Ø§ÙØ¯ÙØ© Ø£Ù ØªÙØ´Ù ÙÙ Ø§ÙØªØ¹Ø§ÙÙ ÙØ¹ Ø³ÙÙØ§Ø±ÙÙÙØ§Øª Ø§ÙÙØ´ÙÙØ§Øª Ø§ÙÙØªÙÙØ¹Ø©Ø ÙÙØ§ ÙØ­Ø¯ ÙÙ ÙØ§Ø¨ÙÙØªÙØ§ ÙÙØªØ·Ø¨ÙÙ Ø§ÙØ¹ÙÙÙ. ÙÙØ¹Ø§ÙØ¬Ø© Ø°ÙÙØ ÙÙÙØ§ Ø¨ØªØ·ÙÙØ± ÙØ¸Ø§Ù ØªÙØµÙØ© ÙØ¹ØªÙØ¯ Ø¹ÙÙ ÙØ¹Ø§ÙØ¬Ø© Ø§ÙÙØºØ© Ø§ÙØ·Ø¨ÙØ¹ÙØ© ÙØ§ÙØªØ¹ÙÙ Ø§ÙØ¢ÙÙ ÙÙ Ø®ÙØ§Ù ØªØµÙÙÙ Ø§ÙÙØµÙØµ. ØªÙ ØªØ¯Ø±ÙØ¨ Ø§ÙÙØ¸Ø§Ù Ø¹ÙÙ Ø¨ÙØ§ÙØ§Øª ÙÙ ÙØªØ§Ø¨ GOF ÙØªÙÙÙÙÙ Ø¨Ø§Ø³ØªØ®Ø¯Ø§Ù Ø£ÙØ¨Ø± ÙØ¬ÙÙØ¹Ø© Ø¨ÙØ§ÙØ§Øª ÙØªØ§Ø­Ø©Ø Ø¨ÙØ§ ÙÙ Ø°ÙÙ 95 Ø³ÙÙØ§Ø±ÙÙ ÙØ´ÙÙØ© ÙÙ ÙØµØ§Ø¯Ø± ÙØªÙÙØ¹Ø©. ØªÙ ØªÙÙÙÙ ÙÙØ¬ÙÙ ÙØ§Ø®ØªÙØ§Ø± Ø§ÙØ£ÙÙØ§Ø· Ø§ÙØªØµÙÙÙÙØ©. ÙØ¹ØªÙØ¯ Ø§ÙÙÙØ¬ Ø§ÙØ£ÙÙ Ø¹ÙÙ Ø£ÙØµØ§Ù Ø§ÙØ£ÙÙØ§Ø· Ø§ÙØªØµÙÙÙÙØ© ÙÙØ·Ø Ø¨ÙÙÙØ§ ÙØ³ØªØ®Ø¯Ù Ø§ÙÙÙØ¬ Ø§ÙØ«Ø§ÙÙ ÙØ¹ÙÙÙØ§Øª Ø§ÙÙØ¦Ø© ÙØªØ¶ÙÙÙ ÙØ·Ø§Ù Ø§ÙØ¨Ø­Ø« ÙØ¨Ù ØªØ­Ø¯ÙØ¯ Ø§ÙÙÙØ· Ø§ÙØªØµÙÙÙÙ Ø§ÙØ£ÙØ³Ø¨. Ø£Ø¸ÙØ±Øª ØªØ¬Ø§Ø±Ø¨ Doc2Vec Ø£Ù Ø§ÙÙÙØ¬ Ø§ÙØªØ³ÙØ³ÙÙ Ø­ÙÙ Ø¯ÙØ© Ø¨ÙØºØª 52.63%Ø ÙØªÙÙÙÙØ§ Ø¹ÙÙ Ø§ÙÙÙØ¬ Ø§ÙÙØ±Ø¯Ù Ø§ÙØ°Ù Ø³Ø¬Ù 22.1%Ø ÙÙØ§ ÙÙØ¶Ø­ ÙØ¹Ø§ÙÙØ© Ø§ÙÙÙØ¬ Ø§ÙØªØ³ÙØ³ÙÙ. Ø¨Ø¹Ø¯ Ø°ÙÙØ ØªÙ Ø§Ø³ØªØ®Ø¯Ø§Ù ØªÙÙÙØ§Øª ÙØ¹Ø§ÙØ¬Ø© Ø§ÙÙØºØ© Ø§ÙØ·Ø¨ÙØ¹ÙØ© ÙØ§ÙØªØ¹ÙÙ Ø§ÙØ¢ÙÙ. ØªØ¶ÙÙØª Ø§ÙØ·Ø±ÙÙØ© Ø®Ø·ÙØ§Øª Ø§ÙÙØ¹Ø§ÙØ¬Ø© Ø§ÙÙØ³Ø¨ÙØ© ÙØ«Ù Ø¥Ø²Ø§ÙØ© Ø§ÙÙÙÙØ§Øª Ø§ÙØ´Ø§Ø¦Ø¹Ø©Ø ÙØ§ÙØªØ¬Ø²Ø¦Ø©Ø ÙØ§ÙØ¬Ø°Ø± Ø§ÙØµØ±ÙÙØ ÙØ§ÙØªÙ ØªÙ ØªØ·Ø¨ÙÙÙØ§ Ø¹ÙÙ Ø£ÙØµØ§Ù Ø§ÙÙØ¦Ø§Øª ÙØ§ÙØ£ÙÙØ§Ø· Ø§ÙØªØµÙÙÙÙØ© ÙØ³ÙÙØ§Ø±ÙÙÙØ§Øª Ø§ÙÙØ´ÙÙØ§Øª. ØªÙ ØªØ·Ø¨ÙÙ ØªÙÙÙØ§Øª Ø§Ø³ØªØ®Ø±Ø§Ø¬ Ø§ÙÙÙØ²Ø§ØªØ ÙØ«Ù Ø­ÙÙØ¨Ø© Ø§ÙÙÙÙØ§Øª (BoW)Ø ÙØªÙØ±Ø§Ø± Ø§ÙÙØµØ·ÙØ­ Ø§ÙØ¹ÙØ³Ù (TF-IDF)Ø ÙØ£Ø¬Ø²Ø§Ø¡ Ø§ÙÙÙØ§Ù (POS)Ø ÙØ«ÙØ§Ø¦ÙØ§Øª Ø§ÙÙÙÙØ§Øª (Bigrams)Ø ÙÙØ§ ÙÙÙÙ ÙÙØ§Ø°Ø¬ Ø§ÙØªØ¹ÙÙ Ø§ÙØ¢ÙÙ ÙÙ Ø¥Ø¬Ø±Ø§Ø¡ Ø§ÙØªÙØ¨Ø¤Ø§Øª. Ø­ÙÙ Ø§ÙÙÙØ¬ Ø§ÙØ£ÙÙ Ø¯ÙØ© Ø¨ÙØºØª 72.63% Ø¨Ø§Ø³ØªØ®Ø¯Ø§Ù ØºØ§Ø¨Ø© Ø¹Ø´ÙØ§Ø¦ÙØ© ÙØ¹ ÙÙØ²Ø§Øª BoW ÙTF-IDFØ Ø¨Ø§ÙØ¥Ø¶Ø§ÙØ© Ø¥ÙÙ Ø§ÙØ§ÙØ­Ø¯Ø§Ø± Ø§ÙÙÙØ¬Ø³ØªÙ ÙØ¹ ÙÙØ²Ø§Øª POS ÙBoW. Ø£ÙØ§ Ø§ÙÙÙØ¬ Ø§ÙØ«Ø§ÙÙ ÙÙØ¯ Ø­Ø³ÙÙ Ø§ÙØ¯ÙØ© Ø¥ÙÙ 74.74% ÙÙ Ø®ÙØ§Ù Ø¯ÙØ¬ Ø§ÙØªØµÙÙÙ Ø¹ÙÙ ÙØ³ØªÙÙ Ø§ÙÙØ¦Ø© Ø£ÙÙØ§ÙØ Ø«Ù Ø§ÙØªØµÙÙÙ Ø¹ÙÙ ÙØ³ØªÙÙ Ø§ÙØ£ÙÙØ§Ø· Ø§ÙØªØµÙÙÙÙØ©. ØªÙ Ø£ÙØ¶ÙØ§ ØªÙÙÙÙ ÙÙØ§Ø°Ø¬ Ø§ÙØ°ÙØ§Ø¡ Ø§ÙØ§ØµØ·ÙØ§Ø¹Ù Ø§ÙØªÙÙÙØ¯ÙØ ÙØ«Ù ChatGPT ÙBard ÙGemini. Ø­ÙÙ ChatGPT Ø¯ÙØ© Ø¨ÙØºØª 88.42%Ø ÙØªÙÙÙÙØ§ Ø¹ÙÙ Ø§ÙØ£Ø³Ø§ÙÙØ¨ Ø§ÙØªÙÙÙØ¯ÙØ©. ÙØ£Ø¸ÙØ±Øª Ø§ÙØ§Ø®ØªØ¨Ø§Ø±Ø§Øª Ø§ÙØ¥Ø¶Ø§ÙÙØ© Ø¹ÙÙ Ø«ÙØ§ÙÙ Ø­Ø§ÙØ§Øª Ø¬Ø¯ÙØ¯Ø© ÙÙ ØªÙØ¹Ø±Ø¶ Ø¹ÙÙ ÙÙØ§Ø°Ø¬ Ø§ÙØ°ÙØ§Ø¡ Ø§ÙØ§ØµØ·ÙØ§Ø¹Ù ÙÙ ÙØ¨Ù Ø¯ÙØ© Ø¨ÙØºØª 75% ÙÙÙ ÙÙ ÙÙØ¬ÙØ§ ÙChatGPTØ Ø¨ÙÙÙØ§ Ø³Ø¬Ù Gemini ÙØ³Ø¨Ø© 62.5%.. ÙØ³Ø§ÙÙ ÙØ°Ø§ Ø§ÙØ¹ÙÙ ÙÙ ØªØ·ÙÙØ± Ø§ÙÙØ¬Ø§Ù ÙÙ Ø®ÙØ§Ù Ø§ÙØ§Ø³ØªÙØ§Ø¯Ø© ÙÙ ÙØ¬ÙÙØ¹Ø© Ø¨ÙØ§ÙØ§Øª Ø£ÙØ¨Ø±Ø ÙØªØ­Ø³ÙÙ Ø§ÙØ£Ø³Ø§ÙÙØ¨Ø ÙØªØ­ÙÙÙ ÙØªØ§Ø¦Ø¬ ÙØªÙØ¯ÙØ©Ø ÙÙØ§ ÙÙÙØ± ÙÙÙØ© Ø£ÙØ§Ø¯ÙÙÙØ© ÙØ¹ÙÙÙØ©. ÙÙØ¯ Ø£Ø¯Ù Ø§ÙÙÙØ¬ Ø§ÙØ«Ø§ÙÙ Ø¥ÙÙ ØªØ­Ø³ÙÙ Ø§ÙØ¯ÙØ© ÙÙ Ø®ÙØ§Ù ØªØ¨Ø³ÙØ· Ø§ÙØªØ¹ÙÙØ¯ ÙØªÙÙÙÙ Ø¹ÙÙ Ø§ÙÙÙØ¬ Ø§ÙØ£ÙÙ
ER  -