TY - BOOK AU - Ebtesam Hussien Mohamed, AU - Osama Ismael AU - Hatem El Kadi TI - Automatic model for mood status detection U1 - 004.21 PY - 2024/// KW - Systems Analysis and Design KW - تحليل وتصميم النظم KW - Emotion classification KW - Deep learning KW - Bidirectional long KW - Sٍhort term ‎memory KW - Recurrent Neural ‎‎Network KW - Attention mechanism KW - Text classification KW - Twitter KW - Multi-label classification N1 - Thesis (Ph.D)-Cairo University, 2024; Bibliography: pages 55-61; Issues also as CD N2 - Nowadays, social networking is controlling our lives. Every passing second, millions of tweets are shared by individuals through online social media platforms like Twitter as a means to express their feelings and thoughts. Exploring and examining the emotions conveyed within social media content, along with extracting valuable insights from extensive data, categorizing it into various groups, and foreseeing end-user behavior or emotions, holds potential advantages across multiple domains such as public health, social welfare, commerce, etc. This thesis offered a deep learning-based solution for addressing multiple emotion classification challenges on Twitter. The novel proposed presents an advanced deep learning model that harnesses the strengths of combining Bidirectional Long-Short Term Memory and Recurrent Neural Network with an additional attention mechanism. Text classification stands as a subject of study within the realm of natural-language processing, aiming to categorize unstructured textual data into coherent and meaningful groups. A recurrent neural network model is the first algorithm that retains its input through internal memory, rendering it exceptionally well-suited for machine learning tasks entailing sequential data, but it is difficult to train a recurrent neural network that requires long-term memorization. In contrast, long-short-term memory models are able to grasp extensive relationships among word sequences; these models are particularly effective for text classification. Nevertheless, despite the utilization of these hybrid deep-learning techniques, the considerable volume of features essential for classification poses a significant obstacle, impeding the training process. This thesis proposes a model that applies a parallel execution of two algorithms: Bi-directional long-short-term memory and a recurrent neural network with an additional attention mechanism on the same dataset, then gets the average from both algorithm outputs. This model has been trained using the “SemEval-2018 Task1 (Twitter Data)” and “Emotions” datasets to evaluate the performance of the suggested model. The experimental outcomes demonstrated that, compared to individual SVM, RNN, or LSTM models, as well as hybrid models, it produces classification results that are more accurate and have greater F1 scores and recall. The proposed model surpasses the existing cutting-edge systems, achieving a superior accuracy score of 0.90. The proposed model provides an alternate resolution to the issue of long-term dependency within current models while also addressing the challenge of data loss with growing training data sizes. The presented model achieved improved accuracy, which was amplified further with larger training data sizes as well as an increased number of training epochs; في أيامنا هذه، أصبحت شبكات التواصل الاجتماعي تسيطر على حياتنا. في كل ثانية تمر، تتم مشاركة ملايين التغريدات من قبل الأفراد عبر منصات التواصل الاجتماعي عبر الإنترنت مثل تويتر كوسيلة للتعبير عن مشاعرهم وأفكارهم. إن استكشاف وفحص المشاعر المنقولة ضمن محتوى وسائل التواصل الاجتماعي، إلى جانب استخلاص رؤى قيمة من البيانات الشاملة، وتصنيفها إلى مجموعات مختلفة، والتنبؤ بسلوك المستخدم أو عواطفه، يحمل مزايا محتملة عبر مجالات متعددة مثل الصحة العامة والاجتماعية الرعاية الاجتماعية، والتجارة، وما إلى ذلك. قدمت هذه الأطروحة حلاً قائمًا على التعلم العميق لمعالجة تحديات تصنيف المشاعر المتعددة على تويتر. تقدم الأطروحة المقترحة نظامًا متقدمًا للتعلم العميق يسخر نقاط القوة في الجمع بين الذاكرة ثنائية الاتجاه طويلة المدى والشبكة العصبية المتكررة مع آلية انتباه إضافية. يعد تصنيف النصوص المكتوبة موضوعًا للدراسة في مجال معالجة اللغات الطبيعية، بهدف تصنيف البيانات النصية غير المنظمة إلى مجموعات متماسكة وذات معنى. نموذج الشبكة العصبية المتكررة هو الخوارزمية الأولى التي تحتفظ بمدخلاتها من خلال الذاكرة الداخلية، مما يجعلها مناسبة بشكل استثنائي لمهام التعلم الآلي التي تتطلب بيانات متسلسلة، ولكن من الصعب تدريب شبكة عصبية متكررة تتطلب حفظًا طويل الأمد. في المقابل، فإن نماذج الذاكرة طويلة المدى قصيرة المدى قادرة على فهم العلاقات الواسعة بين تسلسل الكلمات؛ هذه النماذج فعالة بشكل خاص لتصنيف النص. ومع ذلك، على الرغم من استخدام تقنيات التعلم العميق الهجينة هذه، فإن الحجم الكبير للميزات الأساسية للتصنيف يشكل عائقًا كبيرًا، مما يعيق عملية التدريب. تقترح هذه الأطروحة نموذجًا يطبق التنفيذ المتوازي لخوارزميتين: الذاكرة ثنائية الاتجاه طويلة المدى وشبكة عصبية متكررة مع آلية انتباه إضافية على نفس مجموعة البيانات، ثم الحصول على المتوسط من مخرجات الخوارزمية.‎ تم تدريب هذا النموذج باستخدام مجموعة البيانات "SemEval 2018 Task1 (Twitter Data)” ومجموعة البيانات "Emotions" لتقييم أداء النموذج المقترح. أظهرت النتائج التجريبية أنه، بالمقارنة مع نماذج SVM أو RNN أو LSTM الفردية، بالإضافة إلى النماذج الهجينة، فإنها تنتج نتائج تصنيف أكثر دقة ولها درجات F1 و recall أكبر. النموذج المتقدم يتفوق على الأنظمة المتطورة الحالية، ويحقق درجة دقة فائقة تبلغ 0.90 يوفر النموذج المقترح حلاً بديلاً لمسألة التبعية طويلة المدى ضمن النماذج الحالية بينما يعالج أيضًا التحدي المتمثل في فقدان البيانات مع تزايد أحجام بيانات التدريب. حقق النموذج المقدم دقة محسنة، والتي تم تضخمها بشكل أكبر مع زيادة أحجام بيانات التدريب بالإضافة إلى زيادة عدد فترات التدريب ER -