TY - BOOK AU - Bassma Mohammed Mousa Othman, AU - Mohamed Hassan Haggag AU - Mervat Gheith TI - Social media mining approach for business intelligence U1 - 004 PY - 2025/// KW - Computer Science KW - علوم الحاسب KW - NLP KW - Social Media KW - Sentiment Analysis KW - Sarcasm Detection KW - GCN KW - Neural Networks KW - معالجة اللغة الطبيعية KW - وسائل التواصل الاجتماعي N1 - Thesis (Ph.D)-Cairo University, 2025; Bibliography: pages 121-131; Issues also as CD N2 - Social media is undoubtedly a powerful tool which involved in all life aspects nowadays. To deal with it, it needs the incorporation of cutting-edge Natural Language Processing (NLP) technique especially when it comes to measuring the great effect of social media on Business Intelligence (BI) systems. To help business leaders in decision making despite of the ambiguous world of social media, a great effort in detecting and measuring the effect of sarcasm on sentiment analysis is introduced in this work with specific emphasis on the detection of Arabic sarcasm. The main objective is to present two novel approaches: AraSenti-MARBERT- GCN and AraSenti-MARBERT-Dynamic GCN, which overcome the distinctive linguistic and contextual obstacles inherent in Arabic texts. These models use MARBERT embeddings for encoding dense contextual representations, AraSenti lexicon for scoring sentiment, and graph-based models—Graph Convolutional Networks (GCNs) and Dynamic GCNs—for encoding syntactic dependencies and semantic relationships. Arabic sarcasm detection is particularly challenging because of its morphological complexity, dialectical diversity, and cultural dependence. Sarcasm is a source of major confusion for conventional sentiment analysis systems, and specialized mechanisms are required to properly encode text data. The suggested approaches improve sarcasm detection by combining AraSenti's sentiment scores and MARBERT's contextual embeddings with graph-based XIII representations that encode word relationships. While AraSenti-MARBERT- GCN employs static graphs to encode fixed syntactic dependencies, AraSenti- MARBERT-Dynamic GCN adds dynamism by utilizing graph structures that are dynamic according to input context, thus enhancing the model's capacity to deal with diverse contexts. The performance of both approaches was compared with benchmark datasets: iSarcasmEval and ArSarcasm-v2. Experimental results demonstrate better performance than current state-of-the- art models. More specifically, AraSenti-MARBERT-GCN obtained 92.2% accuracy and 74.5% F1-score on iSarcasmEval, and 84.5% accuracy and 68.7% F1-score on ArSarcasm-v2. More importantly, AraSenti-MARBERT- Dynamic GCN further enhanced these results by obtaining 93.5% accuracy and 76.2% F1-score on iSarcasmEval, and 86.1% accuracy with 70.4% F1- score on ArSarcasm-v2. These improvements recognize the value of dynamic graph adaptation in modeling fine-grained sarcastic utterances. The uses of this research go beyond the academic, providing tangible benefit for BI systems. By incorporating sarcasm-aware sentiment analysis into analytics pipelines, companies can better interpret customer remarks, leading to more advanced decision-making processes. Uses cross-cut multiple industries, such as healthcare and education, in addition to marketing, where public opinion is everything. Future work involves improving proximity matrix construction, improving emoticon and punctuation handling, and investigating multimodal approaches that leverage visual and audio information to further improve the performance of sarcasm detection and sound data integrate in order to have more effective detection of sarcasm; تُعد وسائل التواصل الاجتماعي بلا شك أداة قوية أصبحت جزءًا لا يتجزأ من جميع جوانب الحياة في الوقت الحاضر. وللتعامل معها بفعالية، يتطلب الأمر دمج تقنيات متقدمة في معالجة اللغة الطبيعية (NLP)، لا سيما عند قياس التأثير الكبير لوسائل التواصل الاجتماعي على أنظمة استخبارات الأعمال (BI). لمساعدة قادة الأعمال في اتخاذ القرار رغم غموض عالم التواصل الاجتماعي، يُقدم هذا العمل جهدًا كبيرًا في اكتشاف وقياس تأثير السخرية على تحليل المشاعر، مع التركيز بشكل خاص على اكتشاف السخرية باللغة العربية. الهدف الرئيسي من هذا العمل هو تقديم منهجين مبتكرين: AraSenti-MARBERT-GCN و AraSenti-MARBERT-Dynamic GCN، واللذان يتغلبان على العقبات اللغوية والسياقية المميزة للنصوص العربية. تستخدم هذه النماذج تضمينات MARBERT لتمثيل السياقات بشكل كثيف، ومعجم AraSenti لتقدير المشاعر، ونماذج بيانية قائمة على الشبكات الالتفافية البيانية (GCNs) والشبكات البيانية الديناميكية لتشفير التبعيات النحوية والعلاقات الدلالية. يُعد اكتشاف السخرية باللغة العربية تحديًا كبيرًا بسبب تعقيدها الصرفي، وتنوع لهجاتها، واعتمادها الثقافي. وتُسبب السخرية ارتباكًا كبيرًا لأنظمة تحليل المشاعر التقليدية، مما يستلزم آليات متخصصة لتشفير النصوص بشكل فعال. تُحسن الأطر المقترحة من اكتشاف السخرية من خلال الجمع بين درجات المشاعر من معجم AraSenti والتضمينات السياقية من MARBERT مع تمثيلات بيانية تُشفّر علاقات الكلمات. بينما يستخدم نموذج AraSenti-MARBERT-GCN رسومات ثابتة لتشفير التبعيات النحوية الثابتة، يضيف نموذج AraSenti-MARBERT-Dynamic GCN بُعدًا ديناميكيًا من خلال استخدام بنى رسومية تتكيف مع السياق المدخل، مما يعزز قدرة النموذج على التعامل مع سياقات متنوعة. تمت مقارنة أداء كلا المنهجين باستخدام مجموعات بيانات مرجعية: iSarcasmEval و ArSarcasm-v2. وأظهرت النتائج التجريبية تفوقًا ملحوظًا على النماذج المتقدمة الحالية، حيث حصل نموذج AraSenti-MARBERT-GCN على دقة بلغت 92.2% ودرجة F1 بلغت 74.5% على مجموعة iSarcasmEval، ودقة بلغت 84.5% ودرجة F1 بلغت 68.7% على مجموعة ArSarcasm-v2. والأهم من ذلك، أن نموذج AraSenti-MARBERT-Dynamic GCN حسّن هذه النتائج بشكل أكبر، محققًا دقة بنسبة 93.5% ودرجة F1 بلغت 76.2% على iSarcasmEval، ودقة بنسبة 86.1% ودرجة F1 بلغت 70.4% على ArSarcasm-v2. تُبرز هذه التحسينات أهمية التكيف الديناميكي للرسوم البيانية في تمثيل العبارات الساخرة الدقيقة. وتُعد تطبيقات هذا البحث ذات فائدة عملية تتجاوز الإطار الأكاديمي، حيث تُوفر قيمة ملموسة لأنظمة استخبارات الأعمال. ومن خلال دمج تحليل المشاعر الواعي بالسخرية في خطوط التحليل، يمكن للشركات فهم ملاحظات العملاء بشكل أعمق، مما يؤدي إلى عمليات اتخاذ قرار أكثر تطورًا. وتمتد استخدامات هذا البحث إلى العديد من القطاعات مثل الرعاية الصحية والتعليم، بالإضافة إلى التسويق، حيث تُعد آراء الجمهور ذات أهمية قصوى. يتضمن العمل المستقبلي تحسين بناء مصفوفة القرب، وتحسين التعامل مع الرموز التعبيرية وعلامات الترقيم، واستكشاف النهج متعددة الوسائط التي تعتمد على المعلومات المرئية والصوتية لتعزيز أداء اكتشاف السخرية وتكامل البيانات الصوتية للحصول على كشف أكثر فعالية للسخرية ER -