TY - BOOK AU - Aliaa Atef Abd Elsamea Rohaem, AU - Nagy Ramadan AU - Nesrine Ali AU - Abdelmoneim Helmy TI - Negation handling in sentiment analysis of customer’s reviews U1 - 658.802 PY - 2024/// KW - Data processing KW - معالجة البيانات KW - Sentiment Analysis (SA) KW - Negation Scoping (NS) KW - Machine Learning (ML) KW - Natural Language Processing (NLP) KW - Synthetic Minority Oversampling Technique(SMOTE) KW - Receiver Operating Characteristic (ROC) N1 - Thesis (M.Sc)-Cairo University, 2024; Bibliography: pages 104-115; Issues also as CD N2 - Sentiment analysis (SA) has become an increasingly popular research area; researchers can obtain information about public opinion by analysing data and automatically classifying their sentiment polarity using natural language processing (NLP). The influence of negation on word scope and the inability to handle linguistic features is an essential task in SA. In this study, we firstly tackle the challenge of determining the polarity of a sentence while identifying the scope of negation. Secondly, we suggest an approach to dealing with negations based on linguistic features that determine the impact of various types of negation. The data imbalance problem was overcomed using SMOTE, and ROC curve analysis was also used to assess the performance of the current work. The outcomes of NLP, machine learning (ML), and hybrid approaches were compared; the hybrid approach excelled in detecting negative sentences. By comparing several algorithms, Random Forest (RF) performedbest, followed by support vector machines, Naive Bayes, and K-Nearest Neighbors. The RF algorithm achievedan AVG precision of 89% in electronics, 87% in toys, and 85% in the camera dataset. Additionally, the AUC curves for the negative class reached 89% in both electronics and toys, while in the camera dataset, it reached 90%; أصبح تحليل المشاعر(SA) مجالًا بحثيًاشائعًا بشكل متزايد، أصبح الباحثون قادرين علي الحصول علي المعلومات حول الرأي العام وذلك بتحليل البيانات والتصنيفالتلقائي لأستقطابية مشاعرهم بأستخدام معالجة اللغة الطبيعية (NLP) . يُعد تأثيرالنفي علي نطاق الكلمات وعدم القدرة علي التعامل مع السمات اللغوية مهمة أساسية لتحليل المشاعر. في هذة الدراسة، نتناول أولآ، التحدي المتمثل في تحديد قطبية الجملة مع تحديد نطاق النفي.ثانيآ، نقترح نهجآ للتعامل مع النفي يعتمد علي السمات اللغوية التي تحدد تأثير أنواع النفي المختلفة.تم التغلب علي مشكلة عدم توازن البيانات بأستخدام SMOTE، كما تم أستخدام تحليل منحني ROC لتقييم أداء العمل الحالي. وتمت مقارنة نتائج NLP، والتعلم الألي(ML)، والنهج الهجين، وقد تفوق النهج الهجين في أكتشاف الجمل السلبية. من خلال مقارنة العديد من الخوارزميات،كانتRandom Forest (RF)هيالأفضلأداء، يليها Support Vector Machines (SVM)، Naive Bayes (NB) ، K-Nearest Neighbors (KNN). حققت خوارزمية RF متوسط precision 89 %في الإلكترونيات،87% في الألعاب، 85% في مجموعة بيانات الكاميرا. بالإضافة إلي ذالك، بلغت منحنيات AUC للفئة السلبية 89% في كلآ من الإلكترونيات والألعاب، بينما بلغت 90% في مجموعة بيانات الكاميرا ER -