MARC details
000 -LEADER |
fixed length control field |
10616namaa22004091i 4500 |
003 - CONTROL NUMBER IDENTIFIER |
control field |
OSt |
005 - أخر تعامل مع التسجيلة |
control field |
20250108125459.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION |
fixed length control field |
241229s2024 |||a|||f m||| 000 0 eng d |
040 ## - CATALOGING SOURCE |
Original cataloguing agency |
EG-GICUC |
Language of cataloging |
eng |
Transcribing agency |
EG-GICUC |
Modifying agency |
EG-GICUC |
Description conventions |
rda |
041 0# - LANGUAGE CODE |
Language code of text/sound track or separate title |
eng |
Language code of summary or abstract |
eng |
-- |
ara |
049 ## - Acquisition Source |
Acquisition Source |
Deposit |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER |
Classification number |
005.31 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) |
Classification number |
005.31 |
Edition number |
21 |
097 ## - Degree |
Degree |
M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) |
Local Call Number |
Cai01.18.02.M.Sc.2024.Mo.L |
100 0# - MAIN ENTRY--PERSONAL NAME |
Authority record control number or standard number |
Mona Mohamed Abd ElSalam, |
Preparation |
preparation. |
245 10 - TITLE STATEMENT |
Title |
Sentiment analysis of text incorporating emojis : |
Remainder of title |
Machine Learning Approach / |
Statement of responsibility, etc. |
by Mona Mohamed Abd ElSalam ; Supervised by Prof. Dr. Hesham Ahmed Hefny, Dr. Ahmed Mohammed Gadallah. |
246 15 - VARYING FORM OF TITLE |
Title proper/short title |
: تحليل المشاعر للنص المحتوى على رموز تعبيرية |
Remainder of title |
/ أسلوب تعلم الآلة |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE |
Date of production, publication, distribution, manufacture, or copyright notice |
2024. |
300 ## - PHYSICAL DESCRIPTION |
Extent |
123 leaves : |
Other physical details |
illustrations ; |
Dimensions |
30 cm. + |
Accompanying material |
CD. |
336 ## - CONTENT TYPE |
Content type term |
text |
Source |
rda content |
337 ## - MEDIA TYPE |
Media type term |
Unmediated |
Source |
rdamedia |
338 ## - CARRIER TYPE |
Carrier type term |
volume |
Source |
rdacarrier |
502 ## - DISSERTATION NOTE |
Dissertation note |
Thesis (M.Sc)-Cairo University, 2024. |
504 ## - BIBLIOGRAPHY, ETC. NOTE |
Bibliography, etc. note |
Bibliography: pages 96-109. |
520 ## - SUMMARY, ETC. |
Summary, etc. |
Nowadays, people use emojis in their text to communicate their sentiments or summarize their words. Prior artificial intelligence (AI) strategies only included the order of text, emoticons, pictures, or emoticons with text have always been disregarded, resulting in a slew of feelings being overlooked. Sentiment Analysis examines the problem of studying texts, like posts and reviews, uploaded by users on microblogging, social media platforms, forums, and electronic businesses, regarding the opinions they have about a product, service, event, person or idea. It is still difficult for a vast majority of tools to precisely evaluate what truly is a negative, neutral, and a positive statement especially with the extreme use of emoji shapes in the customer reviews. Accordingly, there is a need for more flexible context-sensitive sentiment analysis approaches for texts including emojis. <br/>This thesis proposed sentiment analysis approach for text aims mainly to gain benefit of mechanizing rate the assessments as unstructured information which is been an important issue today. The main Goal is approving the effectiveness of emoji on text, that is examined by using two different dataset and developing several classifiers with different matrics for each tweet only onetime and another for tweets and emoji. On other hand, the use of sarcasm is a common language phenomena in online writing that expresses personal thoughts. Sarcasm detection is crucial and advantageous for many NLP applications, including sentiment analysis, opinion mining, and advertising. So, the data is gathered, Exploring and Processing Text Data are done, different algorithms and features are applied on text, and evaluation metrics are performed. <br/> The proposed approach is implemented by different machine learning classifiers (Random Forest, Support Vector Machine, Gaussain Naïve Bayes, Logistic Regression, Gradient Boosting, K-Nearset Neighbors) for text and emoji, and for text only. Two different data sets were used to evaluate the proposed approach. <br/> The first data set is concerned with Covid-19 tweets. It contains 1000 text tweets. This data set is combined with 1000 random emojis. The data set is divided into 70% training and 30% testing. The proposed approach is used to classify the new combined tweets with accuracy of 0.95, f-score 0.95, precision 0.99 and re-call 0.96. It is found that, when the emojis are eliminated from the first data set, the classification performance became, 0.45, 0.47, 0.67 and 0.45 for Accuracy, F-score, Precision and Recall measures respectively. This ensures the benefits of adding emojis to text tweets. Another experiment has been performed to show the efficacy the proposed approach. <br/> The second data set is concerned with evaluation of airline services. It is consisted of 12000 text tweets. The proposed approach is tested to classify this data set in case of only text tweets and when combined with 12000 emojis. The result shows that when the data set is divided into 70% for training and 30% for testing is found to be: 0.96, 0.95, 0.96 and 0.96 for Accuracy, F-score, Precision and Recall measures respectively. On the other hand, when the emojis patterns are eliminated, the classification performance is reduced to: 0.39, 0.53, 0.81 and 0.41 for Accuracy, F-score, Precision and Recall measures respectively. <br/> Therefore, the experimental evaluation shows that the proposed approach of adding emojis to text tweets in quite powerful for impressing sentiment classification. |
520 ## - SUMMARY, ETC. |
Summary, etc. |
في الوقت الحاضر، يستخدم الناس الرموز التعبيرية في نصوصهم للتعبير عن مشاعرهم أو تلخيص كلماتهم. كانت استراتيجيات الذكاء الاصطناعي السابقة تتضمن فقط ترتيب النص، أو الرموز التعبيرية، أو الصور، أو الرموز التعبيرية مع النص، والتي تم تجاهلها دائمًا، مما أدى إلى التغاضي عن عدد كبير من المشاعر. يدرس تحليل المشاعر مشكلة دراسة النصوص، مثل المنشورات والمراجعات، التي يتم تحميلها من قبل المستخدمين على المدونات الصغيرة ومنصات التواصل الاجتماعي والمنتديات والشركات الإلكترونية، فيما يتعلق بآراءهم حول منتج أو خدمة أو حدث أو شخص أو فكرة. لا يزال من الصعب على الغالبية العظمى من الأدوات إجراء تقييم دقيق لما هو بيان سلبي ومحايد وإيجابي، خاصة مع الاستخدام المفرط لأشكال الرموز التعبيرية في مراجعات العملاء. وبناءً على ذلك، هناك حاجة إلى أساليب تحليل المشاعر الأكثر مرونة والتي تراعي السياق بالنسبة للنصوص بما في ذلك الرموز التعبيرية.<br/>تهدف هذه الأطروحة إلى منهج تحليل المشاعر للنص بشكل أساسي للاستفادة من ميكنة معدل التقييمات باعتبارها معلومات غير منظمة والتي أصبحت قضية مهمة اليوم. الهدف الرئيسي هو التحقق من فعالية الرموز التعبيرية على النص، والتي يتم فحصها باستخدام مجموعتي بيانات مختلفتين وتطوير عدة مصنفات بمصفوفات مختلفة لكل تغريدة مرة واحدة فقط وأخرى للتغريدات والرموز التعبيرية. من ناحية أخرى، يعد استخدام السخرية ظاهرة لغوية شائعة في الكتابة عبر الإنترنت والتي تعبر عن الأفكار الشخصية. يعد اكتشاف السخرية أمرًا بالغ الأهمية ومفيدًا للعديد من تطبيقات البرمجة اللغوية العصبية، بما في ذلك تحليل المشاعر واستخراج الآراء والإعلانات. لذلك، يتم جمع البيانات، ويتم استكشاف البيانات النصية ومعالجتها، ويتم تطبيق خوارزميات وميزات مختلفة على النص، ويتم تنفيذ مقاييس التقييم.<br/>يتم تنفيذ النهج المقترح من خلال مصنفات مختلفة للتعلم الآلي (Random Forest، Support Vector Machine، Gaussain Naïve Bayes، Logistic Regression، Gradient Boosting، K-Nearset Neighbors) للنص والرموز التعبيرية وللنص فقط. تم استخدام مجموعتين مختلفتين من البيانات لتقييم النهج المقترح.<br/>تتعلق مجموعة البيانات الأولى بتغريدات كوفيد-19. يحتوي على 1000 تغريدة نصية. تم دمج مجموعة البيانات هذه مع 1000 رمز تعبيري عشوائي. تنقسم مجموعة البيانات إلى 70% تدريب و30% اختبار. تم استخدام الطريقة المقترحة لتصنيف التغريدات المجمعة الجديدة الضبط accuracy 0.95 وf-score 0.95 و precision 0.99 و re-call 0.96. لقد وجد أنه عند حذف الرموز التعبيرية من مجموعة البيانات الأولى، أصبح أداء التصنيف 0.45 و0.47 و0.67 و0.45 Accuracy و F-score و precision و re-call على التوالي. وهذا يضمن فوائد إضافة الرموز التعبيرية إلى التغريدات النصية. وقد تم إجراء تجربة أخرى لإظهار فعالية النهج المقترح.<br/>وتتعلق مجموعة البيانات الثانية بتقييم خدمات شركات الطيران. وهي تتألف من 12000 تغريدة نصية. تم اختبار النهج المقترح لتصنيف مجموعة البيانات هذه في حالة التغريدات النصية فقط وعند دمجها مع 12000 رمز تعبيري. تظهر النتيجة أنه عند تقسيم مجموعة البيانات إلى 70% للتدريب و30% للاختبار نجد أن 0.96 و0.95 و0.96 و0.96 لكل من Accuracy و F-score و precision و re-call على التوالي. من ناحية أخرى، عند حذف أنماط الرموز التعبيرية، يتم تقليل أداء التصنيف إلى: 0.39 و0.53 و0.81 و0.41 لكل من Accuracy و F-score و precision و re-call على التوالي.<br/>لذلك، أظهر التقييم التجريبي أن النهج المقترح لإضافة الرموز التعبيرية إلى التغريدات النصية قوي جدًا في التأثير على تصنيف المشاعر |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE |
Issues CD |
Issues also as CD. |
546 ## - LANGUAGE NOTE |
Text Language |
Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM |
Topical term or geographic name entry element |
Machine Learning |
Source of heading or term |
qrmak |
653 #0 - INDEX TERM--UNCONTROLLED |
Uncontrolled term |
sentiment analysis |
-- |
artificial intelligence |
-- |
text |
-- |
emoticons |
-- |
feelings |
-- |
negative |
-- |
neutral |
-- |
a positive |
-- |
sarcasm |
-- |
machine learning |
-- |
evaluation metrics |
-- |
classifiers |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Hesham Ahmed Hefny |
Relator term |
thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Ahmed Mohammed Gadallah |
Relator term |
thesis advisor. |
900 ## - Thesis Information |
Grant date |
01-01-2024 |
Supervisory body |
Hesham Ahmed Hefny |
-- |
Ahmed Mohammed Gadallah |
Universities |
Cairo University |
Faculties |
Faculty of Graduate Studies for Statistical Research |
Department |
Department of Computer Sciences |
905 ## - Cataloger and Reviser Names |
Cataloger Name |
Shimaa |
Reviser Names |
Huda |
942 ## - ADDED ENTRY ELEMENTS (KOHA) |
Source of classification or shelving scheme |
Dewey Decimal Classification |
Koha item type |
Thesis |
Edition |
21 |
Suppress in OPAC |
No |