Enhancing Arabic Opinion Spam Detection in Social Network/ Abdullah Msaood Kasem Alkadri ; Supervisors: Prof. Dr. Abeer El-Korany, Dr. Cherry Ahmed.

By:

Abdullah Msaood Kasem Alkadri [preparation.]

Contributor(s):

Material type: Text

TextLanguage: English Summary language: English, Arabic Producer: 2023Description: 117 Leaves : illustrations ; 30 cm. + CDContent type:

text

Media type:

Unmediated

Carrier type:

volume

Other title:

تعزيز الكشف عن الآراء العربية غير المرغوب فيها في الشبكة الاجتماعية [Added title page title]

Subject(s):

DDC classification:

Available additional physical forms:

Issues also as CD.

Dissertation note: Thesis (Ph.D)-Cairo University, 2023. Summary: he Experiments chapter systematically evaluates the proposed framework’s performance. It comprises a series of key sections, including Experiment Setup, Case Study Datasets, Offline Spam Detection Module Experiments, Offline Relevance Classification Module Experiments, Sentiment Analysis Experiments, New Data Stream Experiment, and an Efficiency Analysis of the Real-Time Arabic Opinion Spam Detection (RTAOSD) System. These sections collectively offer a comprehensive overview of the framework’s capabilities and its adaptability to diverse scenarios, datasets, and real-time data streams. The chapter showcases the framework’s robust performance and consistently superior results when compared to existing approaches, affirming its efficacy in the context of Arabic opinion spam detectionSummary: يصاحب النشر السريع للمعلومات في الشبكات الاجتماعية على الإنترنت، زيادة انتشار المعلومات المضللة ــ وهو مصدر قلق مجتمعي ملح وله آثار عميقة وخطيرة.تشمل المعلومات المضللة نشر معلومات غير دقيقة أو محتوى ملفق، وغالبًا ما يكون الهدف منه التأثير على التصورات العامة، أو خدمة أجندات معينة.تعتبر الشبكات الاجتماعية، مصدرا رئيسيا للمعلومات، وأيضا تستخدم كأرض خصبة لنشر المعلومات المضللة، مما يجعل احتواءها ضرورة حيوية. تتناول هذه الأطروحة التحدي المعقد المتمثل في مكافحة المعلومات المضللة داخل شبكات التواصل الاجتماعي العربية من خلال تطوير "إطار الكشف عن النصوص العربية غير المرغوب فيها في الوقت الحقيقي". وينبع الدافع من الدور الحاسم الذي تلعبه وسائل التواصل الاجتماعي في تشكيل الخطاب العام، إلى جانب التهديد المتصاعد الذي تشكله المعلومات المضللة على سلامة التفاعلات عبر الإنترنت، والى الحاجة الملحة إلى التحليل في الوقت الحقيقي لضمان سلامة المحتوى عبر الإنترنت، خصوصا النص العربي. الهدف الرئيسي من هذه الأطروحة هو تطوير إطار فعال في الوقت الحقيقي لكشف النصوص غير المرغوب فيها - وهي شكل خادع من المعلومات الخاطئة التي يتم نشرها داخل الشبكات الاجتماعية، وخاصة العربية منها، مما يشكل تحديًا كبيرًا من خلال احتمال تزويد المستخدمين بمحتوى مضلل أو غير ذي صلة. يتكون الإطار من ثلاث مكونات مترابطة: وحدة اكتشاف النصوص غير المرغوب فيها، ووحدة تصنيف صلة النص بموضوع معين، ونظام اكتشاف الرسائل غير المرغوب فيها بالرأي العربي في الوقت الفعلي. تبدأ وحدة اكتشاف النصوص غير المرغوب فيها بتصنيف محتوى الشبكة الاجتماعية إلى فئتين أساسيتين: النصوص غير المرغوب فيها والنصوص المرغوب فيها. ويركز على وجه التحديد على الأشكال المختلفة لمحتوى النصوص غير المرغوب فيها، بما في ذلك الإعلانات ومحتوى البالغين وخطاب الكراهية. علاوة على ذلك، تقوم وحدة تصنيف صلة النص بموضوع معين بتقييم مدى صلةالمحتوى المرغوب فيه بموضوعات محددة مما يساعد في تلبية اهتمامات المستخدمين.وأخيرًا، يقوم نظام اكتشاف الرسائل غير المرغوب فيها بالرأي العربي في الوقت الفعلي بجمع المحتوى من شبكات التواصل الاجتماعي العربية، ويستخدم الوحدات المدربة مسبقًا لتصنيف المحتوى، وتحديد النصوص غير المرغوب فيها في الرأي، وتصفية المناقشات ذات الصلة، وتوفير صفحات للعرض وميزات إعداد التقارير. خلال هذه الدراسة، تم إجراء سلسلة من التجارب، مع استخدام مجموعتي بيانات مرجعية كنقطة بداية. وفي وقت لاحق، تم إنشاء مجموعة بيانات جديدة بدقة، وكانت مخصصة لأغراض البحث، ومن المقرر أن تكون متاحة على الإنترنت، وبالتالي تكون بمثابة مجموعة بيانات مرجعية جديدة لتحليل وسائل التواصل الاجتماعي العربية. أظهرت وحدة اكتشاف النصوص غير المرغوب فيهانتائج مميزة مقارنة بالدراسات السابقة، فقد حققت درجة (macro F1) نسبة ملحوظة 91% ومعدل دقة قدره 92.75% باستخدام مجموعة البيانات المخصصة التي تم إنشاؤها لهذا البحث. بالإضافة الى ذلك، أكدت تقييمات المقارنة مع المنهجيات الأخرى ومجموعتي البيانات المنشورة من قبل باحثين اخرين باستمرار تفوق نهجنا. والجدير بالذكر أن النهج المقترح تفوق على بحث قدورة وآخرين. بدرجة استثنائية في ((macro F1بلغت 99.86%. وبالمثل، تفوق النهج المقترح على بحث العزاني وآخرون.، محققًا درجة ((macro F1 كبيرة ودقة بلغت 93.37%. علاوة على ذلك، أسفرت تصنيف صلة النص بموضوع معين عن نتائج مهمة في كل من التصنيفات الثنائية والفئوية. حقق مكون تصنيف الصلة في التصنيف الثنائي درجة ((macro F1بلغت 86.38% ومعدل دقة 86.50%، بينما حقق في تصنيف الصلة المتعدد درجة ((macro F1 بلغت 77.64% ومعدل دقة 78.79%.

Tags from this library: No tags from this library for this title. Log in to add tags.

Average rating: 0.0 (0 votes)

Holdings
Item type	Current library	Home library	Call number	Status	Barcode
Thesis	قاعة الرسائل الجامعية - الدور الاول	المكتبة المركزبة الجديدة - جامعة القاهرة	Cai01.20.03.Ph.D.2023.Ab.E (Browse shelf(Opens below))	Not for loan	01010110089765000

Thesis (Ph.D)-Cairo University, 2023.

Bibliography: pages 96-109.

he Experiments chapter systematically evaluates the proposed
framework’s performance. It comprises a series of key sections, including
Experiment Setup, Case Study Datasets, Offline Spam Detection Module
Experiments, Offline Relevance Classification Module Experiments, Sentiment
Analysis Experiments, New Data Stream Experiment, and an Efficiency
Analysis of the Real-Time Arabic Opinion Spam Detection (RTAOSD) System.
These sections collectively offer a comprehensive overview of the framework’s
capabilities and its adaptability to diverse scenarios, datasets, and real-time
data streams. The chapter showcases the framework’s robust performance and
consistently superior results when compared to existing approaches, affirming
its efficacy in the context of Arabic opinion spam detection

يصاحب النشر السريع للمعلومات في الشبكات الاجتماعية على الإنترنت، زيادة انتشار المعلومات المضللة ــ وهو مصدر قلق مجتمعي ملح وله آثار عميقة وخطيرة.تشمل المعلومات المضللة نشر معلومات غير دقيقة أو محتوى ملفق، وغالبًا ما يكون الهدف منه التأثير على التصورات العامة، أو خدمة أجندات معينة.تعتبر الشبكات الاجتماعية، مصدرا رئيسيا للمعلومات، وأيضا تستخدم كأرض خصبة لنشر المعلومات المضللة، مما يجعل احتواءها ضرورة حيوية.
تتناول هذه الأطروحة التحدي المعقد المتمثل في مكافحة المعلومات المضللة داخل شبكات التواصل الاجتماعي العربية من خلال تطوير "إطار الكشف عن النصوص العربية غير المرغوب فيها في الوقت الحقيقي". وينبع الدافع من الدور الحاسم الذي تلعبه وسائل التواصل الاجتماعي في تشكيل الخطاب العام، إلى جانب التهديد المتصاعد الذي تشكله المعلومات المضللة على سلامة التفاعلات عبر الإنترنت، والى الحاجة الملحة إلى التحليل في الوقت الحقيقي لضمان سلامة المحتوى عبر الإنترنت، خصوصا النص العربي.
الهدف الرئيسي من هذه الأطروحة هو تطوير إطار فعال في الوقت الحقيقي لكشف النصوص غير المرغوب فيها - وهي شكل خادع من المعلومات الخاطئة التي يتم نشرها داخل الشبكات الاجتماعية، وخاصة العربية منها، مما يشكل تحديًا كبيرًا من خلال احتمال تزويد المستخدمين بمحتوى مضلل أو غير ذي صلة.
يتكون الإطار من ثلاث مكونات مترابطة: وحدة اكتشاف النصوص غير المرغوب فيها، ووحدة تصنيف صلة النص بموضوع معين، ونظام اكتشاف الرسائل غير المرغوب فيها بالرأي العربي في الوقت الفعلي.
تبدأ وحدة اكتشاف النصوص غير المرغوب فيها بتصنيف محتوى الشبكة الاجتماعية إلى فئتين أساسيتين: النصوص غير المرغوب فيها والنصوص المرغوب فيها. ويركز على وجه التحديد على الأشكال المختلفة لمحتوى النصوص غير المرغوب فيها، بما في ذلك الإعلانات ومحتوى البالغين وخطاب الكراهية. علاوة على ذلك، تقوم وحدة تصنيف صلة النص بموضوع معين بتقييم مدى صلةالمحتوى المرغوب فيه بموضوعات محددة مما يساعد في تلبية اهتمامات المستخدمين.وأخيرًا، يقوم نظام اكتشاف الرسائل غير المرغوب فيها بالرأي العربي في الوقت الفعلي بجمع المحتوى من شبكات التواصل الاجتماعي العربية، ويستخدم الوحدات المدربة مسبقًا لتصنيف المحتوى، وتحديد النصوص غير المرغوب فيها في الرأي، وتصفية المناقشات ذات الصلة، وتوفير صفحات للعرض وميزات إعداد التقارير.
خلال هذه الدراسة، تم إجراء سلسلة من التجارب، مع استخدام مجموعتي بيانات مرجعية كنقطة بداية. وفي وقت لاحق، تم إنشاء مجموعة بيانات جديدة بدقة، وكانت مخصصة لأغراض البحث، ومن المقرر أن تكون متاحة على الإنترنت، وبالتالي تكون بمثابة مجموعة بيانات مرجعية جديدة لتحليل وسائل التواصل الاجتماعي العربية.
أظهرت وحدة اكتشاف النصوص غير المرغوب فيهانتائج مميزة مقارنة بالدراسات السابقة، فقد حققت درجة (macro F1) نسبة ملحوظة 91% ومعدل دقة قدره 92.75% باستخدام مجموعة البيانات المخصصة التي تم إنشاؤها لهذا البحث. بالإضافة الى ذلك، أكدت تقييمات المقارنة مع المنهجيات الأخرى ومجموعتي البيانات المنشورة من قبل باحثين اخرين باستمرار تفوق نهجنا. والجدير بالذكر أن النهج المقترح تفوق على بحث قدورة وآخرين. بدرجة استثنائية في ((macro F1بلغت 99.86%. وبالمثل، تفوق النهج المقترح على بحث العزاني

وآخرون.، محققًا درجة ((macro F1 كبيرة ودقة بلغت 93.37%. علاوة على ذلك، أسفرت تصنيف صلة النص بموضوع معين عن نتائج مهمة في كل من التصنيفات الثنائية والفئوية. حقق مكون تصنيف الصلة في التصنيف الثنائي درجة ((macro F1بلغت 86.38% ومعدل دقة 86.50%، بينما حقق في تصنيف الصلة المتعدد درجة ((macro F1 بلغت 77.64% ومعدل دقة 78.79%.

Issues also as CD.

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.