000 10438namaa22004211i 4500
003 EG-GICUC
005 20260419151308.0
008 260419s2025 ua a|||frm||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a006.31
092 _a006.31
_221
097 _aPh.D
099 _aCai01.03.05.Ph.D.2025.Sa.S
100 0 _aSahar Saeed Rezk Awaad,
_epreparation.
245 1 0 _aSupervised machine learning techniques:
_ba new ensemble-based hybrid model with application /
_cby Sahar Saeed Rezk Awaad ; Supervised Prof. Kamal Samy Selim.
246 1 5 _a: تقنيات التعلم الآلي تحت الإشراف:
_bنموذج هجين جديد قائم على الأداء الموحد مع التطبيق
264 0 _c2025.
300 _a231 pages :
_billustrations ;
_c25 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (Ph.D)-Cairo University, 2025.
504 _aBibliography: pages 231.
520 3 _a This thesis investigates advanced supervised machine learning approaches with a focus on enhancing classification performance and expanding their practical utility across real-world domains, particularly in education. It is structured around four interrelated studies that together address both theoretical gaps and applied challenges in the area of selective ensemble learning. The first study presents a systematic review of metaheuristic-based selective ensemble learning. This review offers a critical analysis of existing methods in terms of base machine learning model selection, aggregation strategies, and evaluation frameworks. It actually identifies key challenges in such research areas, such as balancing accuracy and diversity, dealing with overconfident predictions, and handling imbalanced data. Motivated by the insights gained from the systematic review, this thesis proposes a novel selective ensemble framework: Coati-based Weighted Truncated Harmonic Mean Ensemble (Coati-WTHM-Ens). This model introduces a new aggregation mechanism that employs a truncated harmonic mean so as to minimize the influence of extreme probability estimates and thereby improving ensemble robustness. As part of a rigorous effort to practically test and validate the proposed model, two empirical studies are conducted to predict school-dropout in Egypt, taking into account their social and economic determinants. Together, these preparatory studies aim to build a solid empirical foundation and enable fair benchmarking. Specifically, they assess the performance of various supervised machine learning classifiers under different resampling strategies designed to address class imbalance. Notably, the second study also introduces the Weighted Unified Performance Metric (WUPM), as holistic metric that integrates several traditional performance indicators to provide a more balanced and informative evaluation in imbalanced classification tasks. In the fourth and final study, the proposed Coati-WTHM-Ens model, which is developed in the same study, is illustrated and applied to the Egyptian school-dropout dataset in addition to eighteen application-based diverse datasets from UCI benchmarking database. Collectively, these evaluations demonstrate the effectiveness of the proposed model both in a real-world social application that investigates the causes of school dropout, and across a wide range of classification problems in various domains, thereby confirming the model’s generalizability and practical utility. The classification results show that the proposed Coati-WTHM-Ens model significantly outperforms seventeen state-of-the-art ensemble methods by achieving higher classification performance in the majority of datasets. Moreover, the model surpasses the baseline metrics of the UCI datasets and achieves a substantial improvement in predicting school-dropout cases. In summary, it could be said that this thesis offers valuable contributions to the fields of ensemble learning, metaheuristic optimization, and educational data mining as an example of applying artificial intelligence to social domains. This provides insights that can help researchers enhance their theoretical understanding and develop their practical applications in these fields through the use of artificial intelligence
520 3 _aتستكشف هذه الأطروحة أساليب متقدمة في التعلم الآلي تحت الإشراف، بهدف تحسين مهام التصنيف وتقديم رؤى حول تطبيقاتها العملية في المجالات الواقعية، وبشكل خاص في قطاع التعليم. تم تنظيم هذه الأطروحة البحثية في أربع دراسات مترابطة، تتكامل تدريجيًا مع بعضها البعض، وتسعى معاً إلى معالجة الفجوات النظرية والتحديات التطبيقية في مجال التعلم القائم على الأداء الموحد الانتقائي. تقدم الدراسة الأولى مراجعة منهجية لأساليب التعلم القائم على الأداء الموحد الانتقائي بالاعتماد على الخوارزميات الميتا-استدلالية، حيث تتناول هذه المراجعة تحليلاً نقديًا للأساليب القائمة من حيث اختيار نماذج التعلم الآلي الأساسية، واستراتيجيات التجميع، وأطر التقييم. كما تسلط هذه الدراسة المرجعية الضوء على التحديات الرئيسية في هذا المجال البحثي، مثل الموازنة بين الدقة والتنوع، والتعامل مع التنبؤات المفرطة الثقة، ومعالجة البيانات غير المتوازنة. استنادًا إلى الرؤى المستخلصة من هذه المراجعة المنهجية، تقترح الرسالة إطارًا جديدًا للتعلم القائم على الأداء الموحد الانتقائي يُعرف باسم: " نموذج التعلم القائم على الأداء الموحد الانتقائي بالاعتماد على المتوسط التوافقي المرجح باستخدام الخوارزمية الميتا-استدلالية الجديدة (Coati-WTHM-Ens) ". ويُقدم هذا النموذج آلية تجميع جديدة تعتمد على المتوسط التوافقي المقتطع بهدف تقليل تأثير القيم الاحتمالية المتطرفة، وبالتالي تحسين استقرار نموذج الأداء الموحد. وسعيا للاختبار التطبيقي الجاد لهذا النموذج المقترح والتحقق من فعاليته، تم إجراء دراستين تطبيقيتين للكشف المبكر عن التسرب المدرسي في مصر تبعا لمسبباته الاجتماعية والاقتصادية، بهدف بناء أساس تجريبي متين وضمان مرجعية تقييم عادلة. تقوم هاتان الدراستان بتقييم أداء مجموعة من نماذج التعلم الآلي تحت الإشراف تحت استراتيجيات إعادة معاينة مختلفة للتعامل مع مشكلة عدم توازن الفئات. ومن الجدير بالذكر أن الدراسة الثانية تقدم أيضًا مقياسًا جديدًا شاملاً للتقييم يُعرف باسم " مقياس الأداء الموحد الموزون" (WUPM) ، والذي يجمع بين عدة مؤشرات أداء تقليدية لتقديم تقييم أكثر توازنًا وشمولًا في سياقات التصنيف غير المتوازن. أما في الدراسة الرابعة والأخيرة، فيتم تطبيق النموذج المقترح Coati-WTHM-Ens المطور في نفس الدراسة على كل من مجموعة بيانات التسرب المدرسي المصرية، فضلا عن ثمانية عشر مجموعة بيانات متنوعة التطبيقات من قاعدة بيانات UCI المعيارية. تُظهر جميع هذه التقييمات في مجملها فعالية النموذج المقترح سواء في سياق تطبيقي اجتماعي واقعي يبحث في مسببات التسرب المدرسي، وكذلك في مجموعة واسعة من مشكلات التصنيف في مجالات مختلفة، مما يؤكد قابلية تعميم النموذج المقترح وفائدته العملية. إذ تُظهر نتائج التصنيف أن هذا النموذج يتفوق بشكل ملحوظ على سبعة عشر نموذجًا تجميعيًا، من حيث تحقيق أداء تصنيفي أعلى في معظم المجموعات. كما يتجاوز هذا النموذج المعايير الأساسية لمجموعات بيانات UCI، وأيضا يُحسن وبفارق كبير القدرة على الكشف المبكر لحالات التسرب المدرسي. وباختصار، يمكن القول إن هذه الرسالة تقدم مساهمات علمية في مجالات التعلم القائم على الأداء الموحد، والتحسين الميتا-استدلالي وفي مجالات التنقيب في بيانات التعليم كمثال للعديد من المجالات الاجتماعية، مما يوفّر رؤى يمكن أن تساعد الباحثين في تعزيز فهمهم النظري وتطوير تطبيقاتهم العملية في هذه المجالات باستخدام الذكاء الاصطناعي.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 0 _aMachine Learning
_2qrmak
650 0 _a التعلم الآلي
_2qrmak
653 1 _aArtificial Intelligence
_aMachine Learning
_aSelective Ensemble Learning
_aHarmonic Means
_aBinary Metaheuristics
_aSchool Dropout in Egypt
_aالذكاء الاصطناعي
_a التعلم الآلي
700 0 _aKamal Samy Selim
_ethesis advisor.
900 _b01-01-2025
_cKamal Samy Selim
_UCairo University
_FFaculty of Economics and Political Science
_DDepartment of Socio-Computing
905 _aShimaa
942 _2ddc
_cTH
_e21
_n0
999 _c179581