TY - BOOK AU - Salma Abdelmonem Abdelmotaleb Mohamed, AU - Samir Ibrahim Shaheen AU - Dina Ahmed Mohamed Elreedy TI - Novel supervised and semi-supervised learning methods for handling class imbalance in customer churn prediction U1 - 005.1 PY - 2025/// KW - Computer Engineering KW - هندسة الحاسبات KW - Customer Churn Prediction KW - Class imbalance KW - Supervised Learning KW - Semi- supervised Learning KW - Safe Semi-supervised Learning KW - Gaussian Process Clas- sifier KW - Self Training KW - Pseudo Labeling KW - Ratio Sampling KW - Safety Checking KW - التعلم الآلي KW - التعلم من البيانات المكتملة N1 - Thesis (Ph.D)-Cairo University, 2025; Bibliography: pages 95-106; Issues also as CD N2 - Customer churn prediction involves identifying which customers are likely to leave or discontinue using a service. While using machine learning tech- niques can be beneficial for this prediction, there are some challenges that arise from the characteristics of the datasets involved. In this thesis, we present novel two supervised and semi-supervised approaches for learning from class-imbalanced datasets like in customer churn prediction applica- tions. First, we propose a novel algorithm-level adaptation to the supervised Gaussian Process Classifier (CIRA) which can effectively learn from unbal- anced datasets. Second, we propose a class imbalanced safe semi-supervised approach (CISL) in a secure advanced self-training approach which can suc- cessfully acquire knowledge from the limited labeled imbalanced datasets. We conduct experiments on imbalanced benchmark datasets and real customer churn prediction datasets. The experimental results, supported with statis- tical significance tests, demonstrate consistent performance enhancements using different performance measures; في هذه الرسالة، نقدم طرقًا جديدة في التعلم الآلي باستخدام البيانات المكتملة والبيانات غير المكتملة للتعلم الآلي برغم عدم توازن البيانات كما هو الحال في تطبيقات توقع مغادرة العملاء. أولاً، نقدم تعديلًا جديدًا على خوارزمية مشهورة في التعلم الآلي باستخدام البيانات المكتملة. يُمَكِن التعديل المقترح، الخوارزمية من التعلم بفعالية من مجموعات البيانات غير المتوازنة. ثانيًا، نقترح طريقة آمنة للتعلم من البيانات غير المكتملة وغير المتوازنة بحيث تكون كفاءة البرنامج مضمونة مسبقًا. للتحقق من كفاءة الطرق المقدمة، أجرينا تجارب على مجموعات بيانات مكتملة غير متوازنة، ومجموعات بيانات غير مكتملة وغير متوازنة، ومجموعات بيانات حقيقية شهيرة لتوقع مغادرة العملاء. تُظهر النتائج التجريبية، المدعومة باختبارات الدلالة الإحصائية، تحسينات مستمرة وثابتة في الأداء باستخدام معايير قياس أداء مختلفة ER -