Novel supervised and semi-supervised learning methods for handling class imbalance in customer churn prediction /

Salma Abdelmonem Abdelmotaleb Mohamed,

Novel supervised and semi-supervised learning methods for handling class imbalance in customer churn prediction / طرق مبتكرة للتعلم من البيانات المصنفة و البيانات شبه المصنفة في ظل عدم توازن البيانات وتطبيقها في توقع مغادرة العملاء by Salma Abdelmonem Abdelmotaleb Mohamed ; Supervisors Prof. Samir Ibrahim Shaheen, Dr. Dina Ahmed Mohamed Elreedy. - 106 pages : illustrations ; 30 cm. + CD.

Thesis (Ph.D)-Cairo University, 2025.

Bibliography: pages 95-106.

Customer churn prediction involves identifying which customers are likely
to leave or discontinue using a service. While using machine learning tech-
niques can be beneficial for this prediction, there are some challenges that
arise from the characteristics of the datasets involved. In this thesis, we
present novel two supervised and semi-supervised approaches for learning
from class-imbalanced datasets like in customer churn prediction applica-
tions. First, we propose a novel algorithm-level adaptation to the supervised
Gaussian Process Classifier (CIRA) which can effectively learn from unbal-
anced datasets. Second, we propose a class imbalanced safe semi-supervised
approach (CISL) in a secure advanced self-training approach which can suc-
cessfully acquire knowledge from the limited labeled imbalanced datasets. We
conduct experiments on imbalanced benchmark datasets and real customer
churn prediction datasets. The experimental results, supported with statis-
tical significance tests, demonstrate consistent performance enhancements
using different performance measures. في هذه الرسالة، نقدم طرقًا جديدة في التعلم الآلي باستخدام البيانات المكتملة والبيانات غير المكتملة للتعلم الآلي برغم عدم توازن البيانات كما هو الحال في تطبيقات توقع مغادرة العملاء. أولاً، نقدم تعديلًا جديدًا على خوارزمية مشهورة في التعلم الآلي باستخدام البيانات المكتملة. يُمَكِن التعديل المقترح، الخوارزمية من التعلم بفعالية من مجموعات البيانات غير المتوازنة. ثانيًا، نقترح طريقة آمنة للتعلم من البيانات غير المكتملة وغير المتوازنة بحيث تكون كفاءة البرنامج مضمونة مسبقًا. للتحقق من كفاءة الطرق المقدمة، أجرينا تجارب على مجموعات بيانات مكتملة غير متوازنة، ومجموعات بيانات غير مكتملة وغير متوازنة، ومجموعات بيانات حقيقية شهيرة لتوقع مغادرة العملاء. تُظهر النتائج التجريبية، المدعومة باختبارات الدلالة الإحصائية، تحسينات مستمرة وثابتة في الأداء باستخدام معايير قياس أداء مختلفة.




Text in English and abstract in Arabic & English.


Computer Engineering
هندسة الحاسبات

Customer Churn Prediction Class imbalance Supervised Learning Semi- supervised Learning Safe Semi-supervised Learning Gaussian Process Clas- sifier Self Training Pseudo Labeling Ratio Sampling Safety Checking التعلم الآلي التعلم من البيانات المكتملة

005.1
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library