An enhanced classification algorithm for classification problems / (Record no. 177045)

MARC details
000 -LEADER
fixed length control field 06893namaa22004211i 4500
003 - CONTROL NUMBER IDENTIFIER
control field EG-GICUC
005 - أخر تعامل مع التسجيلة
control field 20251227100244.0
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 251226s2025 ua a|||frm||| 000 0 eng d
040 ## - CATALOGING SOURCE
Original cataloguing agency EG-GICUC
Language of cataloging eng
Transcribing agency EG-GICUC
Modifying agency EG-GICUC
Description conventions rda
041 0# - LANGUAGE CODE
Language code of text/sound track or separate title eng
Language code of summary or abstract eng
-- ara
049 ## - Acquisition Source
Acquisition Source Deposit
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER
Classification number 005.13
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC)
Classification number 005.13
Edition number 21
097 ## - Degree
Degree M.Sc
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC)
Local Call Number Cai01.18.02.M.Sc.2025.Mo.E
100 0# - MAIN ENTRY--PERSONAL NAME
Authority record control number or standard number Mohamed Ezzeldin Saleh Mohamed,
Preparation preparation.
245 13 - TITLE STATEMENT
Title An enhanced classification algorithm for classification problems /
Statement of responsibility, etc. by Mohamed Ezzeldin Saleh Mohamed ; Supervised Dr. Nadia Abd-Alsabour.
246 15 - VARYING FORM OF TITLE
Title proper/short title خوارزمية محسنة لمشكلات التصنيف
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE
Date of production, publication, distribution, manufacture, or copyright notice 2025.
300 ## - PHYSICAL DESCRIPTION
Extent 113 Leaves :
Other physical details illustrations ;
Dimensions 30 cm. +
Accompanying material CD.
336 ## - CONTENT TYPE
Content type term text
Source rda content
337 ## - MEDIA TYPE
Media type term Unmediated
Source rdamedia
338 ## - CARRIER TYPE
Carrier type term volume
Source rdacarrier
502 ## - DISSERTATION NOTE
Dissertation note Thesis (M.Sc)-Cairo University, 2025.
504 ## - BIBLIOGRAPHY, ETC. NOTE
Bibliography, etc. note Bibliography: pages 108-113.
520 #3 - SUMMARY, ETC.
Summary, etc. In the dynamic telecommunications industry, customer churn prediction (CCP) plays a <br/>crucial role in maintaining competitiveness and ensuring long-term profitability. This thesis <br/>presents a comprehensive exploration into enhancing churn prediction by systematically <br/>improving traditional and ensemble-based machine learning models through robust preprocessing <br/>and model optimization strategies. Using the benchmark Cell2Cell dataset, the study applies a <br/>broad spectrum of preprocessing methods; including multiple imputation techniques, <br/>normalization approaches, feature selection, and class balancing via SMOTE Tomek, resulting in <br/>the generation of 16 distinct, high-quality datasets tailored for effective model training. <br/>The research begins by evaluating how diverse combinations of preprocessing steps affect <br/>the performance of a Decision Tree (DT) model, revealing that K-Nearest Neighbor (KNN) <br/>imputation, MMADN normalization, and Lasso feature selection significantly enhance accuracy <br/>and model robustness. Building upon this, a novel ensemble classifier, the Systematic Forest <br/>(SF), is introduced to address DT’s limitations such as overfitting and lack of generalization. The <br/>SF model achieved notable gains in accuracy and recall, demonstrating better stability in <br/>handling complex feature interactions. Subsequently, the thesis focuses on optimizing tree-based <br/>classifiers, specifically DT (enhanced through grid search as DT+), Random Forest (RF), and <br/>XGBoost (XGB). Grid search-based hyperparameter tuning is employed to refine these models, <br/>and comparative evaluations highlight XGBoost as the top performer with an accuracy of 83% <br/>and ROC-AUC of 88%. RF also shows consistent strength, achieving robust performance due to <br/>its ensemble architecture and adaptability. <br/>Overall, this work offers a unified preprocessing and model evaluation framework for <br/>telecom churn prediction. It emphasizes that meticulous data preparation, model tuning, and <br/>algorithmic innovation collectively lead to interpretable, scalable, and high-performing models. <br/>The findings provide actionable insights for deploying churn prediction solutions in real-world.
520 #3 - SUMMARY, ETC.
Summary, etc. في صناعة الاتصالات الديناميكية، يلعب التنبؤ بانسحاب العملاء دورًا محوريًا في الحفاظ على القدرة التنافسية وضمان الربحية على المدى الطويل. تقدم هذه الأطروحة استكشافًا شاملًا لتعزيز التنبؤ بانسحاب العملاء من خلال تحسين منهجي للنماذج التقليدية ونماذج التعلم الآلي القائمة على التجميع، وذلك باستخدام استراتيجيات قوية في المعالجة المسبقة للبيانات وتحسين النماذج. <br/>وباستخدام مجموعة البيانات القياسية "Cell2Cell" ، طبقت الدراسة مجموعة واسعة من أساليب المعالجة المسبقة، بما في ذلك العديد من تقنيات التعويض ، وأساليب تطبيع البيانات، واختيار السمات ، وموازنة الفئات عبر تقنية "SMOTE Tomek" ، مما أدى إلى إنشاء 16 مجموعة بيانات متميزة وعالية الجودة مُعدة خصيصًا لتدريب النماذج بشكل فعال .<br/>تبدأ الدراسة بتقييم كيفية تأثير التركيبات المتنوعة لخطوات المعالجة المسبقة على أداء نموذج شجرة القرار (DT) ،<br/>حيث تكشف النتائج أن تقنيات التعويض بإستخدام طريقة أقرب الجيران ) KNN ) ، و تطبيع البيانات باستخدام "MMADN" ، واختيار السمات باستخدام "Lasso" تعزز بشكل كبير من دقة النموذج وقوته. بناءً على هذه النتائج، تم تقديم مصنف تجميعي جديد يُدعى الغابة الممنهجة (SF) لمعالجة القيود المعروفة في نموذج شجرة القرار، مثل الإفراط في التخصيص وعدم القدرة على التعميم. وقد حقق النموذج تحسينات ملحوظة في الدقة والاستدعاء، مما أظهر قدرة أفضل على التعامل مع التفاعلات المعقدة بين السمات .بعد ذلك، تركز الأطروحة على تحسين المصنفات القائمة على الأشجار، وتحديدًا شجرة القرار المحسنة باستخدام البحث الشبكي والمعروفة باسم "DT+" ، بالإضافة إلى غابة القرار العشوائي و نموذج XGBoost (XGB) تم استخدام ضبط المعلمات الفائقة عبر البحث الشبكي لتحسين هذه النماذج، وأظهرت التقييمات المقارنة أن XGBoost كان الأفضل أداءً بدقة بلغت 83 % ونسبة ROC-AUC مقدارها 88% . كما أظهرت غابة القرار العشوائي قوة متسقة وأداءً قويًا بفضل بنيتها التجميعية وقدرتها على التكيف
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE
Issues CD Issues also as CD.
546 ## - LANGUAGE NOTE
Text Language Text in English and abstract in Arabic & English.
650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM
Topical term or geographic name entry element Computer algorithms
650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM
Topical term or geographic name entry element خوارزميات الكمبيوتر
653 #1 - INDEX TERM--UNCONTROLLED
Uncontrolled term Random Forest
-- machine learning
-- Decision Tree
-- preprocessing methods
-- الغابة العشوائية
-- التعلم الآلي
700 0# - ADDED ENTRY--PERSONAL NAME
Personal name Nadia Abd-Alsabour
Relator term thesis advisor.
900 ## - Thesis Information
Grant date 01-01-2025
Supervisory body Nadia Abd-Alsabour
Universities Cairo University
Faculties Faculty of Graduate Studies for Statistical Research
Department Department of Computer Sciences
905 ## - Cataloger and Reviser Names
Cataloger Name Shimaa
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Source of classification or shelving scheme Dewey Decimal Classification
Koha item type Thesis
Edition 21
Suppress in OPAC No
Holdings
Source of classification or shelving scheme Home library Current library Date acquired Inventory number Full call number Barcode Date last seen Effective from Koha item type
Dewey Decimal Classification المكتبة المركزبة الجديدة - جامعة القاهرة قاعة الرسائل الجامعية - الدور الاول 26.12.2025 92931 Cai01.18.02.M.Sc.2025.Mo.E 01010110092931000 26.12.2025 26.12.2025 Thesis
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library