Image from OpenLibrary

Using optimization and machine learning methods to improve predictive models of common diseases / by Radwa Taher Mohamed Khalil ; Supervisors Dr. Areeg Abdalla, Dr. Sameh Hassanien Basha.

By: Contributor(s): Material type: TextLanguage: English Summary language: English, Arabic Producer: 2025Description: 94 pages : illustrations ; 25 cm. + CDContent type:
  • text
Media type:
  • Unmediated
Carrier type:
  • volume
Other title:
  • استخدام طرق التحسين و التعلم الألى لرفع كفاءة النماذج التنبؤية ألمراض شائعة [Added title page title]
Subject(s): DDC classification:
  • 510
Available additional physical forms:
  • Issues also as CD.
Dissertation note: Thesis (M.Sc)-Cairo University, 2025. Summary: Predicting common diseases is crucial to improve people’s quality of life and save their lives. There are various methods for early prediction about common diseases, but they all effort and money consuming. So machine learning algorithms were used as it can help reduce cost and effort. The goal of our thesis is to enhance these models and optimize their functionality throughout various stages. Preprocessing, feature se- lection, handling imbalanced datasets, classification, and hyper parameters fine-tuning machine learning models comprise the five primary phases of our suggested model flow. Dataset cleaning, handling missing data and standardization are the techniques used in preprocessing stage. Tomek-Linked Based Under Sampling (RTLU) and Interquartile Range (IQR) are used as outlier removing techniques in preprocessing stage. Extra tree was used for feature selection. Synthetic Minority Over-sampling Technique (SMOTE) was used in diabetes problem and Random Over Sampling (ROS) was used in liver disease to address the imbalance in data. Comparisons between different classifiers have been done. We, also, proposed a novel Chaotic Whale Optimization Algorithm (CWOA) to tune the hyper-parameters of the classifiers. Several performance evalu- ation metrics were used to evaluate the proposed model. Accuracy, recall, precision, specificity, area under curve (AUC) and f-score were used to test the improvement af- ter each stage. The presented model consistently outperformed earlier findings across all performance criteria, establishing its superiority on previous work and state of art classifiers.Summary: التنبؤ بالأمراض الشائعة أمر بالغ الأهميه لتحسين جودة حياة الناس وإنقاذ حياتهم من الهلاك. هناك طرق تستهلك الجهد مختلفة للتنبؤ المبكر للامراض الشائعة، ولكنها جميعا تستهلك الجهد والمال. لذلك تم استخدام خوارزميات ً التعلم الالى التى يمكن أن تساعد في تقليل التكلفة والجهد. الهدف من أطروحتنا هو تحسين هذه النماذج وتحسين أدائها عبر مراحل متعددة. يتضمن النموذج المقترح خمس مراحل رئيسية: المعالجة المسبقة، اختيار أفضل الخصائص القادره على التنبؤ ، التعامل مع البيانات غير المتوازنة، التصنيف باستخدام نماذج تعلم الالى، وضبط المعايير الفائقة لنماذج التعلم الالى. تشمل المرحله الاولى؛ تقنيات المعالجة المسبقة، تنظيف البيانات، التعامل مع البيانات المفقودة والتوحيد القياسي. كطرق إلزالة القيم المتطرفة في مرحلة المعالجة المسبقة مثل المدى بين الربعين و تقليل العينات باستخدام تقنيه توميك (TLU_R) تم استخدام تقنيه الشجره العظمى (Tree-Extra) لختيار أفضل العناصر القادره على التنبؤ. تم استخدام تقنيه زياده فئه العينه الأقل فى التنبؤ بمرض السكرى و استخدام تقنيه الزياده العشوائيه لفئات العينات الأقل عددا فى مساله التنبؤ بمرض الكبد لمعالجه عدم التوازن الموجود فى البيانات. تم إجراء مقارنات بين أداء المراحل المختلفه و مقارنه بين أداء الخوارزميات المستخدمه للتنبؤ. كما تم تقديم مقترح خوارزميه لتحسين أداء نماذج التنبؤ جديده تعتمد على ظبط المعايير الفائقه لنماذج التنبؤ. هذا المقترح هو استخدام النموذج الرياضى المحاكى لحركه الحيتان فى الصيد و تعديل بعض المعايير فيه باستخدام معادلات العشوائيه فى ظبط معايير نماذج التنبؤ. تم استخدام العديد من مقاييس الأداء لتقييم النموذج المقترح مثل الدقة، الإستدعاء، الدقة التنبؤية، التحديد، المساحة تحت المنحنى .النموذج المقدم تفوق باستمرار على النتائج السابقة عبر جميع معايير الأداء، مما يثبت تفوقه على الأعمال السابقة.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Home library Call number Status Barcode
Thesis قاعة الرسائل الجامعية - الدور الاول المكتبة المركزبة الجديدة - جامعة القاهرة Cai01.12.17.M.Sc.2025.Ra.U (Browse shelf(Opens below)) Not for loan 01010110092340000

Thesis (M.Sc)-Cairo University, 2025.

Bibliography: pages 87-94.

Predicting common diseases is crucial to improve people’s quality of life and save
their lives. There are various methods for early prediction about common diseases,
but they all effort and money consuming. So machine learning algorithms were used
as it can help reduce cost and effort. The goal of our thesis is to enhance these models
and optimize their functionality throughout various stages. Preprocessing, feature se-
lection, handling imbalanced datasets, classification, and hyper parameters fine-tuning
machine learning models comprise the five primary phases of our suggested model flow.
Dataset cleaning, handling missing data and standardization are the techniques used in
preprocessing stage. Tomek-Linked Based Under Sampling (RTLU) and Interquartile
Range (IQR) are used as outlier removing techniques in preprocessing stage. Extra tree
was used for feature selection. Synthetic Minority Over-sampling Technique (SMOTE)
was used in diabetes problem and Random Over Sampling (ROS) was used in liver
disease to address the imbalance in data. Comparisons between different classifiers
have been done. We, also, proposed a novel Chaotic Whale Optimization Algorithm
(CWOA) to tune the hyper-parameters of the classifiers. Several performance evalu-
ation metrics were used to evaluate the proposed model. Accuracy, recall, precision,
specificity, area under curve (AUC) and f-score were used to test the improvement af-
ter each stage. The presented model consistently outperformed earlier findings across
all performance criteria, establishing its superiority on previous work and state of art
classifiers.

التنبؤ بالأمراض الشائعة أمر بالغ الأهميه لتحسين جودة حياة الناس وإنقاذ حياتهم من الهلاك. هناك طرق تستهلك الجهد مختلفة للتنبؤ المبكر للامراض الشائعة، ولكنها جميعا تستهلك الجهد والمال. لذلك تم استخدام خوارزميات ً التعلم الالى التى يمكن أن تساعد في تقليل التكلفة والجهد. الهدف من أطروحتنا هو تحسين هذه النماذج وتحسين أدائها عبر مراحل متعددة. يتضمن النموذج المقترح خمس مراحل رئيسية: المعالجة المسبقة، اختيار أفضل الخصائص القادره على التنبؤ ، التعامل مع البيانات غير المتوازنة، التصنيف باستخدام نماذج تعلم الالى، وضبط المعايير الفائقة لنماذج التعلم الالى. تشمل المرحله الاولى؛ تقنيات المعالجة المسبقة، تنظيف البيانات، التعامل مع البيانات المفقودة والتوحيد القياسي. كطرق إلزالة القيم المتطرفة في مرحلة المعالجة المسبقة مثل المدى بين الربعين و تقليل العينات باستخدام تقنيه توميك (TLU_R) تم استخدام تقنيه الشجره العظمى (Tree-Extra) لختيار أفضل العناصر القادره على التنبؤ. تم استخدام تقنيه زياده فئه العينه الأقل فى التنبؤ بمرض السكرى و استخدام تقنيه الزياده العشوائيه لفئات العينات الأقل عددا فى مساله التنبؤ بمرض الكبد لمعالجه عدم التوازن الموجود فى البيانات. تم إجراء مقارنات بين أداء المراحل المختلفه و مقارنه بين أداء الخوارزميات المستخدمه للتنبؤ. كما تم تقديم مقترح خوارزميه لتحسين أداء نماذج التنبؤ جديده تعتمد على ظبط المعايير الفائقه لنماذج التنبؤ. هذا المقترح هو استخدام النموذج الرياضى المحاكى لحركه الحيتان فى الصيد و تعديل بعض المعايير فيه باستخدام معادلات العشوائيه فى ظبط معايير نماذج التنبؤ. تم استخدام العديد من مقاييس الأداء لتقييم النموذج المقترح مثل الدقة، الإستدعاء، الدقة التنبؤية، التحديد، المساحة تحت المنحنى .النموذج المقدم تفوق باستمرار على النتائج السابقة عبر جميع معايير الأداء، مما يثبت تفوقه على الأعمال السابقة.

Issues also as CD.

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.
Share
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library