Using optimization and machine learning methods to improve predictive models of common diseases / (Record no. 175444)

MARC details
000 -LEADER
fixed length control field 06406namaa22004331i 4500
003 - CONTROL NUMBER IDENTIFIER
control field EG-GICUC
005 - أخر تعامل مع التسجيلة
control field 20251103121208.0
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION
fixed length control field 251103s2025 ua a|||frm||| 000 0 eng d
040 ## - CATALOGING SOURCE
Original cataloguing agency EG-GICUC
Language of cataloging eng
Transcribing agency EG-GICUC
Modifying agency EG-GICUC
Description conventions rda
041 0# - LANGUAGE CODE
Language code of text/sound track or separate title eng
Language code of summary or abstract eng
-- ara
049 ## - Acquisition Source
Acquisition Source Deposit
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER
Classification number 510
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC)
Classification number 510
Edition number 21
097 ## - Degree
Degree M.Sc
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC)
Local Call Number Cai01.12.17.M.Sc.2025.Ra.U
100 0# - MAIN ENTRY--PERSONAL NAME
Authority record control number or standard number Radwa Taher Mohamed Khalil,
Preparation preparation.
245 10 - TITLE STATEMENT
Title Using optimization and machine learning methods to improve predictive models of common diseases /
Statement of responsibility, etc. by Radwa Taher Mohamed Khalil ; Supervisors Dr. Areeg Abdalla, Dr. Sameh Hassanien Basha.
246 15 - VARYING FORM OF TITLE
Title proper/short title استخدام طرق التحسين و التعلم الألى لرفع كفاءة النماذج التنبؤية ألمراض شائعة
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE
Date of production, publication, distribution, manufacture, or copyright notice 2025.
300 ## - PHYSICAL DESCRIPTION
Extent 94 pages :
Other physical details illustrations ;
Dimensions 25 cm. +
Accompanying material CD.
336 ## - CONTENT TYPE
Content type term text
Source rda content
337 ## - MEDIA TYPE
Media type term Unmediated
Source rdamedia
338 ## - CARRIER TYPE
Carrier type term volume
Source rdacarrier
502 ## - DISSERTATION NOTE
Dissertation note Thesis (M.Sc)-Cairo University, 2025.
504 ## - BIBLIOGRAPHY, ETC. NOTE
Bibliography, etc. note Bibliography: pages 87-94.
520 #3 - SUMMARY, ETC.
Summary, etc. Predicting common diseases is crucial to improve people’s quality of life and save<br/>their lives. There are various methods for early prediction about common diseases,<br/>but they all effort and money consuming. So machine learning algorithms were used<br/>as it can help reduce cost and effort. The goal of our thesis is to enhance these models<br/>and optimize their functionality throughout various stages. Preprocessing, feature se-<br/>lection, handling imbalanced datasets, classification, and hyper parameters fine-tuning<br/>machine learning models comprise the five primary phases of our suggested model flow.<br/>Dataset cleaning, handling missing data and standardization are the techniques used in<br/>preprocessing stage. Tomek-Linked Based Under Sampling (RTLU) and Interquartile<br/>Range (IQR) are used as outlier removing techniques in preprocessing stage. Extra tree<br/>was used for feature selection. Synthetic Minority Over-sampling Technique (SMOTE)<br/>was used in diabetes problem and Random Over Sampling (ROS) was used in liver<br/>disease to address the imbalance in data. Comparisons between different classifiers<br/>have been done. We, also, proposed a novel Chaotic Whale Optimization Algorithm<br/>(CWOA) to tune the hyper-parameters of the classifiers. Several performance evalu-<br/>ation metrics were used to evaluate the proposed model. Accuracy, recall, precision,<br/>specificity, area under curve (AUC) and f-score were used to test the improvement af-<br/>ter each stage. The presented model consistently outperformed earlier findings across<br/>all performance criteria, establishing its superiority on previous work and state of art<br/>classifiers.
520 #3 - SUMMARY, ETC.
Summary, etc. التنبؤ بالأمراض الشائعة أمر بالغ الأهميه لتحسين جودة حياة الناس وإنقاذ حياتهم من الهلاك. هناك طرق تستهلك الجهد مختلفة للتنبؤ المبكر للامراض الشائعة، ولكنها جميعا تستهلك الجهد والمال. لذلك تم استخدام خوارزميات ً التعلم الالى التى يمكن أن تساعد في تقليل التكلفة والجهد. الهدف من أطروحتنا هو تحسين هذه النماذج وتحسين أدائها عبر مراحل متعددة. يتضمن النموذج المقترح خمس مراحل رئيسية: المعالجة المسبقة، اختيار أفضل الخصائص القادره على التنبؤ ، التعامل مع البيانات غير المتوازنة، التصنيف باستخدام نماذج تعلم الالى، وضبط المعايير الفائقة لنماذج التعلم الالى. تشمل المرحله الاولى؛ تقنيات المعالجة المسبقة، تنظيف البيانات، التعامل مع البيانات المفقودة والتوحيد القياسي. كطرق إلزالة القيم المتطرفة في مرحلة المعالجة المسبقة مثل المدى بين الربعين و تقليل العينات باستخدام تقنيه توميك (TLU_R) تم استخدام تقنيه الشجره العظمى (Tree-Extra) لختيار أفضل العناصر القادره على التنبؤ. تم استخدام تقنيه زياده فئه العينه الأقل فى التنبؤ بمرض السكرى و استخدام تقنيه الزياده العشوائيه لفئات العينات الأقل عددا فى مساله التنبؤ بمرض الكبد لمعالجه عدم التوازن الموجود فى البيانات. تم إجراء مقارنات بين أداء المراحل المختلفه و مقارنه بين أداء الخوارزميات المستخدمه للتنبؤ. كما تم تقديم مقترح خوارزميه لتحسين أداء نماذج التنبؤ جديده تعتمد على ظبط المعايير الفائقه لنماذج التنبؤ. هذا المقترح هو استخدام النموذج الرياضى المحاكى لحركه الحيتان فى الصيد و تعديل بعض المعايير فيه باستخدام معادلات العشوائيه فى ظبط معايير نماذج التنبؤ. تم استخدام العديد من مقاييس الأداء لتقييم النموذج المقترح مثل الدقة، الإستدعاء، الدقة التنبؤية، التحديد، المساحة تحت المنحنى .النموذج المقدم تفوق باستمرار على النتائج السابقة عبر جميع معايير الأداء، مما يثبت تفوقه على الأعمال السابقة.
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE
Issues CD Issues also as CD.
546 ## - LANGUAGE NOTE
Text Language Text in English and abstract in Arabic & English.
650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM
Topical term or geographic name entry element Mathematics
650 #0 - SUBJECT ADDED ENTRY--TOPICAL TERM
Topical term or geographic name entry element الرياضيات
653 #0 - INDEX TERM--UNCONTROLLED
Uncontrolled term Artifial intelligence
-- Machine learning
-- Common disease Prediction
-- Diabetes prediciton
-- Liver prediction
-- Swarm Optimization
-- Chaotic Equations
700 0# - ADDED ENTRY--PERSONAL NAME
Personal name Areeg Abdalla
Relator term thesis advisor.
700 0# - ADDED ENTRY--PERSONAL NAME
Personal name Sameh Hassanien Basha
Relator term thesis advisor.
900 ## - Thesis Information
Grant date 01-01-2025
Supervisory body Areeg Abdalla
-- Sameh Hassanien Basha
Universities Cairo University
Faculties Faculty of Science
Department Department of Mathematics
905 ## - Cataloger and Reviser Names
Cataloger Name Shimaa
942 ## - ADDED ENTRY ELEMENTS (KOHA)
Source of classification or shelving scheme Dewey Decimal Classification
Koha item type Thesis
Edition 21
Suppress in OPAC No
Holdings
Source of classification or shelving scheme Home library Current library Date acquired Inventory number Full call number Barcode Date last seen Effective from Koha item type
Dewey Decimal Classification المكتبة المركزبة الجديدة - جامعة القاهرة قاعة الرسائل الجامعية - الدور الاول 03.11.2025 92340 Cai01.12.17.M.Sc.2025.Ra.U 01010110092340000 03.11.2025 03.11.2025 Thesis
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library