Breast cancer prediction using machine learning /

Ghada Mohammed Mansour Eissa,

Breast cancer prediction using machine learning / التنبؤ بسرطان الثدي باستخدام تعلم الآلة by Ghada Mohammed Mansour Eissa ; Supervised Dr. Shahira Shaaban Azab, Prof. Hesham Ahmed Hefny. - 119 Leaves : illustrations ; 30 cm. + CD.

Thesis (M.Sc)-Cairo University, 2025.

Bibliography: pages 89-99.

In the past few decades, breast cancer has become a critical global health concern as one
of the leading causes of high mortality among women worldwide, linked to the
development of modern human civilization. Early detection and prognosis of breast cancer
have led to higher cure and survival rates, providing an ideal opportunity for effective
treatment. Convolutional neural network (CNN) models have proven effective in
classifying and predicting breast cancer tumors using mammography images. Multiclass
classifications are used to classify tumors according to the BI-RADS classification system.
This research aims to conduct a comparative analysis to explore the results of breast cancer
prediction using DL models and voting ensemble techniques to improve accuracy. This
study is based on a dataset from the Nasser Institute for Research and Treatment in Egypt.
For the first time, DL models are used on an Egyptian breast cancer x-ray dataset of 1,000
female cases, based on various genetic, geographic, and environmental factors, to predict
breast cancer. The investigating such an Egyptian dataset can give a deep understanding of
the impact of genetic, geographical, and environmental factors on breast cancer
development in Egypt. The dataset was collected from the Mammography Unit at the
Oncology Center of the Nasser Institute for Research and Treatment in Egypt, using the
HOLOGIC Selenia Dimensions Breast Imaging System. All mammograms were classified
according to the BI-RADS classification, which includes four mammograms’ views (RCC,
RMLO, LCC, LMLO). A comparative experimental study was conducted on AlexNet,
GoogleNet-V3, VGG16, ResNet50, and MobileNet models. The results indicate that
ResNet50 and VGG16 achieved higher accuracies of 80% and 79.58%, respectively, while
AlexNet, GoogleNet-V3, and MobileNet achieved accuracies of 73%, 78%, and 79.02%,
respectively. The voting scores for all models on the same test dataset were 91.6%. في العقود القليلة الماضية، أصبح سرطان الثدي مصدر قلق صحي عالمي حاسم كأحد الأسباب الرئيسية لارتفاع معدل الوفيات بين النساء في جميع أنحاء العالم، وهو ما ارتبط بتطور الحضارة الإنسانية الحديثة. أدى الكشف المبكر والتنبؤ بسرطان الثدي إلى ارتفاع معدلات الشفاء وبقاء المريض على قيد الحياة، مما يوفر فرصة مثالية للعلاج الفعال. أثبتت نماذج الشبكة العصبية التلافيفية (CNN) فعاليتها في تصنيف وتوقع أورام سرطان الثدي من خلال صور تصوير الثدي بالأشعة السينية لسرطان الثدي. تُستخدم التصنيفات متعددة الفئات في هذه الورقة لإظهار فئة الورم بناءً على تصنيف BI-RADS يهدف هذا البحث إلى إجراء تحليل مقارن لاستكشاف نتائج التنبؤ بسرطان الثدي باستخدام نماذج التعلم العميق وتقنيات مجموعة التصويت لتحقيق دقة أفضل بناءً على مجموعة البيانات المأخوذة من معهد ناصر للبحوث والعلاج في مصر.
نستخدم نماذج التعلم العميق لأول مرة على مجموعة بيانات الأشعة السينية لسرطان الثدي المصري المكونة من 1000 حالة أنثوية بناءً على عوامل وراثية وجغرافية وبيئية متنوعة للتنبؤ بسرطان الثدي. نحن نجادل بأن التحقيق في مثل هذه المجموعة من البيانات المصرية يمكن أن يعطي فهمًا عميقًا لتأثير العوامل الوراثية والجغرافية والبيئية على تطور سرطان الثدي في مصر. تم جمع مجموعة البيانات من وحدة التصوير الشعاعي للثدي في مركز الأورام بمعهد ناصر للبحوث والعلاج في مصر، والتي تم التقاطها بواسطة نظام التصوير الشعاعي للثدي HOLOGIC Selenia Dimensions. تم تصنيف جميع صور الأشعة السينية وفقًا لتصنيف BI-RADS، والذي يحتوي على أربع صور للتصوير الشعاعي للثدي (RCC و RMLO و LCC و LMLO). تم إجراء دراسة مقارنة تجريبية على نماذج AlexNet و GoogleNet-V3 و VGG16 و ResNet50 و MobileNet. تشير النتائج إلى أن ResNet50 و VGG16 حققا دقة أعلى بنسبة 80٪ و 79.58٪ على التوالي، بينما حقق AlexNet و GoogleNet-V3 و MobileNet دقة بنسبة 73٪ و 78٪ و 79.02٪ على التوالي. نتائج التصويت لجميع النماذج على نفس مجموعة البيانات الاختبارية 91.60٪.




Text in English and abstract in Arabic & English.


Machine Learning
تعلم الآلة

EMGD dataset Breast Cancer Prediction Deep Learning Models Voting Ensemble التنبؤ بسرطان الثدي EMGD مجموعة بيانات

006.31
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library