TY - BOOK AU - Ghada Mohammed Mansour Eissa, AU - Shahira Shaaban Azab AU - Hesham Ahmed Hefny TI - Breast cancer prediction using machine learning U1 - 006.31 PY - 2025/// KW - Machine Learning KW - تعلم الآلة KW - EMGD dataset KW - Breast Cancer Prediction KW - Deep Learning Models KW - Voting Ensemble KW - التنبؤ بسرطان الثدي KW - EMGD مجموعة بيانات N1 - Thesis (M.Sc)-Cairo University, 2025; Bibliography: pages 89-99; Issues also as CD N2 - In the past few decades, breast cancer has become a critical global health concern as one of the leading causes of high mortality among women worldwide, linked to the development of modern human civilization. Early detection and prognosis of breast cancer have led to higher cure and survival rates, providing an ideal opportunity for effective treatment. Convolutional neural network (CNN) models have proven effective in classifying and predicting breast cancer tumors using mammography images. Multiclass classifications are used to classify tumors according to the BI-RADS classification system. This research aims to conduct a comparative analysis to explore the results of breast cancer prediction using DL models and voting ensemble techniques to improve accuracy. This study is based on a dataset from the Nasser Institute for Research and Treatment in Egypt. For the first time, DL models are used on an Egyptian breast cancer x-ray dataset of 1,000 female cases, based on various genetic, geographic, and environmental factors, to predict breast cancer. The investigating such an Egyptian dataset can give a deep understanding of the impact of genetic, geographical, and environmental factors on breast cancer development in Egypt. The dataset was collected from the Mammography Unit at the Oncology Center of the Nasser Institute for Research and Treatment in Egypt, using the HOLOGIC Selenia Dimensions Breast Imaging System. All mammograms were classified according to the BI-RADS classification, which includes four mammograms’ views (RCC, RMLO, LCC, LMLO). A comparative experimental study was conducted on AlexNet, GoogleNet-V3, VGG16, ResNet50, and MobileNet models. The results indicate that ResNet50 and VGG16 achieved higher accuracies of 80% and 79.58%, respectively, while AlexNet, GoogleNet-V3, and MobileNet achieved accuracies of 73%, 78%, and 79.02%, respectively. The voting scores for all models on the same test dataset were 91.6%.; في العقود القليلة الماضية، أصبح سرطان الثدي مصدر قلق صحي عالمي حاسم كأحد الأسباب الرئيسية لارتفاع معدل الوفيات بين النساء في جميع أنحاء العالم، وهو ما ارتبط بتطور الحضارة الإنسانية الحديثة. أدى الكشف المبكر والتنبؤ بسرطان الثدي إلى ارتفاع معدلات الشفاء وبقاء المريض على قيد الحياة، مما يوفر فرصة مثالية للعلاج الفعال. أثبتت نماذج الشبكة العصبية التلافيفية (CNN) فعاليتها في تصنيف وتوقع أورام سرطان الثدي من خلال صور تصوير الثدي بالأشعة السينية لسرطان الثدي. تُستخدم التصنيفات متعددة الفئات في هذه الورقة لإظهار فئة الورم بناءً على تصنيف BI-RADS يهدف هذا البحث إلى إجراء تحليل مقارن لاستكشاف نتائج التنبؤ بسرطان الثدي باستخدام نماذج التعلم العميق وتقنيات مجموعة التصويت لتحقيق دقة أفضل بناءً على مجموعة البيانات المأخوذة من معهد ناصر للبحوث والعلاج في مصر. نستخدم نماذج التعلم العميق لأول مرة على مجموعة بيانات الأشعة السينية لسرطان الثدي المصري المكونة من 1000 حالة أنثوية بناءً على عوامل وراثية وجغرافية وبيئية متنوعة للتنبؤ بسرطان الثدي. نحن نجادل بأن التحقيق في مثل هذه المجموعة من البيانات المصرية يمكن أن يعطي فهمًا عميقًا لتأثير العوامل الوراثية والجغرافية والبيئية على تطور سرطان الثدي في مصر. تم جمع مجموعة البيانات من وحدة التصوير الشعاعي للثدي في مركز الأورام بمعهد ناصر للبحوث والعلاج في مصر، والتي تم التقاطها بواسطة نظام التصوير الشعاعي للثدي HOLOGIC Selenia Dimensions. تم تصنيف جميع صور الأشعة السينية وفقًا لتصنيف BI-RADS، والذي يحتوي على أربع صور للتصوير الشعاعي للثدي (RCC و RMLO و LCC و LMLO). تم إجراء دراسة مقارنة تجريبية على نماذج AlexNet و GoogleNet-V3 و VGG16 و ResNet50 و MobileNet. تشير النتائج إلى أن ResNet50 و VGG16 حققا دقة أعلى بنسبة 80٪ و 79.58٪ على التوالي، بينما حقق AlexNet و GoogleNet-V3 و MobileNet دقة بنسبة 73٪ و 78٪ و 79.02٪ على التوالي. نتائج التصويت لجميع النماذج على نفس مجموعة البيانات الاختبارية 91.60٪ ER -