000 11714namaa22004331i 4500
003 EG-GICUC
005 20260312151702.0
008 260312s2025 ua a|||frm||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a005.12
092 _a005.12
_221
097 _aPh.D
099 _aCai01.18.07.Ph.D.2025.Ah.I
100 0 _aAhmed Ali Mohamed Warad,
_epreparation.
245 1 0 _aIntelligent Approach for Forecasting Water Leakage /
_cby Ahmed Ali Mohamed Warad ; Supervised Prof. Dr. Nagy Ramadan Darwish, Prof. Dr. Khaled Tawfik Wassif.
246 1 5 _aنهج ذكي للتنبؤ بتسرب المياه
264 0 _c2025.
300 _a155 Leaves :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (Ph.D)-Cairo University, 2025.
504 _aBibliography: pages 139 -153.
520 3 _aMachine Learning (ML), a key field within artificial intelligence, emphasizes the application of data and algorithms to empower machines to learn from experience and make autonomous decisions, ultimately enhancing human lives and solving complex challenges. On the other hand, Water distribution networks are essential to urban infrastructure, yet they face persistent challenges due to aging pipelines, frequent failures, and inefficient maintenance strategies. Water leakage not only results in the loss of valuable resources but also contributes to infrastructure deterioration, increased operational costs, and service disruptions. These issues are particularly pronounced in large-scale networks such as that of Alexandria, Egypt, where legacy systems and diverse pipe materials complicate predictive planning. This thesis addresses these challenges by proposing an intelligent, data-driven framework that integrates ML techniques into information systems to forecast two critical indicators of pipeline performance: repair time and failure rate. The research introduces two predictive approaches developed using comprehensive datasets provided by the Alexandria Water Company (AWCO). The first proposed approach centers on predicting pipeline failure rates using an ensemble learning model enhanced through Bayesian hyperparameter optimization. The model was trained on the Water-Pipes Factors (WPF) dataset, which includes 63,423 data points covering Alexandria’s entire water network—comprising 3,545 kilometers of main pipelines, 9,373 kilometers of distribution lines, and over 1.95 million service connections. The dataset incorporates variables such as pipe material (e.g., HDPE, cast iron, PVC), installation year, geographic location, and environmental conditions. Key hyperparameters—including minimum leaf size, learning rate, number of learners, and number of predictors to sample—were optimized to improve model accuracy. The final model achieved a minimum RMSE of 0.00231 and MAE of 0.00071513, providing granular insights into the probability of pipeline failure across the network. The second proposed approach focuses on forecasting repair time using supervised regression models. Seven ML algorithms—including Linear Regression, Support Vector Machines, Decision Trees, and ensemble methods such as AdaBoost and Gradient Boosting—were evaluated using the Water-Pipe Breaks (WPB) dataset, which contains 4,989 records spanning six years (2017–2022). The target variable, repair time, is treated as a continuous value ranging from 1 to 12 hours. Experimental results demonstrate that ensemble models significantly outperform traditional approaches, with AdaBoost achieving an R² of 1.000 and RMSE of 0.057, and Gradient Boosting achieving an R² of 0.996 and RMSE of 0.231. These findings establish a novel application of ML in forecasting repair durations, offering utility companies a reliable tool for annual maintenance planning and resource allocation. Both methodologies are designed to be integrated into intelligent decision support systems (DSS) within water utility information systems. By embedding predictive analytics into operational workflows, the proposed framework enables utility managers to prioritize pipeline rehabilitation based on failure likelihood, optimize repair crew deployment and scheduling, reduce water loss and service downtime, and transition from reactive to proactive infrastructure management This thesis contributes to the field of Information Systems and Technology by demonstrating the practical integration of ML into infrastructure management systems. It introduces repair time forecasting as a novel ML application in water utilities and showcases the effectiveness of ensemble learning with hyperparameter optimization in failure rate prediction. The proposed framework supports the development of smart, adaptive infrastructure systems and aligns with global efforts toward sustainable urban development.
520 3 _aالتعلم الآلي (Machine Learning - ML) يُعتبر أحد فروع الذكاء الاصطناعي، حيث يركز على استخدام البيانات والخوارزميات لتمكين الآلات من التعلم واتخاذ قرارات مبنية على المعلومات، بهدف تحسين أنماط الحياة البشرية. وعلى الجانب الآخر، تُعد شبكات توزيع المياه من الركائز الأساسية للبنية التحتية الحضرية، إلا أنها تواجه تحديات متزايدة نتيجة تقادم الأنابيب، وتكرار الأعطال، وضعف كفاءة استراتيجيات الصيانة. تؤدي تسربات المياه إلى فقدان موارد ثمينة، وتدهور البنية التحتية، وارتفاع التكاليف التشغيلية، فضلاً عن تعطيل الخدمات. وتزداد هذه التحديات تعقيدًا في الشبكات واسعة النطاق مثل شبكة مدينة الإسكندرية، حيث تتداخل الأنظمة القديمة مع تنوع المواد المستخدمة في الأنابيب، مما يصعّب من عمليات التنبؤ والتخطيط. تهدف هذه الرسالة إلى معالجة هذه المشكلات من خلال تطوير إطار ذكي قائم على البيانات، يدمج تقنيات التعلم الآلي (Machine Learning) ضمن نظم المعلومات، للتنبؤ بمؤشرين حيويين لأداء الشبكة وهما: مدة الإصلاح ومعدل الفشل. وقد تم تطوير منهجين تنبؤيين اعتمادًا على مجموعة بيانات شاملة مقدمة من شركة مياه الإسكندرية (AWCO). يركز النهج الأول على التنبؤ بمعدلات فشل الأنابيب باستخدام نموذج تعلم تجميعي (Ensemble Learning) تم تحسينه عبر خوارزمية بايزية لضبط المعاملات (Bayesian Optimization). تم تدريب النموذج على مجموعة بيانات "عوامل أنابيب المياه" (WPF) التي تضم 63,423 نقطة بيانات تغطي شبكة المياه بالكامل في الإسكندرية، والتي تشمل 3,545 كيلومترًا من الأنابيب الرئيسية، و9,373 كيلومترًا من خطوط التوزيع، وأكثر من 1.95 مليون توصيلة خدمية. تتضمن البيانات معلومات عن نوع المادة (مثل البولي إيثيلين عالي الكثافة، والحديد الزهر، وكلوريد البوليفينيل)، وسنة التركيب، والموقع الجغرافي، والظروف البيئية. وقد تم تحسين معاملات النموذج مثل حجم الورقة الأدنى، ومعدل التعلم، وعدد المتعلمين، وعدد المتغيرات المختارة، مما أدى إلى تحقيق دقة تنبؤية عالية، حيث بلغ أقل معدل للخطأ التربيعي الجذري (RMSE) 0.00231، ومتوسط الخطأ المطلق (MAE) 0.00071513، مما يوفر رؤى دقيقة حول احتمالية فشل الأنابيب. أما النهج الثاني، فيتناول التنبؤ بمدة الإصلاح باستخدام نماذج الانحدار الخاضعة للإشراف (Supervised Regression). تم تقييم سبعة خوارزميات تعلم آلي، منها الانحدار الخطي، وآلة الدعم الناقل، وأشجار القرار، بالإضافة إلى نماذج التجميع مثل AdaBoost وGradient Boosting، وذلك باستخدام مجموعة بيانات "أعطال أنابيب المياه" (WPB) التي تحتوي على 4,989 سجلًا تغطي الفترة من 2017 إلى 2022. تم اعتبار مدة الإصلاح كمتغير مستمر يتراوح بين 1 إلى 12 ساعة. أظهرت النتائج أن نماذج التجميع تتفوق بشكل ملحوظ على النماذج التقليدية، حيث حقق نموذج AdaBoost معامل تحديد (R²) قدره 1.000 وخطأ تربيعي جذري (RMSE) قدره 0.057، بينما حقق Gradient Boosting معامل تحديد قدره 0.996 وخطأ قدره 0.231. وتُعد هذه النتائج مساهمة جديدة في مجال التنبؤ بمدة الإصلاح باستخدام تقنيات التعلم الآلي. تم تصميم كلا النهجين ليتم دمجهما ضمن نظم دعم اتخاذ القرار الذكية (DSS) في أنظمة معلومات شركات المياه، مما يتيح لمديري المرافق لتحديد أولويات إعادة تأهيل الشبكة بناءً على احتمالية الفشل وتحسين توزيع فرق الإصلاح وجدولة أعمال الصيانة وتقليل فاقد المياه وتقليص فترات توقف الخدمة والتحول من الإدارة التفاعلية إلى الإدارة الاستباقية للبنية التحتية تُسهم هذه الرسالة في مجال نظم المعلومات والتقنية من خلال عرض تطبيق عملي لتقنيات التعلم الآلي في إدارة البنية التحتية، وتقديم نموذج تنبؤي جديد لمدد الإصلاح، وإثبات فعالية التعلم التجميعي المحسن في التنبؤ بمعدلات الفشل. كما يدعم الإطار المقترح تطوير أنظمة ذكية وتكيفية للبنية التحتية، ويتماشى مع التوجهات العالمية نحو التنمية الحضرية المستدامة والتحول الرقمي في إدارة المرافق.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 0 _aInformation Systems and Technology
651 7 _aنظم وتكنولوجيا المعلومات
653 1 _aEnsemble Learning
_a Water Leakage Forecasting
_aFailure Rate
_aRepair Time
_apipeline System
_aLeak Detection
_aIntelligent and Prediction
_a Water Distribution Network
_aالتعلم الجماعي
_aالتنبؤ بتسرب المياه
700 0 _aNagy Ramadan Darwish
_ethesis advisor.
700 0 _aKhaled Tawfik Wassif
_ethesis advisor.
900 _b01-01-2025
_cNagy Ramadan Darwish
_cKhaled Tawfik Wassif
_UCairo University
_FFaculty of Graduate Studies for Statistical Research
_DDepartment of Information Systems and Technology
905 _aShimaa
942 _2ddc
_cTH
_e21
_n0
999 _c178989