Intelligent Approach for Forecasting Water Leakage /

Ahmed Ali Mohamed Warad,

Intelligent Approach for Forecasting Water Leakage / نهج ذكي للتنبؤ بتسرب المياه by Ahmed Ali Mohamed Warad ; Supervised Prof. Dr. Nagy Ramadan Darwish, Prof. Dr. Khaled Tawfik Wassif. - 155 Leaves : illustrations ; 30 cm. + CD.

Thesis (Ph.D)-Cairo University, 2025.

Bibliography: pages 139 -153.

Machine Learning (ML), a key field within artificial intelligence, emphasizes the application of data and algorithms to empower machines to learn from experience and make autonomous decisions, ultimately enhancing human lives and solving complex challenges. On the other hand, Water distribution networks are essential to urban infrastructure, yet they face persistent challenges due to aging pipelines, frequent failures, and inefficient maintenance strategies. Water leakage not only results in the loss of valuable resources but also contributes to infrastructure deterioration, increased operational costs, and service disruptions. These issues are particularly pronounced in large-scale networks such as that of Alexandria, Egypt, where legacy systems and diverse pipe materials complicate predictive planning. This thesis addresses these challenges by proposing an intelligent, data-driven framework that integrates ML techniques into information systems to forecast two critical indicators of pipeline performance: repair time and failure rate.
The research introduces two predictive approaches developed using comprehensive datasets provided by the Alexandria Water Company (AWCO). The first proposed approach centers on predicting pipeline failure rates using an ensemble learning model enhanced through Bayesian hyperparameter optimization. The model was trained on the Water-Pipes Factors (WPF) dataset, which includes 63,423 data points covering Alexandria’s entire water network—comprising 3,545 kilometers of main pipelines, 9,373 kilometers of distribution lines, and over 1.95 million service connections. The dataset incorporates variables such as pipe material (e.g., HDPE, cast iron, PVC), installation year, geographic location, and environmental conditions. Key hyperparameters—including minimum leaf size, learning rate, number of learners, and number of predictors to sample—were optimized to improve model accuracy. The final model achieved a minimum RMSE of 0.00231 and MAE of 0.00071513, providing granular insights into the probability of pipeline failure across the network.
The second proposed approach focuses on forecasting repair time using supervised regression models. Seven ML algorithms—including Linear Regression, Support Vector Machines, Decision Trees, and ensemble methods such as AdaBoost and Gradient Boosting—were evaluated using the Water-Pipe Breaks (WPB) dataset, which contains 4,989 records spanning six years (2017–2022). The target variable, repair time, is treated as a continuous value ranging from 1 to 12 hours. Experimental results demonstrate that ensemble models significantly outperform traditional approaches, with AdaBoost achieving an R² of 1.000 and RMSE of 0.057, and Gradient Boosting achieving an R² of 0.996 and RMSE of 0.231. These findings establish a novel application of ML in forecasting repair durations, offering utility companies a reliable tool for annual maintenance planning and resource allocation.
Both methodologies are designed to be integrated into intelligent decision support systems (DSS) within water utility information systems. By embedding predictive analytics into operational workflows, the proposed framework enables utility managers to prioritize pipeline rehabilitation based on failure likelihood, optimize repair crew deployment and scheduling, reduce water loss and service downtime, and transition from reactive to proactive infrastructure management
This thesis contributes to the field of Information Systems and Technology by demonstrating the practical integration of ML into infrastructure management systems. It introduces repair time forecasting as a novel ML application in water utilities and showcases the effectiveness of ensemble learning with hyperparameter optimization in failure rate prediction. The proposed framework supports the development of smart, adaptive infrastructure systems and aligns with global efforts toward sustainable urban development. التعلم الآلي (Machine Learning - ML) يُعتبر أحد فروع الذكاء الاصطناعي، حيث يركز على استخدام البيانات والخوارزميات لتمكين الآلات من التعلم واتخاذ قرارات مبنية على المعلومات، بهدف تحسين أنماط الحياة البشرية. وعلى الجانب الآخر، تُعد شبكات توزيع المياه من الركائز الأساسية للبنية التحتية الحضرية، إلا أنها تواجه تحديات متزايدة نتيجة تقادم الأنابيب، وتكرار الأعطال، وضعف كفاءة استراتيجيات الصيانة. تؤدي تسربات المياه إلى فقدان موارد ثمينة، وتدهور البنية التحتية، وارتفاع التكاليف التشغيلية، فضلاً عن تعطيل الخدمات. وتزداد هذه التحديات تعقيدًا في الشبكات واسعة النطاق مثل شبكة مدينة الإسكندرية، حيث تتداخل الأنظمة القديمة مع تنوع المواد المستخدمة في الأنابيب، مما يصعّب من عمليات التنبؤ والتخطيط.
تهدف هذه الرسالة إلى معالجة هذه المشكلات من خلال تطوير إطار ذكي قائم على البيانات، يدمج تقنيات التعلم الآلي (Machine Learning) ضمن نظم المعلومات، للتنبؤ بمؤشرين حيويين لأداء الشبكة وهما: مدة الإصلاح ومعدل الفشل. وقد تم تطوير منهجين تنبؤيين اعتمادًا على مجموعة بيانات شاملة مقدمة من شركة مياه الإسكندرية (AWCO).
يركز النهج الأول على التنبؤ بمعدلات فشل الأنابيب باستخدام نموذج تعلم تجميعي (Ensemble Learning) تم تحسينه عبر خوارزمية بايزية لضبط المعاملات (Bayesian Optimization). تم تدريب النموذج على مجموعة بيانات "عوامل أنابيب المياه" (WPF) التي تضم 63,423 نقطة بيانات تغطي شبكة المياه بالكامل في الإسكندرية، والتي تشمل 3,545 كيلومترًا من الأنابيب الرئيسية، و9,373 كيلومترًا من خطوط التوزيع، وأكثر من 1.95 مليون توصيلة خدمية. تتضمن البيانات معلومات عن نوع المادة (مثل البولي إيثيلين عالي الكثافة، والحديد الزهر، وكلوريد البوليفينيل)، وسنة التركيب، والموقع الجغرافي، والظروف البيئية. وقد تم تحسين معاملات النموذج مثل حجم الورقة الأدنى، ومعدل التعلم، وعدد المتعلمين، وعدد المتغيرات المختارة، مما أدى إلى تحقيق دقة تنبؤية عالية، حيث بلغ أقل معدل للخطأ التربيعي الجذري (RMSE) 0.00231، ومتوسط الخطأ المطلق (MAE) 0.00071513، مما يوفر رؤى دقيقة حول احتمالية فشل الأنابيب.
أما النهج الثاني، فيتناول التنبؤ بمدة الإصلاح باستخدام نماذج الانحدار الخاضعة للإشراف (Supervised Regression). تم تقييم سبعة خوارزميات تعلم آلي، منها الانحدار الخطي، وآلة الدعم الناقل، وأشجار القرار، بالإضافة إلى نماذج التجميع مثل AdaBoost وGradient Boosting، وذلك باستخدام مجموعة بيانات "أعطال أنابيب المياه" (WPB) التي تحتوي على 4,989 سجلًا تغطي الفترة من 2017 إلى 2022. تم اعتبار مدة الإصلاح كمتغير مستمر يتراوح بين 1 إلى 12 ساعة. أظهرت النتائج أن نماذج التجميع تتفوق بشكل ملحوظ على النماذج التقليدية، حيث حقق نموذج AdaBoost معامل تحديد (R²) قدره 1.000 وخطأ تربيعي جذري (RMSE) قدره 0.057، بينما حقق Gradient Boosting معامل تحديد قدره 0.996 وخطأ قدره 0.231. وتُعد هذه النتائج مساهمة جديدة في مجال التنبؤ بمدة الإصلاح باستخدام تقنيات التعلم الآلي.
تم تصميم كلا النهجين ليتم دمجهما ضمن نظم دعم اتخاذ القرار الذكية (DSS) في أنظمة معلومات شركات المياه، مما يتيح لمديري المرافق لتحديد أولويات إعادة تأهيل الشبكة بناءً على احتمالية الفشل وتحسين توزيع فرق الإصلاح وجدولة أعمال الصيانة وتقليل فاقد المياه وتقليص فترات توقف الخدمة والتحول من الإدارة التفاعلية إلى الإدارة الاستباقية للبنية التحتية
تُسهم هذه الرسالة في مجال نظم المعلومات والتقنية من خلال عرض تطبيق عملي لتقنيات التعلم الآلي في إدارة البنية التحتية، وتقديم نموذج تنبؤي جديد لمدد الإصلاح، وإثبات فعالية التعلم التجميعي المحسن في التنبؤ بمعدلات الفشل. كما يدعم الإطار المقترح تطوير أنظمة ذكية وتكيفية للبنية التحتية، ويتماشى مع التوجهات العالمية نحو التنمية الحضرية المستدامة والتحول الرقمي في إدارة المرافق.




Text in English and abstract in Arabic & English.


Information Systems and Technology


نظم وتكنولوجيا المعلومات

Ensemble Learning Water Leakage Forecasting Failure Rate Repair Time pipeline System Leak Detection Intelligent and Prediction Water Distribution Network التعلم الجماعي التنبؤ بتسرب المياه

005.12
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library