Application of machine learning on residential and commercial projects : a framework for cost estimation /
: تطبيق التعلُّم الآلي في المشروعات السكنية والتجارية / هيكل لتقدير التكلفة
by Omar Tarek Nada Habib ; Supervision of Dr. Mona Metwally Abouhamad , Dr. AbdElMoniem Bayoumi.
- 187 pages : illustrations ; 30 cm. + CD.
Thesis (M.Sc.)-Cairo University, 2023.
Bibliography: pages 67-72.
onstruction contributes significantly to the economies of world countries. Remarkably, most projects suffer cost overruns as a result of cost estimation issues. This research introduces a new methodology to overcome cost estimation shortcomings in the construction industry. The proposed study aims to estimate construction costs using a random forest (RF) regression model. The research’s undertaken methodology incorporates three main components, namely; (1) dataset preprocessing and features selection, (2) program modelling, and (3) assessment and analysis. San Francisco’s (USA) buildings dataset is used to feed the model after being preprocessed. Python programming language is utilized to code the RF regression model. After conducting ten separate model runs, outcomes are extracted for further analysis. Class (2) of the AACE’s cost estimate classification system is used for assessment. The results indicate that the RF regression model can accurately estimate costs exceeding the selected accuracy range in a matter of few hours. This research demonstrates that RFs specifically and machine learning generally can accurately and rapidly predict construction costs, thus solving most estimating problems and enhancing the overall estimation process in the industry for both owners and contractors. تُعتبر صناعة التشييد من أهم الصناعات المؤثرة في مؤشر الناتج المحلي الإجمالي في مصر والعالم أجمع، نظرًا لكونها مُكوّن كبير من اقتصادات الدول، بالإضافة إلى وفرة القوى العاملة بهذا القطاع. على صعيدٍ أخر، تُعاني مشروعات التشييد بشكل كبير من تخطي التكلفة المٌقدّرة بالمراحل الأولية، الأمر الذي يُهدد استكمال هذه المشاريع في بعض الأحيان ويؤثر على نجاحها في البعض الأخر. في هذا الصدد، يُقدّم هذا البحث آلية جديدة لمعالجة عيوب أنظمة تقدير التكلفة الحالية بمشروعات التشييد. تهدُف هذه الدراسة إلى تقدير تكاليف التشييد باستخدام خوارزمية الغابات العشوائية من نظام التعلُّم الآلي. يعتمد الإطار الخاص بهذا البحث على ثلاث أعمدة رئيسية متمثلة في؛ (1) جمع وتنسيق المعلومات، (2) برمجة الكود الهندسي، و(3) التقييم والتحليل. تم استخدام قاعدة بيانات المباني الخاصة بولاية سان فرانسيسكو (الولايات المُتحدة الأمريكية) لتغذية البرنامج، وذلك بعد اتمام عملية التنسيق اللازمة. بعد القيام بعشر اختبارات لخوارزمية الغابات العشوائية، تم استخراج النتائج من البرنامج للقيام بالتحليل المطلوب. أظهرت النتائج نجاح الغابات العشوائية في إصدار تقديرات دقيقة لتكاليف التشييد، مُتخطية مُعدّلات الصناعة المقبولة، وذلك في ساعات معدودة فقط. نجحت هذه الدراسة في توضيح قدرة خوارزمية الغابات العشوائية بشكل خاص، ونظام التعلُّم الآلي بشكل عام، في تقدير تكاليف التشييد بدقة وسرعة شديدتين، الأمر الذي يؤكد فاعليتها في حل مشاكل تقدير التكلفة التي تواجهها صناعة التشييد مع توفير الحلول المطلوبة من قِبل أصحاب العمل والمقاولين على حدٍ سواء.
Text in English and abstract in Arabic & English.
residential projects
Construction Projects Cost Estimation Machine Learning Random Forest Datasets