Data cleaning using predictive techniques / by Malak Hassan Mostafa ElBakry ; Supervised Prof. Dr. Sherif Mazen, Dr.Ayman El-Kilany, Prof. Farid Ali
Material type:
TextLanguage: English Summary language: English, Arabic Producer: 2025Description: 84 Leaves : illustrations ; 30 cm. + CDContent type: - text
- Unmediated
- volume
- تنقية البيانات باستخدام تقنيات التنبؤية [Added title page title]
- 003.3
- Issues also as CD.
| Item type | Current library | Home library | Call number | Status | Barcode | |
|---|---|---|---|---|---|---|
Thesis
|
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.20.04.Ph.D.2024.Ma.D (Browse shelf(Opens below)) | Not for loan | 01010110092301000 |
Browsing المكتبة المركزبة الجديدة - جامعة القاهرة shelves Close shelf browser (Hides shelf browser)
| No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | ||
| Cai01.20.04.Ph.D.2023.Sh.H. Handling Data Heterogeneity in Internet of Things / | Cai01.20.04.Ph.D.2024.Do.M. Multi Data Fusion in Smart Environment / | Cai01.20.04.Ph.D.2024.Ez.M Managing quality requirements in agile software development / | Cai01.20.04.Ph.D.2024.Ma.D Data cleaning using predictive techniques / | Cai01.20.04.Ph.D.2024.Mo.D Data Analytics Framework of IoT Based Smart Resource Management Systems / | Cai01.20.04.Ph.D.2024.Mo.P A proposed Framework for Digital Transformation Projects/ | Cai01.20.05.M.Sc.2020.Ah.S A system to remediate cross-site scripting vulnerabilities / |
Thesis (Ph.D)-Cairo University, 2025.
Bibliography: pages 78-84.
Handling missing values in time series data is a crucial challenge in data analysis.This thesis addresses the challenge of missing values in time series data by proposing two novel imputation techniques. The first uses fuzzy logic, utilizing fuzzy Gaussian and fuzzy triangular membership functions to determine the imputed values based on weighted nearest neighbor. Results show that the fuzzy triangular yield superior accuracy compared to the others. The second approach introduces a predictive ensemble framework called Predictive Missing Values via Voting Ensemble (PMVVE)that integrates multiple classifiers, outperforming traditional methods in accuracy and reliability across real-world datasets.
يواجه تحليل بيانات السلاسل الزمنية تحديًا بسبب القيم المفقودة، حيث تؤثر على دقة النماذج واتخاذ القرار. يقترح البحث تقنيتين جديدتين لتعويض القيم المفقودة.يعتمد النهج الأول على المنطق الضبابي، حيث يستخدم التوزيع الغاوسي الضبابي ودالة الانتماء المثلثية الضبابية لتحديد القيم المثلى بناءً على حسابات الجار الأقرب الموزون.أظهرت النتائج التجريبية تفوق هذه الطريقة على التقنيات التقليدية، حيث تفوقت دالة الانتماء المثلثية الضبابية من حيث الدقة مقارنةً بالتوزيع الغاوسي الضبابي.أما النهج الثاني، فيقدم إطارًا تنبؤيًا قائمًا على أسلوب التجميع، يُعرف باسم "التنبؤ بالقيم المفقودة عبر التجميع بالتصويت."يدمج هذا النهج بين عدة مصنفات من تعلم الآلة للتنبؤ بالقيم المفقودة بشكل أكثر كفاءة. أثبتت التقييمات التجريبية، التي أجريت على مجموعات بيانات حقيقية متعددة، أن تقنية التنبؤ بالقيم المفقودة عبر التجميع بالتصويتتتفوق على الطرق التقليدية، حيث توفر دقة أعلى وموثوقية أكبر في إكمال البيانات المفقودة.
Issues also as CD.
Text in English and abstract in Arabic & English.
There are no comments on this title.