TY - BOOK AU - Malak Hassan Mostafa ElBakry, AU - Sherif Mazen AU - Ayman El-Kilany AU - Farid Ali TI - Data cleaning using predictive techniques U1 - 003.3 PY - 2025/// KW - Data processing KW - معالجة البيانات KW - Data Quality KW - Missing Data KW - Machine Learning KW - Fuzzy Logic KW - Time Series Data KW - Data Imputation N1 - Thesis (Ph.D)-Cairo University, 2025; Bibliography: pages 78-84.; Issues also as CD N2 - Handling missing values in time series data is a crucial challenge in data analysis.This thesis addresses the challenge of missing values in time series data by proposing two novel imputation techniques. The first uses fuzzy logic, utilizing fuzzy Gaussian and fuzzy triangular membership functions to determine the imputed values based on weighted nearest neighbor. Results show that the fuzzy triangular yield superior accuracy compared to the others. The second approach introduces a predictive ensemble framework called Predictive Missing Values via Voting Ensemble (PMVVE)that integrates multiple classifiers, outperforming traditional methods in accuracy and reliability across real-world datasets; يواجه تحليل بيانات السلاسل الزمنية تحديًا بسبب القيم المفقودة، حيث تؤثر على دقة النماذج واتخاذ القرار. يقترح البحث تقنيتين جديدتين لتعويض القيم المفقودة.يعتمد النهج الأول على المنطق الضبابي، حيث يستخدم التوزيع الغاوسي الضبابي ودالة الانتماء المثلثية الضبابية لتحديد القيم المثلى بناءً على حسابات الجار الأقرب الموزون.أظهرت النتائج التجريبية تفوق هذه الطريقة على التقنيات التقليدية، حيث تفوقت دالة الانتماء المثلثية الضبابية من حيث الدقة مقارنةً بالتوزيع الغاوسي الضبابي.أما النهج الثاني، فيقدم إطارًا تنبؤيًا قائمًا على أسلوب التجميع، يُعرف باسم "التنبؤ بالقيم المفقودة عبر التجميع بالتصويت."يدمج هذا النهج بين عدة مصنفات من تعلم الآلة للتنبؤ بالقيم المفقودة بشكل أكثر كفاءة. أثبتت التقييمات التجريبية، التي أجريت على مجموعات بيانات حقيقية متعددة، أن تقنية التنبؤ بالقيم المفقودة عبر التجميع بالتصويتتتفوق على الطرق التقليدية، حيث توفر دقة أعلى وموثوقية أكبر في إكمال البيانات المفقودة ER -