Image from OpenLibrary

Data cleaning using predictive techniques / by Malak Hassan Mostafa ElBakry ; Supervised Prof. Dr. Sherif Mazen, Dr.Ayman El-Kilany, Prof. Farid Ali

By: Contributor(s): Material type: TextLanguage: English Summary language: English, Arabic Producer: 2025Description: 84 Leaves : illustrations ; 30 cm. + CDContent type:
  • text
Media type:
  • Unmediated
Carrier type:
  • volume
Other title:
  • تنقية البيانات باستخدام تقنيات التنبؤية [Added title page title]
Subject(s): DDC classification:
  • 003.3
Available additional physical forms:
  • Issues also as CD.
Dissertation note: Thesis (Ph.D)-Cairo University, 2025. Summary: Handling missing values in time series data is a crucial challenge in data analysis.This thesis addresses the challenge of missing values in time series data by proposing two novel imputation techniques. The first uses fuzzy logic, utilizing fuzzy Gaussian and fuzzy triangular membership functions to determine the imputed values based on weighted nearest neighbor. Results show that the fuzzy triangular yield superior accuracy compared to the others. The second approach introduces a predictive ensemble framework called Predictive Missing Values via Voting Ensemble (PMVVE)that integrates multiple classifiers, outperforming traditional methods in accuracy and reliability across real-world datasets.Summary: يواجه تحليل بيانات السلاسل الزمنية تحديًا بسبب القيم المفقودة، حيث تؤثر على دقة النماذج واتخاذ القرار. يقترح البحث تقنيتين جديدتين لتعويض القيم المفقودة.يعتمد النهج الأول على المنطق الضبابي، حيث يستخدم التوزيع الغاوسي الضبابي ودالة الانتماء المثلثية الضبابية لتحديد القيم المثلى بناءً على حسابات الجار الأقرب الموزون.أظهرت النتائج التجريبية تفوق هذه الطريقة على التقنيات التقليدية، حيث تفوقت دالة الانتماء المثلثية الضبابية من حيث الدقة مقارنةً بالتوزيع الغاوسي الضبابي.أما النهج الثاني، فيقدم إطارًا تنبؤيًا قائمًا على أسلوب التجميع، يُعرف باسم "التنبؤ بالقيم المفقودة عبر التجميع بالتصويت."يدمج هذا النهج بين عدة مصنفات من تعلم الآلة للتنبؤ بالقيم المفقودة بشكل أكثر كفاءة. أثبتت التقييمات التجريبية، التي أجريت على مجموعات بيانات حقيقية متعددة، أن تقنية التنبؤ بالقيم المفقودة عبر التجميع بالتصويتتتفوق على الطرق التقليدية، حيث توفر دقة أعلى وموثوقية أكبر في إكمال البيانات المفقودة.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Home library Call number Status Barcode
Thesis قاعة الرسائل الجامعية - الدور الاول المكتبة المركزبة الجديدة - جامعة القاهرة Cai01.20.04.Ph.D.2024.Ma.D (Browse shelf(Opens below)) Not for loan 01010110092301000

Thesis (Ph.D)-Cairo University, 2025.

Bibliography: pages 78-84.

Handling missing values in time series data is a crucial challenge in data analysis.This thesis addresses the challenge of missing values in time series data by proposing two novel imputation techniques. The first uses fuzzy logic, utilizing fuzzy Gaussian and fuzzy triangular membership functions to determine the imputed values based on weighted nearest neighbor. Results show that the fuzzy triangular yield superior accuracy compared to the others. The second approach introduces a predictive ensemble framework called Predictive Missing Values via Voting Ensemble (PMVVE)that integrates multiple classifiers, outperforming traditional methods in accuracy and reliability across real-world datasets.

يواجه تحليل بيانات السلاسل الزمنية تحديًا بسبب القيم المفقودة، حيث تؤثر على دقة النماذج واتخاذ القرار. يقترح البحث تقنيتين جديدتين لتعويض القيم المفقودة.يعتمد النهج الأول على المنطق الضبابي، حيث يستخدم التوزيع الغاوسي الضبابي ودالة الانتماء المثلثية الضبابية لتحديد القيم المثلى بناءً على حسابات الجار الأقرب الموزون.أظهرت النتائج التجريبية تفوق هذه الطريقة على التقنيات التقليدية، حيث تفوقت دالة الانتماء المثلثية الضبابية من حيث الدقة مقارنةً بالتوزيع الغاوسي الضبابي.أما النهج الثاني، فيقدم إطارًا تنبؤيًا قائمًا على أسلوب التجميع، يُعرف باسم "التنبؤ بالقيم المفقودة عبر التجميع بالتصويت."يدمج هذا النهج بين عدة مصنفات من تعلم الآلة للتنبؤ بالقيم المفقودة بشكل أكثر كفاءة. أثبتت التقييمات التجريبية، التي أجريت على مجموعات بيانات حقيقية متعددة، أن تقنية التنبؤ بالقيم المفقودة عبر التجميع بالتصويتتتفوق على الطرق التقليدية، حيث توفر دقة أعلى وموثوقية أكبر في إكمال البيانات المفقودة.

Issues also as CD.

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.
Share
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library