header
Local cover image
Local cover image
Image from OpenLibrary

A robust estimation of regression model in case of missing data / by Amer Ibrahim Fahmy ; Supervised by Dr. Mohamed Reda Abonazel.

By: Contributor(s): Material type: TextTextLanguage: English Summary language: English, Arabic Producer: 2023Description: 159 leaves : illustrations ; 30 cm. + CDContent type:
  • text
Media type:
  • Unmediated
Carrier type:
  • volume
Other title:
  • / تقدير حصين لنموذج الانحدار في حالة القيم المفقودة [Added title page title]
Subject(s): DDC classification:
  • 519.53
Available additional physical forms:
  • Issues also as CD.
Dissertation note: Thesis (M.Sc.)-Cairo University, 2023. Summary: Linear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions. The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem. A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis. The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences.Summary: نماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة. وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة. الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة. أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Home library Call number Status Barcode
Thesis Thesis قاعة الرسائل الجامعية - الدور الاول المكتبة المركزبة الجديدة - جامعة القاهرة Cai01.18.04.M.Sc.2023.Am.R (Browse shelf(Opens below)) Not for loan 01010110089414000

Thesis (M.Sc.)-Cairo University, 2023.

Bibliography: pages 90-97.

Linear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions.
The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem.
A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis.
The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences.

نماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة.
وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة.
الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة.
أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب.

Issues also as CD.

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.

Click on an image to view it in the image viewer

Local cover image