A robust estimation of regression model in case of missing data / by Amer Ibrahim Fahmy ; Supervised by Dr. Mohamed Reda Abonazel.
Material type:
- text
- Unmediated
- volume
- / تقدير حصين لنموذج الانحدار في حالة القيم المفقودة [Added title page title]
- 519.53
- Issues also as CD.
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.04.M.Sc.2023.Am.R (Browse shelf(Opens below)) | Not for loan | 01010110089414000 |
Browsing المكتبة المركزبة الجديدة - جامعة القاهرة shelves Close shelf browser (Hides shelf browser)
No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | ||
Cai01.18.04.M.Sc.2022.Sa.K Kummaraswamy Regression Models with Application / | Cai01.18.04.M.Sc.2023.Ah.P. A proposed approach for statistical analysis and modeling of big data / | Cai01.18.04.M.Sc.2023.Al.D Dynamic Panel Data Models with Mixed Frequency Data / | Cai01.18.04.M.Sc.2023.Am.R A robust estimation of regression model in case of missing data / | Cai01.18.04.M.Sc.2023.Ha.S Studying the Performance of Serial Correlation and Heteroskedasticity Tests in Regression Models / | Cai01.18.04.M.Sc.2023.Ha.S Studying the Efficiency of Different Estimators for Beta Regression Model / | Cai01.18.04.M.Sc.2023.Ha.T Testing the errors distribution for error component models / |
Thesis (M.Sc.)-Cairo University, 2023.
Bibliography: pages 90-97.
Linear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions.
The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem.
A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis.
The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences.
نماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة.
وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة.
الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة.
أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب.
Issues also as CD.
Text in English and abstract in Arabic & English.
There are no comments on this title.