000 06240namaa22004091i 4500
003 OSt
005 20250223033336.0
008 241203s2023 |||a|||f m||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a519.53
092 _a519.53
_221
097 _aM.Sc
099 _aCai01.18.04.M.Sc.2023.Am.R
100 0 _aAmer Ibrahim Fahmy,
_epreparation.
245 1 2 _aA robust estimation of regression model in case of missing data /
_cby Amer Ibrahim Fahmy ; Supervised by Dr. Mohamed Reda Abonazel.
246 1 5 _a/ تقدير حصين لنموذج الانحدار في حالة القيم المفقودة
264 0 _c2023.
300 _a159 leaves :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (M.Sc.)-Cairo University, 2023.
504 _aBibliography: pages 90-97.
520 _aLinear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions. The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem. A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis. The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences.
520 _aنماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة. وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة. الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة. أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 7 _aStatistics
_2qrmak
653 0 _aMultiple imputation
_aMissing data
_aOutliers
_aMonte Carlo simulation
_aOLS
_aMM
_aestimate
700 0 _aMohamed Reda Abonazel
_ethesis advisor.
900 _b01-01-2023
_cMohamed Reda Abonazel
_UCairo University
_FFaculty of Graduate Studies for Statistical Research
_DDepartment of Applied Statistics and Econometrics
905 _aShimaa
_eHuda
942 _2ddc
_cTH
_e21
_n0
999 _c169212