000 | 06240namaa22004091i 4500 | ||
---|---|---|---|
003 | OSt | ||
005 | 20250223033336.0 | ||
008 | 241203s2023 |||a|||f m||| 000 0 eng d | ||
040 |
_aEG-GICUC _beng _cEG-GICUC _dEG-GICUC _erda |
||
041 | 0 |
_aeng _beng _bara |
|
049 | _aDeposit | ||
082 | 0 | 4 | _a519.53 |
092 |
_a519.53 _221 |
||
097 | _aM.Sc | ||
099 | _aCai01.18.04.M.Sc.2023.Am.R | ||
100 | 0 |
_aAmer Ibrahim Fahmy, _epreparation. |
|
245 | 1 | 2 |
_aA robust estimation of regression model in case of missing data / _cby Amer Ibrahim Fahmy ; Supervised by Dr. Mohamed Reda Abonazel. |
246 | 1 | 5 | _a/ تقدير حصين لنموذج الانحدار في حالة القيم المفقودة |
264 | 0 | _c2023. | |
300 |
_a159 leaves : _billustrations ; _c30 cm. + _eCD. |
||
336 |
_atext _2rda content |
||
337 |
_aUnmediated _2rdamedia |
||
338 |
_avolume _2rdacarrier |
||
502 | _aThesis (M.Sc.)-Cairo University, 2023. | ||
504 | _aBibliography: pages 90-97. | ||
520 | _aLinear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions. The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem. A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis. The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences. | ||
520 | _aنماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة. وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة. الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة. أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب. | ||
530 | _aIssues also as CD. | ||
546 | _aText in English and abstract in Arabic & English. | ||
650 | 7 |
_aStatistics _2qrmak |
|
653 | 0 |
_aMultiple imputation _aMissing data _aOutliers _aMonte Carlo simulation _aOLS _aMM _aestimate |
|
700 | 0 |
_aMohamed Reda Abonazel _ethesis advisor. |
|
900 |
_b01-01-2023 _cMohamed Reda Abonazel _UCairo University _FFaculty of Graduate Studies for Statistical Research _DDepartment of Applied Statistics and Econometrics |
||
905 |
_aShimaa _eHuda |
||
942 |
_2ddc _cTH _e21 _n0 |
||
999 | _c169212 |