A robust estimation of regression model in case of missing data / (Record no. 169212)
[ view plain ]
000 -LEADER | |
---|---|
fixed length control field | 06240namaa22004091i 4500 |
003 - CONTROL NUMBER IDENTIFIER | |
control field | OSt |
005 - أخر تعامل مع التسجيلة | |
control field | 20250223033336.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION | |
fixed length control field | 241203s2023 |||a|||f m||| 000 0 eng d |
040 ## - CATALOGING SOURCE | |
Original cataloguing agency | EG-GICUC |
Language of cataloging | eng |
Transcribing agency | EG-GICUC |
Modifying agency | EG-GICUC |
Description conventions | rda |
041 0# - LANGUAGE CODE | |
Language code of text/sound track or separate title | eng |
Language code of summary or abstract | eng |
-- | ara |
049 ## - Acquisition Source | |
Acquisition Source | Deposit |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER | |
Classification number | 519.53 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) | |
Classification number | 519.53 |
Edition number | 21 |
097 ## - Degree | |
Degree | M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) | |
Local Call Number | Cai01.18.04.M.Sc.2023.Am.R |
100 0# - MAIN ENTRY--PERSONAL NAME | |
Authority record control number or standard number | Amer Ibrahim Fahmy, |
Preparation | preparation. |
245 12 - TITLE STATEMENT | |
Title | A robust estimation of regression model in case of missing data / |
Statement of responsibility, etc. | by Amer Ibrahim Fahmy ; Supervised by Dr. Mohamed Reda Abonazel. |
246 15 - VARYING FORM OF TITLE | |
Title proper/short title | / تقدير حصين لنموذج الانحدار في حالة القيم المفقودة |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE | |
Date of production, publication, distribution, manufacture, or copyright notice | 2023. |
300 ## - PHYSICAL DESCRIPTION | |
Extent | 159 leaves : |
Other physical details | illustrations ; |
Dimensions | 30 cm. + |
Accompanying material | CD. |
336 ## - CONTENT TYPE | |
Content type term | text |
Source | rda content |
337 ## - MEDIA TYPE | |
Media type term | Unmediated |
Source | rdamedia |
338 ## - CARRIER TYPE | |
Carrier type term | volume |
Source | rdacarrier |
502 ## - DISSERTATION NOTE | |
Dissertation note | Thesis (M.Sc.)-Cairo University, 2023. |
504 ## - BIBLIOGRAPHY, ETC. NOTE | |
Bibliography, etc. note | Bibliography: pages 90-97. |
520 ## - SUMMARY, ETC. | |
Summary, etc. | Linear regression models are common, powerful statistical methods that are used to build a model between dependent variable and one or more independent variables to explain and validate the relationship between the dependent variable and the independent variables there are Estimators that derived to estimate the linear regression model unknown parameters. Ordinary Least Square (OLS) is one of the most common estimates for the linear regression parameters since its best linear unbiased estimators (BLUE) under specific assumptions. <br/> The presence of missing data and the presence of outliers at the same time leads OLS to have poor goodness of fit, handling missing data while neglecting the presence of outliers leads to many consequences. The presence of missing data and outliers was discussed by many researchers, and they discussed the consequences of neglecting outliers in the presence of missing data and some methods how to avoid or to handle both. This thesis aims to discuss and propose how to handle this problem.<br/> A new proposed multiple imputation algorithm to deal with the presence of outliers while handling the missing values depending on robust regression with more robust steps. While imputing the missing data using the proposed algorithm simulation study and empirical studies were used in several cases and under several factors evaluating the imputed data with the proposed algorithm through analysis.<br/> The results from the simulation study and the empirical studies indicated that among most of cases that the proposed robust regression multiple imputation had superiority over OLS regression multiple imputation with obvious differences, leading to the conclusion that the presence of outliers could lead to many consequences, checking for their presence and handling them early from data preprocessing phase is essential to avoid the consequences. |
520 ## - SUMMARY, ETC. | |
Summary, etc. | نماذج الانحدار الخطي (Linear Regression Model) هي طرق إحصائية شائعة وقوية تستخدم لبناء نموذج بين متغير تابع وواحد او أكثر من المتغيرات المستقلة لتوضيح العلاقة بين المتغير التابع والمتغيرات المستقلة. يوجد العديد من طرق التقدير المستخدمة لتقدير معلمات نموذج الانحدار الخطي المجهولة. طريقة المربعات الصغرى (OLS) هي أحد أكثر طرق التقدير شيوعاً لتقدير معلمات الانحدار الخطي حيث انها أفضل مقدر خطي غير متحيز (BLUE) في ظل افتراضات محددة.<br/>وجود البيانات المفقودة (Missing Data) ووجود القيم الشاذة (Outliers) معاً في نموذج الانحدار يؤدى الي ضعف جودة توفيق (Goodness of Fit) طريقة المربعات الصغرى. تم مناقشة عواقب اهمال وجود قيم شاذة في ظل التعامل مع وجود بيانات مفقودة من قبل العديد من الباحثين وكذلك ناقش بعض الباحثين طرق لمعالجة هذه المشكلة. تهدف هذه الرسالة إلى مناقشة واقتراح طريقة لكيفية التعامل مع المشكلة.<br/>الخوارزمية (Algorithm) الجديدة المقترحة هي خوارزمية للاستعاضة (Imputation) المتعددة لتعامل مع وجود القيم الشاذة اثناء استعاضة القيم المفقودة بالاعتماد على الانحدار الحصين (Robust Regression) مع خطوات أكثر حصانة. ولغرض توضيح الخوارزمية المقدمة تم استعمال اسلوب المحاكاة (Simulation) بالإضافة الى جانب التطبيقات العملية في عدة حالات وتحت عدة عوامل لتقييم القيم المستعاضة.<br/> أشارت نتائج المحاكاة والتطبيق العملي أنه في معظم الحالات كان للاستعاضة المتعددة باستخدام الانحدار الحصين المقترحة الأفضلية عن الاستعاضة المتعددة باستخدام طريقة المربعات الصغرى مع وجود اختلافات واضحة، وهذا يقودنا إلى استنتاج مفاده أن وجود القيم المتطرفة يمكن أن يؤدى إلى العديد من العواقب، ويعد التحقق من وجودها والتعامل معها مبكرا منذ مرحلة المعالجة المسبقة للبيانات أمر ضروري من أجل تجنب تلك العواقب. |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE | |
Issues CD | Issues also as CD. |
546 ## - LANGUAGE NOTE | |
Text Language | Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM | |
Topical term or geographic name entry element | Statistics |
Source of heading or term | qrmak |
653 #0 - INDEX TERM--UNCONTROLLED | |
Uncontrolled term | Multiple imputation |
-- | Missing data |
-- | Outliers |
-- | Monte Carlo simulation |
-- | OLS |
-- | MM |
-- | estimate |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Mohamed Reda Abonazel |
Relator term | thesis advisor. |
900 ## - Thesis Information | |
Grant date | 01-01-2023 |
Supervisory body | Mohamed Reda Abonazel |
Universities | Cairo University |
Faculties | Faculty of Graduate Studies for Statistical Research |
Department | Department of Applied Statistics and Econometrics |
905 ## - Cataloger and Reviser Names | |
Cataloger Name | Shimaa |
Reviser Names | Huda |
942 ## - ADDED ENTRY ELEMENTS (KOHA) | |
Source of classification or shelving scheme | Dewey Decimal Classification |
Koha item type | Thesis |
Edition | 21 |
Suppress in OPAC | No |
Source of classification or shelving scheme | Home library | Current library | Date acquired | Inventory number | Full call number | Barcode | Date last seen | Effective from | Koha item type |
---|---|---|---|---|---|---|---|---|---|
Dewey Decimal Classification | المكتبة المركزبة الجديدة - جامعة القاهرة | قاعة الرسائل الجامعية - الدور الاول | 03.12.2024 | 89414 | Cai01.18.04.M.Sc.2023.Am.R | 01010110089414000 | 03.12.2024 | 03.12.2024 | Thesis |