Studying the Efficiency of Different Estimators for Beta Regression Model / by Hadir Abdelmohsen Said Abdelmohsen ; Supervised by Prof. Salah Mahdy Mohamed, Dr. Mohamed Reda Abonazel
Material type:
- text
- Unmediated
- volume
- دراسة كفاءة المقدرات المختلفة لنموذج انحدار بيتا [Added title page title]
- 519
- Issued also as CD
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.04.M.Sc.2023.Ha.S (Browse shelf(Opens below)) | Not for loan | 01010110088777000 |
Browsing المكتبة المركزبة الجديدة - جامعة القاهرة shelves Close shelf browser (Hides shelf browser)
No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | No cover image available | ||
Cai01.18.04.M.Sc.2023.Al.D Dynamic Panel Data Models with Mixed Frequency Data / | Cai01.18.04.M.Sc.2023.Am.R A robust estimation of regression model in case of missing data / | Cai01.18.04.M.Sc.2023.Ha.S Studying the Performance of Serial Correlation and Heteroskedasticity Tests in Regression Models / | Cai01.18.04.M.Sc.2023.Ha.S Studying the Efficiency of Different Estimators for Beta Regression Model / | Cai01.18.04.M.Sc.2023.Ha.T Testing the errors distribution for error component models / | Cai01.18.04.M.Sc.2024.Ma.C. A comparison of some estimation methods for quantile regression model / | Cai01.18.04.M.Sc.2024.Mo.T Transmuted regression models with applications / |
Thesis (M.Sc.)-Cairo University, 2023.
Bibliography: pages 116-127.
Beta regression models are effective for modeling continuous outcomes
within the restricted interval (0, 1). These models assume a beta distribution for
the dependent variable and establish a relationship between its mean and a set of
explanatory variables through coefficients and a link function within a linear
predictor.
Handling missing values is a common challenge in statistical analysis. This
thesis aims to investigate the impact of different methods for addressing missing
data in the context of beta regression models. The thesis includes a review of
imputation methods for missing data in beta regression models. Additionally, a
Monte Carlo simulation Study is conducted to assess the performance of
imputation methods when the missingness mechanism follows a missing at-
random pattern. Various simulation factors, such as sample sizes, missingness
percentages, and precision parameters, are considered.
Real-world data from two different applications are utilized, alongside
simulated data that intentionally incorporates missing values under the missing at
random mechanism. The evaluated methods include Listwise Deletion (LD), three
multiple imputation techniques: K-nearest neighbors (KNN), Predictive Mean
Matching (PMM), and the EM algorithm. Furthermore, three new average
imputation methods, PE, KE, and KP, are proposed.
The evaluation of these methods encompasses the comparison of
information criteria such as the Akaike Information Criterion (AIC), and Bayesian
Information Criterion (BIC), as well as error measures such as Mean Absolute
Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE), and
Mean Absolute Percent Error (MAPE).
The results of the thesis indicate that, within the specific contexts of this
research, the EM algorithm and the three proposed average imputation methods
outperform other approaches in terms of their effectiveness in handling missing
xv
values in beta regression models. This thesis sheds light on the implications of
various missing data handling methods and provides valuable insights for future
applications of beta regression models
نماذج انحدار البيتا تعتبر أدوات قوية لتحليل البيانات المستمرة ضمن الفاصلة المحدودة (0 ,1). تستند إلى توزيع بيتا وتقدم طرقًا فعالة لتحديد علاقة المتغيرات التفسيرية بالمتغير التابع في هذا النطاق المحدود. يمكن استخدامها في مجموعة واسعة من المجالات وتوفير تحليلات دقيقة للبيانات المستمرة المحدود. تتميز هذه النماذج بقدرتها على التعامل مع المتغيرات التي تنتج عنها توزيعات غير منتظمة وتنحرف عن التوزيعات العادية. يعتبر التعامل مع البيانات المفقودة تحدياً شائعاً في التحليل الاحصائى ،وتعد معالجة البيانات المفقودة أمرًا مهماً لضمان دقة التحليل والاستنتاجات الإحصائية ، وهناك العديد من الأدبيات للتعامل مع البيانات المفقودة خاصة في نماذج الانحدار الخطى المعمم (GLM) ، ومن أهمها طرق الاحلال المتعدد.
تهدف هذه الرسالة إلى عرض بعض الطرق المختلفة لمعالجة البيانات المفقودة لنموذج انحدار البيتا، وذلك باستخدام بعض طرق الإحلال المتعدد Multiple Imputation، وأيضاً عرض الطرق المقترحة الجديدة وهي طرق متوسطات الإحلال المتعدد Average Multiple Imputation، والتي تشمل ثلاث طرق مختلقة وهما (PE Method, KE Method, KP Method) والطرق المستخدمة للنموذج هي كالآتي:
1- طريقة الحذف Listwise Deletion (LD)
2- التقدير باستخدام القيمة العظمى المتوقعة Expectation Maximization algorithm (EM).
3- طريقة تقدير الجار الأقرب K- Nearest Neighbour (KNN).
4- طريقة المطابقة التنبؤية Predictive Mean Matching (PMM).
5- وطرق متوسطات الإحلال المتعدد Average Multiple Imputation methods.
وتشمل الرسالة تصميم دراسة المحاكاة باستخدام طريقة مونت كارلو لنموذج انحدار البيتا مع وجود مشكلة البيانات المفقودة ، وذلك مع مراعاة الاختلاف في نسب البيانات المفقودة ، وحجم العينات ، وقيم دقة الثابتة للنموذج، والآلية المستخدمة التي تتبع نمط البيانات المفقودة عشوائيًا ، وتطبيق النموذج على بيانات حقيقية من تطبيقين مختلفين ، أظهرت النتائج توافق دراسة المحاكاة مع التطبيقات بأفصلية طريقة EM في التعامل مع البيانات المفقودة لنموذج انحدار البيتا ، حيث أنها الأقل قيم في متوسط معايير المفاضلة بين الطرق (AIC, BIC, MSE, MAE, RMSE, MAPE) ، وكما أن الطرق الثلاث المقترحة الجديدة اثبت فعاليتها وانها طرق جيدة في التعامل مع البيانات المفقودة نموذج انحدار البيتا واثبت تفوقها على كلاً من KNN , PMM ، وكانت نتائج طريقة PE متقاربة مع نتائج طريقة EM ، وفى الرغم من أن طريقة KP ليست افضل طرق متوسطات الإحلال المتعدد، حيث أنها تفوقت على طريقة KNN , PMM ،وذلك لان طريقة KP تشمل متوسط الطريقين معاً ، وطريقة الحذف(LD) هي أسوء الطرق المستخدمة في معالجة البيانات المفقودة في النموذج .
الكلمات الدالة:
البيانات المفقودة، البيانات المفقودة عشوائياً، البيانات التامة المفقودة عشوائياً، البيانات غير تامة المفقودة عشوائياً، أنماط البيانات المفقودة، خوارزمية EM، طرق التقدير، طريقة التقدير الإمكان الأعظم، نموذج انحدار البيتا، نماذج انحدار البيتا المتضخمة، نماذج الانحدار الخطى المعمم، معايير مفاضلة النماذج، محاكاة مونت كارلو، طريقة الحذف (LD)، طريقة الجار الأقرب (KNN)، طريقة المطابقة التنبؤية (PMM)، طرق الإحلال المتعدد، طرق متوسطات الإحلال المتعدد، طريقة PE، طريقة KP، طريقة KE.
Issued also as CD
Text in English and abstract in Arabic & English.
There are no comments on this title.