TY - BOOK AU - Hadir Abdelmohsen Said Abdelmohsen, AU - Salah Mahdy Mohamed AU - Mohamed Reda Abonazel TI - Studying the Efficiency of Different Estimators for Beta Regression Model / U1 - 519 PY - 2023/// KW - Statistics KW - qrmak KW - Akaike Information Criterion KW - Average Multiple Imputation KW - Bayesian Information Criterion KW - Beta Regression Model KW - Expectation-Maximization Algorithm N1 - Thesis (M.Sc.)-Cairo University, 2023.; Bibliography: pages 116-127.; Issued also as CD N2 - Beta regression models are effective for modeling continuous outcomes within the restricted interval (0, 1). These models assume a beta distribution for the dependent variable and establish a relationship between its mean and a set of explanatory variables through coefficients and a link function within a linear predictor. Handling missing values is a common challenge in statistical analysis. This thesis aims to investigate the impact of different methods for addressing missing data in the context of beta regression models. The thesis includes a review of imputation methods for missing data in beta regression models. Additionally, a Monte Carlo simulation Study is conducted to assess the performance of imputation methods when the missingness mechanism follows a missing at- random pattern. Various simulation factors, such as sample sizes, missingness percentages, and precision parameters, are considered. Real-world data from two different applications are utilized, alongside simulated data that intentionally incorporates missing values under the missing at random mechanism. The evaluated methods include Listwise Deletion (LD), three multiple imputation techniques: K-nearest neighbors (KNN), Predictive Mean Matching (PMM), and the EM algorithm. Furthermore, three new average imputation methods, PE, KE, and KP, are proposed. The evaluation of these methods encompasses the comparison of information criteria such as the Akaike Information Criterion (AIC), and Bayesian Information Criterion (BIC), as well as error measures such as Mean Absolute Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE), and Mean Absolute Percent Error (MAPE). The results of the thesis indicate that, within the specific contexts of this research, the EM algorithm and the three proposed average imputation methods outperform other approaches in terms of their effectiveness in handling missing xv values in beta regression models. This thesis sheds light on the implications of various missing data handling methods and provides valuable insights for future applications of beta regression models; نماذج انحدار البيتا تعتبر أدوات قوية لتحليل البيانات المستمرة ضمن الفاصلة المحدودة (0 ,1). تستند إلى توزيع بيتا وتقدم طرقًا فعالة لتحديد علاقة المتغيرات التفسيرية بالمتغير التابع في هذا النطاق المحدود. يمكن استخدامها في مجموعة واسعة من المجالات وتوفير تحليلات دقيقة للبيانات المستمرة المحدود. تتميز هذه النماذج بقدرتها على التعامل مع المتغيرات التي تنتج عنها توزيعات غير منتظمة وتنحرف عن التوزيعات العادية. يعتبر التعامل مع البيانات المفقودة تحدياً شائعاً في التحليل الاحصائى ،وتعد معالجة البيانات المفقودة أمرًا مهماً لضمان دقة التحليل والاستنتاجات الإحصائية ، وهناك العديد من الأدبيات للتعامل مع البيانات المفقودة خاصة في نماذج الانحدار الخطى المعمم (GLM) ، ومن أهمها طرق الاحلال المتعدد. تهدف هذه الرسالة إلى عرض بعض الطرق المختلفة لمعالجة البيانات المفقودة لنموذج انحدار البيتا، وذلك باستخدام بعض طرق الإحلال المتعدد Multiple Imputation، وأيضاً عرض الطرق المقترحة الجديدة وهي طرق متوسطات الإحلال المتعدد Average Multiple Imputation، والتي تشمل ثلاث طرق مختلقة وهما (PE Method, KE Method, KP Method) والطرق المستخدمة للنموذج هي كالآتي: 1- طريقة الحذف Listwise Deletion (LD) 2- التقدير باستخدام القيمة العظمى المتوقعة Expectation Maximization algorithm (EM). 3- طريقة تقدير الجار الأقرب K- Nearest Neighbour (KNN). 4- طريقة المطابقة التنبؤية Predictive Mean Matching (PMM). 5- وطرق متوسطات الإحلال المتعدد Average Multiple Imputation methods. وتشمل الرسالة تصميم دراسة المحاكاة باستخدام طريقة مونت كارلو لنموذج انحدار البيتا مع وجود مشكلة البيانات المفقودة ، وذلك مع مراعاة الاختلاف في نسب البيانات المفقودة ، وحجم العينات ، وقيم دقة الثابتة للنموذج، والآلية المستخدمة التي تتبع نمط البيانات المفقودة عشوائيًا ، وتطبيق النموذج على بيانات حقيقية من تطبيقين مختلفين ، أظهرت النتائج توافق دراسة المحاكاة مع التطبيقات بأفصلية طريقة EM في التعامل مع البيانات المفقودة لنموذج انحدار البيتا ، حيث أنها الأقل قيم في متوسط معايير المفاضلة بين الطرق (AIC, BIC, MSE, MAE, RMSE, MAPE) ، وكما أن الطرق الثلاث المقترحة الجديدة اثبت فعاليتها وانها طرق جيدة في التعامل مع البيانات المفقودة نموذج انحدار البيتا واثبت تفوقها على كلاً من KNN , PMM ، وكانت نتائج طريقة PE متقاربة مع نتائج طريقة EM ، وفى الرغم من أن طريقة KP ليست افضل طرق متوسطات الإحلال المتعدد، حيث أنها تفوقت على طريقة KNN , PMM ،وذلك لان طريقة KP تشمل متوسط الطريقين معاً ، وطريقة الحذف(LD) هي أسوء الطرق المستخدمة في معالجة البيانات المفقودة في النموذج . الكلمات الدالة: البيانات المفقودة، البيانات المفقودة عشوائياً، البيانات التامة المفقودة عشوائياً، البيانات غير تامة المفقودة عشوائياً، أنماط البيانات المفقودة، خوارزمية EM، طرق التقدير، طريقة التقدير الإمكان الأعظم، نموذج انحدار البيتا، نماذج انحدار البيتا المتضخمة، نماذج الانحدار الخطى المعمم، معايير مفاضلة النماذج، محاكاة مونت كارلو، طريقة الحذف (LD)، طريقة الجار الأقرب (KNN)، طريقة المطابقة التنبؤية (PMM)، طرق الإحلال المتعدد، طرق متوسطات الإحلال المتعدد، طريقة PE، طريقة KP، طريقة KE ER -