header
Local cover image
Local cover image
Image from OpenLibrary

Studying the Efficiency of Different Estimators for Beta Regression Model / by Hadir Abdelmohsen Said Abdelmohsen ; Supervised by Prof. Salah Mahdy Mohamed, Dr. Mohamed Reda Abonazel

By: Contributor(s): Material type: TextTextLanguage: English Summary language: English, Arabic Producer: 2023Description: 145 leaves : illustrations ; 30 cm. + CDContent type:
  • text
Media type:
  • Unmediated
Carrier type:
  • volume
Other title:
  • دراسة كفاءة المقدرات المختلفة لنموذج انحدار بيتا [Added title page title]
Subject(s): DDC classification:
  • 519
Available additional physical forms:
  • Issued also as CD
Dissertation note: Thesis (M.Sc.)-Cairo University, 2023. Summary: Beta regression models are effective for modeling continuous outcomes within the restricted interval (0, 1). These models assume a beta distribution for the dependent variable and establish a relationship between its mean and a set of explanatory variables through coefficients and a link function within a linear predictor. Handling missing values is a common challenge in statistical analysis. This thesis aims to investigate the impact of different methods for addressing missing data in the context of beta regression models. The thesis includes a review of imputation methods for missing data in beta regression models. Additionally, a Monte Carlo simulation Study is conducted to assess the performance of imputation methods when the missingness mechanism follows a missing at- random pattern. Various simulation factors, such as sample sizes, missingness percentages, and precision parameters, are considered. Real-world data from two different applications are utilized, alongside simulated data that intentionally incorporates missing values under the missing at random mechanism. The evaluated methods include Listwise Deletion (LD), three multiple imputation techniques: K-nearest neighbors (KNN), Predictive Mean Matching (PMM), and the EM algorithm. Furthermore, three new average imputation methods, PE, KE, and KP, are proposed. The evaluation of these methods encompasses the comparison of information criteria such as the Akaike Information Criterion (AIC), and Bayesian Information Criterion (BIC), as well as error measures such as Mean Absolute Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE), and Mean Absolute Percent Error (MAPE). The results of the thesis indicate that, within the specific contexts of this research, the EM algorithm and the three proposed average imputation methods outperform other approaches in terms of their effectiveness in handling missing xv values in beta regression models. This thesis sheds light on the implications of various missing data handling methods and provides valuable insights for future applications of beta regression modelsSummary: نماذج انحدار البيتا تعتبر أدوات قوية لتحليل البيانات المستمرة ضمن الفاصلة المحدودة (0 ,1). تستند إلى توزيع بيتا وتقدم طرقًا فعالة لتحديد علاقة المتغيرات التفسيرية بالمتغير التابع في هذا النطاق المحدود. يمكن استخدامها في مجموعة واسعة من المجالات وتوفير تحليلات دقيقة للبيانات المستمرة المحدود. تتميز هذه النماذج بقدرتها على التعامل مع المتغيرات التي تنتج عنها توزيعات غير منتظمة وتنحرف عن التوزيعات العادية. يعتبر التعامل مع البيانات المفقودة تحدياً شائعاً في التحليل الاحصائى ،وتعد معالجة البيانات المفقودة أمرًا مهماً لضمان دقة التحليل والاستنتاجات الإحصائية ، وهناك العديد من الأدبيات للتعامل مع البيانات المفقودة خاصة في نماذج الانحدار الخطى المعمم (GLM) ، ومن أهمها طرق الاحلال المتعدد. تهدف هذه الرسالة إلى عرض بعض الطرق المختلفة لمعالجة البيانات المفقودة لنموذج انحدار البيتا، وذلك باستخدام بعض طرق الإحلال المتعدد Multiple Imputation، وأيضاً عرض الطرق المقترحة الجديدة وهي طرق متوسطات الإحلال المتعدد Average Multiple Imputation، والتي تشمل ثلاث طرق مختلقة وهما (PE Method, KE Method, KP Method) والطرق المستخدمة للنموذج هي كالآتي: 1- طريقة الحذف Listwise Deletion (LD) 2- التقدير باستخدام القيمة العظمى المتوقعة Expectation Maximization algorithm (EM). 3- طريقة تقدير الجار الأقرب K- Nearest Neighbour (KNN). 4- طريقة المطابقة التنبؤية Predictive Mean Matching (PMM). 5- وطرق متوسطات الإحلال المتعدد Average Multiple Imputation methods. وتشمل الرسالة تصميم دراسة المحاكاة باستخدام طريقة مونت كارلو لنموذج انحدار البيتا مع وجود مشكلة البيانات المفقودة ، وذلك مع مراعاة الاختلاف في نسب البيانات المفقودة ، وحجم العينات ، وقيم دقة الثابتة للنموذج، والآلية المستخدمة التي تتبع نمط البيانات المفقودة عشوائيًا ، وتطبيق النموذج على بيانات حقيقية من تطبيقين مختلفين ، أظهرت النتائج توافق دراسة المحاكاة مع التطبيقات بأفصلية طريقة EM في التعامل مع البيانات المفقودة لنموذج انحدار البيتا ، حيث أنها الأقل قيم في متوسط معايير المفاضلة بين الطرق (AIC, BIC, MSE, MAE, RMSE, MAPE) ، وكما أن الطرق الثلاث المقترحة الجديدة اثبت فعاليتها وانها طرق جيدة في التعامل مع البيانات المفقودة نموذج انحدار البيتا واثبت تفوقها على كلاً من KNN , PMM ، وكانت نتائج طريقة PE متقاربة مع نتائج طريقة EM ، وفى الرغم من أن طريقة KP ليست افضل طرق متوسطات الإحلال المتعدد، حيث أنها تفوقت على طريقة KNN , PMM ،وذلك لان طريقة KP تشمل متوسط الطريقين معاً ، وطريقة الحذف(LD) هي أسوء الطرق المستخدمة في معالجة البيانات المفقودة في النموذج . الكلمات الدالة: البيانات المفقودة، البيانات المفقودة عشوائياً، البيانات التامة المفقودة عشوائياً، البيانات غير تامة المفقودة عشوائياً، أنماط البيانات المفقودة، خوارزمية EM، طرق التقدير، طريقة التقدير الإمكان الأعظم، نموذج انحدار البيتا، نماذج انحدار البيتا المتضخمة، نماذج الانحدار الخطى المعمم، معايير مفاضلة النماذج، محاكاة مونت كارلو، طريقة الحذف (LD)، طريقة الجار الأقرب (KNN)، طريقة المطابقة التنبؤية (PMM)، طرق الإحلال المتعدد، طرق متوسطات الإحلال المتعدد، طريقة PE، طريقة KP، طريقة KE.
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)
Holdings
Item type Current library Home library Call number Status Barcode
Thesis Thesis قاعة الرسائل الجامعية - الدور الاول المكتبة المركزبة الجديدة - جامعة القاهرة Cai01.18.04.M.Sc.2023.Ha.S (Browse shelf(Opens below)) Not for loan 01010110088777000

Thesis (M.Sc.)-Cairo University, 2023.

Bibliography: pages 116-127.

Beta regression models are effective for modeling continuous outcomes
within the restricted interval (0, 1). These models assume a beta distribution for
the dependent variable and establish a relationship between its mean and a set of
explanatory variables through coefficients and a link function within a linear
predictor.
Handling missing values is a common challenge in statistical analysis. This
thesis aims to investigate the impact of different methods for addressing missing
data in the context of beta regression models. The thesis includes a review of
imputation methods for missing data in beta regression models. Additionally, a
Monte Carlo simulation Study is conducted to assess the performance of
imputation methods when the missingness mechanism follows a missing at-
random pattern. Various simulation factors, such as sample sizes, missingness
percentages, and precision parameters, are considered.
Real-world data from two different applications are utilized, alongside
simulated data that intentionally incorporates missing values under the missing at
random mechanism. The evaluated methods include Listwise Deletion (LD), three
multiple imputation techniques: K-nearest neighbors (KNN), Predictive Mean
Matching (PMM), and the EM algorithm. Furthermore, three new average
imputation methods, PE, KE, and KP, are proposed.
The evaluation of these methods encompasses the comparison of
information criteria such as the Akaike Information Criterion (AIC), and Bayesian
Information Criterion (BIC), as well as error measures such as Mean Absolute
Error (MAE), Mean Square Error (MSE), Root Mean Square Error (RMSE), and
Mean Absolute Percent Error (MAPE).
The results of the thesis indicate that, within the specific contexts of this
research, the EM algorithm and the three proposed average imputation methods
outperform other approaches in terms of their effectiveness in handling missing
xv
values in beta regression models. This thesis sheds light on the implications of
various missing data handling methods and provides valuable insights for future
applications of beta regression models

نماذج انحدار البيتا تعتبر أدوات قوية لتحليل البيانات المستمرة ضمن الفاصلة المحدودة (0 ,1). تستند إلى توزيع بيتا وتقدم طرقًا فعالة لتحديد علاقة المتغيرات التفسيرية بالمتغير التابع في هذا النطاق المحدود. يمكن استخدامها في مجموعة واسعة من المجالات وتوفير تحليلات دقيقة للبيانات المستمرة المحدود. تتميز هذه النماذج بقدرتها على التعامل مع المتغيرات التي تنتج عنها توزيعات غير منتظمة وتنحرف عن التوزيعات العادية. يعتبر التعامل مع البيانات المفقودة تحدياً شائعاً في التحليل الاحصائى ،وتعد معالجة البيانات المفقودة أمرًا مهماً لضمان دقة التحليل والاستنتاجات الإحصائية ، وهناك العديد من الأدبيات للتعامل مع البيانات المفقودة خاصة في نماذج الانحدار الخطى المعمم (GLM) ، ومن أهمها طرق الاحلال المتعدد.
تهدف هذه الرسالة إلى عرض بعض الطرق المختلفة لمعالجة البيانات المفقودة لنموذج انحدار البيتا، وذلك باستخدام بعض طرق الإحلال المتعدد Multiple Imputation، وأيضاً عرض الطرق المقترحة الجديدة وهي طرق متوسطات الإحلال المتعدد Average Multiple Imputation، والتي تشمل ثلاث طرق مختلقة وهما (PE Method, KE Method, KP Method) والطرق المستخدمة للنموذج هي كالآتي:
1- طريقة الحذف Listwise Deletion (LD)
2- التقدير باستخدام القيمة العظمى المتوقعة Expectation Maximization algorithm (EM).
3- طريقة تقدير الجار الأقرب K- Nearest Neighbour (KNN).
4- طريقة المطابقة التنبؤية Predictive Mean Matching (PMM).
5- وطرق متوسطات الإحلال المتعدد Average Multiple Imputation methods.
وتشمل الرسالة تصميم دراسة المحاكاة باستخدام طريقة مونت كارلو لنموذج انحدار البيتا مع وجود مشكلة البيانات المفقودة ، وذلك مع مراعاة الاختلاف في نسب البيانات المفقودة ، وحجم العينات ، وقيم دقة الثابتة للنموذج، والآلية المستخدمة التي تتبع نمط البيانات المفقودة عشوائيًا ، وتطبيق النموذج على بيانات حقيقية من تطبيقين مختلفين ، أظهرت النتائج توافق دراسة المحاكاة مع التطبيقات بأفصلية طريقة EM في التعامل مع البيانات المفقودة لنموذج انحدار البيتا ، حيث أنها الأقل قيم في متوسط معايير المفاضلة بين الطرق (AIC, BIC, MSE, MAE, RMSE, MAPE) ، وكما أن الطرق الثلاث المقترحة الجديدة اثبت فعاليتها وانها طرق جيدة في التعامل مع البيانات المفقودة نموذج انحدار البيتا واثبت تفوقها على كلاً من KNN , PMM ، وكانت نتائج طريقة PE متقاربة مع نتائج طريقة EM ، وفى الرغم من أن طريقة KP ليست افضل طرق متوسطات الإحلال المتعدد، حيث أنها تفوقت على طريقة KNN , PMM ،وذلك لان طريقة KP تشمل متوسط الطريقين معاً ، وطريقة الحذف(LD) هي أسوء الطرق المستخدمة في معالجة البيانات المفقودة في النموذج .
الكلمات الدالة:
البيانات المفقودة، البيانات المفقودة عشوائياً، البيانات التامة المفقودة عشوائياً، البيانات غير تامة المفقودة عشوائياً، أنماط البيانات المفقودة، خوارزمية EM، طرق التقدير، طريقة التقدير الإمكان الأعظم، نموذج انحدار البيتا، نماذج انحدار البيتا المتضخمة، نماذج الانحدار الخطى المعمم، معايير مفاضلة النماذج، محاكاة مونت كارلو، طريقة الحذف (LD)، طريقة الجار الأقرب (KNN)، طريقة المطابقة التنبؤية (PMM)، طرق الإحلال المتعدد، طرق متوسطات الإحلال المتعدد، طريقة PE، طريقة KP، طريقة KE.

Issued also as CD

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.

Click on an image to view it in the image viewer

Local cover image