Image from OpenLibrary

Comparison among methods of estimation for reducing the effect of multicollinearity and outliers / by Reem Adel Mohamed Ali ; Supervised Prof. Ahmed Amin El Sheikh, Prof. Mohamed Reda Abonazel.

By: Contributor(s): Material type: TextLanguage: English Summary language: English, Arabic Producer: 2024Description: 172 Leaves : illustrations ; 30 cm. + CDContent type:
  • text
Media type:
  • Unmediated
Carrier type:
  • volume
Other title:
  • مقارنة بين طرق التقدير لتقليل تأثير الازدواج الخطى المتعدد والقيم المتطرفة [Added title page title]
Subject(s): DDC classification:
  • 519.72
Available additional physical forms:
  • Issues also as CD.
Dissertation note: Thesis (M.Sc)-Cairo University, 2024. Summary: This thesis is basically aiming to give a clear path to what one should do when facing multicollinearity and outliers problem, especially in linear models. It’s well-known that the multicollinearity problem makes the estimator to have large variance. Large variance will increase the mean square error, thus making the estimator bad also outliers causes errors to be non-normal distributed and vise versa. Outlier often tends to pull the regression line towards themselves, resulting bad estimator and change sign of the coefficient parameter. The concept of multicollinearity and outliers for the linear regression model is introduced. Some approaches for detecting multicollinearity and outliers in linear regression model are presented. Hence, to overcome such problems, this study will try to find robust estimates for handling multicollinearity and outliers problems. This study is focused on six common biased robust estimators to remedy the dilemma of the multicollinearity and outliers in particular; the ridge M, the ridge MM, Liu M, Liu MM, Liu Type M, Liu Type MM estimators. This thesis is organized as follows: Chapter One presents the definition of multicollinearity and outliers problem, its consequences, diagnostics, and remedy methods in linear regression model. Chapter Two discusses the literature review associated to estimation methods for handling multicollinearity, estimation methods for handling outliers, estimation methods for handling multicollinearity and outliers simultaneously and eventually, conclusion of Literature Review are presented. Chapter Three concerns with parameter estimation of linear regression with multicollinearity, parameter estimation of linear regression with outliers and parameter estimation of linear regression with multicollinearity and outliers simultaneously. Chapter Four presents Monte Carlo simulation studies for comparing six estimators in handling multicollinearity and outliers under three different cases. First, generating error term distributed 𝑁(0,1) and outliers based on errors distributed 𝑁(10,1). Second, generating error term distributed 𝑁(0,1) and outliers based on errors distributed 𝑁(20,1). Third, generating error term distributed Laplace with mean zero and variance 2. Fourth, graphs for presenting some means of MSE results of the simulation study. Appendix A presents comparison among MSE behavior of these estimators in case of errors follow a standard normal distribution and some outliers are generated by a percentage of errors according to the selected percentage τ % follow normal distribution with mean = 10 and standard deviation = 1. Appendix B presents comparison among MSE behavior of these estimators in case of errors follow a standard normal distribution and some outliers are generated by a percentage of errors according to the selected percentage τ % follow normal distribution with mean = 20 and standard deviation = 1 Appendix C presents comparison among MSE behavior of these estimators in case of errors follow a Laplace distribution with mean zero and variance two.Summary: المقدمة: يعد تحليل الانحدار أحد أساليب تحليل البيانات والذي يستخدم لتوضيح العلاقات بين المتغيرات، أحد أنواع هذا التحليل هو الانحدار الخطي. الانحدارات الخطية المتعددة هي تقنية إحصائية تستخدم العديد من المتغيرات التفسيرية للتنبؤ بقيمة أحد المتغيرات )المتغير التابع( المربعات الصغرى العادية (OLS) تعد طريقة شائعة الاستخدام في تقدير معلمات الانحدار الخطى. يقال ان هذه الطريقة هل أفضل مقدر خطى غير متحيز عندما تتحقق كل الفروض المتمثلة في استقلالية الأخطاء والتوزيع الطبيعي للأخطاء. والأخطاء بنسب تباين محددة. ومع ذلك، يمكن أن يكون التقدير مضطربًا بشكل كبير بسبب وجود الازدواج الخطى المتعدد وعدم اعتدالية الاخطاء. الازدواج الخطى المتعدد هي حالة يوجد فيها متغيران مستقلان أو أكثر لهما درجة ارتباط من متوسطة إلى مرتفعة. الازدواج الخطى المتعدد يسبب زيادة تباينً المقدر ويؤدي هذا التباين إلى زيادة متوسط الخطأ التربيعي، مما يجعل المقدر سيئًا. القيم المتطرفة تتسبب في أن تكون الأخطاء موزعة بشكل غير طبيعي والعكس صحيح حيث أن القيم المتطرفة هي قيم البيانات التي تختلف بشكل كبير عن غالبية مجموعة من البيانات، غالبا ما تميل القيم المتطرفة الى سحب خط الانحدار تجاهها، و ينتج عن ذلك مقدر سيء ومن ثم، للتغلب على مثل هذه المشاكل، ستحاول هذه الدراسة إيجاد تقديرات قوية للتعامل مع مشاكل القيم المتطرفة والازدواج الخطى المتعدد في آن واحد. عرض المشكلة: يتمثل التحدي في ايجاد أفضل مقدر في ظل وجود مشكلتي القيم المتطرفة والازدواج الخطى المتعدد في نموذج الانحدار الخطى. أهداف الدراسة: .1 دراسة مشكلة الازدواج الخطى المتعدد وأسبابها ونتائجها وطرق الكشف عنها. .2 دراسة مشكلة القيم المتطرفة وأسبابها ونتائجها وطرق الكشف عنها. .3 تقديم بعض طرق التقدير للتعامل مع مشكلة الازدواج الخطى المتعدد. .4 تقديم بعض طرق التقدير للتعامل مع مشكلة القيم المتطرفة. .5 دراسة محاكاة للمقارنة بين الطرق المختلفة التي تتعامل مع مشكلة القيم المتطرفة والازدواج الخطى المتعدد في آن واحد في وجود توزيعات إحصائية مختلفة للخطأ ودرجات مختلفة من الارتباط ونسب مئوية مختلفة للقيم المتطرفة وأحجام عينات مختلفة. • محتوي الرسالة تشتمل هذه الرسالة على أربعة أبواب بالإضافة الى المراجع والملاحق على النحو التالي: الباب الأول: المقدمة والمفاهيم الرئيسية. تناول الفصل الأول والثاني مفهوم الازدواج الخطى والقيم المتطرفة وانواعهم ومصادرهم وتبعات هذه المشكلات وطرق الكشف عنهم. وفي الفصل الثالث طرق معالجة الازدواج الخطى. وفي الفصل الرابع طرق معالجة القيم المتطرفة. وفي الفصل الخامس بعض طرق معالجة الازدواج الخطى والقيم المتطرفة في آن واحد. الباب الثاني: الدراسات السابقة. الباب الثالث: تقدير معالم الانحدار الخطى في وجود الازدواج الخطى والقيم المتطرفة. تناول الفصل الأول نموذج الانحدار الخطى وطريقة المربعات الصغرى العادية (OLS) لتقدير معلمات هذا النموذج. الفصل الثاني تناول بعض طرق معالجة الازدواج الخطى كمقدرRidge ومقدر تحليل ومقدر Liu Typeومقدر Liuومقدر Principal Component Analysis الرئيسية المكونات k) - (r ومقدرd) – .(r وفي الفصل الثالث تناول بعض طرق معالجة القيم المتطرفة كمقدرات LTS) LMS, LAD, S, MM, (M, . وفي الفصل الرابع بعض طرق معالجة الازدواج الخطى والقيم (Robust Ridge, Robust Liu, Robust Liu Type) كمقدرات واحد أن في المتطرفة الباب الرابع: تم تصميم دراسة محاكاه لمقارنة ستة طرق تقدير لمعالجة مشكلة الازدواج الخطى والقيم المتطرفة في آن واحد في وجود توزيعات إحصائية مختلفة للخطأ ودرجات مختلفة من الارتباط ونسب مئوية مختلفة للقيم المتطرفة وأحجام عينات مختلفة وتمت المقارنة باستخدام معيار MSE . ويناقش هذا الباب ملخص ما تم عرضه في الرسالة وما توصلنا اليه من نتائج ورسومات بيانية كما يعرض بعض التوصيات المقترحة فيما يخص مشكلة الازدواج الخطى والقيم المتطرفة في النماذج الخطية وكذلك بعض الأفكار التي يمكن تطبيقها في أي دراسات مستقبلية. الملاحق: تشتمل الرسالة على ثلاثة ملاحق الأول والثاني منها خاص بمقارنة الستة طرق في معالجة مشكلة الازدواج الخطى والقيم المتطرفة تحت شرط التوزيع الطبيعي القياسي للخطأ وتتولد القيم المتطرفة كجزء من توزيع الخطأ ولكن مع تغيير في متوسط الخطأ لهذا الجزء. والثالث يعرض مقارنة الستة طرق تحت شرط .للخطأ Laplace Distribution توزيع
Tags from this library: No tags from this library for this title. Log in to add tags.
Star ratings
    Average rating: 0.0 (0 votes)

Thesis (M.Sc)-Cairo University, 2024.

Bibliography: pages 142-148.

This thesis is basically aiming to give a clear path to what one should do when facing multicollinearity and outliers problem, especially in linear models. It’s well-known that the multicollinearity problem makes the estimator to have large variance. Large variance will increase the mean square error, thus making the estimator bad also outliers causes errors to be non-normal distributed and vise versa. Outlier often tends to pull the regression line towards themselves, resulting bad estimator and change sign of the coefficient parameter. The concept of multicollinearity and outliers for the linear regression model is introduced. Some approaches for detecting multicollinearity and outliers in linear regression model are presented.
Hence, to overcome such problems, this study will try to find robust estimates for handling multicollinearity and outliers problems.
This study is focused on six common biased robust estimators to remedy the dilemma of the multicollinearity and outliers in particular; the ridge M, the ridge MM, Liu M, Liu MM, Liu Type M, Liu Type MM estimators.
This thesis is organized as follows: Chapter One presents the definition of multicollinearity and outliers problem, its consequences, diagnostics, and remedy methods in linear regression model.
Chapter Two discusses the literature review associated to estimation methods for handling multicollinearity, estimation methods for handling outliers, estimation methods for handling multicollinearity and outliers simultaneously and eventually, conclusion of Literature Review are presented.
Chapter Three concerns with parameter estimation of linear regression with multicollinearity, parameter estimation of linear regression with outliers and parameter estimation of linear regression with multicollinearity and outliers simultaneously.

Chapter Four presents Monte Carlo simulation studies for comparing six estimators in handling multicollinearity and outliers under three different cases. First, generating error term distributed 𝑁(0,1) and outliers based on errors distributed 𝑁(10,1). Second, generating error term distributed 𝑁(0,1) and outliers based on errors distributed 𝑁(20,1). Third, generating error term distributed Laplace with mean zero and variance 2. Fourth, graphs for presenting some means of MSE results of the simulation study.
Appendix A presents comparison among MSE behavior of these estimators in case of errors follow a standard normal distribution and some outliers are generated by a percentage of errors according to the selected percentage τ % follow normal distribution with mean = 10 and standard deviation = 1.
Appendix B presents comparison among MSE behavior of these estimators in case of errors follow a standard normal distribution and some outliers are generated by a percentage of errors according to the selected percentage τ % follow normal distribution with mean = 20 and standard deviation = 1
Appendix C presents comparison among MSE behavior of these estimators in case of errors follow a Laplace distribution with mean zero and variance two.

المقدمة:
يعد تحليل الانحدار أحد أساليب تحليل البيانات والذي يستخدم لتوضيح العلاقات بين المتغيرات، أحد أنواع هذا التحليل هو الانحدار الخطي. الانحدارات الخطية المتعددة هي تقنية إحصائية تستخدم العديد من المتغيرات التفسيرية للتنبؤ بقيمة أحد المتغيرات )المتغير التابع(
المربعات الصغرى العادية (OLS) تعد طريقة شائعة الاستخدام في تقدير معلمات الانحدار الخطى. يقال
ان هذه الطريقة هل أفضل مقدر خطى غير متحيز عندما تتحقق كل الفروض المتمثلة في استقلالية الأخطاء والتوزيع الطبيعي للأخطاء. والأخطاء بنسب تباين محددة.
ومع ذلك، يمكن أن يكون التقدير مضطربًا بشكل كبير بسبب وجود الازدواج الخطى المتعدد وعدم اعتدالية الاخطاء.
الازدواج الخطى المتعدد هي حالة يوجد فيها متغيران مستقلان أو أكثر لهما درجة ارتباط من متوسطة إلى مرتفعة. الازدواج الخطى المتعدد يسبب زيادة تباينً المقدر ويؤدي هذا التباين إلى زيادة متوسط الخطأ التربيعي، مما يجعل المقدر سيئًا.
القيم المتطرفة تتسبب في أن تكون الأخطاء موزعة بشكل غير طبيعي والعكس صحيح حيث أن القيم المتطرفة هي قيم البيانات التي تختلف بشكل كبير عن غالبية مجموعة من البيانات، غالبا ما تميل القيم المتطرفة الى سحب خط الانحدار تجاهها، و ينتج عن ذلك مقدر سيء
ومن ثم، للتغلب على مثل هذه المشاكل، ستحاول هذه الدراسة إيجاد تقديرات قوية للتعامل مع مشاكل القيم المتطرفة والازدواج الخطى المتعدد في آن واحد.
عرض المشكلة:
يتمثل التحدي في ايجاد أفضل مقدر في ظل وجود مشكلتي القيم المتطرفة والازدواج الخطى المتعدد في نموذج الانحدار الخطى.

أهداف الدراسة:
.1 دراسة مشكلة الازدواج الخطى المتعدد وأسبابها ونتائجها وطرق الكشف عنها. .2 دراسة مشكلة القيم المتطرفة وأسبابها ونتائجها وطرق الكشف عنها.
.3 تقديم بعض طرق التقدير للتعامل مع مشكلة الازدواج الخطى المتعدد. .4 تقديم بعض طرق التقدير للتعامل مع مشكلة القيم المتطرفة.
.5 دراسة محاكاة للمقارنة بين الطرق المختلفة التي تتعامل مع مشكلة القيم المتطرفة والازدواج الخطى المتعدد في آن واحد في وجود توزيعات إحصائية مختلفة للخطأ ودرجات مختلفة من الارتباط ونسب مئوية مختلفة للقيم المتطرفة وأحجام عينات مختلفة.
• محتوي الرسالة
تشتمل هذه الرسالة على أربعة أبواب بالإضافة الى المراجع والملاحق على النحو التالي: الباب الأول: المقدمة والمفاهيم الرئيسية.
تناول الفصل الأول والثاني مفهوم الازدواج الخطى والقيم المتطرفة وانواعهم ومصادرهم وتبعات هذه المشكلات وطرق الكشف عنهم. وفي الفصل الثالث طرق معالجة الازدواج الخطى. وفي الفصل الرابع طرق معالجة القيم المتطرفة. وفي الفصل الخامس بعض طرق معالجة الازدواج الخطى والقيم المتطرفة في آن واحد.
الباب الثاني: الدراسات السابقة.
الباب الثالث: تقدير معالم الانحدار الخطى في وجود الازدواج الخطى والقيم المتطرفة.
تناول الفصل الأول نموذج الانحدار الخطى وطريقة المربعات الصغرى العادية (OLS) لتقدير معلمات هذا النموذج. الفصل الثاني تناول بعض طرق معالجة الازدواج الخطى كمقدرRidge ومقدر تحليل
ومقدر Liu Typeومقدر Liuومقدر Principal Component Analysis الرئيسية المكونات
k) - (r ومقدرd) – .(r وفي الفصل الثالث تناول بعض طرق معالجة القيم المتطرفة كمقدرات
LTS) LMS, LAD, S, MM, (M, . وفي الفصل الرابع بعض طرق معالجة الازدواج الخطى والقيم
(Robust Ridge, Robust Liu, Robust Liu Type) كمقدرات واحد أن في المتطرفة

الباب الرابع: تم تصميم دراسة محاكاه لمقارنة ستة طرق تقدير لمعالجة مشكلة الازدواج الخطى والقيم المتطرفة في آن واحد في وجود توزيعات إحصائية مختلفة للخطأ ودرجات مختلفة من الارتباط ونسب مئوية مختلفة للقيم المتطرفة وأحجام عينات مختلفة وتمت المقارنة باستخدام معيار MSE . ويناقش هذا الباب ملخص ما تم عرضه في الرسالة وما توصلنا اليه من نتائج ورسومات بيانية كما يعرض بعض التوصيات المقترحة فيما يخص مشكلة الازدواج الخطى والقيم المتطرفة في النماذج الخطية وكذلك بعض الأفكار التي يمكن تطبيقها في أي دراسات مستقبلية.

الملاحق: تشتمل الرسالة على ثلاثة ملاحق الأول والثاني منها خاص بمقارنة الستة طرق في معالجة مشكلة الازدواج الخطى والقيم المتطرفة تحت شرط التوزيع الطبيعي القياسي للخطأ وتتولد القيم المتطرفة كجزء من
توزيع الخطأ ولكن مع تغيير في متوسط الخطأ لهذا الجزء. والثالث يعرض مقارنة الستة طرق تحت شرط
.للخطأ Laplace Distribution توزيع

Issues also as CD.

Text in English and abstract in Arabic & English.

There are no comments on this title.

to post a comment.
Share
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library