Comparison of methods for detecting outliers with distributions for estimating time series models / by Mohamed Ezzat Abdelaziz ; Supervised Prof. Ahmad Amin Elsheikh, Dr. Amal Mohamed Abd-Elfatah.
Material type:
- text
- Unmediated
- volume
- مقارنة طرق الكشف عن القيم المتطرفة مع التوزيعات لتقدير نماذج السلاسل الزمنية [Added title page title]
- 519.5
- Issues also as CD.
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.04.M.Sc.2024.Mo.C (Browse shelf(Opens below)) | Not for loan | 01010110091035000 |
Thesis (M.Sc)-Cairo University, 2024.
Bibliography: pages 130-135.
An outlier is a data value that is unusually small or large or deviates from the pattern of the rest of the data. The subject of outliers has attracted a great deal of attention in the last decades, so the study of outliers is not a new phenomenon. Most real-world data sets contain outliers that have unusually large or small values when compared with others in the data set and it may cause a negative effect on data analysis. There are different methods and tests for detecting outliers according to the type of data which are:
• Methods and tests for cross-section data that follow a specific distribution.
• Methods and tests for time series data.
This study is concerned with detecting the outliers in time series data that follows a specific distribution, so two models were considered which are the Exponential Autoregressive model of order one EAR(1) and the Gamma Autoregressive model of order one GAR(1), and two types of outliers additive outlier (AO) and innovational outlier (IO) were generated in each model, then three methods/tests which are ARIMA-AO(IO), Modified Z-score and Rosner were applied in each model to detect the outliers. An EAR(1) model is an Autoregressive model whose data follows Exponential distribution and a GAR(1) model is an Autoregressive model whose data follows Gamma distribution. For comparison between the best performance, methods and tests of cross-section data (Modified Z-score & Rosner) and time series data (ARIMA-AO(IO)) were applied. Three criteria of performance were used to measure the performance of each method which are Recall, Precision and F-measure.
تحتوي معظم البيانات الحقيقية على مشاهدات قد تكون كبيرة او صغيرة بشكل غير عادى عند مقارانتها بالقيم الأخرى فى مجموعة البيانات. وقد يكون لهذه المشاهدات الشاذة المعروفة بأنها (قيم شاذة) تأثير سلبي على تحليل البيانات مثل تقديرات الانحدار والتنبؤ وتحليل التباين و غيرذلك
والقيم المتطرفة هي أدوات قوية لتحديد الاحداث الاكثر إثارة للاهتمام في بيانات المجتمع ويمكن
انتقاء الاحداث المهمة تاريخيًا من خلال الكشف عن القيم الشاذة في مجموعات بيانات السلاسل الزمنية.
تم عرض العديد من تقنيات الكشف عن القيم المتطرفة في هذه الدراسة. هناك نوعان من طرق الكشف عن القيم المتطرفة بالنسبة لنوع البيانات هما
.1 طرق كشف تستخدم مع التوزيعات االحصائية (البيانات المقطعية التى تتبع توزيع معين)
.2 طرق كشف تستخدم مع بيانات السالسل الزمنية
وهذة الدراسة تهتم بالكشف عن القيم الشاذة فى بيانات السالسل الزمنية التى تتبع توزيع معين و تمت الدراسة على نموذجين
هما
Exponential autoregressive EAR 1 نموذج الانحدار الذاتي الاسي من الرتبة الاولي 1
Gamma Autoregressive GAR 1 نموذج الانحدار الذاتي لجاما من الرتبة الاولي 2
Issues also as CD.
Text in English and abstract in Arabic & English.
There are no comments on this title.