TY - BOOK AU - Mohamed Ezzat Abdelaziz, AU - Ahmad Amin Elsheikh AU - Amal Mohamed Abd-Elfatah TI - Comparison of methods for detecting outliers with distributions for estimating time series models U1 - 519.5 PY - 2024/// KW - Mathematical statistics KW - qrmak KW - Outlier KW - Time series KW - ARIMA KW - Autoregressive KW - Detection KW - Exponential KW - Gamma KW - Extreme value KW - Additive outlier KW - Innovational outlier KW - Simulation KW - Robust N1 - Thesis (M.Sc)-Cairo University, 2024; Bibliography: pages 130-135; Issues also as CD N2 - An outlier is a data value that is unusually small or large or deviates from the pattern of the rest of the data. The subject of outliers has attracted a great deal of attention in the last decades, so the study of outliers is not a new phenomenon. Most real-world data sets contain outliers that have unusually large or small values when compared with others in the data set and it may cause a negative effect on data analysis. There are different methods and tests for detecting outliers according to the type of data which are: • Methods and tests for cross-section data that follow a specific distribution. • Methods and tests for time series data. This study is concerned with detecting the outliers in time series data that follows a specific distribution, so two models were considered which are the Exponential Autoregressive model of order one EAR(1) and the Gamma Autoregressive model of order one GAR(1), and two types of outliers additive outlier (AO) and innovational outlier (IO) were generated in each model, then three methods/tests which are ARIMA-AO(IO), Modified Z-score and Rosner were applied in each model to detect the outliers. An EAR(1) model is an Autoregressive model whose data follows Exponential distribution and a GAR(1) model is an Autoregressive model whose data follows Gamma distribution. For comparison between the best performance, methods and tests of cross-section data (Modified Z-score & Rosner) and time series data (ARIMA-AO(IO)) were applied. Three criteria of performance were used to measure the performance of each method which are Recall, Precision and F-measure; تحتوي معظم البيانات الحقيقية على مشاهدات قد تكون كبيرة او صغيرة بشكل غير عادى عند مقارانتها بالقيم الأخرى فى مجموعة البيانات. وقد يكون لهذه المشاهدات الشاذة المعروفة بأنها (قيم شاذة) تأثير سلبي على تحليل البيانات مثل تقديرات الانحدار والتنبؤ وتحليل التباين و غيرذلك والقيم المتطرفة هي أدوات قوية لتحديد الاحداث الاكثر إثارة للاهتمام في بيانات المجتمع ويمكن انتقاء الاحداث المهمة تاريخيًا من خلال الكشف عن القيم الشاذة في مجموعات بيانات السلاسل الزمنية. تم عرض العديد من تقنيات الكشف عن القيم المتطرفة في هذه الدراسة. هناك نوعان من طرق الكشف عن القيم المتطرفة بالنسبة لنوع البيانات هما .1 طرق كشف تستخدم مع التوزيعات االحصائية (البيانات المقطعية التى تتبع توزيع معين) .2 طرق كشف تستخدم مع بيانات السالسل الزمنية وهذة الدراسة تهتم بالكشف عن القيم الشاذة فى بيانات السالسل الزمنية التى تتبع توزيع معين و تمت الدراسة على نموذجين هما Exponential autoregressive EAR 1 نموذج الانحدار الذاتي الاسي من الرتبة الاولي 1 Gamma Autoregressive GAR 1 نموذج الانحدار الذاتي لجاما من الرتبة الاولي 2 ER -