Machine Learning Algorithms for Missing Values in Phase I Statistical Process Monitoring/ (Record no. 169254)
[ view plain ]
000 -LEADER | |
---|---|
fixed length control field | 11243namaa22004331i 4500 |
003 - CONTROL NUMBER IDENTIFIER | |
control field | OSt |
005 - أخر تعامل مع التسجيلة | |
control field | 20250223033338.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION | |
fixed length control field | 241204s2023 |||a|||f m||| 000 0 eng d |
040 ## - CATALOGING SOURCE | |
Original cataloguing agency | EG-GICUC |
Language of cataloging | eng |
Transcribing agency | EG-GICUC |
Modifying agency | EG-GICUC |
Description conventions | rda |
041 0# - LANGUAGE CODE | |
Language code of text/sound track or separate title | eng |
Language code of summary or abstract | eng |
-- | ara |
049 ## - Acquisition Source | |
Acquisition Source | Deposite |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER | |
Classification number | 519.53 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) | |
Classification number | 519.53 |
Edition number | 21 |
097 ## - Degree | |
Degree | M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) | |
Local Call Number | Cai01.03.01.M.Sc.2023.Di.M |
100 0# - MAIN ENTRY--PERSONAL NAME | |
Authority record control number or standard number | Dina Ashraf Abdelhameed Desoki, |
Preparation | preparation. |
245 10 - TITLE STATEMENT | |
Title | Machine Learning Algorithms for Missing Values in Phase I Statistical Process Monitoring/ |
Statement of responsibility, etc. | Dina Ashraf Abdelhameed Desoki ; Supervisors: Prof. Abdel-Nasser Saad, Prof. Mahmoud Al-Said, Associate Prof. Nesma Saleh. |
246 15 - VARYING FORM OF TITLE | |
Title proper/short title | /خوارزميات تعلم الآلة للقيم المفقودة في المرحلة الأولى للمراقبة الإحصائية للعمليات |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE | |
Date of production, publication, distribution, manufacture, or copyright notice | 2023. |
300 ## - PHYSICAL DESCRIPTION | |
Extent | 84 pages : |
Other physical details | illustrations ; |
Dimensions | 25 cm. + |
Accompanying material | CD. |
336 ## - CONTENT TYPE | |
Content type term | text |
Source | rda content |
337 ## - MEDIA TYPE | |
Media type term | Unmediated |
Source | rdamedia |
338 ## - CARRIER TYPE | |
Carrier type term | volume |
Source | rdacarrier |
502 ## - DISSERTATION NOTE | |
Dissertation note | Thesis (M.Sc.) -Cairo University, 2023. |
504 ## - BIBLIOGRAPHY, ETC. NOTE | |
Bibliography, etc. note | Bibliography: pages 72-80. |
520 ## - SUMMARY, ETC. | |
Summary, etc. | The quality of the estimators from Phase I largely determines the performance of the process monitoring in Phase II. Providing Phase II control charts with poor parameters estimates leads to a weak performance. Phase I analysis is essential to understand the variability of the process and determine its stability. In case of incomplete Phase I data, the problem of missing values must be dealt with before going through the parameters estimation process. In literature, various traditional imputation methods were proposed. After extensive research on imputation methods, researchers concluded that none of the imputation methods best suits all different types of statistical analyses. Each imputation method has its advantages and disadvantages. Researchers commonly rely on the Mean Substitution (MS) and/or the Stochastic Regression (SRG) imputation methods. The MS is a straightforward method that is used heavily in literature, while the SRG imputation method has an outstanding performance in many studies. On another side, the use of machine learning algorithms in different applications is a growing field. The number of studies exploiting machine learning algorithms in the SPC field is rapidly increasing. In this study, the MS and the SRG imputation methods are compared to two common, yet powerful machine learning-based imputation methods: k-Nearest Neighbors (kNN) and Support Vector Regression (SVR) in terms of their abilities to handle missing values in Phase I data. <br/>Overall, machine learning imputation methods considered in this study are preferable to the traditional methods. In most cases, the performance of the SPC tools under machine learning methods is far more powerful than that under the traditional ones. In the other cases, the performance of the SPC tools under the traditional and the machine learning methods is about the same. As a result, the use of the SVR imputation is recommended in monitoring the process mean, while the kNN is the best imputation method in monitoring the process dispersion. All things considered; machine learning imputation methods are highly recommended in case of monitoring the process mean or the process dispersion. Finally, this study emphasizes the importance of choosing the most suitable imputation method to obtain the best performance possible.<br/>This study consists of six chapters as follows:<br/>Chapter One provides an overview of the study problem and motivation, then presents the objectives of the study.<br/>Chapter Two gives the basic definitions of the most common statistical process control tools. It also reviews the literature on the Hotelling’s T2 chart, change-point approach, and the G-chart.<br/>Chapter Three describes the problem of missing data and illustrates the missingness patterns and mechanisms. Additionally, it reviews the literature on the traditional and machine learning-based imputation methods along with their common uses, in general, and in the context of the SPC, in particular.<br/>Chapter Four compares the performance of the Hotelling’s T2 and the change-point approach under the traditional imputation methods to that under machine learning imputation methods. Additionally, the traditional and machine learning imputation methods are compared in terms of the quality of the estimates produced.<br/>Chapter Five evaluates the performance of the G-chart under the traditional and machine learning imputation methods. Moreover, the quality of the estimates produced by different imputation methods is compared.<br/>Chapter Six gives the conclusions, comments, recommendations, and points out some research points to be studied in future work.<br/> |
520 ## - SUMMARY, ETC. | |
Summary, etc. | جودة التقديرات في المرحلة الأولى للمراقبة الإحصائية للجودة تحدد بشكل كبير أداء مراقبة العلميات في المرحلة الثانية. تغذية خرائط التحكم في المرحلة الثانية بتقديرات رديئة للمعلمات سيؤدي إلى أداء ضعيف. تحليل المرحلة الأولى ضروري لفهم تباين العلميات وتحديد استقرارها. في حال كانت بيانات المرحلة الأولى غير مكتملة، فإن مشكلة البيانات المفقودة لابد من التعامل معها قبل المضي قدماً في تقدير معلمات العمليات. في الأدبيات السابقة، اقترحت العديد من طرق تعويض البيانات التقليدية. بعد دراسة مكثفة في طرق تعويض البيانات، خلص الباحثون إلى أنه ما من طريقة لتعويض البيانات تناسب جميع التحليلات الإحصائية. لكل طريقة ما لها وما عليها. عادة ما يعتمد الباحثون على التعويض بالوسط الحسابي Mean Substitution (MS) أو الانحدار العشوائي Stochastic Regression (SRG) imputation أو كلاهما. أما التعويض بالوسط الحسابي فهو طريقة مباشرة وتستخدم بكثرة في الأدبيات، بينما لطريقة الانحدار العشوائي أداءً متميزاً في الكثير من الدراسات. على صعيد آخر، يعتبر استخدام طرق التعويض المبنية على خوارزميات تعلم الآلة مجالاً نامياً. يزداد عدد الدراسات التي تستغل خوارزميات تعلم الآلة في مجال المراقبة الضبط الإحصائي للجودة بتسارع. في هذه الدراسة، نقارن التعويض بالوسط الحسابي والانحدار العشوائي بطريقتي تعويض مبنية على تعلم الآلة شائعتين، ولكن قويتين وهما الجار الأقرب k-Nearest Neighbors (kNN) وانحدار المتجه الداعمSupport Vector Regression (SVR) من حيث قدرتهم على التعامل مع القيم المفقودة في بيانات المرحلة الأولى. <br/>إجمالاً، تفضل طرق التعويض المبنية على خوارزميات تعلم الآلة التي تم تناولها في هذه الدراسة على الطرق التقليدية. في أغلب الأحيان، أداء لقد أُثبت أن أداء أدوات الضبط الإحصائي للجودة تحت طرق تعويض البيانات المبنية على خوارزميات تعلم الآلة أقوى بكثير مقارنةً بذلك بأدائها تحت طرق تعويض البيانات التقليدية في أغلب الأحيان. في الحالات الأخرى، تقدم طرق تعويض البيانات المبنية على خوارزميات تعلم الآلة أداءاً مماثلاً لأداء طرق تعويض البيانات التقليدية. ولذلك، ينصح باستخدام طريقة SVR أثناء مراقبة الوسط الحسابي للعمليات، بينما تفضل طريقة kNN أثناء مراقبة تباين العمليات. بأخذ جميع الأمور في الاعتبار، ينصح باستخدام طرق تعويض البيانات المبنية على خوارزميات تعلم الآلة في حالة مراقبة الوسط الحسابي أو تباين العلميات. هذه الدراسة تؤكد على أهمية اختيار طريقة تعويض البيانات المناسبة للحصول على أفضل أداء ممكن.<br/>تتكون الرسالة من ستة فصول على النحو التالي:<br/>الفصل الأول: يعطي لمحة عامة عن المشكلة التي تتعرض لها الدراسة ودافعها، كما يلقي الضوء على أهداف الدراسة الرئيسية. <br/><br/>الفصل الثاني: يعطي المفاهيم الأساسية عن أدوات الضبط الإحصائي الشائعة، ثم يستعرض الأدبيات السابقة عن خريطة هوتلنــج، طريقة نقطة التغيير، وخريطة تحكم جي.<br/><br/>الفصل الثالث: يصف مشكلة البيانات المفقودة ويوضح نمط وآلية فقد البيانات. علاوة على ذلك، يستعرض الأدبيات السابقة عن طرق تعويض البيانات التقليدية والمبنية على تعلم الآلة مع استخداماتهم الشائعة في العموم وفي نطاق الضبط الإحصائي للجودة بشكل خاص.<br/><br/>الفصل الرابع: يقارن تأثير طرق تعويض البيانات، التقليدية والمبنية على تعلم الآلة، على أداء خريطة هوتلنج وطريقة نقطة التغير. يحدد الفصل المقاييس المستخدمة في المقارنة ويخطط لدراسة المحاكاة، ثم يناقش النتائج.<br/><br/>الفصل الخامس: يقيس أداء خريطة جي تحت طرق تعويض البيانات، التقليدية والمبنية على تعلم الآلة. كما يقارن بين جودة التقديرات الناتجة عن طرق تعويض البيانات المختلفة.<br/><br/>الفصل السادس: يحوي ما خلصت إليه الدراسة، التعليقات، التوصيات ويشير إلى بعض نقاط البحث لتُـــدرس في المستقبل.<br/> |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE | |
Issues CD | Issues also as CD. |
546 ## - LANGUAGE NOTE | |
Text Language | Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM | |
Topical term or geographic name entry element | Statistics |
Source of heading or term | qrmak |
653 #0 - INDEX TERM--UNCONTROLLED | |
Uncontrolled term | Machine Learning |
-- | Missing Values |
-- | SPC |
-- | Phase I |
-- | Hotelling’s T2 Control Chart |
-- | Change-point |
-- | Statistical Process Control |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Abdel-Nasser Saad |
Relator term | thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Mahmoud Al-Said |
Relator term | thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Nesma Saleh |
Relator term | thesis advisor. |
900 ## - Thesis Information | |
Grant date | 01-01-2023 |
Universities | Cairo University |
Faculties | Faculty of Economics and Political Science |
Department | Department of Statistics |
Supervisory body | Abdel-Nasser Saad |
-- | Mahmoud Al-Said |
-- | Nesma Saleh |
905 ## - Cataloger and Reviser Names | |
Cataloger Name | Aya Mohamed |
Reviser Names | Huda |
942 ## - ADDED ENTRY ELEMENTS (KOHA) | |
Source of classification or shelving scheme | Dewey Decimal Classification |
Koha item type | Thesis |
Edition | 21 |
Suppress in OPAC | No |
Source of classification or shelving scheme | Home library | Current library | Date acquired | Inventory number | Full call number | Barcode | Date last seen | Effective from | Koha item type |
---|---|---|---|---|---|---|---|---|---|
Dewey Decimal Classification | المكتبة المركزبة الجديدة - جامعة القاهرة | قاعة الرسائل الجامعية - الدور الاول | 04.12.2024 | 89133 | Cai01.03.01.M.Sc.2023.Di.M | 01010110089133000 | 04.12.2024 | 04.12.2024 | Thesis |