MARC details
000 -LEADER |
fixed length control field |
09391namaa22004331i 4500 |
003 - CONTROL NUMBER IDENTIFIER |
control field |
OSt |
005 - أخر تعامل مع التسجيلة |
control field |
20250223033423.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION |
fixed length control field |
250202s2024 |||a|||f m||| 000 0 eng d |
040 ## - CATALOGING SOURCE |
Original cataloguing agency |
EG-GICUC |
Language of cataloging |
eng |
Transcribing agency |
EG-GICUC |
Modifying agency |
EG-GICUC |
Description conventions |
rda |
041 0# - LANGUAGE CODE |
Language code of text/sound track or separate title |
eng |
Language code of summary or abstract |
eng |
-- |
ara |
049 ## - Acquisition Source |
Acquisition Source |
Deposit |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER |
Classification number |
519.53 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) |
Classification number |
519.53 |
Edition number |
21 |
097 ## - Degree |
Degree |
M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) |
Local Call Number |
Cai01.03.01.M.Sc.2024.Ma.S |
100 0# - MAIN ENTRY--PERSONAL NAME |
Authority record control number or standard number |
Mariam Khaled Fouad Hegazy, |
Preparation |
preparation. |
245 10 - TITLE STATEMENT |
Title |
Survival Analysis: Statistical Approaches Vs Machine Learning Approaches/ |
Statement of responsibility, etc. |
Mariam Khaled Fouad Hegazy ; Supervisors: Prof. Ahmed Mahmoud Gad, Dr. Mahmoud Mostafa Rashwan, Dr. Niveen Ibrahim El Zayat. |
246 15 - VARYING FORM OF TITLE |
Title proper/short title |
/تحليل البقاء على الحياة: الأساليب الإحصائية مقابل أساليب التعلم الآلي |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE |
Date of production, publication, distribution, manufacture, or copyright notice |
2024. |
300 ## - PHYSICAL DESCRIPTION |
Extent |
112 pages : |
Other physical details |
illustrations ; |
Dimensions |
25 cm. + |
Accompanying material |
CD. |
336 ## - CONTENT TYPE |
Content type term |
text |
Source |
rda content |
337 ## - MEDIA TYPE |
Media type term |
Unmediated |
Source |
rdamedia |
338 ## - CARRIER TYPE |
Carrier type term |
volume |
Source |
rdacarrier |
502 ## - DISSERTATION NOTE |
Dissertation note |
Thesis (M.Sc.) -Cairo University, 2024. |
504 ## - BIBLIOGRAPHY, ETC. NOTE |
Bibliography, etc. note |
Bibliography: pages 85-99. |
520 ## - SUMMARY, ETC. |
Summary, etc. |
Survival analysis is a statistical and modelling technique used to analyse time-to-event <br/>data, which measures the time it takes for an event of interest to occur, such as death, <br/>failure, or any other endpoint. It is responsible for predicting the time to event while <br/>accounting for censoring. It is commonly applied in medical research, however, it is <br/>also used in engineering, environmental studies, criminal studies, etc... <br/>Machine learning is rapidly growing as a modern approach for dealing with datasets. It <br/>is concerned with a wide range of algorithms, including decision trees, random forests, <br/>support vector machines, k-nearest neighbours, neural networks, and other algorithms. <br/>Most of the algorithms are specifically trained, tested and validated for classification <br/>problems. However, a number of algorithms were trained to deal with survival analysis <br/>and censoring issues. <br/>Previous researches compared between statistical and machine learning approaches in <br/>prediction as Moncada-Torres et al (2021). However, majority of these comparisons <br/>used only one dataset and did not consider understanding the effect of the dimensions <br/>of the dataset. In addition, previous literature did not deal with the impact of different <br/>natures (complexity of variables, dimensionality of datasets, type of dependent <br/>variables, absence of censoring from dataset, etc…) of datasets. This study aims to deal <br/>with three datasets with various dimensions. For each dataset, the statistical approach <br/>and the machine learning algorithms will be conducted. The performance of each <br/>algorithm would be recorded and the highest preforming technique in prediction for <br/>each dataset was revealed. Moreover, the feature selection should be applied to <br/>understand whether results would significantly change. <br/>iii <br/>The thesis outline includes five chapters. Chapter One starts by introducing machine <br/>learning and statistical approaches in the survival analysis. It introduces the measures <br/>of prediction power for survival models. At the end of the chapter, the research <br/>objectives and the thesis structure were presented. In Chapter Two, a brief review will <br/>be given to survival analysis and the traditional statistical techniques in the field of <br/>survival analysis. It provides information about the history and application for each <br/>statistical technique. The statistical techniques reviewed varied from non-parametric <br/>Kaplan-Meier, semi-parametric Cox regression modelling and the parametric <br/>accelerated failure time model. Afterwards, in Chapter Three, the machine learning <br/>algorithms will be investigated, and their applications will be studied. After reviewing <br/>the survival tree, the evolutions of the algorithm using bagging and boosting methods <br/>were discussed. Therefore, the random survival forest, extreme gradient boosting, <br/>survival support vector regression (with linear/radial basis function/ sigmoid/ <br/>polynomial kernel). To conduct the comparison, Chapter Four will show how the <br/>previous literature dealt with the issue and what research gap was found. Furthermore, <br/>the concordance index will then be discussed as performance metric for the algorithms <br/>across various datasets of different dimensions. The algorithms will be applied and <br/>conclusions regarding the dimensions will be drawn. Eventually, in Chapter Five, we <br/>gave a summary of the conclusion drawn, discussed the existing limitations, and <br/>outlined the recommendation for further research. |
520 ## - SUMMARY, ETC. |
Summary, etc. |
تعد تحليل البقاء تقنية إحصائية ونمذجة تستخدم لتحليل بيانات الوقت حتى الحدث، والتي تقيس الوقت الذي يستغرقه حدث معين ليحدث، مثل الموت، أو الفشل، أو أي نقطة نهاية أخرى. وهو مسؤول عن التنبؤ بالوقت حتى الحدث مع مراعاة الرقابة. يتم تطبيقه بشكل شائع في البحوث الطبية، ومع ذلك، يتم استخدامه أيضًا في الهندسة، والدراسات البيئية، والدراسات الجنائية، إلخ… التعلم الآلي ينمو بسرعة كنهج حديث للتعامل مع مجموعات البيانات. وهو يشمل مجموعة واسعة من الخوارزميات، بما في ذلك Decision Tree، Random Forest، Support Vector Machine، أKNN-neighbours، Neural networks، وخوارزميات أخرى. تم تدريب معظم الخوارزميات خصيصًا، واختبارها والتحقق من صحتها لمشكلات التصنيف. ومع ذلك، تم تدريب عدد من الخوارزميات للتعامل مع تحليل البقاء وقضايا الرقابة. قارنت الأبحاث السابقة بين المناهج الإحصائية والتعلم الآليومع ذلك، استخدمت غالبية هذه المقارنات مجموعة بيانات واحدة فقط ولم تأخذ في عين الاعتبار فهم تأثير أبعاد مجموعة البيانات. بالإضافة إلى ذلك، لم تتعامل الأدبيات السابقة مع تأثير طبائع مجموعات البيانات المختلفة. هذه الدراسة تهدف إلى التعامل مع ثلاث مجموعات بيانات ذات أبعاد مختلفة. بالنسبة لكل مجموعة بيانات، سيتم إجراء المنهجية. تتضمن الرسالة خمسة فصول. يبدأ الفصل الأول بتقديم التعلم الآلي والمناهج الإحصائية في تحليل البقاء. يقدم مقياس الأداء لنماذج البقاء. في نهاية الفصل، تم تقديم أهداف البحث وهيكل الرسالة. في الفصل الثاني، سيتم إعطاء مراجعة موجزة لتحليل البقاء والتقنيات الإحصائية التقليدية في مجال تحليل البقاء. يوفر معلومات حول التاريخ والتطبيق لكل تقنية إحصائية. تنوعت التقنيات الإحصائية المراجعة من كابلان-ماير غير المعلمة، نمذجة انحدار cox شبه المعلمة ونموذج accelerated failure timeالمعلمي. بعد ذلك، في الفصل الثالث، سيتم التحقيق في خوارزميات التعلم الآلي، وسيتم دراسة تطبيقاتها. بعد مراجعة survival tree، تم مناقشة تطورات الخوارزمية باستخدام طرق التجميع والتعزيز. لذا، random survival forest، الsurvival support regression، fast kernel survival support vector machine (مع وظيفة أساس خطية / شعاعية / سيغمويد / كثيرة حدود). لإجراء المقارنة، سيرى الفصل الرابع كيف تعاملت الأدبيات السابقة مع المشكلة وما هو فجوة البحث التي تم العثور عليها. بعد ذلك، سيتم مناقشة مؤشر التوافق كمؤشر أداء للخوارزميات عبر مجموعات بيانات مختلفة من أبعاد مختلفة. ستطبق الخوارزميات وستُستخرَج استنتاجات بشأن الأبعاد. في نهاية المطاف، في الفصل الخامس، قدَّمنا موجزًا للاستنتاج المستخرَج، وناقشنا القيود الموجودة، وحدَّدنا التوصية لأبحاث أخرى. |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE |
Issues CD |
Issues also as CD. |
546 ## - LANGUAGE NOTE |
Text Language |
Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM |
Topical term or geographic name entry element |
Statistics |
Source of heading or term |
qrmak |
653 #0 - INDEX TERM--UNCONTROLLED |
Uncontrolled term |
Accelerated Failure time model |
-- |
Concordance index |
-- |
Cox Regression Modelling |
-- |
Machine Learning algorithms |
-- |
Random Survival Forest |
-- |
Support vector Machine |
-- |
XGBoost |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Ahmed Mahmoud Gad |
Relator term |
thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Mahmoud Mostafa Rashwan |
Relator term |
thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME |
Personal name |
Niveen Ibrahim El Zayat |
Relator term |
thesis advisor. |
900 ## - Thesis Information |
Grant date |
01-01-2024 |
Supervisory body |
Ahmed Mahmoud Gad |
-- |
Mahmoud Mostafa Rashwan |
-- |
Niveen Ibrahim El Zayat |
Universities |
Cairo University |
Faculties |
Faculty of Economics and Political Science |
Department |
Department of Statistics |
905 ## - Cataloger and Reviser Names |
Cataloger Name |
Aya Mohamed |
Reviser Names |
Huda |
942 ## - ADDED ENTRY ELEMENTS (KOHA) |
Source of classification or shelving scheme |
Dewey Decimal Classification |
Koha item type |
Thesis |
Edition |
21 |
Suppress in OPAC |
No |