The statistical inference for quasi lindley regression model with application /
Hager Magdy Rashed Mohamed, 
The statistical inference for quasi lindley regression model with application / الاستدلال الإحصائي لنموذج الانحدار كوزي ليندلي مع التطبيق by Hager Magdy Rashed Mohamed ; Supervised by Prof. Salah Mahdy Ramadan, Dr. Amal Mohamed Abdel Fattah. - 103 Leaves : illustrations ; 30 cm. + CD.
Thesis (Ph.D)-Cairo University, 2024.
Bibliography: pages 98-101.
This thesis presents the development of a novel Log Quasi Lindley (LQL) regression model based on the Quasi Lindley distribution to tackle the complexities of analyzing censored lifetime data, which is prevalent in fields such as medicine and engineering. The study investigates the maximum likelihood estimates of model parameters, considering the presence of censored data. Martingale and deviance residuals were employed to validate model assumptions, ensure data integrity, and identify potential outliers. Additionally, global influence diagnostics, including Cook’s distance, were used to detect influential observations in the dataset. A Monte Carlo simulation study was conducted to evaluate the model’s performance across various sample sizes and censoring rates, focusing on key metrics like average bias and mean square error (MSE). The empirical distribution of martingale and deviance residuals was examined to further assess model performance.
A real-world lifetime dataset was analyzed using the LQL regression model to demonstrate its applicability and effectiveness. Several goodness-of-fit tests were applied, including both graphical methods and numerical criteria (AIC, BIC, and HQIC). The results showed that the LQL model performs best when larger sample sizes and low censoring rates are present, offering robust and accurate parameter estimation. Furthermore, the LQL model was compared to the Lindley and Log-Weibull regression models, with the former outperforming both in terms of goodness-of-fit measures and overall performance, solidifying its value for practical applications in survival analysis. تركز هذه الدراسة على نمذجة وتحليل بيانات وقت الحياة، وهو نوع من البيانات الذي يسجل الوقت حتى وقوع أحداث معينة مثل تعطل المعدات أو تقدم الأمراض أو بقاء المرضى على قيد الحياة. تعتبر بيانات وقت الحياة شائعة في مجالات مثل الطب والهندسة. يعد تحليل البقاء على قيد الحياة المنهج الإحصائي الأساسي المستخدم لتحليل بيانات "الوقت حتى الحدث"، وخاصة في مجموعات البيانات الخاضعة للرقابة Censored data)) حيث لا تتوفر الملاحظات الكاملة.
قدمت النماذج الخطية المعممة (GLMs) إطارًا مرنًا لتحليل المتغيرات الثنائية والعددية والمستمرة. أثبتت نماذج الانحدار لوغاريتم مقياس الموضع (log location scale regression models) فعاليتها بشكل خاص في تحليل بيانات وقت الحياة. يقدم توزيع كوزي ليندلي بديلاً مرنًا لنمذجة بيانات وقت الحياة، مما يوفر تحليل أفضل مقارنة بالتوزيعات الأبسط.
تواجه نماذج الانحدار التقليدية صعوبة في التعامل مع بيانات وقت الحياة الخاضعة للرقابة (Censored lifetime data)، خاصة بسبب افتراضات التوزيع الطبيعي والبيانات الخاضعة للرقابة. تهدف هذه الرسالة إلى معالجة هذه التحديات من خلال تطوير نموذج انحدار جديد يعتمد على اللوغاريتم لتحليل بيانات وقت الحياة الخاضعة للرقابة، مستندًا إلى توزيع كوزي ليندلي(QLD) ، مما يوفر نهجًا أكثر قوة للتنبؤ بالنتائج في ظل وجود المتغيرات المستقلة.
هيكل هذه الدراسة منظم كما يلي:
في الفصل الأول، تم تقديم الأسس النظرية للنماذج الخطية المعممة (GLMs) ونماذج الانحدار القائم على لوغاريتم مقياس الموضع. وضع هذا الأساس لفهم القيود التي تواجه النماذج الحالية، خاصة عند تطبيقها على البيانات الخاضعة للرقابة. تمت مناقشة تقنيات البيانات الخاضعة للرقابة وتقدير مقدرات الإمكان الأعظم(MLE) التي أكدت الحاجة إلى نموذج أكثر مرونة لاستيعاب التعقيدات الجوهرية في بيانات وقت الحياة. كما تم تقديم الفجوة البحثية التي تركز على عدم وجود نموذج انحدار فعال يعتمد على توزيع كوزي ليندلي للبيانات الخاضعة للرقابة.
في الفصل الثاني، تم إجراء مراجعة شاملة للدراسات السابقة التي تغطي تطورات نماذج انحدار ليندلي ونماذج الانحدار الكوزي وبناء نماذج الانحدار المختلفة للتوزيعات الكوزي. سلطت المراجعة الضوء على التقدم المحرز في هذه المجالات وحددت الفجوات البحثية في الأبحاث الحالية، لا سيما غياب النماذج التي تعالج البيانات الخاضعة للرقابة باستخدام توزيع كوزي ليندلي. كما تناول الفصل بناء نماذج الانحدار المختلفة المستندة إلى توزيعات الكوزي، مثل نموذج انحدار كوزي ليندلي بواسون، ونموذج الانحدار الكوزي ذو الحدين، ونموذج الانحدار الكوزي بواسون، مما يؤسس الإطار النظري لتوسيع توزيعات الكوزي إلى مجالات جديدة.
في الفصل الثالث، تم تقديم نموذج الانحدار لوغاريتم كوزي ليندلي (LQL)، بدءًا من تقديم مفصل لتوزيع كوزي ليندلي وخصائصه الرياضية. ثم تم تفصيل بناء نموذج الانحدار القائم على لوغاريتم مقياس الموضع لتوزيع كوزي ليندلي. تم تقديم شرح مفصل لتقدير مقدرات الإمكان الأعظم (MLE) لنموذج الانحدار لوغاريتم كوزي ليندلي .انتهى الفصل باستعراض تقنيات تحليل البواقي مثل بواقي مارتينغال (Martingale Residual) وبواقي الانحراف (Deviance Residual) وبواقي بيرسون (Pearson Residuals )، تليها طرق تحليل الحساسية بما في ذلك مسافة كوك ومسافة الاحتمال (Likelihood Distance).
ركز الفصل الرابع على اختبار وتقييم نموذج لوغاريتم كوزي ليندلي المقترح من خلال دراسة محاكاة مونتي كارلو وتحليل بيانات حقيقة. تم في هذا الفصل مقارنة المعايير الإحصائية المختلفة مثل معيار خاصية "أكياكي" للمعلومات (AIC)، ومعيار خاصية معلومات "بيز" (BIC)، ومعيار خاصية "هانان-كوين" للمعلومات (HQIC)، بالإضافة إلى متوسط التحيز (Average bias)ومتوسط مربعات الأخطاء (MSE) واختبارات جودة الملاءمة لتقييم أداء النموذج. تم تقييم أداء النموذج من خلال محاكاة مونتي كارلو باستخدام أحجام عينات مختلفة (n = 50, 100, 200) ونسب متنوعة من البيانات الخاضعة للرقابة (0٪، 10٪، 30٪) ومعايير تكوين المعلمات المختلفة، إلى جانب تحليل البواقي. أظهرت النتائج أن النموذج يتمتع بدرجة كبيرة من المرونة والموثوقية، حيث انخفضت متوسط التحيز (Average bias)ومتوسط مربعات الأخطاء (MSE) عبر أحجام العينات المختلفة ونسب البيانات خاضعة للرقابة، لا سيما عند زيادة حجم العينات وانخفاض نسب بيانات الخاضعة للرقابة. يتضمن تحليل البيانات الحقيقة تحليل مجموعة بيانات حقيقية من تجربة لدراسة أوقات فشل عينات العزل الكهربائي المصنوعة من الإيبوكسي الصلب تحت اختبار إجهاد الحياة المتسارع. كانت البيانات الحقيقة اختبار ممتاز لنموذج لوغاريتم كوزي ليندلي نظرًا لوجود ملاحظات خاضعه للرقابة بنسبة 10%. تم مقارنة نموذج لوغاريتم كوزي ليندلي مع نماذج انحدار ليندلي ولوغاريتم ويبول. أظهر التحليل التجريبي أن نموذج لوغاريتم كوزي ليندلي قدم أفضل ملاءمة للبيانات، كما يتضح من القيم المنخفضة للمعايير الإحصائية (AIC)، (BIC)، و (CAIC) بالإضافة إلى ذلك، أظهرت تحليلات البواقي وتحليل الحساسية أن نموذج LQL كان الأكثر قدرة على تفسير التغيرات في البيانات مقارنة بالنماذج الأخرى.
في الختام، يمثل نموذج الانحدار لوغاريتم كوزي ليندلي (LQL) تقدمًا كبيرًا في تحليل البقاء على قيد الحياة، خاصة في التعامل مع بيانات وقت الحياة الخاضعة للرقابة. يوسع هذا النموذج نطاق تطبيقات توزيعات الكوزي إلى مجالات جديدة، مما يوفر أداة قوية لتحليل الهياكل المعقدة لبيانات وقت الحياة
Text in English and abstract in Arabic & English.
Statistics
Censored Data Generalized Linear Models (GLMS) Log Quasi Lindley Regression Model Maximum Likelihood Estimation Monte Carlo Simulation Quasi Lindely Distribution Residual Analysis
519.5
                        The statistical inference for quasi lindley regression model with application / الاستدلال الإحصائي لنموذج الانحدار كوزي ليندلي مع التطبيق by Hager Magdy Rashed Mohamed ; Supervised by Prof. Salah Mahdy Ramadan, Dr. Amal Mohamed Abdel Fattah. - 103 Leaves : illustrations ; 30 cm. + CD.
Thesis (Ph.D)-Cairo University, 2024.
Bibliography: pages 98-101.
This thesis presents the development of a novel Log Quasi Lindley (LQL) regression model based on the Quasi Lindley distribution to tackle the complexities of analyzing censored lifetime data, which is prevalent in fields such as medicine and engineering. The study investigates the maximum likelihood estimates of model parameters, considering the presence of censored data. Martingale and deviance residuals were employed to validate model assumptions, ensure data integrity, and identify potential outliers. Additionally, global influence diagnostics, including Cook’s distance, were used to detect influential observations in the dataset. A Monte Carlo simulation study was conducted to evaluate the model’s performance across various sample sizes and censoring rates, focusing on key metrics like average bias and mean square error (MSE). The empirical distribution of martingale and deviance residuals was examined to further assess model performance.
A real-world lifetime dataset was analyzed using the LQL regression model to demonstrate its applicability and effectiveness. Several goodness-of-fit tests were applied, including both graphical methods and numerical criteria (AIC, BIC, and HQIC). The results showed that the LQL model performs best when larger sample sizes and low censoring rates are present, offering robust and accurate parameter estimation. Furthermore, the LQL model was compared to the Lindley and Log-Weibull regression models, with the former outperforming both in terms of goodness-of-fit measures and overall performance, solidifying its value for practical applications in survival analysis. تركز هذه الدراسة على نمذجة وتحليل بيانات وقت الحياة، وهو نوع من البيانات الذي يسجل الوقت حتى وقوع أحداث معينة مثل تعطل المعدات أو تقدم الأمراض أو بقاء المرضى على قيد الحياة. تعتبر بيانات وقت الحياة شائعة في مجالات مثل الطب والهندسة. يعد تحليل البقاء على قيد الحياة المنهج الإحصائي الأساسي المستخدم لتحليل بيانات "الوقت حتى الحدث"، وخاصة في مجموعات البيانات الخاضعة للرقابة Censored data)) حيث لا تتوفر الملاحظات الكاملة.
قدمت النماذج الخطية المعممة (GLMs) إطارًا مرنًا لتحليل المتغيرات الثنائية والعددية والمستمرة. أثبتت نماذج الانحدار لوغاريتم مقياس الموضع (log location scale regression models) فعاليتها بشكل خاص في تحليل بيانات وقت الحياة. يقدم توزيع كوزي ليندلي بديلاً مرنًا لنمذجة بيانات وقت الحياة، مما يوفر تحليل أفضل مقارنة بالتوزيعات الأبسط.
تواجه نماذج الانحدار التقليدية صعوبة في التعامل مع بيانات وقت الحياة الخاضعة للرقابة (Censored lifetime data)، خاصة بسبب افتراضات التوزيع الطبيعي والبيانات الخاضعة للرقابة. تهدف هذه الرسالة إلى معالجة هذه التحديات من خلال تطوير نموذج انحدار جديد يعتمد على اللوغاريتم لتحليل بيانات وقت الحياة الخاضعة للرقابة، مستندًا إلى توزيع كوزي ليندلي(QLD) ، مما يوفر نهجًا أكثر قوة للتنبؤ بالنتائج في ظل وجود المتغيرات المستقلة.
هيكل هذه الدراسة منظم كما يلي:
في الفصل الأول، تم تقديم الأسس النظرية للنماذج الخطية المعممة (GLMs) ونماذج الانحدار القائم على لوغاريتم مقياس الموضع. وضع هذا الأساس لفهم القيود التي تواجه النماذج الحالية، خاصة عند تطبيقها على البيانات الخاضعة للرقابة. تمت مناقشة تقنيات البيانات الخاضعة للرقابة وتقدير مقدرات الإمكان الأعظم(MLE) التي أكدت الحاجة إلى نموذج أكثر مرونة لاستيعاب التعقيدات الجوهرية في بيانات وقت الحياة. كما تم تقديم الفجوة البحثية التي تركز على عدم وجود نموذج انحدار فعال يعتمد على توزيع كوزي ليندلي للبيانات الخاضعة للرقابة.
في الفصل الثاني، تم إجراء مراجعة شاملة للدراسات السابقة التي تغطي تطورات نماذج انحدار ليندلي ونماذج الانحدار الكوزي وبناء نماذج الانحدار المختلفة للتوزيعات الكوزي. سلطت المراجعة الضوء على التقدم المحرز في هذه المجالات وحددت الفجوات البحثية في الأبحاث الحالية، لا سيما غياب النماذج التي تعالج البيانات الخاضعة للرقابة باستخدام توزيع كوزي ليندلي. كما تناول الفصل بناء نماذج الانحدار المختلفة المستندة إلى توزيعات الكوزي، مثل نموذج انحدار كوزي ليندلي بواسون، ونموذج الانحدار الكوزي ذو الحدين، ونموذج الانحدار الكوزي بواسون، مما يؤسس الإطار النظري لتوسيع توزيعات الكوزي إلى مجالات جديدة.
في الفصل الثالث، تم تقديم نموذج الانحدار لوغاريتم كوزي ليندلي (LQL)، بدءًا من تقديم مفصل لتوزيع كوزي ليندلي وخصائصه الرياضية. ثم تم تفصيل بناء نموذج الانحدار القائم على لوغاريتم مقياس الموضع لتوزيع كوزي ليندلي. تم تقديم شرح مفصل لتقدير مقدرات الإمكان الأعظم (MLE) لنموذج الانحدار لوغاريتم كوزي ليندلي .انتهى الفصل باستعراض تقنيات تحليل البواقي مثل بواقي مارتينغال (Martingale Residual) وبواقي الانحراف (Deviance Residual) وبواقي بيرسون (Pearson Residuals )، تليها طرق تحليل الحساسية بما في ذلك مسافة كوك ومسافة الاحتمال (Likelihood Distance).
ركز الفصل الرابع على اختبار وتقييم نموذج لوغاريتم كوزي ليندلي المقترح من خلال دراسة محاكاة مونتي كارلو وتحليل بيانات حقيقة. تم في هذا الفصل مقارنة المعايير الإحصائية المختلفة مثل معيار خاصية "أكياكي" للمعلومات (AIC)، ومعيار خاصية معلومات "بيز" (BIC)، ومعيار خاصية "هانان-كوين" للمعلومات (HQIC)، بالإضافة إلى متوسط التحيز (Average bias)ومتوسط مربعات الأخطاء (MSE) واختبارات جودة الملاءمة لتقييم أداء النموذج. تم تقييم أداء النموذج من خلال محاكاة مونتي كارلو باستخدام أحجام عينات مختلفة (n = 50, 100, 200) ونسب متنوعة من البيانات الخاضعة للرقابة (0٪، 10٪، 30٪) ومعايير تكوين المعلمات المختلفة، إلى جانب تحليل البواقي. أظهرت النتائج أن النموذج يتمتع بدرجة كبيرة من المرونة والموثوقية، حيث انخفضت متوسط التحيز (Average bias)ومتوسط مربعات الأخطاء (MSE) عبر أحجام العينات المختلفة ونسب البيانات خاضعة للرقابة، لا سيما عند زيادة حجم العينات وانخفاض نسب بيانات الخاضعة للرقابة. يتضمن تحليل البيانات الحقيقة تحليل مجموعة بيانات حقيقية من تجربة لدراسة أوقات فشل عينات العزل الكهربائي المصنوعة من الإيبوكسي الصلب تحت اختبار إجهاد الحياة المتسارع. كانت البيانات الحقيقة اختبار ممتاز لنموذج لوغاريتم كوزي ليندلي نظرًا لوجود ملاحظات خاضعه للرقابة بنسبة 10%. تم مقارنة نموذج لوغاريتم كوزي ليندلي مع نماذج انحدار ليندلي ولوغاريتم ويبول. أظهر التحليل التجريبي أن نموذج لوغاريتم كوزي ليندلي قدم أفضل ملاءمة للبيانات، كما يتضح من القيم المنخفضة للمعايير الإحصائية (AIC)، (BIC)، و (CAIC) بالإضافة إلى ذلك، أظهرت تحليلات البواقي وتحليل الحساسية أن نموذج LQL كان الأكثر قدرة على تفسير التغيرات في البيانات مقارنة بالنماذج الأخرى.
في الختام، يمثل نموذج الانحدار لوغاريتم كوزي ليندلي (LQL) تقدمًا كبيرًا في تحليل البقاء على قيد الحياة، خاصة في التعامل مع بيانات وقت الحياة الخاضعة للرقابة. يوسع هذا النموذج نطاق تطبيقات توزيعات الكوزي إلى مجالات جديدة، مما يوفر أداة قوية لتحليل الهياكل المعقدة لبيانات وقت الحياة
Text in English and abstract in Arabic & English.
Statistics
Censored Data Generalized Linear Models (GLMS) Log Quasi Lindley Regression Model Maximum Likelihood Estimation Monte Carlo Simulation Quasi Lindely Distribution Residual Analysis
519.5