Sensitivity analysis of estimating the area under the curve of incomplete longitudinal data /

Nada Ahmed Abdelsabour Shoaib,

Sensitivity analysis of estimating the area under the curve of incomplete longitudinal data / تحليل حساسية تقدير المساحة تحت المنحنى للبيانات الطولية غير الكاملة by Nada Ahmed Abdelsabour Shoaib ; Supervisors: Prof. Abdelnasser Saad, Prof. Ahmed Gad, Dr. Wafaa Ibrahim. - 93 pages : illustrations ; 25 cm. + CD.

Thesis (M.Sc)-Cairo University, 2025.

Bibliography: pages 85-83.

A simple approach to the analysis of longitudinal data is the use of summary measures such as the area under the curve (AUC). The AUC is considered one of the most comprehensive summary statistics to analyze longitudinal data. The AUC represents a summary measure showing the cumulative effect of the response variable over time. Many approaches are suggested in literature to evaluate the AUC, such as trapezoidal rule, Simpson's rule, Lagrange, and spline approximations. Nevertheless, many of the proposed methods in literature use linear mixed effects models (LMMs) for their robustness to handle missing data when evaluating AUC. The main aim of the thesis is to compare different random effect distributional assumptions of LMM to determine the optimal method for estimating the area under the curve using linear mixed effects model considering its bias, power of t-test results and other metrics.
In this case, the missingness mechanism is assumed to be missing at random or missing completely at random. The LMM is known for its robustness in terms of the mean model estimation with respect to misspecification of the random effect distribution. However, misspecification of these assumptions may lead to biased results. The aim of this thesis is to investigate the effect of the misspecification of random effect distribution on the estimation of the treatment effect on the AUC through different simulation studies. I suggest using different distributional assumptions for the random effects, such as heavy tailed distributions (T-distribution, and Asymmetric Laplace distribution) or skewed distributions (Chi-square distribution).
In conclusion, when the random effects follow a Normal or T distribution the estimation of area under the curve outperforms the other proposed distributions in regards of the results of bias and power. On the other hand, the Chi-square distribution may not be suitable for accurate AUC estimation in longitudinal data analyses. Both Missing Completely at Random (MCAR) and Missing at Random (MAR) show similar imputation trends in performance across methods. Linear spline decline trends introduce minor increases in bias and variability. Selecting imputation methods along with distributional assumptions in longitudinal data analysis is crucial to obtain most reliable AUC results. أحد الطرق لتحليل البيانات الطولية هو استخدام مقاييس التلخيص مثل المساحة تحت المنحنى (AUC). تعتبر المساحة تحت المنحنى واحدة من أكثر إحصائيات التلخيص شمولاً لتحليل البيانات الطولية. تمثل المساحة تحت المنحنى مقياسًا تلخيصيًا يوضح التأثير التراكمي لمتغير الاستجابة بمرور الوقت. تم اقتراح العديد من الأساليب في الأدبيات لتقييم المساحة تحت المنحنى، مثل قاعدة شبه المنحرف، وقاعدة سيمبسون، وقاعدة لاغرانج، وتقريبات الشرائح. ومع ذلك، تستخدم العديد من الأساليب المقترحة في الأدبيات نماذج التأثيرات المختلطة الخطية (LMMs) لمتانتها في التعامل مع البيانات المفقودة عند تقييم المساحة تحت المنحنى. الهدف الرئيسي من هذه الرسالة هو مقارنة افتراضات توزيع التأثير بشكل عشوائي المختلفة لنموذج LMM لتحديد الطريقة المثلى لتقدير المساحة تحت المنحنى باستخدام نموذج التأثيرات المختلطة الخطية مع مراعاة تحيزه وقوة نتائج اختبار t وغيرها من المقاييس.
في هذه الحالة، يُفترض أن آلية الفقد بشكل عشوائى وعشوائي بشكل تام. يُعرف نموذج LMM بمتانته من حيث تقدير النموذج المتوسط فيما يتعلق بالتحديد الخاطئ لتوزيع التأثير العشوائي. ومع ذلك، فإن التحديد الخاطئ لهذه الافتراضات قد يؤدي إلى نتائج متحيزة. والهدف من هذه الأطروحة هو التحقيق في تأثير التحديد الخاطئ لتوزيع التأثير العشوائي على تقدير تأثير المعالجة على AUC من خلال دراسات محاكاة مختلفة. أقترح استخدام افتراضات توزيعية مختلفة للتأثيرات العشوائية، مثل التوزيعات ذات الذيل الثقيل (توزيع T، وتوزيع لابلاس غير المتماثل) أو التوزيعات المنحرفة.
وفي الختام، عندما تتبع التأثيرات العشوائية توزيعًا طبيعيًا أو توزيعًا T، فإن تقدير المساحة أسفل المنحنى يتفوق على التوزيعات المقترحة الأخرى فيما يتعلق بنتائج التحيز والقوة. من ناحية أخرى، قد لا يكون توزيع مربع كاي مناسبًا لتقدير AUC الدقيق في تحليلات البيانات الطولية. يُظهر كل من المفقود عشوائيًا بشكل تام (MCAR) والمفقود عشوائيًا (MAR) اتجاهات إسناد مماثلة في الأداء عبر الطرق. تؤدي اتجاهات انحدار المنحنى الخطي إلى زيادة طفيفة في التحيز والتباين. يعد اختيار طرق الإسناد إلى جانب الافتراضات التوزيعية في تحليل البيانات الطولية أمرًا بالغ الأهمية للحصول على نتائج AUC الأكثر موثوقية.




Text in English and abstract in Arabic & English.


Statistics
الإحصاء

missing data longitudinal data area under the curve mixed effects model

519.5
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library