A shared parameter model to evaluate the area under the curve of longitudinal data with missing values /
Sama Alaa El-Din Makram Mohamed Makram,
A shared parameter model to evaluate the area under the curve of longitudinal data with missing values / تقدير المساحة تحت المنحنى للبيانات الطولية في حالة وجود قيم مفقودة باستخدام نموذج المعلمة المشتركة by Sama Alaa El-Din Makram Mohamed Makram ; Supervised Prof. Abdelnasser Saad Abdrabou, Prof. Ahmed Mahmoud Gad. - 102 pages : illustrations ; 25 cm. + CD.
Thesis (M.Sc)-Cairo University, 2025.
Bibliography: pages 95-98.
In longitudinal data, a response variable is collected from every individual of a cohort of subjects, repeatedly over time or under different conditions. The nature of these data makes the existence of missing values very frequent. Missing data mechanism includes; missing completely at random (MCAR), missing at random (MAR), and missing not at random (MNAR). A simple approach to analyze longitudinal data is calculating summary measures. The area under the curve (AUC) falls under the wide umbrella of summary measures and it is most commonly used due to its statistical simplicity.
The existence of missingness complicates the analysis and affects the estimation of the area under the curve. Hence, new approaches have been introduced in literature to handle missing values while accurately estimating AUC. One of these approaches employs the linear mixed effect model to estimate the area under the curve. The approach assumes that the missingness mechanism is MCAR or MAR. However, the missing not at random mechanism (MNAR) is the general mechanism and it is plausible in practice. Therefore, this thesis employs a shared parameter model (SPM) to evaluate the area under the curve under the case of longitudinal data assuming that the missingness mechanism is MNAR. A simulation study is conducted, under different scenarios, to evaluate the proposed method. In addition to that, the proposed approach is compared to the existing methods. The proposed approach is also applied on a real dataset called the labour pain data to evaluate its applicability and effectiveness. في البيانات الطولية، يتم جمع البيانات من كل فرد من مجموعة من الأشخاص، بشكل متكرر على فترات زمنية مختلفة. إن طبيعة هذه البيانات تجعل وجود قيم مفقودة أمراً متكرراً للغاية. يعد التعامل مع القيم المفقودة من أكبر التحديات التي تواجه البيانات الطولية لأن تجاهل هذة المفقودات يؤدي إلى نتائج متحيزة. تنقسم آليات البيانات المفقودة إلى: المفقودات العشوائية تمامًا (MCAR)، والمفقودات العشوائية (MAR)، والمفقودات غير العشوائية (MNAR). هناك طريقة بسيطة لتسهيل تحليل البيانات الطولية وهي حساب المقاييس الموجزة. هذة المقاييس تلخص بيانات كل فرد على حدى فتؤدي إلى تقليل أبعاد البيانات الطولية. تندرج المساحة تحت المنحنى (AUC) تحت المظلة الواسعة للمقاييس الموجزة وهي الأكثر استخدامًا نظرًا لبساطتها الإحصائية.
ويعقّد وجود القيم المفقودة من عملية تحليل البيانات وبالتالي يصعب تقدير المساحة تحت المنحنى. ومن ثم، تم تقديم مناهج جديدة في الأدبيات للتعامل مع القيم المفقودة مع تقدير المساحة تحت المنحنى بدقة. يستخدم أحد هذه الأساليب نموذج التأثير الخطي المختلط لتقدير المساحة تحت المنحنى. يفترض هذا النهج أن آلية الفقد هي MCAR أو MAR. ومع ذلك، فإن آلية الفقد غير العشوائي للبيانات (MNAR) هي الآلية الأكثر تعقيدا وتواجدا من الناحية العملية. ولذلك، تقترح هذه الرسالة استخدام نموذج المعلمة المشتركة (SPM) لتقييم المنطقة تحت المنحنى في حالة البيانات الطولية بافتراض أن آلية الفقدان هي آلية الفقدان العشوائي (MNAR). ويتم إجراء دراسة محاكاة، في ظل سيناريوهات مختلفة، لتقييم كفاءة النموذج المقترح. وتم اختباره من خلال التحيز النسبي والخطا القياسي. بالإضافة إلى ذلك، تتم مقارنة النموذج المقترح بالطرق الحالية الموجودة في الأدبيات. كما تم تطبيق النموذج المقترح على مجموعة بيانات حقيقية لتقييم قابليته للتطبيق.
Text in English and abstract in Arabic & English.
Statistics
الاحصاء
Area under the curve (AUC) longitudinal data missing not at random نموذج المعلمة المشتركة (SPM) البيانات الطولية
519.5405
A shared parameter model to evaluate the area under the curve of longitudinal data with missing values / تقدير المساحة تحت المنحنى للبيانات الطولية في حالة وجود قيم مفقودة باستخدام نموذج المعلمة المشتركة by Sama Alaa El-Din Makram Mohamed Makram ; Supervised Prof. Abdelnasser Saad Abdrabou, Prof. Ahmed Mahmoud Gad. - 102 pages : illustrations ; 25 cm. + CD.
Thesis (M.Sc)-Cairo University, 2025.
Bibliography: pages 95-98.
In longitudinal data, a response variable is collected from every individual of a cohort of subjects, repeatedly over time or under different conditions. The nature of these data makes the existence of missing values very frequent. Missing data mechanism includes; missing completely at random (MCAR), missing at random (MAR), and missing not at random (MNAR). A simple approach to analyze longitudinal data is calculating summary measures. The area under the curve (AUC) falls under the wide umbrella of summary measures and it is most commonly used due to its statistical simplicity.
The existence of missingness complicates the analysis and affects the estimation of the area under the curve. Hence, new approaches have been introduced in literature to handle missing values while accurately estimating AUC. One of these approaches employs the linear mixed effect model to estimate the area under the curve. The approach assumes that the missingness mechanism is MCAR or MAR. However, the missing not at random mechanism (MNAR) is the general mechanism and it is plausible in practice. Therefore, this thesis employs a shared parameter model (SPM) to evaluate the area under the curve under the case of longitudinal data assuming that the missingness mechanism is MNAR. A simulation study is conducted, under different scenarios, to evaluate the proposed method. In addition to that, the proposed approach is compared to the existing methods. The proposed approach is also applied on a real dataset called the labour pain data to evaluate its applicability and effectiveness. في البيانات الطولية، يتم جمع البيانات من كل فرد من مجموعة من الأشخاص، بشكل متكرر على فترات زمنية مختلفة. إن طبيعة هذه البيانات تجعل وجود قيم مفقودة أمراً متكرراً للغاية. يعد التعامل مع القيم المفقودة من أكبر التحديات التي تواجه البيانات الطولية لأن تجاهل هذة المفقودات يؤدي إلى نتائج متحيزة. تنقسم آليات البيانات المفقودة إلى: المفقودات العشوائية تمامًا (MCAR)، والمفقودات العشوائية (MAR)، والمفقودات غير العشوائية (MNAR). هناك طريقة بسيطة لتسهيل تحليل البيانات الطولية وهي حساب المقاييس الموجزة. هذة المقاييس تلخص بيانات كل فرد على حدى فتؤدي إلى تقليل أبعاد البيانات الطولية. تندرج المساحة تحت المنحنى (AUC) تحت المظلة الواسعة للمقاييس الموجزة وهي الأكثر استخدامًا نظرًا لبساطتها الإحصائية.
ويعقّد وجود القيم المفقودة من عملية تحليل البيانات وبالتالي يصعب تقدير المساحة تحت المنحنى. ومن ثم، تم تقديم مناهج جديدة في الأدبيات للتعامل مع القيم المفقودة مع تقدير المساحة تحت المنحنى بدقة. يستخدم أحد هذه الأساليب نموذج التأثير الخطي المختلط لتقدير المساحة تحت المنحنى. يفترض هذا النهج أن آلية الفقد هي MCAR أو MAR. ومع ذلك، فإن آلية الفقد غير العشوائي للبيانات (MNAR) هي الآلية الأكثر تعقيدا وتواجدا من الناحية العملية. ولذلك، تقترح هذه الرسالة استخدام نموذج المعلمة المشتركة (SPM) لتقييم المنطقة تحت المنحنى في حالة البيانات الطولية بافتراض أن آلية الفقدان هي آلية الفقدان العشوائي (MNAR). ويتم إجراء دراسة محاكاة، في ظل سيناريوهات مختلفة، لتقييم كفاءة النموذج المقترح. وتم اختباره من خلال التحيز النسبي والخطا القياسي. بالإضافة إلى ذلك، تتم مقارنة النموذج المقترح بالطرق الحالية الموجودة في الأدبيات. كما تم تطبيق النموذج المقترح على مجموعة بيانات حقيقية لتقييم قابليته للتطبيق.
Text in English and abstract in Arabic & English.
Statistics
الاحصاء
Area under the curve (AUC) longitudinal data missing not at random نموذج المعلمة المشتركة (SPM) البيانات الطولية
519.5405