A Framework To Enhance The Performance Of Generative Adversarial Network /

Mohammed Megahed Hussein Megahed,

A Framework To Enhance The Performance Of Generative Adversarial Network / إطار لتحسين أداء الشبكة المُوَلِدَة التنافسية / By Mohammed Megahed Hussein Megahed; Under supervision of Dr. Mervat Hassan Gheith, Dr. Ammar Mohammed Ammar. - 147 Leaves : illustrations ; 30 cm. + CD.

Thesis (Ph.D)-Cairo University, 2024.

Bibliography: pages 104-147.

A generative model is tasked with creating new data samples based on a probabilistic model. Generative Adversarial Networks (GANs) have been extensively utilized to produce realistic samples across various domains, often outperforming other models within the generative model category. However, developing a robust GAN model is challenging due to numerous issues encountered during the training process, which affect performance and, consequently, the quality and diversity of the generated samples. These issues include training instability and mode collapse. Training instability arises from the performance variance between the generator and the discriminator, while mode collapse occurs when the generator fails to produce diverse samples. In this thesis, a framework is proposed to stabilize the GAN training process. This framework consists of three approaches. The first approach, termed Collaborative-GAN, leverages transfer learning to enhance network performance by periodically transferring the learned weights from well-performing networks to lower-performing ones. The second, known as Multi-Representation Discrimination GAN (MRD-GAN), involves the discriminator man- aging concurrent network discrimination flows to handle different data representations through various transformation functions. Each flow generates a unique loss value representing the distance between the generated and real samples, and a fusion function aggregates these values into a consolidated loss to update the generator’s weights, thus providing diverse feedback to the generator. The third, called Multi-Generative Adversarial Networks with Shared Genera- tor (Multi-GANs-SG), involves a single generator competing against multiple discriminators within different GAN models. These models are categorized into master GAN and subsidiary GANs, with the master GAN updating the weights of the subsidiary GANs during training, thereby updating the generator’s weights. The proposed approaches have been evaluated on various benchmarks, including CelebA, Cifar-10, Fashion-Mnist, and Mnist. Experimental results indicate that the proposed methods surpass existing state-of-the-art GAN models in terms of the FID metric, which measures the generated samples diversity. Whereas, Collaborative GAN achieved FID scores of 11.21, 24.19, and 11.44 on CelebA, Cifar-10, and Fashion-Mnist, respectively. MRD-GAN recorded FID scores of 14.02, 30.19, 9.42, and 3.14 on CelebA, Cifar-10, Fashion-Mnist, and Mnist, respectively. Lastly, Multi-GANs-SG attained FID scores of 13.32, 31.12, 8.78, and 6.12 on CelebA, Cifar-10, Fashion-Mnist, and Mnist, respectively تقوم النماذج المُوَلِدة بإنشاء عينات بيانات جديدة بناءً على نموذج احتمالي. تستخدم النماذج المُوَلِدة التنافسية (GANs) بشكل مكثف لإنتاج عينات واقعية عبر مجالات مختلفة، وغالبًا ما تتفوق على النماذج الأخرى في فئة النماذج المُوَلِدة. ومع ذلك، فإن تطوير نموذج مُوَلِد تنافسي قوي يعد تحديًا بسبب العديد من المشكلات التي تواجه هذا النموذج أثناء عملية التدريب، والتي تؤثر بشكل عام على أداء النموذج وبالتالي تؤثر على جودة وتنوع العينات المُوَلَدة. تشمل هذه المشكلات عدم استقرار عملية التدريب وانهيار أنماط المُوَلِد.حيث ينشأ عدم استقرارعملية التدريب نتيجة لتفاوت الأداء بين المُوَلِد والمميز، في حين يحدث انهيار أنماط المُوَلِد عندما يفشل المُوَلِد في إنتاج عينات متنوعة. في هذه الرسالة، يتم إقتراح إطار قائم على ثلاث طرق لتحقيق استقرار عملية تدريب النماذج المُوَلِدة التنافسية. حيث تعتمد الطريقة الأولى، التي تُسمى بالشبكات المُوَلِدة التنافسية التعاونية (Collaborative-GAN)، على التعلم الانتقالي لتعزيز أداء الشبكة من خلال نقل الأوزان المُتَعلمة دوريًا من الشبكات ذات الأداء الجيد إلى الشبكات ذات الأداء المنخفض. أما الطريقة الثانية، المعروفة باسم الشبكة المُوَلِدة التنافسية ذو المميز المعتمد على تصنيف تمثيل متعدد للبيانات (MRD-GAN)، فتشمل قيام المميز بإدارة تدفقات التمييز الشبكي المتزامن للتعامل مع تمثيلات البيانات المختلفة من خلال وظائف معالجة متنوعة للبيانات. يُنتج كل تدفق قيمة فريدة تمثل الفرق بين العينات المُوَلِدة والحقيقية، وتقوم وظيفة الدمج بتجميع هذه القيم لتحديث أوزان المُوَلِد، مما يوفر تغذية راجعة متنوعة للمُوَلِد. الطريقة الثالثة، المسماة بالشبكات المُوَلِدة التنافسية ذو المُوَلِد المشترك (Mulit-GANs-SG)، حيث تشمل مُوَلِدًا واحدًا يتنافس ضد مميزات متعددة داخل نماذج مُوَلِدة تنافسية مختلفة. تُصنف هذه النماذج إلى نموذج مُوَلِد تنافسي رئيسي ونماذج مُوَلِدة تنافسية فرعية، حيث يقوم المُوَلِد التنافسي الرئيسي بتحديث أوزان المُوَلِدات التنافسية الفرعية أثناء عملية التدريب، وبالتالي يتم تحديث أوزان المُوَلِد. تم تقييم الطرق المقترحة على مجموعة مختلقة من البيانات، بما في ذلك CelebA وCifar-10 وFashion-Mnist وMnist. تشير النتائج التجريبية إلى أن الطرق المقترحة تتفوق على نماذج مُوَلِدة تنافسية تم إقتراحها من جانب باحثين آخرين من حيث مقياس FID، الذي يقيس تنوع العينات المُوَلِدة. حيث حققت الشبكات المُوَلِدة التنافسية التعاونية درجات FID بلغت 11.21 و24.19 و11.44 على CelebA وCifar-10 وFashion-Mnist، على التوالي. بينما سجلت الشبكة المُوَلِدة التنافسية ذو المميز المعتمد على تصنيف تمثيل متعدد للبيانات درجات FID بلغت 14.02 و30.19 و9.42 و3.14 على CelebA وCifar-10 وFashion-Mnist وMnist، على التوالي. أخيرًا، حققت الشبكات المُوَلِدة التنافسية ذو المُوَلِد المشترك درجات FID بلغت 13.32 و31.12 و8.78 و6.12 على CelebA وCifar-10 وFashion-Mnist وMnist، على التوالي.





Text in English and abstract in Arabic & English.


Computer Science

Generative Models Generative Adversarial Network

004
Cairo University Libraries Portal Implemented & Customized by: Eng. M. Mohamady Contacts: new-lib@cl.cu.edu.eg | cnul@cl.cu.edu.eg
CUCL logo CNUL logo
© All rights reserved — Cairo University Libraries
CUCL logo
Implemented & Customized by: Eng. M. Mohamady Contact: new-lib@cl.cu.edu.eg © All rights reserved — New Central Library
CNUL logo
Implemented & Customized by: Eng. M. Mohamady Contact: cnul@cl.cu.edu.eg © All rights reserved — Cairo National University Library