Haitham Mohammed Ali Zaid Al-radhi,

Applications of deep reinforcement learning for control systems: a twin delayed deep deterministic policy gradient (td3) based controller method / تطبيقات التعلم المعزز العميق في أنظمة التحكم: أسلوب تحكم يعتمد على خوارزمية تدرج السياسة الحتمية العميقة ثنائية الناقد ذات التحديث المتأخر (TD3) / By Haitham Mohammed Ali Zaid Al-radhi; Supervisor Prof. Khaled Ali Mohamed El-Metwally. - 86 pages : illustrations ; 30 cm. + CD.

Thesis (M.Sc.)-Cairo University, 2023.

Bibliography: pages 83-86.

This thesis explores Deep Reinforcement Learning (DRL), a relatively new research field where agents learn through interaction with their environment. It explains DRL fundamentals and presents the application of TD3-based controller in control systems. TD3, a DRL algorithm, is utilized for its effectiveness in continuous action spaces. Notably, DRL-based controllers offer robust performance without requiring a plant model. The TD3 controller's performance is examined on two systems, VTOL and coupled tanks, and compared with traditional controllers. Results indicate excellent tracking abilities and well anti-disturbances performance. تستكشف هذه الأطروحة التعلم المعزز العميق (DRL)، وهو مجال بحثي جديد نسبيًا حيث يتعلم الوكلاء من خلال التفاعل مع بيئتهم. تشرح أساسيات DRL وتقدم تطبيق وحدة التحكم المعتمدة على تدرج السياسة الحتمية العميقة ثنائية الناقد (TD3) في أنظمة التحكم. تم استخدام TD3، وهي خوارزمية DRL، لفعاليتها في حل المسائل ذات الإجراءات (Actions) المستمرة. الجدير بالذكر أن وحدات التحكم المستندة إلى DRL توفر أداءً قويًا دون الحاجة إلى نموذج رياضي للنظام. تم تقييم أداء وحدة التحكم المقترحة على نظامين، نظام VTOL ونظام ارتفاع السوائل في الخزانات المقترنة، ومقارنة النتائج مع وحدة تحكم تقليدية. تُشير النتائج إلى أن أداء التتبع لوحدة التحكم المعتمدة على TD3 ممتازاً، كما يتعامل المتحكم المقترح مع الاضطرابات بشكل جيد. تعرض هذه الدراسة إمكانيات وحدات التحكم المعتمدة على TD3 في تطبيقات التحكم.




Text in English and abstract in English.


ELECTRICAL POWER ENGINEERING

deep reinforcement learning TD3-based controller actor-critic method VTOL control coupled tank control

621.319