Applications of deep reinforcement learning for control systems: a twin delayed deep deterministic policy gradient (td3) based controller method / By Haitham Mohammed Ali Zaid Al-radhi; Supervisor Prof. Khaled Ali Mohamed El-Metwally.
Material type:
- text
- Unmediated
- volume
- تطبيقات التعلم المعزز العميق في أنظمة التحكم: أسلوب تحكم يعتمد على خوارزمية تدرج السياسة الحتمية العميقة ثنائية الناقد ذات التحديث المتأخر (TD3) [Added title page title]
- 621.319
- Issues also as CD.
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.13.07.M.Sc.2023.He.A. (Browse shelf(Opens below)) | Not for loan | 01010110089838000 |
Thesis (M.Sc.)-Cairo University, 2023.
Bibliography: pages 83-86.
This thesis explores Deep Reinforcement Learning (DRL), a relatively new research field where agents learn through interaction with their environment. It explains DRL fundamentals and presents the application of TD3-based controller in control systems. TD3, a DRL algorithm, is utilized for its effectiveness in continuous action spaces. Notably, DRL-based controllers offer robust performance without requiring a plant model. The TD3 controller's performance is examined on two systems, VTOL and coupled tanks, and compared with traditional controllers. Results indicate excellent tracking abilities and well anti-disturbances performance.
تستكشف هذه الأطروحة التعلم المعزز العميق (DRL)، وهو مجال بحثي جديد نسبيًا حيث يتعلم الوكلاء من خلال التفاعل مع بيئتهم. تشرح أساسيات DRL وتقدم تطبيق وحدة التحكم المعتمدة على تدرج السياسة الحتمية العميقة ثنائية الناقد (TD3) في أنظمة التحكم. تم استخدام TD3، وهي خوارزمية DRL، لفعاليتها في حل المسائل ذات الإجراءات (Actions) المستمرة. الجدير بالذكر أن وحدات التحكم المستندة إلى DRL توفر أداءً قويًا دون الحاجة إلى نموذج رياضي للنظام. تم تقييم أداء وحدة التحكم المقترحة على نظامين، نظام VTOL ونظام ارتفاع السوائل في الخزانات المقترنة، ومقارنة النتائج مع وحدة تحكم تقليدية. تُشير النتائج إلى أن أداء التتبع لوحدة التحكم المعتمدة على TD3 ممتازاً، كما يتعامل المتحكم المقترح مع الاضطرابات بشكل جيد. تعرض هذه الدراسة إمكانيات وحدات التحكم المعتمدة على TD3 في تطبيقات التحكم.
Issues also as CD.
Text in English and abstract in English.
There are no comments on this title.