000 03937namaa22004091i 4500
003 OSt
005 20250512115709.0
008 250429s2024 ua a|||frm||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a623.043
092 _a623.043
_221
097 _aM.Sc
099 _aCai01.13.08.M.Sc.2024.Ah.F
100 0 _aAhmed Hani Mohamed Abdullah Elgohary,
_epreparation.
245 1 2 _aA framework for automatic generation of convolutional neural networks efficient hardware accelerators /
_cby Ahmed Hani Mohamed Abdullah Elgohary ; Supervisors Dr. Omar Ahmed Ali Nasr.
246 1 5 _aاطار عمل للانشاء التلقائي لمسرعات اجهزة فعالة للشبكات العصبية التلافيفية /
264 0 _c2024.
300 _a65 pages :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (M.Sc)-Cairo University, 2024.
504 _aBibliography: pages 61-65.
520 _aThis thesis presents a framework that targets generating portable accelerators for convolutional neural networks based on Register Transfer Level (RTL) that can be synthesized on any Field Programmable Gate Arrays (FPGA), and it achieves high performance, low power consumption with optimized FPGA resource, this was achieved by utilizing multiple memory compression techniques such as weights quantization and weights pruning which minimize the memory demand which led to getting rid of off-chip memories that is used by most of the previous frameworks. Also, the framework gives the user the ability to choose between different targets which are (minimum latency, minimum hardware sources or best performance-to-resources efficiency) by choosing the level of parallelism in CNNs layers
520 _aتقدم هذه الأطروحة إطار عمل يستهدف إنشاء مسرعات قابلة للتعديل للشبكات العصبية التلافيفية باستخدام لغة وصف الدوائر الالكترونية الرقمية و الذي يمكن تصنيعها على أي دائرة مصفوفات قابلة للبرمجة، ويحقق هذا أداءً عاليًا و استهلاك طاقة منخفضة و استخدام موارد مثلى من الدوائر الالكترونية الرقمية االقابلة للبرمجة، تم تحقيق ذلك من خلال استخدام تقنيات ضغط الذاكرة المتعددة مثل اهمال المعاملات الاقل تأثيرا و الزام المعاملات بمجموعة محددة من القيم مما يقلل من الطلب على الذاكرة مما أدى إلى التخلص من الذاكرة خارج الشريحة التي تستخدمها معظم أطر العمل السابقة. كما يمنح الإطار المستخدم القدرة على الاختيار بين أهداف مختلفة وهي (الحد الأدنى من زمن الوصول أو الحد الأدنى من موارد الأجهزة أو أفضل كفاءة للأداء إلى الموارد) عن طريق اختيار مستوى التوازي في الشبكة العصبية التلافيفية المستهدفة.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 7 _aElectronics Engineering
_2qrmak
653 0 _aConvolutional neural networks (CNNs)
_aField programmable gate arrays (FPGAs)
_aAutomation
700 0 _aOmar Ahmed Ali Nasr
_ethesis advisor.
900 _b01-01-2024
_cOmar Ahmed Ali Nasr
_dHossam Aly H. Fahmy
_dAhmed Hassan Madian
_UCairo University
_FFaculty of Engineering
_DDepartment of Electronics and Communications Engineering
905 _aShimaa
_eEman Ghareb
942 _2ddc
_cTH
_e21
_n0
999 _c171794