000 | 03937namaa22004091i 4500 | ||
---|---|---|---|
003 | OSt | ||
005 | 20250512115709.0 | ||
008 | 250429s2024 ua a|||frm||| 000 0 eng d | ||
040 |
_aEG-GICUC _beng _cEG-GICUC _dEG-GICUC _erda |
||
041 | 0 |
_aeng _beng _bara |
|
049 | _aDeposit | ||
082 | 0 | 4 | _a623.043 |
092 |
_a623.043 _221 |
||
097 | _aM.Sc | ||
099 | _aCai01.13.08.M.Sc.2024.Ah.F | ||
100 | 0 |
_aAhmed Hani Mohamed Abdullah Elgohary, _epreparation. |
|
245 | 1 | 2 |
_aA framework for automatic generation of convolutional neural networks efficient hardware accelerators / _cby Ahmed Hani Mohamed Abdullah Elgohary ; Supervisors Dr. Omar Ahmed Ali Nasr. |
246 | 1 | 5 | _aاطار عمل للانشاء التلقائي لمسرعات اجهزة فعالة للشبكات العصبية التلافيفية / |
264 | 0 | _c2024. | |
300 |
_a65 pages : _billustrations ; _c30 cm. + _eCD. |
||
336 |
_atext _2rda content |
||
337 |
_aUnmediated _2rdamedia |
||
338 |
_avolume _2rdacarrier |
||
502 | _aThesis (M.Sc)-Cairo University, 2024. | ||
504 | _aBibliography: pages 61-65. | ||
520 | _aThis thesis presents a framework that targets generating portable accelerators for convolutional neural networks based on Register Transfer Level (RTL) that can be synthesized on any Field Programmable Gate Arrays (FPGA), and it achieves high performance, low power consumption with optimized FPGA resource, this was achieved by utilizing multiple memory compression techniques such as weights quantization and weights pruning which minimize the memory demand which led to getting rid of off-chip memories that is used by most of the previous frameworks. Also, the framework gives the user the ability to choose between different targets which are (minimum latency, minimum hardware sources or best performance-to-resources efficiency) by choosing the level of parallelism in CNNs layers | ||
520 | _aتقدم هذه الأطروحة إطار عمل يستهدف إنشاء مسرعات قابلة للتعديل للشبكات العصبية التلافيفية باستخدام لغة وصف الدوائر الالكترونية الرقمية و الذي يمكن تصنيعها على أي دائرة مصفوفات قابلة للبرمجة، ويحقق هذا أداءً عاليًا و استهلاك طاقة منخفضة و استخدام موارد مثلى من الدوائر الالكترونية الرقمية االقابلة للبرمجة، تم تحقيق ذلك من خلال استخدام تقنيات ضغط الذاكرة المتعددة مثل اهمال المعاملات الاقل تأثيرا و الزام المعاملات بمجموعة محددة من القيم مما يقلل من الطلب على الذاكرة مما أدى إلى التخلص من الذاكرة خارج الشريحة التي تستخدمها معظم أطر العمل السابقة. كما يمنح الإطار المستخدم القدرة على الاختيار بين أهداف مختلفة وهي (الحد الأدنى من زمن الوصول أو الحد الأدنى من موارد الأجهزة أو أفضل كفاءة للأداء إلى الموارد) عن طريق اختيار مستوى التوازي في الشبكة العصبية التلافيفية المستهدفة. | ||
530 | _aIssues also as CD. | ||
546 | _aText in English and abstract in Arabic & English. | ||
650 | 7 |
_aElectronics Engineering _2qrmak |
|
653 | 0 |
_aConvolutional neural networks (CNNs) _aField programmable gate arrays (FPGAs) _aAutomation |
|
700 | 0 |
_aOmar Ahmed Ali Nasr _ethesis advisor. |
|
900 |
_b01-01-2024 _cOmar Ahmed Ali Nasr _dHossam Aly H. Fahmy _dAhmed Hassan Madian _UCairo University _FFaculty of Engineering _DDepartment of Electronics and Communications Engineering |
||
905 |
_aShimaa _eEman Ghareb |
||
942 |
_2ddc _cTH _e21 _n0 |
||
999 | _c171794 |