A Deep learning approach for Quran machine translation from Arabic to Italian /
نهج التعلم العميق للترجمة الألية للقرأن من العربية الي الإيطالية
By Haiam Hamed Abu Serea AbdelSalam ; Supervised by AbdelMoneim Helmy, Ammar Mohammed.
- 2022.
Thesis (M.Sc.)-Cairo University-Faculty of Graduate Studies for Statistical Research,2022.
Bibliography: p. 70-81.
في الآونة الأخيرة ، أدى التطور السريع في منصات التواصل الاجتماعية إلى تسهيل التواصل بين المستخدمين. وبناءً على ذلك ، زاد التواصل من أهمية ترجمة اللغات البشرية. الترجمة الآلية (MT) هي مجال فرعي مهم لمعالجة اللغة الطبيعية التي تهدف إلى ترجمة اللغات الطبيعية باستخدام الحاسوب. أصبحت الترجمة الآلية ضرورة ملحة بسبب الاختلاف بين اللغات المستخدمة داخل مجتمعات العالم. هناك طرق مختلفة مستخدمة لترجمة اللغة الطبيعية ، مثل الترجمة الآلية الإحصائية القائمة على القواعد ، ومؤخراً الترجمة الآلية العصبية. تعتمد جودة الترجمة الآلية على توافر مجموعات البيانات المتوازية. واجهت اللغات التي لا تحتوي على مجموعات بيانات كافية العديد من التحديات المتعلقة بمعالجتها وتحليلها. يشار إلى هذه اللغات على أنها لغات منخفضة الموارد. لذلك ، استخدمت العديد من أبحاث الترجمة الآلية مجموعات كبيرة موازية لمعالجة مجموعات من اللغات الأوروبية الرئيسية. ومع ذلك ، فقد تناولت القليل من الأبحاث الإيطالية والعربية. ركز هذا البحث على اللغات منخفضة الموارد ، وخاصة اللغة العربية واللغة الإيطالية. تحديات اللغات منخفضة المصدر مثل العربية ، وهي لغة مورفولوجية غنية لها أشكال مختلفة من نفس الكلمات ، يختلف المحتوى العربي ، بما في ذلك الهياكل الصرفية للغة ، وفقًا لسياق الجملة. في حين أن تحديات اللغة الإيطالية تحتاج إلى دراسة عميقة بسبب الاختلاف في اللهجة الإيطالية وفقًا للمنطقة وكذلك تختلف اللغة المنطوقة اختلافًا كبيرًا في أجزاء مختلفة من إيطاليا. علاوة على ذلك ، فإن الترجمات القائمة على القاموس لمعاني القرآن الكريم من العربية إلى الإيطالية عادة ما تكون غير صحيحة لأن الترجمة القائمة على القاموس تعتبر القرآن وثيقة تقليدية وتترجمه بالترتيب. تساهم هذه الأطروحة بطريقتين. أولاً ، يقدم مجموعة موازية من الجمل الإيطالية العربية. ثانيًا ، تقدم الرساله نموذجين للتعلم العميق ، وهما الذاكرة طويلة المدى (LSTM) التسلسل إلى التسلسل مع آلية الانتباه والوحدات المتكررة ذات البوابات (GRU) التسلسل إلى التسلسل مع آلية انتباه للترجمة الالية من اللغة العربية إلى الإيطالية. يتم تقييم كل نموذج من النماذج المقترحة بناءً على درجات تشابه BLEU و ROUGE و Cosine. تشير النتائج التجريبية إلى أن نموذج LSTM-seq2seq قد حقق درجة 0.90 لـ ROUGE و 0.96 لتشابه جيب التمام ومتوسط درجة لـ BLEU هو 0.91. حقق نموذج GRU seq2seq متوسط درجات لـ BLEU هو 0.89 و 0.94 و 0.88 لتشابه Cosine و ROUGE على التوالي