An Enhanced Approach for Privacy Preserving Data Mining / Hajar Hussain Mohammed Redha ; Hesham Ahmed Hefny, Ahmed Mohammed Gadallah
Material type: TextPublication details: 2022.Content type:- text
- Unmediated
- volume
- أسلوب محسن لاستخراج البيانات والحفاظ على الخصوصية
- 004
Item type | Current library | Home library | Call number | Status | Date due | Barcode | |
---|---|---|---|---|---|---|---|
Thesis | قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.02.M.Sc.2022.Ha.E (Browse shelf(Opens below)) | Not for loan | 01010110086160000 |
Thesis(M.Sc.)-Cairo University - Faculty of Graduate Studies for Statistical Research - Department of Computer Science
Bibliography: p. 196-209 .
أدى تضخم البيانات، وهو النتيجة البارزة للتطور السريع الأخير وتنوع المصادر في مجال البيانات والمعلومات، إلى الاستكشاف المستمر لوسائل الاستفادة من هذا الكم الهائل من البيانات الإضافية في مختلف المجالات. يشير مفهوم التنقيب عن البيانات أيضًا إلى اكتشاف المعرفة في مجموعة ضخمة من البيانات إذا تم جمعها وتحليلها بكفاءة، وسوف يساعد ذلك في اتخاذ قرارات سليمة ومناسبة، وحل العديد من المشكلات، مما يؤدي إلى تطوير المؤسسات. وبالتالي، أصبح من الضروري ضمان خصوصية تلك البيانات الخاصة والحساسة ذات القيمة الكبيرة في العالم الرقمي من أجل المساعدة في تقديم خدمات أفضل وعالية الجودة دون فقدان البيانات أو خرقها. ومع ذلك، لا تزال هناك حاجة إلى نهج أكثر مرونة للسماح بالحفاظ على الخصوصية أثناء تطبيق تقنيات التنقيب عن البيانات. تقترح هذه الرسالة نهجًا معززًا لتقنيات استخراج البيانات للحفاظ على الخصوصية في أي بيئة وتحدد بدقة الحلول الفعالة للمشكلات اليومية التي تواجهها تقنيات محاكاة البيانات التقليدية للحفاظ على الخصوصية. وهذا يشمل التطبيع، والتصنيف، والتقدير، واستبدال أشباه السمات ببياناتها التابعة، حيث يضمن ذلك أن تكون البيانات خاصة تمامًا مع تقليل فقدان المعلومات المتاحة. تم اختبار النهج المقترح على بيانات من تصميم ارتباط وصفي، مستخدم مع عينة ملائمة للبالغين اللبنانيين المصابين بداء السكري من النوع 2 الذين تم تجنيدهم من مستشفى رئيسي في بيروت، لبنان. بالإضافة إلى ذلك، تم إنشاء مجموعة البيانات من الاستبيان باستخدام نموذج Google. ويستهدف مرضى السكري في الكويت ومصر، مع مراعاة وجود نفس الحقول الأولية الموجودة في بيانات مرض السكري في لبنان. تظهر النتائج القيمة المضافة للنهج المقترح مقابل الأعمال الأخرى فيما يتعلق بالأنسب لاستخراج البيانات للحفاظ على الخصوصية. نجح الأسلوب المقترح بدقة 0.849 ≈ 0.85، أي ما يعادل 85٪. وبالتالي، قلل النهج المقترح إلى فقدان معلومات أقل وخصوصية متزايدة للبيانات الحساسة مقارنة بالأعمال السابقة التي كانت فيها نسبة الخسارة ≈ 0.73. تضمن النهج المقترح مجموعة البيانات الأصلية ذات سمات متعددة تحدد الفرد بشكل فريد بعد إزالة السمات الحساسة، سيتم استبدال سمات شبه المعرفات في مجموعة البيانات الجديدة بسمات ذات صلة أو مكافئة. بعد تطبيق النهج المقترح، يتم تصحيح النتيجة النهائية للسمات الحساسة ولا يمكن الكشف عنها أو انتهاكها.
There are no comments on this title.