000 05185namaa22004091i 4500
003 OSt
005 20250223033347.0
008 241217s2023 |||a|||f m||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a519.5
092 _a519.5
_221
097 _aM.Sc
099 _aCai01.18.04.M.Sc.2023.Ah.P.
100 0 _aAhmed Ali Abou Elfotouh,
_epreparation.
245 1 _aA proposed approach for statistical analysis and modeling of big data /
_cBy Ahmed Ali Abou Elfotouh; Superviser Prof. Ahmed Amin El-sheikh.
246 1 5 _a: أسلوب مقترح للتحليل الإحصائي ونمذجة البيانات الكبيرة /
264 0 _c2023.
300 _a83 Leaves :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (M.Sc.)-Cairo University, 2023.
504 _aBibliography: pages 80-83.
520 _aThe digital world has witnessed rapid technological developments, which resulted in the emergence of the term big data, to reflect the presence of a remarkable digital boom in the field of data analysis, in addition to being a pivotal stage in the stages of communication and information systems. Although big data was hardly known a few years ago, it is one of the most discussed topics in business today across many sectors such as medical and scientific research, financial services, retail and networking, mobile phones, telecommunications, etc. It is worth noting that the field of statistics is considered one of the fundamental areas in the analysis of big data due to the usage of many modern and traditional statistical methods to analyze that data, where statistical programs contribute significantly to data analysis and modeling. So, this study aims to identify the definition of big data and its types, in addition to the most prominent methodologies used to analyze big data. It also deals with regression analysis models, sample types and their selection mechanisms. A practical application of big data analysis was also reviewed by applying the linear regression model to the temperature database in Brazil, within this aspect, the regression model is applied to the data after using divide and conquer and sampling methods.
520 _aشهد العالم الرقمي خلال العقود الأخيرة تطورات تكنولوجية متسارعة، أسفرت عن ظهور مصطلح البيانات الضخمة، لتعكس وجود طفرة رقمية ملحوظة في مجال تحليل البيانات، بالإضافة إلى كونها مرحلة محورية من مراحل نظم الاتصالات والمعلومات، وعلى الرغم من أن البيانات الضخمة بالكاد كانت معروفة منذ بضع سنوات، إلا أنها تعد واحدة من أكثر الموضوعات التي تمت مناقشتها في مجال الأعمال اليوم عبر العديد من القطاعات على غرار المجال الطبي والبحث العلمي، والخدمات المالية والبيع بالتجزئة والشبكات الاجتماعية وما إلى ذلك. ومن الجدير بالذكر أن مجال الإحصاء يٌعتبر من المجالات الجوهرية في تحليل البيانات الضخمة نظرًا لاستخدام العديد من الأساليب الإحصائية الحديثة والتقليدية لتحليل تلك البيانات، حيث تسهم البرامج الإحصائية بشكل كبير في تحليل البيانات والنمذجة. لذا، تهدف الدراسة إلى التعرف على مفهوم البيانات الضخمة، وأنواعها، بالإضافة إلى أبرز الأساليب الإحصائية المستخدمة لتحليل البيانات الضخمة مثل تحليل الانحدار regression analysis وطريقة التقسيم وإعادة التجميع divide and conquer method ، وطرق العينات sampling methods، كما تم استعراض تطبيق عملي لتحليل البيانات الضخمة من خلال تطبيق نموذج الانحدار الخطي على قاعدة بيانات درجات الحرارة في البرازيل، وتم تطبيق نموذج الانحدار على البيانات بعد استخدام أسلوب التقسيم وإعادة التجميع divide and conquer method وأسلوب العينات sampling methods.
530 _aIssues also as CD.
546 _aText in English and abstract in English.
650 7 _aStatistical mathematics
_2qrmak
653 0 _aBig data
_aBig data analysis
_aRegression analysis
_aDivide and conquer method
_aSampling methods
700 0 _aAhmed Amin El-sheikh
_ethesis advisor.
900 _b01-01-2023
_cAhmed Amin El-sheikh
_UCairo University
_FFaculty of Graduate Studies for Statistical Research
_DDepartment of Applied Statistics and Econometrics
905 _aSara
_eHuda
942 _2ddc
_cTH
_e21
_n0
999 _c169509