000 10403nam a22004211i 4500
003 OSt
005 20250413105801.0
008 250325s2024 |||a|||f m||| 000 0 eng d
040 _aEG-GICUC
_beng
_cEG-GICUC
_dEG-GICUC
_erda
041 0 _aeng
_beng
_bara
049 _aDeposit
082 0 4 _a006.66
092 _a006.66
_221
097 _aM.Sc
099 _aCai01.18.02.M.Sc.2024.Ma.S
100 0 _aManal Anwer Khedr,
_epreparation.
245 1 0 _aSemantic expansion of short queries using domain ontology /
_cby Manal Anwer Khedr ; Supervision Dr. Akram Salah, Dr. Fatma El-Licy
246 1 5 _aالتوسع الدلالي للاستعلامات القصيرة باستخدام أونطولوجيا المجال /
264 0 _c2024.
300 _a111 leaves :
_billustrations ;
_c30 cm. +
_eCD.
336 _atext
_2rda content
337 _aUnmediated
_2rdamedia
338 _avolume
_2rdacarrier
502 _aThesis (M.Sc)-Cairo University, 2024.
504 _aBibliography: pages 91-106.
520 _aThe World Wide Web is a valuable and important source of information. One of the characteristics of the web is searching for resources. Searchers of several backgrounds now use Web search engines to acquire new information about a specific topic. Nonetheless, some searchers may struggle to form appropriate queries to articulate their inquiries due to a lack of domain knowledge. Others used to write short queries, which led to contextless queries. Besides, users and indexers often don't use the same terms, which means users' terms are incompatible with those representing documents, leading to term mismatches or vocabulary problems. Vocabulary problems occur due to the absence of synonymous words or the usage of polysemous, and homonyms words. So choosing the right keywords in a query is a challenge, particularly for beginner searchers. Additionally, semantics is almost neglected in traditional search engines and keyword-based searches deem search results imprecise with irrelevant documents. Also, traditional search engines do not support specific domains. With the emergence of ontology-based query expansion systems, Ontology displayed the strengths of semantic technologies that provide fundamental functionalities for more suitable access to online knowledge. The proposed system utilizes domain ontology to handle the shortness and vagueness of queries to be significant and relevant to the domain of interest. Exploiting the ontological structure of domain-specific is like adding a contextual layer and semantic information at the top of the Google search engine. That improved the expanded query by eliminating the vocabulary problems and accordingly, the search results. The proposed system is directed to consider specific domains to facilitate the search tasks by targeting the search process and improving the precision of the retrieved results. For this research, Java and Python programming languages were selected to present different domain ontology cases as an application for experiment queries of computer languages. Then the system was evaluated with a set of experiments through searching correct, ambiguous, and misspelled queries based on two scenarios utilizing the Google search engine before and after applying the expansion which provided by the proposed system. The quality of experimental results for the expanded queries is much higher than that for the crude queries. Where it was tested using P@rank and Average Precision. Further, the system was evaluated by independent testers using external Mean Average Precision. They confirmed the mechanical test results and displayed their improvement. Derived ontologies are sharable and reusable. The proposed system is portable for any other Domains, provided the availability of the corresponding domain ontology.
520 _aيعدّ الويب المصدر الرئيس للمعلومات لجميع الباحثين حيث يوفر المصادر المختلفة للمعلومات، وبالرغم من وجود كم هائل من المعلومات الا أن الباحثين يواجهون صعوبة في الحصول على المعلومة أو تكوين استعلاما يتوافق مع بحثهم. لذلك لجأ بعض الباحثين إلى كتابة إستعلامات قصيرة تتكون من كلمة واحدة التي قد تتضمن معاني مختلفة، مما يؤدى إلى حدوث تضارب وعدم تطابق بين المستعلم عنه و بين الوثائق المحفوظة عند البحث. بالإضافة إلى أن الدلالات والمعاني يهملها البحث التقليدي حيث يعتمد البحث التقليدي في استرجاع المعلومات على التشابه أو التطابق التام فقط للكلمات المستعلم عنها دون النظر لمعنى الكلمة أوالكلمات المرتبطة بها فى المجال الخاص لها، مما يؤدى إلى نتائج غير دقيقة وغير مرتبطة بمقصد الباحث. كما أن محركات البحث التقليدية لا تدعم مجالات محددة. و من مشكلات الاستعلام على الويب هى عدم كتابة الإستعلام بطريقة صحيحة تتوافق مع الفهارس أو الانطولوجيات، فالمستخدمين والمفهرسين لا يستخدموا نفس المصطلحات غالبا مما يؤدي إلى مشكلة المفردات(عدم تطابق المصطلح) فالكلمة الواحدة لها مرادفات كثيرة أو معاني مختلفة باختلاف المجالات و قد يؤدى الخطأ الإملائي إلى كلمة ذات معنى بعيد من المقصد. لذا فاختيار الكلمات الرئيسية الصحيحة في الاستعلام و كتابتها يمثل تحديًا، خاصة لبعض الباحثين المبتدئين. إن استخدام البنية الوجودية عن طريق الأنطولوجيا والتقنيات الدلالية كقاعدة للمعرفة في استرجاع المعلومات عبر الإنترنت يوضح معنى المستعلم عنه وإزالة الغموض منه مما يعطي سهولة ودقة في عملية البحث عنه خاصة الاستعلام القصير ذو المعنى الغامض وذلك بتوسيع الاستعلامات أوتوماتيكيا وإضافة المرادفات ودمجها مع المصطلحات المرتبطة بالمستعلم عنه. حيث يوجد كلمات أو مصطلحات ذات صلة بالمستعلم عنه يمكنها إبراز معنى المستعلم عنه إذا تمت إضافتها خاصة مع الاستعلام القصير و المكون من كلمة واحدة، التي لها أكثر من معنى محتمل في البحث - لذلك تم اقتراح نظاما يوفر طريقة توسيع الاستعلام الدلالي لإزالة الغموض عن الاستعلامات في مجال برمجة الكمبيوتر باستخدام علم الوجود. و يعدّ كإضافة لطبقة دلالية قبل محرك البحث Google كمحاولة لتحسين عملية استرجاع المعلومات بتوسيع الإستعلام الأولي القصير معتمدا على إضافة المعاني المفقودة للمستعلم عنه أو تحديد المعنى الخاص له بمجال البحث مع توضيح الاختصارات، كما تم دمج طريقة تشابه جيب التمام في النموذج المقترح والذى أدي بدوره إلى تحسين وتصحيح وتوسيع الاستعلام القصير حيث تم استخدام مصطلحات المجال كقاعدة معجمية مع تقنية التشابه للتغلب على بعض مشكلات الأخطاء الإملائية أو التشابه الجزئي و من ثم الحصول علي نتائج ذات صلة بالمستعلم عنه. تم تنفيذ النظام المقترح وتقييمه باستعمال بحث الاستعلامات القصيرة و الموسعة بواسطة محرك البحث Google، ثم مقارنة النتائج قبل وبعد التوسيع بافتراض أن المستخدمين يبحثون في مجالات معينة مثل البحث عن مصطلحات خاصة بلغات البرمجة مثل Java وPython. حيث تم الاختبار مع العديد من الاستعلامات الغامضة باستخدام البحث عن كلمة واحدة وكلمات بها أخطاء إملائية وكانت النتيجة القدرة على استرجاع المزيد من النتائج ذات الصلة عند تطبيقها مما أدى إلى جودة عالية في النتائج المسترجعة للاستعلامات الموسعة عن الاستعلامات الأولية. لذا فاستخدام البحث الدلالي يعد ملائمًا بسبب ثرائه وفعاليته، حيث يوفر الوقت والجهد للباحثين المبتدئين. كما يوفر مجموعة واسعة من النتائج ذات الصلة التي تتعلق باحتياجات المستخدم ــ حيث حسنت أنطولوجيا المجال المخصص عملية البحث عن طريق إضافة سياق دلالي إلى استعلامات البحث بإضافة المصطلحات المرتبطة بالمستعلم عنه. إن الانطولوجيا المشتقة قابلة للمشاركة وقابلة لإعادة الاستخدام، وأيضا إطار العمل المقترح قابل لإضافة أي مجال مخصص آخر عن طريق إنشاء الأنطولوجي الخاص به.
530 _aIssues also as CD.
546 _aText in English and abstract in Arabic & English.
650 7 _aProgramming
_2qrmak
653 0 _aQuery Expansion
_aDomain Ontology
_asemantic web search
_ashort queries
700 0 _aAkram Salah
_ethesis advisor.
700 0 _aFatma El-Licy
_ethesis advisor.
900 _b01-01-2024
_cAkram Salah
_cFatma El-Licy
_UCairo University
_FFaculty of Graduate Studies for statistical Research
_DDepartment of Computer Sciences
905 _aShimaa
_eHuda
942 _2ddc
_cTH
_e21
_n0
999 _c171292