Semantic expansion of short queries using domain ontology / (Record no. 171292)
[ view plain ]
000 -LEADER | |
---|---|
fixed length control field | 10403nam a22004211i 4500 |
003 - CONTROL NUMBER IDENTIFIER | |
control field | OSt |
005 - أخر تعامل مع التسجيلة | |
control field | 20250413105801.0 |
008 - FIXED-LENGTH DATA ELEMENTS--GENERAL INFORMATION | |
fixed length control field | 250325s2024 |||a|||f m||| 000 0 eng d |
040 ## - CATALOGING SOURCE | |
Original cataloguing agency | EG-GICUC |
Language of cataloging | eng |
Transcribing agency | EG-GICUC |
Modifying agency | EG-GICUC |
Description conventions | rda |
041 0# - LANGUAGE CODE | |
Language code of text/sound track or separate title | eng |
Language code of summary or abstract | eng |
-- | ara |
049 ## - Acquisition Source | |
Acquisition Source | Deposit |
082 04 - DEWEY DECIMAL CLASSIFICATION NUMBER | |
Classification number | 006.66 |
092 ## - LOCALLY ASSIGNED DEWEY CALL NUMBER (OCLC) | |
Classification number | 006.66 |
Edition number | 21 |
097 ## - Degree | |
Degree | M.Sc |
099 ## - LOCAL FREE-TEXT CALL NUMBER (OCLC) | |
Local Call Number | Cai01.18.02.M.Sc.2024.Ma.S |
100 0# - MAIN ENTRY--PERSONAL NAME | |
Authority record control number or standard number | Manal Anwer Khedr, |
Preparation | preparation. |
245 10 - TITLE STATEMENT | |
Title | Semantic expansion of short queries using domain ontology / |
Statement of responsibility, etc. | by Manal Anwer Khedr ; Supervision Dr. Akram Salah, Dr. Fatma El-Licy |
246 15 - VARYING FORM OF TITLE | |
Title proper/short title | التوسع الدلالي للاستعلامات القصيرة باستخدام أونطولوجيا المجال / |
264 #0 - PRODUCTION, PUBLICATION, DISTRIBUTION, MANUFACTURE, AND COPYRIGHT NOTICE | |
Date of production, publication, distribution, manufacture, or copyright notice | 2024. |
300 ## - PHYSICAL DESCRIPTION | |
Extent | 111 leaves : |
Other physical details | illustrations ; |
Dimensions | 30 cm. + |
Accompanying material | CD. |
336 ## - CONTENT TYPE | |
Content type term | text |
Source | rda content |
337 ## - MEDIA TYPE | |
Media type term | Unmediated |
Source | rdamedia |
338 ## - CARRIER TYPE | |
Carrier type term | volume |
Source | rdacarrier |
502 ## - DISSERTATION NOTE | |
Dissertation note | Thesis (M.Sc)-Cairo University, 2024. |
504 ## - BIBLIOGRAPHY, ETC. NOTE | |
Bibliography, etc. note | Bibliography: pages 91-106. |
520 ## - SUMMARY, ETC. | |
Summary, etc. | The World Wide Web is a valuable and important source of information. One of the characteristics of the web is searching for resources. Searchers of several backgrounds now use Web search engines to acquire new information about a specific topic. Nonetheless, some searchers may struggle to form appropriate queries to articulate their inquiries due to a lack of domain knowledge. Others used to write short queries, which led to contextless queries. Besides, users and indexers often don't use the same terms, which means users' terms are incompatible with those representing documents, leading to term mismatches or vocabulary problems. Vocabulary problems occur due to the absence of synonymous words or the usage of polysemous, and homonyms words. So choosing the right keywords in a query is a challenge, particularly for beginner searchers. Additionally, semantics is almost neglected in traditional search engines and keyword-based searches deem search results imprecise with irrelevant documents. Also, traditional search engines do not support specific domains.<br/>With the emergence of ontology-based query expansion systems, Ontology displayed the strengths of semantic technologies that provide fundamental functionalities for more suitable access to online knowledge. The proposed system utilizes domain ontology to handle the shortness and vagueness of queries to be significant and relevant to the domain of interest. Exploiting the ontological structure of domain-specific is like adding a contextual layer and semantic information at the top of the Google search engine. That improved the expanded query by eliminating the vocabulary problems and accordingly, the search results. <br/>The proposed system is directed to consider specific domains to facilitate the search tasks by targeting the search process and improving the precision of the retrieved results.<br/><br/>For this research, Java and Python programming languages were selected to present different domain ontology cases as an application for experiment queries of computer languages. Then the system was evaluated with a set of experiments through searching correct, ambiguous, and misspelled queries based on two scenarios utilizing the Google search engine before and after applying the expansion which provided by the proposed system.<br/>The quality of experimental results for the expanded queries is much higher than that for the crude queries. Where it was tested using P@rank and Average Precision. Further, the system was evaluated by independent testers using external Mean Average Precision. They confirmed the mechanical test results and displayed their improvement. <br/>Derived ontologies are sharable and reusable. The proposed system is portable for any other Domains, provided the availability of the corresponding domain ontology. |
520 ## - SUMMARY, ETC. | |
Summary, etc. | يعدّ الويب المصدر الرئيس للمعلومات لجميع الباحثين حيث يوفر المصادر المختلفة للمعلومات، وبالرغم من وجود كم هائل من المعلومات الا أن الباحثين يواجهون صعوبة في الحصول على المعلومة أو تكوين استعلاما يتوافق مع بحثهم. لذلك لجأ بعض الباحثين إلى كتابة إستعلامات قصيرة تتكون من كلمة واحدة التي قد تتضمن معاني مختلفة، مما يؤدى إلى حدوث تضارب وعدم تطابق بين المستعلم عنه و بين الوثائق المحفوظة عند البحث. بالإضافة إلى أن الدلالات والمعاني يهملها البحث التقليدي حيث يعتمد البحث التقليدي في استرجاع المعلومات على التشابه أو التطابق التام فقط للكلمات المستعلم عنها دون النظر لمعنى الكلمة أوالكلمات المرتبطة بها فى المجال الخاص لها، مما يؤدى إلى نتائج غير دقيقة وغير مرتبطة بمقصد الباحث. كما أن محركات البحث التقليدية لا تدعم مجالات محددة. و من مشكلات الاستعلام على الويب هى عدم كتابة الإستعلام بطريقة صحيحة تتوافق مع الفهارس أو الانطولوجيات، فالمستخدمين والمفهرسين لا يستخدموا نفس المصطلحات غالبا مما يؤدي إلى مشكلة المفردات(عدم تطابق المصطلح) فالكلمة الواحدة لها مرادفات كثيرة أو معاني مختلفة باختلاف المجالات و قد يؤدى الخطأ الإملائي إلى كلمة ذات معنى بعيد من المقصد. لذا فاختيار الكلمات الرئيسية الصحيحة في الاستعلام و كتابتها يمثل تحديًا، خاصة لبعض الباحثين المبتدئين. <br/>إن استخدام البنية الوجودية عن طريق الأنطولوجيا والتقنيات الدلالية كقاعدة للمعرفة في استرجاع المعلومات عبر الإنترنت يوضح معنى المستعلم عنه وإزالة الغموض منه مما يعطي سهولة ودقة في عملية البحث عنه خاصة الاستعلام القصير ذو المعنى الغامض وذلك بتوسيع الاستعلامات أوتوماتيكيا وإضافة المرادفات ودمجها مع المصطلحات المرتبطة بالمستعلم عنه. حيث يوجد كلمات أو مصطلحات ذات صلة بالمستعلم عنه يمكنها إبراز معنى المستعلم عنه إذا تمت إضافتها خاصة مع الاستعلام القصير و المكون من كلمة واحدة، التي لها أكثر من معنى محتمل في البحث - لذلك تم اقتراح نظاما يوفر طريقة توسيع الاستعلام الدلالي لإزالة الغموض عن الاستعلامات في مجال برمجة الكمبيوتر باستخدام علم الوجود. و يعدّ كإضافة لطبقة دلالية قبل محرك البحث Google كمحاولة لتحسين عملية استرجاع المعلومات بتوسيع الإستعلام الأولي القصير معتمدا على إضافة المعاني المفقودة للمستعلم عنه أو تحديد المعنى الخاص له بمجال البحث مع توضيح الاختصارات، كما تم دمج طريقة تشابه جيب التمام في النموذج المقترح والذى أدي بدوره إلى تحسين وتصحيح وتوسيع الاستعلام القصير حيث تم استخدام مصطلحات المجال كقاعدة معجمية مع تقنية التشابه للتغلب على بعض مشكلات الأخطاء الإملائية أو التشابه الجزئي و من ثم الحصول علي نتائج ذات صلة بالمستعلم عنه.<br/>تم تنفيذ النظام المقترح وتقييمه باستعمال بحث الاستعلامات القصيرة و الموسعة بواسطة محرك البحث Google، ثم مقارنة النتائج قبل وبعد التوسيع بافتراض أن المستخدمين يبحثون في مجالات معينة مثل البحث عن مصطلحات خاصة بلغات البرمجة مثل Java وPython. حيث تم الاختبار مع العديد من الاستعلامات الغامضة باستخدام البحث عن كلمة واحدة وكلمات بها أخطاء إملائية وكانت النتيجة القدرة على استرجاع المزيد من النتائج ذات الصلة عند تطبيقها مما أدى إلى جودة عالية في النتائج المسترجعة للاستعلامات الموسعة عن الاستعلامات الأولية.<br/>لذا فاستخدام البحث الدلالي يعد ملائمًا بسبب ثرائه وفعاليته، حيث يوفر الوقت والجهد للباحثين المبتدئين. كما يوفر مجموعة واسعة من النتائج ذات الصلة التي تتعلق باحتياجات المستخدم ــ حيث حسنت أنطولوجيا المجال المخصص عملية البحث عن طريق إضافة سياق دلالي إلى استعلامات البحث بإضافة المصطلحات المرتبطة بالمستعلم عنه.<br/>إن الانطولوجيا المشتقة قابلة للمشاركة وقابلة لإعادة الاستخدام، وأيضا إطار العمل المقترح قابل لإضافة أي مجال مخصص آخر عن طريق إنشاء الأنطولوجي الخاص به. |
530 ## - ADDITIONAL PHYSICAL FORM AVAILABLE NOTE | |
Issues CD | Issues also as CD. |
546 ## - LANGUAGE NOTE | |
Text Language | Text in English and abstract in Arabic & English. |
650 #7 - SUBJECT ADDED ENTRY--TOPICAL TERM | |
Topical term or geographic name entry element | Programming |
Source of heading or term | qrmak |
653 #0 - INDEX TERM--UNCONTROLLED | |
Uncontrolled term | Query Expansion |
-- | Domain Ontology |
-- | semantic web search |
-- | short queries |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Akram Salah |
Relator term | thesis advisor. |
700 0# - ADDED ENTRY--PERSONAL NAME | |
Personal name | Fatma El-Licy |
Relator term | thesis advisor. |
900 ## - Thesis Information | |
Grant date | 01-01-2024 |
Supervisory body | Akram Salah |
-- | Fatma El-Licy |
Universities | Cairo University |
Faculties | Faculty of Graduate Studies for statistical Research |
Department | Department of Computer Sciences |
905 ## - Cataloger and Reviser Names | |
Cataloger Name | Shimaa |
Reviser Names | Huda |
942 ## - ADDED ENTRY ELEMENTS (KOHA) | |
Source of classification or shelving scheme | Dewey Decimal Classification |
Koha item type | Thesis |
Edition | 21 |
Suppress in OPAC | No |
Source of classification or shelving scheme | Home library | Current library | Date acquired | Inventory number | Full call number | Barcode | Date last seen | Effective from | Koha item type |
---|---|---|---|---|---|---|---|---|---|
Dewey Decimal Classification | المكتبة المركزبة الجديدة - جامعة القاهرة | قاعة الرسائل الجامعية - الدور الاول | 25.03.2025 | 90838 | Cai01.18.02.M.Sc.2024.Ma.S | 01010110090838000 | 25.03.2025 | 25.03.2025 | Thesis |