Semantic expansion of short queries using domain ontology / by Manal Anwer Khedr ; Supervision Dr. Akram Salah, Dr. Fatma El-Licy
Material type:
- text
- Unmediated
- volume
- التوسع الدلالي للاستعلامات القصيرة باستخدام أونطولوجيا المجال [Added title page title]
- 006.66
- Issues also as CD.
Item type | Current library | Home library | Call number | Status | Barcode | |
---|---|---|---|---|---|---|
![]() |
قاعة الرسائل الجامعية - الدور الاول | المكتبة المركزبة الجديدة - جامعة القاهرة | Cai01.18.02.M.Sc.2024.Ma.S (Browse shelf(Opens below)) | Not for loan | 01010110090838000 |
Thesis (M.Sc)-Cairo University, 2024.
Bibliography: pages 91-106.
The World Wide Web is a valuable and important source of information. One of the characteristics of the web is searching for resources. Searchers of several backgrounds now use Web search engines to acquire new information about a specific topic. Nonetheless, some searchers may struggle to form appropriate queries to articulate their inquiries due to a lack of domain knowledge. Others used to write short queries, which led to contextless queries. Besides, users and indexers often don't use the same terms, which means users' terms are incompatible with those representing documents, leading to term mismatches or vocabulary problems. Vocabulary problems occur due to the absence of synonymous words or the usage of polysemous, and homonyms words. So choosing the right keywords in a query is a challenge, particularly for beginner searchers. Additionally, semantics is almost neglected in traditional search engines and keyword-based searches deem search results imprecise with irrelevant documents. Also, traditional search engines do not support specific domains.
With the emergence of ontology-based query expansion systems, Ontology displayed the strengths of semantic technologies that provide fundamental functionalities for more suitable access to online knowledge. The proposed system utilizes domain ontology to handle the shortness and vagueness of queries to be significant and relevant to the domain of interest. Exploiting the ontological structure of domain-specific is like adding a contextual layer and semantic information at the top of the Google search engine. That improved the expanded query by eliminating the vocabulary problems and accordingly, the search results.
The proposed system is directed to consider specific domains to facilitate the search tasks by targeting the search process and improving the precision of the retrieved results.
For this research, Java and Python programming languages were selected to present different domain ontology cases as an application for experiment queries of computer languages. Then the system was evaluated with a set of experiments through searching correct, ambiguous, and misspelled queries based on two scenarios utilizing the Google search engine before and after applying the expansion which provided by the proposed system.
The quality of experimental results for the expanded queries is much higher than that for the crude queries. Where it was tested using P@rank and Average Precision. Further, the system was evaluated by independent testers using external Mean Average Precision. They confirmed the mechanical test results and displayed their improvement.
Derived ontologies are sharable and reusable. The proposed system is portable for any other Domains, provided the availability of the corresponding domain ontology.
يعدّ الويب المصدر الرئيس للمعلومات لجميع الباحثين حيث يوفر المصادر المختلفة للمعلومات، وبالرغم من وجود كم هائل من المعلومات الا أن الباحثين يواجهون صعوبة في الحصول على المعلومة أو تكوين استعلاما يتوافق مع بحثهم. لذلك لجأ بعض الباحثين إلى كتابة إستعلامات قصيرة تتكون من كلمة واحدة التي قد تتضمن معاني مختلفة، مما يؤدى إلى حدوث تضارب وعدم تطابق بين المستعلم عنه و بين الوثائق المحفوظة عند البحث. بالإضافة إلى أن الدلالات والمعاني يهملها البحث التقليدي حيث يعتمد البحث التقليدي في استرجاع المعلومات على التشابه أو التطابق التام فقط للكلمات المستعلم عنها دون النظر لمعنى الكلمة أوالكلمات المرتبطة بها فى المجال الخاص لها، مما يؤدى إلى نتائج غير دقيقة وغير مرتبطة بمقصد الباحث. كما أن محركات البحث التقليدية لا تدعم مجالات محددة. و من مشكلات الاستعلام على الويب هى عدم كتابة الإستعلام بطريقة صحيحة تتوافق مع الفهارس أو الانطولوجيات، فالمستخدمين والمفهرسين لا يستخدموا نفس المصطلحات غالبا مما يؤدي إلى مشكلة المفردات(عدم تطابق المصطلح) فالكلمة الواحدة لها مرادفات كثيرة أو معاني مختلفة باختلاف المجالات و قد يؤدى الخطأ الإملائي إلى كلمة ذات معنى بعيد من المقصد. لذا فاختيار الكلمات الرئيسية الصحيحة في الاستعلام و كتابتها يمثل تحديًا، خاصة لبعض الباحثين المبتدئين.
إن استخدام البنية الوجودية عن طريق الأنطولوجيا والتقنيات الدلالية كقاعدة للمعرفة في استرجاع المعلومات عبر الإنترنت يوضح معنى المستعلم عنه وإزالة الغموض منه مما يعطي سهولة ودقة في عملية البحث عنه خاصة الاستعلام القصير ذو المعنى الغامض وذلك بتوسيع الاستعلامات أوتوماتيكيا وإضافة المرادفات ودمجها مع المصطلحات المرتبطة بالمستعلم عنه. حيث يوجد كلمات أو مصطلحات ذات صلة بالمستعلم عنه يمكنها إبراز معنى المستعلم عنه إذا تمت إضافتها خاصة مع الاستعلام القصير و المكون من كلمة واحدة، التي لها أكثر من معنى محتمل في البحث - لذلك تم اقتراح نظاما يوفر طريقة توسيع الاستعلام الدلالي لإزالة الغموض عن الاستعلامات في مجال برمجة الكمبيوتر باستخدام علم الوجود. و يعدّ كإضافة لطبقة دلالية قبل محرك البحث Google كمحاولة لتحسين عملية استرجاع المعلومات بتوسيع الإستعلام الأولي القصير معتمدا على إضافة المعاني المفقودة للمستعلم عنه أو تحديد المعنى الخاص له بمجال البحث مع توضيح الاختصارات، كما تم دمج طريقة تشابه جيب التمام في النموذج المقترح والذى أدي بدوره إلى تحسين وتصحيح وتوسيع الاستعلام القصير حيث تم استخدام مصطلحات المجال كقاعدة معجمية مع تقنية التشابه للتغلب على بعض مشكلات الأخطاء الإملائية أو التشابه الجزئي و من ثم الحصول علي نتائج ذات صلة بالمستعلم عنه.
تم تنفيذ النظام المقترح وتقييمه باستعمال بحث الاستعلامات القصيرة و الموسعة بواسطة محرك البحث Google، ثم مقارنة النتائج قبل وبعد التوسيع بافتراض أن المستخدمين يبحثون في مجالات معينة مثل البحث عن مصطلحات خاصة بلغات البرمجة مثل Java وPython. حيث تم الاختبار مع العديد من الاستعلامات الغامضة باستخدام البحث عن كلمة واحدة وكلمات بها أخطاء إملائية وكانت النتيجة القدرة على استرجاع المزيد من النتائج ذات الصلة عند تطبيقها مما أدى إلى جودة عالية في النتائج المسترجعة للاستعلامات الموسعة عن الاستعلامات الأولية.
لذا فاستخدام البحث الدلالي يعد ملائمًا بسبب ثرائه وفعاليته، حيث يوفر الوقت والجهد للباحثين المبتدئين. كما يوفر مجموعة واسعة من النتائج ذات الصلة التي تتعلق باحتياجات المستخدم ــ حيث حسنت أنطولوجيا المجال المخصص عملية البحث عن طريق إضافة سياق دلالي إلى استعلامات البحث بإضافة المصطلحات المرتبطة بالمستعلم عنه.
إن الانطولوجيا المشتقة قابلة للمشاركة وقابلة لإعادة الاستخدام، وأيضا إطار العمل المقترح قابل لإضافة أي مجال مخصص آخر عن طريق إنشاء الأنطولوجي الخاص به.
Issues also as CD.
Text in English and abstract in Arabic & English.
There are no comments on this title.