النموذج البولياني
النموذج البولياني بعتبر من النماذج التقليدية في استرجاع المعلومات ،فهوأول نموذج مستخدم في نظم استرجاع المعلومات ويعتبر من أكثر النماذج التي تم الاعتماد عليها. وهويستخدم من قبل جميع أنظمة استرجاع المعلومات التجارية اليوم.
تعاريف
يستند هذا النموذج بشكل أساسي على المنطق البولياني ونظرية المجموعات وذلك بأنه يعتبر حتى الوثائق التي سيبحث النظام خلالها واستعلام المستخدم كلاهما تعبير عن مجموعة من المصطلحات، ويتم استرجاع وثيقة ما طالما كانت مصطلحات الاستعلام موجودة في هذه الوثيقة. لواعتبرنا المجموعة T
T = {t1, t2, ..., tj, ..., tm
مجموعة منتهية من العناصر والتي نسمي جميع منها مصطلح فهرسة (index term) (والتي قد تكون حدثات أوحتى تعابير، والتي قد تكون تمت عليها عملية تجذير(stemming)، كما أنها قد تكون حدثات مذكورة في الموضوعة أوحتى من المعطيات المتحملة(metadata)التي تصف الوثيقة). والمجموعة D
D = {D1, ..., Di, ..., Dn
هي مجموعة منتهية تمثل الوثائق، جميع عنصر منها تعبير عن مجموعة جزئية من T وذلك لأن الوثيقة تتألف من عدد من المصطلحات أوالحدثات(terms). وسنعهد التعبير Q التالي
Q = (Wi OR Wk OR ...) AND ... AND (Wj OR Ws OR ...)
بأنه استعلام المستخدم والذي يخط بالطريقة الطبيعية الأساسية لأي تعبير بولياني في المنطق البولياني ، وذلك بحيث أن:
Wi=ti, Wk=tk, Wj=tj, Ws=ts, or Wi=NON ti, Wk=NON tk, Wj=NON tj, Ws=NONts
أي أنه إما حتى تكون حدثات الاستعلام غير مسبوقة بإشارة نفي وهي بذلك تعني حتى المستخدم يطلب البحث عن الوثائق التي تحتوي هذه الحدثة، أوأنها تكون مسبوقة بإشارة النفي والتي تعني حتى المستخدم يحتاج البحث عن الموضوعات التي لا تحوي هذه الحدثة. وبشكل مكافئ يمكن حتىقد يكون الاستعلام مكتوب باللغة الطبيعية ليعبر عن احتياج المستخدم. عملية الاسترجاع تتألف من مرحلتين هما:
- الحصول على المجموعات Sj من الوثائق والتي إما حتى تحوي حدثات الاستعلام أولا تحويها وذلك بحسب الاستعلام ذاته أي فيما إذا كانت حدثاته بالشكل (Wj=tj) أو(Wj=NON tj).
Sj = {Di|Wj element of Di
- تتم عملية استرداد الوثائق المجيبة للاستعلام والتي تم الحصول عليها بعد تطبيق العمليات على المجموعات Sj بالشكل الموافق للاستعلام Q أي بالشكل
اتحاد (التقاطعات من Sj).
مثال توضيحي
إيجابيات النموذج البولياني
- سهل التطبيق
- يصاغ الاستعلام بشكل واضح ومعبر عن طلب المستخدم بدقة
سلبيات النموذج البولياني
- يعتمد على المطابقة التامة بين حدثات الاستعلام وحدثات الوثائق وهذا يؤدي إلى استرجاع عدد قليل جداً من الوثائق أوعلى العكس تماماً.
- من الصعب القيام بعملية ترتيب لنتائج البحث، مع حتى بعض الوثائق المسترجعة قد تكون أبرز من غيرها ولكن لا تأخذ ترتيب أعلى.
- قد يجد المستخدم صعوبة في صياغة الاستعلام بالشكل المطلوب.
- جميع حدثات الفهرسة لها أوزان متساوية.
- يعتبره البعض أنه أقرب إلى استرجاع البيانات (Data Retrieval) منه إلى استرجاع المعلومات (Information Retrieval).