محرك بحث

عودة للموسوعة

محرك بحث


محرك البحث (الباحوث ) هوبرنامج حاسوبي مصمم للمساعدة في العثور على مستندات مخزنة على شبكات معلوماتية ( كالشبكة العنكبوتية العالمية بالإنگليزية: World Wide Web) أوعلى حاسوب شخصي. بنيت محركات البحث الأولى اعتمادا على التقنيات المستعملة في إدارة المخطات الكلاسيكية. حيث يتم بناء فهارس للمستندات تشكل قاعدة للبيانات تفيد في البحث عن أي معلومة.

يسمح محرك البحث للمستخدم حتى يطلب المحتوى الذي يقابل معايير محددة (والقاعدة فيها تلك التي تحتوي على حدثة أوتعبير ما) ويستدعي قائمةً بالمراجع توافق تلك المعايير. تستخدم محركات البحث مؤشرات/فهارس/مسارد منتظمة التحديث لتشتغل بسرعة وفعالية.

تعرض النتائج على شكل قائمة بعناوين المستندات التي توافق الطلب. يرفق بالعناوين في الغالب مختصر عن النستند المشار إيه أومقتطف منه للدالة علة موافقته للبحث. عناصر قائمة البحث ترتب على حسب معايير خاصة (قد تختلف من محرك لآخر) من أهمها مدى موافقة جميع عنصر للطلب.

عند الحديث عن محركات البحث فغالبا ما يقصد محركات البحث على شبكة الإنترنت ومحركات الوِيب بالخصوص. محركات البحث في الويب تبحث عن المعلومات على الشبكة العنكبوتية العالمية، ومنها يستعمل على نطاق ضيق يضم البحث داخل الشبكات المحلية للمؤسسات أي إنترانت بالإنگليزية: Intranet. أما محركات البحث الشخصية فتبحث في الحواسيب الشخصية الفردية.

بعض محركات البحث أيضًا تحفر في البيانات المتاحة على المجموعات الإخبارية، وقواعد البيانات الضخمة، أوأدلة مواقع الوِب مثل دِموز دوت أورج. تشتغل محركات البحث عن طريق الخوارزميات، على عكس أدلة المواقع، والتي يقوم عليها محررون بشر.

تاريخ

أول محرك درس وِب قام بها السيد الدكتور نشأت سندي وكان في عام 1955 كان واندكس بالإنگليزية: Wandex [بحاجة لمصدر]، وهوفهرس جمعه متجول وِب وهوزاحف عنكبوتي web crawler طوره ماثيوجراي في معهد ماساشوستس للتكنولوجيا MIT في 1993. ويعد آليوِب بالإنگليزية: Aliweb محرك درس آخر مبكر جدًا وقد ظهر في 1993 ويعمل حتى اليوم. وأول محرك درس قائم على الزاحف العنكبوتي للنصوص الكاملة كان وبكراولر بالإنگليزية: WebCrawler، والذي خرج للوجود في 1994. وعلى عكس سابقيه، فقد هجر المستخدمين يبحثون عن أي حدثة على أي صفحة وِب، وهوما صار القاعدة لكل محركات البحث الكبرى منذ ذلك الوقت. كان هوأيضا الأول في فهم الجمهور به على نطاق واسع. في 1004 كذلك اتى لايكوس بالإنگليزية: Lycos (الذي بدأ في جامعة كارنيجي ميلون بالإنگليزية: Carnegie Mellon University) وصار مشروعًا تجاريًا كبيرًا.

بعد ذلك بقليل، ظهر الكثير من محركات البحث وتزاحمت على الشعبية. وكان من ضمنها إكسايت بالإنگليزية: Excite، إنفوسيك بالإنگليزية: Infoseek، وإنكتومي بالإنگليزية: Inktomi، ونورثرن لايت بالإنگليزية: Northern Light، وألتافيستا بالإنگليزية: Alta Vista. وفي بعض الحالات تنافست مع الأدلة ذات الشعبية مثل ياهو! بالإنگليزية: !Yahoo. فيما بعد، أدمجت الأدلة أوأضافت إليها تقنية محرك البحث من أجل أداء أكبر للوظائف.

عهدت محركات البحث أيضا بكونها بعض ألمع النجوم في نوبة الاستثمار في الإنترنت التي سقطت في أواخر التسعينات. دخلت عدة شركات السوق في مشهد كبير، مسجلة مكاسب قياسية خلال طرح أسهمها العام الافتتاحي. وقد سحب البعض محركاتهم البحثية العامة، وهم يسوقون نسخا للشركات فقط، مثل نورثرن لايت التي كانت من ال8 أوتسعة محركات درس المبكرة بعد حتى اتى لايكوس بالإنگليزية: Lycos.

قبل مجيء الوب، كانت هناك بواحيث لموافيق (بروتوكولات )أواستخدامات أخرى، مثل محرك درس آركي لمواقع إف‌.تي.‌بي المجهولة anonymous FTP ومحرك درس ڤيرونيكا لبروتوكول جوفر.

وستأتي بعض محركات البحث الأخرى منها إيه ناين.كوم a9.com (أمازون.كوم)، آسك چيڤيز/تيوما بالإنگليزية: Ask Jeeves/Teoma، جيجابلاست، سناپ بالإنگليزية: Snap، والهاللوبالإنگليزية: Walhello، كازاز بالإنگليزية: Kazazz، ووايسنَت بالإنگليزية: WiseNut. وبعض آخر آخر محركات البحث، والتي تبحث فقط أنواعا محددة من المحتوى هي پلازوPlazoo (لمردود الخلاصات RSS feeds)، وجوهوك GoHook (لملفات پي دي إف PDF بشكل رئيسي). ومن أشهر المحركات أيضا: Yooci وThroughSearch


أشهر محركات البحث

  • ياهو
  • ألتافيستا
  • جوجل
  • إمإسإن ميكروسوفت


كيف تعمل محركات البحث

تعمل محركات البحث عن طريق تخزين المعلومات عن عدد كبير من صفحات الوِب، والتي تستعيدها من الشبكة العالمية وورلد وايد وب نفسها. تستعاد هذه الصفحات بواسطة زاحف وِب (يعهد أحيانا أيضا بـ ’عنكبوت‘) – وهومستعرض وِب آلي يتبع جميع رابط يراه. بعد ذلك يجري تحليل جميع صفحة لتحديد كيف من الممكن أن ينبغي فهرستها (على سبيل المثال، تستخلص الحدثات من العناوين، رؤوس الموضوعات، أوحقول خاصة تعهد ب ميتا تاجز). تخزن البيانات عن صفحات الوِب في قاعدة بيانات فهرسية للاستخدام في عمليات البحث طلبا لللمعلومات لاحقا. بعض محركات البحث، مثل جوجل، تخزن جميع أوبعض الصفحة المصدر (وتشير لها ب مخبوءة) وبالمثل معلومات عن صفحات الوِب، بينما بعضها تخزن جميع حدثة من جميع صفحة تجدها، مثل ألتاڤيستا. هذه الصفحة المخبوءة تمسك بنص البحث العملي بما أنه هوالذي تمت فهرسته عمليا، لذا فقد تكون مفيدة جدا عندماقد يكون محتوى الصفحة الحالية قد جرى تحديثه ولم تعد ألفاظ البحث فيه. من الممكن تعتبر هذه المشكلة شكلا خفيفا من تعفن الروابط، وتزيد معالجة جوجل لها من إمكانية الاستخدام بإرضاء تسقطات المستخدم بأن ترد ألفاظ البحث في صفحات الوِب العائدة في الرد. وهوما يرضي ’مبدأ مفاجأة أخف من مفاجأة‘ بما حتى المستخدم يتسقط بشكل طبيعي ألفاظ البحث في النتيجة العائدة له. وهذه الصلة بالبحث تجعل هذه الصفحات المخبوءة مفيدة جدا، حتى أكثر من واقع أنها قد تحتوي على بيانات من الممكن لم تعد متاحة في موضع آخر.

عندما يتوجه مستخدم لمحرك البحث ويجري عملية درس طلبا للمعلومات، كما هوسائد بإعطاء حدثات مفتاحية، يفتش المحرك في الفهرس ويقدم قائمة بصفحات الوِب الأفضل توافقا تبعا لمعاييره، في المعتاد مع ملخص قصير يحتوي على عنوان الوثيقة وأحيانا أجزاء من النص. معظم محركات البحث تدعم استخدام الاصطلاحات البولينية (نسبة للجبر البوليني وهونوع من المتغيرات المنطقية): AND وOR وNOT لمزيد من تحديد طلب المعلومات. وهناك خدمة وظيفية متقدمة هي البحث بالتقارب، والتي تسمح لك بتحديد المسافة بين الحدثات المفتاحية، باستخدام ألفاظ مثل NEAR، NOT NEAR، FOLLOWED BY، NOT FOLLOWED BY، SENTENCE، FAR.

يعتمد مدى فائدة محرك درس على مدى صلة النتائج التي يرد بها. فبينما قد تكون هناك ملايين صفحات الوِب التي تحتوي على حدثة أوتعبير محددة، قد تكون بعض أوثق صلة، أوأروج، أومعتمدة أكثر من غيرها. معظم محركات البحث توظف أساليب لوضع مراتب النتائج لتقدم أفضل النتائج أولا. الكيفية التي يقرر بها محرك درس أي الصفحات هي الأفضل توافقا، وما النظام الذي يجب حتى تظهر به النتائج، تختلف بشكل شاسع من محرك لآخر. الأساليب أيضا تتغير عبر الزمن بتغير استخدام إنترنت وتكنيكات جديدة تتطور.

معظم محركات البحث هي مضاربات تجارية يدعمها عائد إعلاني و، بالنتيجة، يوظف البعض الممارسة المثيرة للجدل بالسماح للمعلنين بدفع النقود ليحملوا لهم قوائهم في مراتب نتائج البحث.

الأغلبية الكاسحة من محركات البحث تديرها شركات خاصة تستخدم خوارزميات ملكها وقواعد بيانات مغلقة، وأكثرها رواجا حاليا هي جوجل وباحث إمإسإن وياهو. توجد تقنية محركات درس مفتوحة المصدر مثل إتشتيدِج، نتش، سيناز، إيجوثور وأوبنإفتيإس، ولكن ليس هناك خادم درس وورلد وايد وِب مشاع يستخدم هذه التقنية.

اتى تطور محرك درس الوِب من تطور محركات البحث على شبكات الأجهزة والشبكات الداخلية.

محركات البحث على الشبكة الإنترنت

يمكننا القول بأن الشبكة ومواقعها لن تكون ذات فائدة كبيرة بالنسبة لنا لولم تكن محركات البحث على إنترنت موجودة. في البدء كانت محركات البحث تعبير عن أدلاء تقوم بفهرسة مواقع الإنترنت الجديدة. وقد كان ذلك فعالا عندما كان حجم إنترنت يقدر بملايين الصفحات. ثم تطورت إنترنت، وانضم إليها الملايين من مؤسسات الأعمال، والمؤسسات الحكومية، وبلايين الصفحات من أدلة استخدام المنتجات، والمعلومات الخاصة بالمستثمرين، وغير ذلك من المعلومات التي تقوم بتسيير عجلة اقتصاد إنترنت. ومع هذا النموأصبح من الضروري، بل ومن الحتمي إضافة محرك درس فعال إلى كافة مواقع إنترنت، يقوم بفهرسة وتصنيف المعلومات الموجودة ضمن هذه المواقع كي تتمكن من خدمة زائريها بشكل فعال. واليوم، وبعد حتى أصبحت محركات البحث جزءا أساسيا في حضارتنا الإنترنتية، فإن هناك العشرات من الشركات العاملة في مجال إنتاج برمجيات، وتقنيات، وأساليب درس جديدة موجهة نحوإنترنت وإنترانت. وبسبب الدور المتزايد الذي تلعبه التجارة والأعمال الإلكترونية في اقتصاد اليوم، فإن الحافز المادي على الأقل موجود. ولكن رغم النجاح الذي تدّعي الشركات المنتجة لتقنيات البحث تحقيقه، فإن المستخدمين لا زالوا يشكون من افتقار محركات البحث إلى الدقة المطلوبة، وتلبية النتائج التي يتم تحصيلها لمتطلبات المستخدمين

مشاكل تقنيات البحث

إن مفتاح النجاح في الحصول على نتائج درس جيدة، تكمن في نوعية الاستفسارات، أوالأسئلة، أوالعبارات أوالحدثات المفتاحية التي نقوم بإدخالها في محركات البحث. لكن المشكلة الأساسية هنا تكمن في حتى الغالبية العظمى من المستخدمين لا يقومون عادة بإدخال الاستفسارات أوالحدثات المفتاحية السليمة، والتي تؤدي إلى الحصول على النتائج المطلوبة، وسنستعرض فيما يلي المشاكل الشائعة في عالم البحث عن المعلومات، والطرق التي يحاول بها الباحثون معالجة هذه المشكلات.


عدم طرح الأسئلة السليمة

من الحقائق الغريبة التي يؤكدها خبراء المعلومات هي حتى المستخدمين نادرا ما يقومون بطرح الأسئلة التي تعبر عما يريدونه عملا. والسبب الرئيس في ذلك هوالافتقار إلى الفهم السليم للموضوع قيد البحث، وبالتالي عدم استخدام الحدثات المفتاحية السليمة، والتي تؤدي إلى تكوين استعلامات وأسئلة سليمة. فالمشكلة الأساسية هنا إذا، هي مساعدة المستخدمين على طرح الأسئلة وتكوين الاستعلامات السليمة. ومن مظاهر هذه المشكلة أيضا هي صغر حجم الاستعلامات التيقد يكونها المستخدم عادة للاستفسار عن موضوع معين. فإذا كان مستخدم ما يريد معلومات عن "السفر" مثلا، فإنه يبدأ بإدخال حدثة عامة في محرك البحث، ومن ثم، واعتمادا على النتائج التي يحصل عليها، يقوم بتضييق نطاق بحثه إلى حتى يصل إلى ما يريده. والسبب في حتى الكثير من مستخدمي إنترنت يستعملون هذا الأسلوب يكمن في أنهم لا يعهدون حقا الحجم المهول للمعلومات الموجودة في قواعد البيانات الخاصة بمحركات البحث، والتي تفوق عادة ما يمكن لأي إنسان التعامل معه.

الموازنة بين الكم والنوع

عند التعامل مع تقنيات البحث فلا بد من الموازنة بين الكم والنوع، أوما يدعوه الخبراء بالدقة والقدرة على الاسترجاع. وهي علاقة عكسية تماما، فحدثا تم تضييق نطاق البحث سعيا عن نتائج أكثر دقة، حدثا قل مقدار البيانات الذي يمكن استرجاعه. ولذلك فإن هناك حاجة لوجود محركات درس تقدم دقة عالية دون التضحية بمقدار النتائج "الدقيقة" التي نسترجعها.

غموض الحدثات

معظم الحدثات تحمل أكثر من معنى، ومعظم محركات البحث المستخدمة اليوم تقوم بمطابقة الحدثات وليس معانيها، ولذلك فإن نتائج عمليات البحث التي نحصل عليها، تحتوي غالبا على الحدثات المفتاحية السليمة، ولكنها ذات المعنى الخاطئ. فإذا جربت مثلا حتى تبحث عن معنى حدثة "جافا" مثلا، وهي إحدى لغات البرمجة الشائعة الاستخدام، فإنك ستحصل الكثير من النتائج المتعلقة بالجفاف، أوباسم جزيرة إندونيسية تحمل الاسم نفسه، إضافة إلى معلومات عن لغة البرمجةلانه يبحث عن البنية الصرفية والشكليه للحدثة وليس المعنى.

الأسماء وأنواعها

وماذا عن البحث في الأسماء، أي البحث عن معلومات عن الأشخاص والأماكن، وما إلى ذلك. خصوصا وأن الكتاب يغيرون عادة الكيفية التي يقومون بها بكتابة الأسماء. وإذا ما تحدثنا مثلا عن أسماء الشركات، فإنها تتغير باستمرار نتيجة عملية الاندماج والضم، مما يجعل عملية البحث صعبة. وقد يقول البعض أنه يمكن التغلب على هذه المشكلة نوعا ما باستخدام برمجيات الفهرسة، ولكن المشكلة هي حتى المعلومات في عالمنا تتغير باستمرار مما يجعل الفهرسة اليدوية صعبة. وماذا عن الفهرسة الآلية،يا ترى؟ الإجابة هي أنه لا توجد بعد التقنية التي يمكنها القيام بذلك بدقة، بحيث يمكن التمييز مثلا بين منطق تام عن إنسان معين، ومنطق آخر يذكر اسم الشخص بشكل عابر.

المعالجة الطبيعية للغة

يجمع العاملون في مجال محركات البحث بأن الحل لكافة هذه المشاكل يكمن في تصميم محركات البحث ، وبرمجيات البحث عموما، بحيث تستفيد من برمجيات المعالجة الطبيعية للغة Natural Language Processingعموما، والمعالجة الطبيعية للمعنى Natural Meaning Processing، والاستفادة من قواعد اللغة. النقطة الأساسية هنا هي حتى اللغة عموما مبنية على أساس قواعد ذات أساس شبيه بالمعادلات الرياضية، كما حتى عبارات اللغة وحدثاتها تكون مبنية حسب هيكلية معينة, فلكل جملة مبتدأ وخبر، أوعمل وفاعل ومفعول به، كما حتى الحدثات تأتي عادة من جذور وأصول. وهذه الهيكلية المبنية ضمن اللغة تتناسب وطبيعة عمل برمجيات الحاسوب، والتي بحاجة إلى هيكلية معينة تنفذ على أساسها عملياتها. أما المعالجة الطبيعية للمعنى فهي أكثر صعوبة، فحدثة مثل "راحة" يمكن لها حتى تعني عدة أشياء، كالارتياح بعد التعب، أوالراحة الأبدية والتي تعني الموت، أوراحة اليد. ولهذا فإن برمجيات البحث يجب حتى تتمكن من فهم الحدثة ضمن سياق النص، ودور الحدثة في هذا السياق. ولكن حتى هذا الأسلوب لا يفلح دوما في فهم المعنى. جرب حتى تقرأ ديوانا شعريا جيدا، وستجد حتى هنالك الكثير من الحدثات الصعبة، والتي قد يحاول البعض فهمها من السياق، ولكننا عندما نعجز عن ذلك فإننا نتجه إلى القاموس. وهذا أسلوب يمكن لبرمجيات الحاسوب اتباعه، أي الاعتماد على قاموس أوفهرس بالحدثات والعبارات الشائعة الاستخدام، والبحث في السياق. وفيما يلي بعض مفاهيم البحث التي تعتمد على المعالجة الطبيعية للغة؛


دراسة الجُمل

تتميز الجُمل بأنها ذات هيكلية محددة وواضحة، مما يساعد في فهم المعنى بشكل سريع. ومن خلال تحديد نوع الجملة، يمكن لبرمجيات البحث حتى تقوم بعملها بشكل أكثر دقة. ولعمل ذلك فإن هذه البرمجيات يجب حتى تعتمد على كميات كبيرة من المصادر والمراجع اللغوية، كالمكانز، والتي تحتوي على عبارات وجمل ذات علاقات محددة مسبقا. وباستخدام هذه المكانز يمكن لبرمجيات البحث حتى تفهم بشكل أفضل طبيعة العلاقة بين الحدثات المتنوعة ومواقعها السليمة ضمن الجمل. ورغم الفائدة العظيمة للمكانز، فإن مدى فعاليتها يعتمد على تحديثها باستمرار، وإلا فإنها تفقد فاعليتها تدريجيا. وباستخدام المكانز، وتصريف الجمل وإعرابها يمكن الحصول على نظم درس قوية يمكنها فهم عبارات البحث ومعاني الحدثات ضمن السياق بشكل أفضل.

إزالة الالتباس: اختيار المعنى السليم

أوضحنا في النقطة أعلاه كيف من الممكن أن يمكن للمكانز ونظم تصريف وإعراب الجمل حتى تسهم بشكل أفضل في فهم المعنى من خلال السياق. وهذه التقنية مفيدة إذا كنا نبحث ضمن نص معين، ولكنها ليست مفيدة عند إدخال الاستفسارات والاستعلامات ضمن محركات البحث، حيث تتكون هذه عادة من عدد محدود من الحدثات، وبالتالي فإن حجم النص غير كاف لتحليل معنى الحدثات. والحل لهذه المشكلة واضح إلى درجة الإحراج ويتمثل في سؤال المستخدم عن المعنى الذي يقصده؛ فعندما يُدخل المستخدم حدثة "راحة" مثلا ضمن مربع الاستعلام، فإن محرك البحث يسأله عن المعنى المقصود، أوالمعنى المراد البحث عنه، قبل الشروع بعملية البحث. وتوجد اليوم الكثير من محركات البحث التي تستخدم قواميس مضمنة تقوم بتقديم قوائم بالمعاني المتنوعة التي تمثلها الحدثة الواحدة قبل الشروع في عملية البحث. ومن هذه المحركات هناك LexiGuide من شركة LexiQuest، وOingo، وSimplifind على مسقط Simpli.com.

التصنيف التلقائي

هذا الأسلوب هوالأقدم، حيث يتم تصنيف الوثائق حسب تصنيفات وفروع معينة، ومن ثم البحث بشكل منفصل ضمن جميع تصنيف عن المعلومات المطلوبة. فمثلا، عند البحث عن حدثة "نواة" فإن بحثك قد يقودك إلى تصنيف يتعلق بعلوم الزراعة، وأنواع الحبوب، وما إلى ذلك، ولكنه في الوقت نفسه قد يقودك إلى تصنيف يقع ضمن علوم الفيزياء النووية. والحل هنا يكمن في تصنيف الوثائق المتعلقة بأنوية الحبوب والمزروعات في قسم الزراعة مثلا، والوثائق المتعلقة بأنوية الذرات في قسم الفيزياء الذرية. ولكن ماذا لوكانت لدينا وثيقة تتعلق بتأثير التجارب النووية على أنوية الحبوب والمزروعات،يا ترى؟ هل يجب عندها وضع الوثيقة في القسمين، أم ما الحل،يا ترى؟ وهنا تنشأ لدينا معضلة المعنى المزدوج. ومن هنا تأتي أهمية التصنيف التلقائي، حيث يتم استخدام علوم النحومن تصريف وإعراب، واستخدام المكانز والقواميس، بحيث يتمكن النظام من "فهم" المواضيع الرئيسة في وثيقة ما. ويتم ذلك باستخدام أساليب إحصائية تقوم بدراسة تكرار الحدثات ضمن وثيقة ما، ومن ثم تحديد السياق، والذي يساعد في عملية البحث. وكمثال على ذلك لنأخذ حدثة، أواسم مثل "فهد" أو"ليث" وهي أسماء عربية دارجة. ولنفترض أننا خطنا موضوعا في مجلتنا عن إنسان اسمه "فهد"، ولنفترض حتى محرك درس أراد تصنيف منطقنا هذا. في هذه الحال، وإذا كان محرك البحث يستخدم أسلوب التصنيف التلقائي، فإنه سيقوم من خلال دراسة النص ونوعية الحدثات الموجودة فيه وعلاقاتها وتكرارها، بتحديد حتى الموضوع ينتمي إلى تصنيف علوم الحاسوب والانترنت وليس الحيوانات والوحوش البرية. وتتبع برمجيات التصنيف التلقائي قواعد معينة يحددها المبرمجون، أويمكن للآلة نفسها حتى تتفهم ذاتيا كيف من الممكن أن تقوم بتصنيف الحدثات. أويمكن استعمال الأسلوبين، بحيث يتم تصنيف الوثائق التي تتبع نمطا معينا بشكل تلقائي، في حين يتم تحويل تلك التي يستحيل تصنيفها إلى عامل بشري كي يقوم بذلك.

زيادة دقة الاستعلامات

من يستعمل محركات البحث باستمرار يفهم أنه من المحتوم الحصول على مئات الألوف من النتائج على الأقل عند البحث عن موضوع معين بشكل عام. أما عند تضييق نطاق البحث، فإننا نحصل على مقدار أقل من النتائج الأكثر دقة. ولزيادة دقة الاستعلامات، فإن بعض محركات البحث يقوم بتعديل الاستعلام، وذلك بتقديم معان مرادفة لحدثات البحث إلى المستخدم، لمساعدته على تحديد موضوع بحثه بدقة أكبر. ففي مثل هذه النظم، وإذا كان موضوع استعلامك هو"الرياضة" مثلا، فإن النظام يقدم لك عددا من البدائل التي تساعد في تحديد موضوع البحث مثل "التربية البدنية"، "اللياقة البدنية" أو"اللياقة" وغير ذلك من المرادفات التي تساعد على توجيه العملية بحيث يحصل المستخدم على أكبر كم من النتائج الدقيقة التي تعبّر عن موضوع البحث.

ربط المفاهيم

إذا جربت اليوم حتى تبحث عن العبارة "اسطوانات الليزر" (وهي العبارة العامية والقديمة للأقراص المدمجة) فإنك لن تحصل على الكثير من النتائج المفيدة من محركات البحث، حيث حتى تعبير "الأقراص المدمجة" هي الحدثة الشائعة والمستخدمة في الغالبية العظمى من المطبوعات. ولهذا فإن الكثير من محركات البحث هذه الأيام تستخدم أسلوب الربط بين المفاهيم، بحيث أنك إذا قمت بكتابة العبارة "أقراص الليزر" فإنك ستحصل على معلومات عن "الأقراص المدمجة". ويعتمد هذا الأسلوب على تحديد العلاقة بين الحدثات والعبارات في قاعدة البيانات بشكل مسبق، كما أنه مفيد عند البحث في وثائق متعددة اللغات، فالبحث عن حدثة "أقراص الليزر" يمكن حتى يعطي نتائج لوثائق باللغة الإنجليزية عن Compact Disks أوCDs وما إلى ذلك، وهذا أسلوب مفيد جدا في عالم إنترنتي لم تعد فيه اللغة الإنجليزية هي السائدة.

الصورة الحالية

انظر إلى أي مسقط للتجارة الإلكترونية، وستجد أنه غير ذا فائدة تُذكر إذا لم يكن محرك البحث المستخدم به قادرا على نقلك إلى صفحة المنتج، أوالمنتجات، التي تريدها خلال أسرع وقت ممكن. ولذلك نجد حتى بوابات التجارة والأعمال الإلكترونية العالمية مثل Ebay وأمازون تعتبر برمجيات البحث أحد أبرز موجوداتها وتسعى باستمرار إلى تحديثها. وقد قامت شركة Ebay قبل سنوات بشراء نظام درس متقدم من شركة Fast Search & Transfer النرويجية، والتي كانت تنتج تقنية درس جديدة تقوم بتقديم أحدث المعلومات للباحثين عن نتائج المزادات والأسعار المتداولة. كما حتى أمازون ومواقع مثل Marthastewar.com تقوم بالتعامل مع شركة Google وAskJeeves بحيث يتم ربط المستخدمين بالبضائع التي يريدون شرائها من خلال كتابة سؤال اعتيادي ضمن مربع الاستعلام. وتقول الخبيرة مارثا فراي، وهي باحثة في شؤون التجارة الإلكترونية في مجموعة باتريشيا سيبولد، "يمكن القول بأن السبب الرئيس في فشل معظم مواقع التجارة الإلكترونية، يعود إلى اعتمادها لتقنيات درس ضعيفة." كما اكتشفت مؤسسة ميديا ميتريكس للأبحاث بأن 80% من مستخدمي إنترنت، يتوقفون عن استخدام مسقط ما إذا لم تعمل وظيفة البحث المضمنة فيه بالشكل السليم. ومن هنا كان السباق بين عدد من الشركات لتطوير تقنيات درس متقدمة، يمكن للبشر الاعتياديين التعامل معها، والحصول على النتائج التي يريدونها تماما. وسنستعرض فيما يلي عددا من الشركات العالمية التي ابتكرت تقنيات يمكن لها حتى تغير وجه إنترنت إلى الأبد.

ايكساليد Exalead

ايكساليد (Exalead) محرك درس فرنسي متخصص في التقنيات الحديتة للبحث : نوعية نتائج البحث, تصنيف النتائج, صور تمهيدية لكل صفحة.(Exalead)

إنفراسيرتش Infrasearch

تجمع هذه الشركة ما بين تقنيات البحث المتقدمة التي تحدثنا عنها في الصفحات السابقة، وبين تقنيات برمجيات مشاركة الملفات، وهي ما يطلق عليه البعض برمجيات الند إلى الند، أوما يُعهد بالإنجليزية باسم P2P، (انظر منطقنا في هذا العدد والمتعلق بهذا الموضوع). وقد قامت شركة صن مايكروسيستمز العملاقة مؤخرا بشراء هذه الشركة الشابة بمؤسسيها (المراهقين الثلاث) وطاقم عملها الذي يتكون من 15 مبرمجا. وتعد هذه التقنية، إذا ما كُتب لها النجاح في مختبرات صن فإن تقنية إنفراسيرتش تعد بالسيطرة على عالم البحث عبر إنترنت. وتعمل تقنية إنفراسيرتش بالشكل التالي؛ يقوم المستخدم بتنزيل برنامج صغير الحجم على جهازه، ومشاركة مرشد معين، أوعدة أدلة على جهازه، يريد حتى يمكّن المستخدمين الآخرين من البحث فيها. وهذا البرنامج شبيه ببرنامج نابستر، ولكن قدراته لا تقتصر على ملفات MP3 فقط، بل تتعداها لتضم جميع أنواع الملفات، فإذا كنت تبحث عن الحل لمسألة رياضية معينة مثلا، وكان أحد الطلبة قد قام بحل هذه المسألة أوالمعادلة، ووضع الحل ضمن ملف على جهازه، فإنه تقدر عند البحث باستخدام إنفراسيرتش حتى تعثر على هذا الملف وحل المعادلة، إذا كان هذا المستخدم قد اختار مشاركته مع الغير عبر الشبكة. ولا تتوقف قدرات إنفراسيرتش هنا، فإذا كنت ترغب شراء سيارة معينة، فإن برنامج إنفراسيرتش يأخذك إلى مرشد على مسقط الشركة، ومن ثم توجيهك إلى القسم الخاص بالسيارة التي تريدها، والحصول على آخر المعلومات عن هذه السيارة، بما في ذلك صورة لأحدث موديل لها قام أحد المستخدمين بالتقاطها ووضعها على جهازه ليشاركها مع الغير. كما يمكن للوكيل مثلا حتى يشارك ملفا على جهازه يحتوي على عقد البيع وإجراءات الإنضمام وما إلى ذلك. وبما حتى برنامج إنفراسيرتش مجاني، فقد كان المخطط الأصلي للشركة هوجعل المؤسسات التجارية، التي تتخذ استخدام البرنامج في عملياتها، تقوم بدفع لقاء مادي سهل جدا لقاء جميع عملية درس تقوم أجهزة إنفراسيرتش المزودة بتوجيهها إلى المؤسسة التجارية. وهذا يعني حتى عوائد الشركة تعتمد على عدد الأشخاص الذين يقومون بالبحث في شبكتها. وإضافة إلى ذلك، فإن إنفراسيرتش كانت تخطط للتعاون مع محركات البحث الشائعة الاستخدام، وذلك لجعل نتائج بحثها "طازجة" وحديثة بأكبر قدر ممكن، حيث حتى نتائج البحث التي نحصل عليها عادة من هذه المحركات تعتمد على مدى نشاط الروبوتات التي تقوم بفهرسة مواقع إنترنت، وهي عادة متأخرة حوالي 24 ساعة عما نُشر على الشبكة. أما باستخدام تقنية إنفراسيرتش فإن النتائج تكون طازجة بالدقيقة والثانية. وكما قلنا أعلاه، فإن إنفراسيرتش الآن ملك لصن مايكروسيتمز، ونرجوحتى نرى منتجها عما قريب على إنترنت.

غوغل

بدأ محرك البحث هذا Google.com كمشروع لرسالة دكتوراة حول تقنيات الذكاء الاصطناعي والمعالجة الطبيعية للغة في جامعة ستانفورد في الولايات المتحدة، وتحول اليوم إلى بوابة إنترنت عالمية كبرى تخدم البحث بـ 66 لغة (منها العربية)، تقوم بمعالجة 120 مليون طلب درس يوميا (حسب إحصائيات مؤسسة ميديا ميهجرس للأبحاث)، كما حتى المسقط أصبح مؤخرا ضمن أكبر 15 مسقطا في الولايات المتحدة. ولا يتوقف الأمر هنا، حيث حتى عوائده تصل إلى 50 مليون دولار سنويا، ويتسقط البعض حتى يصل حجم هذه العوائد في المستقبل القريب إلى مليار دولار أمريكي حسب مجلة أعمال ويك الأمريكية . والمستخدم لهذا المسقط يعهد تمام الفهم مدى دقته في تقديم النتائج المطلوبة، ومن المرة الأولى، كما أنه لا يحتاج خبرة كبرى من المستخدم في صياغة الأسئلة والاستعلامات. ويعتمد هذا المسقط تقنيات إحصائية ورياضية متقدمة تقوم بدراسة الوثائق المفهرسة، وتكرار الحدثات ضمن جميع وثيقة، وبالتالي الحكم على موضوعها وعلاقتها بعبارة البحث التي يقوم المستخدم باستعمالها. ومهما كانت الوصفة السحرية التي يستخدمها مسقط غوغل فإنه يعتبر الأفضل بين كافة مواقع البحث المستخدمة اليوم.

آسك جيفز AskJeeves

مسقط AskJeeves.com يستخدم اللغة الطبيعية في البحث ويعتمد قاعدة بيانات وتقنيات تمكّن المستخدم من توجيه سؤال البحث "باللغة الإنجليزية" بلغة سهلة(وعامية أيضاً) لتقوم قاعدة البيانات بالمطابقة بين الحدثات المفتاحية في السؤال، وبين ما موجود في قاعدة بياناتها. ورغم ذلك فإن جيفز يعتمد جزئيا على التدخل البشري لتصنيف المعلومات وفهرستها إذا لم تكن موجودة في قاعدة البيانات. فعند حصول وقع إخباري ما مثلا، فإن جيفز لن يتمكن من التعامل مع أي سؤال يتعلق بهذا الحدث إلا إذا قام مدراء قواعد البيانات بتحديث النظام. وقد قامت الشركة المسئولة عن المسقط بطرح نظام مستقل، يمكن للمؤسسات العاملة في مجالات التجارة والأعمال الإلكترونية تضمينه في مواقعها بحيث يمكن لعملائها توجيه أسئلة واستفسارات باللغة الطبيعية، والحصول على أجوبة لها دون أي تدخل بشري.

أوبن كولا OpenCola

نعود هنا إلى شركة أخرى تستخدم تقنيات مشاركة الملفات، والمعالجة الطبيعية للغة، إضافة إلى أسلوب المجتمعات الخبيرة Expert Communities، لخدمة عملية البحث. وتنتج هذه الشركة برنامجا صغيرا مجانيا يقوم المستخدم بتنزيله وتثبيته على جهازه، ومن ثم يمكن له سحب وإسقاط ملف ما (سواء نص، أوموسيقى، أوصورة، أوأي نسق كان) ضمن هذا البرنامج، والذي يقوم بالبحث ضمن أجهزة كمبيوتر أخرى مشاركة في الشبكة، عن ملفات مشابهة. فإذا كنتم مثلي، من هواة جمع اللوحات الإلكترونية للمدرسة الانطباعية أوالتكعيبية، وكانت لديكم صورة تمثل إحدى هذه المدارس الفنية، فيمكن وضع هذه الصورة ضمن البرنامج، والذي يبحث بعدها في أجهزة الحاسوب المشاركة ضمن الشبكة ليحصل على ملفات مماثلة. وماذا عن فكرة المجتمعات الخبيرة،يا ترى؟ تهدف أوبن كولا إلى تشجيع المشاركين في شبكتها على مشاركة أجهزتهم مع أشخاص يشابهونهم في الاهتمامات، فإذا كان لدي مجلد على جهازي يحتوي على لوحات إلكترونية للمدرسة التكعيبية مثلا، فإنني أقوم بمشاركتها ضمن مسقط أوبن كولا وضمن تصنيف خاص بهذه النوعية من اللوحات. كما حتى أوبن كولا تستخدم روبوتات موزعة، أوعناصر آلية، تعتمد أسلوب البحث في العناصر البرمجية. ويمكن للمستخدمين تحسين دقة النتائج التي يحصلون عليها بتدريب هذه الروبوتات الباحثة، والتي تتفهم من خلال التجربة.

أوتونومي Autonomy

تعتمد البرمجيات التي تستخدمها هذه الشركة Autonomy.com على تقنية المطابقة ما بين أنساق النص وتكرار العبارات والحدثات، وذلك لتحديد المفاهيم الرئيسية المميِّزة لوثيقة ما، وتشفيرها ضمن هذه الوثيقة، ومن ثم البحث عن وثائق تحتوي على مفاهيم مماثلة في نصوص أخرى. وباستخدام هذا الأسلوب يمكن للباحث حتى يقوم بكتابة جمل تصف ما يبحث عنه بلغة سهلة، والبحث على هذا الأساس. كما حتى محرك درس أوتونومي يمكنه حتى يتعلّم ما يريده المستخدم، بناء على نوعية المواد التي يقرأها أويستعرضها هذا المستخدم.

بريموس Primus

هجرز برمجيات البحث الخاصة بهذه الشركة على المواد التي تتعامل مع خدمة الزبائن، أوالمواد الموجودة ضمن نماذج إلكترونية، وهي على هذا الأساس مكملة لما تقوم به شركة أوتونومي. وتسمح هذه البرمجيات للمستخدمين بأن يقوموا بتوجيه أسئلة إلى قاعدة البيانات باستخدام اللغة الطبيعية. ويقوم النظام بجمع نتائج البحث، وتقديمها للمستخدمين الذين يقومون بطرح أسئلة مشابهة.

المستقبل

يوجد على إنترنت اليوم بلايين الصفحات، وحسب المصادر المتوفرة فإنه قد تم حتى اليوم فهرسة ما يزيد قليلا على البليون صفحة. وتتسابق الشركات التي تقوم بفهرسة هذه الصفحات في إتاحتها لمستخدمي إنترنت، والحفاظ على سرعة الاستجابة التي يحصل عليها المستخدم. وإضافة إلى السرعة فإن على قواعد البيانات هذه حتى تثبت وجودها بتقديم أجوبة "طازجة"، ومتناسقة، وذات علاقة بما يبحث عنه المستخدم. كما حتى عجلة الابتكار لا تتوقف في مجال البحث، فمسقط www.hotlinks.com يتيح للمستخدمين إمكانية حفظ مفضلاتهم Favorites ضمن مرشد على إنترنت، وذلك كي تكون هذه المفضلات متاحة للمستخدم أينما كان، ويمكن للمستخدمين حتى يختاروا مشاركة مفضلاتهم مع مستخدمي إنترنت الآخرين، وتمكين زائري المسقط من البحث على إنترنت من خلال البحث في مفضلات الآخرين، وبالتالي الحصول على معلومات رأى مستخدمون آخرون أنها مفيدة لدرجة وضع المواقع التي تحتويها ضمن مفضلاتهم. كما حتى هناك مواقع للبحث مثل www.expertcentral.com والتي تقدم للباحثين إجابات متخصصة. وإضافة إلى ذلك فهناك الكثير من محركات البحث التي تعتمد تقنيات الشبكات العصبية Neural Networks، ومحركات البحث التي يمكن تثبيتها على أجهزة المستخدمين، وفهرسة محتويات أقراصهم الصلبة. ونظرا للأهمية المتواصلة لمحركات البحث، فإن التقنيات الجديدة ستواصل ظهورها، وستواصل التقنية تطورها لتقديم نتائج أفضل للمستخدمين. وبظهور هذه التقنيات فإن بعضها سيفشل وبعضها سينجح، وستصبح التقنيات الناجحة جزءا من محركات البحث المستخدمة اليوم.

تطبيقات مستقبلية

إذا لم تكن ترغب إنفاق الملايين في ابتكار تقنيات للذكاء الاصطناعي والمعالجة الطبيعية للغة، فإن الحل الأسهل هواستخدام الميزات التي تقدمها لغة XML لجعل عملية البحث أكثر دقة. فهذه اللغة كما هومعروف تعتمد على توصيف الوثائق والبيانات عند نشرها على الشبكة. فالمادة المتعلقة بالأسعار مثلا يتم توصيفها بعلامات تدل على أنها تمثل الثمن، والمادة التي تصف أبعاد بضاعة معينة يتم توصيفها بهذا الشكل. وباستخدام XML يمكن للروبوتات التي تقوم بفهرسة مواقع إنترنت حتى تفهم المحتوى الموجود ضمن الصفحات. وبالتالي فعندما تبحث عن تذكرة سفر بثمن معين مثلا، فإن الروبوتات لا تقوم فقط بالعثور على التذكرة بأفضل الأسعار، ولكنها تعثر أيضا على أفضل ثمن لغرفة فندق، أوسيارة مستأجرة. ومن التطبيقات الأخرى مثلا هي أنك إذا عرضت سيرتك الذاتية على الروبوت فإنه يقترح عليك أفضل وظيفة تناسب مؤهلاتك. أوإذا عرضت على الروبوت ملفك الصحي فإنه يقترح عليك الفيتامينات التي يجب عليك تناولها، أوالنوادي الصحية التي تقدر الانضمام إليها. وبالطبع فإننا لا نعتقد حتى XML هي الحل السحري، ولكنها يمكن حتى تؤدي إلى زيادة نجاعة عمليات البحث إذا ما اقترنت بالتقنيات الأخرى المذكورة في موضوعنا هذا.

روابط داخلية

  • استبعاد الحدثات الشائعة

ارتباطات خارجية

  • محرك البحث ولفرام ألفا
  • محرك البحث جوجل
  • اشهار المواقع على محركات البحث العربية والعالمية
  • إعلن عن شركة - مصنع - مؤسسة - منتج - خدمة - عروض مجاناً
  • ابحث في جووجل بلغات متعددة
  • ابحث في اربوغل محرك درس عربي
  • للبحث في الإنترنت العربية
  • أين محرك درس عربي للبحث في الإنترنت العربية
  • أعلى محرك البحث
  • للبحث في الإنترنت العربية
  • اشهار المواقع على محركات البحث
تاريخ النشر: 2020-06-04 06:49:57
التصنيفات: مقالات ذات عبارات بحاجة لمصادر, حوسبة, إنترنت, محرك بحث

مقالات أخرى من الموسوعة

سحابة الكلمات المفتاحية، مما يبحث عنه الزوار في كشاف:

آخر الأخبار حول العالم

خمس قرارات لوزير الأوقاف تنقل الوزارة للعالمية 

المصدر: بوابة أخبار اليوم - مصر التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:49
مستوى الصحة: 49% الأهمية: 52%

الاستخبارات الأمريكية تتنبأ بخطوة بوتين القادمة

المصدر: RT Arabic - روسيا التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:16:38
مستوى الصحة: 95% الأهمية: 99%

برشلونة يهزم سلتا ويتمسك بالمركز الثاني

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:17
مستوى الصحة: 90% الأهمية: 92%

العامري فاروق يطمئن على ترتيبات إقامة بعثة الأهلي في الجزائر

المصدر: الأهلى . كوم - مصر التصنيف: رياضة
تاريخ الخبر: 2022-05-11 00:17:38
مستوى الصحة: 35% الأهمية: 43%

محافظ القاهرة يتابع تطبيق المواعيد الصيفية لغلق المحال 

المصدر: بوابة أخبار اليوم - مصر التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:50
مستوى الصحة: 57% الأهمية: 69%

ليبيا...باشاغا يعلن إعادة فتح النفط

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:02
مستوى الصحة: 93% الأهمية: 95%

وزير الأوقاف: إنشاء رابطة ومنصة لخريجي أكاديمية الأوقاف الدولية 

المصدر: بوابة أخبار اليوم - مصر التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:51
مستوى الصحة: 58% الأهمية: 60%

اتحاد الكرة يخاطب كاف لرفض «نهائي المغرب».. ويؤكد: جاهزون للتصعيد

المصدر: الأهلى . كوم - مصر التصنيف: رياضة
تاريخ الخبر: 2022-05-11 00:17:44
مستوى الصحة: 31% الأهمية: 40%

الخطيب يدعو مجلس الإدارة وشركة الكرة لاجتماع طارئ بعد قرار الكاف

المصدر: الأهلى . كوم - مصر التصنيف: رياضة
تاريخ الخبر: 2022-05-11 00:17:42
مستوى الصحة: 33% الأهمية: 46%

لافروف بالجزائر.. وهذا فحوى الزيارة

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:17:03
مستوى الصحة: 82% الأهمية: 97%

السيسي: نريد عقد زواج يحل مسألة الطلاق

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:16:49
مستوى الصحة: 82% الأهمية: 92%

واشنطن تعلن عن مساعدات إنسانية لسوريا بنحو 800 مليون دولار

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:16:52
مستوى الصحة: 88% الأهمية: 87%

الجيش اليمني: 89 خرقاً حوثياً للهدنة في يوم 

المصدر: العربية - السعودية التصنيف: سياسة
تاريخ الخبر: 2022-05-11 00:16:39
مستوى الصحة: 92% الأهمية: 85%

تحميل تطبيق المنصة العربية