نظم التعرف على الصوت

عودة للموسوعة

نظم التعهد على الصوت

نظم التعهد على الصوت.. لتصفح الإنترنت الجوال

تزداد إتقانا وتنوعا


خدمة گوگل للتعهد على الصوت

الإنترنت يقدم الكثير من الفوائد للأشخاص الذين يتصفحونه عن طريق جهاز الحاسوب. إلا حتى البحث عن الكنوز المختفية في الفضاء المعلوماتي باستخدام لوحات مفاتيح الهواتف الجوالة، أوتلك التي تعمل باللمس، هوأمر في غاية التحدي. وهنا يأتي دور الصوت وتقنيات التعهد عليه، في تسهيل البحث على الشبكة بالأجهزة الجوالة. وكنت أقوم باختبار الخدمات المقدمة من «غوغل» و«ياهو» والخدمات الجديدة التي ظهرت أخيرا، مثل «تشاتشا» ChaCha و«فلينغو» Vlingo التي تسمح جميعها بالبحث عن المعلومات بمجرد طرح السؤال بصوت عال.


أسئلة وإجابات

  • وقد تتساءل ما إذا كانت رحلتك الجوية ستقلع في موعدها المحدد،يا ترى؟ وماذا سيكون عليه الطقس لدى وصولك إلى وجهتك،يا ترى؟ أوترغب فهم المكان الذي ستتناول فيه عشاءك، أوأقرب مقهى إلى فندقك،يا ترى؟ أوما هي أكثر السيارات أمنا على الطرقات،يا ترى؟ أوما الصفر المطلق ؟

لقد قدمت هذه الأسئلة مع غيرها لاختبار هذه الخدمات. واتىت الأجوبة بأساليب مختلفة، فمع «غوغل» هناك وصلات ربط تقودك إلى صفحات على الانترنت. ومع «تشاتشا» التي هي المفضلة لدي، فإنها تعتمد على البشر لتوفير الإجابات، إذ يقوم مرشد من أدلاء الشركة بتصفح الشبكة نيابة عنك لإرسال الأجوبة نصيا إليك خلال دقائق قليلة.

والبحث الجوال عن طريق الصوت عبر الأجهزة الجوالة ليس بالأمر الجديد، لكنه أخذ يتطور بسرعة، وفي بعض الحالات فإنه يستغل المعلومات الخاصة بالمسقط ذاته. وفي حالات أخرى يمكن دمج البحث بواسطة الصوت مع القدرات الأخرى، من الممكن عن طريق طلب بعض الخرائط.


أما البحث بواسطة الصوت في «غوغل» فقد وصل لتوه إلى هاتف «تي-موبايل أندرويد جي 1» كجزء من طرح مجموعة من البرمجيات الرئيسية الجديدة. وهنالك نسخة منها سلفا في هاتف «آي فون». وقبل أسبوعين قامت «ياهو» بتوسيع خدمات بحثها «وان سيرتش» عن طريق الصوت، زيادة على المميزات الأخرى التي تتصف بها بعض هواتف «نوكيا» و«بلاك بيريز»، وذلك عن طريق إضافة هذه الميزة الجديدة إلى بعض هواتف «ويندوز» الجوالة. وفي الواقع تعمل بعض عمليات البحث بالصوت فقط على بعض الأجهزة المحددة، في حين تعمل «تشاتشا» على أغلبيتها.

ولا تخلوجميع الخدمات من الأخطاء، ونصف المعركة تنحصر في التعهد على السؤال، خاصة في ما يتعلق بنبرة الصوت، أواللهجة، أوالضجيج الذي يحيط بالمكان، أوفي ما يتعلق بالتغطية الجوالة ذاتها. وهذه جميعها لها تأثيرها وسقطها الكبير. وغالبا ماقد يكون القصر والإيجاز كافيا. إذ يكفي حتى تقول «الطقس، أسبن» (مدينة في أميركا)، أو«الخطوط الجوية الأميركية الرحلة 972» لتحصل على النشرة الجوية، أوالمستجدات الخاصة بهذه الرحلة.


خدمات متنوعة

  • وعلى افتراض حتى السؤال كان مفهوما، فإنك تتسقط إجابات، أونتائج مفيدة وسريعة وذات معنى. لكن تجربتي كانت بين بين، وإليكم التفاصيل:

في ما يتعلق بخدمة «تشاتشا» التي يفضلها الجميع فقد يحلولك حتى تسأل أي شيء، وغالبا ما تحصل على الجواب السليم. ما الذي يملك ثمنات حرارية أكثر، البازلاء أوالجزر،يا ترى؟ (الجواب البازلاء). إلى غير ذلك يمكن حتى تتصل بـ«تشاتشا» من أي هاتف جوال قادر على إرسال الرسائل النصية. واستخدمت لهذه الغاية هاتف «جي 1» و«آي فون». وهناك حد أقصى لا ينبغي تجاوزه، وهو20 اتصالا استفهاميا في الشهر. و«تشاتشا» هي خدمة مجانية على الرغم من حتى رسوم الرسائل النصية العادية تكون مطبقة. وتتضمن الأجوبة النصية بعض الإعلانات. وقد تنتظر نحوخمس دقائق لتحصل على الجواب، وإن كانت فترة الدقيقتين هي الغالبة. ومع وجود الأدلة من البشر الذين يربوعددهم على الـ55 ألفا،قد يكون احتمال فهم سؤالك واستيعابه أكثر احتمالا. وعلى الرغم من حتى نظام التعهد على الأصوات في «تشاتشا» تصور أنني أسأل عن الإنضمامات والنقاط الأخيرة للاعب البيسبول يوغي بيرز، إلا أنه رد علي بالتسجيلات والنقاط التي سجلها اللاعب بيرا وليس بيرز. إلى غير ذلك دواليك. فإن سألنا عن موعد آخر قطار من نيويورك إلى واشنطن، فقد يأتيك الجواب بين نيويورك وورثينغتون، بدلا من واشنطن. فالبشر يخطئون أيضا. وقد يحصل أحيانا حتى يأتيك نص يطلب منك توضيحات أكثر لسؤالك، أوإضافة المزيد من التفاصيل عليه لتبديد بعض الغموض. أما ما يخص خدمة «غوغل» فقد اختبرت البحث بالصوت على هاتف «آي فون» و«جي 1». وفي الأخير يمكن النقر على أيقونة ميكروفون صغيرة، وبالتالي الشروع بالكلام. أما في «آي فون» فيكفي فقط تقريب الهاتف من أذنك وانتظار إشارة صوتية خافتة، قبل الشروع بالكلام. وبكلتا الطريقتين لا يتوجب عليك النقر، أوالقيام بأي شيء خاص لدى التوقف عن الكلام. وفي غالبية الأوقات قدمت «غوغل» نتائج ذات معنى لدى سماعها السؤال بشكل سليم. ولكن في كلا الجهازين كان التعهد على الأصوات ضعيفا، فقد خلط بين الألفاظ القريبة من بعضها البعض لتأتي الأجوبة متباينة طبعا. وعلى صعيد خدمة «فلينغو» فقد اختبرت تطبيقا مجانيا لها على هاتف «آي فون». إذ يتوجب البدء بالنقر على زر للشروع بالكلام، والنقر عليه ثانية لدى الانتهاء منه. وتستخدم «فلينغو» و«غوغل» أو«ياهو» كمحرك درس وفقا للذي تفضله. وهي تقوم بأكثر من عمليات البحث، إذ يمكن استخدامها لتعديل ما يخصك على «فيس بوك»، أو«تويتر» عن طريق الصوت. والجزء المتعلق منه بالتعهد على الأصوات كان جيدا، لكنه تعهد على «الرئيس الـ32 للولايات المتحدة» تعهد عليه على أنه «رئيس للولايات المتحدة لمدة 30 ثانية». غير أنه من حسن الحظ فإن خدمة «فلينغو» أدركت محدودياتها، إذ كان لي الخيار لكي أطبع «هل تقصد الرئيس الـ32 للولايات المتحدة؟». وفي ما يخص خدمة «ياهو» «وان سيرتش»، فإن «فلينغو» توفر لها التقنية الأساسية، مع تقنية التعهد على الأصوات. وكان علي في هاتف «بيرل» الكبس على زر والاستمرار بذلك على هذه الحالة طوال الوقت الذي كنت أملي فيه السؤال. بيد حتى تقنية التعهد على الصوت كانت جيدة هنا، وتقوم «ياهو» بعمل جيد في تقديم الأجوبة في فئات ومجموعات متقاربة. وفي ما يتعلق بسؤالي عن أفضل سيارة على صعيد الأمان قادتني وصلات الربط إلى «ويكيبيديا»، التي أشارت الأخيرة علي بسيارة من طراز «فولفو». وتقدم «ياهو» مع أجوبتها التي يعدها الأشخاص، أسماء المواقع والصور والآراء والتعليقات أيضا. لكن سؤالي المتعلق بالطقس في أسبن اتى بردود لمواقع لا معنى لها، على الرغم من نيتي الحصول فقط على نشرة جوية سريعة في تلك المدينة. وخلافا لـ«فلينغو» فلم تقدم «وان سيرتش» بديلا لجوابها الذي ارتكبت فيه الخطأ ذاته المتعلق برئيس الولايات المتحدة.

المصادر

  • National Institute of Standards and Technology
  • Elisabeth Zetterholm, Voice Imitation. A Phonetic Study of Perceptual Illusions and Acoustic Success. Phd thesis, Lund University. (2003)


المراجع

الروابط الخارجية

  • SpokenProof.com is dedicated to Voice Biometrics and contains extensive technical coverage
  • Speaker Identification and Verification
  • Free Voice analyzer and Biometrics voice print displaying software from University College London
  • Circumventing Voice Authentication The PLA Radio podcast recently featured a simple way to fool rudimentary voice authentication systems.
  • Fundamentals of Speaker Recognition

  • خدمة «يوإس أيه توداي»
تاريخ النشر: 2020-06-08 21:51:35
التصنيفات: Speaker recognition, Voice technology, Automatic identification and data capture, Biometrics

مقالات أخرى من الموسوعة

سحابة الكلمات المفتاحية، مما يبحث عنه الزوار في كشاف:

آخر الأخبار حول العالم

مجلس الحكومة يصادق على مقترحات تعيين في مناصب عليا

المصدر: موقع الدار - المغرب التصنيف: مجتمع
تاريخ الخبر: 2023-06-08 18:25:56
مستوى الصحة: 60% الأهمية: 61%

المديرية العامة للضرائب تحدد آخر أجل لأداء الرسم المهني

المصدر: أخبارنا المغربية - المغرب التصنيف: سياسة
تاريخ الخبر: 2023-06-08 18:23:39
مستوى الصحة: 70% الأهمية: 79%

مجلس الحكومة يصادق على مشروع مرسوم يتعلق بحقوق المؤلف

المصدر: موقع الدار - المغرب التصنيف: مجتمع
تاريخ الخبر: 2023-06-08 18:25:53
مستوى الصحة: 47% الأهمية: 64%

وصول الفوج الأول من حجاج إيطاليا إلى المدينة السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-06-08 18:24:14
مستوى الصحة: 54% الأهمية: 50%

أطباء السودان يناشدون العالم إنقاذ إقليم دارفور - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-06-08 18:24:07
مستوى الصحة: 57% الأهمية: 69%

إنقاذ فتاة من تشوه في العمود الفقري بمدينة الملك فهد الطبية السعودية

المصدر: جريدة الوطن - السعودية التصنيف: إقتصاد
تاريخ الخبر: 2023-06-08 18:24:13
مستوى الصحة: 49% الأهمية: 53%

مقتل وإصابة 43 أفغانياً في هجوم إرهابي بمسجد - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-06-08 18:24:08
مستوى الصحة: 48% الأهمية: 63%

تحميل تطبيق المنصة العربية