تحويل صفة صورة غير مرتبط بمقياس
تحويل صفة صورة غير مرتبط بمقياس أوScale-invariant feature transform, SIFT هي خوارزمية في مجال الرؤية الحاسوبية طورها البروفيسور الكندي ديفيد لوفي عام 1999. وتعتبر من أبرز الخوارزميات المستخدمة لأغراض التعهد على الاجسام والبحث عن الصور ضمن خدمة الجوجل. كما تستعمل لربط مجموعة من الصور المتداخلة لتكوين صورة بانوراما من خلال تحديد نقاط في الصور المراد مقارنتها. جميع نقطة توصف بشعاع مؤلف من 128 مركبة, ويتم حساب التشابه بين نقطتين بواسطة المسافة الاقليدية بين شعاعيهما. تتسم هذه الميزات بانها غير مرتبطة بالتحويلات الهندسية Geometry Transformations للصورة كالدوران Rotation والتدرج Scaling ( التصغير والتكبير) والتي تنجم عن دوران آلة التصوير أوتغير نقطة التقاط الصورة viewpoint, كما أنها غير مرتبطة بشكل جزئي بالتحويلات الضوئية Photogrammetry Transformations كتغير التمايز Contrast أوالسطوع Brightness والتي تنجم على سبيل المثال بسبب عمل آلة التصوير في اوقات مختلفة (ليل أونهار) أوتحت طقس مختلف ( غائم أومشمس وغير ذلك).
الخوارزمية
تتألف الخوارزمية من أربع مراحل رئيسية
اكتشاف النقاط المميزة في الصورة Keypoints والتي ستشكل المراكز للصفات المرشحة
يتم تحويل الصورة المراد معالجتها الي صورة اسود وأبيض فيما إذا كانت ملونة ثم يتم تمثيلها بارقام حقيقية بحيث تصبح قيم البكسل محصورة ضمن المجال (0-1) بدلا من المجال (0-255) لكي يمكن ترشيحها بواسطة مرشح غاوص. تطوى الصورة الناتجة مع مرشح غاوص بشكل متكرر أربع مرات على الأقل لكي تكون مجموعة من الصور لها ذات الابعاد تدعى الاوكتاف الأول. ثم تصغر الصورة الأخيرة بمعامل 2 عن طريق حذف جميع ثاني سطر وجميع ثاني عمود ثم تطوى هذه الصورة المصغرة مع مرشح غاوص بنفس العدد في المرة الأولى بحيث نحصل على الاوكتاف الثاني وهكذا يكرر التصغير والطي حتى تبلغ ابعاد الصورة حدا معينا لم تعد معه تضهر أي تفاصيل واضحة مهمة. حالما تنتهي هذة العملية نحصل على ما يدعي الهرم الغاوصي Gaussian Pyramid الذي يمكن تمثيله رياضيا بدالة ثلاثية المتحولات يرمز له بـ , حيث تشير جميع من x , y الي إحداثيات النقطة في الصورة اما فهي الانحراف المعياري لمرشح غوص والذي يتغير من صورة إلى صورة ضمن الهرم بسبب الطي المتكرر. لتفسير ذلك نفترض انه لدينا صورة نريد ترشيحهاباستخدام مرشح غاوص ذوانحراف معياري نحصل على صورة جديدة مرشحة كما هومشروح في العلاقة التالية وإذا تكرر الترشيح بنفس المرشح نحصل على صورة ثالثة ومن المعلوم ان وبالتعويض في العلاقة التي قبلها نجد الأمر الذي يفسر تغير الانحراف المعياري بسبب الطي التكرر. انطلاقا من الهرم الغاوصي ومن خلال طرح جميع صورتين متجاورتين من جميع اوكتاف نحصل على ما يدعى هرم الفرق الغاوصي Difference of Gaussian Pyramid DoG. الذي يرمز له بـ حيث يشير الرمز على تغير الانحراف المعياري من صورة لأخرى بسبب الطي المتكرر. انطلاقا من هرم الفرق الغاوصي يتم تحديد مواقع البكسلات ذات القيم المتطرفة ( العظمى والصغرى) عن طريق مقارنة قيمتها مع قيم جيرانها الثمانية في نفس الصورة وقيم جيرانها التسعة الموجودة في الصورة التي من فوقها والتسعة التي من تحتها ضمن جميع اوكتاف, إذا كانت أكبر أواصغر من جميع الـ 26 بكسل المحيطة بها يتم تعليم هذه النقطة كمركز لصفة محتملة.
ايجاد المواقع الدقيقة للصفات وحذف النقاط غير المستقرة
حساب اتجاه محلي لكل نقطة متبقية من الفترة السابقة
توصيف النقطة بشعاع مؤلف من 128 مركبة من خلال المنطقة الدائرية المحيطة بها
مراجع خارجية
- Improved SIFT-Features Matching for Object Recognition
- Demo Software: SIFT Keypoint Detector