الترميز المعنوي للغة العربية
الإنجليزية مشروع الترميز المعنوي والاشتقاقي للغة العربية
هذه المعلومات عرضة للتبدل بشكل دائم خلال سير المشروع وأي مقترحات أومساهمات هي محل ترحيب كبير
حوار حول الترميز
حاليا هناك محادثة حول المخطط الجديد والقراءة الصوتية لمشروع الترميز في منتدى الجمعية الدولية للمترجمين واللغويين العرب
يمكن تحميل عرض تام بالمشروع مستند المخط المفتوح
نظرة أولية
ما يزال تعامل الحاسب مع اللغة العربية قاصرا مقارنة باللغات الأخرى خصوصا الإنكليزية سواء على مستوى النص من حيث الشكل والتخزين ومشاكل الترميز والمعالجة أومن ناحية التعامل مع المعنى الذي يتضمنه النص وبما حتى العربية بخلاف اللغات الأوربية لغة اشتقاقية أي حتى هناك نظاما صارما يربط بناء الحدثات العربية بالعلاقات المعنوية والمنطقية لهذه الحدثات
فإن هذا يبرر السعي إلى آلية مختلفة تستفيد من بنية العربية الاشتقاقية وتسد الحاجات الملحة إلى معالجةنقص التشكيل والمعنى للغة العربية
أهداف المشروع
يهدف مشروع الترميز المعنوي للعربية إلى وضع آلية لتخزين النصوص (الحدثات) العربية متضمنة بناءها وعلاقاتها الاشتقاقية بالشكل الذي يعكس أكبر ما يمكن من ترابط المعاني
- للتطور ليتضمن المعنى وبناء الجملة
- توليد معجم اشتقاقي عربي غير جدوليقد يكون أساسا لمعجم عربي شامل
- سهولة البحث والتصنيف سواء على مستوى الاشتقاق أوعلى المستوى المعنوي
- إمكانية ربط الترميز مع آلية عكسية تشكل مدققا إملائيا ثم نحويا وهوأول منتج حقيقي يجب حتى نسعى لتطويره بحيث يشكل مدققا إملائيا تفاعليا ... وتسهيلا للكتابة بالفصحى .. وقاموسا فعالا للمفردات والمصطلحات
- أن يمثل المشروع العلاقات البنيوية داخل اللغة العربية بحيث يصبح أساسا لإكمال الدراسات العلائقية والصوتية العربية بناءا على التوليد الآلي والتشابه مع العلاقات الرقمية
- أن يتمكن النظام من تسهيل التعامل مع الفصحى وكتابتها بدقة وزيادة شيوعها وتخزين النصوص معضلة نقص التشكيل ((حاليا أقل من 1% من النصوص العربية مشكلة)) ثم إيجاد آلية لنقل النصوص العربية إلى البناء المشكل والمترابط
- تمييز الحدثات غير العربية ((غير المشتقة من أصل أوأنها لا تخضع لنظام التعريب )) ووضعها من خلال إطار يجب حتى يوجد وهوحدثة مستعربة أوغير عربية وهي جزء لا يتجزأ من بنية الترميز وأما بالنسبة للمثالين ولا يكتمل نظام ترميز ما لم يتم تقعيد هذه الأمور وليس هناك دراسات يمكن تقعيدها منطقيا بهذا الشأن حيث يصعب الاستفادة من درس الأستاذ حسن عباس ومهمتنا التعاون لتحويل أمثال هذه الدراسات إلى بناء منطقي
- وضع نظام لتضمين موجهات داخل الترميز بحيث يستخدم لاحقا لحمل آليات مماثلة لـ XML or SQL أوأي أنظمة توجيه آلية أخرى RDF
الفكرة الحالية للمشروع
تقوم فكرة المشروع حاليا كما أراها على تجاوز التعامل مع النص العربي كسلسلة محارف الترميز الحرفي والتعامل مع الحدثة ككل ترميز الحدثة وفق آلية تصنيفية تتابعية تشبه بناء تعليمة المعالج مع محاولة الحفاظ على ثبات طول الرمز وسهولة التعامل معه من خلال لغات البرمجة العليا
سير المشروع
أنجزنا حاليا تصورا أوليا للمشروع ووضعنا مخططا مبدئيا للترميز كما وضع الأخ خلدون سنجاب برنامجا بسيطا لتوضيح أبسط فكرة ترميز
نحن حاليا بحاجة لقراءة واضحة لخصائص النطق الإنساني خصوصا الحروف العربية لتضمين الترميز قيودا رقمية تعكس القيود الصوتية سواء الإنسانية أوالتي تخص العربية من حيث تتالي حروف أواجتماعها مما سيساهم في تخفيض الفضاء الكلي للترميز الذي تجب دراسته
كما أننا بحاجة إلى جدولة للحدثات الدخيلة والشاذة في العربية وقواعد الشذوذ ويبدوبأن جمعية المترجمين العرب في طريقها لإنجاز ذلك
كما نحتاج لحصر جدولي لأوزان المشتقات وآليات تصنيفها وارتباطاتها
وفي فترة متقدمة نحتاج إلى حصر لمتممات الحدثة من ضمائر متصلة أوحتى منفصلة وأحرف جر ....
حامد السحلي
-- hamed suhli
http://sourceforge.net/projects/tarmeez