يونيكود
في فهم الحاسوب، يونيكود هومعيار يُمكّن الحواسيب من تمثيل ومعالجة النصوص المكتوبة بأغلب نظم الكتابة في العالم، بصورة متناسقة. يتكون يونيكود من 100,000 محرف، وطقم من مخططات الرموز كمرجع مرئي، ونهج في الترميز، وطقم من ترميزات المحارف المعيارية، وسرد لخصائص المحارف، وطقم من البيانات المرجعية، وعدد من الأمور المتعلقة مثل خصائص المحارف، وقواعد تطبيع النص، وفك الحروف لوحداتها الأولية، والترتيب، والتصيير، وثنائية الاتجاه (لعرض النصوص الذي يحتوي على كتابات من اليمين لليسار، مثل العربية، مع كتابات من اليسار لليمين، مثل اللاتينية). يطوّر يونيكود بالتوازي مع معيار طقم المحارف العالمي، وينشر على شكل كتاب يحمل الاسم معيار يونيكود (The Unicode Standard).
يطمح مجمع يونيكود -المنظمة غير الربحية التي تنسق تطوير يونيكود- في النهاية إلى استبدال ترميزات المحارف الموجودة حاليا، ليحل محلها يونيكود وتنسيق يونيكود المعياري للتحويل (Unicode Transformation Format ،UTF)، حيث حتى الكثير من الترميزات الحالية محدودة السعة والمدى ولا تتوافق مع البيئات متعددة اللغات.
أدى نجاح يونيكود في توحيد أطقم المحارف إلى انتشار وغلبة استخدامه في عولمة وتوطين برمجيات الحاسوب. وجرى تطبيق البرنامج في الكثير من التقنيات الحديثة، مثل XML، ولغة البرمجة جافا وأنظمة التشغيل الحديثة.
الأصل والتطوّر
يهدف يونيكود بشكل صريح إلى تجاوز القصور في ترميزات المحارف التقليدية، كهؤلاء الذين حددهم معيار ISO 8859 وينتشر استخدامهم في مختلف أقطار العالم لكنهم يفتقدون للتوافقية بينهم بشكل كبير.
تشهجر الكثير من ترميزات المحارف التقليدية في معضلة تمكينهم للمعالجة الحاسوبية ثنائية اللغة (عادة باستخدام المحارف اللاتينية بالإضافة للغة المحلية) دون تعددية اللغات (معالجة الكثير من اللغات مختلطة مع بعضها، كالعربية والإنجليزية والصينية والهندية في صفحة واحدة).
يُرمِّز يونيكود -عن قصد- المحارف الأصلية (تلك التي تمثل الحروف ذاتها وما شابهها) وليس تنويعات الشكل النهائي (فترمز حرف الخاء في العربية، مثلا، وليس أشكال الخاء المتنوعة في أول، أووسط، أوآخر الحدثة، أوالشكل المنفصل). في حالة المحارف الصينية، يؤدى هذا أحيانا لبعض الخلافات حول تمييز التنويعات الشكلية من الحرف المشكل لها.
يضطلع يونيكود بدور تحديد رمز فريد -رقما، وليس شكلا- لكل محرف. بعبارة أخرى، يمثل يونيكود المحارف بصورة مجرّدة ويهجر العرض البصري (الحجم، والشكل، والخط، والأسلوب) لبرمجيات أخرى، مثل متصفح الوب أومعالج الحدثات. على الرغم من بساطة هذا الهدف، فقد أصبح معقدا نتيجة للتنازلات التي قدمها مصمموا يونيكود بغية تشجيع الإسراع في استخدامه.
جُعل أول 256 رمز متطابقين مع محتويات ISO 8859-1 لتبسيط عملية تحويل النصوص الغربية الموجودة مسبقا. الكثير من المحارف المتطابقة تم ترميزها الكثير من المرات في نقاط ترميز مختلفة للحفاظ على التفريق المُستخدم في الترميزات العتيقة مما يسمح بالتحويل بين هذه الترميزات من وإلى يونيكود دون فقد أي معلومات. على سبيل المثال، قسم "كامل العرض" يحتوي على ألفبائية لاتينية كاملة منفصلة عن قسم الألفبائية اللاتينية. في الخطوط الصينية، واليابانية، والكورية (صيك)، تعرض هذه المحارف بنفس عرض رموز صيك بلا من نصف العرض.
عند الكتابة عن يونيكود، تٌمثّل المحارف بكتابة "U+" يليها رقم ست عشري يمثل رمز المحرف.
المعيار
يُطوّر مجمع يونيكود -ومقره كاليفورنيا- معيار يونيكود. الشركات أوالأفراد الراغبون في دفع استحقاقات العضوية يمكنهم الانضمام للمنظمة. يضم الأعضاء نظريا جميع شركات العتاد والبرمجيات الرئيسية التي تهتم بمعايير معالجة النصوص، مثل أدوبي سيستمز، وأبل، وآي.بي.إم، ومايكروسوفت، وهيولت باكرد، وزيروكس وغيرها الكثير.
نشر المجمع معيار يونيكود (ISBN 0-321-18578-1) لأول مرّة في 1991، ويواصل تطوير المعيار بناءا على العمل الأصلي. يُطوّر يونيكود بالاشتراك مع [[المنظمة الدولية للمعايير) (أيزو) ويشهجر في مخطط المحارف مع ISO/IEC 10646: طقم المحارف العالمي.
يعمل يونيكود وISO/IEC 10646 كترميزات محارف بشكل متساو، لكن معيار يونيكود يشتمل على الكثير من المعلومات للمطبيقن، ويغطي -بالتفصيل- مواضيع مثل الترتيب (كالترتيب الأبجدي والألفبائي حسب جميع لغة)، والتصيير. يسرد ينيكود زخما من خصائص المحارف، كتلك المطلوبة لدعم النصوص ثنائية الاتجاه.
مُراجعات يونيكود حتى الآن:
- يونيكود 1.0: أكتوبر 1991
- يونيكود 1.0.1: يناير 1992
- يونيكود 1.1: يونيو1993
- يونيكود 2.0: يوليو1996
- يونيكود 2.1: مايو1998
- يونيكودد 2.1.2: مايو1998
- يونيكود 3.0: سبتمبر 1999. يغطي UCS 16-بتة Basic Multilingual Plane من ISO 10646-1:2000.
- يونيكود 3.1: مارس 2001. أضاف Supplementary Planes من ISO 10646-2، مضيفا المحارف التكميلية
- يونيكود 3.2: مارس 2002
- يونيكود 4.0: أبريل 2003
- يونيكود 4.0.1: مارس 2004
- يونيكود 4.1: مارس 2005
- يونيكود 5.0: يوليو2006
- يونيكود 5.1: متوقهة في أول أومنتصف 2008
أنظمة الكتابة المغطاة
يُغطي يونيكود تقريبا جميع أنظمة الكتابة المستخدمة حاليا.
على الرغم من حتى أكثر من 30 نظام كتابة مدرجة في يونيكود، إلا أنه تظل بعض أنظمة الكتابة التي تنتظر الترميز. كما يتم أيضا إضافة المزيد من المحارف لأنظمة الكتابة المرمّزة بالعمل، وأيضا الرموز مثل الرموز الموسيقية والرياضية.
من ضمن نظم الكتابة التي تنتظر الترميز، الهيروغليفية، البابلية والكتابة المسمارية والأبجدية الفينيقية. مع بعض أنظمة كتابة بعض الأقليات في آسيا وأوروبا وأفريقيا، الكثير منها غير مفهوم.
المصادر
- ^ http://www.unicode.org/standard/principles.html#What_Characters
- ^ ISBN 0-201-56788-1
- ^ ISBN 0-201-60845-6
- ^ المنشورين السابقين، والتقرير التقني #4:معيار يونيكود، إصدارة 1.1 بواسطة مارك ديڤيس
- ^ ISBN 0-201-48345-9
- ^ المنشورات الثلاثة السابقة، وتقرير يونيكود التقني #8، معيار يونيكود، إصدارة 2.1 بواسطة ليزا مور
- ^ ISBN 0-201-61633-5
- ^ ISBN 0-321-18578-1
- ^ (قاعدة بيانات المحارف، المعروفة ب. UCD، والمنشورة في 18 يوليو2006؛ في كتاب، معيار يونيكود، إصدارة 5.0 نُشِر فيتسعة نوفمبر 2006. ISBN 0321480910
- ^ http://www.unicode.org/charts/
- ويكيبيديا العربية
وصلات خارجية
- المسقط الرسمي لمجمع يونيكود - تعريف يونيكود (بالإنجليزية) (بالعربية)
- The Unicode Consortium
- يونيكود at the Open Directory Project
- Alan Wood's Unicode Resources Contains lists of word processors with Unicode capability; fonts and characters are grouped by type; characters are presented in lists, not grids
نطقب:Character encoding