السلام عليكم ورحمة الله تعالى وبركاته،
مع سرعة تطور الانترنت وسرعة انتشاره ووصوله تقريبا إلى كل بلد وإلى كل منزل، بدأت الحاجة إلى تنظيمه وعولمته ليصل إلى هؤلاء المستخدمين بلغاتهم، وهنا ظهرت هذه المنظمات التي ترعى تطور هذه الشبكة العالمية وضمان وصولها بالشكل السليم إلى هؤلاء المستخدمين باللغة التي يفهومنها، وهنا ظهر ترميز Unicode.
Unicode هي مجموعة رموز عالمية تستخدم لتعريف جميع الرموز والحروف المستخدمة في أغلب لغات العالم وتجميعا في ترميز واحد لستهيل عرض وارسال المعلومات بغض النظر عن اللغة المستخدمة. هذا الترميز العالمي يستخدم من 1 إلى 4 بايت (البايت=8 بت) لترميز الحروف، ولم يستخدم حتى هذه اللحظه سوى ثلث العدد المتاح في Unicode لترميز حروف هذه اللغات.
هناك ثلاثة أنواع رئيسية تستخدم حاليا لترميز الUnicode:
- UTF-8
وهو المفضل لدى مبرمجي الويب، حيث يستخدم 1 بايت اذا كانت الرموز موجودة في ترميز ASCII، وتستخدم 2 إلى 4 بايت للرموز المعقدة.
- UTF-16
هذا الترميز يستخدم إما 2 بايت للترميز إذا كانت الرموز موجودة في Basic Multilingual Plane (BMP) و4 بايت للرموز الغير موجودة.
- UTF-32
أما بالنسبة لهذا الترميز فإنه يستخدم 4 بايت على الدوام.
جدول1: مقارنة الرموز مع ما يقابلها من ترجمة - المصدر
وهناك الكثير من الاشتقاقات لهذا الترميز العالمي Unicode منها UTF-2 و UTF-7 وقد أرفقت بعض المراجع لزيادة الاطلاع.
وبعدما عرضنا وعرفنا ماهو Unicode وأنواعه المختلفه، عليك أن تعلم أخي الكريم أن هذا الترميز لا يستخدم فقط في صفحات الويب، وإنما صمم ليشمل كل الملفات التي يمكن تخزينها على أي جهاز ألكتروني، والآن قد جاء السؤال المهم وهو لماذا كل هذا الاهتمام بهذا الترميز؟ وهل علينا فعلا التحول لاستخدامه؟
والجواب سأحاول تلخيصه في عذة نقاط رئيسية تهم مصممي الويب خصوصا:
الوصول بموقعك إلى العالمية، صمم لكي يرى كل الناس عملك وﻻ تجعله حكرا لنظام تشغيل معين، أو متصفح معين، حيث ليس لدى الجميع نظام تشغيل Windows كي يستطيعوا رؤية صفحتك المرمزة بترميز Windows-1256.
تبادل المعلومات، وهذا الجزء مهم جدا حيث كما تعلم أصبح تبادل المعلومات وخصوصا عن طريق لغة XML كبير جدا ومتوسع، فمن المهم أن يفهم الطرفان ما يحتويه ملفات تبادل المعلومات من محتوى.
احترافية التصميم ومتابعة المعايير القياسية، وهذه لعلها قد تكون أهم ما تنادي به منظمة الويب العالمية في مقالها حول عولمة الويب.
الخطأ الشائع بين مصممي الويب
هناك الخطأ الشائع بين مصممي صفحات الويب وهو اعتقادهم أن سطر الميتا meta:
أو بمجرد تغيير ترويسة الصفحة headerكود HTML:<meta http-equiv="content-type" content="text/html; charset=utf-8" />
وحده يكفي لترميز الصفحة بالترميز المناسب، والصحيح أن هذا السطر ما هو إلا لجعل المتصفح فقط يترجم ما تحتويه الصفحة من رموز إلى ما هو موجود بهذا السطر ويبقى ترميز الملف نفسه بالترميز الذي خُزّن به، وكما تعلم عزيزي القارئ بغض النظر عن نوع الملف، فإن أي ملف يتم تخزينه في الحاسب يتحول إلى مجموعة من البايتات المشفرة على حسب نوع الترميز المستخدم في التخزين وعند طلبها فإنه يتم ترجمتها باستخدام نفس الترميز، لذلك فمن المهم التأكد دائما من نوع الترميز المستخدم في ملفاتك قبل تخزينها ومن ثم إضافة السطر المساعد سواء كان ميتا أو ترويسة لمساعدة المتصفح على اختيار النوع المناسب لفك التشفير.كود PHP:
<?php
header('Content-Type: text/html; charset=utf-8');
?>
المراجع وبعض الوصلات المفيدة
http://www.w3.org/International/tuto...nc/en/all.html
http://www.w3.org/TR/unicode-xml/
http://www.unicode.org/standard/principles.html
http://en.wikipedia.org/wiki/HTML_Unicode
http://www.alanwood.net/unicode/
http://www.microsoft.com/typography/unicode/cs.htm
هذا وصلى الله على محمد وعلى آله وصحبه وسلم،
مع تحياتي
---------------------------------------------------------
:: كتبه Bo3oof
:: المصدر: http://www.devpedia.org/articles/index.php?p=80