كان لدي اقتراح واظن انك واجهته من قبل لكنه صعب التطبيق خصوصا انه يحتاج الى قواعد اللغة العربية بشكل دقيق .. وهو التشكيل الآلي للنص كما "بجوجل تشكيل" وكذلك اظن اذا تم التوصل لهذه البرمجية فمن السهل عمل برمجية اخرى لاعراب كلمات النص آلياً
كان لدي اقتراح واظن انك واجهته من قبل لكنه صعب التطبيق خصوصا انه يحتاج الى قواعد اللغة العربية بشكل دقيق .. وهو التشكيل الآلي للنص كما "بجوجل تشكيل" وكذلك اظن اذا تم التوصل لهذه البرمجية فمن السهل عمل برمجية اخرى لاعراب كلمات النص آلياً
__________________
قل اللهم مالك المُلك تؤتي الملك من تشاء وتنزع الملك ممن تشاء وتعز من تشاء وتذل من تشاء بيدك الخير انك على كل شىء قدير
شكرا للأخوين أبو اللبن والفاروق، وعلى الرحب والسعة أخي المبرمج المصري من جهة، من جهة أخرى وبخصوص إقتراحك أرغب في أن أجيب بقليل من الاستفاضة لأهمية الموضوع وضرورة توضيحه:
موضوع التشكيل هو موضوع حساس وهام من جهة نظرا لأن التشكيل ليس مجرد زخرف يمكن الاستغناء عنه بل جزء من صوت وجسد الكلمة يؤثر بمعناها وعادة ما نهمل كتابته على أساس أن المتلقى يفهم القصد ويشكل بتلقائية، لكن هذه ليست الحال بالنسبة لكافة البرامج الحاسوبية والمعالجات الآلية وهنا بيت القصيد، فما نكتب منقوص على عكس لغات أخرى كالإنجليزية.
من جهة أخرى، ينبع تعقيد هذه المسألة من أن التشكيل الصحيح يتطلب إعرابا سليما للجملة، وهو ما يعني ضمنيا فهما لها، وبالتالي فهو أمر من حيث المبدأ يستعصي على المقاربات الآلية كافة (على الأقل بحسب قناعتي الخاصة)، على جميع الأحوال، نستطيع الاكتفاء بحلول جزئية لا ترتقي إلى حد الكمال طالما أن نسبة الخطأ فيها بسيطة، وهنا نجد الحلول المتوافرة للتشكيل الآلي تأتي في صفين أو مدرستين مختلفتين من حيث الفكر والمبدأ:
المدرسة الأولى تترأسها شركة صخر العريقة وتعتمد على تقنيات معالجة اللغة الطبيعية NLP من خلال تطبيق قواعد لغوية وصولا إلى تشكيل النص المطلوب:
http://www.sakhr.com/arabic/Diacritization.aspx
أما المدرسة الأخرى فتعتمد أسلوب آخر مستقل عن فهم اللغة صراحة من خلال القواعد، بل تعتمد على طرق إحصائية صرفة لتحديد التشكيل الأكثر احتمالا للنص المعطى من خلال السياق وما يرتبط به من سواق ولواحق وساق إلخ، وقد كانت Google من رواد هذا الأسلوب منذ زمن خاصة في تطبيقات الترجمة الآلية، لكنها بدأت بتطبيقها على التشكيل الآلي أيضا:
http://tashkeel.googlelabs.com/
كذلك لدى الدكتور منصور الغامدي منتج مماثل وأسبق يعمل بخوارزمية مشابهة (بتقديري نظرا لأن جوجل لا تصرح عن تفاصيل خوارزمياتها للعموم)، لمزيد من التفاصيل يمكنك قراءة البحث التالي للدكتور الغامدي:
http://www.mghamdi.com/ATD.pdf
ملاحظة: إن الدكتور الغامدي هو من أعلام الباحثين في مجال أتمتة اللغة العربية الذين أقتدي وأفخر بهم، يمكنك الإطلاع على مزيد من أبحاثه ومنشوراته من خلال موقعه الخاص على الشابكة (الإنترنت) على العنوان التالي:
http://www.mghamdi.com/index.htm
في الختام، انا ميال للاسلوب الثاني أي الطرق الإحصائية، وأعتقد أننا لا يجب أن نستغرب هذا الأسلوب مطلقا بل نعيد التفكير بأهميته، فكلنا نستخدمه دون أن نعي ذلك، فكم من مرة ترد كلمة ترغب في تشكيلها فتلجأ إلى لفظها بمجموعة التشكيلات المحتملة لترى أيها أسيغ نغمة وأقرب إلى الصواب، أنت هنا تعود إلى ذاكرتك الإحصائية لما سبق وأن سمعت قبلا وهو ما ندعوه عادة السليقة، فقد لا تستطيع إعراب الجملة (أي بكلام آخر تطبيق خوارزميات NLP) لكنك تستطيع بسليقتك (ذاكرتك وخوارزميتك الإحصائية) أن تلفظا لفظا صحيحا وقويما.
أرجو أن أكون قد أوضحت الفكرة، وعبرت عن ما يجول بفكري حاليا، وترقبوا بعض من أدوات مكتبة PHP واللغة العربية والتي تستخدم الأسلوب الإحصائي في القريب من الأيام إن شاء الله.
كما سبق وأن وعدت بأني سأقوم بإضافة صفحة في موقع ar-php.org خاصة بالأسئلة الشائعة حول مشاكل التعامل مع اللغة العربية ضمن بيئة PHP/MySQL لتطوير مواقع الويب على صعد ومستويات مختلفة وطرق حلها والتعامل معها من خلال أمثلة برمجية، للإطلاع على هذه الصفحة:
http://www.ar-php.org/faq-php-arabic.html
وأتمنى في نهاية المطاف أن يكون هذا الاجتهاد مفيدا، فإن أصبت فأعينوني بنشرها وإن أخطأت فقوموني وصححوا لي معلوماتي.
يالغالي عندي استفسار لكن يبدوا انكم لم تتطلعوا عليه في موقع سورس فورج !
انا استعملت مكتبة التعامل مع الصور ! ،
واريد تغيير الخط المطبوع بعد تحويله للعربية !!
لكنه ما ضبط ! ==> مع العلم استعمل IMAGECK
تحياتي لك
__________________
زورونا في موقع الحياة للنقاشات والأسئلة والأجوبة :
- php >> وهو لحل مشاكل php وما حولها
- Ideas >> وهو لعرض الأفكار وتقييمها وايضا لمناقشة الأفكار
بصراحة ما فهمت ما وضيفة السكربت او البرنامج !!
__________________
E-Mail: s7s.web@hotmail.com
عضو في: ترايدنت | سوالف سوفت | الويب الرقمي | عرب نيوك | عرب ووردبريس
أخي العزيز عبد الله أبو اللبن أعتذر عن التأخر بالرد لشدة إنشغالي خلال الفترة الماضية، على كل حال ليس لي أي خبرة على الإطلاق بمكتبة IMAGECK التي أشرت إليها، لذا سأغتنم هذه الفرصة للعمل معك على إيجاد حل لهذه المشكلة وذلك حين عودتي من أوزبكستان مطلع الشهر القادم إن شاء الله.
أما الأخ محسن، فشكرا على مرورك وتعليقك، أما بالنسبة لوظيفة هذه المكتبة، فأريد أن أشير بداية إلى أنها ليست منتجا موجها للمستخدم النهائي بل هي أداة متعددة الاستخدام في يد مطور مواقع الويب العربية لتطوير مواقع تعامل اللغة العربية بشكل إحترافي، لمزيد من المعلومات يمكنك الإطلاع على الموقع الرسمي للمشروع على الرابط التالي: http://www.ar-php.org
بانتظارك أستاذنا خالد ،
فالأمر يعتبر شبه ضروري!
تحياتي لك
__________________
زورونا في موقع الحياة للنقاشات والأسئلة والأجوبة :
- php >> وهو لحل مشاكل php وما حولها
- Ideas >> وهو لعرض الأفكار وتقييمها وايضا لمناقشة الأفكار