كنا في مشروع PHP واللغة العربية قد توصلنا إلى قناعة بأن الوقت قد حان للتعامل مع اللغة العربية في مشروعنا من المنظور الإحصائي الرياضي وتخطي حدود المفاهيم والطرائق القائمة على أساس القواعد وهي التي كانت أداتنا ووسيلتنا طيلة الأعوام الستة الماضية من عمر مشروع PHP واللغة العربية، هذا التوجه الإحصائي الجديد كان ملهمه ومحفزه هو ما نراه كل يوم ونلمسه من نجاحات تحققها عملاقة الشابكة (الإنترنت) شركة غوغل.
لكننا فوجئنا من افتقار لغة PHP للعديد من الأدوات والدوال الأساسية التي يعتمد عليها علم الإحصاء في بناء نماذجه الإحصائية وتوصيف فضاء احتمالاتها، وما زاد من استغرابنا أننا نعلم أن طيف تطبيق مثل هكذا دوال وأدوات يتسع ليتجاوز النطاق الضيق لنمذجة اللغات الطبيعية ومعالجتها وهو ما كان دافعنا في الأساس، ليطال مختلف تطبيقات ذكاء الأعمال والتنقيب عن البيانات، ومن الأمثلة التي تتبادر إلى الذهن عن مثل تلك التطبيقات نذكر منها ما يختص باستخلاص المعلومات المختزلة من بين ركام البيانات الخام الهائل، والذي نحصل عليه عادة من مصادر مختلفة نذكر منها على سبيل المثال وليس الحصر ملفات سجلات زيارة المواقع أو دراسة أرقام الحملات الإعلانية أو حتى نتائج الاستبيانات وعمليات التصويت المباشرة على الشابكة.
لذا قمنا بالعمل على تطوير وإطلاق مكتبة برمجية لردم هذه الفجوة أسميناها الكاشي، ستجد في الرابط التالي تدوينة تتحدث بمزيد من التفصيل حول هذه المكتبة هنا:
http://kalshamaa.wordpress.com/2012/...7%D8%B4%D9%8A/
أما الصفحة الرئيسية المخصصة لهذا المشروع على الشابكة (الإنترنت) فهي على العنوان التالي:
http://www.ar-php.org/stats/al-kashi/
بانتظار آرائكم وتعليقاتكم وانتقاداتكم ونصائحكم