السلام عليكم أصدقائي بسوالف .
مر زمن طويل على سلسلة في ( جعبتي حكاية ) والتي لم أطورها بكشل كبير حيث أن الوقت ضيق و الإلهام معدوم حاليا
موضوعنا اليوم هو للفائدة لكم ولي بشكل كامل .
كثيرا ما تطرقنا لمواضيع البحث و كانت اللغة العربية هي محور النقاش حيث أن لها خواص جميلة وأيضا لجمالها حكاية مع القلق وشد الشعر . وعض الأظافر حتى اصبحت يداي بدون اظافر صدقوني هذة حقيقة .
المهم بعد الكثير من النقاشات وجدت ان حتى عمالقة البحث يعتمدون مبدء بسيط هو الكلمات المفتاحية .
لن اطيل عليكم بل دعونا ندخل لأسلوب الساموراي حيث أن الأخير يجعل كل اعدائه يتفرقون ويبقى امامة واحد يقاتلة بمعنى فرق تسد .
وهنا سوف نقوم بشرح الية الفهرسة وعرض المشكلات التي تواجه الساموراي.
الحالة :
لدينا 10000 سجل مكتوب باللغة العربية .
بعضها مكتوب بالتشكيل والأخر بدون .
المشكلة :
نريد البحث بسرعة فائقة وبدون قصور على الموارد . مع او بدون تشكيل .
الحل :
قمنا بسؤال سيد ساموراي وقمنا مع باللقاء التالي :
سيد ساموراي كيف لنا ان نحل المشكلة ؟
سامورياي يتكلم : أوكي شانا توكوشا _ داتا هوكي لاماسا أنوشي ستوماكشاتا .
( الأخ يتكلم صيني )
بعد الترجمة :
والله يا خونا تعال جيب لك منسف ونعزم علية اخوك أبو مشعل ترى بلا داتا بلا وجع راس وترى لا تنسى تحب على انف مشعل
هههههههههههههههههه
وبعد الطلب الجدي من الاخ ساموراي قال : وبعد الترجمة الحصيرية لقناة سوالف .
الفهرسة تعتمد مبدء عدم تكرار الكلمة ولكن يجب علينا ان نعلم اين تتواجد الكلمة ومن هنا لا نضطر للبحث عنها بكل السجلات .
الخوارزمية :
لدينا جدول بالعادة هو INDEX
فية 3 اعمدة – الاول WORD و الثاني – T_WORD والثالث : POS
ناخذ السجل الاول .
نحولة الى مصفوفة كل كلمة على حدى .
نزيل التشكيل من الكلمة ونجعل حرف ال أ و الحورف ذات الهمزات والنقاط كال ي والمدات تستوي بشكل واحد.
ندخل الان ضمن عمود WORD الكلمة الناتجة وفي عمود ال T_ WORD ندخل الكلمة الأصلية بدون معالجة
وضمن عمود ال POS ندخل رقم السجل الذي قمنا بمعالجتة وهو مثلا 1 فندخلها @1@
الان
نكرر العملية على كل سجل
وقت ادخال كلمة جديدة يجب التأكد هل موجودة في القاعدة في حال كانت موجودة نقوم فقط بتحديث حقل ال POS مثلا كان رقم السجل 10.
@1@10@
الان عندما ياتي شخص ويريد ان يبحث عن كلمة "جلال" مثلا وكانت موجدوه مشكلة اصلا بالقاعدة.
سوف نبحث بعمود ال WORD ونجدها بدون تشكيل ومن ثم ناخذ امكنة التواجد ونحضر السجلات المتعلقة بهم للمستخدم .
بهذة الطريقة بحثت بسرعة رهيبة تشابة سرعة إعصار تسونامي .
المشاكل من واقع التجربة :
عملية الفهرسة مرهقة لأبعد الحدود على القاعدة .
حيث انه لما تحول السجل الى مجموعه كلمات وتريد ان تتحقق عن الكلمة قبل ادخالها فعندك عملة استعلام لكل كلمة .وهذا بحد ذاتة ارهاق للقاعدة ويجب عليك ان تقوم بعملية ابديت (تحديث) وقت وجود الكلمة وهذا لا مفر منه ولا ننسى انه العملية تتم عن طريق المتصفح أي التايم اوت هو العدو الاول –
قمت ببرمجة برنامج على الدلفي يقوم بهذة المهمة ولكن حتى مع الدلفي وجاهت مشاكل حيث اني بفرض عندي 4000 الف سجل يقوم البرنامج بتحديد ال 4000 سجل بعملية استعلام واحدة وهذة ليست مشكلة .
ولكنه سوف يقوم بعملية دوران عليهم سجل سجل ومعالجة كل كلمة ومن ثم التحقق هل الكمة موجودة ضمن قاعدة البينات ام لا وفي حال كانت موجودة يحدث مكان التواجد وفي حال ما كانت موجودة يوقم بادخالها بالقاعدة + مكان التواجد الخاص بها ..
ما اطمع به (الساموراي يتحدث ) ان اجد حل لهذة المعضلة عند اخوانك بسوالف وهل وصلتم انتم العرب الى اساليب فهرسة على طريقة خالد بن الوليد !!
نتمنى منكم يا شباب ان تساعدو الساموراي في موضوعه
=====================================
مواضيع شيقة جدا :
في جعبتي حكاية(*7) .. (تطوير المواقع و أثرها على الكائن البشري) موضوع فريد من نوعة. إضغط هنا
في جعبتي حكاية - 9 -(أخيرا سكريبت الجزيرة دوت نت) في موقعك ( 1 2 ) إضغط هنا
في جعبتي حكاية -8 (المسنجر في سورية وفي الشركات الخاصة وبالجامعة !!!) إضغط هنا
في جعبتي حكاية (7) الشارة الحمارء..... إضغط هنا
6* في جعبتي حكاية (الانتحار بطريقة الكامي كازي.) إضغط هنا
في جعبتي حكاية (5* البحث في المنتديات). إضغط هنا
=================================== :eek2: