صفحة 1 من 2 12 الأخيرةالأخيرة
النتائج 1 إلى 15 من 22

الموضوع: في جعبتي حكاية 10 (فهرسة الساموراي و بحث تسونامي ) : نقاش

  1. #1
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917

    في جعبتي حكاية 10 (فهرسة الساموراي و بحث تسونامي ) : نقاش



    السلام عليكم أصدقائي بسوالف .

    مر زمن طويل على سلسلة في ( جعبتي حكاية ) والتي لم أطورها بكشل كبير حيث أن الوقت ضيق و الإلهام معدوم حاليا

    موضوعنا اليوم هو للفائدة لكم ولي بشكل كامل .
    كثيرا ما تطرقنا لمواضيع البحث و كانت اللغة العربية هي محور النقاش حيث أن لها خواص جميلة وأيضا لجمالها حكاية مع القلق وشد الشعر . وعض الأظافر حتى اصبحت يداي بدون اظافر صدقوني هذة حقيقة .

    المهم بعد الكثير من النقاشات وجدت ان حتى عمالقة البحث يعتمدون مبدء بسيط هو الكلمات المفتاحية .

    لن اطيل عليكم بل دعونا ندخل لأسلوب الساموراي حيث أن الأخير يجعل كل اعدائه يتفرقون ويبقى امامة واحد يقاتلة بمعنى فرق تسد .
    وهنا سوف نقوم بشرح الية الفهرسة وعرض المشكلات التي تواجه الساموراي.

    الحالة :

    لدينا 10000 سجل مكتوب باللغة العربية .
    بعضها مكتوب بالتشكيل والأخر بدون .

    المشكلة :
    نريد البحث بسرعة فائقة وبدون قصور على الموارد . مع او بدون تشكيل .

    الحل :

    قمنا بسؤال سيد ساموراي وقمنا مع باللقاء التالي :
    سيد ساموراي كيف لنا ان نحل المشكلة ؟

    سامورياي يتكلم : أوكي شانا توكوشا _ داتا هوكي لاماسا أنوشي ستوماكشاتا .
    ( الأخ يتكلم صيني )

    بعد الترجمة :
    والله يا خونا تعال جيب لك منسف ونعزم علية اخوك أبو مشعل ترى بلا داتا بلا وجع راس وترى لا تنسى تحب على انف مشعل

    هههههههههههههههههه

    وبعد الطلب الجدي من الاخ ساموراي قال : وبعد الترجمة الحصيرية لقناة سوالف .
    الفهرسة تعتمد مبدء عدم تكرار الكلمة ولكن يجب علينا ان نعلم اين تتواجد الكلمة ومن هنا لا نضطر للبحث عنها بكل السجلات .

    الخوارزمية :
    لدينا جدول بالعادة هو INDEX
    فية 3 اعمدة – الاول WORD و الثاني – T_WORD والثالث : POS
    ناخذ السجل الاول .
    نحولة الى مصفوفة كل كلمة على حدى .
    نزيل التشكيل من الكلمة ونجعل حرف ال أ و الحورف ذات الهمزات والنقاط كال ي والمدات تستوي بشكل واحد.

    ندخل الان ضمن عمود WORD الكلمة الناتجة وفي عمود ال T_ WORD ندخل الكلمة الأصلية بدون معالجة

    وضمن عمود ال POS ندخل رقم السجل الذي قمنا بمعالجتة وهو مثلا 1 فندخلها @1@

    الان
    نكرر العملية على كل سجل
    وقت ادخال كلمة جديدة يجب التأكد هل موجودة في القاعدة في حال كانت موجودة نقوم فقط بتحديث حقل ال POS مثلا كان رقم السجل 10.

    @1@10@

    الان عندما ياتي شخص ويريد ان يبحث عن كلمة "جلال" مثلا وكانت موجدوه مشكلة اصلا بالقاعدة.

    سوف نبحث بعمود ال WORD ونجدها بدون تشكيل ومن ثم ناخذ امكنة التواجد ونحضر السجلات المتعلقة بهم للمستخدم .

    بهذة الطريقة بحثت بسرعة رهيبة تشابة سرعة إعصار تسونامي .


    المشاكل من واقع التجربة :
    عملية الفهرسة مرهقة لأبعد الحدود على القاعدة .
    حيث انه لما تحول السجل الى مجموعه كلمات وتريد ان تتحقق عن الكلمة قبل ادخالها فعندك عملة استعلام لكل كلمة .وهذا بحد ذاتة ارهاق للقاعدة ويجب عليك ان تقوم بعملية ابديت (تحديث) وقت وجود الكلمة وهذا لا مفر منه ولا ننسى انه العملية تتم عن طريق المتصفح أي التايم اوت هو العدو الاول –

    قمت ببرمجة برنامج على الدلفي يقوم بهذة المهمة ولكن حتى مع الدلفي وجاهت مشاكل حيث اني بفرض عندي 4000 الف سجل يقوم البرنامج بتحديد ال 4000 سجل بعملية استعلام واحدة وهذة ليست مشكلة .

    ولكنه سوف يقوم بعملية دوران عليهم سجل سجل ومعالجة كل كلمة ومن ثم التحقق هل الكمة موجودة ضمن قاعدة البينات ام لا وفي حال كانت موجودة يحدث مكان التواجد وفي حال ما كانت موجودة يوقم بادخالها بالقاعدة + مكان التواجد الخاص بها ..


    ما اطمع به (الساموراي يتحدث ) ان اجد حل لهذة المعضلة عند اخوانك بسوالف وهل وصلتم انتم العرب الى اساليب فهرسة على طريقة خالد بن الوليد !!

    نتمنى منكم يا شباب ان تساعدو الساموراي في موضوعه


    =====================================
    مواضيع شيقة جدا :

    في جعبتي حكاية(*7) .. (تطوير المواقع و أثرها على الكائن البشري) موضوع فريد من نوعة. إضغط هنا

    في جعبتي حكاية - 9 -(أخيرا سكريبت الجزيرة دوت نت) في موقعك ( 1 2 ) إضغط هنا

    في جعبتي حكاية -8 (المسنجر في سورية وفي الشركات الخاصة وبالجامعة !!!) إضغط هنا

    في جعبتي حكاية (7) الشارة الحمارء..... إضغط هنا

    6* في جعبتي حكاية (الانتحار بطريقة الكامي كازي.) إضغط هنا

    في جعبتي حكاية (5* البحث في المنتديات). إضغط هنا


    =================================== :eek2:







  2. #2
    عضو فعال
    تاريخ التسجيل
    Mar 2005
    المشاركات
    1,482


    سورى مش فاهم حاجة

    ولا يمكن علشان لسة صاحى من النوم





    __________________

    D0 Th3 B3$T 2B Th3 B3$T !
    L1nux - L1f3 Fr33 0R D13

  3. #3
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917


    :looking: :looking: :looking: :looking:






  4. #4


    للفهرسة يفضل إستخدام أسلوب الـ Inverted Files وهو افضل اسلوب للفهرسة الخاصة بمحركات البحث خصوصا ، هذه الخوارزمية هي المستخدمة حاليا في قووقل لعملية الفهرسة ( لاحظ الفهرسة Indexing و ليس التقييم Ranking )

    تحياتي






  5. #5
    عبدالعزيز الزرعوني
    تاريخ التسجيل
    Feb 2004
    المشاركات
    3,128


    خارج الموضوع وعذراً لبيشو:
    البرواز:
    ياليت تضيفني على :
    mobde3 at gmail.com
    أو تراسلني عليه لأعرف بريدك ونتحدث في موضوع





    __________________
    مدونة المبدع العربي

  6. #6
    عضو فعال جدا
    تاريخ التسجيل
    Feb 2002
    المشاركات
    2,289


    لي تعقيب باذن الله ولكن هل لك ان تشرح


    "ما اطمع به (الساموراي يتحدث ) ان اجد حل لهذة المعضلة عند اخوانك بسوالف وهل وصلتم انتم العرب الى اساليب فهرسة على طريقة خالد بن الوليد !! "

    اولا !! فما هي طريقه خالد بن الوليد رضي الله عنه ؟






  7. #7
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917


    المهمة9


    خالد بن وليد أبدع في فهرسة الجيش فيضع الفارس المناسب ولا يكرره مرة اخرى في نفس المكان
    وهو سف الله المسلول ولا يوجد غيرة اي انه قيمة فريدة في القاعدة الإسلامية .

    وتلك تشابية استقيت منها الكلام وخالد بن وليد بصراحة شخصية اسلامية اعشقها .

    اخي البرواز ممكن تشرح اكتر عن Inverted Files

    وبدوري سوف ابحث الان بغوغل عن الموضوع.






  8. #8
    عضو سوبر نشيط
    تاريخ التسجيل
    Sep 2005
    المشاركات
    940


    أنا أوافقك على هذه الطريقة في حال واحدة وهي أن تكون قاعدة البيانات قاموس فتوجد في الحقل الواحد كلمة واحدة للسجل الواحد.

    أما أن يحتوي الحقل الذي نريد أن نبحث فيه عن مقالة فلا أوافقك.

    والسؤال .... هل يُمكن الاستغناء عن التشكيل؟

    إذا كان نعم ... نقوم بإزالة التشكيل من البرنامج ... وهذا سهل على فكرة ...

    ثم نقوم باستعمال fulltext search في الحقل الذي توجد فيه المقالة

    ملاحظة مهمة: لا يمكنك أن تبدل الحرف آ مثلاً بـ ا لأن الكلمة مرآب غير مراب

    وهذا يعني أن بعض النتائج لن تظهر إلا بوجود misspelling






  9. #9


    الغالي المبدع العربي ، تمت المراسلة ...

    أخي بيشو ، قد يصعب علي تلخيص الـ Inverted Files في موضوع أو سلسلة مواضيع خاصة لمن ليس لهم خلفية في علم إستجلاب المعلومات Information Retrieval ، إبحث عن هذا الموضوع في قووقل و اذا احتجت أي مساعدة انا جاهز بإذن الله ...






  10. #10
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917


    قد بحثت وبصراحة وجدت ملف PDF ولكنة يشرح الموضوع بالمعادلات الرياضية ما لم ادرسها في الجامعة بصفتي خريج تجارة ممكن شرح ولو عن الفكرة ؟






  11. #11
    عضو نشيط
    تاريخ التسجيل
    Oct 2005
    المشاركات
    115


    انا من فترة كنت أفكر في طريقة أرشفة للموقع بشكل كامل

    يعني لو فرضا حبيت اعمل بحث في موقعي
    وموقعي يحتوي على منتديات و أخبار و البوم صور و مقالات و .. و العديد كم الاقسام
    أو بوصف أدق عندي أكثر من قاعدة بيانات

    وحبيت أعمل بحث في كل صفحات الموقع

    فشو رايكم الطريقة الممكنة لعمل هذه الفكرة؟





    __________________
    +------------------------
    |أبو فادي
    +------------------------
    | http://www.palstine.info
    +------------------------
    | http://xremas.com
    +------------------------

  12. #12
    عضو فعال
    تاريخ التسجيل
    Mar 2005
    المشاركات
    1,482


    كده فهمت


    موضوع مفيد جدا جدا جدا





    __________________

    D0 Th3 B3$T 2B Th3 B3$T !
    L1nux - L1f3 Fr33 0R D13

  13. #13
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917


    بالنسبة لكتاب ال PDF

    فهاكم وصلتة
    http://www.cs.rmit.edu.au/~jz/fulltext/acmtods98.pdf






  14. #14
    خبير سيرفرات لينكس
    تاريخ التسجيل
    Mar 1999
    المشاركات
    4,917


    طيب مو عيب او حرام واحد يفهم بالرياضيات لو يقرى الكتاب وعلى الاقل بس يشرح المعادلات ولا يعني المنتددى بس صار منتدى سكريبتات ؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟

    يعني احتجاناكم مرة ........... ولا خلاص ترى والله باندم لاني وضعت الموضوع واذا لم نصل الى حل بهذا الموضوع لكي يستفيد منه اخوانا ترى والله بترك سوالف . ويلي ما يهمة الموضوع لا يهمة ويلي بيهمة يسعى لكي نفهم هذا الموضوع . ترى صجونا الاجانب هم فاهمين ونحن خلفهم ونجيب حبير امريكي .






  15. #15


    أبشر أخوي beshoo راح أشرح لك فكرة الـ Inverted files بغض النظر عن هذا الكتاب .. بس أمهلني بعض الوقت لكثرة مشاغلي هذه الأيام و لأن الموضوع يحتاج الكثير من التفصيل و الإسهاب .










ضوابط المشاركة

  • لا تستطيع إضافة مواضيع جديدة
  • لا تستطيع الرد على المواضيع
  • لا تستطيع إرفاق ملفات
  • لا تستطيع تعديل مشاركاتك
  •  

أضف موقعك هنا| اخبار السيارات | حراج | شقق للايجار في الكويت | بيوت للبيع في الكويت | دليل الكويت العقاري | مقروء | شركة كشف تسربات المياه | شركة عزل اسطح بالرياض | عزل فوم بالرياض| عزل اسطح بالرياض | كشف تسربات المياة بالرياض | شركة عزل اسطح بالرياض