صفحة 1 من 2 12 الأخيرةالأخيرة
النتائج 1 إلى 15 من 27

الموضوع: كل ما يتعلق بملف ال robots.txt وتوجيه عناكب محركات البحث

  1. #1

    كل ما يتعلق بملف ال robots.txt وتوجيه عناكب محركات البحث



    بسم الله الرحمن الرحيم


    مقدمة:
    سنشرح فى هذا الدرس كل ما يتعلق بملف robots.txt هذا الملف الشهير الذى يتحدث الكثير عنه ونقوم بوضعه فى مواقعنا دون ان نفهم محتواه او الفائده منه , بعد هذا الدرس ستفهم كل شىء عنه وستكتب محتوياته بيدك دون الرجوع لأحد , فقط تابع الدرس بتركيز .

    معنى كلمة robots :
    المعنى الحرفى لكلمة robots هى " الرجل الالى" وهذا ادق معنى للrobots الخاصه بمحركات البحث ولكنها ايضا يطلق عليها فى بعض الاحيان Wanderers بمعنى "المتجولون" او spiders " بمعنى عناكب ....الان بدأنا نعرف عن ماذا اتحدث عندما ذكرت كلمة عناكب اليس كذلك؟
    حسنا نستخلص من هذا ان ال robots هى عناكب محركات البحث وبالتالى سيكون ملف robots.txt هو المسؤول عن توجيه هذه العناكب

    ما هى العناكب وما هى وظيفتها:
    عناكب محركات البحث عباره عن برامج تتصفح المواقع تلقائيا . محركات البحث مثل Google تستخدم العناكب فى أرشفة محتويات المواقع لكى تبنى بها محرك بحث Google الشهير .كما ان بعض ال spammers -وهم الذين يهتمون بجمع الايميلات ومراسلتها بغرض الدعايا- يقومون بعمل عناكب بهدف جمع الايميلات من المواقع

    حتى الان عرفنا ماهى العناكب ووظيفتها وما هو ملف الـ robots.txt ووظيفته ولكن سنتعلم فى النقاط التاليه المزيد من وظائف ملف الـ robots.txt وكيفية كتابتة واعداده

    بأختصار:
    اى صاحب موقع يجب عليه ان يقوم بعمل ملف robots.txt لكى يقوم بتوجيه عناكب محركات البحث القادمة الى موقعة وهذا يسمى ببروتوكول استثناء العناكب The Robots Exclusion Protocol , وهذا مثال لكيفية عمل ملف robots.txt:

    سنفترض ان احد عناكب محركات البحث جاء الى الصفحة التالية http://www.example.com/welcome.html قبل ان يقوم بالتعامل مع الصفحة يتحقق اولا من وجود هذا الملف http://www.example.com/robots.txt, وسنفترض مثلا انه وجد به الكود التالى
    كود:
    User-agent: *
    Disallow: /
    هذا الكود يعنى ان الموقع يوافق على دخول جميع عناكب محركات البحث
    كود:
    User-agent: *
    وهذا الكود يعنى انه غير مسموح لعناكب محركات البحث بزيارة اى صفحه بداخل هذا المجلد

    لاحظ النقاط التالية:
    1. بعض العناكب تتجاهل ملف الـ robots.txt مثل العناكب التى تدخل الموقع لتبحث عن الثغرات الامنية والايميلات
    2. ملف الـ robots.txt متاح لأى زائر ويستطيع الكل قراءته لذلك لا تستخدمه لأخفاء معلومات لأنك فى هذه الحاله تفضح المعلومات ولا تخفيها
    سننتقل الان الى الجزء الاهم فى هذا الشرح فرجاء التركيز
    كيف يمكنك عمل ملف الـ robots.txt ؟
    وهذا السؤال ينقسم الى عدة نقاط
    اولا : اين يوضع ملف الـ robots.txt ؟
    الاجابة المختصره على هذا السؤال:
    يوضع فى مجلد الموقع الرئيسى , بمعنى ان رابط الملف بعد تركيبه سيكون بهذا الشكل http://www.example.com/robots.txt
    الاجابة المفصله لهذا السؤال :
    ان عناكب محركات البحث عندما تقوم بالتحقق من وجود ملف الـrobots.txt فهى تقوم بحذف جزء من الرابط هذا الجزء هو من اول slash "/"حتى نهاية الرابط وتضع مكان هذا الجزء "/robots.txt"

    [RIGHT]مثال على ذلك بالنسبة لهذا الرابط http://www.example.com/shop/index.html ستقوم العناكب بحذف /shop/index.html وستضع مكانه "/robots.txt" اى انها ستبحث عن ملف ال robots.txt على هذا الرابط http://www.example.com/robots.txt
    وتذكر دائما ان تكتب اسم الملف بالحروف الصغيره اى ان اسمه robots.txt ووليس Robots.TXT

    ماذا سأضع بداخل ملف الـ robots.txt ؟

    ملف الـ robots ملف نصى "text" وظيفته الاساسية هى الاستثناء كما سنرى
    الامر ابسط مما تتخيلون
    سنشرح عن طريق امثله لمحتويات ملف الـrobots.txt وتفسيرها
    كود:
    User-agent: *
    Disallow: /cgi-bin/
    Disallow: /tmp/
    بواسطتة هذا الكود قمنا بالسماح لجميع محركات البحث بزيارة الموقع عن طريق السطر الاول وقمنا بأستثناء هذه المجدلدت cgi-bin ,tmp من الارشفه اى منعنا عناكب محركات البحث من زيارت هذه المجلدات وكامل محتوياتها

    لاحظ انك يجب ان تضع امر "Disallow" فى سطر منفصل كل مره تحجب فيها مجلد او رابط معين ولا يمكنك حجب مجلدين فى نفس الوقت عن طريق امر واحد بل ضع لكل مجلد امر "Disallow" بمفرده

    كود:
    User-agent: *
    Disallow: /
    بواسطة هذا الكود نمنع كل عناكب محركات البحث من ارشفة كل محتويات الموقع




    كود:
    User-agent: *
    Disallow:
    هذا الكود يسمح لجميع العناكب بالدخول وارشفة جميع محتويات الموقع ويمكنك الاستغناء عن هذا الكود برفع ملف robots.txt فارغ او عدم عمل الملف نهائيا

    كود:
    User-agent: *
    Disallow: /cgi-bin/
    Disallow: /tmp/
    Disallow: /junk/
    بواسطة هذا الكود منعنا جميع العناكب من زيارة اقسام معينه من الموقع


    كود:
    User-agent: BadBot
    Disallow: /
    يستخدم هذا الكود لمنع عناكب احد محركات البحث



    كود:
    User-agent: Google
    Disallow:
    
    User-agent: *
    Disallow: /
    هذا الكود يستخدم للسماح لعناكب احد محركات البحث بالزيارة واستثناء الاخرون



    كود:
    User-agent: *
    Disallow: /~joe/junk.html
    Disallow: /~joe/foo.html
    Disallow: /~joe/bar.html
    وبالطبع هذا الكود لأستثناء الملفات كما هو ظاهر

    _________________
    الدرس القادم سيشرح بعض الاوامر الاخرى المميزه مع اجابة للأسئله الشائعة التى تدور بذهن اى صاحب موقع عن بطلنا ملف الـ robots.txt

    انتهى الموضوع بحمد الله وارجو ان اكون وفقت فى الاعداد

    هذا الشرح فقط سأقوم بوضعه بثلاث مواقع "تراينت و سوالف سوفت و ارابيا فور سيرف"
    عند النقل يرجى ذكر المصدر الاصلى
    http://forum.arabia4serv.com/t16810.html







  2. #2
    عضو شرف
    تاريخ التسجيل
    Mar 2003
    المشاركات
    1,899


    يعطيك العافيه وجزاك الله كل خير

    احب ان اضيف بعض الخواص وخصوصا Allow


    وهي :

    كيف اجعل العناكب لا تقرأ ملفات معينه مثل ملفات الفلاش ؟

    باستخدام هذا الكود

    كود:
    User-agent: *
    Disallow: /*.swf$
    وطبعا يمكن اضافة اي لاحقه مثل ال php و html و js كما يرد صاحب الموقع



    ايضا

    ماذا ان كنت اريد منع مسار معين وفي نفس الوقت اريد ارشفة ملف هذا المسار؟

    مثال :

    كود:
    User-agent: *
    Disallow: /dir/
    Allow: /dir/file.html
    في هذه الحاله سوف تمنع العناكب من ارشفة اي شي بـ dir

    لكن ملف file.html يسمح بارشفته



    وايضا ان استخدمنا الامر هكذا

    كود:
    User-agent: *
    Disallow: /dir/
    Allow: /dir/*.html$
    اي امنع العناكب من ارشفة اي شي داخل مجلد dir ولكن اجعلها تأرشف اي ملفات html داخل هذا المجلد

    وهنا يأتي دور ان هذا المجلد يحتوي على ملفات php و html او حتى swf

    فيتم منع اي لاحقه ماعادا html




    ماذا ان كنت اريد منع ملفات معينه ولكن اسمائها مختلفه لكنها مرتبه

    نستخدم في هذه الحاله العلامه *

    مثلا لديك ملفات بهذه الاسماء

    file_1.html حتى file_500.html

    هل من المعقول ان تضع الاسماء من 1 الى 500 !!

    لا طبعا تستخدم هذا الامر فقط

    كود:
    User-agent: *
    Disallow: /file_*
    او

    كود:
    User-agent: *
    Disallow: /file_*.html

    ايضا يمكن اضافة اخر الملف مسار خريطة الموقع مثل :

    كود:
    Sitemap: http://www.site.com/anyname.xml






    __________________
    محلل لنظم المعلومات - ارسل لي رساله خاصه عبر المنتدى | join me on facebook / twitter
    php | flash&flex&air actionscript 2,3 | ajax&javascript | database pro Analyzer

  3. #3


    اضافات رائعة يا اخ محمد
    الدرس القادم سيشرح بعض الاوامر الاخرى المميزه مع اجابة للأسئله الشائعة التى تدور بذهن اى صاحب موقع عن بطلنا ملف الـ robots.txt
    وفرت علي مجهود كبير فى الدرس القادم سأكتفى بالاسئلة الشائعة ان شاء الله






  4. #4
    عضو فعال
    تاريخ التسجيل
    Sep 2006
    المشاركات
    1,000


    بارك الله فيكم

    موضوع مهم للويب ماسترز ننتظر المزيد


    How do I block or allow Googlebot? - Webmaster Help Center





    __________________
    عندك موقع يستهدف الأطفال؟ ضع لهم عبارات تحفيزيّة و نصائح عن البر بالوالدين والصلاة وهكذا..
    تحميل القران | الاركاني | السديس | الشريم
    Quran القطامي | Listen Quran | ياسر الدوسري
    الكلباني | مشاري العفاسي | المعيقلي

  5. #5
    عضو فعال جدا
    تاريخ التسجيل
    Jan 2005
    المشاركات
    3,948


    رائع جداً

    ولاعدمناكم





    __________________
    سبحان الله ... اللهم اني استغفرك و اتوب الليك
    Twitter
    سيرفرات موقعي على ليكود ويب

  6. #6


    ممتاز جدا

    شكرا لكم






  7. #7
    عضو نشيط
    تاريخ التسجيل
    Apr 2008
    المشاركات
    76


    ما شاء الله تبارك الله

    ابدعتم في الشرح

    بصراحة وسعتم ادراكي لهذا الملف

    وعندي بعض الأسئلة

    انا مركب هاك vbseo وروابط المواضيع عندي على الشكل التالي

    http://www.example.com/vb/t8.html

    واما روابط الاقسام فهي هكذا

    http://www.example.com/vb/1/

    وفي الربورت مانع جميع الروابط اللي في المنتدى إلى الرئيسية حقت المنتدى وروابط المواضيع والاقسام

    فالاختصار سيكون هكذا
    كود:
    User-agent: *
    Allow: /vb/
    Allow: /vb/*/
    Allow: /vb/*.html$
    هل هذا الملف صحيح ام يحتاج تعديل

    ولدي سؤال / ماذا يعني هذا الامر User-agent: ia_archiver

    او يا ليت تفسرون لنا هذا الملف
    كود:
    User-agent: ia_archiver
    Disallow: /
    
    User-agent: Slurp
    Crawl-delay: 1
    
    User-agent: *
    Disallow: /issue.php

    ويعطيكم العافية على هذه المعلومات الثريه

    وجزاكم الله خير





    __________________
    www.5lil.net
    www.x-i5.net

  8. #8


    ما شاء الله تبارك الله

    ابدعتم في الشرح

    بصراحة وسعتم ادراكي لهذا الملف

    وعندي بعض الأسئلة

    انا مركب هاك vbseo وروابط المواضيع عندي على الشكل التالي

    http://www.example.com/vb/t8.html

    واما روابط الاقسام فهي هكذا

    http://www.example.com/vb/1/

    وفي الربورت مانع جميع الروابط اللي في المنتدى إلى الرئيسية حقت المنتدى وروابط المواضيع والاقسام

    فالاختصار سيكون هكذا
    كود:
    User-agent: *
    Allow: /vb/
    Allow: /vb/*/
    Allow: /vb/*.html$
    هل هذا الملف صحيح ام يحتاج تعديل

    ولدي سؤال / ماذا يعني هذا الامر User-agent: ia_archiver

    او يا ليت تفسرون لنا هذا الملف
    كود:
    User-agent: ia_archiver
    Disallow: /
    
    User-agent: Slurp
    Crawl-delay: 1
    
    User-agent: *
    Disallow: /issue.php
    ويعطيكم العافية على هذه المعلومات الثريه

    وجزاكم الله خير
    الكود الاول صحيح

    بالنسبة لكود الثانى هذا تفسيره


    اول جزء
    كود:
    User-agent: ia_archiver
    Disallow: /
    هذا الكود لمنع عناكب اليكسا تماما من دخول الموقع
    ==============
    كود:
    User-agent: Slurp
    Crawl-delay: 1
    السطر الاول من الكود يسمح بدخول عناكب ياهو
    السطر الثانى يأمر العناكب ان تتأخر بعض الوقت حتى لا تسبب ضغط على السيرفر ويمكنك زيادة القيمه اذا وجدت الضغط كبير بسبب عناكب ياهو
    ملحوظه : جوجل يتجاهل Crawl-delay
    =======================

    الجزء الثالث
    كود:
    User-agent: *
    Disallow: /issue.php
    السطر الاول من هذا الجزء يسمح بدخول جميع العناكب لكن مع عدم زيارة هذا الملف issue.php او اى رابط يذكر به اسم الملف
    توضيح : لاحظ انك مثلا اذا حجبت showthread.php لن تتم ارشفة اى موضوع بموقعك لأن روابط المواضيع كلها مثل showthread.php?t=973678






  9. #9
    عضو نشيط
    تاريخ التسجيل
    Apr 2008
    المشاركات
    76


    يسأل احد الاعضاء في ترايدنت بعد ما تم نقل تفسير ملف الربورت اللي عطيتك

    وقال

    كم مدة التأخر بالثانية اذا سمحت؟

    وجزاك الله خير





    __________________
    www.5lil.net
    www.x-i5.net

  10. #10


    يسأل احد الاعضاء في ترايدنت بعد ما تم نقل تفسير ملف الربورت اللي عطيتك

    وقال

    كم مدة التأخر بالثانية اذا سمحت؟

    وجزاك الله خير
    اخى انا كاتب الرد الاخر بترايدنت

    Crawl-delay: 1 الرقم "1" يعنى "1" ثانية






  11. #11
    عضو فعال
    تاريخ التسجيل
    May 2007
    المشاركات
    1,227


    arabia4serv: مشكور موضوع غني جداً وأفادني كثيراً شكراً لك .





    __________________
    حسناً، جرّب الحياة.
    نصائح مهمة: لتفادي سرقة الدومينات.

    للمراسلة إضغط هنا فقط .

  12. #12
    عضو فعال
    تاريخ التسجيل
    May 2007
    المشاركات
    1,227

    Lightbulb



    يوجد امر لقوقل الصوري في ارشفة مجلد معين يوجد به صور واحببت افادتكم به وهو:

    كود:
    User-Agent: Googlebot-Image
    Allow: /images/
    Allow: /
    وهو لبحث قوقل الصوري يفيدك إذا كان عندك قسم صور .





    __________________
    حسناً، جرّب الحياة.
    نصائح مهمة: لتفادي سرقة الدومينات.

    للمراسلة إضغط هنا فقط .

  13. #13
    عضو سوبر نشيط
    تاريخ التسجيل
    May 2006
    المشاركات
    773


    الله يجزاك الجنة






  14. #14
    عضو نشيط
    تاريخ التسجيل
    May 2006
    المشاركات
    171


    بارك الله فيك ...

    اذا تكرمت ممكن تضع افضل اعدادت للربورت للمنتديات.... حتى نلصقه مباشرة ...


    ودمت بود





    __________________
    هل زرت ملتقى الصيادلة العرب
    www.4ph.net
    www.arabph.com

  15. #15
    عضو فعال جدا
    تاريخ التسجيل
    Feb 2003
    المشاركات
    4,383


    ابداعت ياخوي بارك الله فيك
    بس سؤال ...
    اذا كانت ملفات TXT محظورة لدى المستيف الخاصة بي ... فكيف اقدر استثني هذا الملف؟










ضوابط المشاركة

  • لا تستطيع إضافة مواضيع جديدة
  • لا تستطيع الرد على المواضيع
  • لا تستطيع إرفاق ملفات
  • لا تستطيع تعديل مشاركاتك
  •  

أضف موقعك هنا| اخبار السيارات | حراج | شقق للايجار في الكويت | بيوت للبيع في الكويت | دليل الكويت العقاري | مقروء | شركة كشف تسربات المياه | شركة عزل اسطح بالرياض | عزل فوم بالرياض| عزل اسطح بالرياض | كشف تسربات المياة بالرياض | شركة عزل اسطح بالرياض