النتائج 1 إلى 10 من 10

الموضوع: خطأ فادح في robot.txt بجميع المواقع

  1. #1
    عضو فعال
    تاريخ التسجيل
    Feb 2008
    المشاركات
    1,589

    خطأ فادح في robot.txt بجميع المواقع



    كود:
    User-agent: WebZip 
    Disallow: / 
    
    User-agent: larbin 
    Disallow: / 
    
    User-agent: b2w/0.1 
    Disallow: / 
    
    User-agent: Copernic 
    Disallow: / 
    
    User-agent: psbot 
    Disallow: / 
    
    User-agent: Python-urllib 
    Disallow: / 
    
    User-agent: NetMechanic 
    Disallow: / 
    
    User-agent: URL_Spider_Pro 
    Disallow: / 
    
    User-agent: CherryPicker 
    Disallow: / 
    
    User-agent: EmailCollector 
    Disallow: / 
    
    User-agent: EmailSiphon 
    Disallow: / 
    
    User-agent: WebBandit 
    Disallow: / 
    
    User-agent: EmailWolf 
    Disallow: / 
    
    User-agent: ExtractorPro 
    Disallow: / 
    
    User-agent: CopyRightCheck 
    Disallow: / 
    
    User-agent: Crescent 
    Disallow: / 
    
    User-agent: SiteSnagger 
    Disallow: / 
    
    User-agent: ProWebWalker 
    Disallow: / 
    
    User-agent: CheeseBot 
    Disallow: / 
    
    User-agent: LNSpiderguy 
    Disallow: / 
    
    User-agent: Alexibot 
    Disallow: / 
    
    User-agent: Teleport 
    Disallow: / 
    
    User-agent: TeleportPro 
    Disallow: / 
    
    User-agent: MIIxpc 
    Disallow: / 
    
    User-agent: Telesoft 
    Disallow: / 
    
    User-agent: Website Quester 
    Disallow: / 
    
    User-agent: WebZip 
    Disallow: / 
    
    User-agent: moget/2.1 
    Disallow: / 
    
    User-agent: WebZip/4.0 
    Disallow: / 
    
    User-agent: WebStripper 
    Disallow: / 
    
    User-agent: WebSauger 
    Disallow: / 
    
    User-agent: WebCopier 
    Disallow: / 
    
    User-agent: NetAnts 
    Disallow: / 
    
    User-agent: Mister PiX 
    Disallow: / 
    
    User-agent: WebAuto 
    Disallow: / 
    
    User-agent: TheNomad 
    Disallow: / 
    
    User-agent: WWW-Collector-E 
    Disallow: / 
    
    User-agent: RMA 
    Disallow: / 
    
    User-agent: libWeb/clsHTTP 
    Disallow: / 
    
    User-agent: asterias 
    Disallow: / 
    
    User-agent: httplib 
    Disallow: / 
    
    User-agent: turingos 
    Disallow: / 
    
    User-agent: spanner 
    Disallow: / 
    
    User-agent: InfoNaviRobot 
    Disallow: / 
    
    User-agent: Harvest/1.5 
    Disallow: / 
    
    User-agent: Bullseye/1.0 
    Disallow: / 
    
    User-agent: Mozilla/4.0 (compatible; BullsEye; Windows 95) 
    Disallow: / 
    
    User-agent: Crescent Internet ToolPak HTTP OLE Control v.1.0 
    Disallow: / 
    
    User-agent: CherryPickerSE/1.0 
    Disallow: / 
    
    User-agent: CherryPickerElite/1.0 
    Disallow: / 
    
    User-agent: WebBandit/3.50 
    Disallow: / 
    
    User-agent: NICErsPRO 
    Disallow: / 
    
    User-agent: Microsoft URL Control - 5.01.4511 
    Disallow: / 
    
    User-agent: DittoSpyder 
    Disallow: / 
    
    User-agent: Foobot 
    Disallow: / 
    
    User-agent: SpankBot 
    Disallow: / 
    
    User-agent: BotALot 
    Disallow: / 
    
    User-agent: lwp-trivial/1.34 
    Disallow: / 
    
    User-agent: lwp-trivial 
    Disallow: / 
    
    User-agent: BunnySlippers 
    Disallow: / 
    
    User-agent: Microsoft URL Control - 6.00.8169 
    Disallow: / 
    
    User-agent: URLy Warning 
    Disallow: / 
    
    User-agent: Wget/1.6 
    Disallow: / 
    
    User-agent: Wget/1.5.3 
    Disallow: / 
    
    User-agent: Wget 
    Disallow: / 
    
    User-agent: LinkWalker 
    Disallow: / 
    
    User-agent: cosmos 
    Disallow: / 
    
    User-agent: moget 
    Disallow: / 
    
    User-agent: hloader 
    Disallow: / 
    
    User-agent: humanlinks 
    Disallow: / 
    
    User-agent: LinkextractorPro 
    Disallow: / 
    
    User-agent: Offline Explorer 
    Disallow: / 
    
    User-agent: Mata Hari 
    Disallow: / 
    
    User-agent: LexiBot 
    Disallow: / 
    
    User-agent: Web Image Collector 
    Disallow: / 
    
    User-agent: The Intraformant 
    Disallow: / 
    
    User-agent: True_Robot/1.0 
    Disallow: / 
    
    User-agent: True_Robot 
    Disallow: / 
    
    User-agent: BlowFish/1.0 
    Disallow: / 
    
    User-agent: JennyBot 
    Disallow: / 
    
    User-agent: MIIxpc/4.2 
    Disallow: / 
    
    User-agent: BuiltBotTough 
    Disallow: / 
    
    User-agent: ProPowerBot/2.14 
    Disallow: / 
    
    User-agent: BackDoorBot/1.0 
    Disallow: / 
    
    User-agent: toCrawl/UrlDispatcher 
    Disallow: / 
    
    User-agent: suzuran 
    Disallow: / 
    
    User-agent: TightTwatBot 
    Disallow: / 
    
    User-agent: VCI WebViewer VCI WebViewer Win32 
    Disallow: / 
    
    User-agent: VCI 
    Disallow: / 
    
    User-agent: Szukacz/1.4 
    Disallow: / 
    
    User-agent: Openfind data gatherer 
    Disallow: / 
    
    User-agent: Openfind 
    Disallow: / 
    
    User-agent: Xenu's Link Sleuth 1.1c 
    Disallow: / 
    
    User-agent: Xenu's 
    Disallow: / 
    
    User-agent: Zeus 
    Disallow: / 
    
    User-agent: RepoMonkey Bait & Tackle/v1.01 
    Disallow: / 
    
    User-agent: RepoMonkey 
    Disallow: / 
    
    User-agent: Microsoft URL Control 
    Disallow: / 
    
    User-agent: Openbot 
    Disallow: / 
    
    User-agent: URL Control 
    Disallow: / 
    
    User-agent: Zeus Link Scout 
    Disallow: / 
    
    User-agent: Zeus 32297 Webster Pro V2.9 Win32 
    Disallow: / 
    
    User-agent: Webster Pro 
    Disallow: / 
    
    User-agent: EroCrawler 
    Disallow: / 
    
    User-agent: LinkScan/8.1a Unix 
    Disallow: / 
    
    User-agent: Keyword Density/0.9 
    Disallow: / 
    
    User-agent: Kenjin Spider 
    Disallow: / 
    
    User-agent: Iron33/1.0.2 
    Disallow: / 
    
    User-agent: Bookmark search tool 
    Disallow: / 
    
    User-agent: GetRight/4.2 
    Disallow: / 
    
    User-agent: FairAd Client 
    Disallow: / 
    
    User-agent: Gaisbot 
    Disallow: / 
    
    User-agent: Aqua_Products 
    Disallow: / 
    
    User-agent: Radiation Retriever 1.1 
    Disallow: / 
    
    User-agent: Flaming AttackBot 
    Disallow: / 
    
    User-agent: Makbot
    Disallow: /
    طبعا الكل عامل هيك واعتقد سوالف
    هنا سنأخذ مثالا من أول بوت ذكرته:
    User-agent: WebZip
    Disallow: /
    هذه الطريقة لن تفيد شيءا، لماذا؟ لأن هذه النوعية من العناكب "الشريرة" لا تقرأ ملف الروبوت الموجه لها أصلا، فهي مصممة لتجاهل هذا الملف قبل كل شيء، و بالتالي فحينما نطلب منها عدم الأرشفة فهي تفعل العكس !

    لذلك، الحل الفعلي عبر ال htaccess
    نكتب اسم الروبوت مكان العلامات **** في النص التالي
    RewriteCond %{HTTP_USER_AGENT} ^***** [OR]
    فيصبح:
    RewriteCond %{HTTP_USER_AGENT} ^webZIP [OR]
    و هكذا مع بقية الروبوتات بالتتابع، إلى أن نصل لاخر روبوت فلا نضيف or
    RewriteCond %{HTTP_USER_AGENT} ^*****
    عندما ننتهي، نضع كل هذا النص بين النصين التاليين:
    RewriteEngine On
    و
    RewriteRule ^.* - [F,L]
    انتهينا ! بهذه الطريقة نضمن فعالية العملية أكثر من ملف الروبوت، الذي يقوم بمفعول عكسي تماما في هذه الحالة، إذ يحتمل جذبه للروبوتات الشريرة عوض طردها !

    اتمني ان اكون قد افدت





    التعديل الأخير تم بواسطة moh_elferg ; 27-08-2008 الساعة 05:16 AM


  2. #2
    عضو فعال
    تاريخ التسجيل
    Jun 2006
    المشاركات
    1,646


    للروبوتات الشريرة


    يعني الروبوتات هذي تعض ولا شنو بالضبط :funny:





    __________________
    قيد الانشاء



  3. شكرا لك اخي الكريم على التنبيه





    __________________
    مؤسسة البرج الرابع
    إستضافة - استضافة - دومينات - تصميم - دعم فنى
    السعودية - الدمام - شارع الفضيل بن عائض
    جوال:00966563956661
    http://d4-expos.net.sa

  4. #4
    عضو نشيط جدا
    تاريخ التسجيل
    Sep 2006
    المشاركات
    501


    كل الشكر والتقدير على هذه التوضيحات






  5. #5
    عضو فعال
    تاريخ التسجيل
    May 2006
    المشاركات
    1,053


    ماله الريبوت ده اصلا ؟

    ياريت توضيح عنه





    __________________
    لمراسلتى : اضغط هنا
    ██████
    ██████
    ██████
    SEO and Advertising Agency

  6. #6
    عضو نشيط جدا
    تاريخ التسجيل
    Jul 2008
    المشاركات
    389


    لقد قمت باعدادة كما طلبت لنرى النتائج
    شكرا لك






  7. #7
    عضو نشيط جدا
    تاريخ التسجيل
    Aug 2007
    المشاركات
    320


    رقيق المشاعر
    فكرة للدعاية

    شكرا لصاحب الموضوع .. الذي شرح طريقة إضافة اي روبوت يقابلكم والروبوت الذي استخدمه ماهو الا مثال من مئات غيره !
    هذا واحد من عدة روبوتات تقوم إما بمل موقعك سبام او أكل الباندوث او أخذ محتويات موقعك او سرقة الايميلات ا

    هنا قائمة بأغلبها :
    not-sexy.com

    دمت بود





    __________________
    إلى اللقاء سوالف , وآسف على الإزعاج...
    moffed.com , kleeja.com/tour/ar ,phpbbarabia.com

  8. #8
    عضو فعال
    تاريخ التسجيل
    Feb 2008
    المشاركات
    1,589


    مشكورين علي التوضيع الرد الاخير






  9. #9


    بصراحة احترت انا ... كل فترة بلاقي موضوع بحكي كلام غير عن الى قبله

    ياريت تضعوا لنا ملف جاهز بالمسموح والممنوع بالطريقة السليمة

    بتعملوا معروف الله يخليكم


    بوركتم





    __________________
    مهندس أحمد
    إتصالات وإلكترونيات
    مسلم عربي فلسطيني
    I Allah

    مرئية فلسطين على اليوتيوب

    خلجات قلب ....

  10. #10
    عضو جديد
    تاريخ التسجيل
    Jul 2008
    المشاركات
    24


    شكراً على التنبيه










ضوابط المشاركة

  • لا تستطيع إضافة مواضيع جديدة
  • لا تستطيع الرد على المواضيع
  • لا تستطيع إرفاق ملفات
  • لا تستطيع تعديل مشاركاتك
  •  

أضف موقعك هنا| اخبار السيارات | حراج | شقق للايجار في الكويت | بيوت للبيع في الكويت | دليل الكويت العقاري | مقروء | شركة كشف تسربات المياه | شركة عزل اسطح بالرياض | عزل فوم بالرياض| عزل اسطح بالرياض | كشف تسربات المياة بالرياض | شركة عزل اسطح بالرياض