Баним поисковики и снижаем нагрузку на сайт

Тема в разделе "SEO - оптимизация, продвижение", создана пользователем draff, 12.12.2015.

  1. draff
    Offline

    draff Russian Joomla! Team Команда форума

    Регистрация:
    17.01.2011
    Сообщения:
    6 041
    Симпатии:
    518
    Пол:
    Мужской
    Список найден в интернете,и дополнен мной, учитывая оптимизацию интернет-магазина в России. Вставить в начало своего .htaccess . Цель применения бана для поисковиков- снизить нагрузку для сайта на хостинге.
    ## Блокировка по USER AGENT:
    RewriteCond %{HTTP_USER_AGENT} MJ12bot [OR]
    RewriteCond %{HTTP_USER_AGENT} Java [OR]
    RewriteCond %{HTTP_USER_AGENT} NjuiceBot [OR]
    RewriteCond %{HTTP_USER_AGENT} Gigabot [OR]
    RewriteCond %{HTTP_USER_AGENT} Baiduspider [OR]
    RewriteCond %{HTTP_USER_AGENT} JS-Kit [OR]
    RewriteCond %{HTTP_USER_AGENT} Voyager [OR]
    RewriteCond %{HTTP_USER_AGENT} PostRank [OR]
    RewriteCond %{HTTP_USER_AGENT} PycURL [OR]
    RewriteCond %{HTTP_USER_AGENT} Aport [OR]
    RewriteCond %{HTTP_USER_AGENT} ia_archiver [OR]
    RewriteCond %{HTTP_USER_AGENT} DotBot [OR]
    RewriteCond %{HTTP_USER_AGENT} SurveyBot [OR]
    RewriteCond %{HTTP_USER_AGENT} larbin [OR]
    RewriteCond %{HTTP_USER_AGENT} Butterfly [OR]
    RewriteCond %{HTTP_USER_AGENT} libwww [OR]
    RewriteCond %{HTTP_USER_AGENT} Wget [OR]
    RewriteCond %{HTTP_USER_AGENT} SWeb [OR]
    RewriteCond %{HTTP_USER_AGENT} LinkExchanger [OR]
    RewriteCond %{HTTP_USER_AGENT} Soup [OR]
    RewriteCond %{HTTP_USER_AGENT} WordPress [OR]
    RewriteCond %{HTTP_USER_AGENT} PHP/ [OR]
    RewriteCond %{HTTP_USER_AGENT} spbot [OR]
    RewriteCond %{HTTP_USER_AGENT} MLBot [OR]
    RewriteCond %{HTTP_USER_AGENT} InternetSeer [OR]
    RewriteCond %{HTTP_USER_AGENT} FairShare [OR]
    RewriteCond %{HTTP_USER_AGENT} Yeti [OR]
    RewriteCond %{HTTP_USER_AGENT} Birubot [OR]
    RewriteCond %{HTTP_USER_AGENT} YottosBot [OR]
    RewriteCond %{HTTP_USER_AGENT} gold\ crawler [OR]
    RewriteCond %{HTTP_USER_AGENT} Linguee [OR]
    RewriteCond %{HTTP_USER_AGENT} Ezooms [OR]
    RewriteCond %{HTTP_USER_AGENT} lwp-trivial [OR]
    RewriteCond %{HTTP_USER_AGENT} Purebot [OR]
    RewriteCond %{HTTP_USER_AGENT} User-Agent [OR]
    RewriteCond %{HTTP_USER_AGENT} kmSearchBot [OR]
    RewriteCond %{HTTP_USER_AGENT} SiteBot [OR]
    RewriteCond %{HTTP_USER_AGENT} CamontSpider [OR]
    RewriteCond %{HTTP_USER_AGENT} ptd-crawler [OR]
    RewriteCond %{HTTP_USER_AGENT} HTTrack [OR]
    RewriteCond %{HTTP_USER_AGENT} suggybot [OR]
    RewriteCond %{HTTP_USER_AGENT} ttCrawler [OR]
    RewriteCond %{HTTP_USER_AGENT} Nutch [OR]
    RewriteCond %{HTTP_USER_AGENT} SputnikBot [OR]
    RewriteCond %{HTTP_USER_AGENT} Slurp [OR]
    RewriteCond %{HTTP_USER_AGENT} bingbot [OR]
    RewriteCond %{HTTP_USER_AGENT} MSIE [OR]
    RewriteCond %{HTTP_USER_AGENT} AhrefsBot [OR]
    RewriteCond %{HTTP_USER_AGENT} Zeus
    RewriteRule ^(.*)$ – [F,L]
    robots.txt
    В правильное место указать временный промежуток для поисковиков сразу, а потом уже прописать правило обработки ссылок.

    Код (CODE):
    1. Crawl-delay: 40
    2. User-agent: *
    3. Disallow: /administrator/

    Проверено на reg.ru и Яндекс.боте. Нагрузка CPU с 25% снизилась до 5-7%. Иначе хостер предлагал перейти на другой тариф.
     
    Последнее редактирование: 17.07.2016
    Alekxandr, buffalo-ny, Дмитрий Д и ещё 1-му нравится это.
  2.  
  3. Asylum
    Offline

    Asylum специалист

    Регистрация:
    09.02.2007
    Сообщения:
    2 571
    Симпатии:
    152
    Пол:
    Мужской
    Как то у меня стал тормозить довольно неслабый хостинг, провайдер слал гневные письма о превышении нагрузки. Оказалось ресурс ложил adsense google bot
     
  4. buffalo-ny
    Offline

    buffalo-ny Недавно здесь

    Регистрация:
    17.09.2013
    Сообщения:
    4
    Симпатии:
    0
    Пол:
    Мужской
    Разве это не обычный Internet Explorer?
     
  5. Kniazsveta
    Offline

    Kniazsveta Недавно здесь

    Регистрация:
    09.06.2016
    Сообщения:
    7
    Симпатии:
    0
    Пол:
    Мужской
    Если сайт расчитан на буржуев, то не стоит банить Bing, он там на хорошем счету.
     
  6. Offline

    Den0riginal Недавно здесь

    Регистрация:
    18.11.2015
    Сообщения:
    12
    Симпатии:
    0
    Пол:
    Мужской
    У меня почему-то приходится оставлять 2 последних бота без [OR] вместо 1го, если только последний без [OR], сайт 403 ошибку выдает.
     
  7. draff
    Offline

    draff Russian Joomla! Team Команда форума

    Регистрация:
    17.01.2011
    Сообщения:
    6 041
    Симпатии:
    518
    Пол:
    Мужской
    Это как, не понял. Как правильно указал
    Попробуй удали директиву, если ты пользуешься ИЕ
    Код (PHP):
    1. RewriteCond %{HTTP_USER_AGENT} MSIE [OR]
     
  8. Offline

    Den0riginal Недавно здесь

    Регистрация:
    18.11.2015
    Сообщения:
    12
    Симпатии:
    0
    Пол:
    Мужской
    В общем у меня так:
    RewriteCond %{HTTP_USER_AGENT} bingbot [NC,OR]
    RewriteCond %{HTTP_USER_AGENT} AhrefsBot [NC,OR]
    RewriteCond %{HTTP_USER_AGENT} mj12bot [NC,OR]
    RewriteCond %{HTTP_USER_AGENT} MegaIndex [NC,OR]
    RewriteCond %{HTTP_USER_AGENT} Yahoo [NC,OR]
    RewriteCond %{HTTP_USER_AGENT} Gigabot [NC]
    RewriteCond %{HTTP_USER_AGENT} Trident [NC]
    RewriteRule ^(.*)$ – [F,L]
    Если делаю Gigabot [NC,OR] то сайт падает.
     
  9. buffalo-ny
    Offline

    buffalo-ny Недавно здесь

    Регистрация:
    17.09.2013
    Сообщения:
    4
    Симпатии:
    0
    Пол:
    Мужской
    Причем тут браузер которым я пользуюсь? Есть существенный процент посетителей которые пользуются Internet Explorer и если оставлять это правило фильтрации useragent, то нормальные посетители не зайдут на сайт с такими браузерами:
    Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0; MAARJS)
    Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)
    Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/6.0)
    Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; .NET4.0E)
    Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.0)

    NC - это директива NoCase которая указывает не обращать внимание на регистр, потому скорее всего у вас проблема в чем-то другом. Посмотрите логи вебсервера.
     
  10. draff
    Offline

    draff Russian Joomla! Team Команда форума

    Регистрация:
    17.01.2011
    Сообщения:
    6 041
    Симпатии:
    518
    Пол:
    Мужской
    @Den0riginal
    Ну получается что работает только одна последняя директива на юзер-агента
     

Поделиться этой страницей

Загрузка...