Проблема конфликта robots и sitemap

Discussion in 'SEO - оптимизация, продвижение' started by NosferatuMax, Mar 30, 2013.

  1. Offline

    NosferatuMax Недавно здесь

    Joined:
    Jan 20, 2013
    Messages:
    20
    Likes Received:
    0
    Gender:
    Male
    Использую компонент Xmap для создания карты и вот возник вопрос:
    Как указать доступ к файлу сайтмап если он выглядит как:
    http://вашсайт/index.php?option=com_xmap&view=xml&tmpl=component&id=1
    а в robots.txt запрещены следующие URL дабы избежать дублей
    Disallow: /*index*
    Disallow: /*start*
    Disallow: /*component*
    Через .htacess пробовал добавил:
    RewriteCond %{REQUEST_URI} ^/sitemap.xml
    RewriteRule .* /index.php?option=com_xmap&sitemap=1&view=xml
    Пишет что доступ запрещен в robots.txt и выбивает ошибку 500.
    Подскажите пожалуйста может кто сталкивался и решил данную проблему...:'(
     
  2.  
  3. CB9T
    Offline

    CB9T Преподаватель по J! Staff Member ⇒ Профи ⇐

    Joined:
    May 21, 2010
    Messages:
    2,604
    Likes Received:
    322
    Gender:
    Male
  4. Offline

    NosferatuMax Недавно здесь

    Joined:
    Jan 20, 2013
    Messages:
    20
    Likes Received:
    0
    Gender:
    Male
    тоесть не будут работать правила написанные выше?
     
  5. Offline

    NosferatuMax Недавно здесь

    Joined:
    Jan 20, 2013
    Messages:
    20
    Likes Received:
    0
    Gender:
    Male
    При попытке доступа к вашему файлу Sitemap произошла ошибка. Убедитесь, что этот файл Sitemap соответствует нашим правилам и находится в указанном местоположении, а затем отправьте его повторно.
     
  6. CB9T
    Offline

    CB9T Преподаватель по J! Staff Member ⇒ Профи ⇐

    Joined:
    May 21, 2010
    Messages:
    2,604
    Likes Received:
    322
    Gender:
    Male
    http://help.yandex.ru/webmaster/?id=996567

    Код (PHP):
    1. Примечание: Не существовало на момент перевода данного текста, сейчас эта инструкция поддерживаетcя и Гуглом, и Яндексом. Уточняйте по использованию для других роботов.
    2.  
    3. Нет инструкции Allow, есть только Disallow. Файл robots.txt ничего не разрешает, только запрещает!
    4.  
    5.     Отдельные роботы (например googlebot) понимают директиву Allow
    6.  
    7. Так неправильно:
    8.  
    9.     User-agent: Yandex
    10.     Disallow: /john/
    11.     Allow: /jane/
    12.  
    13. А вот так – правильно:
    14.  
    15.     User-agent: Yandex
    16.     Disallow: /john/
    17.     Disallow:
     
  7. Offline

    NosferatuMax Недавно здесь

    Joined:
    Jan 20, 2013
    Messages:
    20
    Likes Received:
    0
    Gender:
    Male
    я это все читал, гугл бот не может перейти на страницу с картой потому что она содержит запрещенные выражения, потому и спаришваюи если какой то обход, т.к. убрать запрет не могу, появляются дубли страниц.
     

Share This Page

Loading...