Sitemap - проиндексированные URL

Тема в разделе "Структура данных сайта", создана пользователем Пыж, 03.07.2009.

  1. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Joomla v.1.0. Стандартными средствами сгенерен файл Sitemap, скормлен Гуглу, из 7 URL`ов проиндексированы 6...
    Особенно странно то, что в главном меню сайта - 10 позиций, т.е. как минимум должно бы вроде быть 10 URL`ов?
    А уж если учитывать у внутренние ссылки... Полагаю, что при генерации файла что-то надо в настройках поменять, но вроде там все достаточно корректно было выбрано...

    Есть идеи?
     
  2.  
  3. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    если отправлено недавно - ждать
    если давно - провести ревизию генератора сайтмап на предмет включенияменю/разделов/категорий для вывода
     
  4. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Отправлено давно.

    В конфигурации Joomap отчекено "Раскрыть категории", "Раскрыть секции", "Помечать внешние ссылки", "кол-во столбцов - 1".
    Исключены идентификаторы меню таких малозначимых пунктов, как Joomla Wiki, контакты, ссылки и прочий мусор.

    Сформирован файл,в котором 8 URL (в принципе, все разделы, которые я хотел бы там видеть, в нем присутствуют...). Но по отчету Гугля, отправлено 7, проиндексировано 6... Вот это и не понятно.

    И попутно вопрос для общего развития: при наличии форума на сайте, он индексируется как 1 URL, вне зависимости от его наполнения темами?
     
  5. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    если добавить расширения для карты сайта для используемых расширений (вот как загнул) то он в xml будет отправлять то, что разрешено
    1. какой компонент генерации карты сайта?
    2. установлены/включены/настроены ли плагины/экстенжены для него под используемые насайте сторонние расширения
    3. опубликована ли карта сайта?
     
  6. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    1. Joomap, если это имелось в виду...
    2. Вот это вряд ли - просто слабо понимаю, о чем речь. Впрочем, сторонних расширений у меня - FireBoard, пожалуй, да и все. Но он работает корректно...
    3. Карта сайта опубликована - к этому претензий у того же Гугла нет.
     
  7. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    я про "дай ссылку на карту в виде странице на сайте и в виде ссылки для панели администратора гугла - посмотрю, может ошибки где
     
  8. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Сорри, уезжал на выходные...

    Карты сайта в виде страницы нет - она опубликована в корне, как и положено (т.е. доступ роботам туда есть).

    Код (PHP):
    1. <?xml version="1.0" encoding="UTF-8" ?>
    2. - <urlset xmlns="http://www.google.com/schemas/sitemap/0.84">
    3. - <url>
    4.   <loc>http://carpc-project.ru/content/view/14/39/</loc>
    5.   </url>
    6. - <url>
    7.   <loc>http://carpc-project.ru/content/view/12/37/</loc>
    8.   </url>
    9. - <url>
    10.   <loc>http://carpc-project.ru/content/view/13/38/</loc>
    11.   </url>
    12. - <url>
    13.   <loc>http://carpc-project.ru/content/view/15/40/</loc>
    14.   </url>
    15. - <url>
    16.   <loc>http://carpc-project.ru/content/view/16/41/</loc>
    17.   </url>
    18. - <url>
    19.   <loc>http://carpc-project.ru/component/option,com_contact/Itemid,3/</loc>
    20.   </url>
    21. - <url>
    22.   <loc>http://carpc-project.ru/content/view/19/49/</loc>
    23.   </url>
    24. - <url>
    25.   <loc>http://carpc-project.ru/component/option,com_fireboard/Itemid,47/</loc>
    26.   </url>
    27.   </urlset>


    В самом файле URl`ы тоже достаточно корректно прописаны - во всяком случае, меня бы такое устроило вполне. Полагаю, что непроиндексированными остались 6-й и 8-й, т.е. те, путь к которым отличается от .../content/view/...

    О, кажись, догнал :) :

    Вот только если эту строчку из robots.txt убрать, то доступ откроется ко всей папке components, что, наверное, не есть хорошо? Тогда вопрос меняется - как сделать исключение из этого правила для форума, т.е для /component/option,com_fireboard/Itemid,47/?

    Не зря говорят, что правильно заданный вопрос - половина ответа: пока расписывал проблему, кое-что стало много яснее :[
     

    Вложения:

    • sitemap.jpg
      sitemap.jpg
      Размер файла:
      32.5 КБ
      Просмотров:
      5
    • sitemap1.jpg
      sitemap1.jpg
      Размер файла:
      25.4 КБ
      Просмотров:
      4
  9. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    Allow /component/option,com_fireboard/
     
  10. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    2 doctorgrif

    Спасибо! Я так понимаю, что эту строку надо добавить в robots.txt и без /Itemid,47/?
     
  11. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    да, но правильнее будет ее записать без SEF сокращения
     
  12. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Мои извинения, а это как, без SEF сокращения?
     
  13. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    открой меню, через которое у тебя ссылка на форум выводится (в админке), кликни на пункте меню Форум - скопируй его путь и обрежь по типу данной конструкции
     
  14. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Если я правильно понял (в админке выбираю раздел главного меню и копирую из него ссыль на форум) - получается такая вот конструкция:
    ***/administrator/index2.php?option=com_menus&menutype=mainmenu&task=edit&id=47&hidemainmenu=1
    Что-то мне кажется, что обрезать тут надо практически все... И чем оставшееся будет отличаться от
    /component/option,com_fireboard/ ?
     
  15. doctorgrif
    Offline

    doctorgrif специалист

    Регистрация:
    14.01.2008
    Сообщения:
    1 284
    Симпатии:
    66
    Пол:
    Мужской
    option=com_fireboard
     
  16. Пыж
    Offline

    Пыж Недавно здесь

    Регистрация:
    13.02.2009
    Сообщения:
    22
    Симпатии:
    0
    Пол:
    Мужской
    Т.е. в robots.txt надо добавить строку Allow option=com_fireboard ?
    (прошу прощения за тупость - ламер я в этих вопросах...)

    Добавил строку Allow /component/option,com_fireboard/.
    Результат: отправлено 7, проиндексировано 5...
    Ошибок и предупреждений не найдено.
     
    Последнее редактирование: 06.07.2009

Поделиться этой страницей

Загрузка...