Заглянул в Яндекс для вебмастеров - тысячи загруженных страниц и среди них куча хлама: почтовые формы и т.п. Вот и думаю: как правитьно организовать robots.txt под Яшу - там вроде бы спецсимволы поддерживаются. Вот думаю, может вообще запретить /index2.php?* ? Или не стоит? А вообще хотелось бы посмотреть на готовые решения, чтобы не изобретать велосипел и не нагородть лишнего. Если не жалко конечно
Ответ: Грамотный robots.txt От robots.txt можнно сказать никакого толка нет, если только ваш сайт использует несколько доменов, в нём можно указать основной, чтобы все не попали в чс яши.
Ответ: Грамотный robots.txt Скажите пожалуйста как правильно указать в robot.txt адрес к sitemap.xml и обязательно это указывать или нет
Меня интересует вопрос можно ли Robots.txt прописать Disallow: /view-document-details*, sh404SEF создает ЧПУ ссылки вида http://www.k-volt.ru/view-document-details........., я не хочу, чтобы роботы индексировали эти страницы
Re: Ответ: Грамотный robots.txt В Robots.txt указывается так, если нет другого выхода Sitemap: http://www.site.ru/sitemap.xml но лучше делать через панель веб-мастера в Google
драсти форумчане. Ситуация: 1 игровой комп, 2 сервер на котором стоит Joomla. Оба компа за роутером Dir 100 (внешний ип белый). Суть вопроса - возможно ли запретить доступ к админке через robot.txt из ИНЕТА, но не запрещен со второго компа (т е локалки ) ? или это настраивается каким то другим путем ? как вариант роутер, или в самом файле хостов сервера, или в самой джумле есть опции ? можно этот вопрос как то освятить ? Чтобы мог заходить через http://192.168.0.100/administrator/ но не мог ни я ни кто либо другой зайти через http://mysite.com/administrator/ Ибо сильно страдаю параноей ((( За ранее спсб.
Ну так вот ответ на самый первый вопрос где? Отошли от темы, господа, отошли. Так и не дав ответа, а жаль
Re: Ответ: Грамотный robots.txt Внатуре человек с головой не дружит. Так же и я могу сказать - нахрена тебе голова, от неё, можно сказать никакого толка нет, а теперь по делу, обращаюсь к создателю темы - можешь посмотреть роботс на моём сайте вот ссылка http://orenmat.ru/robots.txt НО! Большое НО! Мой сайт, находится на хостинге, который увы не поддерживает ЧПУ. Переносить его куда то я не хочу, да и ссылки для сайта закуплены с вот такими нечитабельными адресами. Редиректы тоже не хочется прописывать, так что оставил как есть, а проблему с дублями решил следующим образом. Для каждой страницы в джумла есть свой вариант с датой вместо вместо псевдонима на английском в адресной строке. Я знаю, что материалы были созданы мной в 2011 и 2012 голу не раньше, поэтому я запретил в робо любую последовательность связанную с этими датами. Насколько это правильно - хз, пока провожу опыты с этим делом, но частично избавится от дублей должно помочь. А если у тебя с ЧПУ всё впорядке и хостинг поддерживает sef, то вот роботс который я считаю близким к совершенству для джумла Код (PHP): User-agent: * Allow: /index.php?option=com_xmap&sitemap=1&view=xml&no_html=1 Disallow: /administrator/ Disallow: /cache/ Disallow: /components/ Disallow: /includes/ Disallow: /installation/ Disallow: /language/ Disallow: /libraries/ Disallow: /media/ Disallow: /modules/ Disallow: /plugins/ Disallow: /templates/ Disallow: /tmp/ Disallow: /xmlrpc/ Disallow: /*.pdf Disallow: /*.swf Disallow: /*print=1 Disallow: /*mailto/ Disallow: /index.php? Disallow: /index.php Disallow: /index2.php Disallow: /index.html Disallow: /home Disallow: /*task=vote* Disallow: /*=watermark* Disallow: /*=download* Disallow: /*user/* Disallow: /.html Disallow: /404 Disallow: /*keyword= Disallow: /*pop=0 Disallow: /*product-search Disallow: /*flypage= Disallow: /*cart Disallow: /*feed Disallow: /*% Sitemap: http://erotech.org/index.php?option=com_xmap&sitemap=1&view=xml&no_html=1 User-agent: Yandex Allow: /index.php?option=com_xmap&sitemap=1&view=xml&no_html=1 Disallow: /administrator/ Disallow: /cache/ Disallow: /components/ Disallow: /includes/ Disallow: /installation/ Disallow: /language/ Disallow: /libraries/ Disallow: /media/ Disallow: /modules/ Disallow: /plugins/ Disallow: /templates/ Disallow: /tmp/ Disallow: /xmlrpc/ Disallow: /*.pdf Disallow: /*.swf Disallow: /*print=1 Disallow: /*mailto/ Disallow: /index.php? Disallow: /index.php Disallow: /index2.php Disallow: /index.html Disallow: /home Disallow: /*task=vote* Disallow: /*=watermark* Disallow: /*=download* Disallow: /*user/* Disallow: /.html Disallow: /404 Disallow: /*keyword= Disallow: /*pop=0 Disallow: /*product-search Disallow: /*flypage= Disallow: /*cart Disallow: /*feed Disallow: /*% Host: http://erotech.org Sitemap: http://erotech.org/index.php?option=com_xmap&sitemap=1&view=xml&no_html=1 Это для другого моего сайта с поддержкой ЧПУ жду ваших комментариев
Тестируйте, а потом отпишите результат,я вот сейчас тоже жду очередное обновление в панели вебмастеров, по нему уже буду делать выводы и поправки если необходимо,