Разместить на сайте PDF файлы для скачивания

Тема в разделе "Наполнение", создана пользователем rizespb, 20.11.2012.

  1. Offline

    rizespb Недавно здесь

    Регистрация:
    20.11.2012
    Сообщения:
    9
    Симпатии:
    0
    Пол:
    Мужской
    Друзья, вот такой вопрос созрел:

    Я размещаю на сайте pdf документы для скачивания.

    Вопрос первый:
    Как закрыть от индексации поисковыми системами страницы, на которых размещены ссылки на эти файлы, и сами pdf файлы. Натыкался, что иногда Яндекс или Google выдает в результатах поиска содержимое doc или pdf документов, размещенных на каком-либо файле. Хочу избежать такой ситуации.

    Второй вопрос:
    Как сделать так, чтобы при клике на ссылку для скачивания файла файл по умолчанию начинал скачиваться, но не открывался в браузере.

    Буду очень признателен за помощь/
     
  2.  
  3. OlegK
    Offline

    OlegK Russian Joomla! Team Команда форума ⇒ Профи ⇐

    Регистрация:
    17.01.2011
    Сообщения:
    7 812
    Симпатии:
    771
    Пол:
    Мужской
    <a href="#" rel="noindex"></a>
     
  4. CB9T
    Offline

    CB9T Преподаватель по J! Команда форума ⇒ Профи ⇐

    Регистрация:
    21.05.2010
    Сообщения:
    2 604
    Симпатии:
    322
    Пол:
    Мужской
    Не совсем :)
    С помощью директивы AddType с параметром application/octet-stream можно указать серверу файлы, которые нужно отдавать на загрузку, а не открывать их в браузере. Например, следующие директивы в .htaccess, указывают серверу, что файлы с расширением .pdf и .img следует отдавать на загрузку при их открытии:

    Код (PHP):
    1. AddType application/octet-stream .pdf
    2. AddType application/octet-stream .img


    А если просто закрыть от индексации, то в robots.txt

    пример запрета индексации файлов PDF для гугл


    Код (PHP):
    1. User-agent: Googlebot
    2.  
    3. Disallow: *.pdf$
     
    rizespb нравится это.
  5. Offline

    rizespb Недавно здесь

    Регистрация:
    20.11.2012
    Сообщения:
    9
    Симпатии:
    0
    Пол:
    Мужской
    CB9T, спасибо! Это то, что нужно! Вы уже ответили на мой вопрос, но если будет возможность, буду благодарен, если уточните несколько моментов:

    Что значит знак $ в строке:

    Disallow: *.pdf$

    Несколько раз встречал, что в файле robots нельзя использовать знаки подстановки, типа * и пр. Получается, что можно?

    А если просто переместить все документы pdf в одну папку, например, назвать папку doc, то правильной ли будет такая запись:

    User-agent: *

    Disallow: /doc/

    Кстати, если папку док имеет вложенную папку, например, pdf_docs (/doc/pdf_docs/), Disallow надо прописывать и для каждой вложенной папки

    User-agent: *

    Disallow: /doc/
    Disallow: /pdf_docs/

    Или достаточно прописать Disallow только для doc и это будет применимо для всех вложенных папок?

    И последний вопрос: когда я заливаю файлы на сервер, как лучше делать: оставлять названия файлов на русском кириллицей или переназвать заранее все файлы на латинице? Пробелы допустимы в названиях или их заменить на _ или - ?

    Почему-то я не вижу плюсик под Вашим аватаром, чтобы сказать спасибо(
     
  6. unihost.com
    Offline

    unihost.com Недавно здесь

    Регистрация:
    22.11.2012
    Сообщения:
    2
    Симпатии:
    1
    Пол:
    Мужской
    Спецсимволы типа * и $ использовать можно и даже нужно для удобства.

    По умолчанию к каждому правилу в роботс в конце дописывается *
    Т.е. запись:
    User-agent: *
    Disallow: /doc # блокирует доступ к страницам начинающимся с '/doc'
    идентична записи
    User-agent: *
    Disallow: /doc*​
    Знак $ отменяет * в конце записи, позволяя тем самым роботам индексировать страницы внутри директории doc.
    Для примера:
    Disallow: /page$ # запрещает '/page',
    # но не запрещает '/page.html'

    User-agent: *
    Disallow: /doc # запрещает и /doc/pdf_docs

    Я бы рекомендовал файлы сразу называть латиницей и вставлять вместо пробелов тире.
     
    rizespb нравится это.

Поделиться этой страницей

Загрузка...