Этот фаил служит помощником и путеводителем для робота поисковой системы, он должен располагаться в корневой попке вашего сайта. На сайте может быть только один файл «/robots.txt». Протокол ограничения поисковых роботов (Robots Exclusion Protocol) - это метод, позволяющий администраторам веб-сайтов указывать поисковых роботам, посещающим сайт, какие части их сайтов индексировать нельзя. При заходе на ваш сайт поисковый робот загружает файл robots.txt, содержащий инструкции что можно и что нельзя индексировать. 
Файл можно создать, используя простой текстовый редактор, например блокнот, а можно воспользоваться программами или услугами сайтов по созданию этого файла в автоматическом режиме.

Файл robots.txt состоит из двух  команд: строка пользовательского агента (User-agent) и строка запрета (Disallow).

примеры файлов robots.txt


 

Правильный robots.txt для сайта на Joomla

print
User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/

 


robots.txt для форума SMF:

User-agent: *
Allow: /forum/*sitemap
Allow: /forum/*arcade # если не стоит мод игр, удалить без пропуска строки
Allow: /forum/*rss
Allow: /forum/*type=rss
Disallow: /forum/attachments/
Disallow: /forum/avatars/
Disallow: /forum/Packages/
Disallow: /forum/Smileys/
Disallow: /forum/Sources/
Disallow: /forum/Themes/
Disallow: /forum/Games/
Disallow: /forum/*.msg
Disallow: /forum/*.new
Disallow: /forum/*sort
Disallow: /forum/*topicseen
Disallow: /forum/*wap
Disallow: /forum/*imode
Disallow: /forum/*action
Disallow: /forum/*prev_next
Disallow: /forum/*all
Disallow: /forum/*go.php # либо тот редирект что стоит у вас
Host: www.мой сайт.ru # указать ваше главное зеркало

User-agent: Slurp
Crawl-delay: 100

 

Основные команды для файла robots.txt

Запретить весь сайт для индексации всеми роботами

User-agent: *
Disallow: /

 


Разрешить всем роботам индексировать весь сайт

User-agent: *
Disallow:

 


 

Закрыть от индексации только несколько каталогов

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /private/

 


Запретить индексацию сайта только для одного робота

User-agent: BadBot
Disallow: /

 


 

Разрешить индексацию сайта одному роботу и запретить всем остальным

User-agent: Yandex
Disallow:

User-agent: *
Disallow: /