Оптимальный robots.txt для блога
Файл robots.txt лекарство для блогов WordPress, несмотря на свою гибкость и податливость на изменения в коде, этот движок блога не обладает по умолчанию файлом robots.txt, что для новичков может стать настоящей проблемой. А для внутренней оптимизации этот небольшой файл очень важен. Вот как создать robots.txt для своего блога рассмотрим далее.
О да, блог будет отлично индексироваться и без robots.txt и скорее всего первый пост попадет в индекс шустрого Гугла уже через 3-5 часов. Но что повлечет за собой такая индексация впоследствии, вот в чем загвоздка. Последствия могут быть весьма плачевными, особенно для тех, кто потом в дальнейшем войдет в курс дела и поймет, что заранее не создав robots.txt получил кучу дубликата блога.
Для чего нужен robots.txt? При обращении поисковых ботов к блогу да и к сайту в частности, первым делом происходит сканирование на наличие этого файла, если таковой отсутствует блог будет все равно проиндексирован, но нужно ли это?
Файл robots.txt необходим не для управления поисковыми ботами, а для некоторого направления в индексации, говорящий им о том, что нужно индексировать, а что нет. Он ставит команду на запрет сканирования и занесения в базу поисковика некоторых нежелательных директорий блога.
Основная проблема при работе с WordPress, заключается в большом количестве дубликатов контента, который он создает. Под разными URL адресами на блоге можно найти один и тот же контент, что рассматривается поисковой системой как дубликат и она начинает постепенно применять к блогу свои фильтры. Сюда можно отнести адреса: рубрик, категорий, тегов, RSS канала, запросов через поиск и еще массу ненужных для внесения в базу поисковика адресов – входа в панель администрации WordPress и административную папку в целом.
Чтобы решить проблему дубликатов контента, естественно необходимо создать robots.txt для блога WordPress. У каждого он может быть свой в зависимости от названия папок в корневой части блога и смотря, что Вы хотите срыть от поисковых ботов. Приведу лишь пример файла, который использую на своем блоге. Путем некоторых экспериментов у меня вышел следующий robots.txt, который я считаю наиболее эффективным для WordPress:
User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /tag/
Disallow: /page/
Disallow: /trackback/
Disallow: /feed/- запрет фида канала RSS
Disallow: /comments/ – данную строку указывать, если хотите запретить комментарии
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
Sitemap: http://seocekret.ru/sitemap.xml- карта блога
User-agent: Yandex – команды поисковому боту Яндекса
Disallow: /cgi-bin/
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /wp-includes/
Disallow: /xmlrpc.php
Disallow: /wp-admin
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /tag/
Disallow: /page/
Disallow: /trackback/
Disallow: /feed/ – запрет фида канала RSS
Disallow: /comments/ – данную строку указывать, если хотите запретить комментарии
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
Host: seocekret.ru- адрес хоста, которым нужно исключить зеркала для Яндекса с www
Строки которые не расписаны в объяснении, думаю и так можно догадаться, что они запрещают. Хочу лишь обратить особое внимание на запрет *?* и *? – данная команда даст роботу запрет на индексацию динамических адресов блога, которые обычно по умолчанию создаются при написании постов, и если у Вас URL адреса страниц имеют именно такой вид со знаком вопроса, то обязательно исключите эти команды из файла robots.txt.
Если на блоге Вы используете вид статических адресов, например http://seocekret.ru/blog/, формируя их с помощью плагина, то оставьте все как есть. Создать robots.txt довольно просто – достаточно открыть блокнот и скопировать в него вышеуказанные строки, затем сохранить файл с расширением txt. После чего залейте его в корневой каталог блога, через FTP или непосредственно с панели хостера управления блогом.
Надежные в работе в российских условиях, выгодные цены – автомобили Дэу, всегда пользовались спросом на авторынке
Читать похожие статьи:
Не забывайте подписаться на обновления SEO блога по RSS!


16 Комментариев
Март 22nd, 2009
У меня гораздо короче файл robots.txt
Скажите, пожалуйста, если сейчас мне внести изменения (блогу полгода), добавить строчки команд, это может повлиять на индексацию блога?
Март 22nd, 2009
Вообще срок когда вносить изменения вроде не ограничен. С блогом я работаю тоже не так давно, поэтому с файлом robots.txt проводил опыты, в течении месяца, пока не исключил все дубли и добился нормальной индексации всеми поисковиками. Так, что внести всегда можно, но только нужно с ним поосторожнее, чтобы не запретить к индексу чего лишнего.
Март 22nd, 2009
В Вашем примере ведь ничего лишнего не запрещено, надеюсь?
Если я добавлю
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /tag/
Disallow: /page/
Disallow: /trackback/
Disallow: /feed/
Disallow: /comments/
Disallow: */trackback/
Disallow: */feed/
Disallow: */comments/
Disallow: /?feed=
Disallow: /?s=
Disallow: /*?*
Disallow: /*?
хуже не станет, я думаю.
У меня лучше индексирует Гугл, чем Яндекс. Надеюсь, изменения помогут. Тем более, что делаете выводы на собственной практке, а у меня совершенно ни знаний в этой области, ни тем более опыта, нет.
Март 22nd, 2009
Как раз в этом примере исключены дубликаты.
А вот строчки – Disallow: /comments/ – если хотите закрыть от индексации комментарии на блоге
Disallow: /*?*
Disallow: /* – если у Вас адреса страниц не динамического вида, то есть без знака ?
Если адреса содержат знак ?, то вы их все закроете для поисковиков, в этом случае исключите эти строки.
Март 23rd, 2009
В адресах у меня вопросиков нет, плагин делает их человеко-понятными.:)
Но я не пойму, что писать и не писать мне в таком случае?
Что дает закрытие от индексации комментариев?
Март 23rd, 2009
Комментарии закрываются к индексации: Disallow: /comments/ и Disallow: */comments/.
Но можно их и не закрывать если хотите, чтобы контент комментариев индексировался, а закрыть ссылки в комментариях тегами noindex и nofollow
Сентябрь 28th, 2009
Подойдет ли выше сказанное не к моему сайту на народе (удалено)
Сентябрь 28th, 2009
Подойдет только для блогов, вообще для каждого сайта создается уникальный robots в зависимости от структуры и желания закрыть от индексации.
Февраль 7th, 2010
А почему Вы тэги закрыли от индексации, а рубрики (категории) нет? Разве их индексация не создаёт дубли?
Февраль 7th, 2010
Хороший вопрос Ян, действительно открытая индексация рубрик – это дубли, но все же дубликаты смешанные, то есть не копии полных статей а анонсов нескольких их, и Яндекс вполне неплохо к этому относится (из личных наблюдений) даже неплохо ранжирует такие страницы в выдаче. А вот архивы и теги – это уже перебор…. Если, что можно выбрать что то одно. Эх не все может быть идеальным, из двух зол выбираем меньшее
Февраль 20th, 2010
Спасибо, что делаете полезное дело. А то у меня с этим проблема как раз была. И ваша статья очень кстати.
Февраль 20th, 2010
У меня строка */feed/ не закрывала индексацию адресов типа http://site.ru/super-post.html/feed от индексации яндексом. Изменил на */feed и всё стало ок.
Июль 5th, 2010
а как сделать следующее:
«После чего залейте его в корневой каталог блога, через FTP или непосредственно с панели хостера управления блогом», не могли бы по-подробнее?
Июль 5th, 2010
Елена, через FTP – значит у вас должен быть доступ к сайту при помощи файлового менеджера (например Тотал Коммандер), или через панель хостинга – просто переместите созданный вами файл robots.txt в папку с сайтом.
Август 17th, 2010
Щоб я не писав,усе одно виходить ошибка «User-agent: *
Disallow: /»
І сайт не індиксує
Сентябрь 1st, 2010
Сделал все как написал, может совпадение или еще что но количество проиндексированых страниц немного увеличилось. Я на днях воспользовался авто регистрацией, может еще от туда. Но Статья то что нада, мне помогла!
Добавить комментарий