Доброго времени суток, уважаемые читатели. Не так давно, говоря про внутреннюю оптимизацию сайтов, в основном подразумевали работу с контентом, с тегами HTML, сейчас же, можно с уверенностью утверждать, что внутренняя оптимизация сайтов давно вышла за эти рамки. И сегодня, обсуждая оптимизацию сайтов под поисковые системы, невозможно не затронуть тему внутренней структуры сайта, его навигацию, служебные файлы, такие как robots.txt и sitemap.xml. Об этом и пойдет сегодня речь на примере CMS WordPress.
Продумываем структуру сайта
Любые блоговые платформы строятся по единому принципу, на главной странице выводятся все записи, независимо от того, какой рубрике они принадлежат и есть ли вообще эти рубрики. Но в многофункциональном WordPress можно реализовать любую навигацию, запрещать выводить на главной определенные рубрики, подключать статические страницы, на которых можно выводить списки статей из нескольких рубрик.
Наверно, быстрее фантазия иссякнет, чем иссякнут возможности WordPress. И за всеми этими излишествами можно забыть о такой простой вещи, как структура сайта и удобная навигация по нему.
Стоит, наверно, уточнить, что я подразумеваю под структурой сайта. Открывая какую-либо папку на своем компьютере, мы можем проследить путь любого документа, его родительскую папку, в какой директории папок он находится.


Так и на сайте любой документ (страница) имеет свою директорию. И от вас зависит, какое место вы зададите каждой странице своего блога. Но, как для вашего пользователя, так и для поискового робота структура вашего сайта должна быть максимально прозрачна и интуитивно понятна. Не зря, в своих рекомендациях и Яндекс и Google уделяют этому не последнее значение.
Продумав внутреннюю структуру своего сайта, необходимо определить, как эта структура будет отображаться в адресной строке, какие параметры URL будут использованы.
Наверно, быстрее фантазия иссякнет, чем иссякнут возможности WordPress. И за всеми этими излишествами можно забыть о такой простой вещи, как структура сайта и удобная навигация по нему.
Стоит, наверно, уточнить, что я подразумеваю под структурой сайта. Открывая какую-либо папку на своем компьютере, мы можем проследить путь любого документа, его родительскую папку, в какой директории папок он находится.
Так и на сайте любой документ (страница) имеет свою директорию. И от вас зависит, какое место вы зададите каждой странице своего блога. Но, как для вашего пользователя, так и для поискового робота структура вашего сайта должна быть максимально прозрачна и интуитивно понятна. Не зря, в своих рекомендациях и Яндекс и Google уделяют этому не последнее значение.
Продумав внутреннюю структуру своего сайта, необходимо определить, как эта структура будет отображаться в адресной строке, какие параметры URL будут использованы.
Настраиваем ЧПУ
Правильно настроенные URL адреса называется ЧПУ – человеко-понятные урлы.
Сейчас поисковые системы настоятельно рекомендуют устанавливать человеко-понятные урлы, которые отражали бы содержание страницы. В WordPress по умолчанию стоят URL с использованием знака вопроса и ID поста и это необходимо исправить в разделе Параметры – Постоянные ссылки.
Здесь в первую очередь необходимо определиться, будет ли в адресе страницы присутствовать название вашей рубрики:
http://mysite.ru/category/name_category/name_postИли в URL вообще не будет отображаться полный путь документа:
http://mysite.ru/name_postОбращаю ваше внимание на то, что слово category в URL указывается по умолчанию, но об этом чуть ниже.
Этот момент очень важен, и стоит серьезно подумать, прежде, чем предпринять что-либо.
В первом случае большим преимуществом является то, что положение документа в структуре всего сайта четко прослеживается, значительно упрощая жизнь вашим пользователям/читателям, но при этом, значительно удлиняет сам URL, особенно, если структура сайта имеет вложенные категории.
Однако, существуют различные плагины или ручные методы для того, чтобы убрать слово category из адреса страницы. Советовать в данном посте ничего не буду по той причине, что плагин стоит подбирать индивидуально, пробовать разные, т.к. не на всех блогах корректно работают, а тема поста сегодня не об этом.
Второй вариант получается значительно короче, но при этом, для пользователей менее понятен. Лично я теряюсь на сайтах, у которых сложная структура и при этом в адресной строке не отображается моё местонахождение.
Хотя эта проблема решается, например, с помощью, так называемых, хлебных крошек, когда перед статьей обозначен путь от главной страницы через рубрики до страницы, на которой я нахожусь в данный момент (для WordPress есть специальный плагин для этого Breadcrumb NavXT.
И так, вы самостоятельно должны решить, какие страницы хотите иметь на своем блоге.
Если вы предпочли первый вариант http://mysite.ru/category/name_category/name_post, то отмечаете поле Произвольно и указываете: /%category%/%postname%/

И так, если вы установили такой вариант постоянных ссылок, то теперь вы можете для слова category в url, указать другое, более короткое значение, например, cat:

В таком случае, ваша ссылка http://mysite.ru/category/name_category/name_post преобразится в такой вид:
Если же вы выбрали второй вариант ссылок http://mysite.ru/name_post, то указываете только /%postname%/

Очень важно сделать все эти настройки сразу, как только вы установили свой блог и ещё не наполнили его информацией, особенно, если вы захотите скрыть часть url с помощью специальных плагинов.
Остается ещё одна важная деталь, касающаяся настройки ЧПУ. Дело в том, что после установки значения /%postname%/, все URL-адреса буду формироваться из заголовка статьи в тот момент, когда вы укажите этот заголовок при написании поста

Как видите, в URL кириллица. Не смотря на развитие кириллических доменов в зоне .рф, я придерживаюсь того мнения, что если домен имеет латинское написание, то и окончание ссылки должно быть написано латиницей. Для этого вы можете, либо каждый раз в ручную указывать латинское написание (для этого есть кнопка Изменить), либо необходимо установить специальный плагин RusToLat или RustoEng, который будет в автоматическом режиме переводить кириллицу в латиницу.
Разобравшись с настройкой ЧПУ, можно перейти к установке такого файла, как sitemap.xml.
Однако, существуют различные плагины или ручные методы для того, чтобы убрать слово category из адреса страницы. Советовать в данном посте ничего не буду по той причине, что плагин стоит подбирать индивидуально, пробовать разные, т.к. не на всех блогах корректно работают, а тема поста сегодня не об этом.
Второй вариант получается значительно короче, но при этом, для пользователей менее понятен. Лично я теряюсь на сайтах, у которых сложная структура и при этом в адресной строке не отображается моё местонахождение.
Хотя эта проблема решается, например, с помощью, так называемых, хлебных крошек, когда перед статьей обозначен путь от главной страницы через рубрики до страницы, на которой я нахожусь в данный момент (для WordPress есть специальный плагин для этого Breadcrumb NavXT.
И так, вы самостоятельно должны решить, какие страницы хотите иметь на своем блоге.
Если вы предпочли первый вариант http://mysite.ru/category/name_category/name_post, то отмечаете поле Произвольно и указываете: /%category%/%postname%/
И так, если вы установили такой вариант постоянных ссылок, то теперь вы можете для слова category в url, указать другое, более короткое значение, например, cat:
В таком случае, ваша ссылка http://mysite.ru/category/name_category/name_post преобразится в такой вид:
http://mysite.ru/cat/name_category/name_post.Или можете подыскать плагин, который без проблем вообще уберёт слово category из url-адресов.
Если же вы выбрали второй вариант ссылок http://mysite.ru/name_post, то указываете только /%postname%/
Очень важно сделать все эти настройки сразу, как только вы установили свой блог и ещё не наполнили его информацией, особенно, если вы захотите скрыть часть url с помощью специальных плагинов.
Если вы уже наполняете свой блог статьями, то установка плагина, скрывающего слово category, или ручное вмешательство в код, может привести к тому, что некоторые страницы блога начнут отдавать 404 ошибку, т.е. не будут найдены, т.к. будут находится по новым адресам.
Остается ещё одна важная деталь, касающаяся настройки ЧПУ. Дело в том, что после установки значения /%postname%/, все URL-адреса буду формироваться из заголовка статьи в тот момент, когда вы укажите этот заголовок при написании поста
Как видите, в URL кириллица. Не смотря на развитие кириллических доменов в зоне .рф, я придерживаюсь того мнения, что если домен имеет латинское написание, то и окончание ссылки должно быть написано латиницей. Для этого вы можете, либо каждый раз в ручную указывать латинское написание (для этого есть кнопка Изменить), либо необходимо установить специальный плагин RusToLat или RustoEng, который будет в автоматическом режиме переводить кириллицу в латиницу.
Разобравшись с настройкой ЧПУ, можно перейти к установке такого файла, как sitemap.xml.
Файл sitemap.xml
Файл sitemap.xml – это файл, в котором перечисляются url-адреса всех страниц вашего сайта в специальном формате. Файл sitemap.xml всегда находится в директории сайта и имеет адрес: http://mysite.ru/sitemap.xml.
С одной стороны, наличие этого файла не является обязательным, но, я считаю, он достаточно важен, т.к. только благодаря ему мы можем сообщить поисковой системе о том, какие страницы вообще есть на нашем сайте, особенно в тех случаях, если используется сложная навигация по сайту, так же, поисковые системы постоянно проверяют эти файлы на наличие обновлений. Например, вы давно не писали в свой блог, и поисковый робот не заходил индексировать его, но при этом он постоянно смотрит, не появилась ли какая новая информация в вашем файле sitemap.xml.
Этот файл можно составлять, как вручную (для небольших проектов, однажды я этим занималась для одного статического сайта) или, что более удобно и актуально для современных динамических сайтов, воспользоваться специальным плагином, который в автоматическом режиме формирует список всех страниц вашего блога. И даже используя плагин, если у вас возникнет необходимость внести изменения в этот файл, это всегда можно сделать напрямую через FTP или панель хостера.
Для WordPress самым популярным плагином, который формирует файл sitemap.xml является Google XML Sitemaps.
Так же, существуют отдельные файлы sitemap.xml, например, для мультимедийного контента, видео-роликов.
Последние версии WordPress – мультисайтовые, т.е. на одном сайте/блоге можно создавать большое количество других блогов, которые могут вести зарегистрированные пользователи. Выглядеть это будет, примерно, как блоги на Blogger, которые все находятся на домене blogspot.com. Так вот для таких случаев существует своя карта сайта, которая может объединять все блоги в единое содержание.
Если вы хотите настроить карту сайта для пользователей, то для этого существует специальный плагин, который вы должны установить и настроить. Подробнее можете прочитать в статье Как создать полноценную карту сайта на WordPress.
Этот файл можно составлять, как вручную (для небольших проектов, однажды я этим занималась для одного статического сайта) или, что более удобно и актуально для современных динамических сайтов, воспользоваться специальным плагином, который в автоматическом режиме формирует список всех страниц вашего блога. И даже используя плагин, если у вас возникнет необходимость внести изменения в этот файл, это всегда можно сделать напрямую через FTP или панель хостера.
Для WordPress самым популярным плагином, который формирует файл sitemap.xml является Google XML Sitemaps.
Так же, существуют отдельные файлы sitemap.xml, например, для мультимедийного контента, видео-роликов.
Последние версии WordPress – мультисайтовые, т.е. на одном сайте/блоге можно создавать большое количество других блогов, которые могут вести зарегистрированные пользователи. Выглядеть это будет, примерно, как блоги на Blogger, которые все находятся на домене blogspot.com. Так вот для таких случаев существует своя карта сайта, которая может объединять все блоги в единое содержание.
Если вы хотите настроить карту сайта для пользователей, то для этого существует специальный плагин, который вы должны установить и настроить. Подробнее можете прочитать в статье Как создать полноценную карту сайта на WordPress.
Файл Robots.txt
После установки и настройки плагина, следующим этапом должна стать настройка файла robots.txt. Я уже писала о том, что это очень важный документ для любого сайта, с помощью которого мы можем управлять индексацией своего ресурса.
Только с его помощью мы можем сказать поисковому роботу, какие страницы необходимо индексировать, а какие нет. И как уже не раз говорила, для поисковой системы очень важно показывать пользователям именно те страницы, которые максимально отвечают на вопрос пользователей.
Если же из-за непродуманной структуры сайта, или по другой причине у вас создается дублирование страниц, то поисковая система может все похожие страницы понизить в поисковой выдаче, т.к. не сможет определиться с тем, какая из них является первоисточником.
Так же, благодаря этому файлу мы можем закрывать служебные страницы сайта, которые вообще не должны появляться в поисковой выдаче.
Изначально, я планировала описать, как настройку плагина Google XML Sitemaps, так и весь процесс составления файла robots.txt уже в этой статье, но по ходу написания, вижу, что это займет слишком много времени, а пост получится сильно длинным.
Поэтому о настройке файла robots.txt очень подробно будет в следующей статье. Будет очень подробно потому, что я хочу не только дать готовый вариант этого файла для WordPress, а объяснить всю технологию составления этого документа.
Обновление: Статья про файл robots.txt опубликована - Файл Robots.txt. Оптимизация WordPress
Готовый файл robots.txt можно найти на любом блоге моей и схожей тематики, однако, в сети мало хороших статей, направленных, именно, на понимание этого документа. А я уже столкнулась с тем, что сначала взяла готовый вариант, а потом ещё искала дополнительную информацию то по одному вопросу, то по другому, несколько раз переделывала на что потратила дополнительно время.
Так же, скорее всего, опишу отдельно настройку плагина Google XML Sitemaps, т.к. настроек очень много и не каждый сможет сходу разобраться в них.
Поэтому, не забываем следить за обновлениями блога. Удачного всем развития.
Только с его помощью мы можем сказать поисковому роботу, какие страницы необходимо индексировать, а какие нет. И как уже не раз говорила, для поисковой системы очень важно показывать пользователям именно те страницы, которые максимально отвечают на вопрос пользователей.
Если же из-за непродуманной структуры сайта, или по другой причине у вас создается дублирование страниц, то поисковая система может все похожие страницы понизить в поисковой выдаче, т.к. не сможет определиться с тем, какая из них является первоисточником.
Так же, благодаря этому файлу мы можем закрывать служебные страницы сайта, которые вообще не должны появляться в поисковой выдаче.
Изначально, я планировала описать, как настройку плагина Google XML Sitemaps, так и весь процесс составления файла robots.txt уже в этой статье, но по ходу написания, вижу, что это займет слишком много времени, а пост получится сильно длинным.
Поэтому о настройке файла robots.txt очень подробно будет в следующей статье. Будет очень подробно потому, что я хочу не только дать готовый вариант этого файла для WordPress, а объяснить всю технологию составления этого документа.
Обновление: Статья про файл robots.txt опубликована - Файл Robots.txt. Оптимизация WordPress
Готовый файл robots.txt можно найти на любом блоге моей и схожей тематики, однако, в сети мало хороших статей, направленных, именно, на понимание этого документа. А я уже столкнулась с тем, что сначала взяла готовый вариант, а потом ещё искала дополнительную информацию то по одному вопросу, то по другому, несколько раз переделывала на что потратила дополнительно время.
Так же, скорее всего, опишу отдельно настройку плагина Google XML Sitemaps, т.к. настроек очень много и не каждый сможет сходу разобраться в них.
Поэтому, не забываем следить за обновлениями блога. Удачного всем развития.








