Як уникнути дублювання сторінок і контенту

В даний час досить актуальним є питання щодо дублювання сторінок в різних системах адміністрування. Дублювання сторінок і контенту погано впливає як на usability (юзабіліті), так і на пошукову оптимізацію і просування сайтів. За дублювання сторінок і не унікальний контент цілком можна отримати "пенальті" від пошукових систем (візьмемо, наприклад, фільтри від Яндекс - АГС).

2 Починайте робити сайт локально, тобто не викладаючи його на хостинг. Перевірте працездатність компонентів і правильність урлов до викладання сайту на хостинг.

Якщо Ви все-таки вирішили робити сайт відразу на хостингу, то на час створення закрийте його індексацію в файлі robots.txt:

В подальшому не забудьте прибрати заборону індексації (Disallow: /).

3 Перед тим як Ви будете викладати сайт на сервер, не забудьте видалити з сайту все демо дані Joomla, в тому числі і з кошика!

5 За допомогою файлу .htaccess приберіть дублі головної сторінки Joomla. Ось приклад, після RewriteEngine On вписуєте наступний код:

site.ru - замінюєте на свій домен

6 Якщо Ви використовуєте на своєму сайті SEF URLs без суфіксів на кінці (тобто без .html), Вам необхідно знати, що для пошукових систем сторінка закінчується на слеш і без нього, це дві різні сторінки. За допомогою файлу .htaccess можна прибрати подібні дублі сторінок. Ось приклад коду для файлу .htaccess, який додає слеш в кінці урла:

7 Намагайтеся обійтися на сайті без використання посторінковою навігації і купи модулів, які виводять посилання на статті.

Таким чином, сторінки дублюються. Насправді, якщо сюди приплюсувати неправильне використання модулів виведення статей, посторінковою навігації, компонента пошуку і створення окремих пунктів меню, то можна домогтися появи 5-6-ти дублів практично кожної сторінки.

9 Використовуйте SEF компоненти. Це частково захистить Вас від дублювання сторінок. Правда, швидше за все, знизить швидкість відкриття Вашого сайту, особливо, якщо у Вас велика відвідуваність, а сайт лежить не на виділеному сервері.

10 Використовуйте файл robots.txt для усунення дублів сторінок, щоб уникнути пенальті від пошукових систем.

11 Якщо Ви помітили недоліки самого движка по формуванню урла, обов'язково постарайтеся знайти інструкцію по їх якнайшвидшому усуненню.

Багато напевно помічали, що при первинному попаданні на сайт до url приліплюється ідентифікатор сесії у вигляді великої кількості цифр.

Всі зайві цифри в кінці урла ліквідуються вставкою наступних рядків у файл .htaccess:


php_flag session.use_trans_sid off
php_flag session.use_cookies on
php_flag session.use_only_cookies on

Подібний недогляд лікується дуже просто, відкриваєте файл components / com_content / views / section / view.html.php, знаходите рядок коду


$ Category-> link = JRoute :: _ (ContentHelperRoute :: getCategoryRoute ($ category-> slug, $ category-> section). 'Layout = default');

і трохи змінюєте код


$ Category-> link = JRoute :: _ (ContentHelperRoute :: getCategoryRoute ($ category-> slug, $ category-> section));

Будемо сподіватися, що надалі розробники Joomla усунуть недоліки і не нароблять нові :)