Донецкий техникум промышленной автоматики

Як не допустити дубльований контент в WordPress »WPbloging

  1. Що в результаті?
  2. Як правильно налаштувати і організувати ваш блог на WordPress, не створюючи дубльованого контенту?
  3. При шаблонному підході, на сторінках вашого сайту ви завжди знайдете дублюючий контент.
  4. Важливо, щоб на кожній сторінці всередині вашого сайту, завжди були унікальні:
  5. Міфи пов'язані з дубльованим контентом:

Сама проблема дубльованого контенту виникла недавно, коли пошукові системи стали карати сайти за використання дубльованого контенту. Давайте розберемося в початку, що таке дубльований контент?

Дубльований контент - однаковий текст або частину тексту, до якого можна звернутися за різними URL. Дубльований контент може розташовуватися як в межах одного ресурсу, так і на просторах усього інтернет.

Проілюструю:

Проілюструю:

  1. Посилання на створений пост має вигляд http://www.site.ru/post.html
  2. Багато блогери використовують кроспостінг для підвищення тематичної посилальної маси і для швидкої індексації, візьмемо, наприклад, безкоштовні блоги на livejornal, посилання буде виглядати так: http://site.livejornal.ru/post.html
  3. Якщо у вас вкрали статтю або ви самі розмістили її на якому-небудь ресурсі зі зворотним посиланням, знову ж той же текст можна прочитати за новою посиланням: http://www.othersite.ru/post.html
  4. Часто на головній сторінці свого сайту виводять кілька останніх статей в повному вигляді. Виходить дубль тексту вашого поста за посиланням: http://www.site.ru/
  5. Якщо статей багато, то створюється посторінкова навігація, нові статті витісняють старі статті на наступні сторінки. Якщо ви використовуєте повне виведення статті на головній, то ваш пост можна буде прочитати за посиланням: http://www.site.ru/page.html/page/2
  6. Така ж ситуація, як і з головною сторінкою, і для Рубрик сайту. Якщо ви віддаєте статті повністю в Рубрики, значить, з'являється нова посилання зі сторінки рубрики: http://www.site.ru/category/
  7. Сторінки архіву також, як і рубрики, дублюють контент: http://www.site.ru/2010/, але при цьому, навіть якщо у вас виводиться частина статті або цитата, то в архіві ви все одно отримаєте дублюючу посилання виду: http : //www.site.ru/2010/post.html
  8. Сторінки тегів повністю аналогічні сторінок рубрик: http://www.site.ru/tag/nametag/
  9. У цей комплект дублів додає ще своє посилання Пошук по сайту: http://www.site.ru/?s=search
  10. І навіть на самій сторінці поста можна отримати як мінімум 2 посилання, які дублюють контент:
    1. Посилання з'являється при великій кількості коментарів та включення режиму посторінкового навігації з коментарів, види: http://www.site.ru/page.html/comment-page-1#comments
    2. Посилання з'являється якщо у вас довга стаття, і ви вирішили розділити її на кілька частин тегом <! - nextpage->, який вставляє посторінкову навігацію ще в сам пост. Посилання на 2 сторінку поста матиме вигляд: http://www.site.ru/page.html/2

Що в результаті?

В результаті, при невмілому користуванні функціоналом WordPress, ви ризикуєте отримати як мінімум 8 дублюючих посилань однієї статті всередині самого ресурсу + дублі з розміщення статей на зовнішніх ресурсах.

Як правильно налаштувати і організувати ваш блог на WordPress, не створюючи дубльованого контенту?



Почнемо по порядку пунктів зазначеного вище:

  1. На сторінках постів, статичних сторінках, завжди використовуйте мета-тег rel = 'canonical'. Він дозволяє вказати пошуковим системам правильний джерело контенту всередині сайту і для багатьох зовнішніх ресурсів.
  2. Намагайтеся при кроспостінге, все-таки не віддавати всю статтю ресурсу. Уріжте її як мінімум до 50%. Обов'язково проставляйте посилання на джерело, 2-3 штуки, з різними анкорами. Якщо є можливість змінювати на мета-теги на кроспостінговом ресурсі, приберіть мета-тег rel = 'canonical'.
  3. Якщо ви розміщуєте статтю на зовнішніх ресурсах і немає можливості її уникализировать, дійте за принципом п.1 + змініть хоча б деякі абзаци вашого тексту. Обов'язково проставляйте зворотні посилання на вашу статтю - джерело і сам блог. Ця рекомендація часто допомагає при крадіжці контенту. Оскільки багато злодії копіюють контент на автоматі, спеціальними скриптами і в більшості випадків посилання не затираються.
  4. Практично з самого початку існування WordPress, розробниками був продуманий функціонал, який дозволяв вивести на головній текст на вашу статтю без дублювання контенту.
    Зайдіть на сторінку редактора в адмін - панелі WordPress. На сторінці, під самим редактором знайдете вкладку «Цитата (Excerpt)». Ось вона і призначена для виведення анонса статті на головній, в рубриках, архіві, пошуку і т.д. При створенні статті використовуйте це поле для створення унікального анонса статті, який буде мотивувати відвідувача клікнути по посиланню «Читати далі» і прочитати вашу статтю.
    Крім виключення дублів у поля «Цитата», є ще одна корисна особливість, цей текст ви можете оптимізувати під ключові слова необхідні для Головною, Рубрики і т.д.
  5. Посторінкову навігацію, навігацію по коментарях, Архіви, Теги, пошук по сайту краще за все закрити від індексації в robots.txt:
    Disallow: * / comments *
    Disallow: / search
    Disallow: /? S = *
    Disallow: / author / *
    Disallow: / tag / *
    Disallow: / trackback
    Disallow: / 20 * / *
    Disallow: / page / *
    Disallow: / comment-page *
    Disallow: / *? Replytocom *
  1. Від дублювання контенту в рубриці позбавляємося тим же способом, як і для Головної сторінки блогу. Або закрити і її від індексації. Вирішувати вам.
  2. Залишилася одна посилання - дубль, що виникає при поділі сторінки на частини і створює посторінкову навігацію для самого поста. Як з нею боротися, поки не знаю. Моя порада, постарайтеся не використовувати цей функціонал. Краще розділіть статтю на реальні частини і створіть для кожної частини окремий пост.

При шаблонному підході, на сторінках вашого сайту ви завжди знайдете дублюючий контент.



наприклад:

  • Віджети в сайдбарі
  • Шапка і підвал сайту
  • Якісь вставки в самому пості.

Важливо, щоб на кожній сторінці всередині вашого сайту, завжди були унікальні:

  1. Заголовок сторінки (title).
  2. Мета - тег опису сторінки (description).
  3. Як мінімум (моя думка) 50% сукупного текстового наповнення сторінки.

Всі інші сторінки сайту, які формують свій контент на основі тексту самих постів, повинні бути закриті від індексації.

При такому підході, у вас найменші шанси отримати покарання від пошукових систем за дубльований контент.

Міфи пов'язані з дубльованим контентом:

  1. Посилання з «якорем» типу http://www.site.ru/page.html#якорь створює дубльований контент для пошукових систем.
    Це твердження не вірно, тому що даний якір всього лише позиціонує сторінку у вікні браузера при переході по посиланню і не є динамічним параметром. Пошуковики давно вже навчилися відрізняти «якоря» від динамічних параметрів посилань. Тому використання посилань «Читати далі» в WordPress більш ніж безпечно.
  2. Новий мета-тег <link rel = 'canonical' href = 'http://www.site.ru/page.html' /> врятує весь світ і вирішить проблему дубльованого контенту.
    На жаль і це твердження не вірно. Уявіть ситуацію, коли ви створили статтю, а хтось її вкрав протягом години, наприклад використовуючи ваш RSS, і розмістив у себе на новій сторінці сайту. У нього також з'явиться мета-тег rel = 'canonical'. Якщо рейтинги вашого сайту приблизно однакові, як ви думаєте, як пошукові системи визначать першоджерело? Той до кого прийде першим робот, той і буде у виграші. Стовідсоткового вирішення даної проблеми немає. Якщо для вас це важливо, Google вам на допомогу.
    Даний мета-тег швидше допомагає вирішити проблему з дубльованим контентом в межах одного ресурсу. Використовуючи збирають сторінки сайту (рубрики, архіви, теги, пошук по сайту, головна) важливо стежити, щоб у цих сторінок даний тег був відсутній. Тоді, присутність rel = 'canonical' тільки в сторінках статей дає вагомі гарантії унікальності вашого контенту.
  3. Рерайт або синонімізація зробить текст унікальним.
    На щастя, пошуковики навчилися розпізнавати і рерайт. Більшість сайтів використовують рерайт, банять на протязі 1-2 місяців. Я у свій час захопився рерайтом, навіть купив не дешевий софт. Моя думка, якісний і швидкий рерайт, на сьогоднішній день, написання нової - унікальної статті на ту ж тему. Все інше - даремно витрачений час.

Спонсор поста:
Агентство «ІДЕАЛ» - один з лідерів сучасного ринку пошукового просування сайту в Україні.

PS У цій статті, я намагався доступною мовою пояснити, що таке дубльований контент в WordPress і як від нього можна позбутися внутрішнім функціоналом платформи. Якщо я щось упустив або ви знаєте ще проблемні місця в WordPress, що створюють дубльований контент, ласкаво просимо в коментарі.

Чекаю ваших запитань.


Знайшов помилку в тексті? Виділи її мишкою і натисни

Що в результаті?
Як правильно налаштувати і організувати ваш блог на WordPress, не створюючи дубльованого контенту?
Давайте розберемося в початку, що таке дубльований контент?
Ru/?
Як правильно налаштувати і організувати ваш блог на WordPress, не створюючи дубльованого контенту?
Якщо рейтинги вашого сайту приблизно однакові, як ви думаєте, як пошукові системи визначать першоджерело?
Знайшов помилку в тексті?