Донецкий техникум промышленной автоматики

Як пошукові системи борються зі спамом - Blog Imena.UA

  1. Як пошукові системи борються зі спамом Справжнім вікном у світ Інтернету давно стали пошуковики....
  2. Авгієві стайні Інтернету
  3. Цифрова купа сміття
  4. Як пошукові системи борються зі спамом
  5. таємна війна
  6. Авгієві стайні Інтернету
  7. Цифрова купа сміття
  8. Як пошукові системи борються зі спамом
  9. таємна війна
  10. Авгієві стайні Інтернету
  11. Цифрова купа сміття
  12. Як пошукові системи борються зі спамом
  13. таємна війна
  14. Авгієві стайні Інтернету
  15. Цифрова купа сміття

Як пошукові системи борються зі спамом

Справжнім вікном у світ Інтернету давно стали пошуковики. Саме в пошуковий рядок Google, Bing, Yandex, Yahoo або будь-якого іншого пошукового ресурсу ми вводимо запит того, що хочемо знайти у Всесвітній павутині.

Було б дивно, якби цією властивістю людини не скористалися зловмисники або рядові рекламні агенти, виводячи свої сайти з низькоякісними або відверто маркетинговими матеріалами в топ пошукової видачі. Можливо, це має якийсь ефект для рекламної віддачі, але це точно дратує користувачів, які змушені перелопачувати гори сміття в пошуках цікавих для них даних.

Сучасна війна пошукових систем зі спамом нагадує справжню бійню. Пошукові гіганти постійно відточують та ускладнюють інструменти і алгоритми, що відокремлюють інформаційне сміття від корисних відомостей. Крім того, не останню роль в боротьбі зі спамом грає і психологія, що дозволяє розуміти мотиви спамера.

таємна війна

таємна війна

Що таке спам? Це, в нашому випадку, web-сторінка, власник якої використовує технології просування SEO, за допомогою яких хоче перехитрити алгоритми пошукача і зайняти топові позиції в пошуковій видачі, завдяки чому накручується кількість відвідувачів рекламного сайту. І добре, якщо на цьому ресурсі лежить просто невинний рекламний буклет - все більше сайтів, набитих спамом, перетворюються на справжні розсадники Інтернет-епідемій, розсилаючи шкідливі програми, і вставляють шкідливі коди на системи користувачів.

Якщо ми хочемо, щоб Інтернет приносив нам користь, даремний спам потрібно постійно відсівати, інакше Всесвітня павутина швидко перетвориться на суцільну дошку оголошень і рекламних статей. Крім того, через засилля спаму корисні і потрібні web-сторінки просто губляться десь на дні списку пошукової видачі. Не можна забувати і про необхідність постійно припиняти потенційні вірусні епідемії, джерелом яких можуть бути всі ті ж рекламні сторінки. Нарешті, зменшення кількості спам-ресурсів покращує екосистему Інтернету знижуючи обсяги трафіку. Не можна забувати і про те, що пошуковий рейтинг займає апаратні ресурси, що мають обмежений обсяг - якщо почистити їх від спаму, це звільнить місце для корисних посилань.

Протівоспамовая захист пошукача - наприклад, Google - як правило, складається з двох елементів. На сторожі інформаційної чистоти стоять автоматизована система і команда експертів-аналітиків, які підчищають руками то, що не помітив комп'ютер. «Команда антиспам» Google , Подібно до секретній службі, базується в декількох точках планети, кожну хвилину очищаючи Інтернет від сміття. У свою чергу, пошуковик корпорації Microsoft - Bing - більше покладається на автоматизовані фільтри. Тому в рядах Microsoft куди менше аналітиків, і більше психологів, які консультують програмістів щодо мотивів поведінки спамерів. Завдяки цій інформацією люди можуть постійно вдосконалювати комп'ютерні протоколи, зачищають інформаційне сміття.

Авгієві стайні Інтернету

Авгієві стайні Інтернету

Боротьба пошукових систем зі спам-сайтами нагадує дуель двох фехтувальників, збройних щитами і мечами. Зловмисники постійно маскуються і всіляко намагаються захистити свої сайти. У свою чергу, пошукові системи і стоять за ними люди вдосконалюють методи розпізнавання спаму і ускладнюють зловмисникам життя, модернізуючи пошукові алгоритми. До слова, саме тому пошукові системи тримають в таємниці точні специфікації своїх алгоритмів.

Основний мотив творця черговий спам-сторінки - заробіток, адже поширення спаму давно перетворилося у вигідний бізнес, яким, найчастіше, не гребують навіть великі рекламні агентства. Втім, тут чимало винятків. Окремі зловмисники ведуть свою діяльність з політичних мотивів, або ж намагаються, таким чином, самовиражатися. Але більшість все ж має банальний фінансовий інтерес. Найпростіший спосіб заробити грошей на спам - демонструвати рекламні оголошення. Чим більше людей перегляне рекламу, тим вищий дохід спамера.

Розуміючи мотиви зловмисників, пошукові системи давно розробили список параметрів, які аналізує комп'ютер. В першу чергу, увагу звертають на якість матеріалів - оскільки спамер бажає банально заробити на рекламі, то наповнення сторінки здійснюється за рахунок низькоякісних текстів, набитих тегами для пошукових систем. Якість матеріалу на сторінці визначає детальний аналіз сотень факторів, включаючи кількість символів, унікальність слів і так далі. Наступний параметр, який має значення для пошукових фільтрів - наявність на сторінці реклами. Кожна сторінка в Інтернеті сьогодні містить деяку кількість рекламних матеріалів, що, однак, не робить її спамом. Показниками рекламної чистоти сторінки є кількість оголошень на екрані, їх тип - банери, спливаючі вікна тощо - і навіть, їх нав'язливість. Крім того, автоматичні фільтри оцінюють верстку сторінки, аналізуючи розміщення матеріалу і реклами. Соціальні сигнали - ще один важливий показник для аналітиків, оскільки якісні статті обговорюють в соціальних мережах, тим самим доводячи, що дана конкретна сторінка не відноситься до категорії спаму.

Цифрова купа сміття

Цифрова купа сміття

Але ось спамер створив свою сторінку в Мережі. Тепер він хоче максимізувати свої доходи. Для цього, зловмисники можуть автоматично «підселити» на свої сайти чужі матеріали, використовувати програми автоматичної генерування текстів і навіть популяризувати сторінки з неунікальні матеріалами. Для підвищення рейтингу в пошуковій видачі спамери гранично насичують сайт ключові слова, маніпулюють посиланнями, засмічують форуми формуванням звітів і навіть додають невидимі користувачеві матеріали, що перенаправляють його на спам-сайт.

У свою чергу, пошуковики постійно змінюють алгоритми своєї роботи - це, до речі, можна помітити неозброєним оком. Зверніть увагу, коли пошуковик на один і той же запит видає різні результати, що свідчить як раз про оновлення пошукового алгоритму. Такі поновлення здійснюються, в середньому, раз на рік.

Читач може подумати, що потрапити на спам-сайт не так-то просто, і це, в основному, доля завсідників торрент-треккеров і сайтів з матеріалами «для дорослих», проте, це популярне оману. Web-спам завжди поруч, чим би Ви не займалися в Мережі. Посилання на спам-сторінки ховаються на форумах, в повідомленнях соціальних мереж, файлообмінниках, особистих блогах і рекламних оголошеннях, що демонструються самими пошуковими системами. У 2011 році аналітики Google визнали, що велика частина шкідливих посилань ховається, безпосередньо, в топі їх пошукової видачі. На оновлення алгоритму пошуку тоді витратили мільйони доларів, в результаті чого Google розпочав видавати на 130 млн спам-сайтів менше. Представники пошукових систем сьогодні визнають, що всі перемоги у війні зі спамом короткострокові, а повністю позбутися від цифрового сміття, судячи з усього, вони зможуть ніколи. Втім, робота йде постійно. На сьогоднішній день самим безпечним пошукачем загальновизнано вважається Google - він показує всього 272 спам-сайту на 10 млн ресурсів в пошуковій видачі. Той же параметр для Bing становить 1 285 шкідливих сайту, а для Яндекс -3 330.

Як пошукові системи борються зі спамом

Справжнім вікном у світ Інтернету давно стали пошуковики. Саме в пошуковий рядок Google, Bing, Yandex, Yahoo або будь-якого іншого пошукового ресурсу ми вводимо запит того, що хочемо знайти у Всесвітній павутині.

Було б дивно, якби цією властивістю людини не скористалися зловмисники або рядові рекламні агенти, виводячи свої сайти з низькоякісними або відверто маркетинговими матеріалами в топ пошукової видачі. Можливо, це має якийсь ефект для рекламної віддачі, але це точно дратує користувачів, які змушені перелопачувати гори сміття в пошуках цікавих для них даних.

Сучасна війна пошукових систем зі спамом нагадує справжню бійню. Пошукові гіганти постійно відточують і ускладнюють інструменти і алгоритми, що відокремлюють інформаційне сміття від корисних відомостей. Крім того, не останню роль в боротьбі зі спамом грає і психологія, що дозволяє розуміти мотиви спамера.

таємна війна

таємна війна

Що таке спам? Це, в нашому випадку, web-сторінка, власник якої використовує технології просування SEO, за допомогою яких хоче перехитрити алгоритми пошукача і зайняти топові позиції в пошуковій видачі, завдяки чому накручується кількість відвідувачів рекламного сайту. І добре, якщо на цьому ресурсі лежить просто невинний рекламний буклет - все більше сайтів, набитих спамом, перетворюються на справжні розсадники Інтернет-епідемій, розсилаючи шкідливі програми, і вставляють шкідливі коди на системи користувачів.

Якщо ми хочемо, щоб Інтернет приносив нам користь, даремний спам потрібно постійно відсівати, інакше Всесвітня павутина швидко перетвориться на суцільну дошку оголошень і рекламних статей. Крім того, через засилля спаму корисні і потрібні web-сторінки просто губляться десь на дні списку пошукової видачі. Не можна забувати і про необхідність постійно припиняти потенційні вірусні епідемії, джерелом яких можуть бути всі ті ж рекламні сторінки. Нарешті, зменшення кількості спам-ресурсів покращує екосистему Інтернету, знижуючи обсяги трафіку. Не можна забувати і про те, що пошуковий рейтинг займає апаратні ресурси, що мають обмежений обсяг - якщо почистити їх від спаму, це звільнить місце для корисних посилань.

Протівоспамовая захист пошукача - наприклад, Google - як правило, складається з двох частин. На сторожі інформаційної чистоти стоять автоматизована система і команда експертів-аналітиків, які підчищають руками то, що не помітив комп'ютер. «Команда антиспам» Google , Подібно до секретній службі, базується в декількох точках планети, кожну хвилину очищаючи Інтернет від сміття. У свою чергу, пошуковик корпорації Microsoft - Bing - більше покладається на автоматизовані фільтри. Тому в рядах Microsoft куди менше аналітиків, і більше психологів, які консультують програмістів щодо мотивів поведінки спамерів. Завдяки цій інформації люди можуть постійно вдосконалювати комп'ютерні протоколи, зачищають інформаційне сміття.

Авгієві стайні Інтернету

Авгієві стайні Інтернету

Боротьба пошукових систем зі спам-сайтами нагадує дуель двох фехтувальників, збройних щитами і мечами. Зловмисники постійно маскуються і всіляко намагаються захистити свої сайти. У свою чергу, пошукові системи і стоять за ними люди вдосконалюють методи розпізнавання спаму і ускладнюють зловмисникам життя, модернізуючи пошукові алгоритми. До слова, саме тому пошукові системи тримають в таємниці точні специфікації своїх алгоритмів.

Основний мотив творця черговий спам-сторінки - заробіток, адже поширення спаму давно перетворилося у вигідний бізнес, яким, найчастіше, не гребують навіть великі рекламні агентства. Втім, тут чимало винятків. Окремі зловмисники ведуть свою діяльність з політичних мотивів, або ж намагаються, таким чином, самовиражатися. Але більшість все ж має банальний фінансовий інтерес. Найпростіший спосіб заробити грошей на спам - демонструвати рекламні оголошення. Чим більше людей перегляне рекламу, тим вищий дохід спамера.

Розуміючи мотиви зловмисників, пошукові системи давно розробили список параметрів, які аналізує комп'ютер. В першу чергу, увагу звертають на якість матеріалів - оскільки спамер бажає банально заробити на рекламі, то наповнення сторінки здійснюється за рахунок низькоякісних текстів, набитих тегами для пошукових систем. Якість матеріалу на сторінці визначає детальний аналіз сотень факторів, включаючи кількість символів, унікальність слів і так далі. Наступний параметр, який має значення для пошукових фільтрів - наявність на сторінці реклами. Кожна сторінка в Інтернеті сьогодні містить деяку кількість рекламних матеріалів, що, однак, не робить її спамом. Показниками рекламної чистоти сторінки є кількість оголошень на екрані, їх тип - банери, спливаючі вікна тощо - а також, їх нав'язливість. Крім того, автоматичні фільтри оцінюють верстку сторінки, аналізуючи розміщення матеріалу і реклами. Соціальні сигнали - ще один важливий показник для аналітиків, оскільки якісні статті обговорюють в соціальних мережах, тим самим доводячи, що дана конкретна сторінка не відноситься до категорії спаму.

Цифрова купа сміття

Цифрова купа сміття

Але ось спамер створив свою сторінку в Мережі. Тепер він хоче максимізувати свої доходи. Для цього, зловмисники можуть автоматично «підселити» на свої сайти чужі матеріали, використовувати програми автоматичного генерування текстів і навіть популяризувати сторінки з неунікальні матеріалами. Для підвищення рейтингу в пошуковій видачі спамери гранично насичують сайт ключовими словами, маніпулюють посиланнями, засмічують форуми своїми повідомленнями і навіть додають невидимі користувачеві матеріали, що перенаправляють його на спам-сайт.

У свою чергу, пошуковики постійно змінюють алгоритми своєї роботи - це, до речі, можна помітити неозброєним оком. Зверніть увагу, коли пошуковик на один і той же запит видає різні результати, що свідчить як раз про оновлення пошукового алгоритму. Такі поновлення здійснюються, в середньому, раз на рік.

Читач може подумати, що потрапити на спам-сайт не так-то просто, і це, в основному, доля завсідників торрент-треккеров і сайтів з матеріалами «для дорослих», проте, це популярне оману. Web-спам завжди поруч, чим би Ви не займалися в Мережі. Посилання на спам-сторінки ховаються на форумах, в повідомленнях соціальних мереж, файлообмінниках, особистих блогах і рекламних оголошеннях, що демонструються самими пошуковими системами. У 2011 році аналітики Google визнали, що велика частина шкідливих посилань ховається, безпосередньо, в топі їх пошукової видачі. На оновлення алгоритму пошуку тоді витратили мільйони доларів, в результаті чого Google почав видавати на 130 млн спам-сайтів менше. Представники пошукових систем сьогодні визнають, що всі перемоги у війні зі спамом короткострокові, а повністю позбутися від цифрового сміття, судячи з усього, вони не зможуть ніколи. Втім, робота йде постійно. На сьогоднішній день самим безпечним пошукачем загальновизнано вважається Google - він показує всього 272 спам-сайту на 10 млн ресурсів в пошуковій видачі. Той же параметр для Bing становить 1 285 шкідливих сайту, а для Яндекс -3 330.

Як пошукові системи борються зі спамом

Справжнім вікном у світ Інтернету давно стали пошуковики. Саме в пошуковий рядок Google, Bing, Yandex, Yahoo або будь-якого іншого пошукового ресурсу ми вводимо запит того, що хочемо знайти у Всесвітній павутині.

Було б дивно, якби цією властивістю людини не скористалися зловмисники або рядові рекламні агенти, виводячи свої сайти з низькоякісними або відверто маркетинговими матеріалами в топ пошукової видачі. Можливо, це має якийсь ефект для рекламної віддачі, але це точно дратує користувачів, які змушені перелопачувати гори сміття в пошуках цікавих для них даних.

Сучасна війна пошукових систем зі спамом нагадує справжню бійню. Пошукові гіганти постійно відточують і ускладнюють інструменти і алгоритми, що відокремлюють інформаційне сміття від корисних відомостей. Крім того, не останню роль в боротьбі зі спамом грає і психологія, що дозволяє розуміти мотиви спамера.

таємна війна

таємна війна

Що таке спам? Це, в нашому випадку, web-сторінка, власник якої використовує технології просування SEO, за допомогою яких хоче перехитрити алгоритми пошукача і зайняти топові позиції в пошуковій видачі, завдяки чому накручується кількість відвідувачів рекламного сайту. І добре, якщо на цьому ресурсі лежить просто невинний рекламний буклет - все більше сайтів, набитих спамом, перетворюються на справжні розсадники Інтернет-епідемій, розсилаючи шкідливі програми, і вставляють шкідливі коди на системи користувачів.

Якщо ми хочемо, щоб Інтернет приносив нам користь, даремний спам потрібно постійно відсівати, інакше Всесвітня павутина швидко перетвориться на суцільну дошку оголошень і рекламних статей. Крім того, через засилля спаму корисні і потрібні web-сторінки просто губляться десь на дні списку пошукової видачі. Не можна забувати і про необхідність постійно припиняти потенційні вірусні епідемії, джерелом яких можуть бути всі ті ж рекламні сторінки. Нарешті, зменшення кількості спам-ресурсів покращує екосистему Інтернету, знижуючи обсяги трафіку. Не можна забувати і про те, що пошуковий рейтинг займає апаратні ресурси, що мають обмежений обсяг - якщо почистити їх від спаму, це звільнить місце для корисних посилань.

Протівоспамовая захист пошукача - наприклад, Google - як правило, складається з двох частин. На сторожі інформаційної чистоти стоять автоматизована система і команда експертів-аналітиків, які підчищають руками то, що не помітив комп'ютер. «Команда антиспам» Google , Подібно до секретній службі, базується в декількох точках планети, кожну хвилину очищаючи Інтернет від сміття. У свою чергу, пошуковик корпорації Microsoft - Bing - більше покладається на автоматизовані фільтри. Тому в рядах Microsoft куди менше аналітиків, і більше психологів, які консультують програмістів щодо мотивів поведінки спамерів. Завдяки цій інформації люди можуть постійно вдосконалювати комп'ютерні протоколи, зачищають інформаційне сміття.

Авгієві стайні Інтернету

Авгієві стайні Інтернету

Боротьба пошукових систем зі спам-сайтами нагадує дуель двох фехтувальників, збройних щитами і мечами. Зловмисники постійно маскуються і всіляко намагаються захистити свої сайти. У свою чергу, пошукові системи і стоять за ними люди вдосконалюють методи розпізнавання спаму і ускладнюють зловмисникам життя, модернізуючи пошукові алгоритми. До слова, саме тому пошукові системи тримають в таємниці точні специфікації своїх алгоритмів.

Основний мотив творця черговий спам-сторінки - заробіток, адже поширення спаму давно перетворилося у вигідний бізнес, яким, найчастіше, не гребують навіть великі рекламні агентства. Втім, тут чимало винятків. Окремі зловмисники ведуть свою діяльність з політичних мотивів, або ж намагаються, таким чином, самовиражатися. Але більшість все ж має банальний фінансовий інтерес. Найпростіший спосіб заробити грошей на спам - демонструвати рекламні оголошення. Чим більше людей перегляне рекламу, тим вищий дохід спамера.

Розуміючи мотиви зловмисників, пошукові системи давно розробили список параметрів, які аналізує комп'ютер. В першу чергу, увагу звертають на якість матеріалів - оскільки спамер бажає банально заробити на рекламі, то наповнення сторінки здійснюється за рахунок низькоякісних текстів, набитих тегами для пошукових систем. Якість матеріалу на сторінці визначає детальний аналіз сотень факторів, включаючи кількість символів, унікальність слів і так далі. Наступний параметр, який має значення для пошукових фільтрів - наявність на сторінці реклами. Кожна сторінка в Інтернеті сьогодні містить деяку кількість рекламних матеріалів, що, однак, не робить її спамом. Показниками рекламної чистоти сторінки є кількість оголошень на екрані, їх тип - банери, спливаючі вікна тощо - а також, їх нав'язливість. Крім того, автоматичні фільтри оцінюють верстку сторінки, аналізуючи розміщення матеріалу і реклами. Соціальні сигнали - ще один важливий показник для аналітиків, оскільки якісні статті обговорюють в соціальних мережах, тим самим доводячи, що дана конкретна сторінка не відноситься до категорії спаму.

Цифрова купа сміття

Цифрова купа сміття

Але ось спамер створив свою сторінку в Мережі. Тепер він хоче максимізувати свої доходи. Для цього, зловмисники можуть автоматично «підселити» на свої сайти чужі матеріали, використовувати програми автоматичного генерування текстів і навіть популяризувати сторінки з неунікальні матеріалами. Для підвищення рейтингу в пошуковій видачі спамери гранично насичують сайт ключовими словами, маніпулюють посиланнями, засмічують форуми своїми повідомленнями і навіть додають невидимі користувачеві матеріали, що перенаправляють його на спам-сайт.

У свою чергу, пошуковики постійно змінюють алгоритми своєї роботи - це, до речі, можна помітити неозброєним оком. Зверніть увагу, коли пошуковик на один і той же запит видає різні результати, що свідчить як раз про оновлення пошукового алгоритму. Такі поновлення здійснюються, в середньому, раз на рік.

Читач може подумати, що потрапити на спам-сайт не так-то просто, і це, в основному, доля завсідників торрент-треккеров і сайтів з матеріалами «для дорослих», проте, це популярне оману. Web-спам завжди поруч, чим би Ви не займалися в Мережі. Посилання на спам-сторінки ховаються на форумах, в повідомленнях соціальних мереж, файлообмінниках, особистих блогах і рекламних оголошеннях, що демонструються самими пошуковими системами. У 2011 році аналітики Google визнали, що велика частина шкідливих посилань ховається, безпосередньо, в топі їх пошукової видачі. На оновлення алгоритму пошуку тоді витратили мільйони доларів, в результаті чого Google почав видавати на 130 млн спам-сайтів менше. Представники пошукових систем сьогодні визнають, що всі перемоги у війні зі спамом короткострокові, а повністю позбутися від цифрового сміття, судячи з усього, вони не зможуть ніколи. Втім, робота йде постійно. На сьогоднішній день самим безпечним пошукачем загальновизнано вважається Google - він показує всього 272 спам-сайту на 10 млн ресурсів в пошуковій видачі. Той же параметр для Bing становить 1 285 шкідливих сайту, а для Яндекс -3 330.

Як пошукові системи борються зі спамом

Справжнім вікном у світ Інтернету давно стали пошуковики. Саме в пошуковий рядок Google, Bing, Yandex, Yahoo або будь-якого іншого пошукового ресурсу ми вводимо запит того, що хочемо знайти у Всесвітній павутині.

Було б дивно, якби цією властивістю людини не скористалися зловмисники або рядові рекламні агенти, виводячи свої сайти з низькоякісними або відверто маркетинговими матеріалами в топ пошукової видачі. Можливо, це має якийсь ефект для рекламної віддачі, але це точно дратує користувачів, які змушені перелопачувати гори сміття в пошуках цікавих для них даних.

Сучасна війна пошукових систем зі спамом нагадує справжню бійню. Пошукові гіганти постійно відточують і ускладнюють інструменти і алгоритми, що відокремлюють інформаційне сміття від корисних відомостей. Крім того, не останню роль в боротьбі зі спамом грає і психологія, що дозволяє розуміти мотиви спамера.

таємна війна

таємна війна

Що таке спам? Це, в нашому випадку, web-сторінка, власник якої використовує технології просування SEO, за допомогою яких хоче перехитрити алгоритми пошукача і зайняти топові позиції в пошуковій видачі, завдяки чому накручується кількість відвідувачів рекламного сайту. І добре, якщо на цьому ресурсі лежить просто невинний рекламний буклет - все більше сайтів, набитих спамом, перетворюються на справжні розсадники Інтернет-епідемій, розсилаючи шкідливі програми, і вставляють шкідливі коди на системи користувачів.

Якщо ми хочемо, щоб Інтернет приносив нам користь, даремний спам потрібно постійно відсівати, інакше Всесвітня павутина швидко перетвориться на суцільну дошку оголошень і рекламних статей. Крім того, через засилля спаму корисні і потрібні web-сторінки просто губляться десь на дні списку пошукової видачі. Не можна забувати і про необхідність постійно припиняти потенційні вірусні епідемії, джерелом яких можуть бути всі ті ж рекламні сторінки. Нарешті, зменшення кількості спам-ресурсів покращує екосистему Інтернету, знижуючи обсяги трафіку. Не можна забувати і про те, що пошуковий рейтинг займає апаратні ресурси, що мають обмежений обсяг - якщо почистити їх від спаму, це звільнить місце для корисних посилань.

Протівоспамовая захист пошукача - наприклад, Google - як правило, складається з двох частин. На сторожі інформаційної чистоти стоять автоматизована система і команда експертів-аналітиків, які підчищають руками то, що не помітив комп'ютер. «Команда антиспам» Google , Подібно до секретній службі, базується в декількох точках планети, кожну хвилину очищаючи Інтернет від сміття. У свою чергу, пошуковик корпорації Microsoft - Bing - більше покладається на автоматизовані фільтри. Тому в рядах Microsoft куди менше аналітиків, і більше психологів, які консультують програмістів щодо мотивів поведінки спамерів. Завдяки цій інформації люди можуть постійно вдосконалювати комп'ютерні протоколи, зачищають інформаційне сміття.

Авгієві стайні Інтернету

Авгієві стайні Інтернету

Боротьба пошукових систем зі спам-сайтами нагадує дуель двох фехтувальників, збройних щитами і мечами. Зловмисники постійно маскуються і всіляко намагаються захистити свої сайти. У свою чергу, пошукові системи і стоять за ними люди вдосконалюють методи розпізнавання спаму і ускладнюють зловмисникам життя, модернізуючи пошукові алгоритми. До слова, саме тому пошукові системи тримають в таємниці точні специфікації своїх алгоритмів.

Основний мотив творця черговий спам-сторінки - заробіток, адже поширення спаму давно перетворилося у вигідний бізнес, яким, найчастіше, не гребують навіть великі рекламні агентства. Втім, тут чимало винятків. Окремі зловмисники ведуть свою діяльність з політичних мотивів, або ж намагаються, таким чином, самовиражатися. Але більшість все ж має банальний фінансовий інтерес. Найпростіший спосіб заробити грошей на спам - демонструвати рекламні оголошення. Чим більше людей перегляне рекламу, тим вищий дохід спамера.

Розуміючи мотиви зловмисників, пошукові системи давно розробили список параметрів, які аналізує комп'ютер. В першу чергу, увагу звертають на якість матеріалів - оскільки спамер бажає банально заробити на рекламі, то наповнення сторінки здійснюється за рахунок низькоякісних текстів, набитих тегами для пошукових систем. Якість матеріалу на сторінці визначає детальний аналіз сотень факторів, включаючи кількість символів, унікальність слів і так далі. Наступний параметр, який має значення для пошукових фільтрів - наявність на сторінці реклами. Кожна сторінка в Інтернеті сьогодні містить деяку кількість рекламних матеріалів, що, однак, не робить її спамом. Показниками рекламної чистоти сторінки є кількість оголошень на екрані, їх тип - банери, спливаючі вікна тощо - а також, їх нав'язливість. Крім того, автоматичні фільтри оцінюють верстку сторінки, аналізуючи розміщення матеріалу і реклами. Соціальні сигнали - ще один важливий показник для аналітиків, оскільки якісні статті обговорюють в соціальних мережах, тим самим доводячи, що дана конкретна сторінка не відноситься до категорії спаму.

Цифрова купа сміття

Цифрова купа сміття

Але ось спамер створив свою сторінку в Мережі. Тепер він хоче максимізувати свої доходи. Для цього, зловмисники можуть автоматично «підселити» на свої сайти чужі матеріали, використовувати програми автоматичного генерування текстів і навіть популяризувати сторінки з неунікальні матеріалами. Для підвищення рейтингу в пошуковій видачі спамери гранично насичують сайт ключовими словами, маніпулюють посиланнями, засмічують форуми своїми повідомленнями і навіть додають невидимі користувачеві матеріали, що перенаправляють його на спам-сайт.

У свою чергу, пошуковики постійно змінюють алгоритми своєї роботи - це, до речі, можна помітити неозброєним оком. Зверніть увагу, коли пошуковик на один і той же запит видає різні результати, що свідчить як раз про оновлення пошукового алгоритму. Такі поновлення здійснюються, в середньому, раз на рік.

Читач може подумати, що потрапити на спам-сайт не так-то просто, і це, в основному, доля завсідників торрент-треккеров і сайтів з матеріалами «для дорослих», проте, це популярне оману. Web-спам завжди поруч, чим би Ви не займалися в Мережі. Посилання на спам-сторінки ховаються на форумах, в повідомленнях соціальних мереж, файлообмінниках, особистих блогах і рекламних оголошеннях, що демонструються самими пошуковими системами. У 2011 році аналітики Google визнали, що велика частина шкідливих посилань ховається, безпосередньо, в топі їх пошукової видачі. На оновлення алгоритму пошуку тоді витратили мільйони доларів, в результаті чого Google почав видавати на 130 млн спам-сайтів менше. Представники пошукових систем сьогодні визнають, що всі перемоги у війні зі спамом короткострокові, а повністю позбутися від цифрового сміття, судячи з усього, вони не зможуть ніколи. Втім, робота йде постійно. На сьогоднішній день самим безпечним пошукачем загальновизнано вважається Google - він показує всього 272 спам-сайту на 10 млн ресурсів в пошуковій видачі. Той же параметр для Bing становить 1 285 шкідливих сайту, а для Яндекс -3 330.