Рейтинг:  5 / 5

Звезда активнаЗвезда активнаЗвезда активнаЗвезда активнаЗвезда активна
 

Спам (от английской аббревиатуры SPAM, см. ниже "Возникновение термина") – рассылка любого вида сообщений, коммерческой и другой рекламы либо информации лицам без их ведома и согласия. В частности, в русскоязычных странах обозначает главным образом электронную рассылку писем с рекламой и прочей информацией.

К 2011 году доля спама в мировом почтовом трафике составила около 80%.

Существует огромное количество видов спама. Что же касается сферы SEO, то здесь есть смысл говорить о поисковом спаме.

Поисковый спам – это веб-страницы или целые ресурсы, созданыe с целью влияния на поисковую выдачу, то есть, такое манипулирование поисковыми системами, при котором на первые позиции в выдаче попадают не максимально релевантные ресурсы, а продвигаемые оптимизатором. Является, по сути, незаконной деятельностью, относится к черной оптимизации и может повлечь за собой отправление ресурса в бан.

 

Возникновение термина

Слово SPAM появилось в 1936 году и являлось аббревиатурой (и одновременно товарным знаком) мясных консервов американского производителя Hormel Foods Corporation. Есть два варианта расшифровки данной аббревиатуры: Shoulder of Pork and hAM – "свиные лопатки и окорока" и SPiced hAM – "острая ветчина" или "ветчина со специями". Ассоциироваться с навязчивой рекламой данные вполне обычные мясные консервы стали после Второй Мировой Войны, когда после снабжения войск их осталось огромное количество. Для того, чтобы все это добро максимально быстро сбыть (сроки годности подходили к концу), компания Hormel Foods Corporation провела крайне навязчивую рекламную кампанию, разместив слово SPAM везде, где только можно (и нельзя): транспорт, фасады домов, газеты и журналы, доски объявлений… Кроме того, реклама шла по радио практически без остановки. И постепенно название консервов превратилось в имя нарицательное, означающее навязчивую рекламу вообще.

Фирма Hormel Foods вовсе не обиделась на скетч и даже некоторое время выпускала банки в «монтипайтоновском» оформлении.

Приложили руку к распространению слова SPAM и создатели известного английского телевизионного шоу "Летающий цирк Монти Пайтон", вышедший в 1969 году. Смысл скетча сводится к тому, что в одном кафе все блюда в меню содержат «SPAM», некоторые даже по нескольку раз. Когда главный герой скетча, пришедший в это кафе вместе с женой, просит принести ему блюдо без SPAMа, официантка предлагает ему блюдо "с небольшим количеством SPAMа".

Посетитель возмущается, а хор викингов, сидящих за соседними столиками, начинает петь хвалебную песню SPAM: "Spam, Spam, Spam, Spam… Lovely Spam! Wonderful Spam!" (Spam, Spam, Spam, Spam… Любимый Spam! Замечательный Spam!), делая невозможным диалог официантки и посетителей (то есть "spamming" диалог — "заспамить" диалог), после чего скетч погружается в хаос. В конце скетча жена героя восклицает: "Я не люблю SPAM!" В титрах к именам действующих лиц также было добавлено слово SPAM (Spam Terry Jones, Michael Spam Palin, John Spam John Spam John Spam Cleese и др.). В общей сложности это слово упоминается в скетче 108 раз.

В 1980-е годы смысл слова "спам" несколько расширился. В Usenet (одной из старейших компьютерных сетей) появились недобросовестные рекламодатели; потоки рекламы начали мешать конструктивному общению. По аналогии со скетчем, это явление стали называть "заспамить диалог", а назойливую корреспонденцию, соответственно, "спамом". На этот раз производители консервов не поддержали инициативу, и даже судились с производителем антиспамового программного обеспечения SpamArrest. Суд разрешил использовать слово "спам" только вместе с названием фирмы (Hormel).

Еще один ряд бесконечных рекламных сообщений, после которого спам стал спамом в сегодняшнем значении, пришелся на 1986 год. Тогда в конференциях Usenet появилось множество одинаковых сообщений от некоего Дэйва Родеса, который рекламировал новую финансовую пирамиду. Заголовок гласил: "Заработай кучу денег", а в письмах содержалась инструкция, как это сделать. Автор с завидным упорством продолжал дублировать свои тексты, и они настолько приелись подписчикам, что их стали сравнивать с рекламируемыми в скетче консервами.

Так за словом «спам» закрепилось новое значение, позднее перешедшее в компьютерную терминологию для обозначения назойливых рекламных рассылок.

 

Виды спама

По данным Лаборатории Касперского, в феврале 2010 года почтовый спам в интернете распределился по тематике следующим образом: 18,9% — образование, 15,7% — отдых и путешествия, 15,5% — медикаменты, товары/услуги для здоровья, 9,2% — компьютерное мошенничество, 6,5% — компьютеры и интернет, 5,2% — реплики элитных товаров, 4,1% — реклама спамерских услуг, 2,7% — для взрослых, 2,2% — недвижимость, 2,2% — юридические услуги, 1,9% — личные финансы, 1,4% — полиграфия.

Самой Лаборатории Касперского так и не удалось создать конкурентоспособный спам-фильтр — вплоть до 2013 г. их системы не обеспечивали возможности фильтрации контента.

 

Реклама

Некоторые компании, занимающиеся легальным бизнесом, рекламируют свои товары или услуги с помощью спама. Привлекательность такой рекламы — низкая стоимость и (предположительно) большой охват потенциальных клиентов. Впрочем, такая реклама может иметь и обратный эффект, вызывая настороженность у получателей.

 

Реклама незаконных товаров

С помощью спама рекламируют продукцию, о которой нельзя сообщить другими способами — например, п()рн()гр@фию, контрафактные товары (подделки, конфискат), лекарственные средства с ограничениями по обороту, незаконно полученную закрытую информацию (базы данных), контрафактное программное обеспечение.

Сюда же относится и реклама самих услуг рассылки спама. Хотя спам-рассылки официально не запрещены, тем не менее, открыто рекламировать их сложно из-за того, что не всякий сайт согласится у себя разместить баннер или контекстную рекламу подобного содержания.

 

Антиреклама

Запрещенная законодательством о рекламе информация — например, порочащая конкурентов и их продукцию, — также может распространяться с помощью спама.

 

Нигерийские письма

Иногда спам используется мошенниками, чтобы выманить деньги у получателя письма. Наиболее распространённый способ получил название "нигерийские письма", потому что большое количество таких писем приходило из Нигерии. Такое письмо содержит сообщение о том, что получатель письма может получить каким-либо образом большую сумму денег, а отправитель может ему в этом помочь. Затем отправитель письма просит перевести ему немного денег под предлогом, например, оформления документов или открытия счета. Выманивание этой суммы и является целью мошенников.

Более узкое название этого вида мошенничества — скам или скам 419 (по номеру статьи в УК Нигерии).

 

Фишинг

От англ. password — пароль и fishing — рыбалка. Ещё один способ мошенничества. Он представляет собой попытку спамеров выманить у получателя письма номера его кредитных карточек или пароли доступа к системам онлайновых платежей. Такое письмо обычно маскируется под официальное сообщение от администрации банка. В нём говорится, что получатель должен подтвердить сведения о себе, иначе его счёт будет заблокирован, и приводится адрес сайта (принадлежащего спамерам) с формой, которую надо заполнить. Среди данных, которые требуется сообщить, присутствуют и те, которые нужны мошенникам. Для того, чтобы жертва не догадалась об обмане, оформление этого сайта также имитирует оформление официального сайта банка.

 

Другие виды спама

  • Письма счастья.
  • Пропаганда.
  • DoS и DDoS-атаки.
  • Массовая рассылка от имени другого лица, для того чтобы вызвать к нему негативное отношение.
  • Массовая рассылка писем, содержащих компьютерные вирусы (для их начального распространения).
  • Рассылка писем, содержащих душещипательную историю (как правило, о больном, либо пострадавшем в результате несчастного случая ребёнке) с информацией о том, что за каждую пересылку письма некий интернет-провайдер якобы выплатит семье пострадавшего определённую сумму денег "на лечение". Целью такой рассылки является сбор e-mail адресов: после многочисленных пересылок «всем знакомым» в тексте такого письма часто содержатся e-mail адреса всех, кому оно было переслано ранее. А в числе очередных адресатов вполне может оказаться и инициировавший её спамер.

Есть также такие типы массовых рассылок, которые обычно не относят к категории спама, потому что они осуществляются неумышленно.

  • Почтовые черви определённого типа распространяют себя при помощи электронной почты. Заразив очередной компьютер, такой червь сканирует компьютер в поисках e-mail адресов и рассылает себя по найденным адресам.
  • Почтовый сервер, отвергнув письмо, может послать отправителю уведомление о недоставке (англ. Non-delivery report, NDR). Поскольку в спаме адрес отправителя подделан, не имеющий отношения к рассылке пользователь может получить в свой адрес множество сообщений о недоставке. Английский термин для этого явления — backscatter.
  • Аналогичное поведение демонстрируют некоторые антивирусные программы и спам-фильтры. Впрочем, такое поведение встречается только у очень старых программ — выпущенных ещё до того, как проблема спама в интернете приобрела массовый характер.

 

Поисковый спам

Он же спамдексинг или веб-спам — это целые сайты или отдельные страницы в Интернете, созданные с целью манипуляции результатами поиска в поисковых машинах — в конечном счёте, для обмана пользователя.

Несмотря на все методы борьбы и фильтрации, 20% всех интернет-сайтов являются спамом, а 5-7% ссылок при поисковой выдаче ведут на страницы с поисковым спамом.

 

Возникновение поискового спама

История развития поисковых систем и спамдексинга идут рука об руку. Спамеры постоянно совершенствуют свои методы, а поисковые системы реагируют на это изменением формулы релевантности.

Изначально поисковые системы придавали большое значение содержимому мета-тегов и ключевым словам. Поскольку содержимое мета-тегов не видно пользователю, но прекрасно индексируется поисковиками, то оптимизаторы стали размещать в мета-тегах нужные (популярные) ключевики, зачастую не имеющие никакого отношения к содержимому сайта. В результате этого пользователи поисковых систем перестали получать информацию релевантную их запросам. После того, как подобными методами стали пользоваться практически все вебмастера, поисковики перестали учитывать информацию, размещенную в мета-тегах. Поисковые системы стали учитывать только содержание текстов веб-страниц, то есть ту информацию, которая видна пользователям.

 

Виды поискового спама

  • Не имеющие отношения к содержимому страницы, но популярные в поисковых запросах слова в тегах "meta keywords", "description", например "sex", "халява". В результате поисковые машины стали анализировать не только специальные теги, но и сам текст сайта.
  • "Накачка" текста ключевыми словами — искусственное повышение частоты ключевого слова или выражения в тексте и (или) использование элементов разметки HTML (h1-3, strong, b, em, i) для искусственного повышения веса ключевого слова.
  • Дублирование страниц. Может возникать в интернет-магазинах или на других ресурсах, предлагающих несколько похожих товаров/услуг с использованием одного и того же описания на разных страницах. При продвижении сайта в поисковых машинах на дублирующихся страницах создаются уникальные описания позиций, чтобы предотвратить понижение рейтинга ресурса.
  • Невидимый текст — текст, невидимый для посетителя страницы, но индексируемый поисковой машиной. Применяется цвет текста, соответствующий цвету фона, текст размером в 1 пиксель, блоки текста, со стилем "display:none".
  • Неравномерное соотношение количества внутренних и внешних ссылок. Если на страницу практически не ссылаются другие ресурсы, а на ней размещено большое количество исходящих линков, такая ситуация может расцениваться поисковыми роботами как непотизм (ссылочный спам).
  • Ссылочный спам — ссылки, накручивающие параметр "link popularity" и PageRank сайта. Так как поисковики, отвечая на запрос, ориентируются на количество ссылок, имеющихся на других сайтах на данный ресурс, то появилась идея как-то увеличить число таких ссылок:

Создать небольшие сайты на бесплатном хостинге, зарегистрировать их в большом количестве тематических каталогов и с них ссылаться на основной;

Принять участие в обмене ссылками;

Приобретать ссылки за деньги;

Ссылочный спам с гостевых книг, блогов, википроектов и пр.

Пример поискового спама на странице

Поисковые машины борются с этим, создавая фильтры, в которые добавляют сайты, ссылки с которых не учитываются при ранжировании.

  • Дорвеи — промежуточные страницы, созданные для накрутки веса страницы при ссылочном ранжировании или для организации Гугл-бомбы. В соответствии с технологией дорвеев в поисковом индексе надо продвигать специальную страницу дорвей. А уже с этой страницы перенаправлять на рекламную. У одной рекламной страницы может быть неограниченное число дорвеев. Поисковые машины в ответ удаляют из своей базы данных сайты, в которых есть автоматическое перенаправление. На что спамеры отвечают простой уловкой: просят посетителя самого нажать на кнопку "Вход на сайт" или что-то подобное.
  • Маскировка, или клоакинг — анализ переменных запроса, при котором поисковой машине отдается содержимое сайта, отличное от того, которое видит пользователь.

 

Последствия использования поискового спама

Для работы с поиском в Google даже существует разные отделы, один посвящен качеству поиска (Search Quality Team) и его задача как раз обеспечивать качество выдачи (работают с формулой ранжирования).

Главная проблема, порождаемая поисковым спамом, заключается в том, что он генерирует множество мусорного контента, затрудняя эффективную работу поисковых серверов, искажает объективное ранжирование интернет-ресурсов и релевантность поисковых результатов. В итоге это во многом обесценивает Интернет как источник получения объективной информации.

Если ранние поисковые машины могли доверять ключевым словам, указаниям на частоту обновления, то, в связи с активным использованием этих методов для обмана поисковых систем, более поздние версии поисковиков были вынуждены практически полностью игнорировать эти указания, критически относясь к каждой из страниц сайта, что сделало затруднительным поиск действительно релевантных страниц c редким содержимым и прописанными ключевыми словами. Например, страница с текстом средневековой песни и ключевыми "Средние века, поэзия, Восточная Европа", не обладающая большим количеством ссылок с других сайтов, не содержащая в тексте слова "Средние века, поэзия", вряд ли будет найдена по этим ключевым словам.

Сегодня при ранжировании сайтов поисковыми системами в формуле учитывается не только релевантность сайта, его авторитетность и все остальные показатели качества, но также и коэффициент спамности. Причем, этот коэффициент не бинарный (спам или не спам), а непрерывный.

Один из методов определения контентного поискового спама это статистический анализ различных его информационных составляющих. В одном из документов специалисты из Microsoft показывают явные зависимости спамности контента от количества используемых слов, средней их длины, сжимаемости текста, используемых водянистых слов и других параметров.

 

Оценка эффективности

Тестирование и анализ результатов рассылки спама неизменно показывает его исключительно низкую эффективность, а часто и почти полную безрезультатность. Например, во время рекламной кампании в Калифорнии с 75 869 компьютеров за 26 дней были разосланы 350 млн. извещений о продаже нового лекарства на натуральной основе. В итоге фирма получила 28 заказов.

 

Известные спамеры

  1. Американец Сэнфорд Уоллес по прозвищу "Король спама" был оштрафован на 4, 234 и 711 млн. долларов (в 2006, 2008 и 2009 годах соответственно).
  2. Известный российский спамер Леонид Куваев, занимающий второе место в списке самых злостных спамеров Интернета, начинал свой бизнес в Америке, однако в 2005 году попал под суд — генеральный прокурор штата Массачусетс определил, что спамерская сеть Куваева, в том числе партнёрская программа BadCow, генерируют ему $30 млн. ежегодно — и выходцу из РФ присудили штраф в размере $37 млн. Однако, тот уехал обратно в Россию, откуда его не удалось достать даже с помощью ФБР. Его сайты продолжали продавать "Виагру" без лицензии и рассылать спам через ботнеты. В декабре 2009 года Куваев был арестован в Москве за преступление не связанное со спам-деятельностью.
  3. Центр Американского Английского — один из наиболее известных российских спамеров.
  4. Центр Плюс, Экстра М — наиболее известные представители "бумажного спама".

 

В 2013 году в российских СМИ появилась информация о разработке и скором запуске специальной системы, которая автоматизирует рассылку политического спама в социальных сетях. Предполагается, что с помощью данного ресурса активисты различных провластных молодёжных движений будут выводить в мировые или российские треды системы Твиттер свои хэштеги, а также "замусоривать" спамом темы, выдвигаемые оппозицией в социальных сетях.