О накрутках и этике бизнеса.
За 11 лет работы счётчика «Акавита» накопился огромный опыт отслеживания разного рода манипуляций с трафиком участников рейтинга.
Не все посетители одинаково полезны.
Вспомним, как это было, основные моменты:
2000 год:
Для увеличения позиций в рейтинге, владелец сайта просто дёргал счётчик со своего IP-адреса — решилось простым баном как сайта, так и IP.
Немного позднее, другие извлекли урок и накручивали свой сайт уже с разных IP, но криво написали робота: не прописали переменную окружения HTTP_ACCEPT_LANGUAGE :). Ребята молодцы, растут над собой, но спалились невнимательностью.
Затем пару лет ничего особенного не происходило, но вдруг кого-то осенило использовать для накруток модную технологию IFRAME: размещаем на каком-то посещаемом сайте (какая-нибудь порнуха porno-uchilki.com) HTML-таг «iframe» размером 0×0, который вызывает целевой сайт (тот сайт, у которого нужно накрутить посещаемость, например pupkind.com), и — вуаля! Посетители порно-училок автоматически посещают сайт Пупкинда, сами того не подозревая. А для счётчиков всё прекрасно! Они видят живых посетителей, не роботов, поэтому никаких накруток нет. Но вот незадача — в качестве ссылающейся страницы статистика предательски показывает porno-uchilki.com :(, да ещё и как основного источника трафика…
Почему в качестве примера трафикоисточника приведён порносайт? В моей практике отловленных накруток для таких целей использовались исключительно порно-сайты и варез-ресурсы. Оно и логично: цивилизованный сайт такой ерундой заниматься не будет, ему дороже репутация. Этим же ребятам ничего не чуждо, лишь бы платили.
После нескольких банов любителей ифрэймов, накрутчики надолго ушли в подполье.
2004 год ознаменовался новой вехой в истории трафикопривлечения.
Это время прихода на рынок очередного «мегапортала республиканского значения» — проекта tochka.by. Идея выбрана довольно удачно: поскольку большинство «вкусных» доменов (mail.by, chat.by, news.by и тд) захвачены самим регистратором доменов .BY (!!!) — надеюсь, что когда-нибудь это станет темой отдельного разбирательства — «точечники» предложили прикольную альтернативу: mail.tochka.by (мэйл-точка-бай), news.tochka.by (ньюс-точка-бай) и т. д.
Как же молодому амбициозному проекту привлечь первых посетителей? Очевидно, владельцы проекта это знали. Вскоре действительно tochka.by начала уверенно ползти к первым местам белорусского интернет-пьедестала, хотя многие недоумевали — откуда трафик? Но какой-то негодяй испортил им праздник, опубликовав ссылку на что-то вроде pupsik.ru, где при нажатии на картинку с красивыми формами, посетитель, вместо открытия новых горизонтов своего воображения, попадал… прямо на tochka.by! Был, как водится, скандал; на порносайтах больше точку не видели, пошумели и забыли. И про порнуху, и про «точку».
После этого наступил последний, самый современный и технологичный этап, который актуален и по сей день, и который пока не нуждается в принципиальном улучшении, только «подстройка» тонкостей алгоритма. Хотя, конечно, есть и другие методы, но лично я считаю самым красивым этот. Почему? Потому что мы с коллегой (владельцем другого счётчика) сами его придумали в процессе отлавливания свежего хитроумного накрутчика, еще до того, как этим методам стали пользоваться сами накрутчики. Году, наверное, в 2003-м.
Метод замечательный. Суть его заключается в том, что злоумышленник, всё на том же [сомнительнопосещаемом] сайте а-ля porno.com, ставит всё тот же хорошо знакомый нам IFRAME-код накручиваемого сайта, для примера снова pupkind.com. Дальше мы просто смотрим, в процессе генерации страницы нашего сайта: если в качестве referef (то есть ссылающейся страницы) приходит porno.com, где мы купили трафик и который мы не хотим светить в статистике, то мы подсовываем пользователю НАШ код счётчика № 1,НАШ код счётчика № 2 и тд, где прописан ПРАВИЛЬНЫЙ источник перехода: например zakon. kz ;). А если подойти творчески, то можно предварительно составить семантическое ядро сайта, которое применяется при поисковой оптимизации, и подсовывать в качестве referer-ов вместо порнухи… переходы из поисковиков по ключевым словам! А потом показывать рекламодателю: смотри, у нас отличный трафик! Только целевые посетители! Вот искали «Вася Пупкинд», вот — «купить золото», вот — «установка спойлеров на феррари», что душа пожелает!
Какой из этого вывод?
Доказать сегодня факт накрутки с помощью каких бы то ни было скриншотов, графиков и таблиц хоть li.ru, хоть GoogleAnalytics, хоть любого другого счётчика — НЕВОЗМОЖНО. Даже если будет открыт доступ ко всем публичным отчётам.
Единственный кто может это доказать — САМА система статистики, внутренним расследованием и тщательным ручным анализом. Сегодня — только так. Как именно следует делать анализ и что учитывать — это уже предмет отдельного разговора, но представители сервисов статистики знают где копать.
Впрочем, опытный аналитик сделает ряд выводов даже на основании пары отчётов из того же гугл-аналитикс. Есть такой параметр — процент отказов. Это любым способом привлечённые посетители, не являющиеся аудиторией сайта. Получили спам — кликнули, зашли, сразу ушли. Перекинуло с порнухи — зашли, сразу ушли и так далее. В том числе следует обратить внимание и на SEO-трафик, который почему-то многими считается образцом, идеальным трафиком, к которому не подкопаешься. Однако процент отказов с поисковиков может достигать чудовищных цифр в 80−90%! Да, сайт по ряду запросов будет в верхушке выдачи, но … кликнули, зашли, сразу ушли. Счётчики же — посчитали :)
А рекламодателям потом показывают графики и таблицы с армиями «уникальных посетителей» и требуют денег. Рекламодатель же, не зная предмета, но считая что он сейчас кого-то «охватит» — часто ведётся, увы.
Как же спастись от этой напасти? Часто это вопрос доверия, так как разобраться во всех технических тонкостях могут даже не все специалисты. Но тем, кто хочет вникнуть сам — вот несколько советов:
Надо тщательно анализировать конверсию во время рекламной кампании и состав аудитории, которая совершает переходы, а также требовать у рекламной площадки доступ к статистике.
Например, если высокий % отказов у сайта онлайн-энциклопедии — это нормально: посетитель пришёл из поиска на нужную статью и больше ему там делать нечего. Но, например, у крупного портала, который предлагает посетителям полный набор сервисов, этот показатель должен стремиться к нулю. Если мы видим обратную картину — значит аудитория там крайне низкого качества и нужно делать соответствующие выводы.
Таким образом, учитывая богатые технологические возможности современных методов накруток, на первое место выступает деловая этика и культура бизнеса.
А показать красивые картинки можно в любом счётчике, главное задаться целью.
Главный вывод: доверять данным счётчиков, установленных на рекламной площадке можно ровно до того момента, пока вы доверяете хозяевам этой рекламной площадки.
Ну и, конечно же, счётчик ОБЯЗАН быть независимым инструментом. Если он связан с крупной рекламной площадкой или ещё хуже — рекламным агентством — вопрос предвзятости является первым, ещё до просмотра графиков и отчётов данного счётчика.
С уважением, Фёдор Короленко, автор-разработчик системы статистики «Акавита» (akavita.by).
PS:
Кстати, первое упоминание «Акавиты» в СМИ — середина октября 1999 года, «Компьютерная газета»; то есть ровно 11 лет назад, с чем нас и поздравляю :)