Как приготовить лучшую базу ключей на рынке?

Когда перед нами встала задача наполнения базы ключевых слов, а это, без сомнения, наиболее важный элемент любого подобного сервиса, мы подошли к процессу масштабно. Из большинства доступных источников – подсказки Яндекса, на тот момент ещё открытые данные счетчиков Метрики, данные из счётчиков Liveinternet – были собраны примерно 1,5 млрд ключевых слов. Всем этим словам была проверена частотность Wordstat и из всей базы мы выбрали 150 000 000 наиболее часто запрашиваемых слов. При сортировке всех 1,5 млрд по столбцу «Частотность», строка под номером 150 000 000 имела показатель 4 показа в месяц. Мы решили, что это – та самая граница, которую мы искали.

Мы разработали алгоритм выделения перефразированных запросов и запросов с одинаковыми словами в разном порядке, долго и упорно экспериментировали с этими подходами в попытках сделать базу чище, получили, как нам казалось, хорошие результаты. Используя этот подход, мы сделали выборку наиболее уникальных и запрашиваемых слов, получилось немногим более 70 000 000 фраз, именно они послужили отправной точкой для нашей базы.

Команда Keys.so
Оцените автора
Блог Keys.so