tg-me.com/heymoneymaker/1558
Last Update:
Идея предложена ребятами из MOAB, а это максимально простая реализация на Python.
Напомню суть: чтобы понять относится ли запрос к вашему сайту или нет, нужно собрать список наиболее близких конкурентов и посчитать, сколько раз они встречаются в топе по семантике.
Если в топ-10 хотя бы 2 ваших конкурента, то однозначно он релевантен и вам. Если в топе нет ни одного конкурента, то запрос можно удалить.
Считая для каждого запроса количество «баллов» можно быстро отфильтровать семантику и удалить запросы набравшие 0 или 1 балл.
Область применения скрипта не только в чистке семантики, но и для определения коммерческости запроса (например, по наличию Яндекс.Услуг / Маркета)
Как работать со скриптомзапрос;url1;...;url10
в текстовом файле input.txt
(экспорт данных в XLSX в программе KeyAssort)cleankeys.py
и кладём рядом с input.txt
, не забываем указать конкурентов (больше - точнее)finish.csv
, в котором содержится колонка с баллами.
Результат на скриншоте, за пару часов можно автоматом вычистить десятки тысяч запросов и оставить только целевые, ссылка на код скрипта.