⭐️ Способ массового внедрения тегирования ⭐️
Последние несколько дней изрядно кипел над задачей по массовому внедрению тегов для агрегатора. Трёх лет и армии джунов у меня нет, поэтому автоматизация наше всё.
При решении этой задачи есть три ключевых проблемы:
1. Сбор полного списка тегов;
2. Привязка собранных тегов к категориям;
3. Наполнение товаром.
1. Первое что приходит на ум - собрать групповой отчёт по конкурентам с полной семантикой, снять частотность, срезать все запросы с 1 словом и больше 4 слов. И если закрыть глаза, на то что там будет куча товарных запросов (не категорийных) сталкиваемся с серьезной проблемой - из запросов режутся все символы и переводятся в нижний регистр, как следствие получаем, например, такое:
* манометр для воды 3 4
* шланг для душа 3 8
Даже если и проиндексируются такие страницы, то показывать случайно зашедшим пользователям будет стыдно. Поэтому заранее отправляем любую сумму на благотворительность, запускаем лягушку и идём грешить. 🤷♂️
Если верить в гипотезу, что крупные SEO отделы конкурентов за вас провели работу по сбору тегов, то нам остаётся просто спарсить H1, в котором тег находится в нужном регистре и в правильной словоформе. Используя XPath и немного наблюдательности запускаем скан только на категории и теги (которые часто не отличить от категорий). Забрать нужно следующие данные:
URL | H1 | Хлебные крошки (для понимания принадлежности к категории)
Нормально столкнуться с тем, что скан лягушкой забанен, тогда с аналогичной задачей идём на фриланс к специалистам по парсингу. Итоговый список категорий и тегов прогоняем на "частотность", чтобы срезать все пустышки. Зная нашу структуру категорий минусуем все прямые совпадения, остальное будем считать тегами.
2. Теперь наша задача привязать список тегов к категориям. Если бы теги мы забирали с одного проекта, за пару дней можно было подготовить связь структур, но что делать, когда доноров с тегами много? Правильно, включать мозг.
Кто у нас разбирается в релевантности? Яндекс и Google. Формируем Excel файл, в котором по формуле добавляем запросы:
📌 site:vashsite.ru {тут_название_тега} "какая-нибудь маска текста из тайтла категории"
Осталось по этой маске получить первый релевантный ответ из выдачи поисковика - это и будет ближайшая к тегу категория с вашего сайта. Сделать это можно, например, через KeyAssort.
3. Теперь имея тег, остаётся привязать товары. Используем вышеуказанный способ, только вместо маски категории используем маску товара, и результатов не 1, а например 50 или 100. Дальше остаётся импортировать всё на сайт. Как только появляется видимость по тегу - вручную корректируем подборку товаров, добавляем более релевантные или удаляем лишние.