Программа проверяет вхождения запросов в контенте заданных вами урлов. Эти данные добавляются в карту релевантности сайта.
Интерфейс
Как работает?
Шаг 1
Составляется файл в формате таблицы. Стили, гиперссылки в файле должны быть почищены. Поисковые операторы типа «+» из запросов надо удалить. Одинаковые урл желательно сгруппировать, чтобы они шли подряд в столбце — работать будет быстрее.
Формат файла:
Два столбца
А:запрос (что ищем на странице)
B: целевая страница ( урл, на котором хотим найти запрос)
Пример входного файла:
Выделяем столбцы и жмем копировать (Ctrl + C).
Шаг 2
Жмем кнопку “Paste from clipboard”, чтобы программа скопировала данные из буфера.
Шаг 3
Жмем «Create Map”.
Прога начинает искать по коду страницы и искать совпадения.
Когда находит, делает кнопку “Paste from clipboard” активной.
Копируем в буфер и добавляем в наш исходный файл.
Готовый файл представляет собой уже пять столбцов. Первые два — те же, что были на входе, а следующие три показывают вхождения запроса.
Пример готового файла:
Как работает программа: видео
Вхождения запросов
- A: Запрос (словосочетание которое ищем)
- B: Целевая страница (Урл страницы на которой ищем запрос из первого столбца)
- C (Exact): Точное вхождение (все слова запроса найдены подряд, но могут стоять другом порядке)
- D: (Partial)Частичное вхождение (в контенте найдены все слова запроса, но не подряд, и в любом порядке)
- E: (One Of) (найдено хотя бы одно из слов запроса)
Значения столбцов:
- C: количество 1-100 (сколько раз нашел на странице)
- D: 1 либо 0 (да/нет)
- E: 1 либо 0 (да/нет)
Как ищет?
- Прога ищет исключительно по тексту. Все то, что находится между тегами: «p», «div», «span», «h1…». Атрибуты тегов, стили и скрипты, комментарии не рассматриваются. Если например, пункт меню у вас выпадает скриптом, текст пункта ссылки не будет учтен.
- Контент в тегах title и description учитывается.
- Поиск производится не полнотекстовый — если нужны словоформы, вам надо самостоятельно подать их на вход. По умолчанию ищется так: «!слово !слово».
- Прога не ищет по сайту — только по тому урлу, который вы задаете. В том то и смысл, чтобы отделить целевой урл от остальных страниц. Если на целевом плохо с вхождениями, то и релевантным он не окажется. Скорее всего, стоит докручивать.
Пример поиска по тексту
На вход подали запрос “купить красный стул” и урл целевой страницы с таким текстом:
«В Москве красный стул купить можно недорого. Недорогой стул — это то, что хотят купить все. Неважно, красный он или малиновый.»
Что найдется на выходе:
Столбец (Exact): цифра 1, потому что найдено три слова подряд, но в другом порядке “красный стул купить”
Столбец (Partial): статус 1, так как найдены все три слова: “купить, красный, стул” в разных местах текста
Столбец (One Of): статус 1, так хотя бы одно из слов найдено (ну там есть все три, так что любое)
Теперь по тому же тексту ищем другой запрос: “купить малиновый стул”
Столбец (Exact): 0 «купить малиновый стул, стул малиновый купить, купить стул малиновый, малиновый купить стул» — перебраны варианты по порядку, не найдено
Столбец (Partial): статус 1, так как найдены все три слова: «малиновый, купить, стул»
Столбец (One Of): статус 1, одно из слов найдено
Теперь ищем “малиновый диван”
Столбец (Exact): 0 эти слова рядом не найдены, и в другом порядке тоже
Столбец (Partial): 0 так как “малиновый” найдено, а “диван” нет
Столбец (One Of): 1 так как найдено: “малиновый”
Слова-исключения, которые не учитываются при поиске, это служебные части речи (список ниже). Планируем возможность добавлять свой список минус-слов при проверке. А пока можно написать мне, если считаете что надо минусить какое-то слово для всех.
а
бы
в
во
вот
для
до
если
же
за
и
из
или
к
ко
на
но
о
об
от
по
при
с
то
у
чтобы
да
нет
не
между
над
около
под
про
среди
Что делать с готовым файлом?
Вставляем три получившихся столбца в свою карту релевантности, смотрим, делаем выводы. Можем понять, почему целевую страницу, которую вы продвигаете, Яндекс не считает релевантной — на ней просто нет точных вхождений нужных запросов.
Если что-то осталось непонятным по работе сервиса — пишите автору