В процессе оптимизации проекта SEO-специалисту приходится работать с большим объемом данных. Для решения подобных задач используются электронные таблицы. На замену оффлайн таблицам пришли Google таблицы, с которыми можно работать онлайн, без волнения о потере данных или последних изменений. Google Sheets удобны в использовании и сохраняют изменения в режиме реального времени.
Упростить работу с данными помогут формулы. В Google таблицах есть множество полезных формул для сортировки, объединения, разделения, добавления и поиска данных в таблице, и многие другие. Использование формул значительно облегчает и уменьшает временные затраты на выполнение задач.
С точки зрения задач по оптимизации сайта для поисковых систем SEO-специалисту может пригодиться множество формул, с помощью которых можно чистить, кластеризовать, интегрировать данные. Но не все знают о том, что таблицы Google можно использовать для импорта данных сайта.
SEO аудит сайта при помощи Google sheets
Технический SEO-аудит сайта необходимый и обязательный этап для любого проекта. Проведение аудита является основой для выявления последующей стратегии и работ по оптимизации. Для анализа и парсинга данных ресурса существует множество полезных ресурсов, таких как краулеры Screaming Frog SEO, NetPeak Spider, Visual SEO Studio и другие. Но не всегда необходимо прибегать к помощи краулеров, ведь некоторые их функции можно выполнить с помощью функций встроенных в Гугл таблицы.
Рассмотрим, какие формулы и возможности таблиц являются полезными для SEO. Импортировать данные из кода веб-страницы поможет формула ImportXML. Эта формула содержит два аргумента:
- URL-адрес документа, который указывается в скобках — (URL-адрес);
- запрос Xpath, в котором указано какой конкретный фрагмент из кода страницы необходимо извлечь.
Готовая формула ImportXML будет иметь следующий вид
=importxml ( URL; «запрос Xpath») |
Например для выгрузки из страницы в ячейке таблицы A2 элементов содержащихся в теге <(li)>…<(/li)> используется следующая формула:
=importxml (A2; “//li”) |
С помощью Гугл таблиц можно реализовать импорт данных различного формата, таких как:
- данные из других таблиц;
- таблицы или списки из веб-страниц;
- метаданные страницы;
- заголовки H1-H6;
- содержимое тега Robots;
- канонические страницы;
- ссылки на странице — входящие/исходящие;
- содержимое различных разметок в коде.
Таким образом можно автоматизировать извлечение нужных данных со страницы и не делать этого вручную, когда например нужно проверить отдельные веб-страницы сайта. Важно учитывать, что импортируемые с веб страницы данные подгружаются при открытии таблицы. Это очень удобно, когда нужно проследить были ли изменения на страницах либо внедрены ли необходимые правки. Также данные функции чувствительны к регистру в названии тегов, к примеру, если в формуле будет задано Description, а в коде сайта description, то формула не сработает.
Из минусов использования данного метода стоит отметить, что выгружать большие объемы данных с помощью формул в одной таблице не получится, будет необходимо разбить данные на несколько таблиц.
Импорт метаданных title, description и заголовков H1-H6 страниц
Одной из частых задач в процессе анализа сайта и проверки оптимизации страниц является парсинг метаданных содержащихся в title и description страницы. Таким образом можно быстро проследить изменения или сравнить имеющиеся на странице метаданные с необходимыми.
Для выполнения этой задачи помогут функции следующего вида:
- Определить title страницы:
=importxml (URL; «//title») |
Например, для извлечения контента тега title страницы — https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ , указанной в ячейке A2, необходимо добавить в таблицу следующий фрагмент:
URL | Title |
https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ | =importxml (A2; «//title») |
После загрузки данных Google Sheets получим:

- Определить description страницы:
=importxml (URL; «//meta[@name=’description’]/@content») |
Например, для извлечения контента мета-тега description страницы — https://svitsoft.com/ru/blog/audyt-podriadchyka-dlia-optymyzatsyy-yly-chto-nuzhno-znat-o-rabote-seo-spetsyalysta-na-karantyne/ , указанной в ячейке A2 добавляем в таблицу:
URL | Title |
https://svitsoft.com/ru/blog/audyt-podriadchyka-dlia-optymyzatsyy-yly-chto-nuzhno-znat-o-rabote-seo-spetsyalysta-na-karantyne/ | =importxml (A2; «//meta[@name=’description’]/@content») |
Результат:

- Определить заголовки H1-H6 страницы:
=importxml (A2; «//h1») |
=importxml (A2; «//h2») |
… |
=importxml (A2; «//h6») |
Например для извлечения заголовков H1 и H2 страницы — https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ в таблицу необходимо вставить данные:
URL | Заголовок H1 | Заголовок H2 | Заголовок H3 |
https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ | =importxml (A2; «//h1») | =importxml (A2; «//h2») | =importxml (A2; «//h3») |
Результат:

Импорт содержимого тега Robots страницы
Порой возникает необходимость узнать были ли внесены указания для роботов поисковых систем посредством добавления тега Robots на страницы и справиться с этой задачей, поможет очередная функция Google таблиц:
=importxml (URL; «//meta[@name=’robots’]/@content») |
Например, чтобы узнать какие значения прописаны в теге Robots для страницы
https://svitsoft.com/ru/blog/kak-uvelichit-organicheskij-trafik-na-114/ применим формулу вида:
URL | Canonical |
https://svitsoft.com/ru/blog/kak-uvelichit-organicheskij-trafik-na-114/ | =importxml (A2; «//meta[@name=’robots’]/@content») |
Результат:

Извлечение канонических страниц
Для импорта из HTML кода страницы содержимого canonical пригодится формула следующего вида:
=importxml(URL ; «//link[@rel=’canonical’]/@href») |
Например, для извлечения канонической страницы указанной для — https://svitsoft.com/ru/ необходимо применить следующую формулу:
URL | Canonical |
https://svitsoft.com/ru/ | =importxml(A2 ; «//link[@rel=’canonical’]/@href») |
Результат:

На этом функции Google таблиц применимые для работы SEO-специалистом не заканчиваются. Возможности Xpatch заложенные в основу формул импорта данных из кода страниц весьма разнообразны. Таким образом можно извлечь практически любое содержимое из HTML кода страницы.
Анастасия Шитько
SEO-специалист