SEO Все статьи

Анализ сайта бесплатно с помощью Google таблиц: извлечение данных проекта с помощью формул

Анастасия Шитько
Анастасия Шитько SEO-специалист
27.10.2020
2531
0

В процессе оптимизации проекта SEO-специалисту приходится работать с большим объемом данных. Для решения подобных задач используются электронные таблицы. На замену оффлайн таблицам пришли Google таблицы, с которыми можно работать онлайн, без волнения о потере данных или последних изменений. Google Sheets удобны в использовании и сохраняют изменения в режиме реального времени.

Упростить работу с данными помогут формулы. В Google таблицах есть множество полезных формул для сортировки, объединения, разделения, добавления и поиска данных в таблице, и многие другие. Использование формул значительно облегчает и уменьшает временные затраты на выполнение задач. 

С точки зрения задач по оптимизации сайта для поисковых систем SEO-специалисту может пригодиться множество формул, с помощью которых можно чистить, кластеризовать, интегрировать данные. Но не все знают о том, что таблицы Google можно использовать для импорта данных сайта.

SEO аудит сайта при помощи Google sheets

Технический SEO-аудит сайта необходимый и обязательный этап для любого проекта. Проведение аудита является основой для выявления последующей стратегии и работ по оптимизации. Для анализа и парсинга данных ресурса существует множество полезных ресурсов, таких как краулеры Screaming Frog SEO, NetPeak Spider, Visual SEO Studio и другие. Но не всегда необходимо прибегать к помощи краулеров, ведь некоторые их функции можно выполнить с помощью функций встроенных в Гугл таблицы.

Рассмотрим, какие формулы и возможности таблиц являются полезными для SEO. Импортировать данные из кода веб-страницы поможет формула ImportXML. Эта формула содержит два аргумента:

  1. URL-адрес документа, который указывается в скобках — (URL-адрес);
  2. запрос Xpath, в котором указано какой конкретный фрагмент из кода страницы необходимо извлечь.

Готовая формула ImportXML будет иметь следующий вид

=importxml ( URL; «запрос Xpath»)

Например для выгрузки из страницы в ячейке таблицы A2  элементов содержащихся в теге <(li)>…<(/li)> используется следующая формула:

=importxml (A2; “//li”)

С помощью Гугл таблиц можно реализовать импорт данных различного формата, таких как:

  • данные из других таблиц;
  • таблицы или списки из веб-страниц;
  • метаданные страницы;
  • заголовки H1-H6;
  • содержимое тега Robots;
  • канонические страницы;
  • ссылки на странице — входящие/исходящие;
  • содержимое различных разметок в коде.

Таким образом можно автоматизировать извлечение нужных данных со страницы и не делать этого вручную, когда например нужно проверить отдельные веб-страницы сайта. Важно учитывать, что импортируемые с веб страницы данные подгружаются при открытии таблицы. Это очень удобно, когда нужно проследить были ли изменения на страницах либо внедрены ли необходимые правки. Также данные функции чувствительны к регистру в названии тегов, к примеру, если в формуле будет задано Description, а в коде сайта description, то формула не сработает.

Из минусов использования данного метода стоит отметить, что выгружать большие объемы данных с помощью формул в одной таблице не получится, будет необходимо разбить данные на несколько таблиц.

Импорт метаданных title, description и заголовков H1-H6 страниц

Одной из частых задач в процессе анализа сайта и проверки оптимизации страниц является парсинг метаданных содержащихся в title и description страницы. Таким образом можно быстро проследить изменения или сравнить имеющиеся на странице метаданные с необходимыми.

Для выполнения этой задачи помогут функции следующего вида: 

  1. Определить title страницы:
=importxml (URL; «//title»)

Например, для извлечения контента тега title страницы — https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ , указанной в ячейке A2, необходимо добавить в таблицу следующий фрагмент:

URLTitle
https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ =importxml (A2; «//title»)

После загрузки данных Google Sheets получим:

  1. Определить description страницы:
=importxml (URL; «//meta[@name=’description’]/@content»)

Например, для извлечения контента мета-тега description страницы — https://svitsoft.com/ru/blog/audyt-podriadchyka-dlia-optymyzatsyy-yly-chto-nuzhno-znat-o-rabote-seo-spetsyalysta-na-karantyne/ , указанной в ячейке A2 добавляем в таблицу:

URLTitle
https://svitsoft.com/ru/blog/audyt-podriadchyka-dlia-optymyzatsyy-yly-chto-nuzhno-znat-o-rabote-seo-spetsyalysta-na-karantyne/=importxml (A2; «//meta[@name=’description’]/@content»)

Результат:

  1. Определить заголовки H1-H6 страницы:
=importxml (A2; «//h1»)
=importxml (A2; «//h2»)
=importxml (A2; «//h6»)

Например для извлечения заголовков H1 и H2 страницы — https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/ в таблицу необходимо вставить данные:

URLЗаголовок H1Заголовок H2Заголовок H3
https://svitsoft.com/ru/blog/chto-nuzhno-znat-pry-podbore-tehov-dlia-youtube-kanala-y-vydeorolykov/=importxml (A2; «//h1»)=importxml (A2; «//h2»)=importxml (A2; «//h3»)

Результат:

Импорт содержимого тега Robots страницы

Порой возникает необходимость узнать были ли внесены указания для роботов поисковых систем посредством добавления тега Robots на страницы и справиться с этой задачей, поможет очередная функция Google таблиц:

=importxml (URL; «//meta[@name=’robots’]/@content»)

Например, чтобы узнать какие значения прописаны в теге Robots для страницы

 https://svitsoft.com/ru/blog/kak-uvelichit-organicheskij-trafik-na-114/ применим формулу вида:

URLCanonical
https://svitsoft.com/ru/blog/kak-uvelichit-organicheskij-trafik-na-114/=importxml (A2; «//meta[@name=’robots’]/@content»)

Результат:

Извлечение канонических страниц

Для импорта из HTML кода страницы содержимого canonical пригодится формула следующего вида:

=importxml(URL ; «//link[@rel=’canonical’]/@href»)

Например, для извлечения канонической страницы указанной для — https://svitsoft.com/ru/ необходимо применить следующую формулу:

URLCanonical
https://svitsoft.com/ru/=importxml(A2 ; «//link[@rel=’canonical’]/@href»)

Результат:

На этом функции Google таблиц применимые для работы SEO-специалистом не заканчиваются. Возможности Xpatch заложенные в основу формул импорта данных из кода страниц весьма разнообразны. Таким образом можно извлечь практически любое содержимое из HTML кода страницы.

Анастасия Шитько
SEO-специалист

Комментарии
0 записей

Выскажите свое мнение