Ассоциированные конверсии в GA4 (Google Analytics 4)

Ассоциированные конверсии в GA4 (Google Analytics 4)

С переходом на GA4 многие потеряли отчёт по ассоциированным конверсиям. Пользователей можно понять - такого отчёта нет в GA4, а посмотреть участие кампаний и источников в цепочках конверсий бывает нужно. Ведь как еще показать клиенту, что охватные кампании действительно работают несмотря на огромный CPL? Мы решили разобраться как получать ассоциированные из Google Analytics 4 и по каким срезам они доступны. 

Что такое ассоциированные конверсии?

Если источник хотя бы 1 раз участвовал в цепочке конверсий, при этом он не являлся последним, мы считаем эти конверсии ассоциированными для данного источника. 

Скажу пару слов о значимых источниках и их влиянии на ассоциированные, чтобы сразу закрыть этот вопрос. Значимые источники в Google Analytics - это все источники, кроме прямых переходов. Прямые переходы обозначаются в GA как "direct / none". При подсчёте конверсий по стандартной модели (последний значимый переход) мы не учитываем прямой трафик, так как он не является значимым. Но значимость источника никак не влияет на вычисление ассоциированных конверсий. Google считает ассоциированные по всей цепочке кроме последнего касания и неважно насколько значимым было последнее касание и все остальные касания. 

Разберём несколько примеров и посчитаем число прямых и ассоциированных конверсий для yandex_direct. Возьмём 5 цепочек конверсий, каждая из которых закончилась одной конверсией: 

yandex_direct
yandex_direct -> yandex_direct -> yandex_direct -> yandex_direct
yandex_direct -> mytarget -> yandex_direct 
google_organic -> vkads -> yandex_direct
vkads -> yandex_direct -> mytarget

Первая цепочка из одного источника даёт 1 прямую конверсию yandex_direct. Вторая цепочка из 4 касаний по yandex_direct даёт 1 прямую и 1 ассоциированную конверсию yandex_direct. Третья цепочка даёт также 1 прямую и 1 ассоциированную конверсию yandex_direct. Четвёртая даёт 1 прямую конверсию yandex_direct. Пятая цепочка даёт 1 ассоциированную конверсию. По итогу у yandex_direct 3 ассоциированных и 4 прямых конверсии.

Мы рассмотрели ассоциированные по yandex_direct, но те же цепочки давали ассоциированные конверсии другим источникам - mytarget, vkads и google_organic. В связи с этим ассоциированные конверсии разных источников нельзя суммировать. Сумма ассоциированных конверсий по разным источникам не имеет никакого смысла. Смысл несёт только число ассоц. для конкретного источника или кампании.

При этом сумма ассоциированных по источникам не совпадёт с суммой ассоциированных по кампаниям. Рассмотрим простой пример:

yandex_direct (campaign1) -> yandex_direct (campaign2) -> yandex_direct (campaign3) -> yandex_direct (campaign1)

В нашей цепочке из 4 касаний yandex_direct всего 1 ассоциированная по yandex_direct, но целых 3 ассоциированных в разрезе кампаний - по campaign1, campaign2 и campaign3. Поэтому не пытайтесь суммировать ассоциированные, вы получите неверные данные. 

Ассоциированные конверсии против моделей атрибуции

Я всегда оперировал понятием "модель атрибуции", а не "ассоциированные конверсии". Вы можете переключать модели, сравнивать их и видеть разную картину по разным источникам и РК, это удобно. Многих смущает дробное число конверсий в той же линейной модели, но это нужно принять: если цепочка состоит из 3 касаний, каждому источнику достанется 1/3 конверсии.  

Почему же так популярны именно ассоциированные конверсии, а не модели атрибуции? Рынок привык всё оценивать по модели "последний значимый источник", ведь когда вы включаете счётчик, он отображает именно её. Но как же понять вклад источников в цепочки если все смотрят отдачу по последнему значимому? Всё верно - посмотреть ассоциированные конверсии. 

Анонсы всех видео, статей и полезностей - в нашем Telegram-канале🔥
Присоединяйтесь, обсуждайте и автоматизируйте!

Замечу, что в цепочке "vkads / cpc -> direct / none" источнику vkads будет засчитана как прямая, так и ассоциированная конверсия. Таковы особенности расчёта гугла на основе значимых источников - про это писал выше. Не скажу, что таких конверсий много, но определённое пересечение будет, его надо иметь в виду.   

Конечно, идея построить отчёт по кастомной модели атрибуции без подобных пересечений звучит заманчиво, но с чем этот отчёт потом сравнивать, как понять что он правильный? С отчётом по последнему значимому всё гораздо проще - зашел в счётчик аналитики и посмотрел сколько там конверсий, если совпало - отчёт верный. Ну и ассоциированные заодно сверил. 

Так что хоть многие знают про модели атрибуции, эти модели не всегда приживаются. И несмотря на проблемы с суммированием ассоц. конверсий, спрос на них всё равно есть. И, как вы уже догадались, ассоциированные можно посчитать имея доступ к выгрузке цепочек конверсий.

Считаем ассоциированные по отчёту пути конверсии в GA4

В Google Analytics 4 можно выгрузить пути конверсий по 4 срезам: 
Канал, Источник, Группа каналов и Кампания.

Возьмём знакомый пример:

yandex_direct
yandex_direct -> yandex_direct -> yandex_direct -> yandex_direct
yandex_direct -> mytarget -> yandex_direct 
google_organic -> vkads -> yandex_direct
vkads -> yandex_direct -> mytarget

Поскольку ассоциированные считаются по всем касаниям кроме последнего, можно удалить последний источник цепочки:

-
yandex_direct -> yandex_direct -> yandex_direct
yandex_direct -> mytarget
google_organic -> vkads
vkads -> yandex_direct

Цепочки из 1 источника остаются пустыми, их можно удалить. В результате остаётся 4 цепочки.

В рамках каждой цепочки нам нужно удалить дубли по источникам, то есть повторяющийся yandex_direct будет считаться только 1 раз. 

Заменю знак "->" на запятую, чтобы удобнее было считать:

yandex_direct
yandex_direct, mytarget
google_organic, vkads
vkads, yandex_direct

Остаётся разбить наши цепочки на отдельные источники и посчитать количество конверсий по каждому из них. Если мы получили по 1 конверсии на каждую цепочку, результат будет таким:

yandex_direct: 3 ассоц конверсии
mytarget: 1 ассоц конверсия
vkads: 2 ассоц конверсии
google_organic: 1 ассоц конверсия

В реальности на цепочку может приходиться не 1, а 10 конверсий. При этом в ваших расчётах на эту цепочку будет приходиться 10 ассоциированных для каждого источника данной цепочки. 

Есть только одна проблема  - на сентябрь 2023 года пути конверсий не выгружаются по API, только в ручном режиме. Поэтому на текущий момент выгрузку путей конверсии нужно делать вручную в формате CSV. 

Автоматизируем обработку путей конверсий Google Analytics 4

Сейчас нам придётся работать с CSV-файлом, но если Google Analytics 4 реализует выгрузку цепочек конверсий через API - напишите нам, мы добавим возможность получения  ассоциированных напрямую по API.

Какой инструмент выбрать для автоматизации подсчёта ассоциированных? Вы можете выбрать Python или любой другой язык программирования, который вам ближе. Но мы пошли простым путём и написали скрипт на Power Query. Его можно использовать как для Power BI, так и в Excel. 

Excel более удобен для использования и установлен у всех, поэтому базово используем его. Файлик размещен на Boosty и доступен по подписке ПРО. 

Как это работает? Первым шагом вы переходите в отчёт "пути конверсии" (Реклама -> Атрибуция -> Пути конверсий):


Скачиваете все цепочки в CSV формате:


Открываете наш Excel-файл и вставляете полный адрес CSV-файла на компьютере в ячейку слева сверху, например: "C:\Users\a.morin\Downloads\data-export.csv" (без кавычек).

Иногда Excel требует сначала включить работу скриптов Power Query, вам потребуется "включить содержимое". Далее переходите на вкладку "Данные" в Excel и нажимаете "Обновить всё": 


После этого в табличке отобразится количество ассоциированных по данным вашей выгрузки:

Левый столбец будет называться "Источник" независимо от того выбрали вы Кампании или Группы каналов, это название из скрипта. На скриншоте вы видите именно Группы каналов, но кампании обычно смотреть гораздо интереснее.

Можно ли верить файлу? Чтобы проверить алгоритм, мы скорректировали его под данные Universal Analytics. Итоговые числа совпали с отчётом "Ассоциированные конверсии". Такая проверка подтверждает правильность нашего алгоритма.

Будьте осторожны - функция работает для Excel начиная с версии 2016 или на office 365, но НЕ РАБОТАЕТ на более старых версиях (2013, 2010 и подобных). Если вы скачали файл с Boosty и поняли, что ваш Excel не поддерживает Power Query, пишите нам и мы пришлём скрипт в pbix-файле.

Заключение

Мы разобрали что такое ассоциированные конверсии, зачем они нужны и чем они отличаются от моделей атрибуции, а также пробежались по алгоритму извлечения ассоциированных из отчёта "пути конверсий" в GA4. 

Почему в Google Analytics 4 нет ассоциированных? Возможно, разработчики Google посчитали, что модели атрибуций - это гораздо ценнее, чем ассоц. конверсии. И это действительно так.

Не стоит забывать и о возможности выгрузки сырых данных из GA4 в Google Big Query, что позволит вам строить любые отчёты средствами SQL и различных визуализаторов (например, Looker Studio или Power BI). Но Google Big Query стоит денег, а также требует знаний в SQL и в данном случае может быть просто излишним. 

Надеюсь, наш скрипт поможет вам получить ассоциированные конверсии и доказать клиенту, что охватные кампании не только бессмысленно пожирают бюджет, но и приносят хорошую отдачу в виде ассоциированных конверсий и ассоциированного дохода. И возможно, никакой цепочки конверсий и не было бы если бы не ваша охватная кампания в Яндексе.

Пути конверсий неисповедимы.

Комментарии