В GA4 можно просматривать все данные, кроме Client ID. Увидеть Client ID возможно только при просмотре статистики пользователей. Из-за этого фильтрация/сегментация остальной отчетности по конкретному client ID ограничена. Это мешает процессу анализа.
ID пользователей в GA4
Согласно официальным справкам, client ID определяется по _ga, записывается и хранится системой самостоятельно. Также он является основой расчета главных метрик.
Логика сбора и формирования client ID одинаковая для GA UA и GA4. При этом название, домен и срок действия cookie пользователь может изменять самостоятельно.
Настройка параметров cookie
В справке для GA UA указано, что сохранять значения поля client ID можно самостоятельно. Для этого при создании объекта отслеживания нужно задать параметр client Id.
Система идентифицирует клиента (его экземпляр браузера) в ClientId
Если специалисту нужна собственная система аутентификации, он может сделать это с помощью функции User ID без вмешательств в client ID.
Чтобы решить эту проблему с невозможностью создания отчетности по клиентам, специалисты используют один из нескольких вариантов сбора client ID из cookie с _ga с последующей передачей информации в свойства пользователя GA4. Это стандартный метод — раньше он использовался для настройки специальных показателей в Universal Analytics.
Такая настройка создает независимый параметр, который принимает переданное в него значение. Например, специалист может создать параметр client ID, одним из значений которого будет 1135380329.1543226534. В итоге идентификаторы клиента, которые система автоматически собирает и хранит для создания отчетности по пользователям, остаются неизменными. Это позволяет специалистам дорабатывать отчетность под свои запросы без коррекции работы системы аналитики.
При помощи параметра cid_user удалось передать в систему GA4 значения client ID.
Специалисты вывели эти данные в отчет с событиями. При стандартной настройке это недоступно.
Если запросить статистику по конкретному ID, то данные кастомного свойства и автоматически собираемого ID будут равны.
Данные ID пользователя
Во время работы с этой настройкой мы выявили новую возможность взаимодействия с GA4. Мы узнали, что так можно изменять значения действующего идентификатора пользователя.
Мы настроили событие client_id в GTM после запуска конфигурации. Вместе с этим отправили параметр события client_id и свойство пользователя client_id в одноименные спецпараметры GA4.
Настройка события в GA4
Особенностью переменной, переданной вместе с событием, была обработка ошибки — генерации ID, который состоял из одних единиц. Ошибка возникала, когда срабатывала переменная {{client_id}}. Значение 111.111 передавалось с GA4.
С течением времени мы заметили, что количество целевых событий на пользователя стало увеличиваться без видимых причин. Мы провели анализ отчетности. Он показал, что GA4 стал перезаписывать внутренний действующий идентификатор пользователя теми данными, которые получал из свойств пользователя client_id. Из-за этого изменился расчет метрик системой.
На скрине видно, как в системный показатель добавились значения, которые мы закладывали в кастомную переменную.
Мы провели тестирование различных вариантов отправки данных. Тесты показали, что если использовать в параметре события или свойстве пользователя название client_id, идентификаторы в системе аналитики будут перезаписаны. Опыт удалось повторить и на других проектах.
Изменение действующего идентификатора приводит к началу новой сессии. Из-за этого вся информация о пользователях (например, источники переходов на сайт) теряется.
В настройках отправки оффлайн-конверсий свойство пользователя для связи его с данными GA4 называется client_id. Специалисты могут перезаписать эти данные, загрузив новые. Например, если вы загрузите новые значения параметров для определенного события (с теми же атрибутами tag_id, client_id, timestamp_micros и event_name), они заменят прежние значения. Загруженные события будут обработаны так же, как и любые другие данные.
Параметры оффлайн-событий в GA4
Изменение названия параметров и свойств позволило нам постепенно снизить количество данных по пользователю с именем 111.111. В настройках тега мы добавили обязательную проверку запуска конфигурации. Данные об источнике перехода, устройстве, браузере и т.д. не терялись. При просмотре детальной информации об 111.1111 можно было увидеть, что это несколько пользователей с разной географией, устройствами, источниками, которые объединены в одного.
Это привело к тому, что после появления новых данных идентификатор пользователя стал принимать корректное значение.
Нам удалось получить корректные данные о пользователях
Работая над этим кейсом, мы выявили новые возможности взаимодействия с системой. И сделали выводы:
- Если вы не планируете изменять внутренний учет идентификаторов пользователей, то использовать имя параметра/свойства client_id нельзя.
- Следует избегать названий параметров и свойств, которые использует система. Например, если вы введете название value, будет внесено значение в параметр ценности события.
Мы поняли, что можно редактировать данные системы за счет использования свойств пользователя и передачи собственных значений в идентификаторы GA4. Это может помочь другим специалистам для проведения анализа и составления отчетности.
Но пока изменение внутренних данных системы исследовано не до конца. Можно искать новые пути для его изучения и открывать возможности, отличные от стандартных настроек.