Узнайте, как работать с шумом, учитывать его и снижать его влияние в ваших агрегированных отчетах.
Прежде чем начать
Прежде чем продолжить, для более глубокого понимания того, что такое шум и его воздействие, ознакомьтесь с разделом Понимание шума в сводных отчетах .
Ваш контроль над шумом
Хотя вы не можете напрямую контролировать шум, добавляемый в ваши агрегируемые отчеты, есть шаги, которые вы можете предпринять, чтобы минимизировать эффекты. В следующих разделах объясняются эти стратегии.
Увеличить до бюджета взносов
Как поясняется в разделе «Понимание шума», шум, применяемый к итоговому значению для каждого ключа, основан на шкале от 0 до 65 536 (0- CONTRIBUTION_BUDGET
).

В связи с этим, чтобы максимизировать сигнал относительно шума, необходимо масштабировать каждое значение перед установкой его в качестве агрегируемого значения, то есть умножить каждое значение на определенный коэффициент, коэффициент масштабирования , при этом проверяя, что оно остается в пределах бюджета вклада.

Расчет коэффициента масштабирования
Коэффициент масштабирования представляет, насколько вы хотите масштабировать данное агрегируемое значение. Его значение должно быть бюджетом вклада, деленным на максимальное агрегируемое значение для определенного ключа.

Например, предположим, что рекламодатели хотят знать общую стоимость покупки. Вы знаете, что максимальная ожидаемая стоимость покупки для любой отдельной покупки составляет $2000, за исключением нескольких выбросов, которые вы решили проигнорировать:
- Рассчитаем коэффициент масштабирования :
- Чтобы максимизировать соотношение сигнал/шум, вам необходимо масштабировать это значение до 65 536 (бюджет вклада).
- Это дает 65,536 / 2,000, приблизительно 32 x коэффициент масштабирования. На практике вы можете округлить этот коэффициент вверх или вниз.
- Увеличьте свои значения перед агрегацией . Для каждого $1 покупки увеличивайте отслеживаемую метрику на 32. Например, для покупки на $120 установите агрегируемое значение 120*32 = 3840.
- Уменьшите значения после агрегации . Получив сводный отчет, содержащий сумму покупок, просуммированную по нескольким пользователям, уменьшите сводное значение, используя коэффициент масштабирования, который вы использовали до агрегации. В нашем примере мы использовали коэффициент масштабирования 32 до агрегации, поэтому нам нужно разделить сводное значение, полученное в сводном отчете, на 32. Таким образом, если сводная стоимость покупки для данного ключа в сводном отчете составляет 76 800, то сводная стоимость покупки (с шумом) составляет 76 800/32 = 2 400 долларов США.
Разделите свой бюджет
Если у вас есть несколько целей измерения, например, количество покупок и стоимость покупки, вы можете разделить свой бюджет по этим целям.
В этом случае ваши коэффициенты масштабирования будут разными для разных агрегируемых значений в зависимости от ожидаемого максимума заданного агрегируемого значения.
Подробности читайте в разделе Понимание ключей агрегации .
Например, предположим, что вы отслеживаете как количество покупок, так и их стоимость и решили распределить свой бюджет поровну.
65 536 / 2 = 32 768 можно распределить по типу измерения и по источнику.
- Количество покупок:
- Вы отслеживаете только одну покупку, поэтому максимальное количество покупок для данной конверсии составляет 1.
- Поэтому вы решаете установить коэффициент масштабирования для количества покупок равным 32 768 / 1 = 32 768.
- Стоимость покупки:
- Предположим, что максимальная ожидаемая стоимость любой отдельной покупки составляет 2000 долларов США.
- Поэтому вы решаете установить коэффициент масштабирования для стоимости покупки равным 32 768 / 2 000 = 16,384 или приблизительно 16.
Более грубые ключи агрегации улучшают соотношение сигнал/шум
Поскольку грубые ключи улавливают больше событий конверсии, чем детализированные ключи, грубые ключи, как правило, приводят к более высоким итоговым значениям.
Более высокие суммарные значения меньше подвержены влиянию шума, чем более низкие значения; шум в этих значениях, вероятно, будет ниже по сравнению с данным значением.
Значения, собранные с использованием более грубых ключей, скорее всего, будут относительно менее шумными, чем значения, собранные с использованием более детализированных ключей.
Пример
При прочих равных условиях ключ, который отслеживает стоимость покупки в глобальном масштабе (суммируется по всем странам), приведет к более высокой суммарной стоимости покупки (и большему суммарному количеству конверсий), чем ключ, который отслеживает конверсии на уровне страны.
Таким образом, относительный шум в общей стоимости покупки для конкретной страны будет выше, чем относительный шум в общей стоимости покупки для всех стран.
Аналогично, при прочих равных условиях общая стоимость покупки обуви ниже общей стоимости покупки всех товаров (включая обувь).
Таким образом, относительный шум в общей стоимости покупки обуви будет выше, чем относительный шум в общей стоимости покупки всех товаров.

Суммирование итоговых значений (свертка) также суммирует их шум
Суммируя сводные значения из сводных отчетов для доступа к данным более высокого уровня, вы также суммируете шум из этих сводных значений.

Давайте рассмотрим два разных подхода:
- Подход A : вы включаете идентификатор географии в свои ключи. Сводные отчеты раскрывают ключи уровня гео-идентификатора, каждый из которых связан с итоговой стоимостью покупки на уровне определенного гео-идентификатора.
- Подход B : вы не включаете идентификатор географии в свои ключи. Сводные отчеты напрямую отображают сводную стоимость покупки для всех идентификаторов географии / местоположений.
Чтобы получить доступ к стоимости покупки на уровне страны:
- При подходе A вы суммируете сводные значения уровня гео-ID и, следовательно, также суммируете их шум. Это, вероятно, приведет к увеличению шума, добавленного к окончательной стоимости покупки уровня гео-ID.
- При подходе B вы напрямую смотрите на данные, представленные в сводных отчетах. Шум был добавлен к этим данным только один раз.
Таким образом, суммарная стоимость покупки для данного гео-идентификатора, скорее всего, будет более зашумленной при подходе А.
Аналогично, включение в ключи измерения на уровне почтового индекса, скорее всего, приведет к более шумным результатам, чем использование более грубых ключей с измерением на уровне региона.
Агрегирование за более длительные периоды времени увеличивает соотношение сигнал/шум.
Если запрашивать сводные отчеты реже, то каждое сводное значение, скорее всего, будет выше, чем если бы вы запрашивали отчеты чаще; больше конверсий, скорее всего, произойдет за более длительные промежутки времени.
Как упоминалось ранее, чем выше суммарное значение, тем ниже относительный шум. Следовательно, запрос на суммирующие отчеты реже приводит к более высокому (лучшему) отношению сигнала к шуму.

Вот пример для иллюстрации:
- Если вы запрашиваете почасовые сводные отчеты за 24 часа, а затем суммируете сводные значения из каждого почасового отчета для доступа к данным на уровне дня, шум добавляется 24 раза.
- В одном ежедневном сводном отчете шум добавляется только один раз.
Выше эпсилон, ниже шум
Чем выше значение эпсилон, тем ниже уровень шума и ниже уровень защиты конфиденциальности.
Использование фильтрации и дедупликации
Важной частью распределения бюджета между различными ключами является понимание того, сколько раз может произойти данное событие. Например, рекламодатель может заботиться только об одной покупке для каждого клика, но может быть заинтересован в конверсиях «просмотр страницы продукта» до 3. Для поддержки этих вариантов использования вы также можете использовать следующие функции API, которые позволяют вам контролировать, сколько отчетов создается и какие конверсии учитываются:
- Фильтрация. Подробнее о фильтрации читайте здесь .
- Дедупликация. Узнайте больше о дедупликации .
Эксперименты с эпсилоном
Специалисты по рекламе могут устанавливать epsilon на значение больше 0 и до 64 включительно. Этот диапазон обеспечивает гибкое тестирование. Более низкие значения epsilon обеспечивают большую защиту конфиденциальности. Мы рекомендуем вам начать с epsilon=10.
Рекомендации по эксперименту
Мы рекомендуем следующее:
- Начните с эпсилон = 10.
- В случае, если это вызывает существенные проблемы с полезностью, постепенно увеличивайте эпсилон.
- Поделитесь своими отзывами о конкретных переломных моментах, которые вы можете обнаружить в отношении удобства использования данных.
Привлекайте и делитесь отзывами
Вы можете участвовать и экспериментировать с этим API .
- Читайте об агрегированных отчетах и службе агрегирования , задавайте вопросы и предлагайте отзывы.
- Прочтите руководства по созданию отчетов по атрибуции .
- Задавайте вопросы и присоединяйтесь к обсуждениям в репозитории поддержки разработчиков Privacy Sandbox .
Следующие шаги
- Дополнительную информацию о факторах, влияющих на отчетность, таких как переменные кампании, частота пакетирования и детализация измерений, см. в разделе Эксперимент с решениями по дизайну сводных отчетов .
- Попробуйте лабораторию шума .