Travailler avec le bruit

Découvrez comment gérer le bruit dans vos rapports agrégables, en tenir compte et en réduire l'impact.

Avant de commencer

Avant de continuer, consultez Comprendre le bruit dans les rapports récapitulatifs pour en savoir plus sur le bruit et son impact.

Vos options de contrôle du bruit

Vous ne pouvez pas contrôler directement le bruit ajouté à vos rapports agrégables, mais vous pouvez prendre des mesures pour en minimiser les effets. Les sections suivantes expliquent ces stratégies.

Augmenter le budget de contribution

Comme expliqué dans la section "Comprendre le bruit", le bruit appliqué à la valeur récapitulative pour chaque clé est basé sur l'échelle 0-65 536 (0-CONTRIBUTION_BUDGET).

La distribution du bruit est basée sur le budget.
La distribution du bruit est basée sur le budget.

Par conséquent, pour maximiser le signal par rapport au bruit, vous devez augmenter chaque valeur avant de la définir comme valeur agrégable. En d'autres termes, multipliez chaque valeur par un certain facteur, le facteur de mise à l'échelle, tout en vérifiant qu'elle reste dans le budget de contribution.

Bruit relatif avec et sans mise à l'échelle.
Bruit relatif avec et sans mise à l'échelle.

Calculer un facteur de scaling

Le facteur de scaling représente l'ampleur de la mise à l'échelle d'une valeur agrégable donnée. Sa valeur doit correspondre au budget de contribution divisé par la valeur agrégable maximale pour une clé donnée.

Déterminer le facteur d'échelle en fonction du budget de contribution.
Déterminer le facteur de scaling en fonction du budget de contribution.

Par exemple, imaginons que les annonceurs souhaitent connaître la valeur totale des achats. Vous savez que la valeur d'achat maximale attendue pour chaque achat est de 2 000 $, à l'exception de quelques valeurs aberrantes que vous décidez d'ignorer :

  • Calculer le facteur de scaling :
    • Pour maximiser le rapport signal/bruit, vous devez mettre à l'échelle cette valeur sur 65 536 (le budget de contribution).
    • Cela donne un facteur de scaling d'environ 32x (65 536 / 2 000). En pratique, vous pouvez arrondir ce facteur à l'entier supérieur ou inférieur.
  • Mettez à l'échelle vos valeurs avant l'agrégation. Pour chaque euro d'achat, incrémentez la métrique suivie de 32. Par exemple, pour un achat de 120$, définissez une valeur agrégable de 120 x 32 = 3 840.
  • Réduisez vos valeurs après l'agrégation. Une fois que vous avez reçu le rapport récapitulatif contenant la valeur d'achat cumulée pour plusieurs utilisateurs, réduisez la valeur récapitulative à l'aide du facteur de scaling que vous avez utilisé avant l'agrégation. Dans notre exemple, nous avons utilisé un facteur de scaling de 32 avant l'agrégation. Nous devons donc diviser la valeur récapitulative reçue dans le rapport récapitulatif par 32. Par conséquent, si la valeur d'achat récapitulative pour une clé donnée dans le rapport récapitulatif est de 76 800, la valeur d'achat récapitulative (avec bruit) est de 76 800/32 = 2 400 $.

Répartir votre budget

Si vous avez plusieurs objectifs de mesure (par exemple, le nombre d'achats et la valeur des achats), vous pouvez répartir votre budget entre ces objectifs.

Dans ce cas, vos facteurs de scaling seront différents pour différentes valeurs agrégables, en fonction du maximum attendu d'une valeur agrégable donnée.

Pour en savoir plus, consultez Comprendre les clés d'agrégation.

Par exemple, supposons que vous suiviez à la fois le nombre d'achats et la valeur des achats, et que vous décidiez de répartir votre budget de manière égale.

65 536 / 2 = 32 768 peuvent être attribués par type de mesure et par source.

  • Nombre d'achats :
    • Vous ne suivez qu'un seul achat. Le nombre maximal d'achats pour une conversion donnée est donc de 1.
    • Vous décidez donc de définir votre facteur de scaling pour le nombre d'achats sur 32 768 / 1 = 32 768.
  • Valeur des achats :
    • Supposons que la valeur d'achat maximale attendue pour un achat individuel soit de 2 000 $.
    • Vous décidez donc de définir votre facteur de scaling pour la valeur d'achat sur 32 768 / 2 000 = 16,384, soit environ 16.

Des clés d'agrégation plus générales améliorent le rapport signal/bruit

Étant donné que les clés approximatives capturent plus d'événements de conversion que les clés précises, elles entraînent généralement des valeurs récapitulatives plus élevées.

Les valeurs récapitulatives plus élevées sont moins affectées par le bruit que les valeurs plus faibles. Le bruit sur ces valeurs est susceptible d'être plus faible par rapport à cette valeur.

Les valeurs collectées avec des clés plus générales sont susceptibles d'être relativement moins bruitées que celles collectées avec des clés plus précises.

Exemple

Toutes choses étant égales par ailleurs, une clé qui suit la valeur des achats au niveau mondial (somme pour tous les pays) entraînera une valeur d'achat récapitulative plus élevée (et un nombre de conversions récapitulatif plus élevé) qu'une clé qui suit les conversions au niveau d'un pays.

Par conséquent, le bruit relatif sur la valeur totale des achats pour un pays spécifique sera plus élevé que le bruit relatif sur la valeur totale des achats pour tous les pays.

De même, toutes choses égales par ailleurs, la valeur totale des achats de chaussures est inférieure à la valeur totale des achats de tous les articles (y compris les chaussures).

Par conséquent, le bruit relatif sur la valeur totale des achats de chaussures sera plus élevé que celui sur la valeur totale des achats de tous les articles.

Impact du bruit avec des clés précises ou approximatives.
Impact du bruit avec des clés précises ou approximatives.

La somme des valeurs récapitulatives (cumuls) additionne également leur bruit.

En additionnant les valeurs récapitulatives de vos rapports récapitulatifs pour accéder à des données de niveau supérieur, vous additionnez également le bruit de ces valeurs récapitulatives.

Degré de bruit avec des clés précises avec regroupements par rapport à des clés générales sans regroupements.
Degré de bruit avec des clés précises avec rollups par rapport à des clés générales sans rollups.

Examinons deux approches différentes :

  • Approche A : vous incluez un ID de zone géographique dans vos clés. Les rapports récapitulatifs exposent des clés au niveau de l'ID géographique, chacune associée à la valeur d'achat récapitulative au niveau d'un ID géographique spécifique.
  • Approche B : vous n'incluez pas l'ID de zone géographique dans vos clés. Les rapports récapitulatifs exposent directement la valeur d'achat récapitulative pour tous les ID géographiques / lieux.

Pour accéder à la valeur des achats au niveau du pays :

  • Avec l'approche A, vous additionnez les valeurs récapitulatives au niveau de l'ID géographique et, par conséquent, vous additionnez également leur bruit. Cela risque d'ajouter du bruit à la valeur d'achat finale au niveau de l'ID géographique.
  • Avec l'approche B, vous examinez directement les données exposées dans les rapports récapitulatifs. Le bruit n'a été ajouté qu'une seule fois à ces données.

Par conséquent, la valeur d'achat récapitulative pour un ID géographique donné sera probablement plus bruyante avec l'approche A.

De même, l'inclusion d'une dimension au niveau du code postal dans vos clés entraînera probablement des résultats plus bruyants que l'utilisation de clés plus grossières avec une dimension au niveau de la région.

L'agrégation sur des périodes plus longues augmente le rapport signal/bruit.

Si vous demandez des rapports récapitulatifs moins souvent, chaque valeur récapitulative sera probablement plus élevée que si vous demandiez des rapports plus souvent. En effet, il est plus probable que davantage de conversions se produisent sur des périodes plus longues.

Comme indiqué précédemment, plus la valeur récapitulative est élevée, plus le bruit relatif est susceptible d'être faible. Par conséquent, plus vous demandez de rapports récapitulatifs, plus le rapport signal/bruit est élevé (ce qui est mieux).

Demander des rapports récapitulatifs moins souvent permet d'améliorer le rapport signal/bruit.
Demander des rapports récapitulatifs moins fréquemment permet d'obtenir un meilleur rapport signal/bruit.

Voici un exemple pour illustrer :

  • Si vous demandez des rapports récapitulatifs horaires sur 24 heures, puis que vous additionnez la valeur récapitulative de chaque rapport horaire pour accéder aux données au niveau du jour, du bruit est ajouté 24 fois.
  • Dans un rapport récapitulatif quotidien, le bruit n'est ajouté qu'une seule fois.

Plus la valeur epsilon est élevée, moins le bruit est important.

Plus la valeur epsilon est élevée, plus le bruit est faible et moins la confidentialité est protégée.

Exploiter le filtrage et la déduplication

Pour répartir le budget entre différentes clés, il est important de comprendre combien de fois un événement donné peut se produire. Par exemple, un annonceur peut ne s'intéresser qu'à un seul achat par clic, mais être intéressé par un maximum de trois conversions "Vue de la page produit". Pour prendre en charge ces cas d'utilisation, vous pouvez également utiliser les fonctionnalités d'API suivantes, qui vous permettent de contrôler le nombre de rapports générés et les conversions comptabilisées :

Tester l'epsilon

Les technologies publicitaires peuvent définir epsilon sur une valeur supérieure à 0 et inférieure ou égale à 64. Cette plage permet de tester de manière flexible. Plus la valeur epsilon est faible, plus la protection de la confidentialité est élevée. Nous vous recommandons de commencer par epsilon=10.

Recommandations à tester

Nous vous recommandons de suivre les conseils suivants :

  • Commencez par un epsilon de 10.
  • Si cela entraîne des problèmes d'utilité notables, augmentez progressivement epsilon.
  • Partagez vos commentaires sur les points d'inflexion spécifiques que vous pouvez rencontrer en termes d'utilisabilité des données.

Interagir et envoyer des commentaires

Vous pouvez participer et tester cette API.

Étapes suivantes