Certaines technologies de la Privacy Sandbox sont en cours d'abandon.

Consultez notre information sur l'avenir des technologies de la Privacy Sandbox. La page État des fonctionnalités de la Privacy Sandbox fournit plus d'informations sur l'état des différentes API et fonctionnalités de la plate-forme.

Noiselab

À propos de ce document

En lisant ce document, vous allez :

Découvrez les stratégies à créer avant de générer des rapports récapitulatifs.
Découvrez Noise Lab, un outil qui vous aide à comprendre les effets de différents paramètres de bruit et qui vous permet d'explorer et d'évaluer rapidement différentes stratégies de gestion du bruit.

Capture d'écran de Noise Lab. — Noise Lab

Envoyer des commentaires

Bien que ce document résume quelques principes à suivre pour travailler avec des rapports récapitulatifs, il existe plusieurs approches de gestion du bruit qui ne sont peut-être pas reflétées ici. N'hésitez pas à nous faire part de vos suggestions, ajouts et questions.

Pour donner votre avis publiquement sur les stratégies de gestion du bruit, sur l'utilité ou la confidentialité de l'API (epsilon), et pour partager vos observations lors de la simulation avec Noise Lab : Commenter ce problème
Pour envoyer des commentaires publics sur un autre aspect de l'API : Créez un problème ici.

Avant de commencer

Pour une introduction, consultez Attribution Reporting : rapports récapitulatifs et Présentation complète du système Attribution Reporting.
Pour tirer le meilleur parti de ce guide, consultez Comprendre le bruit et Comprendre les clés d'agrégation.

Décisions de conception

Principe de conception de base

Il existe des différences fondamentales entre le fonctionnement des cookies tiers et celui des rapports récapitulatifs. Une différence essentielle réside dans le bruit ajouté aux données de mesure dans les rapports récapitulatifs. Un autre concerne la programmation des rapports.

Pour accéder aux données de mesure des rapports récapitulatifs avec des rapports signal/bruit plus élevés, les plates-formes côté demande (DSP) et les fournisseurs de mesure des annonces devront collaborer avec leurs annonceurs pour développer des stratégies de gestion du bruit. Pour développer ces stratégies, les DSP et les fournisseurs de solutions de mesure doivent prendre des décisions de conception. Ces décisions tournent autour d'un concept essentiel :

Bien que les valeurs de bruit de la distribution soient tirées, à proprement parler, uniquement de deux paramètres (epsilon et le budget de contribution), vous disposez d'un certain nombre d'autres contrôles qui auront un impact sur les rapports signal/bruit de vos données de mesure de sortie.

Nous pensons qu'un processus itératif permettra de prendre les meilleures décisions. Toutefois, chaque variante de ces décisions entraînera une implémentation légèrement différente. Par conséquent, ces décisions doivent être prises avant d'écrire chaque itération de code (et avant de diffuser des annonces).

Décision : précision des dimensions

Essayer dans Noise Lab

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
Observez les paramètres par défaut. Par défaut, le nombre total de conversions attribuables par jour est de 1 000. Cela représente environ 40 buckets si vous utilisez la configuration par défaut (dimensions par défaut, nombre par défaut de valeurs différentes possibles pour chaque dimension, stratégie clé A). Notez que la valeur est de 40 dans le champ "Nombre moyen de conversions attribuables quotidiennes" PAR ENSEMBLE.
Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
Dans le panneau latéral "Paramètres", recherchez "Dimensions". Renommez Geography en City et définissez le nombre de valeurs différentes possibles sur 50.
Observez comment cela modifie le nombre moyen de conversions attribuables par bucket. Elle est désormais beaucoup plus faible. En effet, si vous augmentez le nombre de valeurs possibles dans cette dimension sans rien changer d'autre, vous augmentez le nombre total de buckets sans modifier le nombre d'événements de conversion qui seront inclus dans chaque bucket.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue : ils sont désormais plus élevés que pour la simulation précédente.

Compte tenu du principe de conception de base, les petites valeurs récapitulatives sont susceptibles d'être plus bruyantes que les grandes valeurs récapitulatives. Par conséquent, votre choix de configuration a un impact sur le nombre d'événements de conversion attribués qui se retrouvent dans chaque bucket (également appelé clé d'agrégation). Cette quantité a un impact sur le bruit dans les rapports récapitulatifs de sortie finale.

La précision des dimensions est une décision de conception qui a un impact sur le nombre d'événements de conversion attribués dans un même bucket. Voici quelques exemples de clés d'agrégation et de leurs dimensions :

Approche 1 : une structure clé avec des dimensions générales : Pays x Campagne publicitaire (ou le plus grand bucket d'agrégation de campagne) x Type de produit (sur 10 types de produits possibles)
Approche 2 : une structure de clé avec des dimensions précises : Ville x ID de la création x Produit (sur 100 produits possibles)

Ville est une dimension plus précise que Pays, ID de la création est plus précis que Campagne et Produit est plus précis que Type de produit. Par conséquent, l'approche 2 générera un nombre d'événements (conversions) par bucket (= par clé) inférieur à celui de l'approche 1 dans son rapport récapitulatif. Étant donné que le bruit ajouté à la sortie est indépendant du nombre d'événements dans le bucket, les données de mesure dans les rapports récapitulatifs seront plus bruyantes avec l'approche 2. Pour chaque annonceur, testez différents compromis de précision dans la conception de la clé afin de maximiser l'utilité des résultats.

Décision : Structures clés

Essayer dans Noise Lab

En mode simple, la structure de clé par défaut est utilisée. En mode avancé, vous pouvez tester différentes structures de clés. Quelques exemples de dimensions sont inclus. Vous pouvez également les modifier.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Stratégie clé". Notez que la stratégie par défaut, nommée "A" dans l'outil, utilise une structure de clé précise qui inclut toutes les dimensions : Géographie x ID de campagne x Catégorie de produit.
Cliquez sur "Simuler".
Observez les rapports de bruit de la simulation obtenue.
Remplacez la stratégie de clé par "B". Des commandes supplémentaires s'affichent pour vous permettre de configurer votre structure de clés.
Configurez votre structure de clés, par exemple comme suit :
1. Nombre de structures clés : 2
2. Structure clé 1 = Géographie x Catégorie de produit.
3. Structure clé 2 = ID de campagne x catégorie de produit.
Cliquez sur "Simuler".
Notez que vous obtenez désormais deux rapports récapitulatifs par type d'objectif de mesure (deux pour le nombre d'achats et deux pour la valeur des achats), étant donné que vous utilisez deux structures de clés distinctes. Observez leurs ratios de bruit.
Vous pouvez également essayer avec vos propres dimensions personnalisées. Pour ce faire, recherchez "Données à suivre : dimensions". Envisagez de supprimer les dimensions d'exemple et de créer les vôtres à l'aide des boutons "Ajouter", "Supprimer" et "Réinitialiser" situés sous la dernière dimension.

Une autre décision de conception qui aura un impact sur le nombre d'événements de conversion attribués dans un même bucket concerne les structures de clés que vous décidez d'utiliser. Voici quelques exemples de clés d'agrégation :

Une structure clé avec toutes les dimensions (nous l'appellerons "Stratégie clé A").
Deux structures clés, chacune avec un sous-ensemble de dimensions ; appelons cela la stratégie clé B.

Buckets pour les stratégies clés A et B. — Paliers pour les stratégies clés A et B.

La stratégie A est plus simple, mais vous devrez peut-être regrouper (additionner) les valeurs récapitulatives bruitées incluses dans les rapports récapitulatifs pour accéder à certains insights. En additionnant ces valeurs, vous additionnez également le bruit. Avec la stratégie B, les valeurs récapitulatives exposées dans les rapports récapitulatifs peuvent déjà vous fournir les informations dont vous avez besoin. Cela signifie que la stratégie B est susceptible d'entraîner de meilleurs rapports signal/bruit que la stratégie A. Toutefois, le bruit peut déjà être acceptable avec la stratégie A. Vous pouvez donc toujours choisir de privilégier la stratégie A pour sa simplicité. Pour en savoir plus, consultez l'exemple détaillé décrivant ces deux stratégies.

La gestion des clés est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer le rapport signal/bruit. L'un est décrit dans la section Gestion avancée des clés.

Décision : fréquence de regroupement par lot

Essayer dans Noise Lab

Accédez au mode Simple (ou au mode Avancé, les deux modes fonctionnent de la même manière en ce qui concerne la fréquence de regroupement).
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation" > "Fréquence de regroupement". Il s'agit de la fréquence de regroupement des rapports agrégables traités par le service d'agrégation dans un même job.
Observez la fréquence de regroupement par défaut : par défaut, une fréquence de regroupement quotidienne est simulée.
Cliquez sur "Simuler".
Observez les rapports de bruit de la simulation obtenue.
Définissez la fréquence de regroupement sur "hebdomadaire".
Observez les rapports de bruit de la simulation obtenue : ils sont désormais plus faibles (meilleurs) que pour la simulation précédente.

La fréquence de regroupement que vous décidez d'utiliser est une autre décision de conception qui aura un impact sur le nombre d'événements de conversion attribués dans un même bucket. La fréquence de regroupement correspond à la fréquence à laquelle vous traitez les rapports agrégables.

Un rapport dont l'agrégation est programmée plus fréquemment (par exemple, toutes les heures) inclura moins d'événements de conversion que le même rapport avec une programmation d'agrégation moins fréquente (par exemple, toutes les semaines). Par conséquent, le rapport horaire inclura plus de bruit et moins d'événements de conversion que le même rapport avec une fréquence d'agrégation moins élevée (par exemple, chaque semaine). Par conséquent, le rapport horaire aura un rapport signal/bruit inférieur à celui du rapport hebdomadaire, toutes choses égales par ailleurs. Testez les exigences de reporting à différentes fréquences et évaluez les rapports signal/bruit pour chacune d'elles.

Pour en savoir plus, consultez Regrouper les données par lots et Agrégation sur des périodes plus longues.

Décision : variables de campagne qui affectent les conversions attribuables

Essayer dans Noise Lab

Bien qu'il puisse être difficile de prédire ce nombre et qu'il puisse varier considérablement en plus des effets de saisonnalité, essayez d'estimer le nombre de conversions quotidiennes attribuables au canal unique le plus proche d'une puissance de 10 : 10, 100, 1 000 ou 10 000.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
Observez les paramètres par défaut. Par défaut, le nombre total de conversions attribuables par jour est de 1 000. Cela représente environ 40 buckets si vous utilisez la configuration par défaut (dimensions par défaut, nombre par défaut de valeurs différentes possibles pour chaque dimension, stratégie clé A). Notez que la valeur est de 40 dans le champ "Nombre moyen de conversions attribuables quotidiennes" PAR ENSEMBLE.
Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
Observez les rapports de bruit de la simulation obtenue.
Définissez ensuite le nombre TOTAL de conversions attribuables quotidiennes sur 100. Notez que cela réduit la valeur du nombre moyen de conversions attribuables par tranche.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont désormais plus élevés. En effet, lorsque vous avez moins de conversions par bucket, plus de bruit est appliqué pour préserver la confidentialité.

Il est important de faire la distinction entre le nombre total de conversions possibles pour un annonceur et le nombre total de conversions attribuées. C'est ce dernier qui a un impact sur le bruit dans les rapports récapitulatifs. Les conversions attribuées sont un sous-ensemble des conversions totales qui sont sujettes aux variables de campagne, telles que le budget publicitaire et le ciblage des annonces. Par exemple, vous vous attendez à ce qu'une campagne publicitaire de 10 millions de dollars génère un nombre de conversions attribuées plus élevé qu'une campagne publicitaire de 10 000 dollars, toutes choses étant égales par ailleurs.

Points à prendre en compte :

Évaluez les conversions attribuées par rapport à un modèle d'attribution monotouche sur le même appareil, car elles font partie des rapports récapitulatifs collectés avec l'API Attribution Reporting.
Tenez compte du nombre de conversions attribuées dans le pire et le meilleur des cas. Par exemple, à toutes choses égales par ailleurs, examinez les budgets de campagne minimum et maximum possibles pour un annonceur, puis projetez les conversions attribuables pour les deux résultats comme entrées dans votre simulation.
Si vous envisagez d'utiliser la Privacy Sandbox Android, tenez compte des conversions attribuées cross-plateformes dans le calcul.

Décision : Utiliser le scaling

Essayer dans Noise Lab

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation" > "Mise à l'échelle". Par défaut, la valeur est définie sur "Oui".
Pour comprendre les effets positifs de la mise à l'échelle sur le rapport signal/bruit, définissez d'abord "Mise à l'échelle" sur "Non".
Cliquez sur "Simuler".
Observez les rapports de bruit de la simulation obtenue.
Définissez "Mise à l'échelle" sur "Oui". Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyennes et maximales) des objectifs de mesure de votre scénario. Dans une configuration de système réel ou d'évaluation d'origine, vous devez implémenter votre propre calcul des facteurs de mise à l'échelle.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont désormais plus faibles (meilleurs) dans cette deuxième simulation. En effet, vous utilisez le scaling.

Compte tenu du principe de conception de base, le bruit ajouté est une fonction du budget de contribution.

Par conséquent, pour augmenter le rapport signal/bruit, vous pouvez choisir de transformer les valeurs collectées lors d'un événement de conversion en les mettant à l'échelle par rapport au budget de contribution (et en les remettant à l'échelle après l'agrégation). Utilisez la mise à l'échelle pour augmenter le rapport signal/bruit.

Décision : nombre d'objectifs de mesure et répartition du budget de confidentialité

Cela concerne la mise à l'échelle. Veillez à lire Utiliser la mise à l'échelle.

Essayer dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Données à suivre" > "Objectifs de mesure". Par défaut, vous disposez de deux objectifs de mesure : la valeur des achats et le nombre d'achats.
Cliquez sur "Simuler" pour exécuter une simulation avec les objectifs par défaut.
Cliquez sur "Supprimer". Cela supprimera le dernier objectif de mesure (le nombre d'achats dans ce cas).
Cliquez sur "Simuler".
Notez que les ratios de bruit pour la valeur d'achat sont désormais plus faibles (meilleurs) pour cette deuxième simulation. En effet, vous avez moins d'objectifs de mesure. Votre seul objectif de mesure reçoit donc l'intégralité du budget de contribution.
Cliquez sur "Réinitialiser". Vous disposez à nouveau de deux objectifs de mesure : la valeur des achats et le nombre d'achats. Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyennes et maximales) des objectifs de mesure pour votre scénario. Par défaut, Noise Lab répartit le budget de manière égale entre les objectifs de mesure.
Cliquez sur "Simuler".
Observez les rapports de bruit de la simulation obtenue. Notez les facteurs de scaling affichés dans la simulation.
Maintenant, personnalisons la répartition du budget de confidentialité pour obtenir de meilleurs rapports signal/bruit.
Ajustez le pourcentage du budget attribué à chaque objectif de mesure. Étant donné les paramètres par défaut, l'objectif de mesure 1, à savoir la valeur d'achat, a une plage beaucoup plus large (entre 0 et 1 000) que l'objectif de mesure 2, à savoir le nombre d'achats (entre 1 et 1, c'est-à-dire toujours égal à 1). Pour cette raison, il a besoin de "plus d'espace pour évoluer". L'idéal serait d'attribuer un budget de contribution plus important à l'objectif de mesure 1 qu'à l'objectif de mesure 2, afin qu'il puisse être mis à l'échelle plus efficacement (voir "Mise à l'échelle").
Attribuez 70 % du budget à l'objectif de mesure 1. Attribuez 30 % à l'objectif de mesure 2.
Cliquez sur "Simuler".
Observez les rapports de bruit de la simulation obtenue. Pour la valeur d'achat, les rapports signal/bruit sont désormais nettement inférieurs (meilleurs) que pour la simulation précédente. Le nombre d'achats est resté à peu près le même.
Continuez à ajuster la répartition du budget entre les métriques. Observez l'impact sur le bruit.

Notez que vous pouvez définir vos propres objectifs de mesure personnalisés à l'aide des boutons "Ajouter", "Supprimer" et "Réinitialiser".

Si vous mesurez un point de données (objectif de mesure) sur un événement de conversion, tel que le nombre de conversions, ce point de données peut obtenir l'intégralité du budget de contribution (65 536). Si vous définissez plusieurs objectifs de mesure pour un événement de conversion (par exemple, le nombre de conversions et la valeur des achats), ces points de données devront partager le budget de contribution. Cela signifie que vous avez moins de marge de manœuvre pour augmenter vos valeurs.

Par conséquent, plus vous avez d'objectifs de mesure, plus les rapports signal/bruit sont susceptibles d'être faibles (bruit plus élevé).

Une autre décision à prendre concernant les objectifs de mesure est la répartition du budget. Si vous répartissez le budget de contribution de manière égale entre deux points de données, chacun d'eux reçoit un budget de 65 536/2 = 32 768. Cette valeur peut être optimale ou non, selon la valeur maximale possible pour chaque point de données. Par exemple, si vous mesurez le nombre d'achats avec une valeur maximale de 1 et la valeur des achats avec un minimum de 1 et un maximum de 120, la valeur des achats bénéficiera d'un "espace" plus important pour être mise à l'échelle, c'est-à-dire pour se voir attribuer une plus grande part du budget de contribution. Vous verrez si certains objectifs de mesure doivent être privilégiés par rapport à d'autres en fonction de l'impact du bruit.

Décision : gestion des valeurs aberrantes

Essayer dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation" > "Mise à l'échelle".
Assurez-vous que la mise à l'échelle est définie sur "Oui". Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser, en fonction des plages (valeurs moyennes et maximales) que vous avez indiquées pour les objectifs de mesure.
Supposons que le plus gros achat jamais effectué s'élève à 2 000 $, mais que la plupart des achats se situent entre 10 et 120 $. Commençons par voir ce qui se passe si nous utilisons une approche de scaling littérale (non recommandée) : saisissez 2 000 $comme valeur maximale pour purchaseValue.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont élevés. En effet, notre facteur de scaling est calculé sur la base de 2 000 $, alors que la plupart des valeurs d'achat sont en réalité nettement inférieures.
Utilisons maintenant une approche de scaling plus pragmatique. Remplacez la valeur d'achat maximale par 120 $.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont plus faibles (meilleurs) dans cette deuxième simulation.

Pour implémenter le scaling, vous devez généralement calculer un facteur de scaling en fonction de la valeur maximale possible pour un événement de conversion donné (en savoir plus dans cet exemple).

Toutefois, évitez d'utiliser une valeur maximale littérale pour calculer ce facteur de scaling, car cela détériorerait vos rapports signal/bruit. Supprimez plutôt les valeurs aberrantes et utilisez une valeur maximale pragmatique.

La gestion des valeurs aberrantes est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer le rapport signal/bruit. L'une est décrite dans Gestion avancée des valeurs aberrantes.

Étapes suivantes

Maintenant que vous avez évalué différentes stratégies de gestion du bruit pour votre cas d'utilisation, vous pouvez commencer à tester les rapports récapitulatifs en collectant des données de mesure réelles à l'aide d'un test d'origine. Consultez les guides et les conseils pour essayer l'API.

Annexe

Visite rapide de Noise Lab

Noise Lab vous aide à évaluer et à comparer rapidement les stratégies de gestion du bruit. Utilisez-la pour :

Comprendre les principaux paramètres qui peuvent avoir un impact sur le bruit et leur effet
Simulez l'effet du bruit sur les données de mesure de sortie en fonction de différentes décisions de conception. Ajustez les paramètres de conception jusqu'à obtenir un rapport signal/bruit adapté à votre cas d'utilisation.
Partagez vos commentaires sur l'utilité des rapports récapitulatifs : quelles valeurs des paramètres epsilon et de bruit fonctionnent pour vous, et lesquelles ne fonctionnent pas ? Où se trouvent les points d'inflexion ?

Considérez cela comme une étape préparatoire. Noise Lab génère des données de mesure pour simuler les résultats des rapports récapitulatifs en fonction de vos entrées. Il ne conserve ni ne partage aucune donnée.

Il existe deux modes différents dans Noise Lab :

Mode simple : comprendre les principes de base des commandes de contrôle du bruit
Mode avancé : testez différentes stratégies de gestion du bruit et évaluez celle qui permet d'obtenir les meilleurs rapports signal/bruit pour vos cas d'utilisation.

Cliquez sur les boutons du menu supérieur pour basculer entre les deux modes (n° 1 dans la capture d'écran ci-dessous).

Mode simple

En mode Simple, vous contrôlez les paramètres (situés sur la gauche, ou n° 2 dans la capture d'écran ci-dessous) tels que l'epsilon, et vous voyez comment ils affectent le bruit.
Chaque paramètre est associé à un info-bulle (bouton "?"). Cliquez dessus pour afficher une explication de chaque paramètre (n° 3 dans la capture d'écran ci-dessous).
Pour commencer, cliquez sur le bouton "Simulate" (Simuler) et observez l'apparence du résultat (n° 4 dans la capture d'écran suivante).
La section "Sortie" contient diverses informations. Certains éléments sont suivis d'un point d'interrogation (?). Prenez le temps de cliquer sur chaque "?" pour afficher une explication des différentes informations.
Dans la section "Sortie", cliquez sur le bouton bascule "Détails" si vous souhaitez afficher une version développée du tableau (n° 5 dans la capture d'écran ci-dessous).
Après chaque tableau de données dans la section "Résultats", vous avez la possibilité de le télécharger pour l'utiliser hors connexion. En outre, en bas à droite, vous pouvez télécharger tous les tableaux de données (n° 6 sur la capture d'écran ci-dessous).
Testez différents paramètres dans la section "Paramètres", puis cliquez sur "Simuler" pour voir leur impact sur le résultat :

Interface de Noise Lab en mode simple.

Mode avancé

En mode avancé, vous avez plus de contrôle sur les paramètres. Vous pouvez ajouter des dimensions et des objectifs de mesure personnalisés (n° 1 et n° 2 dans la capture d'écran ci-dessous).
Faites défiler la section "Paramètres" jusqu'à l'option "Stratégie clé". Vous pouvez l'utiliser pour tester différentes structures de clés (n° 3 dans la capture d'écran ci-dessous).
- Pour tester différentes structures de clés, définissez la stratégie de clé sur "B".
- Saisissez le nombre de structures de clés différentes que vous souhaitez utiliser (la valeur par défaut est définie sur "2").
- Cliquez sur "Générer des structures de clés".
- Vous pouvez spécifier vos structures de clés en cochant les cases à côté des clés que vous souhaitez inclure pour chaque structure de clés.
- Cliquez sur "Simuler" pour afficher le résultat.
  
  Interface Noise Lab pour le mode avancé.
  
  Interface de Noise Lab pour le mode avancé.

Métriques de bruit

Concept de base

Du bruit est ajouté pour protéger la confidentialité des utilisateurs individuels.

Une valeur de bruit élevée indique que les buckets/clés sont rares et contiennent des contributions d'un nombre limité d'événements sensibles. Cette opération est effectuée automatiquement par Noise Lab pour permettre aux utilisateurs de "se fondre dans la masse". En d'autres termes, elle protège la confidentialité de ces utilisateurs limités en ajoutant une plus grande quantité de bruit.

Une faible valeur de bruit indique que la configuration des données a été conçue de manière à permettre aux individus de "se fondre dans la masse". Cela signifie que les buckets contiennent des contributions d'un nombre suffisant d'événements pour vérifier que la confidentialité des utilisateurs individuels est protégée.

Cette affirmation est vraie pour l'erreur de pourcentage moyen (APE) et pour RMSRE_T (racine carrée de l'erreur relative moyenne avec un seuil).

APE (erreur moyenne en pourcentage)

L'APE est le rapport entre le bruit et le signal, à savoir la valeur récapitulative réelle.

Plus les valeurs APE sont faibles, plus les rapports signal/bruit sont élevés.

Formule

Pour un rapport récapitulatif donné, l'APE est calculé comme suit :

Équation pour l'APE. Des valeurs absolues sont requises, car le bruit peut être négatif.

True correspond à la valeur récapitulative "true". L'APE correspond à la moyenne du bruit pour chaque valeur récapitulative réelle, moyennée sur toutes les entrées d'un rapport récapitulatif. Dans Noise Lab, cette valeur est ensuite multipliée par 100 pour obtenir un pourcentage.

Avantages et inconvénients

Les buckets de plus petite taille ont un impact disproportionné sur la valeur finale de l'APE. Cela peut être trompeur lors de l'évaluation du bruit. C'est pourquoi nous avons ajouté une autre métrique, RMSRE_T, conçue pour atténuer cette limite de l'APE. Pour en savoir plus, consultez les exemples.

Code

Consultez le code source pour le calcul de l'APE.

RMSRE_T (racine carrée de l'erreur relative moyenne avec un seuil)

RMSRE_T (racine carrée de l'erreur relative moyenne avec un seuil) est une autre mesure du bruit.

Interpréter RMSRE_T

Plus les valeurs RMSRE_T sont faibles, plus les rapports signal/bruit sont bons.
Par exemple, si un rapport de bruit acceptable pour votre cas d'utilisation est de 20 % et que RMSRE_T est de 0,2, vous pouvez être sûr que les niveaux de bruit se situent dans votre plage acceptable.

Formule

Pour un rapport récapitulatif donné, RMSRE_T est calculé comme suit :

Avantages et inconvénients

La RMSRE_T est un peu plus complexe à comprendre que l'APE. Toutefois, il présente quelques avantages qui le rendent parfois plus adapté que l'APE pour analyser le bruit dans les rapports récapitulatifs :

RMSRE_T est plus stable. "T" est un seuil. "T" est utilisé pour accorder moins d'importance dans le calcul de RMSRE_T aux buckets qui ont moins de conversions et qui sont donc plus sensibles au bruit en raison de leur petite taille. Avec T, la métrique n'augmente pas de manière spectaculaire dans les buckets avec peu de conversions. Si T est égal à 5, une valeur de bruit aussi petite que 1 dans un bucket avec 0 conversion ne sera pas affichée comme étant largement supérieure à 1. Au lieu de cela, elle sera plafonnée à 0,2, ce qui équivaut à 1/5, car T est égal à 5. En accordant moins d'importance aux petits buckets, qui sont donc plus sensibles au bruit, cette métrique est plus stable et permet donc de comparer plus facilement deux simulations.
RMSRE_T permet une agrégation simple. En connaissant le RMSRE_T de plusieurs buckets, ainsi que leurs nombres réels, vous pouvez calculer le RMSRE_T de leur somme. Cela vous permet également d'optimiser RMSRE_T pour ces valeurs combinées.

Bien qu'il soit possible d'agréger l'APE, la formule est assez complexe, car elle implique la valeur absolue de la somme des bruits de Laplace. Il est donc plus difficile d'optimiser l'APE.

Code

Examinez le code source pour le calcul de RMSRE_T.

Exemples

Rapport récapitulatif avec trois buckets :

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13 %

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

Rapport récapitulatif avec trois buckets :

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0,1 + 0,2 + 1) / 3 = 43 %

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Rapport récapitulatif avec trois buckets :

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + infini) / 3 = infini

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Gestion avancée des clés

Une DSP ou une entreprise de mesure publicitaire peut avoir des milliers de clients publicitaires dans le monde, répartis dans plusieurs secteurs, devises et potentiels de prix d'achat. Cela signifie qu'il est probablement très peu pratique de créer et de gérer une clé d'agrégation par annonceur. De plus, il sera difficile de sélectionner une valeur agrégable maximale et un budget d'agrégation qui peuvent limiter l'impact du bruit pour ces milliers d'annonceurs mondiaux. Prenons plutôt les exemples suivants :

Stratégie clé A

Le fournisseur de technologie publicitaire décide de créer et de gérer une clé pour tous ses clients publicitaires. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie de ceux à faible volume et haut de gamme à ceux à fort volume et bas de gamme. Cela génère la clé suivante :

	Clé (plusieurs devises)
Valeur agrégable maximale	5 000 000
Plage de valeurs des achats	[120 - 5000000]

Stratégie clé B

Le fournisseur de technologie publicitaire décide de créer et de gérer deux clés pour tous ses clients publicitaires. Il décide de séparer les clés par devise. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie de ceux à faible volume et haut de gamme à ceux à fort volume et bas de gamme. En séparant les données par devise, ils créent deux clés :

	Clé 1 (USD)	Clé 2 (¥)
Valeur agrégable maximale	40 000 $	5 000 000 JPY
Plage de valeurs des achats	[120 - 40 000]	[15 000 - 5 000 000]

La stratégie B aura moins de bruit dans ses résultats que la stratégie A, car les valeurs monétaires ne sont pas réparties de manière uniforme entre les devises. Par exemple, réfléchissez à la façon dont les achats libellés en yens mélangés à ceux libellés en dollars américains modifieront les données sous-jacentes et le résultat bruyant obtenu.

Stratégie clé C

Le fournisseur de technologie publicitaire décide de créer et de gérer quatre clés pour tous ses clients publicitaires, et de les séparer par devise et secteur d'activité de l'annonceur :

	Clé 1 (USD x annonceurs de bijoux haut de gamme)	Clé 2 (¥ x annonceurs de bijoux haut de gamme)	Clé 3 (USD x annonceurs de vente de vêtements)	Clé 4 (¥ x annonceurs de vêtements)
Valeur agrégable maximale	40 000 $	5 000 000 JPY	500 €	65 000 ¥
Plage de valeurs des achats	[10 000 - 40 000]	[1 250 000 - 5 000 000]	[120 - 500]	[15 000 - 65 000]

La stratégie clé C générera moins de bruit dans ses résultats que la stratégie clé B, car les valeurs d'achat des annonceurs ne sont pas réparties de manière uniforme entre eux. Par exemple, imaginez que les achats de bijoux haut de gamme soient mélangés à ceux de casquettes de baseball. Cela modifiera les données sous-jacentes et générera un résultat bruyant.

Envisagez de créer des valeurs agrégées maximales et des facteurs d'échelle partagés pour les points communs entre plusieurs annonceurs afin de réduire le bruit dans le résultat. Par exemple, vous pouvez tester les stratégies suivantes pour vos annonceurs :

Une stratégie séparée par devise (USD, ¥, CAD, etc.)
Une stratégie séparée par secteur d'annonceur (assurance, automobile, vente au détail, etc.)
Une stratégie séparée par des plages de valeurs d'achat similaires ([100], [1000], [10000], etc.)

En créant des stratégies clés autour des points communs des annonceurs, les clés et le code correspondant sont plus faciles à gérer, et les rapports signal/bruit deviennent plus élevés. Testez différentes stratégies avec différentes similitudes d'annonceurs pour identifier les points d'inflexion permettant de maximiser l'impact du bruit par rapport à la gestion du code.

Gestion avancée des valeurs aberrantes

Prenons l'exemple de deux annonceurs :

Annonceur A :
- Sur tous les produits du site de l'annonceur A, les prix d'achat possibles sont compris entre 120 $ et 1 000 $, soit une fourchette de 880 $.
- Les prix d'achat sont répartis uniformément sur la plage de 880 $, sans valeurs aberrantes en dehors de deux écarts-types par rapport au prix d'achat médian.
Annonceur B :
- Sur tous les produits du site de l'annonceur B, les prix d'achat possibles se situent entre 120 $ et 1 000 $, soit une fourchette de 880 $.
- Les prix d'achat sont fortement orientés vers la tranche de 120 à 500 $, avec seulement 5 % des achats effectués dans la tranche de 500 à 1 000 $.

Compte tenu des exigences concernant le budget de contribution et de la méthodologie avec laquelle le bruit est appliqué aux résultats finaux, l'annonceur B aura, par défaut, un résultat plus bruyant que l'annonceur A, car l'annonceur B a un potentiel plus élevé d'impact des valeurs aberrantes sur les calculs sous-jacents.

Il est possible d'y remédier en configurant une clé spécifique. Testez des stratégies clés qui vous aident à gérer les données aberrantes et à répartir plus uniformément les valeurs d'achat dans la plage d'achat de la clé.

Pour l'annonceur B, vous pouvez créer deux clés distinctes pour capturer deux plages de valeurs d'achat différentes. Dans cet exemple, la technologie publicitaire a noté que les valeurs aberrantes apparaissent au-dessus de la valeur d'achat de 500 $. Essayez d'implémenter deux clés distinctes pour cet annonceur :

Structure clé 1 : clé qui ne capture que les achats compris entre 120 $et 500 $ (couvrant environ 95 % du volume total des achats).
Structure clé 2 : clé qui ne capture que les achats supérieurs à 500 € (environ 5 % du volume d'achat total).

L'implémentation de cette stratégie clé devrait permettre de mieux gérer le bruit pour l'annonceur B et de maximiser l'utilité des rapports récapitulatifs pour lui. Compte tenu des nouvelles plages plus petites, les clés A et B devraient désormais présenter une distribution de données plus uniforme pour chaque clé respective que pour la clé unique précédente. Cela réduira l'impact du bruit dans la sortie de chaque clé par rapport à la clé unique précédente.

Noiselab Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

À propos de ce document

Envoyer des commentaires

Avant de commencer

Décisions de conception

Principe de conception de base

Décision : précision des dimensions

Essayer dans Noise Lab

Décision : Structures clés

Essayer dans Noise Lab

Décision : fréquence de regroupement par lot

Essayer dans Noise Lab

Décision : variables de campagne qui affectent les conversions attribuables

Essayer dans Noise Lab

Décision : Utiliser le scaling

Essayer dans Noise Lab

Décision : nombre d'objectifs de mesure et répartition du budget de confidentialité

Essayer dans Noise Lab

Décision : gestion des valeurs aberrantes

Essayer dans Noise Lab

Étapes suivantes

Annexe

Visite rapide de Noise Lab

Mode simple

Mode avancé

Métriques de bruit

Concept de base

APE (erreur moyenne en pourcentage)

Formule

Avantages et inconvénients

Code

RMSRE_T (racine carrée de l'erreur relative moyenne avec un seuil)

Interpréter RMSRE_T

Formule

Avantages et inconvénients

Code

Exemples

Gestion avancée des clés

Stratégie clé A

Stratégie clé B

Stratégie clé C

Gestion avancée des valeurs aberrantes

Noiselab