Cette page a été traduite par l'API Cloud Translation.

Noiselab

À propos de ce document

En lisant ce document, vous allez :

Déterminez les stratégies à créer avant de générer des rapports récapitulatifs.
Découvrez Noise Lab, un outil qui permet de comprendre les effets de différents paramètres de bruit et d'explorer et d'évaluer rapidement différentes stratégies de gestion du bruit.

Capture d'écran de Noise Lab. — Atelier sur le bruit

Envoyer des commentaires

Bien que ce document résume quelques principes à suivre pour travailler avec des rapports récapitulatifs, il existe plusieurs approches de gestion du bruit qui ne sont peut-être pas reflétées ici. N'hésitez pas à nous faire part de vos suggestions, ajouts et questions.

Pour donner votre avis public sur les stratégies de gestion du bruit, sur l'utilité ou la confidentialité de l'API (epsilon) et pour partager vos observations lors de la simulation avec Noise Lab : Commenter ce problème
Pour envoyer des commentaires publics sur Noise Lab (poser une question, signaler un bug ou demander une fonctionnalité) : créez un problème ici.
Pour envoyer des commentaires publics sur un autre aspect de l'API : Créez un problème ici.

Avant de commencer

Pour en savoir plus, consultez Attribution Reporting : rapports récapitulatifs et Présentation complète du système Attribution Reporting.
Consultez les articles Comprendre le bruit et Comprendre les clés d'agrégation pour exploiter pleinement ce guide.

Décisions de conception

Principe de conception de base

Il existe des différences fondamentales entre le fonctionnement des cookies tiers et celui des rapports récapitulatifs. La principale différence réside dans le bruit ajouté aux données de mesure dans les rapports récapitulatifs. Il y a aussi la façon dont les rapports sont planifiés.

Pour accéder aux données de mesure des rapports récapitulatifs avec des rapports signal/bruit plus élevés, les plates-formes côté demande (DSP) et les fournisseurs de solutions de mesure des annonces devront collaborer avec leurs annonceurs pour développer des stratégies de gestion du bruit. Pour développer ces stratégies, les DSP et les fournisseurs de solutions de mesure doivent prendre des décisions de conception. Ces décisions reposent sur un concept essentiel :

Bien que la distribution des valeurs de bruit ne dépende, en termes absolus, que de deux paramètres⏤epsilon et du budget de contribution⏤, vous disposez d'un certain nombre d'autres commandes qui auront un impact sur les rapports signal/bruit de vos données de mesure de sortie.

Bien que nous nous attendions à ce qu'un processus itératif permette de prendre les meilleures décisions, chaque variation de ces décisions entraînera une implémentation légèrement différente. Par conséquent, ces décisions doivent être prises avant d'écrire chaque itération de code (et avant de diffuser des annonces).

Décision : Précision des dimensions

Essayez-la dans Noise Lab

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
Observez les paramètres par défaut. Par défaut, le nombre TOTAL de conversions attribuées par jour est de 1 000. Cela représente en moyenne environ 40 valeurs par bucket si vous utilisez la configuration par défaut (dimensions par défaut, nombre par défaut de valeurs différentes possibles pour chaque dimension, stratégie clé A). Notez que la valeur est de 40 dans la zone de saisie "Nombre moyen de conversions attribuables par jour PAR BUCKET".
Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
Dans le panneau latéral "Paramètres", recherchez "Dimensions". Remplacez Géographie par Ville et définissez le nombre de valeurs différentes possibles sur 50.
Observez l'impact de cette modification sur le nombre moyen de conversions attribuables par jour PAR BUCKET. Elle est maintenant beaucoup plus faible. En effet, si vous augmentez le nombre de valeurs possibles dans cette dimension sans rien changer d'autre, vous augmentez le nombre total de buckets sans modifier le nombre d'événements de conversion qui y seront inclus.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue : ils sont désormais plus élevés que pour la simulation précédente.

Compte tenu du principe de conception de base, les petites valeurs récapitulatives sont plus susceptibles d'être bruyantes que les grandes valeurs récapitulatives. Par conséquent, votre choix de configuration a une incidence sur le nombre d'événements de conversion attribués qui se retrouvent dans chaque bucket (autrement appelé "clé d'agrégation"), et cette quantité a une incidence sur le bruit dans les rapports récapitulatifs de sortie finaux.

La granularité des dimensions est une décision de conception qui a un impact sur le nombre d'événements de conversion attribués dans un même bucket. Prenons les exemples suivants de clés d'agrégation et de leurs dimensions :

Approche 1 : une structure de clé avec des dimensions grossières : Pays x Campagne publicitaire (ou le plus grand bucket d'agrégation de campagnes) x Type de produit (parmi 10 types de produits possibles)
Approche 2 : une structure de clé avec des dimensions précises : Ville x ID de la création x Produit (parmi 100 produits possibles)

Ville est une dimension plus détaillée que Pays. ID de création est plus détaillé que Campagne. Produit est plus détaillé que Type de produit. Par conséquent, l'approche 2 comportera un nombre d'événements (conversions) par bucket (= par clé) inférieur à celui de l'approche 1 dans le rapport récapitulatif. Étant donné que le bruit ajouté à la sortie est indépendant du nombre d'événements dans le bucket, les données de mesure dans les rapports récapitulatifs seront plus bruyantes avec l'approche 2. Pour chaque annonceur, testez différents compromis de granularité dans la conception de la clé afin d'obtenir une utilité maximale dans les résultats.

Décision : Structures clés

Essayez-la dans Noise Lab

En mode simple, la structure de clé par défaut est utilisée. En mode avancé, vous pouvez tester différentes structures de clés. Des exemples de dimensions sont inclus. Vous pouvez également les modifier.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Stratégie clé". Notez que la stratégie par défaut, nommée A dans l'outil, utilise une structure de clé détaillée qui inclut toutes les dimensions : zone géographique x ID de campagne x catégorie de produit.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue.
Remplacez la stratégie "Clé" par B. Des commandes supplémentaires s'affichent pour vous permettre de configurer votre structure de clés.
Configurez votre structure de clés, par exemple comme suit :
1. Nombre de structures clés : 2
2. Structure clé 1 = zone géographique x catégorie de produits
3. Structure de clé 2 = ID de campagne x Catégorie de produits
Cliquez sur "Simuler".
Notez que vous obtenez désormais deux rapports récapitulatifs par type d'objectif de mesure (deux pour le nombre d'achats, deux pour la valeur d'achat), étant donné que vous utilisez deux structures de clés distinctes. Observez leurs ratios de bruit.
Vous pouvez également essayer cette méthode avec vos propres dimensions personnalisées. Pour ce faire, recherchez "Données à suivre : dimensions". Envisagez de supprimer les exemples de dimensions et de créer les vôtres à l'aide des boutons "Ajouter/Supprimer/Réinitialiser" sous la dernière dimension.

Une autre décision de conception qui aura un impact sur le nombre d'événements de conversion attribués dans un même bucket est les structures de clés que vous décidez d'utiliser. Prenons les exemples de clés d'agrégation suivants :

Une structure de clé avec toutes les dimensions (appelons-la "Stratégie clé A").
Deux structures clés, chacune avec un sous-ensemble de dimensions. Appelons cette stratégie clé B.

Buckets pour les stratégies clés A et B.

La stratégie A est plus simple, mais vous devrez peut-être agréger (additionner) les valeurs récapitulatives comportant du bruit incluses dans les rapports récapitulatifs pour accéder à certains insights. En additionnant ces valeurs, vous additionnez également le bruit. Avec la stratégie B, les valeurs récapitulatives affichées dans les rapports récapitulatifs peuvent déjà vous fournir les informations dont vous avez besoin. Cela signifie que la stratégie B est susceptible de générer un meilleur rapport signal/bruit que la stratégie A. Toutefois, le bruit peut déjà être acceptable avec la stratégie A. Vous pouvez donc toujours décider de privilégier la stratégie A pour plus de simplicité. En savoir plus sur ces deux stratégies dans l'exemple détaillé

La gestion des clés est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer les rapports signal/bruit. L'une d'elles est décrite dans la section Gestion avancée des clés.

Décision : Fréquence de traitement par lot

Essayez-la dans Noise Lab

Accédez au mode Simple (ou au mode Avancé, les deux modes fonctionnant de la même manière en ce qui concerne la fréquence de traitement par lot).
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation" > "Fréquence de traitement par lot". Il s'agit de la fréquence de traitement par lot des rapports agrégables traités avec le service d'agrégation dans une seule tâche.
Observez la fréquence de traitement par lot par défaut : par défaut, une fréquence de traitement par lot quotidienne est simulée.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue.
Définissez la fréquence de traitement par lot sur hebdomadaire.
Observez les rapports signal/bruit de la simulation obtenue : ils sont désormais inférieurs (meilleurs) que pour la simulation précédente.

La fréquence de traitement par lot que vous décidez d'utiliser est une autre décision de conception qui aura un impact sur le nombre d'événements de conversion attribués dans un même bucket. La fréquence de traitement par lot correspond à la fréquence à laquelle vous traitez les rapports agrégables.

Un rapport dont l'agrégation est planifiée plus fréquemment (par exemple, toutes les heures) inclura moins d'événements de conversion que le même rapport avec un calendrier d'agrégation moins fréquent (par exemple, toutes les semaines). Par conséquent, le rapport horaire inclura plus de bruit.``` Il comportera moins d'événements de conversion que le même rapport avec un calendrier d'agrégation moins fréquent (par exemple, chaque semaine). Par conséquent, le rapport horaire aura un rapport signal/bruit inférieur à celui du rapport hebdomadaire, toutes choses égales par ailleurs. Testez les exigences de création de rapports à différentes fréquences et évaluez les rapports signal/bruit pour chacun d'eux.

Pour en savoir plus, consultez les articles Grouper des données et Agréger des données sur de longues périodes.

Décision : Variables de campagne qui affectent les conversions attribuables

Essayez-la dans Noise Lab

Bien que cela puisse être difficile à prévoir et que les variations puissent être importantes en plus des effets saisonniers, essayez d'estimer le nombre de conversions quotidiennes attribuables à un seul contact à la puissance de 10 la plus proche : 10, 100, 1 000 ou 10 000.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Vos données de conversion".
Observez les paramètres par défaut. Par défaut, le nombre TOTAL de conversions attribuées par jour est de 1 000. Cela représente en moyenne environ 40 valeurs par bucket si vous utilisez la configuration par défaut (dimensions par défaut, nombre par défaut de valeurs différentes possibles pour chaque dimension, stratégie clé A). Notez que la valeur est de 40 dans la zone de saisie "Nombre moyen de conversions attribuables par jour PAR BUCKET".
Cliquez sur "Simuler" pour exécuter une simulation avec les paramètres par défaut.
Observez les ratios de bruit de la simulation obtenue.
Définissez maintenant le nombre TOTAL de conversions attribuables quotidiennes sur 100. Notez que cela réduit la valeur du nombre moyen de conversions attribuables par jour PAR BUCKET.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont désormais plus élevés : en effet, lorsque vous enregistrez moins de conversions par bucket, plus de bruit est appliqué pour préserver la confidentialité.

Il est important de distinguer le nombre total de conversions possibles pour un annonceur du nombre total de conversions attribuées possibles. C'est ce dernier qui a finalement un impact sur le bruit dans les rapports récapitulatifs. Les conversions attribuées sont un sous-ensemble des conversions totales qui sont sensibles aux variables de la campagne, telles que le budget publicitaire et le ciblage publicitaire. Par exemple, vous pouvez vous attendre à un nombre plus élevé de conversions attribuées pour une campagne publicitaire de 10 millions de dollars qu'une campagne publicitaire de 10 000 dollars, toutes choses égales par ailleurs.

Tenez compte des remarques suivantes :

Évaluez les conversions attribuées à l'aide d'un modèle d'attribution par contact unique sur le même appareil, car elles entrent dans le champ d'application des rapports récapitulatifs collectés avec l'API Attribution Reporting.
Tenez compte d'un nombre de conversions attribuées dans le pire des cas et dans le meilleur des cas. Par exemple, toutes choses égales par ailleurs, prenez en compte les budgets de campagne minimum et maximum possibles pour un annonceur, puis projetez les conversions attribuables pour les deux résultats en tant qu'entrées dans votre simulation.
Si vous envisagez d'utiliser la Privacy Sandbox sur Android, tenez compte des conversions attribuées multiplates-formes dans le calcul.

Décision : Utiliser le scaling

Essayez-la dans Noise Lab

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation> Échelle". Par défaut, elle est définie sur "Oui".
Pour comprendre les effets positifs de la mise à l'échelle sur le rapport signal/bruit, définissez d'abord "Scaling" (Mise à l'échelle) sur "No" (Non).
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue.
Définissez "Scaling" (Échelle) sur "Yes" (Oui). Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyenne et maximale) des objectifs de mesure de votre scénario. Dans une configuration réelle de système ou d'essai d'origine, vous devez implémenter votre propre calcul pour les facteurs de mise à l'échelle.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont maintenant plus faibles (meilleurs) dans cette deuxième simulation. Cela est dû au fait que vous utilisez la mise à l'échelle.

Compte tenu du principe de conception de base, le bruit ajouté est une fonction du budget de contribution.

Par conséquent, pour augmenter le rapport signal/bruit, vous pouvez décider de transformer les valeurs collectées lors d'un événement de conversion en les échelonnant en fonction du budget de contribution (et en les déséchelonnant après l'agrégation). Utilisez la mise à l'échelle pour augmenter les rapports signal/bruit.

Décision : Nombre d'objectifs de mesure et répartition du budget de confidentialité

Cela concerne l'ajustement. Veillez à lire Utiliser l'ajustement.

Essayez-la dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Données à suivre : objectifs de mesure". Par défaut, vous disposez de deux objectifs de mesure : la valeur d'achat et le nombre d'achats.
Cliquez sur "Simuler" pour exécuter une simulation avec les objectifs par défaut.
Cliquez sur "Supprimer". Cela supprimera le dernier objectif de mesure (nombre d'achats dans ce cas).
Cliquez sur "Simuler".
Notez que les ratios de bruit pour la valeur d'achat sont désormais inférieurs (meilleurs) pour cette deuxième simulation. En effet, vous avez moins d'objectifs de mesure. Par conséquent, votre seul objectif de mesure reçoit désormais l'intégralité du budget de contribution.
Cliquez sur "Réinitialiser". Vous avez à nouveau deux objectifs de mesure : la valeur des achats et le nombre d'achats. Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser en fonction des plages (valeurs moyenne et maximale) des objectifs de mesure de votre scénario. Par défaut, Noise Lab répartit le budget de manière égale entre les objectifs de mesure.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue. Notez les facteurs de scaling affichés dans la simulation.
Maintenant, personnalisons la répartition du budget de confidentialité pour obtenir de meilleurs rapports signal/bruit.
Ajustez le pourcentage de budget attribué à chaque objectif de mesure. Compte tenu des paramètres par défaut, l'objectif de mesure 1, à savoir la valeur d'achat, a une plage beaucoup plus large (entre 0 et 1 000) que l'objectif de mesure 2, à savoir le nombre d'achats (entre 1 et 1, c'est-à-dire toujours égal à 1). Par conséquent, il a besoin de "plus d'espace pour évoluer" : il serait idéal d'attribuer plus de budget de contribution à l'objectif de mesure 1 qu'à l'objectif de mesure 2, afin qu'il puisse être étendu plus efficacement (voir "Évoluer"), et donc
Attribuez 70 % du budget à l'objectif de mesure 1. Attribuez 30 % à l'objectif de mesure 2.
Cliquez sur "Simuler".
Observez les ratios de bruit de la simulation obtenue. Pour la valeur d'achat, les ratios de bruit sont désormais nettement inférieurs (meilleurs) que pour la simulation précédente. Le nombre d'achats est à peu près inchangé.
Continuez à ajuster la répartition du budget entre les métriques. Observez l'impact de cette modification sur le bruit.

Notez que vous pouvez définir vos propres objectifs de mesure personnalisés à l'aide des boutons "Ajouter/Supprimer/Réinitialiser".

Si vous mesurez un point de données (objectif de mesure) sur un événement de conversion, tel que le nombre de conversions, ce point de données peut recevoir l'intégralité du budget de contribution (65 536). Si vous définissez plusieurs objectifs de mesure sur un événement de conversion, tels que le nombre de conversions et la valeur d'achat, ces points de données devront partager le budget de contribution. Vous avez donc moins de marge de manœuvre pour augmenter vos valeurs.

Par conséquent, plus vous avez d'objectifs de mesure, plus le rapport signal/bruit est faible (bruit plus élevé).

Vous devez également prendre une décision concernant la répartition du budget. Si vous répartissez le budget de contribution de manière égale entre deux points de données, chaque point de données reçoit un budget de 65 536/2 = 32 768. Cela peut être optimal ou non, en fonction de la valeur maximale possible pour chaque point de données. Par exemple, si vous mesurez le nombre d'achats avec une valeur maximale de 1 et la valeur d'achat avec un minimum de 1 et un maximum de 120, la valeur d'achat bénéficierait d'une "plus grande marge" pour être agrandie, c'est-à-dire pour recevoir une plus grande proportion du budget de contribution. Vous verrez si certains objectifs de mesure doivent être prioritaires par rapport à d'autres en fonction de l'impact du bruit.

Décision : Gestion des anomalies

Essayez-la dans Noise Lab

Un objectif de mesure est un point de données distinct collecté dans les événements de conversion.

Accédez au mode avancé.
Dans le panneau latéral "Paramètres", recherchez "Votre stratégie d'agrégation> Échelle".
Assurez-vous que l'option "Scaling" (Échelle) est définie sur "Yes" (Oui). Notez que Noise Lab calcule automatiquement les facteurs de scaling à utiliser, en fonction des plages (valeurs moyenne et maximale) que vous avez indiquées pour les objectifs de mesure.
Supposons que le plus gros achat jamais effectué ait été de 2 000 $, mais que la plupart des achats se situent entre 10 $et 120 $. Tout d'abord, voyons ce qui se passe si nous utilisons une approche de mise à l'échelle littérale (non recommandée) : saisissez 2 000 $comme valeur maximale pour purchaseValue.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont élevés. En effet, notre facteur de mise à l'échelle est calculé sur la base de 2 000 $, alors qu'en réalité, la plupart des valeurs d'achat seront nettement inférieures.
Utilisons maintenant une approche de mise à l'échelle plus pragmatique. Modifiez la valeur d'achat maximale sur 120 $.
Cliquez sur "Simuler".
Notez que les ratios de bruit sont inférieurs (meilleurs) dans cette deuxième simulation.

Pour implémenter la mise à l'échelle, vous calculez généralement un facteur de mise à l'échelle en fonction de la valeur maximale possible pour un événement de conversion donné (en savoir plus dans cet exemple).

Toutefois, évitez d'utiliser une valeur maximale littérale pour calculer ce facteur de scaling, car cela aggraverait vos ratios signal/bruit. À la place, supprimez les valeurs aberrantes et utilisez une valeur maximale pragmatique.

La gestion des valeurs aberrantes est un sujet complexe. Un certain nombre de techniques élaborées peuvent être envisagées pour améliorer les rapports signal/bruit. L'une d'elles est décrite dans la section Gestion avancée des valeurs aberrantes.

Étapes suivantes

Maintenant que vous avez évalué différentes stratégies de gestion du bruit pour votre cas d'utilisation, vous pouvez commencer à tester les rapports récapitulatifs en collectant des données de mesure réelles à l'aide d'un test d'origine. Consultez les guides et les conseils pour essayer l'API.

Annexe

Visite rapide de Noise Lab

Noise Lab vous aide à évaluer et à comparer rapidement les stratégies de gestion du bruit. Utilisez-la pour :

Comprendre les principaux paramètres pouvant avoir un impact sur le bruit et leur effet
Simulez l'effet du bruit sur les données de mesure de sortie en fonction de différentes décisions de conception. Ajustez les paramètres de conception jusqu'à ce que vous atteigniez un rapport signal sur bruit adapté à votre cas d'utilisation.
Partagez vos commentaires sur l'utilité des rapports récapitulatifs : quelles valeurs des paramètres epsilon et bruit fonctionnent pour vous, et lesquelles ne le font pas ? Où se trouvent les points d'inflexion ?

Considérez cette étape comme une étape de préparation. Noise Lab génère des données de mesure pour simuler les sorties de rapports récapitulatifs en fonction de vos entrées. Il ne conserve ni ne partage aucune donnée.

Noise Lab propose deux modes différents :

Mode simple : découvrez les principes de base des commandes dont vous disposez pour le bruit.
Mode avancé : testez différentes stratégies de gestion du bruit et évaluez celle qui offre le meilleur rapport signal/bruit pour vos cas d'utilisation.

Cliquez sur les boutons du menu du haut pour basculer entre les deux modes (numéro 1 sur la capture d'écran suivante).

Mode simple

Avec le mode Simple, vous contrôlez les paramètres (situés sur le côté gauche, ou numéro 2 dans la capture d'écran suivante), tels que Epsilon, et observez leur impact sur le bruit.
Chaque paramètre est associé à une info-bulle (bouton "?"). Cliquez dessus pour obtenir une explication de chaque paramètre (numéro 3 dans la capture d'écran suivante).
Pour commencer, cliquez sur le bouton "Simuler" et observez l'apparence de la sortie (numéro 4 dans la capture d'écran suivante).
La section "Output" (Sortie) affiche diverses informations. À côté de certains éléments, un point d'interrogation s'affiche. Prenez le temps de cliquer sur chaque point d'interrogation pour obtenir une explication des différentes informations.
Dans la section "Sortie", cliquez sur le bouton d'activation/de désactivation des détails si vous souhaitez afficher une version développée du tableau (numéro 5 dans la capture d'écran suivante).
Après chaque table de données de la section de sortie, vous pouvez télécharger la table pour l'utiliser hors connexion. En outre, en bas à droite, vous pouvez télécharger tous les tableaux de données (numéro 6 dans la capture d'écran suivante).
Testez différents paramètres dans la section "Paramètres", puis cliquez sur "Simuler" pour voir leur impact sur la sortie :

Interface Noise Lab pour le mode Simple.

Mode avancé

En mode avancé, vous avez plus de contrôle sur les paramètres. Vous pouvez ajouter des objectifs et des dimensions de mesure personnalisés (numéros 1 et 2 dans la capture d'écran suivante).
Faites défiler la section "Paramètres" vers le bas pour voir l'option "Stratégie clé". Vous pouvez l'utiliser pour tester différentes structures de clés (numéro 3 dans la capture d'écran suivante).
- Pour tester différentes structures de clés, définissez la stratégie de clé sur "B".
- Saisissez le nombre de structures de clés différentes que vous souhaitez utiliser (par défaut, la valeur est "2").
- Cliquez sur "Générer des structures de clés".
- Vous verrez des options pour spécifier vos structures de clés en cochant les cases à côté des clés que vous souhaitez inclure pour chaque structure de clés.
- Cliquez sur "Simuler" pour afficher la sortie.
  
  Interface Noise Lab pour le mode avancé.
  
  Interface Noise Lab pour le mode avancé.

Métriques de bruit

Concept de base

Du bruit est ajouté pour protéger la confidentialité des utilisateurs individuels.

Une valeur de bruit élevée indique que les buckets/clés sont clairsemés et contiennent des contributions d'un nombre limité d'événements sensibles. Cela se fait automatiquement par Noise Lab, afin de permettre aux utilisateurs de "se cacher dans la foule", ou en d'autres termes, de protéger la confidentialité de ces utilisateurs limités avec une quantité plus importante de bruit ajouté.

Une valeur de bruit faible indique que la configuration des données a été conçue de manière à permettre aux individus de "se cacher dans la foule". Cela signifie que les buckets contiennent des contributions d'un nombre suffisant d'événements pour vérifier que la confidentialité des utilisateurs individuels est protégée.

Cette affirmation est vraie pour l'erreur relative moyenne (APE) et RMSRE_T (erreur relative quadratique moyenne avec un seuil).

APE (erreur moyenne en pourcentage)

L'APE correspond au rapport entre le bruit et le signal, c'est-à-dire la valeur récapitulative réelle.

Plus la valeur APE est faible, meilleur est le rapport signal sur bruit.

Formule

Pour un rapport récapitulatif donné, l'APE est calculé comme suit :

Équation de l'APE. Les valeurs absolues sont obligatoires, car le bruit peut être négatif.

True est la valeur récapitulative réelle. L'APE est la moyenne du bruit sur chaque valeur récapitulative réelle, calculée sur l'ensemble des entrées d'un rapport récapitulatif. Dans Noise Lab, ce nombre est ensuite multiplié par 100 pour obtenir un pourcentage.

Avantages et inconvénients

Les buckets de petite taille ont un impact disproportionné sur la valeur finale de l'APE. Cela peut être trompeur lors de l'évaluation du bruit. C'est pourquoi nous avons ajouté une autre métrique, RMSRE_T, conçue pour atténuer cette limitation de l'APE. Pour en savoir plus, consultez les exemples.

Code

Examinez le code source pour le calcul de l'APE.

RMSRE_T (erreur relative quadratique moyenne avec seuil)

RMSRE_T (erreur relative quadratique moyenne avec seuil) est une autre mesure du bruit.

Interpréter RMSRE_T

Plus la valeur RMSRE_T est faible, meilleur est le rapport signal sur bruit.
Par exemple, si le rapport de bruit acceptable pour votre cas d'utilisation est de 20 % et que RMSRE_T est de 0,2, vous pouvez être sûr que les niveaux de bruit se situent dans la plage acceptable.

Formule

Pour un rapport récapitulatif donné, RMSRE_T est calculé comme suit :

Avantages et inconvénients

RMSRE_T est un peu plus complexe à comprendre que l'APE. Toutefois, il présente quelques avantages qui le rendent, dans certains cas, plus adapté que l'APE pour analyser le bruit dans les rapports récapitulatifs :

RMSRE_T est plus stable. "T" est un seuil. "T" permet de donner moins de poids au calcul de RMSRE_T aux buckets qui enregistrent moins de conversions et qui sont donc plus sensibles au bruit en raison de leur petite taille. Avec T, la métrique ne connaît pas de pic pour les buckets comportant peu de conversions. Si T est égal à 5, une valeur de bruit aussi faible que 1 sur un bucket contenant 0 conversions ne sera pas affichée comme bien supérieure à 1. Il sera plafonné à 0, 2, ce qui équivaut à 1/5, car T est égal à 5. En accordant moins de poids aux petits buckets, qui sont donc plus sensibles au bruit, cette métrique est plus stable et permet de comparer plus facilement deux simulations.
RMSRE_T permet une agrégation simple. Connaître la RMSRE_T de plusieurs buckets, ainsi que leur nombre réel, vous permet de calculer la RMSRE_T de leur somme. Vous pouvez également optimiser pour RMSRE_T pour ces valeurs combinées.

Bien que l'agrégation soit possible pour l'APE, la formule est assez complexe, car elle implique la valeur absolue de la somme des bruits de Laplace. Il est donc plus difficile d'optimiser l'APE.

Code

Examinez le code source pour le calcul de RMSRE_T.

Exemples

Rapport récapitulatif avec trois buckets :

bucket_1 = bruit : 10, valeur_récapitulative_réelle : 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13 %

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

Rapport récapitulatif avec trois buckets :

bucket_1 = bruit : 10, valeur_récapitulative_réelle : 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = bruit : 20, trueSummaryValue : 20

APE = (0,1 + 0,2 + 1) / 3 = 43 %

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Rapport récapitulatif avec trois buckets :

bucket_1 = bruit : 10, valeur_récapitulative_réelle : 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + Infinity) / 3 = Infinity

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Gestion avancée des clés

Une DSP ou une entreprise de mesure des annonces peut avoir des milliers de clients publicitaires dans le monde, couvrant plusieurs secteurs, devises et prix d'achat potentiels. Cela signifie que créer et gérer une clé d'agrégation par annonceur sera probablement très peu pratique. De plus, il sera difficile de sélectionner une valeur maximale agrégable et un budget d'agrégation qui peuvent limiter l'impact du bruit sur ces milliers d'annonceurs internationaux. Prenons plutôt les scénarios suivants :

Stratégie clé A

Le fournisseur de technologie publicitaire décide de créer et de gérer une clé pour l'ensemble de ses clients publicitaires. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie de faibles volumes d'achats haut de gamme à des volumes élevés d'achats bas de gamme. Vous obtenez la clé suivante :

	Clé (plusieurs devises)
Valeur maximale agrégable	5 000 000
Plage de valeurs des achats	[120 - 5000000]

Stratégie clé B

Le fournisseur de technologie publicitaire décide de créer et de gérer deux clés pour l'ensemble de ses clients publicitaires. Il décide de séparer les clés par devise. Pour tous les annonceurs et toutes les devises, la gamme d'achats varie de faibles volumes d'achats haut de gamme à des volumes élevés d'achats bas de gamme. En les séparant par devise, il crée deux clés :

	Clé 1 (USD)	Clé 2 (¥)
Valeur maximale agrégable	40 000 $	5 000 000 JPY
Plage de valeurs des achats	[120 - 40 000]	[15 000 - 5 000 000]

La stratégie clé B présentera moins de bruit dans ses résultats que la stratégie clé A, car les valeurs des devises ne sont pas réparties uniformément entre les devises. Par exemple, réfléchissez à la façon dont les achats libellés en ¥ mélangés à ceux libellés en USD modifieront les données sous-jacentes et le résultat bruyant qui en résulte.

Stratégie clé C

Le fournisseur de technologie publicitaire décide de créer et de gérer quatre clés pour l'ensemble de ses clients publicitaires, et de les séparer par devise x secteur de l'annonceur :

	Clé 1 (USD x Annonceurs de bijoux haut de gamme)	Clé 2 (¥ x Annonceurs de bijoux haut de gamme)	Clé 3 (USD x Annonceurs marchands de vêtements)	Clé 4 (¥ x Annonceurs de magasins de vêtements)
Valeur maximale agrégable	40 000 $	5 000 000 JPY	500 €	65 000 ¥
Plage de valeurs des achats	[10 000 - 40 000]	[1 250 000 - 5 000 000]	[120 - 500]	[15 000 - 65 000]

La stratégie clé C présentera moins de bruit dans ses résultats que la stratégie clé B, car les valeurs d'achat des annonceurs ne sont pas réparties uniformément entre eux. Par exemple, considérez comment les achats de bijoux haut de gamme mélangés à ceux de casquettes de baseball modifieront les données sous-jacentes et le résultat bruyant qui en résulte.

Envisagez de créer des valeurs agrégées maximales partagées et des facteurs de scaling partagés pour les points communs entre plusieurs annonceurs afin de réduire le bruit dans la sortie. Par exemple, vous pouvez tester les stratégies suivantes pour vos annonceurs :

Une stratégie séparée par devise (USD, ¥, CAD, etc.)
Une stratégie séparée par secteur de l'annonceur (assurance, automobile, commerce, etc.)
Une stratégie séparée par des plages de valeurs d'achat similaires ([100], [1 000], [10 000], etc.)

En créant des stratégies clés autour des points communs des annonceurs, les clés et le code correspondant sont plus faciles à gérer, et les ratios signal/bruit sont plus élevés. Testez différentes stratégies avec différentes similitudes entre les annonceurs pour identifier les points d'inflexion afin de maximiser l'impact du bruit par rapport à la gestion du code.

Gestion avancée des valeurs aberrantes

Prenons l'exemple de deux annonceurs :

Annonceur A :
- Pour tous les produits du site de l'annonceur A, le prix d'achat peut varier entre [$120 et $1 000] , soit une fourchette de 880 $.
- Les prix d'achat sont répartis uniformément sur la gamme de 880 $, sans valeurs aberrantes en dehors de deux écarts-types du prix d'achat médian.
Annonceur B :
- Pour tous les produits du site de l'annonceur B, le prix d'achat peut varier entre [$120 et $1 000] , soit une fourchette de 880 $.
- Les prix d'achat sont fortement orientés vers la fourchette de 120 à 500 $, et seuls 5 % des achats se situent entre 500 et 1 000 $.

Compte tenu des exigences concernant le budget de contribution et de la méthodologie avec laquelle le bruit est appliqué aux résultats finaux, l'annonceur B aura, par défaut, une sortie plus bruyante que l'annonceur A, car il est plus susceptible d'être affecté par les valeurs aberrantes dans les calculs sous-jacents.

Vous pouvez y remédier en configurant des clés spécifiques. Testez des stratégies clés qui aident à gérer les données aberrantes et à répartir plus uniformément les valeurs d'achat sur la plage d'achat de la clé.

Pour l'annonceur B, vous pouvez créer deux clés distinctes pour capturer deux plages de valeurs d'achat différentes. Dans cet exemple, la technologie publicitaire a constaté que des valeurs aberrantes apparaissent au-dessus de la valeur d'achat de 500 $. Essayez d'implémenter deux clés distinctes pour cet annonceur :

Structure de clé 1 : clé qui ne capture que les achats compris entre 120 $et 500 $ (couvrant environ 95 % du volume d'achat total).
Structure de clé 2 : clé qui ne capture que les achats supérieurs à 500 $ (couvrant environ 5 % du volume d'achat total).

L'implémentation de cette stratégie clé devrait mieux gérer le bruit pour l'annonceur B et l'aider à maximiser l'utilité des rapports récapitulatifs. Compte tenu des nouvelles plages plus petites, la clé A et la clé B devraient désormais présenter une distribution des données plus uniforme dans chaque clé respective que pour la clé unique précédente. Cela aura moins d'impact sur le bruit dans la sortie de chaque clé que pour la clé unique précédente.

Noiselab Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

À propos de ce document

Envoyer des commentaires

Avant de commencer

Décisions de conception

Principe de conception de base

Décision : Précision des dimensions

Essayez-la dans Noise Lab

Décision : Structures clés

Essayez-la dans Noise Lab

Décision : Fréquence de traitement par lot

Essayez-la dans Noise Lab

Décision : Variables de campagne qui affectent les conversions attribuables

Essayez-la dans Noise Lab

Décision : Utiliser le scaling

Essayez-la dans Noise Lab

Décision : Nombre d'objectifs de mesure et répartition du budget de confidentialité

Essayez-la dans Noise Lab

Décision : Gestion des anomalies

Essayez-la dans Noise Lab

Étapes suivantes

Annexe

Visite rapide de Noise Lab

Mode simple

Mode avancé

Métriques de bruit

Concept de base

APE (erreur moyenne en pourcentage)

Formule

Avantages et inconvénients

Code

RMSRE_T (erreur relative quadratique moyenne avec seuil)

Interpréter RMSRE_T

Formule

Avantages et inconvénients

Code

Exemples

Gestion avancée des clés

Stratégie clé A

Stratégie clé B

Stratégie clé C

Gestion avancée des valeurs aberrantes

Noiselab