Framework de tests de charge du service d'agrégation

Nous vous invitons à nous faire part de vos commentaires sur ce document, car nous nous préparons à l'ajouter à notre dépôt public de recommandations.

Nous encourageons les technologies publicitaires à effectuer des tests de charge sur 100% du trafic de production:

  1. Les technologies publicitaires doivent accéder à la mesure de l'attribution des conversions à l'aide de l'API Attribution Reporting pour leurs cas d'utilisation de reporting.
  2. La technologie publicitaire doit prendre des décisions de conception tout en réduisant le bruit (voir la modélisation des décisions de conception).
  3. Lors des tests, les technologies publicitaires doivent suivre le nombre de tâches qu'elles exécutent par jour (par exemple, par tâches d'annonceur), une distribution estimée du volume d'événements de conversion et le nombre de clés agrégées en entrée par tâche de traitement (reportez-vous au paramètre de tâche output_domain_blob_prefix dans la documentation de l'API Aggregation Service), ainsi que les événements de conversion moyens estimés par rapport au rapport d'entrée.
  4. Pour les tests, les technologies publicitaires doivent rechercher le type d'instance recommandé dans le tableau des conseils de dimensionnement en fonction de la taille de tâche attendue (volume de rapports, taille de domaine, etc.) et dimensionner leur service d'agrégation déployé en conséquence. Référence: Conseils de dimensionnement pour le service agrégé sur AWS
  5. Les technologies publicitaires doivent exécuter des tâches d'agrégation pour les tests de charge.

Objectifs

Ces conseils sont spécifiques à la mesure de l'attribution des conversions agrégées et incluent des instructions de configuration et de configuration clés destinées aux technologies publicitaires pour:

  • Estimez les attentes de charge pour la mesure de l'attribution des conversions agrégées.
  • Optimiser la configuration et la configuration clés pour les performances et le bruit en fonction des dimensions et des objectifs qu'ils avaient l'intention de mesurer, ainsi que de la taille et de la segmentation de leurs annonceurs.

Conditions préalables

Ce guide est destiné aux professionnels de la technologie publicitaire. Avant de suivre les étapes suivantes, consultez notre documentation sur l'utilisation du bruit et les décisions de conception des rapports récapitulatifs, et testez le laboratoire de bruit pour une configuration optimale.

Étapes

1. Stratégie de configuration initiale des clés d'agrégation

Déterminez le nombre de structures de clés (ensemble de dimensions) différentes dont vous avez besoin en fonction de votre type d'entreprise et de vos objectifs. Notez que l'optimisation de votre structure de clés peut contribuer à réduire le bruit dans les rapports.

Nombre d'annonceurs que vous avez
Par exemple, supposons que vous ayez 1 000 annonceurs.

Les similitudes entre vos annonceurs
Les similitudes doivent être évaluées en fonction du volume de conversions, des valeurs de conversion relatives et de la couverture générale des caractéristiques des annonceurs. Plus vous pouvez les regrouper de manière similaire, plus vos résultats seront précis (en raison de la moindre variance des valeurs de sortie) et, par conséquent, moins l'impact du bruit sera important. Pour en savoir plus, consultez la section Gestion des clés avancée. Par exemple, une technologie publicitaire peut segmenter ses annonceurs par secteur, dépenses et volume de conversions comme suit:

  • Secteur (par exemple: Assurance, Bijoux, Commerce de détail en croissance)
  • Dépenses (par exemple: < 50 000 €/trimestre, 50 000 à 150 000 €/trimestre, 150 000 à 250 000 €/trimestre)
  • Volume de conversions (faible, moyen, élevé)

Nombre de structures de clés agrégées à créer
Exemple : 27 (3x3x3) : trois secteurs, trois types de dépenses et trois regroupements pour les valeurs de conversion.

2. Identifier les dimensions clés d'agrégation

Identifiez ensuite les dimensions importantes que vous souhaitez suivre pour les impressions et les conversions afin d'estimer le nombre de clés côté source et déclencheur.

Pour chaque structure de clé d'agrégation, les dimensions importantes que vous devez suivre pour les impressions vous aideront à déterminer le nombre de clés côté source. Les dimensions dépendent du type d'annonceur, comme le secteur d'activité, les dépenses ou les conversions. Les exemples suivants aident à expliquer les dimensions:

  • Structure de clés 1: (secteur = assurance, dépenses = <50 000, volume de conversions = faible)

    • A: 4 dimensions : Campagne (par exemple, 50 possibilités), Groupe d'annonces (par exemple : 20 possibilités), Type d'appareil (par exemple : 5 possibilités), Geo (par exemple : 50 possibilités)
      1. Combinaisons de dimensions possibles = 50 x 20 x 5 x 50 = 250 000. Il s'agit du nombre de combinaisons dimensionnelles possibles pour les clés côté source pour la structure de clé 1.
      2. 18 bits doivent être réservés (18 bits = 262 144 combinaisons possibles)
  • Structure de clé 2: (secteur = assurance, dépenses = <50 000, volume de conversions = moyen)

    • A: 4 dimensions : Campagne (par exemple, 30 possibilités), Groupe d'annonces (par exemple : 80 possibilités), type d'annonce (par exemple : 3 possibilités), Geo (par exemple : 50 possibilités).
      1. Combinaisons de dimensions possibles = 30 x 80 x 3 x 50 = 360 000. Il s'agit du nombre de combinaisons dimensionnelles ou de clés côté source possibles pour la structure de clé 2.
      2. Il faut réserver 19 bits (19 bits = 524 288 combinaisons possibles).
  • Structure de clé 3: répétez (planifiez de la même manière toutes les structures de clé que vous possédez)

Pour chaque structure de clé d'agrégation, les dimensions importantes que vous devez suivre pour les conversions vous aideront à déterminer les clés côté déclencheur. Exemple :

  • Structure de clés 1: (secteur = assurance, dépenses = <50 000, volume de conversions = faible)

    • A: Deux dimensions : la catégorie de produits (par exemple, 100 possibilités), Type de conversion (par exemple : 5 possibilités)
      1. Combinaisons de dimensions possibles = 100 x 5 = 500
      2. Il faut réserver neuf bits (9 bits = 512 combinaisons possibles).
  • Structure de clé 2: (secteur = assurance, dépenses = <50 000, volume de conversions = moyen)

    • A: Trois dimensions : catégorie de produits (par exemple, 50 possibilités), Type de produit (10 possibilités), Type de conversion (3 possibilités)
      1. Combinaisons de dimensions possibles = 50 x 10 x 3 = 1 500
      2. 11 bits doivent être réservés (11 bits = 2 048 combinaisons possibles)
  • Structure de clé 3: répéter (planifiez de la même manière pour toutes les structures de clé que vous possédez)

Estimations pour les clés agrégées

  • Structure de clés 1: 250 000 clés d'impression x 500 clés de conversion = 125 000 000 clés
  • Structure de clé 2: 360 000 clés d'impression x 1,5 clés de conversion = 540 000 000 clés
  • Structure de clé 3: (planifiez de la même manière toutes les structures de clé que vous possédez)
  • Répéter pour chaque structure de clé
  • Nombre maximal de clés d'agrégation = 540 000 000 clés (pour toutes les structures de clés). 30 bits doivent être réservés (30 bits = 1,07 milliards de combinaisons possibles)

Volume de conversions prévu

Pour chaque structure de clé d'agrégation, le volume prévu peut être expliqué à l'aide des exemples suivants:

  • Structure de clés 1: (secteur = assurance, dépenses = <50 000, volume de conversions = faible)
    • A: Prévoyez que la structure clé 1 représentera environ 500 000 $de dépenses publicitaires au cours du prochain trimestre,pour un CPM moyen de 8 $. Comptez sur 62 500 000 impressions à enregistrer.
    • Prévoyez que le taux moyen d'impressions vers les conversions que la structure de clés 1 représentera au cours du prochain trimestre sera de 0,08%, ce qui entraînera 50 000 conversions attribuées à capturer. Pour chaque conversion, mesurez la valeur et le nombre d'achats.
  • Structure de clés 2: (secteur = assurance, dépenses = < 50 000, volume de conversions = moyen)
    • A: Prévoyez que la clé 2 représentera environ 800 000 $ de dépenses au cours du prochain trimestre,pour un CPM moyen de 10 $. Comptez sur 80 millions d'impressions à enregistrer.
    • Prévoyez que le taux moyen d'impressions vers les conversions que la clé 2 représentera au cours du prochain trimestre sera de 0,03125%, ce qui entraînera 25 000 conversions attribuées à capturer. Pour chaque conversion, mesurez la valeur et le nombre d'achats.
  • Répéter pour chaque structure de clé

Fréquence de diffusion des rapports et de traitement par lot (lot par annonceur)**

Pour chaque structure de clé d'agrégation, vous devez recevoir des rapports sur les conversions de manière récurrente. Nous recommandons aux technologies publicitaires de regrouper les données par annonceur (pour une séparation plus nette des données par rapport et une agrégation plus efficace) et d'utiliser le champ shared_info.scheduled_report_time du rapport pour le regroupement.

  • A: Toutes les heures
  • B: Quotidiennement
  • C: Hebdomadaire

Remarques

  • Pour le traitement par lot par annonceur, vérifiez les contrats de niveau de service avec les annonceurs.
  • Plus les lots sont fréquents, plus le bruit est élevé par lot. (voir Décision : Fréquence des lots).

  • Pour éviter les erreurs dues à un traitement par lot incorrect, assurez-vous que les lots utilisent le champ scheduled_report_time, et non report arrival time. Par exemple, si vous créez des lots toutes les heures, votre lot de 11h ne doit inclure que les rapports avec un scheduled_report_time compris entre 10h et 11h, et non les rapports arrivés entre 10h et 11h avec un scheduled_report_time différent (par exemple : 9h).

Estimations du volume de rapports

  • Structure de clé 1: 50 000 conversions attribuées / 2 160 (rapports horaires, heures par trimestre) = 24 rapports récapitulatifs par heure et par annonceur (24 x 1 000 annonceurs = 24 000 rapports récapitulatifs)
  • Structure de clé 2: 25 000 conversions attribuées / 2 160 (rapports horaires, heures par trimestre) = 12 rapports récapitulatifs par heure et par annonceur (12 x 1 000 annonceurs = 12 000 rapports récapitulatifs)
  • Structure de clé 3: répétition
  • Nombre total de rapports récapitulatifs par heure = 24 rapports récapitulatifs pour la structure de clés 1 + 12 rapports récapitulatifs pour la structure de clés 2 + ... = ... par heure et par annonceur

Résumé des commentaires

Comprendre les estimations suivantes des technologies publicitaires nous aide à planifier les fonctionnalités et les améliorations nécessaires pour répondre à l'échelle requise par les technologies publicitaires. Nous vous suggérons de nous communiquer les informations suivantes. Pour en savoir plus, consultez nos conseils de dimensionnement pour le service d'agrégation sur AWS:

  • Nombre maximal de clés de domaine d'entrée (clés à agréger) par tâche de service d'agrégation
  • Volume maximal de rapports d'entrée par tâche (conversions attribuées)
  • Contributions estimées par rapport (paires clé/valeur dans un rapport)
  • Répartition estimée des conversions attribuées par tâche
  • Distribution estimée des clés de domaine dans une tâche
  • Nombre estimé de tâches par heure/jour/semaine