Framework de prueba de carga del servicio de agregación

Agradecemos tus comentarios sobre este documento mientras nos preparamos para agregarlo a nuestro repositorio de orientación pública.

Recomendamos a las empresas de tecnología publicitaria que realicen pruebas de carga en el 100% del tráfico de producción:

  1. Las tecnologías publicitarias deben acceder a la medición de la atribución de conversiones con la API de Attribution Reporting como sus casos de uso de informes.
  2. La tecnología publicitaria debe tomar decisiones de diseño y, al mismo tiempo, minimizar el ruido (referencia: decisiones de diseño modeladas).
  3. Durante las pruebas, las tecnologías publicitarias deben hacer un seguimiento de la cantidad de trabajos que ejecutan por día (p.ej., trabajos por anunciante), una distribución estimada del volumen de eventos de conversión y la cantidad de claves agregadas como entrada por trabajo de procesamiento (consulta el parámetro de trabajo output_domain_blob_prefix en la documentación de la API de Aggregation Service) y los eventos de conversión promedio estimados por informe de entrada.
  4. Para las pruebas, las tecnologías publicitarias deben consultar el tipo de instancia recomendado en la tabla de orientación sobre el tamaño según el tamaño esperado del trabajo (es decir, el volumen de informes y el tamaño del dominio) y ajustar el tamaño del servicio de agregación implementado en consecuencia. Referencia: Orientación sobre el tamaño del servicio agregado en AWS
  5. Las tecnologías publicitarias deben ejecutar trabajos de agregación para las pruebas de carga.

Objetivos

Esta guía se aplica específicamente a la medición de la atribución de conversiones agregadas y contiene instrucciones clave de configuración y ajuste destinadas a las empresas de tecnología publicitaria para que realicen las siguientes acciones:

  • Estima las expectativas de carga para la medición de la atribución de conversiones agregadas.
  • Optimizar su configuración clave para el rendimiento y el ruido en función de las dimensiones y los objetivos que pretendían medir, y el tamaño y la segmentación de sus anunciantes

Requisitos

Esta guía está dirigida a un público objetivo de tecnología publicitaria. Antes de seguir los pasos que se indican a continuación, debes revisar nuestra documentación sobre cómo trabajar con el ruido, las decisiones de diseño del informe de resumen y experimentar con el laboratorio de ruido para obtener una configuración óptima.

Pasos

1. Estrategia de configuración inicial de la clave de agregación

Determina cuántas estructuras de claves (es decir, conjuntos de dimensiones) diferentes necesitas según tu tipo de empresa y tus objetivos. Ten en cuenta que optimizar la estructura de tus claves podría ayudar a reducir el ruido en los informes.

La cantidad de anunciantes que tienes
Por ejemplo, supongamos que tienes 1,000 anunciantes.

Las similitudes entre tus anunciantes
Las similitudes se deben evaluar en función de la cantidad de conversiones, los valores de conversión relativos y la cobertura general de las características de los anunciantes. Cuanto más similares sean los grupos que puedas formar, más precisos serán tus resultados (debido a la menor varianza en los valores de salida) y, por lo tanto, menor será el impacto del ruido. Consulta la administración avanzada de claves para obtener más detalles. Por ejemplo, una tecnología publicitaria puede segmentar a sus anunciantes por sector, inversión y volumen de conversiones de la siguiente manera:

  • Sector (por ejemplo, seguros, joyería, comercio minorista en crecimiento)
  • Inversión (por ejemplo, menos de USD 50,000 por trimestre, de USD 50,000 a USD 150,000 por trimestre, de USD 150,000 a USD 250,000 por trimestre)
  • Volumen de conversiones (bajo, medio, alto)

Cantidad de estructuras de claves agregadas que se crearán
Por ejemplo, 27 (3 x 3 x 3) : 3 industrias, 3 tipos de inversión y 3 agrupaciones para los valores de conversión.

2. Identifica las dimensiones de la clave de agregación

A continuación, identifica las dimensiones importantes que desees hacer un seguimiento tanto de las impresiones como de las conversiones para estimar la cantidad de claves del lado de la fuente y del activador.

Para cada estructura de clave de agregación, las dimensiones importantes que debes hacer un seguimiento para las impresiones te ayudarán a determinar la cantidad de claves del lado de la fuente. Las dimensiones dependerán del tipo de anunciante, como la industria, la inversión o la conversión. Los siguientes ejemplos ayudan a explicar las dimensiones:

  • Estructura clave 1: (Sector = seguros, inversión =< USD 50,000, volumen de conversiones = bajo)

    • R.: 4 dimensiones: Campaña (p. ej., 50 posibilidades), grupo de anuncios (p.ej., 20 posibilidades), Tipo de dispositivo (p.ej., 5 posibilidades), ubicación geográfica (p.ej., 50 posibilidades)
      1. Combinaciones dimensionales posibles = 50 x 20 x 5 x 50 = 250,000. Representa la cantidad de combinaciones dimensionales posibles para las claves del lado de la fuente para la estructura de claves 1.
      2. Se deben reservar 18 bits (18 bits = 262,144 combinaciones posibles).
  • Estructura de la clave 2: (Sector = seguros, inversión = <50,000, volumen de conversiones = medio)

    • R.: 4 dimensiones: Campaña (p. ej., 30 posibilidades), grupo de anuncios (p.ej., 80 posibilidades), Tipo de anuncio (p.ej., 3 posibilidades), Geo (p.ej., 50 posibilidades).
      1. Combinaciones dimensionales posibles = 30 x 80 x 3 x 50 = 360,000. Representa la cantidad de combinaciones dimensionales posibles o claves del lado de la fuente para la estructura de claves 2.
      2. Necesitas reservar 19 bits (19 bits = 524,288 combinaciones posibles).
  • Estructura clave 3: Repetición (planifica de manera similar todas las estructuras clave que tengas)

Para cada estructura de clave de agregación, las dimensiones importantes que necesitas hacer un seguimiento para las conversiones te ayudarán a determinar las claves secundarias de activación. Por ejemplo:

  • Estructura clave 1: (Sector = seguros, inversión =< USD 50,000, volumen de conversiones = bajo)

    • R.: 2 dimensiones: Categoría de producto (p. ej., 100 posibilidades), Tipo de conversión (p.ej., 5 posibilidades)
      1. Combinaciones dimensionales posibles = 100 x 5 = 500
      2. Se deben reservar 9 bits (9 bits = 512 combinaciones posibles).
  • Estructura de la clave 2: (Sector = seguros, inversión = <50,000, volumen de conversiones = medio)

    • R.: 3 dimensiones: Categoría de producto (p. ej., 50 posibilidades), Tipo de producto (10 posibilidades), Tipo de conversión (3 posibilidades)
      1. Combinaciones dimensionales posibles = 50 x 10 x 3 = 1,500
      2. Se deben reservar 11 bits (11 bits = 2,048 combinaciones posibles).
  • Estructura clave 3: Repetición (planifica de manera similar todas las estructuras clave que tengas)

Estimaciones para las claves de agregación

  • Estructura de claves 1: 250,000 claves de impresión x 500 claves de conversión = 125,000,000 de claves
  • Estructura de claves 2: 360,000 claves de impresión x 1,500 claves de conversión = 540,000,000 claves
  • Estructura clave 3: (de manera similar, planifica todas las estructuras clave que tengas)
  • Repite el proceso para cada estructura de clave
  • Cantidad máxima de claves de agregación: 540,000,000 de claves (en todas las estructuras de claves) Se deben reservar 30 bits (30 bits = 1.07 mil millones de combinaciones posibles).

Volumen de conversiones previsto

Para cada estructura de clave de agregación, el volumen previsto se puede explicar con los siguientes ejemplos:

  • Estructura clave 1: (Sector = seguros, inversión = <50,000, cantidad de conversiones = baja)
    • R.: Se prevé que la estructura clave 1 representará alrededor de USD 500,000 en inversión de los anunciantes durante el próximo trimestre, con un precio de CPM promedio de USD 8. Anticipa que esto generará 62,500,000 impresiones que se deben registrar.
    • Anticipa que el porcentaje promedio de impresiones a conversiones que constituirá la estructura clave 1 durante el próximo trimestre será del 0.08%, lo que generará 50,000 conversiones atribuidas que se deben captar. Para cada conversión, mide el valor y el recuento de compras.
  • Estructura de palabras clave 2: (Sector = seguros, inversión = < USD 50,000, volumen de conversiones = medio)
    • R.: Se prevé que la clave 2 representará alrededor de USD 800,000 en inversión durante el próximo trimestre, con un precio de CPM promedio de USD 10. Anticipa que esto generará 80,000,000 de impresiones que se deben registrar.
    • Anticipa que la tasa de conversión promedio de impresiones que representará la clave 2 durante el próximo trimestre será del 0.03125%, lo que generará 25,000 conversiones atribuidas que se deben captar. Para cada conversión, mide el valor y el recuento de compras.
  • Repite el proceso para cada estructura de clave

Frecuencia de entrega de informes y procesamiento por lotes (lote por anunciante)**

Para cada estructura de clave de agregación, necesitarás informes de conversiones que se entreguen de forma recurrente. Recomendamos que las tecnologías publicitarias realicen el procesamiento por lotes por anunciante (para una separación más clara de los datos por informe y una agregación más eficiente) y que usen el campo shared_info.scheduled_report_time del informe para el procesamiento por lotes.

  • A.: Por hora
  • B: Diaria
  • C: Semanal

Notas

  • Para el procesamiento por lotes según el anunciante, verifica los ANS con los anunciantes.
  • El procesamiento por lotes más frecuente incluirá más ruido por lote. (Consulta Decisión: Frecuencia de lotes).

  • Para evitar errores debido a la agrupación incorrecta, asegúrate de que los lotes usen el campo scheduled_report_time, no report arrival time. Por ejemplo, si creas lotes cada hora, el lote de las 11 a.m. solo debe incluir informes con scheduled_report_time entre las 10 a.m. y las 11 a.m., y no los informes que llegaron entre las 10 a.m. y las 11 a.m. con un scheduled_report_time diferente (p. ej., 9 a.m.).

Estimaciones del volumen de informes

  • Estructura de clave 1: 50,000 conversiones atribuidas / 2,160 (informes por hora, horas en un trimestre) = 24 informes de resumen por hora y por anunciante (24 x 1,000 anunciantes = 24,000 informes de resumen)
  • Estructura de clave 2: 25,000 conversiones atribuidas / 2,160 (informes por hora, horas en un trimestre) = 12 informes de resumen por hora y por anunciante (12 x 1,000 anunciantes = 12,000 informes de resumen)
  • Estructura clave 3: Repetición
  • Cantidad total de informes de resumen por hora = 24 informes de resumen para la estructura clave 1 + 12 informes de resumen para la estructura clave 2 + … = … por hora y por anunciante

Resumen de comentarios

Comprender las siguientes estimaciones de las tecnologías publicitarias nos ayuda a planificar funciones y mejoras para admitir la escala que requieren las tecnologías publicitarias. Te sugerimos que nos compartas la siguiente información. Consulta nuestros lineamientos sobre el tamaño del servicio de agregación en AWS para obtener más información:

  • Cantidad máxima de claves de dominio de entrada (claves para agregar) por trabajo del servicio de agregación
  • Cantidad máxima de informes de entrada por trabajo (conversiones atribuidas)
  • Contribuciones estimadas por informe (pares clave-valor en un informe)
  • Distribución estimada de las conversiones atribuidas por trabajo
  • Distribución estimada de las claves de dominio en un trabajo
  • Cantidad estimada de trabajos por hora, día o semana