Noiselab

Acerca de este documento

Cuando leas este documento, podrás hacer lo siguiente:

  • Comprender qué estrategias crear antes de generar informes de resumen
  • Conoce Noise Lab, una herramienta que ayuda a comprender los efectos de varios parámetros de ruido y que permite explorar y evaluar rápidamente varias estrategias de administración de ruido.
Captura de pantalla de Noise Lab.
Noise Lab

Comparte tus comentarios

Si bien en este documento se resumen algunos principios para trabajar con informes de resumen, existen varios enfoques para la administración del ruido que es posible que no se reflejen aquí. Agradecemos tus sugerencias, incorporaciones y preguntas.

  • Para enviar comentarios públicos sobre las estrategias de administración de ruido, la utilidad o la privacidad de la API (epsilon) y compartir tus observaciones cuando realices simulaciones con Noise Lab, comenta este problema.
  • Para enviar comentarios públicos en Noise Lab (hacer una pregunta, informar un error o solicitar una función), crea un problema nuevo aquí.
  • Para enviar comentarios públicos sobre otro aspecto de la API, crea un problema nuevo aquí.

Antes de comenzar

  1. Para obtener una introducción, lee Attribution Reporting: informes de resumen y Descripción general del sistema completo de Attribution Reporting.
  2. Consulta Cómo comprender el ruido y Cómo comprender las claves de agregación para aprovechar al máximo esta guía.

Decisiones de diseño

Principio de diseño principal

Existen diferencias fundamentales entre el funcionamiento de las cookies de terceros y los informes de resumen. Una diferencia clave es el ruido que se agrega a los datos de medición en los informes de resumen. Otro es cómo se programan los informes.

Para acceder a los datos de medición del informe de resumen con relaciones señal/ruido más altas, las plataformas orientadas a la demanda (DSP) y los proveedores de medición de anuncios deberán trabajar con sus anunciantes para desarrollar estrategias de administración de ruido. Para desarrollar estas estrategias, las DSP y los proveedores de medición deben tomar decisiones de diseño. Estas decisiones giran en torno a un concepto esencial:

Si bien los valores de ruido de la distribución se extraen, en términos absolutos, solo dependen de dos parámetros⏤epsilon y el presupuesto de contribución⏤, tienes a tu disposición varios otros controles que afectarán las relaciones señal-ruido de tus datos de medición de salida.

Si bien esperamos que un proceso iterativo lleve a las mejores decisiones, cada variación de estas decisiones llevará a una implementación ligeramente diferente. Por lo tanto, estas decisiones deben tomarse antes de escribir cada iteración de código (y antes de publicar anuncios).

Decisión: Nivel de detalle de las dimensiones

Pruébala en Noise Lab

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca Tus datos de conversiones.
  3. Observa los parámetros predeterminados. De forma predeterminada, el recuento TOTAL de conversiones atribuibles diarias es de 1,000. Esto da un promedio de alrededor de 40 por bucket si usas la configuración predeterminada (dimensiones predeterminadas, cantidad predeterminada de valores diferentes posibles para cada dimensión, estrategia clave A). Observa que el valor es 40 en la entrada Cantidad diaria promedio de conversiones atribuibles por BUCKET.
  4. Haz clic en Simular para ejecutar una simulación con los parámetros predeterminados.
  5. En el panel lateral Parámetros, busca Dimensiones. Cambia el nombre de Geografía a Ciudad y cambia la cantidad de valores diferentes posibles a 50.
  6. Observa cómo esto cambia el recuento promedio diario de conversiones atribuibles por BUCKET. Ahora es mucho más bajo. Esto se debe a que, si aumentas la cantidad de valores posibles dentro de esta dimensión sin cambiar nada más, aumentas la cantidad total de segmentos sin cambiar la cantidad de eventos de conversión que se incluirán en cada uno.
  7. Haz clic en Simular.
  8. Observa las relaciones de ruido de la simulación resultante: ahora son más altas que las de la simulación anterior.

Dado el principio de diseño principal, es probable que los valores de resumen pequeños sean más ruidosos que los valores de resumen grandes. Por lo tanto, tu elección de configuración afecta la cantidad de eventos de conversión atribuidos que terminan en cada bucket (también conocido como tu clave de agregación), y esa cantidad afecta el ruido en los informes de resumen de resultados finales.

Una decisión de diseño que afecta la cantidad de eventos de conversión atribuidos dentro de un solo bucket es el nivel de detalle de las dimensiones. Considera los siguientes ejemplos de claves de agregación y sus dimensiones:

  • Enfoque 1: Una estructura de clave con dimensiones generales: País × Campaña de anuncios (o el bucket de agregación de campañas más grande) × Tipo de producto (de 10 tipos de productos posibles)
  • Enfoque 2: Una estructura de claves con dimensiones detalladas: Ciudad × ID de creatividad × Producto (de 100 productos posibles)

Ciudad es una dimensión más detallada que País, ID de creatividad es más detallada que Campaña y Producto es más detallada que Tipo de producto. Por lo tanto, el enfoque 2 tendrá una menor cantidad de eventos (conversiones) por bucket (= por clave) en el resultado del informe de resumen que el enfoque 1. Dado que el ruido agregado al resultado es independiente de la cantidad de eventos en el bucket, los datos de medición en los informes de resumen tendrán más ruido con el enfoque 2. Para cada anunciante, experimenta con varias compensaciones de nivel de detalle en el diseño de la clave para obtener la máxima utilidad en los resultados.

Decisión: Estructuras clave

Pruébala en Noise Lab

En el modo Simple, se usa la estructura de claves predeterminada. En el modo avanzado, puedes experimentar con diferentes estructuras de claves. Se incluyen algunas dimensiones de ejemplo, que también puedes modificar.

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca Estrategia clave. Observa que la estrategia predeterminada, denominada A en la herramienta, usa una estructura de claves detallada que incluye todas las dimensiones: ubicación geográfica × ID de campaña × categoría de producto.
  3. Haz clic en Simular.
  4. Observa las relaciones de ruido de la simulación resultante.
  5. Cambia la estrategia de claves a B. Se mostrarán controles adicionales para que configures tu estructura de claves.
  6. Configura tu estructura de claves, p.ej., de la siguiente manera:
    1. Cantidad de estructuras clave: 2
    2. Estructura de claves 1 = Ubicación geográfica × Categoría de producto.
    3. Estructura clave 2 = ID de la campaña × Categoría de producto
  7. Haz clic en Simular.
  8. Observa que ahora obtienes dos informes de resumen por tipo de objetivo de medición (dos para el recuento de compras y dos para el valor de compra), ya que usas dos estructuras de claves distintas. Observa sus relaciones de ruido.
  9. También puedes probar esto con tus propias dimensiones personalizadas. Para ello, busca los datos de los que deseas hacer un seguimiento: Dimensiones. Considera quitar las dimensiones de ejemplo y crear las tuyas propias con los botones Agregar, Quitar o Restablecer debajo de la última dimensión.

Otra decisión de diseño que afectará la cantidad de eventos de conversión atribuidos dentro de un solo bucket son las estructuras de claves que decidas usar. Considera los siguientes ejemplos de claves de agregación:

  • Una estructura de claves con todas las dimensiones; llamemos a esta estrategia clave A.
  • Dos estructuras clave, cada una con un subconjunto de dimensiones; llamemos a esto estrategia clave B.
Diagrama: Buckets para las estrategias clave A y B.

La estrategia A es más simple, pero es posible que debas consolidar (sumar) los valores de resumen con ruido incluidos en los informes de resumen para acceder a ciertas estadísticas. Cuando sumas estos valores, también sumas el ruido. Con la estrategia B, es posible que los valores de resumen que se muestran en los informes de resumen ya te proporcionen la información que necesitas. Esto significa que es probable que la estrategia B genere mejores relaciones señal/ruido que la estrategia A. Sin embargo, es posible que el ruido ya sea aceptable con la estrategia A, por lo que puedes decidir favorecerla por motivos de simplicidad. Obtén más información en el ejemplo detallado que describe estas dos estrategias.

La administración de claves es un tema extenso. Se pueden considerar varias técnicas elaboradas para mejorar las relaciones señal/ruido. Uno se describe en Administración de claves avanzada.

Decisión: Frecuencia de lotes

Pruébala en Noise Lab

  1. Ve al modo Simple (o al modo Avanzado, ya que ambos funcionan de la misma manera en lo que respecta a la frecuencia de lotes).
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Frecuencia de lotes. Esto hace referencia a la frecuencia por lotes de los informes agregables que se procesan con el servicio de agregación en una sola tarea.
  3. Observa la frecuencia de lotes predeterminada: De forma predeterminada, se simula una frecuencia de lotes diaria.
  4. Haz clic en Simular.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Cambia la frecuencia de lotes a semanal.
  7. Observa las relaciones de ruido de la simulación resultante: ahora son más bajas (mejores) que las de la simulación anterior.

Otra decisión de diseño que afectará la cantidad de eventos de conversión atribuidos dentro de un solo bucket es la frecuencia de lotes que decidas usar. La frecuencia de lotes es la frecuencia con la que se procesan los informes agregables.

Un informe que se programe para la agregación con mayor frecuencia (p.ej., cada hora) incluirá menos eventos de conversión que el mismo informe con un programa de agregación menos frecuente (p.ej., cada semana). Como resultado, el informe por hora incluirá más ruido.``` incluye menos eventos de conversión que el mismo informe con un programa de agregación menos frecuente (p.ej., cada semana). Como resultado, el informe por hora tendrá una relación señal-ruido más baja que el informe semanal, en igualdad de condiciones. Experimenta con los requisitos de informes en varias frecuencias y evalúa las relaciones señal/ruido de cada una.

Obtén más información en Batching y Aggregating over longer time periods.

Decisión: Variables de la campaña que afectan las conversiones atribuibles

Pruébala en Noise Lab

Si bien esto puede ser difícil de predecir y puede tener variaciones significativas, además de los efectos de la estacionalidad, intenta estimar la cantidad diaria de conversiones atribuibles a un solo contacto en la potencia de 10 más cercana: 10, 100,1, 000 o 10,000.

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca Tus datos de conversiones.
  3. Observa los parámetros predeterminados. De forma predeterminada, el recuento TOTAL de conversiones atribuibles diarias es de 1,000. Esto da un promedio de alrededor de 40 por bucket si usas la configuración predeterminada (dimensiones predeterminadas, cantidad predeterminada de valores diferentes posibles para cada dimensión, estrategia clave A). Observa que el valor es 40 en la entrada Cantidad diaria promedio de conversiones atribuibles por BUCKET.
  4. Haz clic en Simular para ejecutar una simulación con los parámetros predeterminados.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Ahora, establece el recuento TOTAL de conversiones atribuibles diarias en 100. Observa que esto reduce el valor de la cantidad promedio diaria de conversiones atribuibles por BUCKET.
  7. Haz clic en Simular.
  8. Observa que las relaciones de ruido ahora son más altas: esto se debe a que, cuando tienes menos conversiones por bucket, se aplica más ruido para mantener la privacidad.

Una distinción importante es la cantidad total de conversiones posibles para un anunciante en comparación con la cantidad total de conversiones atribuidas posibles. Lo último es lo que, en última instancia, afecta el ruido en los informes de resumen. Las conversiones atribuidas son un subconjunto de las conversiones totales que están sujetas a variables de la campaña, como el presupuesto y la segmentación de anuncios. Por ejemplo, se espera una cantidad mayor de conversiones atribuidas para una campaña publicitaria de USD 10 millones en comparación con una campaña publicitaria de USD 10,000, si todo lo demás es igual.

Ten en cuenta lo siguiente:

  • Evalúa las conversiones atribuidas en función de un modelo de atribución de un solo toque y en el mismo dispositivo, ya que estos se encuentran dentro del alcance de los informes de resumen recopilados con la API de Attribution Reporting.
  • Considera un registro de casos extremos y un registro de casos ideales para las conversiones atribuidas. Por ejemplo, si todo lo demás es igual, considera los presupuestos mínimos y máximos posibles de la campaña para un anunciante y, luego, proyecta las conversiones atribuibles para ambos resultados como entradas en tu simulación.
  • Si estás considerando usar Privacy Sandbox de Android, ten en cuenta las conversiones atribuidas multiplataforma en el cálculo.

Decisión: Usar el escalamiento

Pruébala en Noise Lab

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Escalamiento. De forma predeterminada, está configurado en Sí.
  3. Para comprender los efectos positivos del escalamiento en la proporción de ruido, primero establece la escala en No.
  4. Haz clic en Simular.
  5. Observa las relaciones de ruido de la simulación resultante.
  6. Establece el parámetro de escalamiento en Sí. Ten en cuenta que Noise Lab calcula automáticamente los factores de escala que se usarán según los rangos (valores promedio y máximo) de los objetivos de medición de tu situación. En una configuración real de prueba del sistema o del origen, te recomendamos que implementes tu propio cálculo para los factores de escalamiento.
  7. Haz clic en Simular.
  8. Observa que las relaciones de ruido ahora son más bajas (mejores) en esta segunda simulation. Esto se debe a que usas el escalamiento.

Dado el principio de diseño principal, el ruido agregado es una función del presupuesto de contribución.

Por lo tanto, para aumentar las relaciones señal/ruido, puedes transformar los valores recopilados durante un evento de conversión ajustándolos en función del presupuesto de contribución (y desajustándolos después de la agregación). Usa el escalamiento para aumentar las relaciones señal-ruido.

Decisión: Cantidad de objetivos de medición y división del presupuesto de privacidad

Esto se relaciona con el escalamiento. Asegúrate de leer Cómo usar el escalamiento.

Pruébala en Noise Lab

Un objetivo de medición es un dato distinto que se recopila en los eventos de conversión.

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca los datos de los que deseas hacer un seguimiento: Objetivos de medición. De forma predeterminada, tienes dos objetivos de medición: valor de compra y recuento de compras.
  3. Haz clic en Simular para ejecutar una simulación con los objetivos predeterminados.
  4. Haz clic en Quitar. Esta acción quitará el último objetivo de medición (recuento de compras en ese caso).
  5. Haz clic en Simular.
  6. Observa que las relaciones de ruido para el valor de compra ahora son más bajas (mejores) para esta segunda simulación. Esto se debe a que tienes menos objetivos de medición, por lo que tu único objetivo de medición ahora recibe todo el presupuesto de contribución.
  7. Haz clic en Restablecer. Ahora tienes dos objetivos de medición: el valor de compra y el recuento de compras. Ten en cuenta que Noise Lab calcula automáticamente los factores de escala que se usarán según los rangos (valores promedio y máximo) de los objetivos de medición de tu caso. De forma predeterminada, Noise Lab divide el presupuesto de forma equitativa entre los objetivos de medición.
  8. Haz clic en Simular.
  9. Observa las relaciones de ruido de la simulación resultante. Anota los factores de escalamiento que se muestran en la simulación.
  10. Ahora, personalicemos la división del presupuesto de privacidad para lograr mejores relaciones señal-ruido.
  11. Ajusta el porcentaje de presupuesto asignado para cada objetivo de medición. Dado que los parámetros predeterminados, el objetivo de medición 1, es decir, el valor de compra, tiene un rango mucho más amplio (entre 0 y 1,000) que el objetivo de medición 2, es decir, el recuento de compras (entre 1 y 1, es decir, siempre igual a 1). Debido a esto, necesita "más espacio para escalar": lo ideal sería asignar más presupuesto de contribución al objetivo de medición 1 que al objetivo de medición 2, de modo que se pueda escalar de manera más eficiente (consulta Escalamiento).
  12. Asigna el 70% del presupuesto al objetivo de medición 1. Asigna el 30% al objetivo de medición 2.
  13. Haz clic en Simular.
  14. Observa las relaciones de ruido de la simulación resultante. En el caso del valor de compra, las relaciones de ruido ahora son notablemente más bajas (mejores) que en la simulación anterior. En el caso del recuento de compras, no se modifican.
  15. Sigue ajustando la división del presupuesto entre las métricas. Observa cómo esto afecta al ruido.

Ten en cuenta que puedes establecer tus propios objetivos de medición personalizados con los botones para agregar, quitar o restablecer.


Si mides un dato (objetivo de medición) en un evento de conversión, como el recuento de conversiones, ese dato puede obtener todo el presupuesto de contribución (65,536). Si estableces varios objetivos de medición en un evento de conversión, como el recuento de conversiones y el valor de compra, esos datos deberán compartir el presupuesto de contribución. Esto significa que tienes menos margen para aumentar tus valores.

Por lo tanto, cuantos más objetivos de medición tengas, es probable que las relaciones señal-ruido sean más bajas (mayor ruido).

Otra decisión que debes tomar con respecto a los objetivos de medición es la división del presupuesto. Si divides el presupuesto de contribución por igual entre dos datos, cada uno obtiene un presupuesto de 65536/2 = 32768. Esto puede ser óptimo o no, según el valor máximo posible para cada dato. Por ejemplo, si mides el recuento de compras que tiene un valor máximo de 1 y el valor de compra con un mínimo de 1 y un máximo de 120, el valor de compra se beneficiaría de tener "más espacio" para aumentar, es decir, para obtener una proporción mayor del presupuesto de contribución. Verás si algunos objetivos de medición deben priorizarse sobre otros en relación con el impacto del ruido.

Decisión: Administración de valores atípicos

Pruébala en Noise Lab

Un objetivo de medición es un dato distinto que se recopila en los eventos de conversión.

  1. Ve al modo avanzado.
  2. En el panel lateral Parámetros, busca Tu estrategia de agregación > Escalamiento.
  3. Asegúrate de que la escala esté configurada como Sí. Ten en cuenta que Noise Lab calcula automáticamente los factores de escala que se usarán, según los rangos (valores promedio y máximos) que hayas indicado para los objetivos de medición.
  4. Supongamos que la compra más grande que se realizó fue de USD 2,000, pero que la mayoría de las compras se realizan en el rango de USD 10 a USD 120. Primero, veamos qué sucede si usamos un enfoque de escalamiento literal (no recomendado): ingresa USD 2,000 como el valor máximo para purchaseValue.
  5. Haz clic en Simular.
  6. Observa que las relaciones de ruido son altas. Esto se debe a que, actualmente, nuestro factor de escalamiento se calcula en función de USD 2,000, cuando, en realidad, la mayoría de los valores de compra serán mucho más bajos.
  7. Ahora, usemos un enfoque de escalamiento más pragmático. Cambia el valor máximo de compra a USD 120.
  8. Haz clic en Simular.
  9. Observa que las relaciones de ruido son más bajas (mejores) en esta segunda simulación.

Para implementar el escalamiento, por lo general, se calcula un factor de escalamiento en función del valor máximo posible para un evento de conversión determinado (obtén más información en este ejemplo).

Sin embargo, evita usar un valor máximo literal para calcular ese factor de escalamiento, ya que esto empeoraría tus relaciones señal/ruido. En su lugar, quita los valores atípicos y usa un valor máximo pragmático.

La administración de valores atípicos es un tema extenso. Se pueden considerar varias técnicas elaboradas para mejorar las relaciones señal/ruido. Uno se describe en Administración avanzada de valores extremos.

Próximos pasos

Ahora que evaluaste varias estrategias de administración de ruido para tu caso de uso, está todo listo para que comiences a experimentar con los informes de resumen recopilando datos de medición reales a través de una prueba de origen. Revisa las guías y sugerencias para probar la API.

Apéndice

Recorrido rápido por Noise Lab

Noise Lab te ayuda a evaluar y comparar rápidamente las estrategias de administración del ruido. Puedes usarlo para lo siguiente:

  • Comprende los parámetros principales que pueden afectar el ruido y el efecto que tienen.
  • Simula el efecto del ruido en los datos de medición de salida según diferentes decisiones de diseño. Ajusta los parámetros de diseño hasta que alcances una relación señal/ruido que funcione para tu caso de uso.
  • Comparte tus comentarios sobre la utilidad de los informes de resumen: ¿qué valores de los parámetros de epsilon y ruido funcionan para ti y cuáles no? ¿Dónde están los puntos de inflexión?

Piensa en esto como un paso de preparación. Noise Lab genera datos de medición para simular los resultados de los informes de resumen en función de tu entrada. No conserva ni comparte datos.

Hay dos modos diferentes en Noise Lab:

  1. Modo simple: Comprende los aspectos básicos de los controles que tienes sobre el ruido.
  2. Modo avanzado: Prueba diferentes estrategias de administración de ruido y evalúa cuál genera las mejores relaciones señal/ruido para tus casos de uso.

Haz clic en los botones del menú de la parte superior para alternar entre los dos modos (paso 1 en la captura de pantalla que aparece a continuación).

Modo simple
  • Con el modo Simple, controlas los parámetros (que se encuentran en el lado izquierdo o en el paso 2 de la captura de pantalla que aparece a continuación), como Epsilon, y ves cómo afectan el ruido.
  • Cada parámetro tiene una información sobre herramientas (un botón "?"). Haz clic en ellos para ver una explicación de cada parámetro (nº 3 en la captura de pantalla que aparece a continuación).
  • Para comenzar, haz clic en el botón “Simular” y observa cómo se ve el resultado (paso 4 en la captura de pantalla que aparece a continuación).
  • En la sección Salida, puedes ver una variedad de detalles. Algunos elementos tienen un "?" junto a ellos. Tómate el tiempo para hacer clic en cada signo de interrogación para ver una explicación de los diversos datos.
  • En la sección Salida, haz clic en el botón de activación Detalles si deseas ver una versión expandida de la tabla (paso 5 en la captura de pantalla que aparece a continuación).
  • Debajo de cada tabla de datos en la sección de resultados, hay una opción para descargar la tabla para usarla sin conexión. Además, en la esquina inferior derecha, hay una opción para descargar todas las tablas de datos (nº 6 en la captura de pantalla que aparece a continuación).
  • Prueba diferentes parámetros de configuración en la sección Parámetros y haz clic en Simular para ver cómo afectan el resultado:
    Interfaz de Noise Lab para el modo Simple.
    Interfaz de Noise Lab para el modo Simple.
Modo avanzado
  • En el modo avanzado, tienes más control sobre los parámetros. Puedes agregar dimensiones y objetivos de medición personalizados (nº 1 y 2 en la captura de pantalla que aparece a continuación).
  • Desplázate hacia abajo en la sección Parámetros y consulta la opción Estrategia clave. Esto se puede usar para probar diferentes estructuras de claves (nº 3 en la captura de pantalla que aparece a continuación).
    • Para probar diferentes estructuras de claves, cambia la estrategia de claves a "B".
    • Ingresa la cantidad de estructuras de claves diferentes que deseas usar (el valor predeterminado se establece en “2”).
    • Haz clic en Generar estructuras de claves.
    • Haz clic en las casillas de verificación junto a las claves que deseas incluir para cada estructura de claves para ver las opciones para especificar tus estructuras de claves.
    • Haz clic en Simular para ver el resultado.
      El modo avanzado ofrece controles para los objetivos de medición y las dimensiones de seguimiento, que se destacan en la barra lateral.
      Interfaz de Noise Lab para el modo avanzado.
      El modo avanzado también tiene una opción de estrategia clave en la sección Parámetros de la barra lateral.
      Interfaz de Noise Lab para el modo avanzado.

Métricas de ruido

Concepto principal

Se agrega ruido para proteger la privacidad de los usuarios individuales.

Un valor de ruido alto indica que los buckets o las claves son dispersos y contienen contribuciones de una cantidad limitada de eventos sensibles. Noise Lab lo hace automáticamente para permitir que las personas se “oculten entre la multitud”, o, en otras palabras, protege la privacidad de estas personas limitadas con una mayor cantidad de ruido agregado.

Un valor de ruido bajo indica que la configuración de los datos se diseñó de una manera que ya permite que las personas “se escondan entre la multitud”. Esto significa que los buckets contienen contribuciones de una cantidad suficiente de eventos para garantizar que se proteja la privacidad de los usuarios individuales.

Esta afirmación es válida tanto para el error porcentual promedio (APE) como para RMSRE_T (error relativo raíz cuadrada del error cuadrático medio con un umbral).

APE (error porcentual promedio)

El APE es la relación entre el ruido y la señal, es decir, el valor de resumen real.p> Los valores más bajos de APE significan mejores relaciones señal/ruido.

Formula

Para un informe de resumen determinado, el APE se calcula de la siguiente manera:

La ecuación de APE. Se requieren valores absolutos, ya que el ruido puede ser negativo.

True es el valor de resumen verdadero. El APE es el promedio del ruido sobre cada valor de resumen verdadero, promediado en todas las entradas de un informe de resumen. En Noise Lab, este valor se multiplica por 100 para obtener un porcentaje.

Ventajas y desventajas

Los buckets con tamaños más pequeños tienen un impacto desproporcionado en el valor final de APE. Eso podría ser engañoso cuando se evalúa el ruido. Por este motivo, agregamos otra métrica, RMSRE_T, que está diseñada para mitigar esta limitación de la APE. Revisa los ejemplos para obtener más detalles.

Código

Revisa el código fuente para el cálculo del APE.

RMSRE_T (error relativo raíz cuadrada de la media con un umbral)

RMSRE_T (error relativo raíz cuadrada del error cuadrático medio con un umbral) es otra medida del ruido.

Cómo interpretar RMSRE_T

Los valores más bajos de RMSRE_T significan mejores relaciones señal/ruido.
Por ejemplo, si una relación de ruido aceptable para tu caso de uso es del 20% y RMSRE_T es 0.2, puedes estar seguro de que los niveles de ruido se encuentran dentro del rango aceptable.

Formula

Para un informe de resumen determinado, RMSRE_T se calcula de la siguiente manera:

Formula
La ecuación para RMSRE_T. Se requieren valores absolutos, ya que el ruido puede ser negativo.
Pros y contras

RMSRE_T es un poco más complejo de entender que APE. Sin embargo, tiene algunas ventajas que, en algunos casos, lo hacen más adecuado que el APE para analizar el ruido en los informes de resumen:

  • RMSRE_T es más estable. "T" es un umbral. "T" se usa para dar menos importancia en el cálculo de RMSRE_T a los buckets que tienen menos conversiones y, por lo tanto, son más sensibles al ruido debido a su tamaño pequeño. Con T, la métrica no aumenta repentinamente en los intervalos con pocas conversiones. Si T es igual a 5, un valor de ruido tan pequeño como 1 en un bucket con 0 conversiones no se mostrará como muy superior a 1. En cambio, se limitará a 0.2, que equivale a 1/5, ya que T es igual a 5. Dado que se le da menos importancia a los buckets más pequeños, que son más sensibles al ruido, esta métrica es más estable y, por lo tanto, facilita la comparación de dos simulaciones.
  • RMSRE_T permite una agregación sencilla. Conocer el RMSRE_T de varios buckets, junto con sus recuentos reales, te permite calcular el RMSRE_T de su suma. Esto también te permite optimizar RMSRE_T para estos valores combinados.

Si bien la agregación es posible para APE, la fórmula es bastante complicada, ya que implica el valor absoluto de la suma de los ruidos de Laplace. Esto dificulta la optimización de APE.

Código

Revisa el código fuente para el cálculo de RMSRE_T.

Ejemplos

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Informe de resumen con tres segmentos:

  • bucket_1 = ruido: 10, trueSummaryValue: 100
  • bucket_2 = ruido: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + Infinity) / 3 = Infinity

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Administración avanzada de claves

Una DSP o una empresa de medición de anuncios puede tener miles de clientes de publicidad globales, que abarcan varios sectores, monedas y precios de compra potenciales. Esto significa que crear y administrar una clave de agregación por anunciante probablemente no sea muy práctico. Además, será un desafío seleccionar un valor máximo agregable y un presupuesto de agregación que pueda limitar el impacto del ruido en estos miles de anunciantes globales. En su lugar, consideremos las siguientes situaciones:

Estrategia clave A

El proveedor de tecnología publicitaria decide crear y administrar una clave para todos sus clientes publicitarios. En todos los anunciantes y todas las monedas, el rango de compras varía desde compras de alta gama con bajo volumen hasta compras de baja gama con alto volumen. Esto genera la siguiente clave:

Clave (varias monedas)
Valor máximo agregable 5,000,000
Rango de valores de compra [120 - 5000000]
Estrategia clave B

El proveedor de tecnología publicitaria decide crear y administrar dos claves en todos sus clientes de publicidad. Deciden separar las claves por moneda. En todos los anunciantes y todas las monedas, el rango de compras varía desde compras de alta gama con volumen bajo hasta compras de gama baja con volumen alto. Si se separan por moneda, se crean 2 claves:

Clave 1 (USD) Clave 2 (¥)
Valor máximo agregable $40,000 ¥5,000,000
Rango de valores de compra [120 - 40,000] [15,000 - 5,000,000]

La estrategia clave B tendrá menos ruido en su resultado que la estrategia clave A, ya que los valores de las monedas no se distribuyen de forma uniforme entre las monedas. Por ejemplo, ten en cuenta cómo las compras denominadas en ¥ combinadas con las compras denominadas en USD alterarán los datos subyacentes y el resultado con ruido resultante.

Estrategia clave C

El proveedor de tecnología publicitaria decide crear y administrar cuatro claves en todos sus clientes publicitarios, y separarlas por moneda y sector del anunciante:

Clave 1
(USD x anunciantes de joyas de alta gama)
Clave 2
(¥ x anunciantes de joyas de alta gama)
Clave 3
(USD x anunciantes minoristas de ropa)
Clave 4
(¥ x anunciantes minoristas de ropa)
Valor máximo agregable $40,000 ¥5,000,000 USD 500 ¥65,000
Rango de valores de compra [10,000 - 40,000] [1,250,000 - 5,000,000] [120 - 500] [15,000 - 65,000]

La estrategia clave C tendrá menos ruido en su resultado que la estrategia clave B, ya que los valores de compra del anunciante no se distribuyen de forma uniforme entre los anunciantes. Por ejemplo, considera cómo las compras de joyas de alta gama combinadas con las compras de sombreros de béisbol alterarán los datos subyacentes y el resultado ruidoso resultante.

Considera crear valores agregados máximos y factores de escalamiento compartidos para los aspectos comunes entre varios anunciantes para reducir el ruido en el resultado. Por ejemplo, podrías experimentar con las siguientes estrategias para tus anunciantes:

  • Una estrategia separada por moneda (USD, ¥, CAD, etcétera)
  • Una estrategia separada por industria del anunciante (seguros, automóviles, venta minorista, etc.)
  • Una estrategia separada por rangos de valor de compra similares ([100], [1,000], [10,000], etc.)

Cuando se crean estrategias clave en torno a las características comunes de los anunciantes, las claves y el código correspondiente son más fáciles de administrar, y las relaciones señal/ruido aumentan. Experimenta con diferentes estrategias con diferentes puntos en común de los anunciantes para descubrir puntos de inflexión en la maximización del impacto del ruido en comparación con la administración de código.


Administración avanzada de valores extremos

Analicemos una situación en la que participan dos anunciantes:

  • Anunciante A:
    • En todos los productos del sitio del anunciante A, las posibilidades de precio de compra están entre [$120 - $1,000] , con un rango de USD 880.
    • Los precios de compra se distribuyen de manera uniforme en el rango de USD 880, sin valores atípicos fuera de dos desviaciones estándar del precio de compra promedio.
  • Anunciante B:
    • En todos los productos del sitio del anunciante B, las posibilidades de precio de compra están entre [$120 - $1,000] , con un rango de USD 880.
    • Los precios de compra se inclinan en gran medida hacia el rango de USD 120 a USD 500, y solo el 5% de las compras se produce en el rango de USD 500 a USD 1,000.

Teniendo en cuenta los requisitos del presupuesto de contribución y la metodología con la que se aplica el ruido a los resultados finales, el anunciante B, de forma predeterminada, tendrá un resultado más ruidoso que el anunciante A, ya que tiene un mayor potencial de que los valores atípicos afecten los cálculos subyacentes.

Es posible mitigar esto con una configuración de claves específica. Prueba estrategias clave que ayuden a administrar los datos de valores atípicos y a distribuir los valores de compra de manera más uniforme en el rango de compra de la clave.

Para el anunciante B, puedes crear dos claves independientes para capturar dos intervalos de valores de compra diferentes. En este ejemplo, la tecnología publicitaria observó que los valores extremos aparecen por encima del valor de compra de USD 500. Intenta implementar dos claves independientes para este anunciante:

  • Estructura de claves 1 : Clave que solo captura compras entre los USD 120 y los USD 500 (abarca aproximadamente el 95% del volumen total de compras).
  • Estructura de claves 2: Clave que solo captura compras superiores a USD 500 (abarca alrededor del 5% del volumen total de compras).

La implementación de esta estrategia clave debería administrar mejor el ruido para el anunciante B y ayudarlo a maximizar la utilidad de los informes de resumen. Dado que los nuevos rangos son más pequeños, la clave A y la clave B ahora deberían tener una distribución más uniforme de los datos en cada clave respectiva que para la clave única anterior. Esto generará un menor impacto de ruido en el resultado de cada clave que en la clave única anterior.