Comprendere il rumore nei report di riepilogo

Scopri cosa significa rumore, dove viene aggiunto e come influisce sui tuoi sforzi di misurazione.

I report di riepilogo sono il risultato dell'aggregazione dei report aggregabili. Quando i report aggregabili vengono raggruppati in batch da un raccoglitore ed elaborati dal servizio di aggregazione, ai report di riepilogo risultanti viene aggiunto del rumore, ovvero una quantità casuale di dati. Il rumore viene aggiunto per proteggere la privacy degli utenti. L'obiettivo di questo meccanismo è disporre di un framework in grado di supportare la misurazione differenzialmente privata.

Il rumore viene aggiunto nel report di riepilogo finale.
Il rumore viene aggiunto nel report di riepilogo finale.

Introduzione al rumore nei report di riepilogo

Sebbene l'aggiunta di rumore non faccia parte della misurazione degli annunci, in molti casi il rumore aggiunto non cambia in modo sostanziale l'interpretazione dei risultati.

Può essere utile pensare in questo modo: Prenderesti una decisione basata su un determinato dato se questo non fosse rumoroso?

Ad esempio, un inserzionista si sentirebbe sicuro di modificare la strategia o i budget della campagna in base al fatto che la campagna A ha generato 15 conversioni e la campagna B 16?

Se la risposta è no, il rumore è irrilevante.

Quello che devi fare è configurare l'utilizzo dell'API in modo che:

  1. La risposta alla domanda è sì.
  2. Il rumore viene gestito in modo da non influire in modo significativo sulla tua capacità di prendere una decisione in base a determinati dati. Puoi procedere nel seguente modo: per un numero minimo previsto di conversioni, vuoi mantenere il rumore nella metrica raccolta al di sotto di una determinata percentuale.

In questa sezione e nella successiva, descriveremo le strategie per raggiungere il punto 2.

Concetti principali

Il servizio di aggregazione aggiunge rumore una volta a ogni valore di riepilogo, ovvero una volta per chiave, ogni volta che viene richiesto un report di riepilogo.

Questi valori di rumore vengono estratti in modo casuale da una distribuzione di probabilità specifica, come segue.

Tutti gli elementi che influiscono sul rumore si basano su due concetti principali.

  1. La distribuzione del rumore (dettagli di seguito) è la stessa indipendentemente dal valore del riepilogo, basso o alto. Pertanto, maggiore è il valore del riepilogo, minore è l'impatto che il rumore potrebbe avere, rispetto a questo valore.

    Ad esempio, supponiamo che un valore di acquisto aggregato totale di 20.000 $e un valore di acquisto aggregato totale di 200 $siano soggetti a rumore selezionato dalla stessa distribuzione.

    Supponiamo che il rumore di questa distribuzione vari approssimativamente tra -100 e +100.

    • Per il valore di acquisto riepilogativo di 20.000 $, il rumore varia tra 0 e 100/20.000=0,5%.
    • Per il valore di acquisto riepilogativo di 200 $, il rumore varia tra 0 e 100/200=50%.

    Pertanto, il rumore avrà probabilmente un impatto minore sul valore di acquisto aggregato di 20.000 $rispetto al valore di 200 $. In termini relativi, è probabile che 20.000 $ siano meno rumorosi, ovvero che abbiano un rapporto segnale/rumore più elevato.

    I valori aggregati più elevati hanno un impatto del rumore relativamente inferiore.
    I valori aggregati più elevati hanno un impatto del rumore relativamente inferiore.

    Ciò ha alcune importanti implicazioni pratiche che vengono descritte nella sezione successiva. Questo meccanismo fa parte della progettazione dell'API e le implicazioni pratiche sono a lungo termine. Continueranno a svolgere un ruolo importante quando le tecnologie pubblicitarie progetteranno e valuteranno varie strategie di aggregazione.

  2. Sebbene il rumore venga estratto dalla stessa distribuzione indipendentemente dal valore di riepilogo, questa distribuzione dipende da diversi parametri. Uno di questi parametri, epsilon, potrebbe essere stato modificato dalle tecnologie pubblicitarie durante la prova dell'origine conclusa per valutare vari aggiustamenti di utilità/privacy. Tuttavia, considera la possibilità di modificare epsilon come temporanea. Il tuo feedback sui casi d'uso e sui valori di epsilon che funzionano bene è sempre gradito.

Sebbene un'azienda di ad tech non controlli direttamente i modi in cui viene aggiunto il rumore, può influenzare l'impatto del rumore sui suoi dati di misurazione. Nelle sezioni successive, vedremo come il rumore può essere influenzato nella pratica.

Prima di farlo, diamo un'occhiata più da vicino al modo in cui viene applicato il rumore.

Zoom avanti: come viene applicato il rumore

Una distribuzione del rumore

Il rumore viene estratto dalla distribuzione di Laplace, con i seguenti parametri:

  • Una media (μ) di 0. Ciò significa che il valore di rumore più probabile è 0 (nessun rumore aggiunto) e che il valore con rumore ha la stessa probabilità di essere inferiore o superiore al valore originale (a volte questa proprietà viene chiamata non distorta).
  • Un parametro di scala dib = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET è definito nel browser.
    • epsilon viene utilizzato nel servizio di aggregazione.

Il seguente diagramma mostra la funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20:

Funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20
Funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20

Valori di rumore casuale, una distribuzione del rumore

Supponiamo che una tecnologia pubblicitaria richieda report di riepilogo per due chiavi di aggregazione, key1 e key2.

Il servizio di aggregazione seleziona due valori di rumore x1 e x2, seguendo la stessa distribuzione del rumore. x1 viene aggiunto al valore di riepilogo per key1 e x2 viene aggiunto al valore di riepilogo per key2.

Nei diagrammi, rappresenteremo i valori di rumore come identici. Si tratta di una semplificazione; in realtà, i valori di rumore variano, in quanto vengono estratti in modo casuale dalla distribuzione.

Ciò dimostra che tutti i valori di rumore provengono dalla stessa distribuzione e sono indipendenti dal valore di riepilogo a cui vengono applicati.

Altre proprietà del rumore

Il rumore viene applicato a ogni valore di riepilogo, inclusi quelli vuoti (0).

Anche i valori di riepilogo vuoti sono soggetti a rumore.
Anche i valori di riepilogo vuoti sono soggetti a rumore.

Ad esempio, anche se il valore di riepilogo effettivo per una determinata chiave è 0, il valore di riepilogo con rumore che vedrai nel report di riepilogo per questa chiave (molto probabilmente) non sarà 0.

Il rumore può essere un numero positivo o negativo.

Esempi di rumore positivo e negativo.
Esempi di rumore positivo e negativo.

Ad esempio, per un importo di acquisto prima del rumore di 327.000, il rumore potrebbe essere +6000 o -6000 (questi sono valori di esempio arbitrari).

Valutazione del rumore

Calcolare la deviazione standard del rumore

La deviazione standard del rumore è:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Esempio

Con epsilon = 10, la deviazione standard del rumore è:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Valutare quando le differenze di misurazione sono significative

Poiché conoscerai la deviazione standard del rumore aggiunto a ogni valore restituito dal servizio di aggregazione, puoi determinare le soglie appropriate per il confronto per stabilire se le differenze osservate potrebbero essere dovute al rumore.

Ad esempio, se il rumore aggiunto a un valore è di circa +/- 10 (tenendo conto del ridimensionamento) e la differenza di valore tra due campagne è superiore a 100, è probabile che la differenza di valore misurata tra ciascuna campagna non sia dovuta solo al rumore.

Partecipare e condividere feedback

Puoi partecipare e sperimentare questa API.

Passaggi successivi