Lavorare con il rumore

Scopri come gestire, tenere conto e ridurre l'impatto del rumore nei report aggregabili.

Prima di iniziare

Prima di procedere, per una comprensione approfondita di cosa sia il rumore e del suo impatto, consulta l'articolo Informazioni sul rumore nei report di riepilogo.

I tuoi controlli sul rumore

Sebbene non sia possibile controllare direttamente il rumore aggiunto ai report aggregabili, esistono alcuni passaggi che puoi seguire per ridurne al minimo gli effetti. Queste strategie sono spiegate nelle sezioni che seguono.

Eseguire l'upgrade al budget di contributo

Come spiegato in Informazioni sul rumore, il rumore applicato al valore di riepilogo per ogni chiave si basa sulla scala 0-65.536 (0-CONTRIBUTION_BUDGET).

La distribuzione del rumore si basa sul budget.

Per questo motivo, per massimizzare l'indicatore rispetto al rumore, devi aumentare ogni valore prima di impostarlo come valore aggregabile, ovvero moltiplicare ogni valore per un determinato fattore, il fattore di scalabilità, assicurandoti al contempo che rimanga entro il budget del contributo.

Rumore relativo con e senza scala.

Calcolo di un fattore di scala

Il fattore di scala rappresenta la misura in cui vuoi scalare un determinato valore aggregabile. Il relativo valore deve essere il budget del contributo diviso per il valore aggregabile massimo per una determinata chiave.

Determinazione del fattore di scalabilità in base al budget dei contributi.

Ad esempio, supponiamo che gli inserzionisti vogliano conoscere il valore totale dell'acquisto. Sai che il valore di acquisto massimo previsto per ogni singolo acquisto è 2000 $, ad eccezione di alcuni valori anomali che decidi di ignorare:

  • Calcola il fattore di scalabilità:
    • Per massimizzare il rapporto segnale/rumore, devi scalare questo valore a 65.536 (il budget del contributo).
    • Il risultato è un fattore di scalabilità di circa 32x (65.536 / 2000). In pratica, puoi arrotondare questo fattore per eccesso o per difetto.
  • Aumenta i valori prima dell'aggregazione. Per ogni 1$ di acquisto, incrementa la metrica monitorata di 32. Ad esempio, per un acquisto di 120$, imposta un valore aggregabile di 120*32 = 3840.
  • Ridurre i valori dopo l'aggregazione. Una volta ricevuto il report di riepilogo contenente il valore dell'acquisto sommato per più utenti, riduci il valore di riepilogo utilizzando il fattore di scala utilizzato prima dell'aggregazione. Nel nostro esempio abbiamo utilizzato un fattore di scalabilità di 32 prima dell'aggregazione, quindi dobbiamo dividere il valore di riepilogo ricevuto nel report di riepilogo per 32. Pertanto, se il valore di acquisto complessivo per una determinata chiave nel report di riepilogo è 76.800, il valore di acquisto complessivo (con rumore) è 76.800/32 = 2.400 $.

Suddividere il budget

Se hai diversi obiettivi di misurazione, ad esempio il conteggio dei risultati di acquisto e il valore di acquisto, ti consigliamo di suddividere il budget tra questi obiettivi.

In questo caso, i fattori di scala saranno diversi per valori aggregabili diversi, a seconda del valore massimo previsto di un determinato valore aggregabile.

Leggi i dettagli nella sezione Informazioni sulle chiavi di aggregazione.

Ad esempio, supponiamo che tu monitori sia il conteggio degli acquisti sia il valore di acquisto e che tu decida di allocare il budget in modo uguale.

65.536 / 2 = 32.768 possono essere allocati per tipo di misurazione e per origine.

  • Numero di acquisti:
    • Monitori un solo acquisto, pertanto il numero massimo di acquisti per una determinata conversione è 1.
    • Pertanto, decidi di impostare il fattore di scalabilità per il conteggio acquisti su 32.768 / 1 = 32.768.
  • Valore di acquisto:
    • Supponiamo che il valore di acquisto massimo previsto per ogni singolo acquisto sia di 2000 $.
    • Pertanto, decidi di impostare il fattore di scalabilità per il valore di acquisto su 32.768 / 2.000 = 16.384 o circa 16.

Le chiavi di aggregazione più granulari migliorano il rapporto segnale/rumore

Poiché le chiavi approssimative rilevano più eventi di conversione rispetto alle chiavi granulari, in genere generano valori di riepilogo più elevati.

I valori di riepilogo più elevati sono meno influenzati dal rumore rispetto ai valori più bassi. È probabile che il rumore su questi valori sia inferiore rispetto a questo valore.

I valori raccolti con chiavi più generali hanno maggiori probabilità di essere relativamente meno rumorosi rispetto ai valori raccolti con chiavi più granulari.

Esempio

A parità di condizioni, una chiave che monitora il valore di acquisto a livello globale (sommato in tutti i paesi) genera un valore di acquisto complessivo (e un conteggio delle conversioni complessivo) più elevato rispetto a una chiave che monitora le conversioni a livello di paese.

Pertanto, il rumore relativo al valore di acquisto totale per un paese specifico sarà superiore al rumore relativo al valore di acquisto totale per tutti i paesi.

Analogamente, a parità di condizioni, il valore totale di acquisto delle scarpe è inferiore al valore totale di acquisto di tutti gli articoli (incluse le scarpe).

Pertanto, il rumore relativo al valore di acquisto totale per le scarpe sarà superiore al rumore relativo al valore di acquisto totale per tutti gli articoli.

Impatto del rumore con chiavi granulari rispetto a chiavi approssimative.

La somma dei valori di riepilogo (aggregazioni) somma anche il relativo rumore

Sommando i valori di riepilogo dei report di riepilogo per accedere ai dati di livello superiore, sommi anche il rumore di questi valori di riepilogo.

Il grado di rumore con chiavi granulari con aggregazioni rispetto alle chiavi approssimative senza aggregazioni

Vediamo due approcci diversi: - Approccio A: includi un ID geografico nelle chiavi. I report di riepilogo mostrano le chiavi a livello di ID geografico, ciascuna associata al valore di acquisto di riepilogo a livello di ID geografico specifico. - Approccio B: non includi l'ID geografico nelle chiavi. I report di riepilogo mostrano direttamente il valore di acquisto complessivo per tutti gli ID / le località geografiche.

Per accedere al valore di acquisto a livello di paese: - Con l'approccio A, sommi i valori di riepilogo a livello di ID geografico e, di conseguenza, anche il relativo rumore. Ciò potrebbe causare un aumento del rumore aggiunto al valore di acquisto finale a livello di ID geografico. - Con l'approccio B, esamini direttamente i dati esposti nei report di riepilogo. Il rumore è stato aggiunto una sola volta a questi dati.

Pertanto, il valore di acquisto complessivo per un determinato ID geografico è probabile che sia più rumoroso con l'approccio A.

Analogamente, l'inclusione di una dimensione a livello di codice postale nelle chiavi probabilmente comporterà risultati meno affidabili rispetto all'utilizzo di chiavi più granulari con una dimensione a livello di regione.

L'aggregazione su periodi di tempo più lunghi aumenta il rapporto segnale/rumore

Se richiedi i report di riepilogo meno spesso, ogni valore di riepilogo sarà probabilmente più alto rispetto a se li avessi richiesti più spesso. È più probabile che si verifichino più conversioni in periodi di tempo più lunghi.

Come accennato in precedenza, maggiore è il valore del riepilogo, minore è la probabilità che il rumore relativo sia elevato. Pertanto, richiedere report di riepilogo meno di frequente porta a un rapporto segnale/rumore più elevato (migliore).

La richiesta di report di riepilogo con minore frequenza porta a un rapporto segnale/rumore più elevato

Ecco un esempio:

  • Se richiedi report di riepilogo ogni ora per 24 ore e poi sommi il valore di riepilogo di ogni report orario per accedere ai dati a livello di giorno, il rumore viene aggiunto 24 volte.
  • In un report di riepilogo giornaliero, il rumore viene aggiunto una sola volta.

Epsilon più elevato, rumore inferiore

Maggiore è il valore di epsilon, minore è il rumore e minore è la protezione della privacy.

Sfruttare i filtri e la deduplica

Un aspetto importante dell'allocazione del budget tra chiavi diverse è capire quante volte può verificarsi un determinato evento. Ad esempio, un inserzionista potrebbe essere interessato solo a un acquisto per ogni clic, ma potrebbe essere interessato fino a tre conversioni di tipo "Visualizzazione pagina prodotto". Per supportare questi casi d'uso, ti consigliamo di utilizzare anche le seguenti funzionalità dell'API che ti consentono di controllare il numero di report generati e le conversioni conteggiate:

Sperimentazione con epsilon

Gli esperti di tecnologia pubblicitaria possono impostare epsilon su un valore maggiore di 0 e fino a 64. Questo intervallo consente test flessibili. Valori più bassi di epsilon offrono una maggiore protezione della privacy. Ti consigliamo di iniziare con epsilon=10.

Suggerimenti per l'esperimento

Ti consigliamo quanto segue: - Inizia con epsilon = 10. - Se ciò causa notevoli problemi di utilità, aumenta epsilon in modo incrementale. - Condividi il tuo feedback su punti di inflessione specifici che potresti riscontrare in merito all'usabilità dei dati.

Interagisci e condividi il tuo feedback

Puoi partecipare e sperimentare con questa API.

Passaggi successivi