Scopri come utilizzare, tenere conto e ridurre l'impatto del rumore nei report aggregabili.
Prima di iniziare
Prima di procedere, per una comprensione approfondita di cosa sia il rumore e del suo impatto, consulta Comprendere il rumore nei report di riepilogo.
Controlli del rumore
Sebbene non sia possibile controllare direttamente il rumore aggiunto ai report aggregabili, puoi adottare alcuni accorgimenti per ridurne gli effetti. Le sezioni seguenti spiegano queste strategie.
Aumentare fino al budget di contribuzione
Come spiegato in Informazioni sul rumore, il rumore applicato al valore di riepilogo per ogni chiave si basa sulla scala 0-65.536 (0-CONTRIBUTION_BUDGET).
Per questo motivo, per massimizzare il segnale rispetto al rumore, devi aumentare la scala di ogni valore prima di impostarlo come valore aggregabile, ovvero moltiplicare ogni valore per un determinato fattore, il fattore di scalabilità, verificando che rimanga entro il budget di contributo.
Calcolo di un fattore di scalabilità
Il fattore di scalabilità rappresenta la quantità di scalabilità che vuoi applicare a un determinato valore aggregabile. Il suo valore deve essere il budget di contributo diviso per il valore aggregabile massimo per una determinata chiave.
Ad esempio, supponiamo che gli inserzionisti vogliano conoscere il valore totale dell'acquisto. Sai che il valore massimo previsto di acquisto di ogni singolo acquisto è di 2000 $, ad eccezione di alcuni valori anomali che decidi di ignorare:
- Calcola il fattore di scalabilità:
- Per massimizzare il rapporto segnale/rumore, devi scalare questo valore a 65.536 (il budget di contribuzione).
- Il risultato è un fattore di scalabilità di 65.536 / 2000, ovvero circa 32x. In pratica, puoi arrotondare questo fattore per eccesso o per difetto.
- Aumenta i valori prima dell'aggregazione. Per ogni 1 € di acquisto, incrementa la metrica monitorata di 32. Ad esempio, per un acquisto di 120$, imposta un valore aggregabile pari a 120*32 = 3840.
- Ridimensiona i valori dopo l'aggregazione. Una volta ricevuto il report riepilogativo contenente il valore di acquisto sommato per più utenti, ridimensiona il valore riepilogativo utilizzando il fattore di ridimensionamento utilizzato prima dell'aggregazione. Nel nostro esempio, abbiamo utilizzato un fattore di scalabilità di 32 prima dell'aggregazione, quindi dobbiamo dividere il valore di riepilogo ricevuto nel report di riepilogo per 32. Pertanto, se il valore di acquisto riepilogativo per una determinata chiave nel report riepilogativo è 76.800, il valore di acquisto riepilogativo (con rumore) è 76.800/32 = 2400 €.
Dividere il budget
Se hai diversi obiettivi di misurazione, ad esempio il conteggio degli acquisti e il valore degli acquisti, ti consigliamo di suddividere il budget tra questi obiettivi.
In questo caso, i fattori di scalabilità saranno diversi per i diversi valori aggregabili, a seconda del massimo previsto per un determinato valore aggregabile.
Leggi i dettagli nella sezione Comprendere le chiavi di aggregazione.
Ad esempio, supponiamo che tu stia monitorando sia il conteggio degli acquisti sia il valore degli acquisti e che tu decida di distribuire il budget in modo equo.
È possibile allocare 65.536 / 2 = 32.768 per tipo di misurazione e per origine.
- Conteggio acquisti:
- Stai monitorando un solo acquisto, quindi il numero massimo di acquisti per una determinata conversione è 1.
- Pertanto, decidi di impostare il fattore di scalabilità per il conteggio degli acquisti su 32.768 / 1 = 32.768.
- Valore di acquisto:
- Supponiamo che il valore massimo previsto per un singolo acquisto sia di 2000 $.
- Pertanto, decidi di impostare il fattore di scalabilità per il valore di acquisto su 32.768 / 2000 = 16,384 o circa 16.
Le chiavi di aggregazione più grossolane migliorano il rapporto segnale-rumore
Poiché le chiavi grossolane acquisiscono più eventi di conversione rispetto alle chiavi granulari, in genere portano a valori di riepilogo più elevati.
I valori di riepilogo più alti sono meno influenzati dal rumore rispetto a quelli più bassi; il rumore su questi valori è probabilmente inferiore rispetto a questo valore.
I valori raccolti con chiavi più grossolane hanno probabilmente un rumore relativamente inferiore rispetto ai valori raccolti con chiavi più granulari.
Esempio
A parità di altre condizioni, una chiave che monitora il valore di acquisto a livello globale (sommato in tutti i paesi) genererà un valore di acquisto riepilogativo più elevato (e un conteggio delle conversioni riepilogativo più elevato) rispetto a una chiave che monitora le conversioni a livello di paese.
Pertanto, il rumore relativo sul valore totale degli acquisti per un paese specifico sarà superiore a quello sul valore totale degli acquisti per tutti i paesi.
Allo stesso modo, a parità di altre condizioni, il valore totale dell'acquisto di scarpe è inferiore al valore totale dell'acquisto di tutti gli articoli (incluse le scarpe).
Pertanto, il rumore relativo sul valore totale dell'acquisto di scarpe sarà superiore a quello sul valore totale dell'acquisto di tutti gli articoli.
La somma dei valori di riepilogo (rollup) somma anche il rumore.
Se sommi i valori di riepilogo dei report di riepilogo per accedere a dati di livello superiore, sommi anche il rumore di questi valori di riepilogo.
Esaminiamo due approcci diversi:
- Approccio A: includi un ID geografia nelle chiavi. I report di riepilogo mostrano le chiavi a livello di ID geografico, ognuna associata al valore di acquisto riepilogativo a un livello specifico dell'ID geografico.
- Approccio B: non includi l'ID area geografica nelle chiavi. I report di riepilogo mostrano direttamente il valore di acquisto riepilogativo per tutti gli ID / le località geografiche.
Per accedere al valore di acquisto a livello di paese:
- Con l'approccio A, sommi i valori riepilogativi a livello di ID geografico e quindi anche il rumore. Ciò potrebbe causare un aumento del rumore aggiunto al valore di acquisto finale a livello di ID geografico.
- Con l'approccio B, esamini direttamente i dati esposti nei report di riepilogo. Il rumore è stato aggiunto una sola volta a questi dati.
Pertanto, il valore di acquisto riepilogativo per un determinato ID geografico è probabilmente più rumoroso con l'approccio A.
Allo stesso modo, l'inclusione di una dimensione a livello di codice postale nelle chiavi probabilmente genererà risultati più rumorosi rispetto all'utilizzo di chiavi più grossolane con una dimensione a livello di regione.
L'aggregazione su periodi di tempo più lunghi aumenta il rapporto segnale/rumore
Se richiedi report riepilogativi meno spesso, è probabile che ogni valore riepilogativo sia superiore rispetto a quando richiedi report più spesso, poiché è più probabile che si verifichino più conversioni in periodi di tempo più lunghi.
Come accennato in precedenza, maggiore è il valore del riepilogo, minore è il rumore relativo. Pertanto, richiedere report riepilogativi meno frequentemente comporta un rapporto segnale/rumore più elevato (migliore).
Ecco un esempio:
- Se richiedi report di riepilogo orari per più di 24 ore e poi sommi il valore di riepilogo di ogni report orario per accedere ai dati a livello giornaliero, il rumore viene aggiunto 24 volte.
- In un report di riepilogo giornaliero, il rumore viene aggiunto una sola volta.
Epsilon più alto, rumore più basso
Maggiore è il valore epsilon, minore è il rumore e minore è la protezione della privacy.
Sfruttare il filtraggio e la deduplicazione
Una parte importante dell'allocazione del budget tra chiavi diverse è capire quante volte può verificarsi un determinato evento. Ad esempio, un inserzionista potrebbe essere interessato a un solo acquisto per ogni clic, ma potrebbe essere interessato a un massimo di tre conversioni "visualizzazione pagina di prodotto". Per supportare questi casi d'uso, potresti anche voler utilizzare le seguenti funzionalità dell'API che ti consentono di controllare il numero di report generati e le conversioni conteggiate:
- Filtri. Scopri di più sul filtro.
- Deduplicazione. Scopri di più sulla deduplicazione.
Sperimentazione con epsilon
Le ad tech possono impostare epsilon su un valore maggiore di 0 e fino a 64 incluso. Questo intervallo consente test flessibili. Valori più bassi di epsilon offrono una maggiore protezione della privacy. Ti consigliamo di iniziare con epsilon=10.
Consigli per gli esperimenti
Ti consigliamo quanto segue:
- Inizia con epsilon = 10.
- Se ciò causa problemi di utilità notevoli, aumenta epsilon in modo incrementale.
- Condividi il tuo feedback su punti di inflessione specifici che potresti trovare in relazione all'usabilità dei dati.
Partecipare e condividere feedback
Puoi partecipare e sperimentare questa API.
- Leggi informazioni sui report aggregabili e sul servizio di aggregazione, poni domande e suggerisci feedback.
- Leggi le guide al reporting sull'attribuzione.
Passaggi successivi
- Per ulteriori informazioni sui fattori che influenzano la generazione di report, come le variabili della campagna, la frequenza di raggruppamento e la granularità delle dimensioni, consulta l'articolo Sperimentare le decisioni di progettazione dei report di riepilogo .
- Prova il Noise Lab.