Saiba o que é ruído, onde ele é adicionado e como afeta seus esforços de medição.
Os relatórios de resumo são o resultado da agregação de relatórios agregáveis. Quando os relatórios agregáveis são agrupados por um coletor e processados pelo serviço de agregação, um ruído (uma quantidade aleatória de dados) é adicionado aos relatórios de resumo resultantes. O ruído é adicionado para proteger a privacidade do usuário. O objetivo desse mecanismo é ter um framework que ofereça suporte à medição de privacidade diferencial.
Introdução ao ruído nos relatórios de resumo
Embora a adição de ruído não seja normalmente parte da medição de anúncios hoje, em muitos casos, o ruído adicionado não muda substancialmente a forma como você interpreta seus resultados.
Pense da seguinte forma: você tomaria uma decisão com base em um determinado dado se ele não fosse ruidoso?
Por exemplo, um anunciante teria confiança em mudar a estratégia ou os orçamentos da campanha com base no fato de que a Campanha A teve 15 conversões e a Campanha B teve 16?
Se a resposta for "não", o ruído será irrelevante.
Configure o uso da API de forma que:
- A resposta é sim.
- O ruído é gerenciado de forma que não afete significativamente sua capacidade de tomar uma decisão com base em determinados dados. Você pode fazer isso da seguinte maneira: para um número mínimo esperado de conversões, mantenha o ruído na métrica coletada abaixo de uma determinada porcentagem.
Nesta seção e na seguinte, vamos descrever estratégias para alcançar o objetivo 2.
Principais conceitos
O serviço de agregação adiciona ruído uma vez a cada valor de resumo (ou seja, uma vez por chave) sempre que um relatório de resumo é solicitado.
Esses valores de ruído são extraídos aleatoriamente de uma distribuição de probabilidade específica, da seguinte forma:
Todos os elementos que afetam o ruído dependem de dois conceitos principais.
A distribuição de ruído (detalhes abaixo) é a mesma, seja o valor do resumo baixo ou alto. Portanto, quanto maior o valor do resumo, menor será o impacto do ruído em relação a esse valor.
Por exemplo, suponha que um valor total agregado de compra de US $20.000 e um valor total agregado de compra de US $200 estejam sujeitos a ruído selecionado da mesma distribuição.
Vamos supor que o ruído dessa distribuição varie aproximadamente entre -100 e +100.
- Para o valor de compra resumido de US $20.000, o ruído varia entre 0 e 100/20.000=0,5%.
- Para o valor de compra resumido de US $200, o ruído varia entre 0 e 100/200=50%.
Portanto, o ruído provavelmente terá um impacto menor no valor agregado de compra de US $20.000 do que no valor de US $200. Relativamente falando, US$ 20.000 provavelmente terão menos ruído,ou seja, uma proporção sinal-ruído maior.
Valores agregados mais altos têm um impacto de ruído relativamente menor. Isso tem algumas implicações práticas importantes, que são descritas na próxima seção. Esse mecanismo faz parte do design da API, e as implicações práticas são de longo prazo. Elas vão continuar desempenhando um papel importante quando as adtechs criarem e avaliarem várias estratégias de agregação.
Embora o ruído seja extraído da mesma distribuição, independente do valor do resumo, essa distribuição depende de vários parâmetros. Um desses parâmetros, epsilon, pode ser alterado pelas adtechs durante o teste de origem concluído para avaliar vários ajustes de utilidade/privacidade. No entanto, considere a capacidade de ajustar o epsilon como temporária. Aceitamos seu feedback sobre os casos de uso e os valores de epsilon que funcionam bem.
Embora uma empresa de adtech não tenha controle direto sobre as formas de adição de ruído, ela pode influenciar o impacto do ruído nos dados de medição. Nas próximas seções, vamos explicar como o ruído pode ser influenciado na prática.
Antes disso, vamos analisar mais de perto como o ruído é aplicado.
Aumentar o zoom: como o ruído é aplicado
Uma distribuição de ruído
O ruído é extraído da distribuição de Laplace, com os seguintes parâmetros:
- Uma média (
μ) de 0. Isso significa que o valor de ruído mais provável é 0 (nenhum ruído adicionado) e que o valor com ruído tem a mesma probabilidade de ser menor ou maior que o original (às vezes chamado de não enviesado). - Um parâmetro de escala de
b = CONTRIBUTION_BUDGET/epsilon.CONTRIBUTION_BUDGETé definido no navegador.epsiloné usado no Aggregation Service.
O diagrama a seguir mostra a função de densidade de probabilidade para uma distribuição de Laplace com μ=0, b = 20:
Valores de ruído aleatórios, uma distribuição de ruído
Vamos supor que uma adtech solicite relatórios de resumo para duas chaves de agregação, key1 e key2.
O serviço de agregação seleciona dois valores de ruído x1 e x2, seguindo a mesma distribuição de ruído. x1 é adicionado ao valor de resumo da chave1, e x2 é adicionado ao valor de resumo da chave2.
Nos diagramas, vamos representar os valores de ruído como idênticos. Essa é uma simplificação. Na realidade, os valores de ruído variam porque são extraídos aleatoriamente da distribuição.
Isso ilustra que todos os valores de ruído vêm da mesma distribuição e são independentes do valor do resumo a que são aplicados.
Outras propriedades do ruído
O ruído é aplicado a todos os valores de resumo, incluindo os vazios (0).
Por exemplo, mesmo que o valor real do resumo para uma determinada chave seja 0, o valor ruidoso que você vai ver no relatório de resumo para essa chave provavelmente não será 0.
O ruído pode ser um número positivo ou negativo.
Por exemplo, para um valor de compra antes da adição de ruído de 327.000, o ruído pode ser +6.000 ou -6.000 (esses são valores de exemplo arbitrários).
Avaliação de ruído
Como calcular o desvio padrão do ruído
O desvio padrão do ruído é:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Exemplo
Com epsilon = 10, o desvio padrão do ruído é:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Avaliar quando as diferenças de medição são significativas
Como você vai saber o desvio padrão do ruído adicionado a cada valor gerado pelo serviço de agregação, é possível determinar limites adequados para comparação e determinar se as diferenças observadas podem ser atribuídas ao ruído.
Por exemplo, se o ruído adicionado a um valor for de aproximadamente +/- 10 (considerando o escalonamento) e a diferença no valor entre duas campanhas for superior a 100, é provável que a diferença no valor medido entre cada campanha não seja apenas devido ao ruído.
Engajamento e como compartilhar feedback
- Leia sobre relatórios agregáveis e o serviço de agregação, faça perguntas e envie feedback.
- Leia os guias de relatórios de atribuição.
Próximas etapas
- Para saber quais variáveis você pode controlar para melhorar a relação sinal-ruído, consulte Como trabalhar com ruído.
- Consulte Experimentar decisões de design de relatórios de resumo para planejar suas estratégias de relatórios de agregação.
- Teste o laboratório de ruído.