Como trabalhar com ruídos

Saiba como trabalhar, considerar e reduzir o impacto do ruído nos seus relatórios agregáveis.

Antes de começar

Antes de continuar, para entender melhor o que é ruído e o impacto dele, consulte Entender o ruído nos relatórios de resumo.

Seus controles de ruído

Embora não seja possível controlar diretamente o ruído adicionado aos seus relatórios agregáveis, há etapas que você pode seguir para minimizar os efeitos. As seções a seguir explicam essas estratégias.

Aumentar a escala até o orçamento de contribuição

Conforme explicado em "Entender o ruído", o ruído aplicado ao valor do resumo de cada chave se baseia na escala de 0 a 65.536 (0 a CONTRIBUTION_BUDGET).

A distribuição de ruído é baseada no orçamento.
A distribuição de ruído é baseada no orçamento.

Por isso, para maximizar o sinal em relação ao ruído, aumente a escala de cada valor antes de defini-lo como um valor agregável. Ou seja, multiplique cada valor por um determinado fator, o fator de escalonamento, e verifique se ele permanece dentro do orçamento de contribuição.

Ruído relativo com e sem escalonamento.
Ruído relativo com e sem escalonamento.

Como calcular um fator de escalonamento

O fator de escalonamento representa o quanto você quer dimensionar um determinado valor agregável. O valor precisa ser o orçamento de contribuição dividido pelo valor máximo agregável de uma determinada chave.

Determinar o fator de escalonamento com base no orçamento de contribuição.
Como determinar o fator de escalonamento com base no orçamento de contribuição.

Por exemplo, suponha que os anunciantes queiram saber o valor total da compra. Você sabe que o valor máximo esperado de qualquer compra individual é de US $2.000, exceto alguns outliers que você decide ignorar:

  • Calcule o fator de escalonamento:
    • Para maximizar a relação sinal-ruído, é necessário dimensionar esse valor para 65.536 (o orçamento de contribuição).
    • Isso resulta em um fator de escalonamento de 65.536 / 2.000, aproximadamente 32x. Na prática, você pode arredondar esse fator para cima ou para baixo.
  • Aumente seus valores antes da agregação. Para cada US$1 de compra, aumente a métrica rastreada em 32. Por exemplo, para uma compra de US$120, defina um valor agregável de 120*32 = 3.840.
  • Reduza seus valores após a agregação. Depois de receber o relatório de resumo com o valor da compra somado em vários usuários, reduza o valor do resumo usando o fator de escalonamento usado antes da agregação. No nosso exemplo, usamos um fator de escalonamento de 32 antes da agregação. Portanto, precisamos dividir o valor do resumo recebido no relatório de resumo por 32. Portanto, se o valor de compra resumido de uma determinada chave no relatório de resumo for 76.800, o valor de compra resumido (com ruído) será 76.800/32 = US $2.400.

Divida seu orçamento

Se você tiver várias metas de medição, como contagem e valor de compras, divida seu orçamento entre elas.

Nesse caso, os fatores de escalonamento serão diferentes para valores agregáveis distintos, dependendo do máximo esperado de um determinado valor agregável.

Leia os detalhes em Noções básicas sobre chaves de agregação.

Por exemplo, suponha que você esteja acompanhando a contagem e o valor das compras e decida alocar seu orçamento de forma igual.

65.536 / 2 = 32.768 podem ser alocados por tipo de medição e por origem.

  • Contagem de compras:
    • Você está rastreando apenas uma compra, então o número máximo de compras para uma determinada conversão é 1.
    • Portanto, você decide definir o fator de escalonamento para a contagem de compras como 32.768 / 1 = 32.768.
  • Valor de compra:
    • Vamos supor que o valor máximo esperado de compra seja de US $2.000.
    • Portanto, você decide definir o fator de escalonamento para o valor da compra como 32.768 / 2.000 = 16.384 ou aproximadamente 16.

Chaves de agregação mais grosseiras melhoram a relação sinal-ruído

Como as chaves aproximadas capturam mais eventos de conversão do que as granulares, elas geralmente resultam em valores de resumo mais altos.

Valores de resumo mais altos são menos afetados por ruídos do que valores mais baixos. O ruído nesses valores provavelmente será menor em relação a esse valor.

Os valores coletados com chaves mais grosseiras provavelmente serão relativamente menos ruidosos do que os coletados com chaves mais granulares.

Exemplo

Mantendo todo o resto igual, uma chave que rastreia o valor da compra globalmente (somado em todos os países) vai resultar em um valor de compra resumido mais alto (e uma contagem de conversões resumida mais alta) do que uma chave que rastreia conversões no nível de um país.

Portanto, o ruído relativo no valor total da compra para um país específico será maior do que o ruído relativo no valor total da compra para todos os países.

Da mesma forma, todo o resto sendo igual, o valor total da compra de sapatos é menor do que o valor total da compra de todos os itens (incluindo sapatos).

Portanto, o ruído relativo no valor total da compra de sapatos será maior do que o ruído relativo no valor total da compra de todos os itens.

Impacto de ruído com chaves granulares e aproximadas.
Impacto de ruído com chaves granulares x aproximadas.

A soma dos valores de resumo (agrupamentos) também soma o ruído deles.

Ao somar os valores dos relatórios de resumo para acessar dados de nível superior, você também soma o ruído desses valores.

O grau de ruído com chaves granulares com resumos x chaves aproximadas sem resumos.
O grau de ruído com chaves granulares com agrupamentos por substituição versus chaves aproximadas sem agrupamentos por substituição.

Vamos analisar duas abordagens diferentes:

  • Abordagem A: inclua um ID de geografia nas suas chaves. Os relatórios de resumo expõem chaves no nível do ID geográfico, cada uma associada ao valor de compra resumido no nível de um ID geográfico específico.
  • Abordagem B: não inclua o ID da região geográfica nas suas chaves. Os relatórios de resumo expõem diretamente o valor total da compra para todos os IDs / locais geográficos.

Para acessar o valor da compra por país:

  • Com a abordagem A, você soma os valores de resumo no nível do ID geográfico e, portanto, também soma o ruído deles. Isso provavelmente vai adicionar mais ruído ao valor de compra final no nível do ID geográfico.
  • Com a abordagem B, você analisa diretamente os dados expostos nos relatórios de resumo. O ruído foi adicionado apenas uma vez a esses dados.

Portanto, o valor de compra resumido para um determinado ID geográfico provavelmente será mais ruidoso com a abordagem A.

Da mesma forma, incluir uma dimensão de CEP nas chaves provavelmente vai gerar resultados com mais ruído do que usar chaves mais grosseiras com uma dimensão regional.

A agregação em períodos mais longos aumenta a relação sinal-ruído

Solicitar relatórios de resumo com menos frequência significa que cada valor de resumo provavelmente será maior do que se você solicitasse relatórios com mais frequência. É mais provável que mais conversões aconteçam em períodos mais longos.

Como mencionado anteriormente, quanto maior o valor do resumo, menor será o ruído relativo. Portanto, solicitar relatórios de resumo com menos frequência resulta em uma proporção sinal-ruído maior (melhor).

Solicitar relatórios de resumo com menos frequência aumenta a proporção de sinal-ruído
Solicitar relatórios de resumo com menos frequência aumenta a relação sinal-ruído.

Confira um exemplo:

  • Se você solicitar relatórios de resumo por hora em um período de 24 horas e somar o valor do resumo de cada relatório por hora para acessar dados diários, o ruído será adicionado 24 vezes.
  • Em um relatório de resumo diário, o ruído é adicionado apenas uma vez.

Maior épsilon, menor ruído

Quanto maior o valor de épsilon, menor o ruído e menor a proteção de privacidade.

Como usar filtragem e remoção de duplicidade

Uma parte importante da alocação de orçamento entre diferentes chaves é entender quantas vezes um determinado evento pode ocorrer. Por exemplo, um anunciante pode se importar apenas com uma compra por clique, mas ter interesse em até três conversões de "visualização da página do produto". Para oferecer suporte a esses casos de uso, você também pode usar os seguintes recursos da API, que permitem controlar quantos relatórios são gerados e quais conversões são contabilizadas:

Testar o epsilon

As adtechs podem definir o epsilon como um valor maior que 0 e até 64. Esse intervalo permite testes flexíveis. Valores menores de épsilon oferecem maior proteção de privacidade. Recomendamos começar com epsilon=10.

Recomendações para testar

Recomendamos o seguinte:

  • Comece com epsilon = 10.
  • Se isso causar problemas de utilidade significativos, aumente o epsilon de forma incremental.
  • Compartilhe seu feedback sobre pontos de inflexão específicos que você pode encontrar em relação à usabilidade dos dados.

Engajamento e como compartilhar feedback

Participe e teste essa API.

Próximas etapas