Algumas tecnologias do Sandbox de privacidade estão sendo desativadas.

Confira nossa Atualização sobre os planos para as tecnologias do Sandbox de privacidade. O

status dos recursos do Sandbox de privacidade fornece mais informações sobre o status de APIs e recursos da plataforma individuais.

Esta página foi traduzida pela API Cloud Translation.

Princípios básicos da API Private Aggregate

Principais conceitos da API Private Aggregation

Para quem é este documento?

A API Private Aggregation permite a coleta de dados agregados de worklets com acesso a dados entre sites. Os conceitos compartilhados aqui são importantes para desenvolvedores que criam funções de relatórios no armazenamento compartilhado e na API Protected Audience.

Se você for um desenvolvedor criando um sistema de relatórios para medição entre sites.
Se você é um profissional de marketing, cientista de dados ou outro consumidor de relatórios de resumo, entender esses mecanismos vai ajudar você a tomar decisões de design para recuperar um relatório de resumo otimizado.

Termos-chave

Antes de ler este documento, é útil se familiarizar com os principais termos e conceitos. Cada um desses termos será descrito em detalhes aqui.

Uma chave de agregação (também conhecida como bucket) é uma coleção predeterminada de pontos de dados. Por exemplo, talvez você queira coletar um bucket de dados de local em que o navegador informa o nome do país. Uma chave de agregação pode conter mais de uma dimensão (por exemplo, país e ID do widget de conteúdo).
Um valor agregável é um ponto de dados individual coletado em uma chave de agregação. Se você quiser medir quantos usuários da França viram seu conteúdo, France será uma dimensão na chave de agregação, e o viewCount de 1 será o valor agregável.
Os relatórios agregáveis são gerados e criptografados em um navegador. Para a API Private Aggregation, isso contém dados sobre um único evento.
O Serviço de agregação processa dados de relatórios agregáveis para criar um relatório de resumo.
Um relatório de resumo é a saída final do Aggregation Service e contém dados agregados ruidosos do usuário e dados detalhados de conversão.
Um worklet é uma parte da infraestrutura que permite executar funções JavaScript específicas e retornar informações ao solicitante. Em um worklet, é possível executar JavaScript, mas não interagir ou se comunicar com a página externa.

Fluxo de trabalho da API Private Aggregation

Quando você chama a API Private Aggregation com uma chave de agregação e um valor agregável, o navegador gera um relatório agregável. Os relatórios são enviados ao seu servidor, que os agrupa. Os relatórios em lote são processados posteriormente pelo serviço de agregação, e um relatório de resumo é gerado.

Os dados fluem do cliente para o coletor e, em seguida, para o serviço de agregação, que gera um relatório de resumo. — Fluxo de dados do cliente para o coletor.

Quando você chama a API Private Aggregation, o cliente (navegador) gera e envia o relatório agregável para seu servidor para ser coletado.
Seu servidor coleta os relatórios dos clientes e os agrupa para serem enviados ao serviço de agregação.
Depois de coletar relatórios suficientes, você os agrupa e envia para o serviço de agregação, executado em um ambiente de execução confiável, para gerar um relatório de resumo.

O fluxo de trabalho descrito nesta seção é semelhante à API Attribution Reporting. No entanto, os Relatórios de atribuição associam dados coletados de um evento de impressão e um evento de conversão, que acontecem em momentos diferentes. A agregação particular mede um único evento entre sites.

Chave de agregação

Uma chave de agregação (ou "chave") representa o bucket em que os valores agregáveis serão acumulados. Uma ou mais dimensões podem ser codificadas na chave. Uma dimensão representa algum aspecto que você quer entender melhor, como a faixa etária dos usuários ou a contagem de impressões de uma campanha publicitária.

Por exemplo, você pode ter um widget incorporado em vários sites e querer analisar o país dos usuários que o viram. Você quer responder a perguntas como "Quantos dos usuários que viram meu widget são do país X?" Para gerar um relatório sobre essa questão, configure uma chave de agregação que codifique duas dimensões: ID do widget e ID do país.

A chave fornecida à API Private Aggregation é um BigInt, que consiste em várias dimensões. Neste exemplo, as dimensões são o ID do widget e o ID do país. Digamos que o ID do widget possa ter até quatro dígitos, como 1234, e que cada país seja mapeado para um número em ordem alfabética, como Afeganistão (1), França (61) e Zimbábue (195). Portanto, a chave agregável teria sete dígitos, em que os quatro primeiros caracteres são reservados para o WidgetID e os três últimos para o CountryID.

Digamos que a chave represente a contagem de usuários da França (ID do país 061) que viram o ID do widget 3276. A chave de agregação é 3276061.

Chave de agregação
ID do widget	ID do país
3276	061

Exemplo:se uma dimensão tiver espaço de chave disponível para vários dígitos, mas o valor tiver menos, adicione zeros à esquerda. Por exemplo, se o ID do país permitir três dígitos, o ID da Argélia será 003.

A chave de agregação também pode ser gerada com um mecanismo de hash, como SHA-256. Por exemplo, a string {"WidgetId":3276,"CountryID":67} pode ser hashizada e convertida em um valor BigInt de 42943797454801331377966796057547478208888578253058197330928948081739249096287n. Se o valor de hash tiver mais de 128 bits, você poderá truncá-lo para garantir que ele não exceda o valor máximo permitido de 2^128−1.

Em um worklet do armazenamento compartilhado, você pode acessar os módulos crypto e TextEncoder que ajudam a gerar um hash. Para saber mais sobre como gerar um hash, confira SubtleCrypto.digest() na MDN.

O exemplo a seguir descreve como gerar uma chave de bucket com base em um valor de hash:

async function convertToBucket(data) {
  // Encode as UTF-8 Uint8Array
  const encodedData = new TextEncoder().encode(data);

  // Generate SHA-256 hash
  const hashBuffer = await crypto.subtle.digest('SHA-256', encodedData);

  // Truncate the hash
  const truncatedHash = Array.from(new Uint8Array(hashBuffer, 0, 16));

  // Convert the byte sequence to a decimal
  return truncatedHash.reduce((acc, curr) => acc * 256n + BigInt(curr), 0n);
}

const data = {
  WidgetId: 3276,
  CountryID: 67
};

const dataString = JSON.stringify(data);
const bucket = await convertToBucket(dataString);

console.log(bucket); // 126200478277438733997751102134640640264n

Valor agregável

Os valores agregáveis são somados por chave em vários usuários para gerar insights agregados na forma de valores de resumo em relatórios de resumo.

Agora, volte à pergunta de exemplo feita anteriormente: "Quantos dos usuários que viram meu widget são da França?" A resposta para essa pergunta será algo como "Aproximadamente 4.881 usuários que viram meu ID do widget 3276 são da França". O valor agregável é 1 para cada usuário, e "4.881 usuários" é o valor agregado, que é a soma de todos os valores agregáveis para essa chave de agregação.

Chave de agregação		Valor agregável
ID do widget	ID do país	Contagem de visualizações
3276	061	1

Neste exemplo, incrementamos o valor em 1 para cada usuário que vê o widget. Na prática, o valor agregável pode ser dimensionado para melhorar a proporção sinal-ruído.

Orçamento de contribuição

Cada chamada à API Private Aggregation é chamada de contribuição. Para proteger a privacidade dos usuários, o número de contribuições que podem ser coletadas de um indivíduo é limitado.

Quando você soma todos os valores agregáveis em todas as chaves de agregação, o resultado precisa ser menor que o orçamento de contribuição. O orçamento é definido por origem de worklet e por dia, e é separado para worklets da API Protected Audience e do armazenamento compartilhado. Uma janela móvel de aproximadamente as últimas 24 horas é usada para o dia. Se um novo relatório agregável fizer com que o orçamento seja excedido, ele não será criado.

O orçamento de contribuição é representado pelo parâmetro L₁ e é definido como 2¹⁶ (65.536) a cada dez minutos por dia, com um limite de 2²⁰ (1.048.576). Consulte a explicação para saber mais sobre esses parâmetros.

O valor do orçamento de contribuição é arbitrário, mas o ruído é dimensionado para ele. Você pode usar esse orçamento para maximizar a relação sinal-ruído nos valores de resumo (mais detalhes na seção Ruído e escalonamento).

Para saber mais sobre os orçamentos de contribuição, consulte a explicação. Consulte também o orçamento de contribuição para mais orientações.

Limite de contribuição por relatório

Dependendo do autor da chamada, o limite de contribuição pode ser diferente e, para o armazenamento compartilhado, esses limites são padrões que podem ser substituídos. No momento, os relatórios gerados para chamadores da API Shared Storage têm um limite de 20 contribuições por relatório. Por outro lado, os chamadores da API Protected Audience têm um limite de 100 contribuições por relatório. Esses limites foram escolhidos para equilibrar o número de contribuições que podem ser incorporadas com o tamanho da carga útil.

No armazenamento compartilhado, as contribuições feitas em uma única operação run() ou selectURL() são agrupadas em um relatório. Para a API Protected Audience, as contribuições feitas por uma única origem em um leilão são agrupadas.

Contribuições com padding

As contribuições são modificadas ainda mais com um recurso de padding. O padding do payload protege informações sobre o número real de contribuições incorporadas no relatório agregável. O padding aumenta o payload com null contribuições (ou seja, com valor 0) para atingir um tamanho fixo.

Relatórios agregáveis

Quando o usuário invoca a API Private Aggregation, o navegador gera relatórios agregáveis para serem processados pelo serviço de agregação em um momento posterior para gerar relatórios de resumo. Um relatório agregável tem formatação JSON e contém uma lista criptografada de contribuições, cada uma sendo um par {aggregation key, aggregatable value}. Os relatórios agregáveis são enviados com um atraso aleatório de até uma hora.

As contribuições são criptografadas e não podem ser lidas fora do serviço de agregação. O Serviço de agregação descriptografa os relatórios e gera um resumo. A chave de criptografia do navegador e a chave de descriptografia do serviço de agregação são emitidas pelo coordenador, que atua como o serviço de gerenciamento de chaves. O coordenador mantém uma lista de hashes binários da imagem do serviço para verificar se o autor da chamada tem permissão para receber a chave de descriptografia.

Exemplo de relatório agregável com o modo de depuração ativado:

  "aggregation_service_payloads": [
    {
      "debug_cleartext_payload": "omRkYXRhgaJldmFsdWVEAAAAgGZidWNrZXRQAAAAAAAAAAAAAAAAAAAE0mlvcGVyYXRpb25paGlzdG9ncmFt",
      "key_id": "2cc72b6a-b92f-4b78-b929-e3048294f4d6",
      "payload": "a9Mk3XxvnfX70FsKrzcLNZPy+00kWYnoXF23ZpNXPz/Htv1KCzl/exzplqVlM/wvXdKUXCCtiGrDEL7BQ6MCbQp1NxbWzdXfdsZHGkZaLS2eF+vXw2UmLFH+BUg/zYMu13CxHtlNSFcZQQTwnCHb"
    }
  ],
  "debug_key": "777",
  "shared_info": "{\"api\":\"shared-storage\",\"debug_mode\":\"enabled\",\"report_id\":\"5bc74ea5-7656-43da-9d76-5ea3ebb5fca5\",\"reporting_origin\":\"https://localhost:4437\",\"scheduled_report_time\":\"1664907229\",\"version\":\"0.1\"}"

Os relatórios agregáveis podem ser inspecionados na página chrome://private-aggregation-internals:

Página interna da API Private Aggregation

Para fins de teste, o botão "Enviar relatórios selecionados" pode ser usado para enviar o relatório ao servidor imediatamente.

Coletar e agrupar relatórios agregáveis

O navegador envia os relatórios agregáveis para a origem do worklet que contém a chamada para a API Private Aggregation, usando o caminho conhecido listado:

Para o armazenamento compartilhado: /.well-known/private-aggregation/report-shared-storage
Para o Protected Audience: /.well-known/private-aggregation/report-protected-audience

Nesses endpoints, você precisa operar um servidor, que atua como um coletor, e recebe os relatórios agregáveis enviados pelos clientes.

Em seguida, o servidor deve agrupar os relatórios e enviar o lote para o serviço de agregação. Crie lotes com base nas informações disponíveis na carga não criptografada do relatório agregável, como o campo shared_info. O ideal é que os lotes tenham 100 ou mais relatórios cada.

Você pode decidir fazer isso diariamente ou semanalmente. Essa estratégia é flexível, e você pode mudar a estratégia de agrupamento em lote para eventos específicos em que espera mais volume, por exemplo, dias do ano em que mais impressões são esperadas. Os lotes precisam incluir relatórios da mesma versão da API, origem e horário de agendamento.

IDs de filtro

A API Private Aggregation e o serviço de agregação permitem o uso de IDs de filtragem para processar medições em um nível mais granular, como por campanha publicitária, em vez de processar os resultados em consultas maiores.

IDs de filtragem do serviço de agregação e da agregação particular. — IDs de filtragem do serviço de agregação e agregação privada.

Para começar a usar hoje, confira algumas etapas gerais para aplicar à sua implementação atual.

Etapas do armazenamento compartilhado

Se você estiver usando a API Shared Storage no seu fluxo:

Defina onde você vai declarar e executar seu novo módulo de armazenamento compartilhado. No exemplo a seguir, nomeamos o arquivo do módulo como filtering-worklet.js, registrado em filtering-example.
```
(async function runFilteringIdsExample () {
await window.sharedStorage.worklet.addModule('filtering-worklet.js');
await window.sharedStorage.run('filtering-example', {
  keepAlive: true,
  privateAggregationConfig: {
    contextId: 'example-id',
    filteringIdMaxBytes: 8 // optional
  }
}});
})();
```
filteringIdMaxBytes pode ser configurado por relatório e, se não for definido, o padrão será 1. Esse valor padrão evita o aumento desnecessário do tamanho da carga útil e, portanto, dos custos de armazenamento e processamento. Leia mais na explicação sobre a contribuição flexível.

Em filtering-worklet.js, ao transmitir uma contribuição para privateAggregation.contributeToHistogram(...) no worklet do armazenamento compartilhado, é possível especificar um ID de filtragem.

// Within  filtering-worklet.js
class FilterOperation {
  async run() {
    let contributions = [{
      bucket: 1234n,
      value: 56,
      filteringId: 3n // defaults to 0n if not assigned, type bigint
    }];

    for (const c of contributions) {
      privateAggregation.contributeToHistogram(c);
    }
    …
}
});

register('filtering-example', FilterOperation);

Os relatórios agregáveis serão enviados para o endpoint /.well-known/private-aggregation/report-shared-storage definido por você. Continue no guia de filtragem de IDs para saber mais sobre as mudanças necessárias nos parâmetros de job do Serviço de agregação.

Depois que o agrupamento em lotes for concluído e enviado ao serviço de agregação implantado, os resultados filtrados vão aparecer no relatório de resumo final.

Etapas da API Protected Audience

Se você estiver usando a API Protected Audience no seu fluxo:

Na sua implementação atual da API Protected Audience, você pode definir o seguinte para se conectar à agregação particular. Ao contrário do armazenamento compartilhado, ainda não é possível configurar o tamanho máximo dos IDs de filtragem. Por padrão, o tamanho máximo do ID de filtragem é de 1 byte e será definido como 0n. Essas funções seriam definidas nas suas funções de relatórios da API Protected Audience (por exemplo, reportResult() ou generateBid()).
```
const contribution = {
  ...
  filteringId: 0n
};

privateAggregation.contributeToHistogram(contribution);
```
Os relatórios agregáveis serão enviados para o endpoint /.well-known/private-aggregation/report-protected-audience definido por você. Depois que o agrupamento em lotes for concluído e enviado ao serviço de agregação implantado, os resultados filtrados serão refletidos no relatório de resumo final. Os seguintes artigos explicativos sobre a API Attribution Reporting e a API Private Aggregation estão disponíveis, assim como a proposta inicial.

Continue lendo nosso guia de filtragem de IDs no Serviço de agregação ou acesse as seções da API Attribution Reporting para ler uma explicação mais detalhada.

Serviço de agregação

O serviço é executado em um TEE, descriptografa os relatórios agregáveis e adiciona
ruído para criar o relatório resumido final. — O serviço é executado em um TEE, descriptografa os relatórios agregáveis e adiciona ruído para criar o relatório de resumo final.

O Serviço de agregação recebe relatórios agregáveis criptografados do coletor e gera relatórios de resumo. Para mais estratégias sobre como agrupar relatórios agregáveis em lote no seu coletor, consulte nosso guia de loteamento.

O serviço é executado em um ambiente de execução confiável (TEE), que oferece um nível de garantia para integridade e confidencialidade de dados e integridade de código. Se quiser saber mais sobre como os coordenadores são usados com os TEEs, leia sobre a função e a finalidade deles.

Relatórios de resumo

Os relatórios de resumo permitem ver os dados coletados com ruído adicionado. É possível solicitar relatórios de resumo para um determinado conjunto de chaves.

Um relatório de resumo contém um conjunto de pares de chave-valor no estilo de dicionário JSON. Cada par contém:

bucket: a chave de agregação como uma string de número binário. Se a chave de agregação usada for "123", o bucket será "1111011".
value: o valor do resumo de uma determinada meta de medição, somado de todos os relatórios agregáveis disponíveis com ruído adicionado.

Exemplo:

[
  {"bucket":` `"111001001",` `"value":` `"2558500"},
  {"bucket":` `"111101001",` `"value":` `"3256211"},
  {"bucket":` `"111101001",` `"value":` `"6536542"},
]

Ruído e escalonamento

Para preservar a privacidade do usuário, a Aggregation Service adiciona ruído uma vez a cada valor de resumo sempre que um relatório resumido é solicitado. Os valores de ruído são extraídos aleatoriamente de uma distribuição de probabilidade de Laplace. Embora você não tenha controle direto sobre as formas de adição de ruído, é possível influenciar o impacto dele nos dados de medição.

A distribuição de ruído é a mesma, independente da soma de todos os valores agregáveis. Portanto, quanto maiores os valores agregáveis, menor será o impacto do ruído.

Por exemplo, suponha que a distribuição de ruído tenha um desvio padrão de 100 e esteja centralizada em zero. Se o valor do relatório agregável coletado (ou "valor agregável") for apenas 200, o desvio padrão do ruído será 50% do valor agregado. Mas, se o valor agregável for 20.000,o desvio padrão do ruído será de apenas 0, 5% do valor agregado. Assim, o valor agregável de 20.000 teria uma proporção sinal-ruído muito maior.

Portanto, multiplicar seu valor agregável por um fator de escalonamento pode ajudar a reduzir o ruído. O fator de escalonamento representa o quanto você quer escalonar um determinado valor agregável.

O ruído é constante, independente do valor agregado. — Constante de ruído independente do valor agregado.

Aumentar os valores escolhendo um fator de escalonamento maior reduz o ruído relativo. No entanto, isso também faz com que a soma de todas as contribuições em todos os intervalos atinja o limite de orçamento de contribuição mais rapidamente. Reduzir os valores escolhendo uma constante de fator de escalonamento menor aumenta o ruído relativo, mas reduz o risco de atingir o limite de orçamento.

Ajuste o valor agregável ao orçamento de contribuição.

Para calcular um fator de escalonamento adequado, divida o orçamento de contribuição pela soma máxima de valores agregáveis em todas as chaves.

Consulte a documentação do orçamento de contribuição para saber mais.

Engajamento e como compartilhar feedback

A API Private Aggregation está em discussão e sujeita a mudanças no futuro. Se você testar essa API e tiver feedback, envie sua opinião.

GitHub: leia a explicação, faça perguntas e participe da discussão.

Princípios básicos da API Private Aggregate Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Para quem é este documento?

Termos-chave

Fluxo de trabalho da API Private Aggregation

Chave de agregação

Valor agregável

Orçamento de contribuição

Limite de contribuição por relatório

Contribuições com padding

Relatórios agregáveis

Coletar e agrupar relatórios agregáveis

IDs de filtro

Etapas do armazenamento compartilhado

Etapas da API Protected Audience

Serviço de agregação

Relatórios de resumo

Ruído e escalonamento

Engajamento e como compartilhar feedback

Princípios básicos da API Private Aggregate