Usługa agregacji dostarcza dostawcom technologii reklamowych statystyk skuteczności, które są potrzebne do zwiększania skuteczności kampanii u klientów.
Ten dokument obejmuje:
- Kluczowe terminy i pojęcia
- Jak działa usługa do agregacji, aby dostarczać szczegółowe dane o konwersjach i pomiarach zasięgu na podstawie surowych raportów podlegających agregacji
- Omówienie założeń grupowania raportów zbiorczych
- Omówienie koncepcyjne komponentów chmury
Dla kogo jest ten dokument?
Ta strona pomaga dostawcom technologii reklamowych i deweloperom zrozumieć, jak nasze interfejsy API umożliwiają skuteczne pomiary reklam, które chronią prywatność użytkowników.
W tym dokumencie zakładamy, że znasz interfejsy Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage i Trusted Execution Environments.
Kluczowe terminy i pojęcia
Zanim przejdziesz dalej, zapoznaj się z najważniejszymi terminami:
Słowniczek
- Technologia reklamowa
-
Platforma reklamowa to firma, która świadczy usługi w zakresie wyświetlania reklam.
- Raporty, które można agregować
-
Aggregatable reports are encrypted reports sent from individual user devices. These reports contain data about cross-site user behavior and conversions. Conversions (sometimes called attribution trigger events) and associated metrics are defined by the advertiser or ad tech. Each report is encrypted to prevent various parties from accessing the underlying data.
- Rozliczanie raportów zbiorczych
-
rozproszona księga znajdująca się w obu koordynatorach, która śledzi przypisany budżet prywatności i egzekwuje regułę „Bez duplikatów”. Jest to mechanizm ochrony prywatności, który działa w ramach koordynatorów i zapewnia, że żadne raporty nie są przekazywane przez usługę agregacji poza przydzielony budżet prywatności.
Więcej informacji o strategiach grupowania danych w związku z raportami podlegającymi agregacji
- Budżet konta raportu zbiorczego
-
References to the budget that ensures individual reports are not processed more than once.
- Usługa do agregacji
-
An ad tech-operated service that processes aggregatable reports to create a summary report.
Read more about the Aggregation Service backstory in our explainer and the full terms list.
- Potwierdzenie
-
A mechanism to authenticate software identity, usually with cryptographic hashes or signatures. For the aggregation service proposal, attestation matches the code running in your ad tech-operated aggregation service with the open source code.
- Bonding z udziałem
- Koordynator
-
Podmioty odpowiedzialne za zarządzanie kluczami i rachunkowość raportów podlegających agregacji. Koordynator prowadzi listę haszy zatwierdzonych konfiguracji usługi agregacji i konfiguruje dostęp do kluczy odszyfrowywania.
- Szum i skalowanie
-
szum statystyczny dodawany do raportów zbiorczych podczas procesu agregacji w celu zachowania prywatności i zapewnienia, że raporty końcowe zawierają anonimowe informacje pomiarowe.
Dowiedz się więcej o mechanizmie addytywnym generującym szum, który jest oparty na rozkładzie Laplace’a.
- Miejsce zgłoszenia
-
The entity that receives aggregatable reports—in other words, you or an ad tech that called the Attribution Reporting API. Aggregatable reports are sent from user devices to a well-known URL associated with the reporting origin. The reporting origin is designated during enrollment.
- Udostępniony identyfikator
-
Obliczona wartość, która składa się z
shared_info,reporting_origin,destination_site(tylko w przypadku Attribution Reporting API),source_registration-time(tylko w przypadku Attribution Reporting API),scheduled_report_timeoraz wersji.Wiele raportów, które mają te same atrybuty w polu
shared_info, powinno mieć ten sam identyfikator współdzielony. Udostępnione identyfikatory odgrywają ważną rolę w raportowaniu w raportach agregowalnych. - Raport zbiorczy
-
Typ raportu interfejsów Attribution Reporting API i Private Aggregation API. Raport podsumowania zawiera zagregowane dane o użytkownikach i może zawierać szczegółowe dane o konwersjach z dodanym szumem. Raporty podsumowujące składają się z raportów zbiorczych. Zapewniają one większą elastyczność i bogatszy model danych niż raportowanie na poziomie zdarzenia, co jest szczególnie przydatne w przypadku niektórych zastosowań, np. wartości konwersji.
- Zaufane środowisko wykonawcze (TEE)
-
A secure configuration of computer hardware and software that allows external parties to verify the exact versions of software running on the machine without fear of exposure. TEEs allow external parties to verify that the software does exactly what the software manufacturer claims it does—nothing more or less.
To learn more about TEEs used for the Privacy Sandbox proposals, read the Protected Audience API services explainer and the Aggregation Service explainer.
Przepływ pracy usługi agregacji
Usługa do agregacji generuje raporty podsumowujące szczegółowe dane o konwersjach i zasięgu na podstawie surowych raportów podlegających agregacji. Proces generowania raportu obejmuje te etapy:
- Przeglądarka pobiera klucz publiczny, aby generować zaszyfrowane raporty.
- Zaszyfrowane raporty z możliwością agregacji są wysyłane na serwery dostawców technologii reklamowej.
- Serwer dostawcy technologii reklamowej zbiera w partiach raporty (w formacie avro) i wysyła je do usługi do agregacji.
- Instancja robocza agregacji pobiera zagregowane raporty w celu ich odszyfrowania.
- Instancja robocza agregacji pobiera klucze odszyfrowywania z koordynatora.
- Proces agregacji odszyfrowuje raporty na potrzeby agregacji i dodawania szumu.
- Usługa rozliczeniowa raportów z możliwością agregacji sprawdza, czy jest wystarczający budżet na potrzeby prywatności, aby wygenerować raport podsumowujący dla danych raportów z możliwością agregacji.
- Usługa do agregacji przesyła ostateczny raport podsumowujący.
Na diagramie poniżej przedstawiono działanie usługi do agregacji od momentu otrzymania raportów z urządzeń mobilnych i internetowych do momentu utworzenia przez nią raportu podsumowującego.
Podsumowując, interfejs Attribution Reporting API lub Private Aggregation API generuje raporty z wielu instancji przeglądarki. Chrome pobiera klucz publiczny, który jest zmieniany co 7 dni, z usługi hostingu kluczy w koordynatorze, aby zaszyfrować raporty przed wysłaniem ich do źródła raportowania technologii reklamowych. Pochodzenie raportowania dostawcy technologii reklamowej zbiera i konwertuje przychodzące raporty do formatu avro, a następnie wysyła je do usługi do agregacji. Gdy do usługi do agregacji zostanie wysłana prośba o przetworzenie partii, pobierze ona klucze odszyfrowywania z usługi hostingu kluczy, odszyfruje raporty, a następnie zagreguje je i doda do nich szum, aby utworzyć raport podsumowujący, o ile wystarczy budżetu prywatności.
Więcej informacji o przygotowywaniu raportów z możliwością agregacji znajdziesz w sekcji dotyczącej wdrażania.
Grupowanie raportów podlegających agregacji
Proces raportowania nie byłby kompletny bez pomocy wyznaczonego serwera źródłowego raportowania, który został określony podczas rejestracji. Pochodzenie raportowania odpowiada za zbieranie, przekształcanie i grupowanie raportów z możliwością agregacji oraz przygotowywanie ich do wysłania do usługi do agregacji w Google Cloud lub Amazon Web Services. Dowiedz się więcej o przygotowywaniu raportów z możliwością agregacji.
Komponenty chmury
Usługa agregacji składa się z kilku komponentów usługi w chmurze. Do aprowizacji i konfigurowania wszystkich niezbędnych komponentów usług w chmurze używasz dostarczonych skryptów Terraform.
Usługa frontendu
Zarządzana usługa w chmurze: Cloud Functions (Google Cloud) / API Gateway (Amazon Web Services)
Usługa frontendu to bezserwerowa brama, która jest głównym punktem wejścia dla wywołań interfejsu Aggregation API służących do tworzenia zadań i pobierania ich stanu. Odpowiada za odbieranie żądań od użytkowników usługi agregacji, weryfikowanie parametrów wejściowych i inicjowanie procesu planowania zadań agregacji.
Usługa frontendu ma 2 dostępne interfejsy API:
| Punkt końcowy | Opis |
|---|---|
createJob |
Ten interfejs API wywołuje zadanie usługi agregacji. Aby uruchomić zadanie, musisz podać informacje takie jak identyfikator zadania, szczegóły dotyczące pamięci wejściowej i wyjściowej oraz źródło raportowania. |
getJob |
Ten interfejs API zwraca stan zadania o określonym identyfikatorze. Zawiera informacje o stanie zadania, np. „Otrzymano”, „W toku” lub „Zakończono”. Jeśli zadanie zostało zakończone, zwraca też jego wynik, w tym wszelkie komunikaty o błędach, które wystąpiły podczas jego wykonywania. |
Zapoznaj się z dokumentacją interfejsu API usługi agregacji.
Kolejka zadań
Zarządzana usługa w chmurze: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
Kolejka zadań to kolejka komunikatów zawierająca żądania zadań dla usługi do agregacji. Usługa frontendu wstawia do kolejki żądania zadań, które są następnie wykorzystywane przez instancje robocze agregacji, które je przetwarzają.
Cloud Storage
Zarządzana usługa w chmurze: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)
Pliki wejściowe i wyjściowe używane przez usługę agregacji, takie jak zaszyfrowane pliki raportów i wyjściowe raporty podsumowujące, są przechowywane w chmurze.
Baza danych metadanych zadań
Zarządzana usługa w chmurze: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
Baza danych metadanych zadań służy do przechowywania i śledzenia stanu zadań agregacji. Rejestruje metadane, takie jak czas utworzenia, czas przesłania żądania, czas aktualizacji i stan (np. Otrzymano, W trakcie lub Zakończono). Instancje robocze agregacji aktualizują bazę danych metadanych zadań w miarę postępów w przetwarzaniu zadań.
Zasób roboczy agregacji
Zarządzana usługa w chmurze: Compute Engine z przestrzenią poufną (Google Cloud) / Amazon Web Services EC2 z Nitro Enclave (Amazon Web Services).
Proces roboczy agregacji przetwarza żądania zadań w kolejce zadań i odszyfrowuje zaszyfrowane dane wejściowe za pomocą kluczy pobranych z usługi generowania i dystrybucji kluczy (KGDS) w koordynatorach. Aby zminimalizować opóźnienie przetwarzania zadań, instancje robocze agregacji buforują klucze deszyfrowania przez 8 godzin i używają ich w przetwarzanych zadaniach.
Procesy agregacji działają w instancji zaufanego środowiska wykonawczego (TEE). Pracownik obsługuje tylko 1 zadanie naraz. Możesz skonfigurować wiele instancji roboczych do równoległego przetwarzania zadań, ustawiając konfigurację autoskalowania. Jeśli jest używane, autoskalowanie dynamicznie dostosowuje liczbę instancji roboczych do liczby wiadomości w kolejce zadań. Minimalną i maksymalną liczbę instancji roboczych na potrzeby autoskalowania możesz skonfigurować w pliku środowiska Terraform. Więcej informacji o autoskalowaniu znajdziesz w tych skryptach Terraform: Amazon Web Services lub Google Cloud.
Procesy robocze agregacji wywołują usługę rozliczeniową raportów podlegających agregacji w celu rozliczania raportów podlegających agregacji. Ta usługa sprawdza, czy zadania są uruchamiane tylko wtedy, gdy nie został przekroczony limit budżetu ochrony prywatności. (Patrz reguła „Bez duplikatów”). Jeśli budżet jest dostępny, generowany jest raport podsumowujący z użyciem zaszumionych wartości zagregowanych. Przeczytaj dodatkowe informacje o rozliczaniu raportów zbiorczych.
Procesy agregacji aktualizują metadane zadań w bazie danych metadanych zadań. Te informacje obejmują kody zwrotu zadania i liczniki błędów raportu w przypadku częściowych błędów raportu. Użytkownicy mogą pobrać stan za pomocą interfejsu API getJob do pobierania stanu zadania.
Szczegółowy opis usługi agregacji znajdziesz w tym wyjaśnieniu.
Dalsze kroki
Teraz, gdy wiesz już, jak działa usługa agregacji, zapoznaj się z przewodnikiem dla początkujących, aby wdrożyć własną instancję za pomocą Google Cloud lub Amazon Web Services.