Jak to działa

Usługa agregacji dostarcza dostawcom technologii reklamowych statystyk skuteczności, które są potrzebne do zwiększania skuteczności kampanii u klientów.

Ten dokument obejmuje:

Dla kogo jest ten dokument?

Ta strona pomaga dostawcom technologii reklamowych i deweloperom zrozumieć, jak nasze interfejsy API umożliwiają skuteczne pomiary reklam, które chronią prywatność użytkowników.

W tym dokumencie zakładamy, że znasz interfejsy Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared StorageTrusted Execution Environments.

Kluczowe terminy i pojęcia

Zanim przejdziesz dalej, zapoznaj się z najważniejszymi terminami:

Słowniczek

Technologia reklamowa

Platforma reklamowa to firma, która świadczy usługi w zakresie wyświetlania reklam.

Raporty, które można agregować

Raporty podlegające agregacji to zaszyfrowane raporty wysyłane z pojedynczych urządzeń użytkowników. Te raporty zawierają dane o zachowaniu użytkowników i konwersjach w różnych witrynach. Konwersje (czasami nazywane zdarzeniami wywołującymi atrybucję) i powiązane z nimi dane są definiowane przez reklamodawcę lub technologię reklamową. Każdy raport jest zaszyfrowany, aby uniemożliwić innym stronom dostęp do danych źródłowych.

Więcej informacji o raportach możliwych do zsumowania

Rozliczanie raportów zbiorczych

rozproszona księga znajdująca się w obu koordynatorach, która śledzi przypisany budżet prywatności i egzekwuje regułę „Bez duplikatów”. Jest to mechanizm ochrony prywatności, który działa w ramach koordynatorów i zapewnia, że żadne raporty nie są przekazywane przez usługę agregacji poza przydzielony budżet prywatności.

Więcej informacji o strategiach grupowania danych w związku z raportami podlegającymi agregacji

Budżet konta raportu zbiorczego

Odwołania do budżetu, które zapewniają, że poszczególne raporty nie są przetwarzane więcej niż raz.

Usługa do agregacji

Usługa obsługiwana przez firmę zajmującą się technologiami reklamowymi, która przetwarza raporty podlegające agregacji, aby utworzyć raport podsumowania.

Więcej informacji o usłudze agregacji znajdziesz w artykulepełnej wersji warunków.

Potwierdzenie

Mechanizm uwierzytelniania tożsamości oprogramowania, zwykle za pomocą funkcji szyfrowania skrótów lub podpisów. W przypadku propozycji usługi agregacji weryfikacja polega na sprawdzeniu, czy kod działający w usłudze agregacji obsługiwanej przez firmę zajmującą się technologią reklamową jest zgodny z kodem open source.

Więcej informacji o atestach

Bonding z udziałem
Koordynator

Podmioty odpowiedzialne za zarządzanie kluczami i rachunkowość raportów podlegających agregacji. Koordynator prowadzi listę haszy zatwierdzonych konfiguracji usługi agregacji i konfiguruje dostęp do kluczy odszyfrowywania.

Szum i skalowanie

szum statystyczny dodawany do raportów zbiorczych podczas procesu agregacji w celu zachowania prywatności i zapewnienia, że raporty końcowe zawierają anonimowe informacje pomiarowe.

Dowiedz się więcej o mechanizmie addytywnym generującym szum, który jest oparty na rozkładzie Laplace’a.

Miejsce zgłoszenia

Podmiot, który otrzymuje raporty podlegające agregacji, czyli Ty lub zespół ds. technologii reklamowej, który wywołał interfejs Attribution Reporting API. Raporty umożliwiające agregację są wysyłane z urządzeń użytkowników do znanego adresu URL powiązanego z miejscem pochodzenia raportu. Źródło raportowania jest wyznaczane podczas rejestracji.

Udostępniony identyfikator

Obliczona wartość, która składa się z shared_info, reporting_origin, destination_site (tylko w przypadku Attribution Reporting API), source_registration-time (tylko w przypadku Attribution Reporting API), scheduled_report_time oraz wersji.

Wiele raportów, które mają te same atrybuty w polu shared_info, powinno mieć ten sam identyfikator współdzielony. Udostępnione identyfikatory odgrywają ważną rolę w raportowaniu w raportach agregowalnych.

Więcej informacji o zaufanych serwerach

Raport zbiorczy

Typ raportu interfejsów Attribution Reporting API i Private Aggregation API. Raport podsumowania zawiera zagregowane dane o użytkownikach i może zawierać szczegółowe dane o konwersjach z dodanym szumem. Raporty podsumowujące składają się z raportów zbiorczych. Zapewniają one większą elastyczność i bogatszy model danych niż raportowanie na poziomie zdarzenia, co jest szczególnie przydatne w przypadku niektórych zastosowań, np. wartości konwersji.

Zaufane środowisko wykonawcze (TEE)

Bezpieczna konfiguracja sprzętu i oprogramowania komputera, która umożliwia podmiotom zewnętrznym sprawdzenie dokładnych wersji oprogramowania działającego na urządzeniu bez obawy przed ujawnieniem. Środowiska TEE umożliwiają podmiotom zewnętrznym sprawdzenie, czy oprogramowanie działa dokładnie tak, jak twierdzi deweloper, i nic więcej.

Aby dowiedzieć się więcej o zasadach TEE używanych w propozycjach dotyczących Piaskownicy prywatności, przeczytaj informacje o interfejsie Protected Audience APIinformacje o usłudze agregacji danych.

Przepływ pracy usługi agregacji

Usługa do agregacji generuje raporty podsumowujące szczegółowe dane o konwersjach i zasięgu na podstawie surowych raportów podlegających agregacji. Proces generowania raportu obejmuje te etapy:

  1. Przeglądarka pobiera klucz publiczny, aby generować zaszyfrowane raporty.
  2. Zaszyfrowane raporty z możliwością agregacji są wysyłane na serwery dostawców technologii reklamowej.
  3. Serwer dostawcy technologii reklamowej zbiera w partiach raporty (w formacie avro) i wysyła je do usługi do agregacji.
  4. Instancja robocza agregacji pobiera zagregowane raporty w celu ich odszyfrowania.
  5. Instancja robocza agregacji pobiera klucze odszyfrowywania z koordynatora.
  6. Proces agregacji odszyfrowuje raporty na potrzeby agregacji i dodawania szumu.
  7. Usługa rozliczeniowa raportów z możliwością agregacji sprawdza, czy jest wystarczający budżet na potrzeby prywatności, aby wygenerować raport podsumowujący dla danych raportów z możliwością agregacji.
  8. Usługa do agregacji przesyła ostateczny raport podsumowujący.

Na diagramie poniżej przedstawiono działanie usługi do agregacji od momentu otrzymania raportów z urządzeń mobilnych i internetowych do momentu utworzenia przez nią raportu podsumowującego.

Procedura usługi agregacji typu end-to-end.
Cały proces usługi do agregacji

Podsumowując, interfejs Attribution Reporting API lub Private Aggregation API generuje raporty z wielu instancji przeglądarki. Chrome pobiera klucz publiczny, który jest zmieniany co 7 dni, z usługi hostingu kluczy w koordynatorze, aby zaszyfrować raporty przed wysłaniem ich do źródła raportowania technologii reklamowych. Pochodzenie raportowania dostawcy technologii reklamowej zbiera i konwertuje przychodzące raporty do formatu avro, a następnie wysyła je do usługi do agregacji. Gdy do usługi do agregacji zostanie wysłana prośba o przetworzenie partii, pobierze ona klucze odszyfrowywania z usługi hostingu kluczy, odszyfruje raporty, a następnie zagreguje je i doda do nich szum, aby utworzyć raport podsumowujący, o ile wystarczy budżetu prywatności.

Więcej informacji o przygotowywaniu raportów z możliwością agregacji znajdziesz w sekcji dotyczącej wdrażania.

Grupowanie raportów podlegających agregacji

Proces raportowania nie byłby kompletny bez pomocy wyznaczonego serwera źródłowego raportowania, który został określony podczas rejestracji. Pochodzenie raportowania odpowiada za zbieranie, przekształcanie i grupowanie raportów z możliwością agregacji oraz przygotowywanie ich do wysłania do usługi do agregacji w Google Cloud lub Amazon Web Services. Dowiedz się więcej o przygotowywaniu raportów z możliwością agregacji.

Komponenty chmury

Usługa agregacji składa się z kilku komponentów usługi w chmurze. Do aprowizacji i konfigurowania wszystkich niezbędnych komponentów usług w chmurze używasz dostarczonych skryptów Terraform.

Komponenty usługi agregacji w chmurze.
Komponenty chmurowe usługi do agregacji.

Usługa frontendu

Zarządzana usługa w chmurze: Cloud Functions (Google Cloud) / API Gateway (Amazon Web Services)

Usługa frontendu to bezserwerowa brama, która jest głównym punktem wejścia dla wywołań interfejsu Aggregation API służących do tworzenia zadań i pobierania ich stanu. Odpowiada za odbieranie żądań od użytkowników usługi agregacji, weryfikowanie parametrów wejściowych i inicjowanie procesu planowania zadań agregacji.

Usługa frontendu ma 2 dostępne interfejsy API:

Punkt końcowy Opis
createJob Ten interfejs API wywołuje zadanie usługi agregacji. Aby uruchomić zadanie, musisz podać informacje takie jak identyfikator zadania, szczegóły dotyczące pamięci wejściowej i wyjściowej oraz źródło raportowania.
getJob Ten interfejs API zwraca stan zadania o określonym identyfikatorze. Zawiera informacje o stanie zadania, np. „Otrzymano”, „W toku” lub „Zakończono”. Jeśli zadanie zostało zakończone, zwraca też jego wynik, w tym wszelkie komunikaty o błędach, które wystąpiły podczas jego wykonywania.

Zapoznaj się z dokumentacją interfejsu API usługi agregacji.

Kolejka zadań

Zarządzana usługa w chmurze: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)

Kolejka zadań to kolejka komunikatów zawierająca żądania zadań dla usługi do agregacji. Usługa frontendu wstawia do kolejki żądania zadań, które są następnie wykorzystywane przez instancje robocze agregacji, które je przetwarzają.

Cloud Storage

Zarządzana usługa w chmurze: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)

Pliki wejściowe i wyjściowe używane przez usługę agregacji, takie jak zaszyfrowane pliki raportów i wyjściowe raporty podsumowujące, są przechowywane w chmurze.

Baza danych metadanych zadań

Zarządzana usługa w chmurze: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)

Baza danych metadanych zadań służy do przechowywania i śledzenia stanu zadań agregacji. Rejestruje metadane, takie jak czas utworzenia, czas przesłania żądania, czas aktualizacji i stan (np. Otrzymano, W trakcie lub Zakończono). Instancje robocze agregacji aktualizują bazę danych metadanych zadań w miarę postępów w przetwarzaniu zadań.

Zasób roboczy agregacji

Zarządzana usługa w chmurze: Compute Engine z przestrzenią poufną (Google Cloud) / Amazon Web Services EC2 z Nitro Enclave (Amazon Web Services).

Proces roboczy agregacji przetwarza żądania zadań w kolejce zadań i odszyfrowuje zaszyfrowane dane wejściowe za pomocą kluczy pobranych z usługi generowania i dystrybucji kluczy (KGDS) w koordynatorach. Aby zminimalizować opóźnienie przetwarzania zadań, instancje robocze agregacji buforują klucze deszyfrowania przez 8 godzin i używają ich w przetwarzanych zadaniach.

Procesy agregacji działają w instancji zaufanego środowiska wykonawczego (TEE). Pracownik obsługuje tylko 1 zadanie naraz. Możesz skonfigurować wiele instancji roboczych do równoległego przetwarzania zadań, ustawiając konfigurację autoskalowania. Jeśli jest używane, autoskalowanie dynamicznie dostosowuje liczbę instancji roboczych do liczby wiadomości w kolejce zadań. Minimalną i maksymalną liczbę instancji roboczych na potrzeby autoskalowania możesz skonfigurować w pliku środowiska Terraform. Więcej informacji o autoskalowaniu znajdziesz w tych skryptach Terraform: Amazon Web Services lub Google Cloud.

Procesy robocze agregacji wywołują usługę rozliczeniową raportów podlegających agregacji w celu rozliczania raportów podlegających agregacji. Ta usługa sprawdza, czy zadania są uruchamiane tylko wtedy, gdy nie został przekroczony limit budżetu ochrony prywatności. (Patrz reguła „Bez duplikatów”). Jeśli budżet jest dostępny, generowany jest raport podsumowujący z użyciem zaszumionych wartości zagregowanych. Przeczytaj dodatkowe informacje o rozliczaniu raportów zbiorczych.

Procesy agregacji aktualizują metadane zadań w bazie danych metadanych zadań. Te informacje obejmują kody zwrotu zadania i liczniki błędów raportu w przypadku częściowych błędów raportu. Użytkownicy mogą pobrać stan za pomocą interfejsu API getJob do pobierania stanu zadania.

Szczegółowy opis usługi agregacji znajdziesz w tym wyjaśnieniu.

Dalsze kroki

Teraz, gdy wiesz już, jak działa usługa agregacji, zapoznaj się z przewodnikiem dla początkujących, aby wdrożyć własną instancję za pomocą Google Cloud lub Amazon Web Services.