Informacje o tym dokumencie
Czytając ten dokument, dowiesz się:
- Dowiedz się, jakie strategie utworzyć przed wygenerowaniem raportów podsumowujących.
- Poznaj Noise Lab, czyli narzędzie, które pomaga zrozumieć wpływ różnych parametrów hałasu i umożliwia szybkie zbadanie oraz ocenę różnych strategii zarządzania hałasem.

Prześlij opinię
Ten dokument zawiera kilka zasad dotyczących pracy z raportami zbiorczymi, ale istnieją różne metody zarządzania szumem, które mogą nie być tu opisane. Czekamy na Twoje sugestie, dodatki i pytania.
- Aby publicznie ocenić strategie zarządzania hałasem, przydatność lub prywatność interfejsu API (epsilon) oraz podzielić się spostrzeżeniami dotyczącymi symulacji w Noise Lab: Komentuj ten problem
- Aby publicznie wyrazić opinię na temat Noise Lab (zadać pytanie, zgłosić błąd lub poprosić o funkcję): Tutaj utwórz nowe zgłoszenie
- Aby publicznie przekazać opinię na temat innego aspektu interfejsu API: utwórz nowe zgłoszenie tutaj
Zanim rozpoczniesz
- Aby zapoznać się z ogólnymi informacjami na temat raportowania atrybucji, przeczytaj artykuły Raportowanie atrybucji: raporty podsumowania i Pełny system raportowania atrybucji.
- Aby w pełni wykorzystać ten przewodnik, zapoznaj się z artykułami Pojęcie szumu i Pojęcie kluczy agregacji.
Decyzje projektowe
Podstawowa zasada projektowania
Istnieją podstawowe różnice między działaniem plików cookie stron trzecich a raportami podsumowania. Jedną z głównych różnic jest szum dodawany do danych pomiarowych w raportach podsumowujących. Kolejną kwestią jest sposób planowania raportów.
Aby uzyskać dostęp do danych pomiarowych raportu zbiorczego o wyższym współczynniku sygnału do szumu, platformy DSP i dostawcy pomiarów reklam będą musieli współpracować z reklamodawcami nad opracowaniem strategii zarządzania szumem. Aby opracować te strategie, platformy DSP i dostawcy usług pomiarowych muszą podejmować decyzje projektowe. Te decyzje sprowadzają się do jednego kluczowego zagadnienia:
Rozkład wartości szumu zależy w zasadzie tylko od 2 parametrów⏤epsilon i budżetu udziału, ale masz do dyspozycji kilka innych ustawień, które będą wpływać na współczynniki sygnału do szumu danych pomiarowych na wyjściu.
Chociaż spodziewamy się, że proces iteracyjny doprowadzi do podjęcia najlepszych decyzji, każda ich odmiana spowoduje nieco inną implementację. Dlatego decyzje te muszą zostać podjęte przed napisaniem każdej iteracji kodu (i przed wyświetleniem reklam).
Decyzja: szczegółowość wymiarów
Wypróbuj to w Noise Lab
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry odszukaj sekcję Twoje dane o konwersjach.
- Sprawdź parametry domyślne. Domyślna łączna liczba konwersji przypisanych do dnia wynosi 1000. Jeśli korzystasz z ustawienia domyślnego (domyślne wymiary, domyślna liczba możliwych różnych wartości dla każdego wymiaru, strategia kluczowa A), średnia liczba elementów na kolumnę wynosi około 40. Zwróć uwagę, że w polu „Średnia dzienna liczba konwersji przypisanych DO ZASOBNIKA” wartość wynosi 40.
- Kliknij Symuluj, aby przeprowadzić symulację z ustawieniami domyślnymi.
- W panelu bocznym Parametry znajdź Wymiary. Zmień nazwę pola Geografia na Miasto i zwiększ liczbę możliwych wartości do 50.
- Zwróć uwagę, jak to wpływa na średnią dzienną liczbę konwersji przypisanych DO POSZCZEGÓŁNEGO BUCKETA. Teraz jest znacznie niższy. Dzieje się tak, ponieważ zwiększenie liczby możliwych wartości w tej wymiarze bez zmiany innych parametrów powoduje zwiększenie łącznej liczby zbiorów bez zmiany liczby zdarzeń konwersji przypadających na każdy z nich.
- Kliknij Symuluj.
- Sprawdź współczynniki szumów w wyniku symulacji: są one teraz wyższe niż w poprzedniej symulacji.
Zgodnie z główną zasadą projektowania małe wartości podsumowania będą prawdopodobnie bardziej niejednorodne niż duże wartości podsumowania. Dlatego wybór konfiguracji wpływa na to, ile przypisanych zdarzeń konwersji trafia do poszczególnych grup (zwanych kluczem agregacji), a ta ilość wpływa na szum w ostatecznych raportach podsumowania.
Jednym z elementów projektu, który wpływa na liczbę przypisanych zdarzeń konwersji w ramach jednego zagregowania, jest szczegółowość wymiarów. Zapoznaj się z tymi przykładami kluczy agregacji i ich wymiarów:
- Metoda 1. Jedna struktura klucza z grubymi wymiarami: Kraj × Kampania reklamowa (lub największy zbiór agregujący kampanie) × Typ produktu (z 10 możliwych typów produktów)
- Metoda 2. Jedna struktura klucza z wymiarami szczegółowymi: Miasto x Identyfikator kreacji x Produkt (na 100 możliwych produktów)
Miasto to wymiar o większej szczegółowości niż Kraj, Identyfikator kreacji ma większą szczegółowość niż Kampania, a Produkt ma większą szczegółowość niż Typ produktu. Dlatego w przypadku podejścia 2 w wyniku raportu podsumowania będzie mniejsza liczba zdarzeń (konwersji) na grupę (czyli na klucz) niż w przypadku podejścia 1. Ponieważ szum dodawany do danych wyjściowych jest niezależny od liczby zdarzeń w grupie, dane pomiarowe w raportach zbiorczych będą bardziej wiarygodne w przypadku podejścia 2. W przypadku każdego reklamodawcy eksperymentuj z różnymi kompromisami w projektowaniu klucza pod kątem szczegółowości, aby uzyskać jak największą przydatność wyników.
Decyzja: kluczowe struktury
Wypróbuj to w Noise Lab
W trybie uproszczonym używana jest domyślna struktura klucza. W trybie zaawansowanym możesz eksperymentować z różnymi strukturami kluczy. Zawiera ona kilka przykładowych wymiarów, które możesz też zmodyfikować.
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry znajdź opcję Kluczowa strategia. Zwróć uwagę, że domyślna strategia o nazwie A w narzędziu korzysta z jednej szczegółowej struktury kluczy, która obejmuje wszystkie wymiary: geografia x identyfikator kampanii x kategoria produktu.
- Kliknij Symuluj.
- Sprawdź współczynniki hałasu w wyniku symulacji.
- Zmień strategię Klucz na B. Wyświetli się dodatkowe okno, w którym możesz skonfigurować strukturę kluczy.
- Skonfiguruj strukturę kluczy, np. w ten sposób:
- Liczba struktur klucza: 2
- Kluczowa struktura 1 = obszar geograficzny x kategoria produktu.
- Struktura klucza 2 = identyfikator kampanii x kategoria produktu.
- Kliknij Symuluj.
- Zwróć uwagę, że teraz otrzymujesz 2 raporty podsumowania na każdy typ celu pomiarowego (2 raporty dotyczące liczby zakupów i 2 raporty dotyczące wartości zakupu), ponieważ używasz 2 różnych struktur kluczy. Zwróć uwagę na ich stosunek sygnału do szumu.
- Możesz też spróbować tego z własnymi wymiarami niestandardowymi. W tym celu poszukaj danych, które chcesz śledzić: Wymiary. Rozważ usunięcie przykładowych wymiarów i utworzenie własnych za pomocą przycisków Dodaj, Usuń i Resetuj pod ostatnim wymiarem.
Kolejną decyzją projektową, która wpłynie na liczbę przypisanych konwersji w ramach pojedynczego zbiornika, są struktury kluczy, których użyjesz. Oto przykłady kluczy agregacji:
- Jedna struktura klucza ze wszystkimi wymiarami; nazwijmy ją strategia klucza A.
- 2 kluczowe struktury, z których każda zawiera podzbiór wymiarów. Nazwijmy to strategią kluczową B.

Strategia A jest prostsza, ale aby uzyskać dostęp do niektórych statystyk, konieczne może być podsumowanie (zsumowanie) wartości podsumowania uwzględnionych w raportach podsumowania. Dodając te wartości, sumujesz też szum. W przypadku strategii B wartości podsumowania podawane w raportach podsumowujących mogą już zawierać potrzebne informacje. Oznacza to, że strategia B będzie prawdopodobnie dawać lepszy stosunek sygnału do szumu niż strategia A. Jednak w przypadku strategii A szum może być już akceptowalny, więc ze względu na prostotę możesz nadal preferować tę strategię. Więcej informacji znajdziesz w szczegółowym przykładzie przedstawiającym te 2 strategie
Zarządzanie kluczami to skomplikowany temat. Aby poprawić współczynnik sygnału do szumu, można zastosować wiele zaawansowanych technik. Jeden z nich jest opisany w artykule Zaawansowane zarządzanie kluczami.
Decyzja: grupowanie wyświetleń
Wypróbuj to w Noise Lab
- Przejdź do trybu prostego (lub zaawansowanego – oba tryby działają tak samo w przypadku częstotliwości przetwarzania w partiach).
- W panelu bocznym Parametry odszukaj opcję Twoja strategia agregacji > Częstotliwość zbiorczego przetwarzania. Dotyczy to częstotliwości przetwarzania zbiorczego raportów, które można agregować, za pomocą usługi agregującej w ramach jednego zadania.
- Zwróć uwagę na domyślną częstotliwość grupowania: domyślnie symulowana jest codzienna częstotliwość grupowania.
- Kliknij Symuluj.
- Sprawdź współczynniki hałasu w wyniku symulacji.
- Zmień częstotliwość zbiorczego przetwarzania na cotygodniową.
- Zwróć uwagę na współczynniki szumów w wyniku symulacji: współczynniki szumów są teraz niższe (co jest korzystne) niż w poprzedniej symulacji.
Kolejną decyzją projektową, która wpłynie na liczbę przypisanych zdarzeń konwersji w ramach pojedynczego zbioru, jest częstotliwość zbiorczego przetwarzania, którą zdecydujesz się zastosować. Częstotliwość grupowania to częstotliwość przetwarzania raportów, które można agregować.
Raport, który jest agregowany częściej (np. co godzinę), będzie zawierał mniej zdarzeń konwersji niż ten sam raport z rzadszym harmonogramem agregacji (np. co tydzień). W efekcie raport godzinowy będzie zawierał więcej zakłóceń.``` zawierać mniej zdarzeń konwersji niż ten sam raport z rzadszym harmonogramem agregacji (np. co tydzień). W efekcie raport godzinowy będzie miał niższy stosunek sygnału do szumu niż raport tygodniowy, przy pozostałych niezmienionych warunkach. Eksperymentuj z wymaganiami dotyczącymi raportowania na różnych częstotliwościach i ocenjuj współczynniki sygnału do szumu dla każdego z nich.
Więcej informacji znajdziesz w artykułach Przetwarzanie zbiorcze i Agregowanie danych za dłuższe okresy.
Decyzja: zmienne kampanii, które wpływają na przypisywanie konwersji
Wypróbuj to w Noise Lab
Chociaż może być trudno przewidzieć tę liczbę i może ona się znacznie zmieniać (poza sezonowością), spróbuj oszacować liczbę codziennych konwersji przypisywanych pojedynczemu kliknięciu do najbliższej potęgi 10: 10, 100, 1000 lub 10 000.
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry odszukaj sekcję Twoje dane o konwersjach.
- Sprawdź parametry domyślne. Domyślna łączna liczba konwersji przypisanych do dnia wynosi 1000. Jeśli korzystasz z ustawienia domyślnego (domyślne wymiary, domyślna liczba możliwych różnych wartości dla każdego wymiaru, strategia kluczowa A), średnia liczba elementów na kolumnę wynosi około 40. Zwróć uwagę, że w polu „Średnia dzienna liczba konwersji przypisanych DO ZASOBNIKA” wartość wynosi 40.
- Kliknij Symuluj, aby przeprowadzić symulację z ustawieniami domyślnymi.
- Sprawdź współczynniki hałasu w wyniku symulacji.
- Teraz ustaw łączną dzienną liczbę konwersji przypisanych na 100. Zwróć uwagę, że zmniejsza to wartość średniej dziennej liczby konwersji przypisywalnych DO POSZCZEGÓŁOWEGO BUCKETA.
- Kliknij Symuluj.
- Zauważ, że współczynniki szumu są teraz wyższe: wynika to z tego, że gdy masz mniej konwersji na jeden przedział, na potrzeby ochrony prywatności stosuje się większy szum.
Ważne jest rozróżnienie łącznej liczby możliwych konwersji dla danego reklamodawcy i łącznej liczby możliwych konwersji przypisanych. To właśnie ma wpływ na szum w raportach podsumowujących. Przypisane konwersje to podzbiór całkowitej liczby konwersji, które są podatne na zmienne kampanii, np. budżet reklamy i kierowanie reklam. Na przykład przy założeniu, że wszystkie inne czynniki są takie same, można oczekiwać większej liczby przypisanych konwersji w przypadku kampanii reklamowej o budżecie 10 mln USD niż w przypadku kampanii reklamowej o budżecie 10 tys. USD.
Kwestie, na które należy zwrócić uwagę:
- Oceniaj przypisane konwersje za pomocą modelu atrybucji „jeden punkt styczności z klientem” na tym samym urządzeniu, ponieważ są one uwzględniane w raportach zbiorczych zebranych za pomocą interfejsu Attribution Reporting API.
- W przypadku konwersji przypisanych weź pod uwagę zarówno scenariusz najgorszego, jak i najlepszego wyniku. Na przykład, przy założeniu, że wszystkie inne czynniki są takie same, weź pod uwagę minimalny i maksymalny możliwy budżet kampanii reklamodawcy, a potem prognozuj przypisane konwersje dla obu wyników jako dane wejściowe do symulacji.
- Jeśli rozważasz korzystanie z Piaskownicy prywatności na Androida, weź pod uwagę konwersje przypisane do różnych platform.
Decyzja: użycie skalowania
Wypróbuj to w Noise Lab
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry znajdź opcję Twoja strategia agregacji > Skalowanie. Domyślnie jest ono ustawione na „Tak”.
- Aby zrozumieć pozytywny wpływ skalowania na współczynnik szumu, najpierw ustaw opcję Skalowanie na „Nie”.
- Kliknij Symuluj.
- Sprawdź współczynniki hałasu w wyniku symulacji.
- Ustaw opcję Skalowanie na Tak. Pamiętaj, że Noise Lab automatycznie oblicza współczynniki skalowania, które mają być używane na podstawie zakresów (wartości średniej i maksymalnej) celów pomiarów w danym scenariuszu. W przypadku prawdziwego systemu lub testu próbnego pochodzenia warto zaimplementować własne obliczenia czynników skalowania.
- Kliknij Symuluj.
- Zwróć uwagę, że w tej drugiej symulacji współczynniki szumów są niższe (lepsze). Wynika to z tego, że używasz skalowania.
Zgodnie z główną zasadą projektowania dodawany szum jest funkcją budżetu na wkład.
Aby zwiększyć współczynnik sygnału do szumu, możesz przekształcić wartości zebrane podczas zdarzenia konwersji, skalując je w stosunku do budżetu na udział (a po agregacji odskalować). Stosuj skalowanie, aby zwiększać współczynniki sygnału do szumu.
Decyzja: liczba celów pomiarowych i podział budżetu na potrzeby prywatności
Dotyczy to skalowania. Przeczytaj artykuł Używanie skalowania.
Wypróbuj to w Noise Lab
Cel pomiarowy to odrębny punkt danych zbierany w zdarzeniach konwersji.
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry odszukaj dane, które chcesz śledzić: Cele pomiarowe. Domyślnie masz 2 cele pomiarowe: wartość zakupu i liczbę zakupów.
- Kliknij Symuluj, aby uruchomić symulację z domyślnymi celami.
- Kliknij Usuń. Spowoduje to usunięcie ostatniego celu pomiaru (w tym przypadku zliczanie zakupów).
- Kliknij Symuluj.
- Zwróć uwagę, że w tej drugiej symulacji współczynniki szumów w przypadku wartości zakupu są mniejsze (co jest korzystniejsze). Dzieje się tak, ponieważ masz mniej celów pomiarowych, więc jeden cel pomiarowy otrzymuje teraz cały budżet na współfinansowanie.
- Kliknij Resetuj. Ponownie masz 2 cele pomiarowe: wartość zakupu i liczbę zakupów. Pamiętaj, że Noise Lab automatycznie oblicza współczynniki skalowania, które mają być używane na podstawie zakresów (wartości średniej i maksymalnej) celów pomiarów w Twoim scenariuszu. Domyślnie Noise Lab dzieli budżet równomiernie między cele pomiarowe.
- Kliknij Symuluj.
- Sprawdź współczynniki hałasu w wyniku symulacji. Zwróć uwagę na współczynniki skalowania wyświetlane w simulacji.
- Skonfigurujmy teraz podział budżetu na potrzeby ochrony prywatności, aby uzyskać lepszy współczynnik sygnału do szumu.
- Dostosuj wartość procentową budżetu przypisaną do każdego celu pomiarowego. Przy założeniu domyślnych parametrów cel pomiarowy 1, czyli wartość zakupu, ma znacznie szerszy zakres (od 0 do 1000) niż cel pomiarowy 2, czyli liczba zakupów (od 1 do 1, czyli zawsze równa 1). W związku z tym potrzebuje „większej przestrzeni na skalowanie”. Najlepiej byłoby przypisać większe środki na realizację celu pomiarowego 1 niż celu pomiarowego 2, aby można było go efektywniej skalować (patrz: „Skalowanie”).
- Przypisz 70% budżetu do celu pomiarowego 1. Przypisz 30% do celu pomiarowego 2.
- Kliknij Symuluj.
- Sprawdź współczynniki hałasu w wyniku symulacji. W przypadku wartości zakupu współczynniki szumów są teraz znacznie niższe (lepsze) niż w przypadku poprzedniej symulacji. Liczba zakupów pozostała mniej więcej na tym samym poziomie.
- Ciągle dostosowuj podział budżetu do danych. Zwróć uwagę, jak to wpływa na szum.
Pamiętaj, że za pomocą przycisków Dodaj, Usuń i Resetuj możesz ustawiać własne niestandardowe cele pomiarowe.
Jeśli bierzesz pod uwagę jeden punkt danych (cel pomiaru) w związku ze zdarzeniem konwersji, np. liczbą konwersji, ten punkt danych może otrzymać cały budżet udziału (65 536). Jeśli w przypadku zdarzenia konwersji ustawisz kilka celów pomiarowych, np. liczbę konwersji i wartość zakupu, te punkty danych będą musiały dzielić budżet na cele. Oznacza to, że masz mniejsze pole manewru na zwiększanie wartości.
Dlatego im więcej masz celów pomiarowych, tym niższy jest prawdopodobnie stosunek sygnału do szumu (im większy szum).
Kolejną decyzją dotyczącą celów pomiarowych jest podział budżetu. Jeśli podzielisz budżet na potrzeby udziału w dochodach po równo na 2 punkty danych, każdy z nich otrzyma budżet 65 536/2 = 32 768. Może to być optymalne, ale nie musi, w zależności od maksymalnej możliwej wartości każdego punktu danych. Jeśli np. mierzysz liczbę zakupów o wartości maksymalnej 1 i wartość zakupu o wartości minimalnej 1 i maksymalnie 120, warto zwiększyć „przestrzeń” przeznaczoną na wartość zakupu, czyli zwiększyć jej udział w budżecie na udział w dobrach. Zobaczysz, czy niektóre cele pomiarowe powinny być traktowane priorytetowo w stosunku do innych ze względu na wpływ szumu.
Decyzja: zarządzanie wartościami odstającymi
Wypróbuj to w Noise Lab
Cel pomiarowy to odrębny punkt danych zbierany w zdarzeniach konwersji.
- Przejdź do trybu zaawansowanego.
- W panelu bocznym Parametry znajdź opcję Twoja strategia agregacji > Skalowanie.
- Upewnij się, że opcja Skalowanie jest ustawiona na Tak. Pamiętaj, że Noise Lab automatycznie oblicza współczynniki skalowania na podstawie podanych przez Ciebie zakresów (wartości średniej i maksymalnej) dla celów pomiarowych.
- Załóżmy, że największy zakup w historii to 2000 USD, ale większość zakupów mieści się w zakresie 10–120 USD. Najpierw sprawdźmy, co się stanie, jeśli użyjemy dosłownego podejścia do skalowania (niezalecane): wpisz 2000 USD jako maksymalną wartość parametru purchaseValue.
- Kliknij Symuluj.
- Zauważ, że współczynniki szumów są wysokie. Dzieje się tak, ponieważ nasz współczynnik skalowania jest obecnie obliczany na podstawie kwoty 2000 USD, podczas gdy w większości przypadków wartości zakupów są znacznie niższe.
- Teraz zastosujemy bardziej praktyczne podejście do skalowania. Zmień maksymalną wartość zakupu na 120 USD.
- Kliknij Symuluj.
- Zwróć uwagę, że w tej drugiej symulacji współczynniki szumów są niższe (co jest korzystniejsze).
Aby wdrożyć skalowanie, zwykle obliczasz współczynnik skalowania na podstawie maksymalnej możliwej wartości danego zdarzenia konwersji (więcej informacji znajdziesz w tym przykładzie).
Unikaj jednak stosowania do obliczenia tego współczynnika skalowania dosłownej wartości maksymalnej, ponieważ pogorszy to współczynnik sygnału do szumu. Zamiast tego usuń wartości odstające i użyj praktycznej wartości maksymalnej.
Zarządzanie wartościami odstającymi to skomplikowany temat. Aby poprawić współczynnik sygnału do szumu, można zastosować wiele zaawansowanych technik. Jedną z nich opisujemy w artykule Zaawansowane zarządzanie wartościami odstającemi.
Dalsze kroki
Po przeanalizowaniu różnych strategii zarządzania szumem w danym przypadku użycia możesz zacząć eksperymentować z raportami podsumowania, zbierając rzeczywiste dane pomiarowe za pomocą próbnego pomiaru pochodzenia. Zapoznaj się z przewodnikami i wskazówkami, aby wypróbować interfejs API.
Dodatek
Krótka prezentacja Noise Lab
Noise Lab pomaga szybko oceniać i porównywać strategie zarządzania hałasem. Pozwala na:
- Poznaj główne parametry, które mogą wpływać na szum, oraz ich wpływ.
- Symulowanie wpływu szumu na dane pomiarowe wyjściowe w zależności od różnych decyzji projektowych. Dostosuj parametry projektu, aż uzyskasz stosunek sygnału do szumu, który będzie odpowiedni w danym przypadku użycia.
- Podziel się opinią na temat przydatności raportów zbiorczych: które wartości parametrów epsilon i szum są dla Ciebie odpowiednie, a które nie? Gdzie znajdują się punkty przegięcia?
Jest to etap przygotowawczy. Noise Lab generuje dane pomiarowe, aby symulować dane wyjściowe raportu podsumowania na podstawie podanych przez Ciebie informacji. Nie przechowuje ani nie udostępnia żadnych danych.
W Noise Lab są 2 tryby:
- Tryb prosty: poznaj podstawy elementów sterujących hałasem.
- Tryb zaawansowany: testuj różne strategie zarządzania szumem i oceniaj, która z nich zapewnia najlepszy stosunek sygnału do szumu w przypadku Twoich zastosowań.
Aby przełączać się między tymi trybami (1. na zrzucie ekranu poniżej), kliknij przyciski w górnym menu.
Tryb prosty
- W trybie uproszczonym możesz kontrolować parametry (znajdujące się po lewej stronie lub #2. na poniższym zrzucie ekranu), takie jak epsilon, i obserwować ich wpływ na szum.
- Każdy parametr ma etykietę (przycisk „?”). Kliknij te ikony, aby wyświetlić wyjaśnienie każdego parametru (#3. na poniższym zrzucie ekranu).
- Aby rozpocząć, kliknij przycisk „Symuluj” i obserwuj wynik (#4. na zrzucie ekranu poniżej).
- W sekcji Wyjście możesz zobaczyć różne szczegóły. Obok niektórych elementów znajduje się znak zapytania. Warto kliknąć każdy znak „?”, aby wyświetlić wyjaśnienia dotyczące różnych informacji.
- W sekcji Wyjście kliknij przełącznik Szczegóły, jeśli chcesz wyświetlić rozwiniętą wersję tabeli (#5. na zrzucie ekranu poniżej).
- Pod każdą tabelą danych w sekcji danych wyjściowych znajduje się opcja umożliwiająca pobranie tabeli na potrzeby korzystania z niej w trybie offline. W prawym dolnym rogu jest też opcja pobierania wszystkich tabel danych (#6. na poniższym zrzucie ekranu).
- W sekcji Parametry przetestuj różne ustawienia parametrów i kliknij Symuluj, aby sprawdzić, jak wpływają one na dane wyjściowe:
Interfejs Noise Lab w trybie uproszczonym.
Tryb dla zaawansowanych
- W trybie zaawansowanym masz większą kontrolę nad parametrami. Możesz dodawać niestandardowe cele pomiarowe i wymiary (1. i 2. na zrzucie ekranu poniżej).
- Przewiń w dół sekcję Parametry i zobacz opcję Kluczowa strategia. Możesz go użyć do przetestowania różnych struktur kluczy (3. na zrzucie ekranu poniżej).
- Aby przetestować różne struktury kluczy, zmień strategię klucza na „B”.
- Wpisz liczbę różnych struktur kluczy, których chcesz użyć (domyślnie jest to „2”).
- Kliknij Generuj struktury kluczy.
- Aby określić struktury kluczy, kliknij pola wyboru obok kluczy, które chcesz uwzględnić w każdej strukturze.
- Aby zobaczyć wynik, kliknij Symuluj.
Interfejs Noise Lab w trybie zaawansowanym. Interfejs Noise Lab w trybie zaawansowanym.
Dane dotyczące hałasu
Koncepcja podstawowa
Sztuczny szum jest dodawany w celu ochrony prywatności poszczególnych użytkowników.
Wysoka wartość szumów wskazuje, że zbiory lub klucze są rzadkie i zawierają dane pochodzące z ograniczonej liczby wrażliwych zdarzeń. Jest to wykonywane automatycznie przez Noise Lab, aby umożliwić użytkownikom „ukrywanie się w tłumie”. Innymi słowy, chronimy prywatność tych osób, dodając do dźwięku większy szum.
Niska wartość szumów wskazuje, że konfiguracja danych została zaprojektowana w taki sposób, aby umożliwiała użytkownikom „ukrywanie się w tłumie”. Oznacza to, że zbiory zawierają dane pochodzące z wystarczającej liczby zdarzeń, aby zapewnić ochronę prywatności poszczególnych użytkowników.
To stwierdzenie jest prawdziwe zarówno w przypadku średniego błędu procentowego (APE), jak i błędu średniokwadratowego względnego z prognozą (RMSRE_T).
APE (średni błąd procentowy)
APE to stosunek szumu do sygnału, czyli rzeczywista wartość zbiorcza.p>Niższe wartości APE oznaczają lepszy stosunek sygnału do szumu.
Formuła
W przypadku danego raportu zbiorczego wskaźnik APE jest obliczany w ten sposób:

True to prawdziwa wartość podsumowania. APE to średnia wartość szumu w przypadku każdej prawdziwej wartości podsumowania, obliczona jako średnia wszystkich wpisów w raporcie podsumowania. W Noise Lab wynik jest następnie mnożony przez 100, aby uzyskać wartość procentową.
Zalety i wady
Segmenty o mniejszych rozmiarach mają nieproporcjonalny wpływ na ostateczną wartość APE. Może to wprowadzać w błąd przy ocenie szumów. Dlatego dodaliśmy kolejny rodzaj danych RMSRE_T, który ma na celu ograniczenie tego ograniczenia w przypadku APE. Szczegółowe informacje znajdziesz w przykładach.
Kod
Sprawdź kod źródłowy, aby dowiedzieć się, jak jest obliczana APE.
RMSRE_T (średnia kwadratowa błędu względnego z progiem)
RMSRE_T (średnia kwadratowa błędu względnego z prognozą) to kolejny wskaźnik szumu.
Interpretowanie wartości RMSRE_T
Im niższe wartości RMSRE_T, tym lepszy stosunek sygnału do szumu.
Jeśli na przykład stosunek szumu, który jest dopuszczalny w przypadku Twojego zastosowania, wynosi 20%, a RMSRE_T – 0,2, możesz mieć pewność, że poziom szumu mieści się w dopuszczalnym zakresie.
Formuła
W przypadku danego raportu zbiorczego RMSRE_T jest obliczana w ten sposób:

Zalety i wady
Wartość RMSRE_T jest nieco trudniejsza do zrozumienia niż APE. Ma on jednak kilka zalet, które w niektórych przypadkach sprawiają, że jest on bardziej odpowiedni niż APE do analizowania szumu w raportach podsumowania:
- RMSRE_T jest bardziej stabilny. „T” to wartość progowa. Parametr „T” służy do nadawania mniejszej wagi w obliczeniach RMSRE_T grupom, które mają mniej konwersji i dlatego są bardziej podatne na szumy ze względu na ich małą wielkość. W przypadku T dane nie osiągają szczytów w przypadku zbiorów z niewielką liczbą konwersji. Jeśli T jest równe 5, wartość szumu wynosząca 1 w grupie z 0 konwersjami nie będzie wyświetlana jako większa niż 1. Zamiast tego zostanie ona ograniczona do 0, 2, co odpowiada 1/5, ponieważ T = 5. Dzięki temu, że mniejsze zbiory mają mniejszy udział w wyliczeniu, a zatem są bardziej podatne na szumy, wskaźnik jest stabilniejszy, co ułatwia porównywanie 2 symulacji.
- RMSRE_T umożliwia łatwą agregację. Znajomość wartości RMSRE_T wielu zbiorników wraz z ich rzeczywistymi wartościami umożliwia obliczenie wartości RMSRE_T ich sumy. Dzięki temu możesz też optymalizować skuteczność pod kątem wartości RMSRE_T w przypadku tych wartości połączonych.
Mimo że agregacja jest możliwa w przypadku APE, formuła jest dość skomplikowana, ponieważ obejmuje wartość bezwzględną sumy szumów Laplace’a. W efekcie utrudnia to optymalizację APE.
Kod
Sprawdź kod źródłowy, aby dowiedzieć się, jak oblicza się RMSRE_T.
Przykłady
Raport zbiorczy z 3 grupami:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = hałas: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Raport zbiorczy z 3 grupami:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = hałas: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Raport zbiorczy z 3 grupami:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = hałas: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + nieskończoność) / 3 = nieskończoność
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Zaawansowane zarządzanie kluczami
Platforma DSP lub firma zajmująca się pomiarem reklam może mieć tysiące klientów na całym świecie, którzy działają w różnych branżach i w różnych walutach oraz mają różne ceny zakupu. Oznacza to, że tworzenie klucza agregacji na reklamodawcę i zarządzanie nim może być bardzo niepraktyczne. Poza tym trudno będzie wybrać maksymalną wartość agregowalną i budżet agregacji, które ograniczą wpływ szumu w przypadku tysięcy reklamodawców na całym świecie. Zamiast tego rozważ te scenariusze:
Kluczowa strategia A
Dostawca technologii reklamowych decyduje się utworzyć 1 klucz i zarządzać nim w przypadku wszystkich swoich klientów reklamowych. W przypadku wszystkich reklamodawców i wszystkich walut zakres zakupów obejmuje zarówno drogie produkty kupowane w małej ilości, jak i tańsze produkty kupowane w dużej ilości. W rezultacie otrzymujemy klucz:
Klucz (wiele walut) | |
---|---|
Maksymalna wartość agregowalna | 5 000 000 |
Przedział wartości zakupu | [120 – 5 000 000] |
Kluczowa strategia B
Dostawca technologii reklamowych decyduje się utworzyć 2 klucze i zarządzać nimi w przypadku wszystkich swoich klientów reklamowych. Decydują się na rozdzielenie kluczy według waluty. W przypadku wszystkich reklamodawców i wszystkich walut zakres zakupów obejmuje od niewielkich zakupów droższych produktów po duże zakupy tańszych produktów. Podział według waluty powoduje utworzenie 2 kluczy:
Klucz 1 (USD) | Klawisz 2 (¥) | |
---|---|---|
Maksymalna wartość agregowalna | 40 000 USD | 5 000 000 JPY |
Przedział wartości zakupu | [120 – 40 000] | [15 tys. – 5 mln] |
Strategia B będzie miała mniej zakłóceń w wynikach niż strategia A, ponieważ wartości walut nie są równomiernie rozłożone między poszczególne waluty. Rozważ na przykład, jak zakupy w JPY mieszane z zakupami w USD zmieniają dane źródłowe i powodują niespójności w wynikach.
Kluczowa strategia C
Dostawca technologii reklamowej decyduje się utworzyć 4 klucze i zarządzać nimi w przypadku wszystkich klientów reklamowych, dzieląc je według waluty i branży reklamodawcy:
Klawisz 1 (USD x Reklamodawcy oferujący biżuterię luksusową) |
Klucz 2 (¥ x Reklamodawcy luksusowej biżuterii) |
Klucz 3 (USD x Reklamodawcy – sprzedawcy odzieży) |
Klucz 4 (¥ x Reklamodawcy – sklepy odzieżowe) |
|
---|---|---|---|---|
Maksymalna wartość agregowalna | 40 000 USD | 5 000 000 JPY | 500 USD | 65 000 JPY |
Przedział wartości zakupu | [10 000 – 40 000] | [1 250 000–5 000 000] | [120–500] | [15 000 – 65 000] |
Strategia kluczowa C będzie miała mniej zakłóceń w wynikach niż strategia kluczowa B, ponieważ wartości zakupu reklamodawcy nie są równomiernie rozłożone między reklamodawców. Na przykład zakupy drogiej biżuterii powiązane z zakupami czapek baseballowych zmienią dane źródłowe i powodują niechciane wyniki.
Aby zmniejszyć szum w wynikach, rozważ utworzenie wspólnych maksymalnych wartości zbiorczych i wspólnych współczynników skalowania dla wspólnych elementów u różnych reklamodawców. Możesz na przykład eksperymentować z użyciem tych strategii dla swoich reklamodawców:
- 1 strategia z oddzieleniem na walutę (USD, ¥, CAD itp.)
- Jedna strategia podzielona według branży reklamodawcy (ubezpieczenia, motoryzacja, handel detaliczny itp.).
- 1 strategia podzielona na podobne przedziały wartości zakupu ([100], [1000], [10000] itd.).
Dzięki tworzeniu strategii dotyczących słów kluczowych na podstawie podobieństw między reklamodawcami łatwiej jest zarządzać słowami kluczowymi i odpowiednim kodem, a stosunek sygnału do szumu jest wyższy. Eksperymentuj z różnymi strategiami z uwzględnieniem podobieństw między reklamodawcami, aby odkryć punkty zwrotne w maksymalizowaniu wpływu hałasu w porównaniu z zarządzaniem kodem.
Zaawansowane zarządzanie wartościami odstającemi
Rozważmy scenariusz dotyczący 2 reklamodawców:
- Reklamodawca A:
- W przypadku wszystkich produktów w witrynie reklamodawcy A cena zakupu może się wahać w zakresie od 120 do 1000 USD, czyli w zakresie 880 USD.
- Ceny zakupu są równomiernie rozłożone w zakresie 880 USD, bez wartości odstających poza 2 odchylenia standardowe od mediany ceny zakupu.
- Reklamodawca B:
- W przypadku wszystkich produktów w witrynie reklamodawcy B cena zakupu może się wahać w zakresie od 120 do 1000 USD, czyli w zakresie 880 USD.
- Ceny zakupów są mocno zawężone do przedziału 120–500 USD, a tylko 5% zakupów przypada na przedział 500–1000 USD.
Ze względu na wymagania dotyczące budżetu na udział w kosztach oraz metodę, w jaką wprowadzany jest szum w wynikach końcowych, reklamodawca B domyślnie będzie miał bardziej szumny wynik niż reklamodawca A, ponieważ reklamodawca B ma większą szansę na to, że wartości odstające będą miały wpływ na obliczenia podstawowe.
Można to ograniczyć, stosując odpowiednią konfigurację klucza. Testuj strategie kluczy, które pomagają zarządzać danymi wartości odstających i równomierniej rozkładać wartości zakupu w zakresie zakupu klucza.
W przypadku reklamodawcy B możesz utworzyć 2 osobne klucze, aby rejestrować 2 różne zakresy wartości zakupu. W tym przykładzie technologia reklamowa zauważyła, że wartości odstające występują powyżej wartości zakupu 500 USD. Spróbuj zastosować 2 osobne klucze dla tego reklamodawcy:
- Struktura klucza 1 : klucz, który rejestruje tylko zakupy w zakresie od 120 do 500 USD (obejmujące ok. 95% łącznej liczby zakupów).
- Struktura klucza 2: klucz, który rejestruje tylko zakupy powyżej 500 USD (obejmuje ok. 5% łącznej liczby zakupów).
Wdrożenie tej kluczowej strategii powinno pomóc reklamodawcy B lepiej zarządzać zakłóceniami i maksymalizować przydatność raportów zbiorczych. Mając na uwadze nowe, mniejsze zakresy, klucz A i klucz B powinny mieć teraz bardziej równomierny rozkład danych w poszczególnych kluczach niż w przypadku poprzedniego pojedynczego klucza. W efekcie szum będzie miał mniejszy wpływ na dane wyjściowe każdego klucza niż w przypadku poprzedniego pojedynczego klucza.