Informationen zu diesem Dokument
In diesem Dokument erfahren Sie Folgendes:
- Hier erfahren Sie, welche Strategien Sie erstellen müssen, bevor Sie Zusammenfassungsberichte generieren.
- Sie lernen Noise Lab kennen, ein Tool, mit dem Sie die Auswirkungen verschiedener Rauschparameter nachvollziehen und verschiedene Strategien zur Rauschunterdrückung schnell untersuchen und bewerten können.

Feedback geben
In diesem Dokument werden einige Grundsätze für die Arbeit mit Zusammenfassungsberichten zusammengefasst. Es gibt jedoch mehrere Ansätze für die Rauschunterdrückung, die hier möglicherweise nicht berücksichtigt werden. Wir freuen uns über Ihre Vorschläge, Ergänzungen und Fragen.
- Wenn Sie öffentliches Feedback zu Strategien zur Rauschunterdrückung, zur Nützlichkeit oder zum Datenschutz der API (Epsilon) geben und Ihre Beobachtungen bei der Simulation mit Noise Lab teilen möchten, kommentieren Sie dieses Problem.
- So geben Sie öffentliches Feedback zu Noise Lab (Frage stellen, Fehler melden, Funktion anfordern): Hier ein neues Problem erstellen
- So geben Sie öffentliches Feedback zu einem anderen Aspekt der API: Erstellen Sie hier ein neues Problem.
Vorbereitung
- Eine Einführung finden Sie unter Attributionsberichte: Zusammenfassungsberichte und Attributionsberichte – vollständige Systemübersicht.
- Lesen Sie die Abschnitte Rauschen verstehen und Aggregationsschlüssel verstehen, um diesen Leitfaden optimal zu nutzen.
Designentscheidungen
Grundlegendes Designprinzip
Es gibt grundlegende Unterschiede zwischen der Funktionsweise von Drittanbieter-Cookies und Zusammenfassungsberichten. Ein wesentlicher Unterschied ist das Rauschen, das den Messdaten in zusammenfassenden Berichten hinzugefügt wird. Ein weiterer Unterschied ist, wie Berichte geplant werden.
Um auf zusammenfassende Berichtsdaten mit einem höheren Signal-Rausch-Verhältnis zuzugreifen, müssen Demand-Side-Plattformen (DSPs) und Anbieter von Anzeigenmessungen gemeinsam mit ihren Werbetreibenden Strategien zur Rauschunterdrückung entwickeln. Um diese Strategien zu entwickeln, müssen DSPs und Anbieter von Analyselösungen Designentscheidungen treffen. Diese Entscheidungen drehen sich um ein wesentliches Konzept:
Die Verteilung, aus der die Rauschwerte gezogen werden, hängt absolut gesehen nur von zwei Parametern ab: Epsilon und dem Beitragsetat. Sie haben jedoch eine Reihe anderer Steuerelemente zur Verfügung, die sich auf das Signal-Rausch-Verhältnis Ihrer Ausgabemessdaten auswirken.
Wir gehen davon aus, dass ein iterativer Prozess zu den besten Entscheidungen führt. Jede Variation dieser Entscheidungen führt jedoch zu einer leicht unterschiedlichen Implementierung. Daher müssen diese Entscheidungen vor dem Schreiben jeder Code-Iteration (und vor dem Schalten von Anzeigen) getroffen werden.
Entscheidung: Detaillierungsgrad der Dimension
Im Noise Lab ausprobieren
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig beträgt die GESAMTE täglich zuordenbare Conversion-Anzahl 1.000. Bei der Standardeinrichtung (Standarddimensionen, Standardanzahl möglicher unterschiedlicher Werte für jede Dimension, Schlüsselstrategie A) sind das durchschnittlich etwa 40 Werte pro Bucket. Der Wert im Eingabefeld „Durchschnittliche tägliche Anzahl der zuordenbaren Conversions“ ist 40 PRO BUCKET.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardparametern auszuführen.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Dimensionen“. Benennen Sie Geography in City um und ändern Sie die Anzahl der möglichen unterschiedlichen Werte in 50.
- Sehen Sie sich an, wie sich dadurch die durchschnittliche Anzahl der zugeordneten Conversions pro Bucket ändert. Er ist jetzt viel niedriger. Wenn Sie die Anzahl der möglichen Werte in dieser Dimension erhöhen, ohne etwas anderes zu ändern, steigt die Gesamtzahl der Buckets, ohne dass sich ändert, wie viele Conversion-Ereignisse in die einzelnen Buckets fallen.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an: Sie sind jetzt höher als bei der vorherigen Simulation.
Aufgrund des zentralen Designprinzips sind kleine zusammengefasste Werte wahrscheinlich ungenauer als große zusammengefasste Werte. Ihre Konfigurationsauswahl wirkt sich also darauf aus, wie viele zugeordnete Conversion-Ereignisse in den einzelnen Buckets (auch als Aggregationsschlüssel bezeichnet) landen. Diese Menge wirkt sich wiederum auf das Rauschen in den endgültigen Zusammenfassungsberichten aus.
Eine Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist die Dimensionen-Granularität. Hier einige Beispiele für Aggregationsschlüssel und ihre Dimensionen:
- Ansatz 1: Eine Schlüsselstruktur mit groben Dimensionen: Land × Werbekampagne (oder der größte Kampagnenaggregations-Bucket) × Produkttyp (von 10 möglichen Produkttypen)
- Ansatz 2: Eine Schlüsselstruktur mit detaillierten Dimensionen: Stadt × Creative-ID × Produkt (von 100 möglichen Produkten)
Stadt ist eine detailliertere Dimension als Land, Creative-ID ist detaillierter als Kampagne und Produkt ist detaillierter als Produkttyp. Daher enthält der Zusammenfassungsbericht für Ansatz 2 eine geringere Anzahl von Ereignissen (Conversions) pro Bucket (= pro Schlüssel) als für Ansatz 1. Da das der Ausgabe hinzugefügte Rauschen unabhängig von der Anzahl der Ereignisse im Bucket ist, sind die Messdaten in Zusammenfassungsberichten bei Ansatz 2 stärker verrauscht. Testen Sie für jeden Werbetreibenden verschiedene Kompromisse bei der Granularität des Schlüsseldesigns, um die Ergebnisse optimal zu nutzen.
Entscheidung: Wichtige Strukturen
Im Noise Lab ausprobieren
Im einfachen Modus wird die Standardschlüsselstruktur verwendet. Im erweiterten Modus können Sie mit verschiedenen Schlüsselstrukturen experimentieren. Es sind einige Beispieldimensionen enthalten, die Sie auch ändern können.
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Wichtige Strategie“. Die Standardstrategie, die im Tool als „A“ bezeichnet wird, verwendet eine granulare Schlüsselstruktur, die alle Dimensionen umfasst: geografische Einheit × Kampagnen-ID × Produktkategorie.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an.
- Ändern Sie die Schlüsselstrategie in B. Daraufhin werden zusätzliche Steuerelemente angezeigt, mit denen Sie die Schlüsselstruktur konfigurieren können.
- Konfigurieren Sie die Schlüsselstruktur z.B. so:
- Anzahl der wichtigsten Strukturen: 2
- Schlüsselstruktur 1 = Region × Produktkategorie.
- Schlüsselstruktur 2 = Kampagnen-ID × Produktkategorie.
- Klicken Sie auf „Simulieren“.
- Sie erhalten jetzt zwei Übersichtsberichte pro Messzieltyp (zwei für die Anzahl der Käufe, zwei für den Kaufwert), da Sie zwei unterschiedliche Schlüsselstrukturen verwenden. Beobachten Sie die Rauschverhältnisse.
- Sie können das auch mit Ihren eigenen benutzerdefinierten Dimensionen ausprobieren. Suchen Sie dazu nach Daten, die Sie erfassen möchten: Dimensionen. Entfernen Sie die Beispieldimensionen und erstellen Sie eigene Dimensionen mit den Schaltflächen „Hinzufügen“, „Entfernen“ und „Zurücksetzen“ unter der letzten Dimension.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist die Schlüsselstruktur, die Sie verwenden. Hier einige Beispiele für Aggregationsschlüssel:
- Eine Schlüsselstruktur mit allen Dimensionen (Schlüsselstrategie A).
- Zwei Schlüsselstrukturen mit jeweils einer Teilmenge von Dimensionen. Wir nennen diese Schlüsselstrategie B.

Strategie A ist einfacher, aber Sie müssen möglicherweise die zusammengefassten Werte in den zusammengefassten Berichten zusammenfassen (addieren), um auf bestimmte Statistiken zuzugreifen. Wenn Sie diese Werte addieren, addieren Sie auch das Rauschen. Bei Strategie B liefern die in den Übersichtsberichten enthaltenen zusammengefassten Werte möglicherweise bereits die benötigten Informationen. Das bedeutet, dass Strategie B wahrscheinlich zu besseren Signal-Rausch-Verhältnissen führt als Strategie A. Möglicherweise ist das Rauschen bei Strategie A jedoch bereits akzeptabel. In diesem Fall können Sie sich aus Gründen der Einfachheit für Strategie A entscheiden. Weitere Informationen
Die Schlüsselverwaltung ist ein komplexes Thema. Es gibt eine Reihe ausgefeilter Techniken, mit denen sich das Signal-Rausch-Verhältnis verbessern lässt. Eine davon wird unter Erweiterte Schlüsselverwaltung beschrieben.
Entscheidung: Batching-Häufigkeit
Im Noise Lab ausprobieren
- Wechseln Sie in den einfachen Modus oder den erweiterten Modus. Die Batching-Häufigkeit funktioniert in beiden Modi gleich.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Aggregationsstrategie“ > „Batching-Häufigkeit“. Dies bezieht sich auf die Batching-Häufigkeit von aggregierbaren Berichten, die mit dem Aggregationsdienst in einem einzelnen Job verarbeitet werden.
- Beobachten Sie die standardmäßige Batching-Häufigkeit: Standardmäßig wird eine tägliche Batching-Häufigkeit simuliert.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an.
- Ändern Sie die Batching-Häufigkeit in „Wöchentlich“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an: Sie sind jetzt niedriger (besser) als bei der vorherigen Simulation.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist die Batching-Häufigkeit, die Sie verwenden. Die Batching-Häufigkeit gibt an, wie oft Sie aggregierbare Berichte verarbeiten.
Ein Bericht, der häufiger zusammengefasst wird (z.B. stündlich), enthält weniger Conversion-Ereignisse als derselbe Bericht mit einem weniger häufigen Zusammenfassungszeitplan (z.B. wöchentlich). Daher enthält der stündliche Bericht mehr Rauschen.``` Außerdem sind weniger Conversion-Ereignisse enthalten als im selben Bericht mit einem weniger häufigen Aggregationszeitplan (z.B. wöchentlich). Daher hat der stündliche Bericht im Vergleich zum wöchentlichen Bericht ein geringeres Signal-Rausch-Verhältnis. Testen Sie die Anforderungen an Berichte mit verschiedenen Häufigkeiten und bewerten Sie das Signal-Rausch-Verhältnis für jede Häufigkeit.
Weitere Informationen finden Sie unter Batching und Über längere Zeiträume aggregieren.
Entscheidung: Kampagnenvariablen, die sich auf zuordenbare Conversions auswirken
Im Noise Lab ausprobieren
Das ist zwar schwer vorherzusagen und kann neben saisonalen Effekten auch erhebliche Schwankungen aufweisen, aber versuchen Sie, die Anzahl der täglich durch Single-Touch-Attribution ermittelten Conversions auf die nächste Zehnerpotenz zu schätzen: 10, 100, 1.000 oder 10.000.
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig beträgt die GESAMTE täglich zuordenbare Conversion-Anzahl 1.000. Bei der Standardeinrichtung (Standarddimensionen, Standardanzahl möglicher unterschiedlicher Werte für jede Dimension, Schlüsselstrategie A) sind das durchschnittlich etwa 40 Werte pro Bucket. Der Wert im Eingabefeld „Durchschnittliche tägliche Anzahl der zuordenbaren Conversions“ ist 40 PRO BUCKET.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardparametern auszuführen.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an.
- Legen Sie die GESAMTE Anzahl der täglich zuordenbaren Conversions auf 100 fest. Dadurch sinkt die durchschnittliche tägliche Anzahl der zugeordneten Conversions PRO BUCKET.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind jetzt höher, da bei weniger Conversions pro Bucket mehr Rauschen hinzugefügt wird, um den Datenschutz zu wahren.
Ein wichtiger Unterschied ist die Gesamtzahl der möglichen Conversions für einen Werbetreibenden im Vergleich zur Gesamtzahl der möglichen zugeordneten Conversions. Letzteres wirkt sich letztendlich auf das Rauschen in Zusammenfassungsberichten aus. Zugeordnete Conversions sind eine Teilmenge der Gesamt-Conversions, die von Kampagnenvariablen wie Anzeigenbudget und Anzeigenausrichtung beeinflusst werden. Bei einer Werbekampagne mit einem Budget von 10 Millionen Euro ist beispielsweise mit einer höheren Anzahl von zugeordneten Conversions zu rechnen als bei einer Werbekampagne mit einem Budget von 10.000 Euro, sofern alle anderen Faktoren gleich sind.
Beachten Sie Folgendes:
- Bewerten Sie zugeordnete Conversions anhand eines Attributionsmodells mit einem Touchpoint auf demselben Gerät, da diese im Rahmen von Zusammenfassungsberichten erfasst werden, die mit der Attribution Reporting API erhoben werden.
- Berücksichtigen Sie sowohl die Anzahl der Conversions im Worst-Case-Szenario als auch im Best-Case-Szenario. Berücksichtigen Sie beispielsweise unter sonst gleichen Bedingungen das minimale und maximale mögliche Kampagnenbudget für einen Werbetreibenden und projizieren Sie dann die zugehörigen Conversions für beide Ergebnisse als Eingaben für Ihre Simulation.
- Wenn Sie die Android Privacy Sandbox verwenden möchten, sollten Sie plattformübergreifende Conversions in die Berechnung einbeziehen.
Entscheidung: Skalierung verwenden
Im Noise Lab ausprobieren
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Aggregationsstrategie“ > „Skalierung“. Die Standardeinstellung ist „Ja“.
- Um die positiven Auswirkungen der Skalierung auf das Rauschverhältnis zu verstehen, stellen Sie die Skalierung zuerst auf „Nein“ ein.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an.
- Setzen Sie „Skalierung“ auf „Ja“. Noise Lab berechnet die Skalierungsfaktoren, die für die Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario verwendet werden sollen, automatisch. In einem echten System oder bei einem Origin Trial sollten Sie Ihre eigene Berechnung für Skalierungsfaktoren implementieren.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind in dieser zweiten Simulation niedriger (besser). Das liegt daran, dass Sie die Skalierung verwenden.
Gemäß dem grundlegenden Designprinzip ist das hinzugefügte Rauschen eine Funktion des Beitragsbudgets.
Um das Signal-Rausch-Verhältnis zu erhöhen, können Sie die während eines Conversion-Ereignisses erfassten Werte skalieren. Dazu werden sie mit dem Beitragbudget multipliziert und nach der Aggregation wieder de-skaliert. Mit der Skalierung lässt sich das Signal-Rausch-Verhältnis verbessern.
Entscheidung: Anzahl der Messziele und Aufteilung des Datenschutzbudgets
Das hängt mit der Skalierung zusammen. Lesen Sie dazu den Abschnitt Skalierung verwenden.
Im Noise Lab ausprobieren
Ein Messziel ist ein eindeutiger Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach den Daten, die Sie erfassen möchten: Messziele: Standardmäßig sind zwei Messziele vorhanden: „Kaufwert“ und „Anzahl der Käufe“.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardzielvorhaben auszuführen.
- Klicken Sie auf „Entfernen“. Dadurch wird das letzte Zielvorhaben für die Analyse entfernt (in diesem Fall die Anzahl der Käufe).
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse für den Kaufwert sind in dieser zweiten Simulation niedriger (besser). Das liegt daran, dass Sie weniger Messziele haben. Das Budget für Beiträge wird jetzt also vollständig Ihrem einen Messziel zugewiesen.
- Klicken Sie auf „Zurücksetzen“. Sie haben jetzt wieder zwei Analyseziele: Kaufwert und Anzahl der Käufe. Noise Lab berechnet die Skalierungsfaktoren, die für die Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario verwendet werden sollen, automatisch. Standardmäßig wird das Budget im Noise Lab gleichmäßig auf die Analyseziele aufgeteilt.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an. Achten Sie auf die Skalierungsfaktoren, die in der Simulation angezeigt werden.
- Passen wir nun die Aufteilung des Datenschutzbudgets an, um ein besseres Signal-Rausch-Verhältnis zu erzielen.
- Passen Sie den Budgetprozentsatz an, der für jedes Analyseziel zugewiesen ist. Bei den Standardparametern hat Zielvorhaben 1 (Kaufwert) einen viel größeren Bereich (zwischen 0 und 1.000) als Zielvorhaben 2 (Anzahl der Käufe, zwischen 1 und 1, d. h. immer gleich 1). Daher ist mehr Spielraum für die Skalierung erforderlich. Es wäre ideal, Zielvorhaben 1 mehr Budget zuzuweisen als Zielvorhaben 2, damit es effizienter skaliert werden kann (siehe Skalierung).
- Weisen Sie Zielvorhaben 1 für die Analyse 70% des Budgets zu. Weisen Sie Zielvorhaben 2 für die Messung 30% zu.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an. Für den Kaufwert sind die Rauschverhältnisse jetzt deutlich niedriger (besser) als bei der vorherigen Simulation. Bei der Anzahl der Käufe hat sich nicht viel geändert.
- Passen Sie die Budgetaufteilung auf die Messwerte immer wieder an. Beobachten Sie, wie sich das auf das Rauschen auswirkt.
Mit den Schaltflächen „Hinzufügen“, „Entfernen“ und „Zurücksetzen“ können Sie eigene benutzerdefinierte Analyseziele festlegen.
Wenn Sie einen Datenpunkt (Messziel) für ein Conversion-Ereignis messen, z. B. die Anzahl der Conversions, kann dieser Datenpunkt das gesamte Beitragbudget (65.536) erhalten. Wenn Sie für ein Conversion-Ereignis mehrere Analyseziele festlegen, z. B. die Anzahl der Conversions und den Kaufwert, müssen sich diese Datenpunkte das Budget für Beiträge teilen. Das bedeutet, dass Sie weniger Spielraum haben, Ihre Werte zu steigern.
Je mehr Analyseziele Sie haben, desto niedriger ist das Signal-Rausch-Verhältnis (höheres Rauschen).
Eine weitere Entscheidung, die Sie in Bezug auf Analyseziele treffen müssen, ist die Budgetaufteilung. Wenn Sie das Budget für Beiträge gleichmäßig auf zwei Datenpunkte aufteilen, erhält jeder Datenpunkt ein Budget von 65.536/2 = 32.768. Das ist je nach maximalem möglichen Wert für die einzelnen Datenpunkte möglicherweise nicht optimal. Wenn Sie beispielsweise die Anzahl der Käufe mit einem Maximalwert von 1 und den Kaufwert mit einem Minimalwert von 1 und einem Maximalwert von 120 messen, profitiert der Kaufwert davon, dass er mehr Spielraum für die Steigerung hat, d. h., er erhält einen größeren Anteil des Beitragsbudgets. Sie sehen, ob einige Analyseziele aufgrund der Auswirkungen von Rauschen priorisiert werden sollten.
Entscheidung: Ausreißerbehandlung
Im Noise Lab ausprobieren
Ein Messziel ist ein eindeutiger Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechsle in den erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Ihre Aggregationsstrategie“ > „Skalierung“.
- Achte darauf, dass „Skalierung“ auf „Ja“ eingestellt ist. Noise Lab berechnet die zu verwendenden Skalierungsfaktoren automatisch anhand der Bereiche (Durchschnitts- und Maximalwerte), die Sie für die Messziele angegeben haben.
- Angenommen, der bisher größte Kauf hatte einen Wert von 2.000 $, die meisten Käufe liegen aber zwischen 10 und 120 $. Sehen wir uns zuerst an, was passiert, wenn wir einen direkten Skalierungsansatz verwenden (nicht empfohlen): Geben Sie 2.000 $als Maximalwert für „purchaseValue“ ein.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind hoch. Das liegt daran, dass unser Skalierungsfaktor auf Grundlage von 2.000 $berechnet wird, während die meisten Kaufwerte in der Realität deutlich niedriger sind.
- Wenden wir nun einen pragmatischeren Ansatz an. Ändern Sie den maximalen Kaufwert in 120 $.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind in dieser zweiten Simulation niedriger (besser).
Um die Skalierung zu implementieren, berechnen Sie in der Regel einen Skalierungsfaktor basierend auf dem maximal möglichen Wert für ein bestimmtes Conversion-Ereignis (weitere Informationen in diesem Beispiel).
Vermeiden Sie es jedoch, einen Literalwert für den Maximalwert zu verwenden, um diesen Skalierungsfaktor zu berechnen, da dies das Signal-Rausch-Verhältnis verschlechtern würde. Entfernen Sie stattdessen Ausreißer und verwenden Sie einen pragmatischen Maximalwert.
Die Verwaltung von Ausreißern ist ein komplexes Thema. Es gibt eine Reihe ausgefeilter Techniken, mit denen sich das Signal-Rausch-Verhältnis verbessern lässt. Eine davon wird unter Erweiterte Verwaltung von Ausreißern beschrieben.
Nächste Schritte
Nachdem Sie verschiedene Strategien zur Rauschunterdrückung für Ihren Anwendungsfall bewertet haben, können Sie mit der Erstellung von Zusammenfassungsberichten beginnen. Dazu müssen Sie mit einem Origin Trial echte Messdaten erfassen. Leitfäden und Tipps zum Testen der API
Anhang
Noise Lab – Kurze Einführung
Mit Noise Lab können Sie schnell Strategien zur Rauschunterdrückung bewerten und vergleichen. Sie können damit:
- Die wichtigsten Parameter, die sich auf Rauschen auswirken können, und ihre Auswirkungen verstehen
- Simulieren Sie die Auswirkungen von Rauschen auf die Ausgabemessdaten bei unterschiedlichen Designentscheidungen. Passen Sie die Designparameter an, bis Sie ein Signal-Rausch-Verhältnis erreichen, das für Ihren Anwendungsfall geeignet ist.
- Teilen Sie uns Ihr Feedback zur Nützlichkeit der Übersichtsberichte mit: Welche Werte von Epsilon- und Rauschparametern funktionieren für Sie und welche nicht? Wo sind die Wendepunkte?
Das ist ein Vorbereitungsschritt. Noise Lab generiert Messdaten, um Zusammenfassungsberichte auf Grundlage Ihrer Eingaben zu simulieren. Es werden keine Daten gespeichert oder weitergegeben.
Es gibt zwei verschiedene Modi im Noise Lab:
- Einfacher Modus: Hier erfahren Sie die Grundlagen der Rauschunterdrückung.
- Erweiterter Modus: Testen Sie verschiedene Strategien zur Rauschunterdrückung und ermitteln Sie, welche für Ihre Anwendungsfälle zu den besten Signal-Rausch-Verhältnissen führt.
Klicken Sie auf die Schaltflächen im oberen Menü, um zwischen den beiden Modi zu wechseln (1. im folgenden Screenshot).
Einfacher Modus
- Im einfachen Modus können Sie Parameter wie Epsilon (links oder Nr. 2 im folgenden Screenshot) anpassen und sehen, wie sich das auf das Rauschen auswirkt.
- Jeder Parameter hat eine Kurzinfo (eine Schaltfläche mit einem Fragezeichen). Klicken Sie darauf, um eine Erklärung der einzelnen Parameter aufzurufen (Nr. 3 im folgenden Screenshot).
- Klicken Sie zuerst auf die Schaltfläche „Simulieren“ und sehen Sie sich die Ausgabe an (Nr. 4 im folgenden Screenshot).
- Im Abschnitt „Output“ sehen Sie verschiedene Details. Neben einigen Elementen wird ein „?“ angezeigt. Klicken Sie auf jedes „?“, um eine Erklärung der verschiedenen Informationen zu sehen.
- Klicken Sie im Bereich „Ausgabe“ auf die Ein/Aus-Schaltfläche „Details“, wenn Sie eine erweiterte Version der Tabelle sehen möchten (Nr. 5 im folgenden Screenshot).
- Nach jeder Datentabelle im Ausgabebereich gibt es eine Option zum Herunterladen der Tabelle für die Offline-Nutzung. Außerdem gibt es rechts unten die Möglichkeit, alle Datentabellen herunterzuladen (Nr. 6 im folgenden Screenshot).
- Testen Sie verschiedene Einstellungen für die Parameter im Bereich „Parameter“ und klicken Sie auf „Simulieren“, um zu sehen, wie sie sich auf die Ausgabe auswirken:
Noise Lab-Oberfläche für den einfachen Modus
Erweiterter Modus
- Im erweiterten Modus haben Sie mehr Kontrolle über die Parameter. Sie können benutzerdefinierte Messziele und ‑dimensionen hinzufügen (Nr. 1 und 2 im folgenden Screenshot).
- Scrollen Sie im Bereich „Parameter“ weiter nach unten, bis Sie die Option „Schlüsselstrategie“ sehen. Damit lassen sich verschiedene Schlüsselstrukturen testen (Nr. 3 im folgenden Screenshot).
- Wenn Sie verschiedene Schlüsselstrukturen testen möchten, stellen Sie die Schlüsselstrategie auf „B“ um.
- Geben Sie die Anzahl der verschiedenen Schlüsselstrukturen ein, die Sie verwenden möchten (Standardwert ist „2“).
- Klicken Sie auf „Schlüsselstrukturen generieren“.
- Wenn Sie die Kästchen neben den Schlüsseln anklicken, die Sie für die einzelnen Schlüsselstrukturen verwenden möchten, werden Optionen zum Angeben der Schlüsselstrukturen angezeigt.
- Klicken Sie auf „Simulieren“, um die Ausgabe zu sehen.
Noise Lab-Oberfläche für den erweiterten Modus Noise Lab-Oberfläche für den erweiterten Modus
Messwerte für Rauschen
Kernkonzept
Es werden Störsignale hinzugefügt, um den Datenschutz einzelner Nutzer zu gewährleisten.
Ein hoher Rauschwert weist darauf hin, dass Buckets/Schlüssel spärlich sind und Beiträge aus einer begrenzten Anzahl sensibler Ereignisse enthalten. Dies geschieht automatisch durch Noise Lab, damit sich Einzelpersonen „in der Menge verstecken“ können. Mit anderen Worten: Der Datenschutz dieser wenigen Personen wird durch eine größere Menge an zusätzlichem Rauschen geschützt.
Ein niedriger Rauschwert deutet darauf hin, dass die Dateneinrichtung so konzipiert wurde, dass sich Einzelpersonen bereits „in der Menge verstecken“ können. Das bedeutet, dass die einzelnen Gruppen Beiträge aus einer ausreichenden Anzahl von Ereignissen enthalten, um zu bestätigen, dass die Privatsphäre der einzelnen Nutzer geschützt ist.
Diese Aussage gilt sowohl für den durchschnittlichen prozentualen Fehler (Average Percentage Error, APE) als auch für RMSRE_T (Wurzel des mittleren quadratischen relativen Fehlers mit einem Schwellenwert).
Durchschnittlicher prozentualer Fehler (Average Percentage Error, APE)
APE ist das Verhältnis von Rauschen zum Signal, also zum tatsächlichen zusammenfassenden Wert.
Niedrigere APE-Werte bedeuten ein besseres Signal-Rausch-Verhältnis.
Formel
Für einen bestimmten Zusammenfassungsbericht wird der durchschnittliche prozentuale Fehler so berechnet:

True ist der tatsächliche Zusammenfassungswert. APE ist der Durchschnitt des Rauschens für jeden tatsächlichen Zusammenfassungswert, gemittelt über alle Einträge in einem Zusammenfassungsbericht. Im Noise Lab wird dieser Wert dann mit 100 multipliziert, um einen Prozentsatz zu erhalten.
Vor- und Nachteile
Klassen mit kleineren Größen haben einen überproportionalen Einfluss auf den endgültigen APE-Wert. Das kann bei der Beurteilung von Rauschen irreführend sein. Aus diesem Grund haben wir einen weiteren Messwert hinzugefügt, RMSRE_T, der diese Einschränkung von APE abmildern soll. Weitere Informationen finden Sie in den Beispielen.
Code
Sehen Sie sich den Quellcode für die APE-Berechnung an.
RMSRE_T (Wurzel des mittleren quadratischen relativen Fehlers mit einem Schwellenwert)
RMSRE_T (Wurzel des mittleren relativen Fehlers mit einem Schwellenwert) ist ein weiterer Messwert für Rauschen.
RMSRE_T interpretieren
Niedrigere RMSRE_T-Werte bedeuten ein besseres Signal-Rausch-Verhältnis.
Wenn beispielsweise ein für Ihren Anwendungsfall akzeptables Rauschverhältnis 20 % beträgt und RMSRE_T 0, 2 ist, können Sie davon ausgehen, dass die Rauschpegel in Ihrem akzeptablen Bereich liegen.
Formel
Für einen bestimmten Zusammenfassungsbericht wird RMSRE_T so berechnet:

Vor- und Nachteile
RMSRE_T ist etwas komplexer zu verstehen als APE. Es hat jedoch einige Vorteile, die es in manchen Fällen besser als APE für die Analyse von Rauschen in Übersichtsberichten geeignet machen:
- RMSRE_T ist stabiler. „T“ ist ein Schwellenwert. „T“ wird verwendet, um Buckets mit weniger Conversions, die aufgrund ihrer geringen Größe anfälliger für Rauschen sind, bei der Berechnung von RMSRE_T weniger Gewicht zu verleihen. Bei T steigt der Messwert nicht in Buckets mit wenigen Conversions. Wenn T gleich 5 ist, wird ein Rauschwert von nur 1 in einem Bucket mit 0 Conversions nicht als viel höher als 1 angezeigt. Stattdessen wird sie auf 0, 2 begrenzt, was 1/5 entspricht, da T gleich 5 ist. Da kleineren Gruppen, die daher anfälliger für Rauschen sind, weniger Gewicht beigemessen wird, ist dieser Messwert stabiler und es ist einfacher, zwei Simulationen zu vergleichen.
- RMSRE_T ermöglicht eine einfache Aggregation. Wenn Sie den RMSRE_T mehrerer Gruppen zusammen mit ihren tatsächlichen Anzahl kennen, können Sie den RMSRE_T ihrer Summe berechnen. So können Sie auch für diese kombinierten Werte für RMSRE_T optimieren.
Die Aggregation ist zwar für APE möglich, die Formel ist jedoch recht kompliziert, da sie den absoluten Wert der Summe der Laplace-Störungen enthält. Das macht es schwieriger, APE zu optimieren.
Code
Sehen Sie sich den Quellcode für die Berechnung von RMSRE_T an.
Beispiele
Zusammenfassender Bericht mit drei Buckets:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Zusammenfassender Bericht mit drei Buckets:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Zusammenfassender Bericht mit drei Buckets:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + Unendlich) / 3 = Unendlich
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Erweiterte Schlüsselverwaltung
Eine DSP oder ein Unternehmen für Anzeigenmessung hat möglicherweise Tausende von globalen Werbekunden aus verschiedenen Branchen, mit unterschiedlichen Währungen und Kaufpreispotenzialen. Das bedeutet, dass das Erstellen und Verwalten eines Aggregationsschlüssels pro Werbetreibendem wahrscheinlich sehr unpraktisch ist. Außerdem ist es schwierig, einen maximalen aggregierbaren Wert und ein Aggregationsbudget auszuwählen, mit denen sich die Auswirkungen von Rauschen bei diesen Tausenden von Werbetreibenden weltweit begrenzen lassen. Sehen wir uns stattdessen die folgenden Szenarien an:
Schlüsselstrategie A
Der Anbieter von Anzeigentechnologien entscheidet sich, einen Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten. Bei allen Werbetreibenden und in allen Währungen variiert die Anzahl der Käufe von geringem Volumen und hochwertigen Käufen bis hin zu hohem Volumen und Käufen im unteren Preissegment. Daraus ergibt sich der folgende Schlüssel:
Schlüssel (mehrere Währungen) | |
---|---|
Maximal aggregierbarer Wert | 5.000.000 |
Bereich für den Kaufwert | [120 – 5.000.000] |
Schlüsselstrategie B
Der Anbieter von Anzeigentechnologien entscheidet sich, zwei Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten. Sie beschließen, die Schlüssel nach Währung zu trennen. Bei allen Werbetreibenden und in allen Währungen variiert die Anzahl der Käufe von geringem Volumen und hochwertigen Käufen bis hin zu hohem Volumen und Käufen im unteren Preissegment. Nach Währung getrennt werden zwei Schlüssel erstellt:
Schlüssel 1 (USD) | Schlüssel 2 (¥) | |
---|---|---|
Maximal aggregierbarer Wert | 40.000 $ | 5.000.000 JPY |
Bereich für den Kaufwert | [120 – 40.000] | [15.000–5.000.000] |
Die Ergebnisse von Schlüsselstrategie B sind weniger verrauscht als die von Schlüsselstrategie A, da die Währungswerte nicht gleichmäßig auf die Währungen verteilt sind. Wenn beispielsweise Käufe in Yen mit Käufen in US-Dollar vermischt werden, werden die zugrunde liegenden Daten und die daraus resultierende ungenaue Ausgabe verändert.
Schlüsselstrategie C
Der Anzeigentechnologie-Anbieter beschließt, vier Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten und sie nach Währung × Branche des Werbetreibenden zu trennen:
Schlüssel 1 (USD × Werbetreibende für hochwertigen Schmuck) |
Schlüssel 2 (¥ x Werbetreibende für hochwertigen Schmuck) |
Schlüssel 3 (USD × Werbetreibende im Einzelhandel für Bekleidung) |
Schlüssel 4 (¥ x Werbetreibende im Einzelhandel für Bekleidung) |
|
---|---|---|---|---|
Maximal aggregierbarer Wert | 40.000 $ | 5.000.000 JPY | 500 € | 65.000 ¥ |
Bereich für den Kaufwert | [10.000–40.000] | [1.250.000 – 5.000.000] | [120–500] | [15.000–65.000] |
Die Ergebnisse von Schlüsselstrategie C sind weniger verrauscht als die von Schlüsselstrategie B, da die Kaufwerte der Werbetreibenden nicht gleichmäßig auf die Werbetreibenden verteilt sind. Wenn beispielsweise Käufe von hochwertigem Schmuck mit Käufen von Baseballkappen vermischt werden, werden die zugrunde liegenden Daten und die daraus resultierende verrauschte Ausgabe verändert.
Erwägen Sie, gemeinsame maximale Gesamtwert und gemeinsame Skalierungsfaktoren für Gemeinsamkeiten bei mehreren Werbetreibenden zu erstellen, um das Rauschen in der Ausgabe zu reduzieren. Sie können beispielsweise die folgenden Strategien für Ihre Werbetreibenden testen:
- Eine Strategie, nach Währung getrennt (USD, ¥, CAD usw.)
- Eine Strategie, aufgeschlüsselt nach Branche des Werbetreibenden (Versicherungen, Autos, Einzelhandel usw.)
- Eine Strategie, die durch ähnliche Kaufwertbereiche getrennt ist ([100], [1000], [10000] usw.)
Wenn Sie Schlüsselstrategien auf Grundlage von Gemeinsamkeiten von Werbetreibenden erstellen, lassen sich Schlüssel und der entsprechende Code leichter verwalten und das Signal-Rausch-Verhältnis wird höher. Testen Sie verschiedene Strategien mit unterschiedlichen Gemeinsamkeiten von Werbetreibenden, um Wendepunkte bei der Maximierung der Auswirkungen von Rauschen im Vergleich zur Codeverwaltung zu ermitteln.
Erweiterte Verwaltung von Ausreißern
Sehen wir uns ein Beispiel mit zwei Werbetreibenden an:
- Werbetreibender A:
- Für alle Produkte auf der Website von Werbetreibender A liegen die möglichen Kaufpreise zwischen 120 $ und 1.000 $, also in einer Spanne von 880 $.
- Die Kaufpreise sind gleichmäßig über die Spanne von 880 $verteilt. Es gibt keine Ausreißer außerhalb von zwei Standardabweichungen vom Median des Kaufpreises.
- Werbetreibender B:
- Für alle Produkte auf der Website von Werbetreibender B liegen die möglichen Kaufpreise zwischen 120 $ und 1.000 $, also in einer Spanne von 880 $.
- Die Kaufpreise liegen größtenteils zwischen 120 $und 500 $. Nur 5% der Käufe fallen in den Bereich von 500 $bis 1.000 $.
Aufgrund der Anforderungen an das Beitrag-Budget und der Methodik, mit der Rauschen auf die Endergebnisse angewendet wird, hat Werbetreibender B standardmäßig eine ungenauere Ausgabe als Werbetreibender A, da bei Werbetreibender B mehr Ausreißer die zugrunde liegenden Berechnungen beeinflussen können.
Mit einer bestimmten Schlüsselkonfiguration lässt sich dieses Problem jedoch beheben. Testen Sie wichtige Strategien, mit denen sich Ausreißerdaten verwalten und Kaufwerte gleichmäßiger über den Kaufbereich des Schlüssels verteilen lassen.
Für Werbetreibenden B könnten Sie zwei separate Schlüssel erstellen, um zwei unterschiedliche Kaufwertbereiche zu erfassen. In diesem Beispiel hat die Ad-Tech-Lösung festgestellt, dass Ausreißer über dem Kaufwert von 500 $auftreten. Implementieren Sie zwei separate Schlüssel für diesen Werbetreibenden:
- Schlüsselstruktur 1 : Schlüssel, mit dem nur Käufe im Bereich von 120 $bis 500 $ erfasst werden (entspricht etwa 95% des gesamten Kaufvolumens).
- Schlüsselstruktur 2: Schlüssel, mit dem nur Käufe über 500 $erfasst werden (ca. 5% des gesamten Kaufvolumens).
Durch die Implementierung dieser Schlüsselstrategie sollte das Rauschen für Werbetreibenden B besser verwaltet werden und der Nutzen von Zusammenfassungsberichten für ihn maximiert werden. Aufgrund der neuen, kleineren Bereiche sollte die Datenverteilung für Schlüssel A und Schlüssel B jetzt gleichmäßiger sein als für den vorherigen einzelnen Schlüssel. Das führt zu weniger Rauschen in der Ausgabe jedes Schlüssels als beim vorherigen einzelnen Schlüssel.