Informationen zu diesem Dokument
In diesem Dokument erfahren Sie Folgendes:
- Informieren Sie sich, welche Strategien Sie erstellen sollten, bevor Sie Zusammenfassungsberichte erstellen.
- Sie lernen Noise Lab kennen, ein Tool, mit dem sich die Auswirkungen verschiedener Geräuschparameter besser nachvollziehen und verschiedene Strategien zur Geräuschverwaltung schnell untersuchen und bewerten lassen.

Feedback geben
In diesem Dokument werden einige Prinzipien für die Arbeit mit Zusammenfassungsberichten zusammengefasst. Es gibt jedoch mehrere Ansätze zur Verwaltung von Rauschen, die hier möglicherweise nicht berücksichtigt werden. Vorschläge, Ergänzungen und Fragen sind willkommen.
- Wenn Sie öffentliches Feedback zu Strategien zur Geräuschverwaltung, zur Nützlichkeit oder zum Datenschutz der API (Epsilon) geben und Ihre Beobachtungen bei der Simulation mit Noise Lab teilen möchten, kommentieren Sie dieses Thema.
- So kannst du öffentliches Feedback zu Noise Lab geben (Fragen stellen, Fehler melden, Funktionen anfordern): Hier ein neues Problem erstellen
- So geben Sie öffentliches Feedback zu einem anderen Aspekt der API: Hier ein neues Problem erstellen
Vorbereitung
- Weitere Informationen finden Sie unter Attributionsberichte: Zusammenfassungsberichte und Attributionsberichte: Vollständige Systemübersicht.
- Lesen Sie die Artikel Störungen verstehen und Aggregationsschlüssel verstehen, um diesen Leitfaden optimal zu nutzen.
Designentscheidungen
Grundlegendes Designprinzip
Es gibt grundlegende Unterschiede zwischen der Funktionsweise von Drittanbieter-Cookies und Zusammenfassungsberichten. Ein wesentlicher Unterschied besteht darin, dass den Messdaten in Zusammenfassungsberichten Störungen hinzugefügt werden. Ein weiterer Punkt ist die Planung von Berichten.
Damit Demand-Side-Plattformen (DSPs) und Anbieter von Anzeigenmessungen auf Messdaten in Zusammenfassungsberichten mit einem höheren Signal-Rausch-Verhältnis zugreifen können, müssen sie gemeinsam mit ihren Werbetreibenden Strategien zur Rauschunterdrückung entwickeln. Um diese Strategien zu entwickeln, müssen DSPs und Analyseanbieter Designentscheidungen treffen. Diese Entscheidungen drehen sich um ein wesentliches Konzept:
Die Verteilung, aus der die Rauschwerte gezogen werden, hängt zwar absolut gesehen nur von zwei Parametern ab – Epsilon und dem Beitragsbudget –, Sie haben aber eine Reihe weiterer Steuerelemente zur Verfügung, die sich auf das Signal-Rausch-Verhältnis Ihrer Ausgabemessdaten auswirken.
Wir gehen davon aus, dass ein iterativer Prozess zu den besten Entscheidungen führt. Jede Abweichung von diesen Entscheidungen führt jedoch zu einer etwas anderen Implementierung. Daher müssen diese Entscheidungen vor dem Schreiben jeder Codeiteration (und vor dem Ausliefern von Anzeigen) getroffen werden.
Entscheidung: Detaillierungsgrad der Dimension
In Noise Lab ausprobieren
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig ist die tägliche Gesamtzahl der zugeordneten Conversions auf 1.000 festgelegt. Bei der Standardkonfiguration (Standarddimensionen, Standardzahl der möglichen verschiedenen Werte für jede Dimension, Hauptstrategie A) ergibt sich ein Durchschnitt von etwa 40 pro Bucket. Beachten Sie, dass der Wert in der Eingabe „Durchschnittliche tägliche Anzahl der zurechenbaren Conversions PRO BUCKET“ 40 beträgt.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardparametern auszuführen.
- Suchen Sie im seitlichen Bereich „Parameter“ nach „Dimensionen“. Benennen Sie Geography in City um und ändern Sie die Anzahl der möglichen verschiedenen Werte auf 50.
- Sehen Sie sich an, wie sich dadurch die durchschnittliche Anzahl der täglich zugeordneten Conversions PRO BATCH ändert. Sie ist jetzt viel niedriger. Wenn Sie die Anzahl der möglichen Werte in dieser Dimension erhöhen, ohne sonst etwas zu ändern, steigt die Gesamtzahl der Bucket, ohne dass sich die Anzahl der Conversion-Ereignisse ändert, die in jeden Bucket fallen.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschanteile der resultierenden Simulation an: Die Rauschanteile sind jetzt höher als bei der vorherigen Simulation.
Gemäß dem Grundlegenden Designprinzip sind kleine Summenwerte wahrscheinlich ungenauer als große Summenwerte. Ihre Konfigurationsentscheidung wirkt sich daher darauf aus, wie viele zugeordnete Conversion-Ereignisse in jedem Bucket (auch Aggregationsschlüssel genannt) landen. Diese Menge wirkt sich wiederum auf die Fehlertoleranz in den abschließenden Zusammenfassungsberichten aus.
Eine Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse innerhalb eines einzelnen Buckets auswirkt, ist die Detaillierungsebene der Dimension. Hier sind einige Beispiele für Aggregationsschlüssel und ihre Dimensionen:
- Methode 1: Eine Schlüsselstruktur mit groben Dimensionen: Land × Werbekampagne (oder der größte Kampagnenaggregations-Bucket) × Produkttyp (von 10 möglichen Produkttypen)
- Ansatz 2: Eine Schlüsselstruktur mit detaillierten Dimensionen: Ort × Creative-ID × Produkt (von 100 möglichen Produkten)
Ort ist eine detailliertere Dimension als Land, Creative-ID ist detaillierter als Kampagne und Produkt ist detaillierter als Produkttyp. Daher ist die Anzahl der Ereignisse (Conversions) pro Bucket (= pro Schlüssel) in der Zusammenfassung des Berichts bei Ansatz 2 niedriger als bei Ansatz 1. Da der der Ausgabe hinzugefügte Rauschanteil unabhängig von der Anzahl der Ereignisse im Bucket ist, sind die Messdaten in Zusammenfassungsberichten bei Ansatz 2 ungenauer. Testen Sie für jeden Werbetreibenden verschiedene Kompromisse bei der Detailgenauigkeit des Schlüssels, um die Ergebnisse optimal zu nutzen.
Entscheidung: Wichtige Strukturen
In Noise Lab ausprobieren
Im einfachen Modus wird die Standardschlüsselstruktur verwendet. Im erweiterten Modus können Sie mit verschiedenen Schlüsselstrukturen experimentieren. Es sind einige Beispieldimensionen enthalten, die Sie auch ändern können.
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Schlüsselstrategie“. Die Standardstrategie, die im Tool als „A“ bezeichnet wird, verwendet eine detaillierte Schlüsselstruktur, die alle Dimensionen enthält: Geografie × Kampagnen-ID × Produktkategorie.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Hauptstrategie in B. Dadurch werden zusätzliche Steuerelemente zum Konfigurieren der Schlüsselstruktur angezeigt.
- Konfigurieren Sie die Schlüsselstruktur z.B. so:
- Anzahl der wichtigen Strukturen: 2
- Schlüsselstruktur 1 = Region × Produktkategorie
- Schlüsselstruktur 2 = Kampagnen-ID × Produktkategorie
- Klicken Sie auf „Simulieren“.
- Da Sie zwei verschiedene Schlüsselstrukturen verwenden, erhalten Sie jetzt zwei Zusammenfassungsberichte pro Messzielvorhaben (zwei für die Anzahl der Käufe, zwei für den Wert der Käufe). Beobachten Sie die Rauschverhältnisse.
- Sie können das auch mit Ihren eigenen benutzerdefinierten Dimensionen ausprobieren. Suchen Sie dazu nach den Daten, die Sie erfassen möchten: „Dimensionen“. Sie können die Beispieldimensionen entfernen und mithilfe der Schaltflächen „Hinzufügen“, „Entfernen“ und „Zurücksetzen“ unter der letzten Dimension eigene Dimensionen erstellen.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, sind die von Ihnen verwendeten Schlüsselstrukturen. Hier sind einige Beispiele für Aggregationsschlüssel:
- Eine Schlüsselstruktur mit allen Dimensionen; nennen wir diese Schlüsselstrategie A.
- Zwei wichtige Strukturen, jede mit einer Teilmenge von Dimensionen; nennen wir das „Schlüsselstrategie B“.

Strategie A ist einfacher, aber Sie müssen möglicherweise die fehlerhaften zusammengefassten Werte in Zusammenfassungsberichten zusammenfassen (summieren), um auf bestimmte Statistiken zuzugreifen. Wenn Sie diese Werte addieren, summieren Sie auch den Rauschenanteil. Bei Strategie B enthalten die zusammengefassten Werte in den Zusammenfassungsberichten möglicherweise bereits die benötigten Informationen. Das bedeutet, dass Strategie B wahrscheinlich zu einem besseren Signal-Rausch-Verhältnis führt als Strategie A. Möglicherweise ist der Rauschanteil mit Strategie A jedoch bereits akzeptabel. Daher können Sie sich aus Gründen der Einfachheit für Strategie A entscheiden. Weitere Informationen finden Sie im detaillierten Beispiel, das diese beiden Strategien veranschaulicht.
Die Schlüsselverwaltung ist ein komplexes Thema. Es gibt eine Reihe ausgefeilter Techniken, mit denen sich das Signal-Rausch-Verhältnis verbessern lässt. Eine davon wird unter Erweiterte Schlüsselverwaltung beschrieben.
Entscheidung: Batch-Frequenz
In Noise Lab ausprobieren
- Wechseln Sie zum einfachen Modus (oder zum erweiterten Modus – beide Modi funktionieren bei der Batch-Frequenz gleich).
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > „Batch-Frequenz“. Dies bezieht sich auf die Häufigkeit, mit der aggregierbare Berichte in einem einzelnen Job mit dem Aggregationsdienst verarbeitet werden.
- Beachten Sie die Standard-Batch-Häufigkeit: Standardmäßig wird eine tägliche Batch-Häufigkeit simuliert.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Häufigkeit der Batchverarbeitung in „Wöchentlich“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an: Die Rauschverhältnisse sind jetzt niedriger (besser) als bei der vorherigen Simulation.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse in einem einzelnen Bucket auswirkt, ist die von Ihnen festgelegte Batch-Frequenz. Die Batch-Häufigkeit gibt an, wie oft aggregierbare Berichte verarbeitet werden.
In einem Bericht, der häufiger (z.B. stündlich) aggregiert wird, sind weniger Conversion-Ereignisse enthalten als in einem Bericht mit einem weniger häufigen Aggregationszeitplan (z.B. wöchentlich). Daher enthält der stündliche Bericht mehr „Rauschen“.``` enthalten weniger Conversion-Ereignisse als derselbe Bericht mit einem weniger häufigen Aggregationszeitraum (z.B. jede Woche). Daher hat der stündliche Bericht bei ansonsten gleichen Bedingungen ein niedrigeres Signal-Rausch-Verhältnis als der Wochenbericht. Probieren Sie verschiedene Berichtsanforderungen mit unterschiedlichen Häufigkeiten aus und bewerten Sie für jede die Signal-Rausch-Verhältnisse.
Weitere Informationen finden Sie unter Batch-Verarbeitung und Aggregation über längere Zeiträume.
Entscheidung: Kampagnenvariablen, die sich auf atribuierbare Conversions auswirken
In Noise Lab ausprobieren
Das kann zwar schwierig vorherzusagen sein und es kann neben saisonalen Effekten auch zu erheblichen Schwankungen kommen. Versuchen Sie jedoch, die Anzahl der täglichen Conversions mit nur einer Interaktion auf die nächste Zehnerpotenz zu schätzen: 10, 100, 1.000 oder 10.000.
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig ist die tägliche Gesamtzahl der zugeordneten Conversions auf 1.000 festgelegt. Bei der Standardkonfiguration (Standarddimensionen, Standardzahl der möglichen verschiedenen Werte für jede Dimension, Hauptstrategie A) ergibt sich ein Durchschnitt von etwa 40 pro Bucket. Beachten Sie, dass der Wert in der Eingabe „Durchschnittliche tägliche Anzahl der zurechenbaren Conversions PRO BUCKET“ 40 beträgt.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardparametern auszuführen.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Legen Sie nun die tägliche Anzahl der zurechenbaren Conversions auf 100 fest. Dadurch wird der Wert für die durchschnittliche tägliche Anzahl der zurechenbaren Conversions pro BUCKET gesenkt.
- Klicken Sie auf „Simulieren“.
- Die Rauschanteile sind jetzt höher. Das liegt daran, dass bei weniger Conversions pro Bucket mehr Rauschen angewendet wird, um den Datenschutz zu wahren.
Es ist wichtig, zwischen der Gesamtzahl der möglichen Conversions für einen Werbetreibenden und der Gesamtzahl der möglichen zugewiesenen Conversions zu unterscheiden. Letzteres wirkt sich letztendlich auf den Rauschenpegel in Zusammenfassungsberichten aus. Zugewiesene Conversions sind eine Teilmenge der Gesamtzahl der Conversions, die von Kampagnenvariablen wie dem Anzeigenbudget und der Anzeigenausrichtung beeinflusst werden. So ist beispielsweise bei einer Werbekampagne mit einem Budget von 10 Millionen Euro unter sonst gleichen Bedingungen eine höhere Anzahl von zugeordneten Conversions zu erwarten als bei einer Werbekampagne mit einem Budget von 10. 000 Euro.
Beachten Sie Folgendes:
- Vergleichen Sie die zugeordneten Conversions mit einem Attributionsmodell vom Typ „Einmal-Touch“ und „Gleiche Geräte“, da diese in den Zusammenfassungsberichten enthalten sind, die mit der Attribution Reporting API erfasst werden.
- Berücksichtigen Sie sowohl die Anzahl der zugeordneten Conversions im Worst-Case- als auch im Best-Case-Szenario. Angenommen, Sie berücksichtigen das minimale und maximale Kampagnenbudget für einen Werbetreibenden und projizieren dann die zurechenbaren Conversions für beide Ergebnisse als Eingaben in Ihre Simulation.
- Wenn Sie die Privacy Sandbox für Android verwenden möchten, sollten Sie bei der Berechnung plattformübergreifend zugeordnete Conversions berücksichtigen.
Entscheidung: Skalierung verwenden
In Noise Lab ausprobieren
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie im seitlichen Bereich „Parameter“ nach „Aggregationsstrategie“ > „Skalierung“. Die Standardeinstellung ist „Ja“.
- Um die positiven Auswirkungen der Skalierung auf das Rausch-Verhältnis zu verstehen, legen Sie zuerst „Skalierung“ auf „Nein“ fest.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Legen Sie „Skalierung“ auf „Ja“ fest. Hinweis: In Noise Lab werden die zu verwendenden Skalierungsfaktoren automatisch anhand der Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario berechnet. Bei der Einrichtung eines echten Systems oder Ursprungstests sollten Sie Ihre eigene Berechnung für Skalierungsfaktoren implementieren.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation jetzt niedriger (besser) sind. Das liegt daran, dass Sie die Skalierung verwenden.
Gemäß dem Grundlegenden Designprinzip ist das hinzugefügte Rauschen eine Funktion des Beitragsbudgets.
Um das Signal-Rausch-Verhältnis zu verbessern, können Sie die während eines Conversion-Ereignisses erfassten Werte anhand des Beitragsbudgets skalieren und nach der Aggregation wieder in den ursprünglichen Zustand versetzen. Mit der Skalierung lässt sich das Signal-Rausch-Verhältnis erhöhen.
Entscheidung: Anzahl der Analyseziele und Aufteilung des Datenschutzbudgets
Weitere Informationen finden Sie unter Skalierung verwenden.
In Noise Lab ausprobieren
Ein Analysezielvorhaben ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie im seitlichen Bereich „Parameter“ nach den Daten, die Sie erfassen möchten: Messziele. Standardmäßig sind zwei Messziele verfügbar: „Kaufwert“ und „Kaufmenge“.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardzielvorhaben auszuführen.
- Klicken Sie auf „Entfernen“. Dadurch wird das letzte Messziel entfernt (in diesem Fall die Anzahl der Käufe).
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschanteile für den Kaufwert bei dieser zweiten Simulation jetzt niedriger (besser) sind. Das liegt daran, dass Sie weniger Messziele haben. Daher wird das gesamte Beitragsbudget jetzt auf das einzige Messziel angewendet.
- Klicken Sie auf „Zurücksetzen“. Sie haben jetzt wieder zwei Analyseziele: Kaufwert und Anzahl der Käufe. Hinweis: In Noise Lab werden die zu verwendenden Skalierungsfaktoren automatisch anhand der Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario berechnet. Standardmäßig wird das Budget in Noise Lab gleichmäßig auf die Analyseziele verteilt.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Achten Sie auf die Skalierungsfaktoren, die in der Simulation angezeigt werden.
- Passen wir nun die Aufteilung des Datenschutzbudgets an, um ein besseres Signal-Rausch-Verhältnis zu erzielen.
- Passen Sie den Prozentsatz des Budgets an, der für jedes Messziel zugewiesen ist. Bei den Standardparametern hat Zielvorhaben 1, also der Wert der Käufe, einen viel größeren Bereich (zwischen 0 und 1.000) als Zielvorhaben 2, also die Anzahl der Käufe (zwischen 1 und 1, also immer gleich 1). Daher benötigt es „mehr Spielraum für die Skalierung“: Idealerweise wird dem ersten Messziel mehr Beitragsbudget zugewiesen als dem zweiten, damit es effizienter skaliert werden kann (siehe „Skalierung“).
- Weisen Sie 70% des Budgets dem Analyseziel 1 zu. Weisen Sie Zielvorhaben 2 der Messung 30% zu.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Bei Kaufpreisen sind die Rauschverhältnisse jetzt deutlich niedriger (besser) als bei der vorherigen Simulation. Die Anzahl der Käufe ist ungefähr gleich geblieben.
- Passen Sie die Budgetaufteilung nach und nach an die Messwerte an. Beobachten Sie, wie sich das auf den Rauschpegel auswirkt.
Mit den Schaltflächen „Hinzufügen“, „Entfernen“ und „Zurücksetzen“ können Sie benutzerdefinierte Analyseziele festlegen.
Wenn Sie einen Datenpunkt (Messzielvorhaben) für ein Conversion-Ereignis erfassen, z. B. die Conversion-Anzahl, kann dieser Datenpunkt das gesamte Beitragsbudget (65.536) erhalten. Wenn Sie für ein Conversion-Ereignis mehrere Analyseziele festlegen, z. B. die Anzahl der Conversions und den Kaufwert, muss das Beitragsbudget auf diese Datenpunkte aufgeteilt werden. Das bedeutet, dass Sie weniger Spielraum haben, Ihre Werte zu skalieren.
Je mehr Analyseziele Sie haben, desto geringer ist also wahrscheinlich das Signal-Rausch-Verhältnis (höheres Rauschen).
Eine weitere Entscheidung, die Sie in Bezug auf die Analyseziele treffen müssen, ist die Budgetaufteilung. Wenn Sie das Beitragsbudget gleichmäßig auf zwei Datenpunkte aufteilen, erhält jeder Datenpunkt ein Budget von 65.536 ÷ 2 = 32.768. Das ist je nach dem maximal möglichen Wert für jeden Datenpunkt optimal oder nicht. Wenn Sie beispielsweise die Anzahl der Käufe mit einem Maximalwert von 1 und den Wert des Kaufs mit einem Minimum von 1 und einem Maximum von 120 messen, kann der Wert des Kaufs „ausgedehnt“ werden, d. h., er kann einen größeren Anteil des Beitragsbudgets erhalten. Sie sehen, ob einige Analyseziele im Hinblick auf die Auswirkungen von Rauschen gegenüber anderen priorisiert werden sollten.
Entscheidung: Ausreißerverwaltung
In Noise Lab ausprobieren
Ein Analysezielvorhaben ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Rufen Sie den erweiterten Modus auf.
- Suchen Sie im seitlichen Bereich „Parameter“ nach „Aggregationsstrategie“ > „Skalierung“.
- Achten Sie darauf, dass „Scaling“ auf „Yes“ (Ja) gesetzt ist. Die zu verwendenden Skalierungsfaktoren werden in Noise Lab automatisch anhand der von Ihnen für die Analyseziele angegebenen Bereiche (Durchschnitts- und Maximalwerte) berechnet.
- Angenommen, der größte Kauf aller Zeiten betrug 2.000 €, die meisten Käufe liegen aber im Bereich von 10 bis 120 €. Sehen wir uns zuerst an, was passiert, wenn wir einen buchstäblichen Skalierungsansatz verwenden (nicht empfohlen): Geben Sie 2.000 $als maximalen Wert für „purchaseValue“ ein.
- Klicken Sie auf „Simulieren“.
- Die Rauschanteile sind hoch. Das liegt daran, dass unser Skalierungsfaktor derzeit auf 2.000 $basiert, die meisten Kaufwerte in Wirklichkeit aber deutlich darunter liegen.
- Sehen wir uns nun einen pragmatischeren Ansatz zur Skalierung an. Ändern Sie den maximalen Kaufwert in 120 $.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation niedriger (besser) sind.
Wenn Sie die Skalierung implementieren möchten, berechnen Sie in der Regel einen Skalierungsfaktor basierend auf dem maximal möglichen Wert für ein bestimmtes Conversion-Ereignis. Weitere Informationen finden Sie in diesem Beispiel.
Verwenden Sie jedoch keinen buchstäblichen Maximalwert, um diesen Skalierungsfaktor zu berechnen, da sich dadurch das Signal-Rausch-Verhältnis verschlechtert. Entfernen Sie stattdessen Ausreißer und verwenden Sie einen pragmatischen Maximalwert.
Das Management von Ausreißern ist ein umfangreiches Thema. Es gibt eine Reihe ausgefeilter Techniken, mit denen sich das Signal-Rausch-Verhältnis verbessern lässt. Eine davon wird unter Erweiterte Verwaltung von Ausreißern beschrieben.
Nächste Schritte
Nachdem Sie verschiedene Strategien zur Verwaltung von Rauschen für Ihren Anwendungsfall bewertet haben, können Sie mit dem Testen von Zusammenfassungsberichten beginnen. Dazu erfassen Sie echte Messdaten über einen Test der Herkunft. Anleitungen und Tipps zum Testen der API
Anhang
Kurze Einführung in Noise Lab
Mit Noise Lab können Sie Strategien zur Geräuschminderung schnell bewerten und vergleichen. Sie können damit:
- Die wichtigsten Parameter, die sich auf Rauschen auswirken können, und ihre Auswirkungen.
- Die Auswirkungen von Rauschen auf die Ausgabemessdaten bei verschiedenen Designentscheidungen simulieren Passen Sie die Designparameter an, bis Sie ein Signal-Rausch-Verhältnis erreichen, das für Ihren Anwendungsfall geeignet ist.
- Teilen Sie uns mit, wie nützlich Sie die Zusammenfassungsberichte finden: Welche Werte für die Epsilon- und Rauschparameter funktionieren für Sie und welche nicht? Wo sind die Wendepunkte?
Betrachten Sie dies als Vorbereitungsschritt. Noise Lab generiert Messdaten, um anhand Ihrer Eingaben Zusammenfassungsberichte zu simulieren. Es werden keine Daten gespeichert oder weitergegeben.
In Noise Lab gibt es zwei verschiedene Modi:
- Einfacher Modus: Hier erfahren Sie die Grundlagen der Einstellungen für Geräusche.
- Erweiterter Modus: Hier können Sie verschiedene Strategien zur Geräuschunterdrückung testen und bewerten, welche das beste Signal-Rausch-Verhältnis für Ihre Anwendungsfälle bietet.
Klicken Sie auf die Schaltflächen im Menü oben, um zwischen den beiden Modi zu wechseln (Nummer 1 im Screenshot unten).
Einfacher Modus
- Im einfachen Modus können Sie Parameter wie Epsilon (auf der linken Seite oder Nummer 2 im Screenshot unten) steuern und sehen, wie sich diese auf den Rauschpegel auswirken.
- Jeder Parameter hat eine Kurzinfo (Schaltfläche „?“). Klicken Sie darauf, um eine Erklärung der einzelnen Parameter aufzurufen (#3. im Screenshot unten).
- Klicken Sie zuerst auf die Schaltfläche „Simulieren“ und sehen Sie sich die Ausgabe an (#4 im Screenshot unten).
- Im Bereich „Ausgabe“ sehen Sie verschiedene Details. Neben einigen Elementen steht ein „?“. Klicken Sie auf die einzelnen „?“, um eine Erklärung der verschiedenen Informationen zu erhalten.
- Klicken Sie im Bereich „Ausgabe“ auf die Ein/Aus-Schaltfläche für Details, um eine maximierte Version der Tabelle aufzurufen (#5 im Screenshot unten).
- Unter jeder Datentabelle im Ausgabebereich gibt es eine Option, die Tabelle zur Offlinenutzung herunterzuladen. Außerdem haben Sie rechts unten die Möglichkeit, alle Datentabellen herunterzuladen (Nummer 6 im Screenshot unten).
- Testen Sie verschiedene Einstellungen für die Parameter im Bereich „Parameter“ und klicken Sie auf „Simulieren“, um zu sehen, wie sich diese auf die Ausgabe auswirken:
Noise Lab-Benutzeroberfläche für den einfachen Modus
Erweiterter Modus
- Im erweiterten Modus haben Sie mehr Kontrolle über die Parameter. Sie können benutzerdefinierte Analyseziele und Dimensionen hinzufügen (1. und 2. im Screenshot unten).
- Scrollen Sie im Bereich „Parameter“ nach unten und sehen Sie sich die Option „Schlüsselstrategie“ an. So können Sie verschiedene Schlüsselstrukturen testen (#3 im Screenshot unten).
- Wenn Sie verschiedene Schlüsselstrukturen testen möchten, ändern Sie die Schlüsselstrategie zu „B“.
- Geben Sie die Anzahl der verschiedenen Schlüsselstrukturen ein, die Sie verwenden möchten. Standardmäßig ist „2“ festgelegt.
- Klicken Sie auf „Schlüsselstrukturen generieren“.
- Klicken Sie auf die Kästchen neben den Schlüsseln, die Sie für jede Schlüsselstruktur einbeziehen möchten, um die entsprechenden Optionen zu sehen.
- Klicken Sie auf „Simulieren“, um die Ausgabe zu sehen.
Noise Lab-Benutzeroberfläche für den erweiterten Modus Noise Lab-Benutzeroberfläche für den erweiterten Modus
Rauschmesswerte
Zentrales Konzept
Störsignale werden hinzugefügt, um die Privatsphäre einzelner Nutzer zu schützen.
Ein hoher Rauschwert weist darauf hin, dass die Bucket/Schlüssel spärlich sind und Beiträge von einer begrenzten Anzahl sensibler Ereignisse enthalten. Dies geschieht automatisch durch Noise Lab, damit sich Personen „in der Masse verstecken“ können. Mit anderen Worten: Der Datenschutz dieser Personen wird durch eine größere Menge hinzugefügter Rauschen geschützt.
Ein niedriger Rauschwert weist darauf hin, dass die Datenkonfiguration so konzipiert wurde, dass sich einzelne Personen bereits „in der Masse verstecken“ können. Das bedeutet, dass die Bucket-Daten Beiträge von einer ausreichenden Anzahl von Ereignissen enthalten, um die Privatsphäre einzelner Nutzer zu schützen.
Dies gilt sowohl für den durchschnittlichen prozentualen Fehler (APE) als auch für den RMSRE_T (Wurzel des mittleren quadratischen relativen Fehlers mit einem Grenzwert).
APE (durchschnittlicher prozentualer Fehler)
Der APE ist das Verhältnis von Rauschen zu Signal, also der wahre Summenwert.p> Je niedriger der APE-Wert, desto besser ist das Signal-Rausch-Verhältnis.
Formel
Für einen bestimmten Zusammenfassungsbericht wird der durchschnittliche Preis pro 1.000 Impressionen so berechnet:

True ist der wahre Summenwert. APE ist der Durchschnitt der Abweichungen für jeden wahren Summenwert, durchschnittlich über alle Einträge in einem Zusammenfassungsbericht. In Noise Lab wird dieser Wert dann mit 100 multipliziert, um einen Prozentsatz zu erhalten.
Vor- und Nachteile
Blöcke mit kleineren Größen haben einen unverhältnismäßig großen Einfluss auf den Endwert der durchschnittlichen Preiselastizität. Das kann bei der Beurteilung von Lärm irreführend sein. Aus diesem Grund haben wir einen weiteren Messwert hinzugefügt, RMSRE_T, der diese Einschränkung von APE abmildern soll. Weitere Informationen finden Sie in den Beispielen.
Code
Quellcode für die APE-Berechnung ansehen
RMSRE_T (Wurzel des mittleren quadratischen relativen Fehlers mit einem Grenzwert)
RMSRE_T (Wurzel des mittleren quadratischen relativen Fehlers mit Grenzwert) ist ein weiterer Messwert für Rauschen.
RMSRE_T auswerten
Je niedriger der Wert für RMSRE_T ist, desto besser ist das Signal-Rausch-Verhältnis.
Wenn beispielsweise ein für Ihren Anwendungsfall akzeptables Rauschverhältnis 20 % beträgt und RMSRE_T = 0, 2 ist, können Sie davon ausgehen, dass die Rauschpegel im akzeptablen Bereich liegen.
Formel
Für einen bestimmten Zusammenfassungsbericht wird RMSRE_T so berechnet:

Vor- und Nachteile
RMSRE_T ist etwas komplizierter als APE. Sie hat jedoch einige Vorteile, die sie in einigen Fällen besser als APE für die Analyse von Rauschen in Zusammenfassungsberichten geeignet machen:
- RMSRE_T ist stabiler. „T“ ist ein Grenzwert. „T“ gibt an, dass bei der Berechnung von RMSRE_T weniger Gewicht auf Buckets mit weniger Conversions gelegt wird, die aufgrund ihrer geringen Größe empfindlicher auf Rauschen reagieren. Bei T kommt es bei Bucket mit wenigen Conversions nicht zu Spitzenwerten. Wenn T = 5 ist, wird ein Rauschwert von nur 1 in einem Bucket mit 0 Conversions nicht als weit über 1 angezeigt. Stattdessen wird sie auf 0, 2 begrenzt, was 1/5 entspricht, da T = 5 ist. Da kleinere Bucket, die empfindlicher auf Rauschen reagieren, weniger gewichtet werden, ist dieser Messwert stabiler und ermöglicht einen einfacheren Vergleich von zwei Simulationen.
- RMSRE_T ermöglicht eine einfache Aggregation. Wenn Sie die RMSRE_T mehrerer Bucket mit ihren tatsächlichen Werten kennen, können Sie die RMSRE_T ihrer Summe berechnen. So können Sie auch für diese kombinierten Werte nach RMSRE_T optimieren.
Die Aggregation ist für APE zwar möglich, die Formel ist jedoch recht kompliziert, da sie den absoluten Wert der Summe der Laplace-Störungen enthält. Das erschwert die Optimierung von APE.
Code
Sehen Sie sich den Quellcode für die Berechnung von RMSRE_T an.
Beispiele
Zusammenfassender Bericht mit drei Kategorien:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) ÷ 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Zusammenfassender Bericht mit drei Kategorien:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) ÷ 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Zusammenfassender Bericht mit drei Kategorien:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + Unendlich) ÷ 3 = Unendlich
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Erweiterte Schlüsselverwaltung
Eine DSP oder ein Unternehmen für Anzeigenmessung kann Tausende von Werbekunden weltweit haben, die verschiedene Branchen, Währungen und Kaufpreispotenziale abdecken. Das Erstellen und Verwalten eines Aggregationsschlüssels pro Werbetreibendem ist daher höchst unpraktisch. Außerdem ist es schwierig, einen maximal aggregierbaren Wert und ein Aggregationsbudget auszuwählen, mit dem sich die Auswirkungen von Störfaktoren bei diesen Tausenden von Werbetreibenden weltweit begrenzen lassen. Betrachten wir stattdessen die folgenden Szenarien:
Schlüsselstrategie A
Der Anbieter von Anzeigentechnologien beschließt, einen Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten. Bei allen Werbetreibenden und in allen Währungen variiert die Bandbreite der Käufe von Käufen mit geringem Volumen und hohem Preis bis hin zu Käufen mit hohem Volumen und niedrigem Preis. Das führt zum folgenden Schlüssel:
Schlüssel (mehrere Währungen) | |
---|---|
Maximal aggregierbarer Wert | 5.000.000 |
Kaufwertbereich | [120 – 5000000] |
Schlüsselstrategie B
Der Anbieter von Anzeigentechnologien beschließt, zwei Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten. Er beschließt, die Schlüssel nach Währung zu trennen. Bei allen Werbetreibenden und in allen Währungen variiert die Bandbreite der Käufe von wenigen, teuren Käufen bis hin zu vielen, günstigen Käufen. Er trennt die Daten nach Währung und erstellt zwei Schlüssel:
Schlüssel 1 (USD) | Taste 2 (¥) | |
---|---|---|
Maximal aggregierbarer Wert | 40.000 $ | 5.000.000 JPY |
Kaufwertbereich | [120 – 40.000] | [15.000–5.000.000] |
Bei der Schlüsselstrategie B sind die Ergebnisse weniger fehlerbehaftet als bei der Schlüsselstrategie A, da die Währungswerte nicht gleichmäßig auf die einzelnen Währungen verteilt sind. Angenommen, Käufe in japanischen Yen werden mit Käufen in US-Dollar vermischt. Das würde die zugrunde liegenden Daten und die daraus resultierende Ausgabe ungenau machen.
Schlüsselstrategie C
Der Anbieter von Anzeigentechnologien beschließt, vier Schlüssel für alle Werbekunden zu erstellen und zu verwalten und diese nach Währung x Werbebranche zu trennen:
Schlüssel 1 (USD x Werbetreibende für Luxusschmuck) |
Schlüssel 2 (¥ x Werbetreibende für Luxusschmuck) |
Schlüssel 3 (USD × Werbetreibende aus der Bekleidungsbranche) |
Schlüssel 4 (¥ x Werbetreibende aus der Bekleidungsbranche) |
|
---|---|---|---|---|
Maximal aggregierbarer Wert | 40.000 $ | 5.000.000 JPY | 500 € | 65.000 JPY |
Kaufwertbereich | [10.000–40.000] | [1.250.000–5.000.000] | [120–500] | [15.000–65.000] |
Bei der wichtigsten Strategie C sind die Ergebnisse weniger fehlerbehaftet als bei der wichtigsten Strategie B, da die Kaufwerte der Werbetreibenden nicht gleichmäßig auf die Werbetreibenden verteilt sind. Angenommen, Käufe von hochwertigem Schmuck werden mit Käufen von Baseballmützen vermischt. Das würde die zugrunde liegenden Daten und die daraus resultierende Ausgabe verfälschen.
Sie können gemeinsame maximale Gesamtwerte und gemeinsame Skalierungsfaktoren für Gemeinsamkeiten bei mehreren Werbetreibenden erstellen, um Abweichungen in den Ergebnissen zu reduzieren. Sie können beispielsweise die folgenden Strategien für Ihre Werbetreibenden ausprobieren:
- Eine Strategie, nach Währung (z. B. USD, ¥, CAD) getrennt
- Eine Strategie, getrennt nach Branche des Werbetreibenden (Versicherung, Automobil, Einzelhandel usw.)
- Eine Strategie, die nach ähnlichen Kaufpreisbereichen unterteilt ist ([100], [1.000], [10.000] usw.)
Wenn Sie Strategien für gemeinsame Merkmale von Werbetreibenden entwickeln, lassen sich Schlüssel und der entsprechende Code leichter verwalten und das Signal-Rausch-Verhältnis wird höher. Testen Sie verschiedene Strategien mit unterschiedlichen Gemeinsamkeiten von Werbetreibenden, um Wendepunkte bei der Maximierung der Auswirkungen von Rauschen im Vergleich zum Codemanagement zu ermitteln.
Erweiterte Verwaltung von Ausreißern
Sehen wir uns ein Szenario mit zwei Werbetreibenden an:
- Werbetreibender A:
- Für alle Produkte auf der Website von Werbetreibendem A liegen die Kaufpreise zwischen [$120 und $1.000] , was einer Spanne von 880 $entspricht.
- Die Kaufpreise sind gleichmäßig über den Bereich von 880 $verteilt, ohne Ausreißer außerhalb von zwei Standardabweichungen vom Medianwert des Kaufpreises.
- Werbetreibender B:
- Für alle Produkte auf der Website von Werbetreibendem B liegen die Kaufpreise zwischen [$120 und $1.000] , was einer Spanne von 880 $entspricht.
- Die Kaufpreise liegen hauptsächlich im Bereich von 120 $bis 500 $. Nur 5% der Käufe liegen im Bereich von 500 $bis 1.000 $.
Aufgrund der Anforderungen an das Beitragsbudget und der Methode, mit der Rauschen auf die Endergebnisse angewendet wird, hat Werbetreibender B standardmäßig eine ungenauere Ausgabe als Werbetreibender A, da bei Werbetreibender B die Wahrscheinlichkeit höher ist, dass Ausreißer sich auf die zugrunde liegenden Berechnungen auswirken.
Mit einer bestimmten Schlüsseleinrichtung lässt sich dieses Problem jedoch beheben. Testen Sie Schlüsselstrategien, mit denen sich Ausreißerdaten besser verwalten und Kaufwerte gleichmäßiger über den Kaufbereich des Schlüssels verteilen lassen.
Für Werbetreibender B könnten Sie zwei separate Schlüssel erstellen, um zwei unterschiedliche Kaufpreisbereiche zu erfassen. In diesem Beispiel hat der Werbetreibende festgestellt, dass Ausreißer über dem Kaufwert von 500 $liegen. Implementieren Sie zwei separate Schlüssel für diesen Werbetreibenden:
- Schlüsselstruktur 1 : Schlüssel, der nur Käufe im Bereich von 120 $bis 500 $ erfasst (deckt etwa 95% des gesamten Kaufvolumens ab).
- Schlüsselstruktur 2: Schlüssel, der nur Käufe über 500 $erfasst (ca. 5% des gesamten Kaufvolumens).
Durch die Implementierung dieser wichtigen Strategie sollte es möglich sein, Störfaktoren für Werbetreibender B besser zu verwalten und die Nützlichkeit von Zusammenfassungsberichten zu maximieren. Aufgrund der neuen, kleineren Bereiche sollten Schlüssel A und Schlüssel B jetzt eine gleichmäßigere Verteilung der Daten auf die jeweiligen Schlüssel haben als beim vorherigen einzelnen Schlüssel. Dies führt zu weniger Rauscheinflüssen bei der Ausgabe der einzelnen Schlüssel als beim vorherigen einzelnen Schlüssel.