Hier erfahren Sie, was Rauschen ist, wo es hinzugefügt wird und wie es sich auf Ihre Analyse auswirkt.
Zusammenfassungsberichte sind das Ergebnis der Aggregation von aggregierbaren Berichten. Wenn aggregierbare Berichte von einem Collector in Batches zusammengefasst und vom Aggregationsdienst verarbeitet werden, wird den resultierenden Zusammenfassungsberichten Rauschen (eine zufällige Menge an Daten) hinzugefügt. Es werden Störsignale hinzugefügt, um den Datenschutz zu verbessern. Ziel dieses Mechanismus ist es, ein Framework zu schaffen, das differenziell private Analysen unterstützt.

Abweichungen in zusammenfassenden Berichten
Das Hinzufügen von Rauschen ist derzeit in der Regel nicht Teil der Anzeigenanalyse. In vielen Fällen ändert sich dadurch aber nicht wesentlich, wie Sie Ihre Ergebnisse interpretieren.
Es kann hilfreich sein, sich Folgendes zu fragen: Würden Sie eine Entscheidung auf Grundlage bestimmter Daten treffen, wenn diese Daten nicht verrauscht wären?
Wäre ein Werbetreibender beispielsweise zuversichtlich, seine Kampagnenstrategie oder seine Budgets zu ändern, wenn Kampagne A 15 Conversions und Kampagne B 16 Conversions erzielt hat?
Wenn die Antwort „Nein“ lautet, ist Rauschen irrelevant.
Sie sollten Ihre API-Nutzung so konfigurieren, dass:
- Die Antwort auf die Frage lautet „Ja“.
- Rauschen wird so verwaltet, dass es Ihre Fähigkeit, Entscheidungen auf Grundlage bestimmter Daten zu treffen, nicht wesentlich beeinträchtigt. Sie können so vorgehen: Bei einer erwarteten Mindestanzahl von Conversions möchten Sie das Rauschen im erfassten Messwert unter einem bestimmten Prozentsatz halten.
In diesem und im folgenden Abschnitt werden Strategien zur Erreichung von Ziel 2 beschrieben.
Wichtige Konzepte
Der Aggregationsdienst fügt jedem zusammengefassten Wert (d. h. einmal pro Schlüssel) einmal Rauschen hinzu, wenn ein zusammengefasster Bericht angefordert wird.
Diese Rauschwerte werden zufällig aus einer bestimmten Wahrscheinlichkeitsverteilung gezogen.
Alle Elemente, die sich auf das Rauschen auswirken, basieren auf zwei primären Konzepten.
Die Rauschverteilung (siehe unten) ist unabhängig vom Zusammenfassungswert gleich, egal ob er niedrig oder hoch ist. Je höher der zusammenfassende Wert, desto geringer ist die Wahrscheinlichkeit, dass sich Rauschen relativ zu diesem Wert auswirkt.
Angenommen, sowohl ein aggregierter Gesamtkaufwert von 20.000 $als auch ein aggregierter Gesamtkaufwert von 200 $unterliegen Rauschen,das aus derselben Verteilung ausgewählt wird.
Nehmen wir an, dass der Rauschenwert aus dieser Verteilung ungefähr zwischen -100 und +100 variiert.
- Bei einem zusammengefassten Kaufwert von 20.000 $variiert das Rauschen zwischen 0 und 100/20.000=0,5%.
- Beim zusammengefassten Kaufwert von 200 $variiert das Rauschen zwischen 0 und 100/200=50%.
Daher hat Rauschen wahrscheinlich einen geringeren Einfluss auf den aggregierten Kaufwert von 20.000 $als auf den Wert von 200 $. Relativ gesehen sind 20.000 $ wahrscheinlich weniger verrauscht, d. h., das Signal-Rausch-Verhältnis ist höher.
Höhere aggregierte Werte sind relativ weniger von Rauschen betroffen. Das hat einige wichtige praktische Auswirkungen, die im nächsten Abschnitt beschrieben werden. Dieser Mechanismus ist Teil des API-Designs und die praktischen Auswirkungen sind langfristig. Sie werden weiterhin eine wichtige Rolle spielen, wenn Ad-Tech-Unternehmen verschiedene Aggregationsstrategien entwickeln und bewerten.
Der Rauschen wird unabhängig vom Zusammenfassungswert aus derselben Verteilung gezogen. Diese Verteilung hängt jedoch von mehreren Parametern ab. Einer dieser Parameter, Epsilon, konnte von Ad-Tech-Unternehmen während des abgeschlossenen Origin Trials geändert werden, um verschiedene Anpassungen in Bezug auf Nützlichkeit und Datenschutz zu testen. Die Möglichkeit, Epsilon anzupassen, ist jedoch nur vorübergehend. Wir freuen uns über Ihr Feedback zu Ihren Anwendungsfällen und den Werten von Epsilon, die gut funktionieren.
Anbieter von Anzeigentechnologien haben zwar keinen direkten Einfluss darauf, wie Rauschen hinzugefügt wird, können aber den Einfluss von Rauschen auf ihre Messdaten beeinflussen. In den nächsten Abschnitten erfahren Sie, wie sich Rauschen in der Praxis beeinflussen lässt.
Sehen wir uns vorher genauer an, wie Rauschen angewendet wird.
Heranzoomen: So wird Rauschen angewendet
Eine Rauschverteilung
Der Rauschen wird aus der Laplace-Verteilung mit den folgenden Parametern gezogen:
- Ein Mittelwert (
μ
) von 0. Das bedeutet, dass der wahrscheinlichste Rauschwert 0 ist (kein Rauschen hinzugefügt) und dass der verrauschte Wert genauso wahrscheinlich kleiner wie größer als der ursprüngliche Wert ist (dies wird manchmal als unvoreingenommen bezeichnet). - Ein Skalierungsparameter von
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
ist im Browser definiert.epsilon
wird im Aggregationsdienst verwendet.
Das folgende Diagramm zeigt die Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20:

Zufällige Rauschwerte, eine Rauschverteilung
Angenommen, eine Ad-Tech-Firma fordert Zusammenfassungsberichte für zwei Aggregationsschlüssel an: „key1“ und „key2“.
Der Aggregationsdienst wählt zwei Rauschwerte x1 und x2 aus, die der gleichen Rauschverteilung folgen. x1 wird dem Zusammenfassungswert für key1 und x2 dem Zusammenfassungswert für key2 hinzugefügt.
In den Diagrammen stellen wir Rauschwerte als identisch dar. Das ist eine Vereinfachung. In der Realität variieren die Rauschwerte, da sie zufällig aus der Verteilung gezogen werden.
Das zeigt, dass die Rauschwerte alle aus derselben Verteilung stammen und unabhängig vom zusammenfassenden Wert sind, auf den sie angewendet werden.
Weitere Eigenschaften von Rauschen
Jeder zusammengefasste Wert wird mit Rauschen versehen, auch leere Werte (0).

Selbst wenn der tatsächliche zusammengefasste Wert für einen bestimmten Schlüssel 0 ist, wird der zusammengefasste Wert, der im Übersichtsbericht für diesen Schlüssel angezeigt wird, höchstwahrscheinlich nicht 0 sein.
Rauschen kann eine positive oder negative Zahl sein.

Bei einem Kaufbetrag vor Rauschen von 327.000 € kann das Rauschen beispielsweise +6.000 € oder -6.000 € betragen (diese Werte sind willkürlich).
Rauschen bewerten
Standardabweichung des Rauschens berechnen
Die Standardabweichung des Rauschens ist:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Beispiel
Bei Epsilon = 10 beträgt die Standardabweichung des Rauschens:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Bewerten, wann Messunterschiede signifikant sind
Da Sie die Standardabweichung des Rauschens kennen, das jedem vom Aggregationsdienst ausgegebenen Wert hinzugefügt wird, können Sie geeignete Grenzwerte für den Vergleich festlegen, um zu ermitteln, ob beobachtete Unterschiede auf Rauschen zurückzuführen sein könnten.
Wenn beispielsweise das Rauschen, das einem Wert hinzugefügt wird, ungefähr +/- 10 beträgt (unter Berücksichtigung der Skalierung) und die Differenz des Werts zwischen zwei Kampagnen über 100 liegt, kann mit hoher Wahrscheinlichkeit davon ausgegangen werden, dass die Differenz des gemessenen Werts zwischen den einzelnen Kampagnen nicht allein auf Rauschen zurückzuführen ist.
Reagieren und Feedback geben
Sie können an dieser API teilnehmen und sie testen.
- Informieren Sie sich über aggregierbare Berichte und den Aggregationsdienst, stellen Sie Fragen und geben Sie Feedback.
- Leitfäden zu Attributionsberichten
- Im Privacy Sandbox-Entwickler-Support-Repository kannst du Fragen stellen und an Diskussionen teilnehmen.
Nächste Schritte
- Informationen dazu, welche Variablen Sie steuern können, um das Signal-Rausch-Verhältnis zu verbessern, finden Sie unter Rauschen reduzieren.
- Weitere Informationen zur Planung Ihrer Strategien für die Aggregationsberichterstellung finden Sie unter Zusammenfassungsberichte für Tests entwerfen.
- Noise Lab ausprobieren