Rauschen in Zusammenfassungsberichten

Hier erfahren Sie, was Rauschen ist, wo es hinzugefügt wird und wie es sich auf Ihre Analyse auswirkt.

Zusammenfassungsberichte sind das Ergebnis der Aggregation von aggregierbaren Berichten. Wenn aggregierbare Berichte von einem Collector in Batches zusammengefasst und vom Aggregationsdienst verarbeitet werden, wird den resultierenden Zusammenfassungsberichten Rauschen (eine zufällige Menge an Daten) hinzugefügt. Es werden Störsignale hinzugefügt, um den Datenschutz zu verbessern. Ziel dieses Mechanismus ist es, ein Framework zu schaffen, das differenziell private Analysen unterstützt.

Im endgültigen Zusammenfassungsbericht wird Rauschen hinzugefügt.
Im endgültigen Zusammenfassungsbericht wird Rauschen hinzugefügt.

Abweichungen in zusammenfassenden Berichten

Das Hinzufügen von Rauschen ist derzeit in der Regel nicht Teil der Anzeigenanalyse. In vielen Fällen ändert sich dadurch aber nicht wesentlich, wie Sie Ihre Ergebnisse interpretieren.

Es kann hilfreich sein, sich Folgendes zu fragen: Würden Sie eine Entscheidung auf Grundlage bestimmter Daten treffen, wenn diese Daten nicht verrauscht wären?

Wäre ein Werbetreibender beispielsweise zuversichtlich, seine Kampagnenstrategie oder seine Budgets zu ändern, wenn Kampagne A 15 Conversions und Kampagne B 16 Conversions erzielt hat?

Wenn die Antwort „Nein“ lautet, ist Rauschen irrelevant.

Sie sollten Ihre API-Nutzung so konfigurieren, dass:

  1. Die Antwort auf die Frage lautet „Ja“.
  2. Rauschen wird so verwaltet, dass es Ihre Fähigkeit, Entscheidungen auf Grundlage bestimmter Daten zu treffen, nicht wesentlich beeinträchtigt. Sie können so vorgehen: Bei einer erwarteten Mindestanzahl von Conversions möchten Sie das Rauschen im erfassten Messwert unter einem bestimmten Prozentsatz halten.

In diesem und im folgenden Abschnitt werden Strategien zur Erreichung von Ziel 2 beschrieben.

Wichtige Konzepte

Der Aggregationsdienst fügt jedem zusammengefassten Wert (d. h. einmal pro Schlüssel) einmal Rauschen hinzu, wenn ein zusammengefasster Bericht angefordert wird.

Diese Rauschwerte werden zufällig aus einer bestimmten Wahrscheinlichkeitsverteilung gezogen.

Alle Elemente, die sich auf das Rauschen auswirken, basieren auf zwei primären Konzepten.

  1. Die Rauschverteilung (siehe unten) ist unabhängig vom Zusammenfassungswert gleich, egal ob er niedrig oder hoch ist. Je höher der zusammenfassende Wert, desto geringer ist die Wahrscheinlichkeit, dass sich Rauschen relativ zu diesem Wert auswirkt.

    Angenommen, sowohl ein aggregierter Gesamtkaufwert von 20.000 $als auch ein aggregierter Gesamtkaufwert von 200 $unterliegen Rauschen,das aus derselben Verteilung ausgewählt wird.

    Nehmen wir an, dass der Rauschenwert aus dieser Verteilung ungefähr zwischen -100 und +100 variiert.

    • Bei einem zusammengefassten Kaufwert von 20.000 $variiert das Rauschen zwischen 0 und 100/20.000=0,5%.
    • Beim zusammengefassten Kaufwert von 200 $variiert das Rauschen zwischen 0 und 100/200=50%.

    Daher hat Rauschen wahrscheinlich einen geringeren Einfluss auf den aggregierten Kaufwert von 20.000 $als auf den Wert von 200 $. Relativ gesehen sind 20.000 $ wahrscheinlich weniger verrauscht, d. h., das Signal-Rausch-Verhältnis ist höher.

    Bei höheren aggregierten Werten ist der Einfluss von Rauschen relativ geringer.
    Höhere aggregierte Werte sind relativ weniger von Rauschen betroffen.

    Das hat einige wichtige praktische Auswirkungen, die im nächsten Abschnitt beschrieben werden. Dieser Mechanismus ist Teil des API-Designs und die praktischen Auswirkungen sind langfristig. Sie werden weiterhin eine wichtige Rolle spielen, wenn Ad-Tech-Unternehmen verschiedene Aggregationsstrategien entwickeln und bewerten.

  2. Der Rauschen wird unabhängig vom Zusammenfassungswert aus derselben Verteilung gezogen. Diese Verteilung hängt jedoch von mehreren Parametern ab. Einer dieser Parameter, Epsilon, konnte von Ad-Tech-Unternehmen während des abgeschlossenen Origin Trials geändert werden, um verschiedene Anpassungen in Bezug auf Nützlichkeit und Datenschutz zu testen. Die Möglichkeit, Epsilon anzupassen, ist jedoch nur vorübergehend. Wir freuen uns über Ihr Feedback zu Ihren Anwendungsfällen und den Werten von Epsilon, die gut funktionieren.

Anbieter von Anzeigentechnologien haben zwar keinen direkten Einfluss darauf, wie Rauschen hinzugefügt wird, können aber den Einfluss von Rauschen auf ihre Messdaten beeinflussen. In den nächsten Abschnitten erfahren Sie, wie sich Rauschen in der Praxis beeinflussen lässt.

Sehen wir uns vorher genauer an, wie Rauschen angewendet wird.

Heranzoomen: So wird Rauschen angewendet

Eine Rauschverteilung

Der Rauschen wird aus der Laplace-Verteilung mit den folgenden Parametern gezogen:

  • Ein Mittelwert (μ) von 0. Das bedeutet, dass der wahrscheinlichste Rauschwert 0 ist (kein Rauschen hinzugefügt) und dass der verrauschte Wert genauso wahrscheinlich kleiner wie größer als der ursprüngliche Wert ist (dies wird manchmal als unvoreingenommen bezeichnet).
  • Ein Skalierungsparameter vonb = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ist im Browser definiert.
    • epsilon wird im Aggregationsdienst verwendet.

Das folgende Diagramm zeigt die Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20:

Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20
Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20

Zufällige Rauschwerte, eine Rauschverteilung

Angenommen, eine Ad-Tech-Firma fordert Zusammenfassungsberichte für zwei Aggregationsschlüssel an: „key1“ und „key2“.

Der Aggregationsdienst wählt zwei Rauschwerte x1 und x2 aus, die der gleichen Rauschverteilung folgen. x1 wird dem Zusammenfassungswert für key1 und x2 dem Zusammenfassungswert für key2 hinzugefügt.

In den Diagrammen stellen wir Rauschwerte als identisch dar. Das ist eine Vereinfachung. In der Realität variieren die Rauschwerte, da sie zufällig aus der Verteilung gezogen werden.

Das zeigt, dass die Rauschwerte alle aus derselben Verteilung stammen und unabhängig vom zusammenfassenden Wert sind, auf den sie angewendet werden.

Weitere Eigenschaften von Rauschen

Jeder zusammengefasste Wert wird mit Rauschen versehen, auch leere Werte (0).

Auch leere Zusammenfassungswerte unterliegen dem Rauschen.
Auch leere Zusammenfassungswerte unterliegen dem Rauschen.

Selbst wenn der tatsächliche zusammengefasste Wert für einen bestimmten Schlüssel 0 ist, wird der zusammengefasste Wert, der im Übersichtsbericht für diesen Schlüssel angezeigt wird, höchstwahrscheinlich nicht 0 sein.

Rauschen kann eine positive oder negative Zahl sein.

Beispiele für positives und negatives Rauschen.
Beispiele für positives und negatives Rauschen

Bei einem Kaufbetrag vor Rauschen von 327.000 € kann das Rauschen beispielsweise +6.000 € oder -6.000 € betragen (diese Werte sind willkürlich).

Rauschen bewerten

Standardabweichung des Rauschens berechnen

Die Standardabweichung des Rauschens ist:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Beispiel

Bei Epsilon = 10 beträgt die Standardabweichung des Rauschens:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Bewerten, wann Messunterschiede signifikant sind

Da Sie die Standardabweichung des Rauschens kennen, das jedem vom Aggregationsdienst ausgegebenen Wert hinzugefügt wird, können Sie geeignete Grenzwerte für den Vergleich festlegen, um zu ermitteln, ob beobachtete Unterschiede auf Rauschen zurückzuführen sein könnten.

Wenn beispielsweise das Rauschen, das einem Wert hinzugefügt wird, ungefähr +/- 10 beträgt (unter Berücksichtigung der Skalierung) und die Differenz des Werts zwischen zwei Kampagnen über 100 liegt, kann mit hoher Wahrscheinlichkeit davon ausgegangen werden, dass die Differenz des gemessenen Werts zwischen den einzelnen Kampagnen nicht allein auf Rauschen zurückzuführen ist.

Reagieren und Feedback geben

Sie können an dieser API teilnehmen und sie testen.

Nächste Schritte