Özet raporlarında gürültüyü anlama

Gürültünün ne anlama geldiğini, nereye eklendiğini ve ölçüm çalışmalarınızı nasıl etkilediğini öğrenin.

Özet raporlar, toplanabilir raporların toplanmasıyla elde edilen sonuçlardır. Toplanabilir raporlar bir toplayıcı tarafından gruplandırılıp toplama hizmeti tarafından işlendiğinde, sonuçta elde edilen özet raporlara rastgele bir veri miktarı olan gürültü eklenir. Kullanıcı gizliliğini korumak için gürültü eklenir. Bu mekanizmanın amacı, diferansiyel gizliliğe sahip ölçümü destekleyebilecek bir çerçeve oluşturmaktır.

Nihai özet raporuna gürültü eklenir.
Nihai özet raporuna gürültü eklenir.

Özet raporlardaki gürültüye giriş

Gürültü eklemek günümüzde genellikle reklam ölçümünün bir parçası olmasa da çoğu durumda eklenen gürültü, sonuçlarınızı yorumlama şeklinizi önemli ölçüde değiştirmez.

Bu durumu şu şekilde düşünebilirsiniz: Belirli bir veri gürültülü olmasaydı bu veriye dayanarak karar vermekten emin olur muydunuz?

Örneğin, bir reklamveren Kampanya A'nın 15, Kampanya B'nin ise 16 dönüşüm elde etmesine dayanarak kampanya stratejisini veya bütçelerini değiştirmekten emin olur mu?

Cevap hayırsa gürültü alakasızdır.

Yapmak isteyeceğiniz şey, API kullanımınızı şu şekilde yapılandırmaktır:

  1. Sorunun cevabı evet.
  2. Gürültü, belirli verilere dayalı olarak karar verme yeteneğinizi önemli ölçüde etkilemeyecek şekilde yönetilir. Bu durumu şu şekilde ele alabilirsiniz: Beklenen minimum dönüşüm sayısı için toplanan metrikteki gürültüyü belirli bir yüzdenin altında tutmak istiyorsunuz.

Bu bölümde ve sonraki bölümde, 2. hedefe ulaşmaya yönelik stratejileri özetleyeceğiz.

Temel kavramlar

Toplama hizmeti, bir özet raporu her istendiğinde her özet değerine (yani anahtar başına bir kez) bir kez gürültü ekler.

Bu gürültü değerleri, aşağıdaki gibi belirli bir olasılık dağılımından rastgele olarak alınır.

Gürültüyü etkileyen tüm öğeler iki temel kavrama dayanır.

  1. Gürültü dağılımı (ayrıntılar aşağıda), özet değerinden (düşük veya yüksek) bağımsız olarak aynıdır. Bu nedenle, özet değeri ne kadar yüksek olursa varyansın bu değer üzerindeki etkisi de o kadar az olur.

    Örneğin, hem 20.000 TL'lik toplam toplu satın alma değerinin hem de 200 TL'lik toplam toplu satın alma değerinin aynı dağılımdan seçilen gürültüye tabi olduğunu varsayalım.

    Bu dağılımdan gelen gürültünün yaklaşık olarak -100 ile +100 arasında değiştiğini varsayalım.

    • 20.000 ABD doları tutarındaki özet satın alma değeri için gürültü, 0 ile 100/20.000=%0,5 arasında değişir.
    • 200 ABD doları tutarındaki özet satın alma değeri için gürültü, 0 ile 100/200=%50 arasında değişir.

    Bu nedenle, gürültünün 20.000 ABD doları tutarındaki toplu satın alma değeri üzerindeki etkisi,200 ABD doları tutarındaki değer üzerindeki etkisinden daha az olacaktır. Nispeten konuşmak gerekirse 20.000 ABD doları daha az gürültülü olacaktır. Yani sinyal-gürültü oranı daha yüksek olacaktır.

    Daha yüksek toplu değerler, gürültüden nispeten daha az etkilenir.
    Daha yüksek toplu değerler, nispeten daha düşük gürültü etkisine sahiptir.

    Bu durumun, bir sonraki bölümde açıklanan birkaç önemli pratik sonucu vardır. Bu mekanizma, API tasarımının bir parçasıdır ve pratik etkileri uzun vadeli olur. Reklam teknolojileri çeşitli toplama stratejileri tasarlayıp değerlendirirken bu teknolojiler önemli bir rol oynamaya devam edecektir.

  2. Gürültü, özet değerinden bağımsız olarak aynı dağılımdan alınsa da bu dağılım çeşitli parametrelere bağlıdır. Bu parametrelerden biri olan epsilon, çeşitli yardımcı program/gizlilik ayarlamalarını değerlendirmek için tamamlanan kaynak denemesi sırasında reklam teknolojileri tarafından değiştirilebilir. Ancak epsilon değerini ayarlama özelliğinin geçici olduğunu unutmayın. Kullanım alanlarınız ve iyi sonuç veren epsilon değerleri hakkındaki geri bildirimlerinizi bekliyoruz.

Bir reklam teknolojisi şirketi, gürültünün eklenme şekillerini doğrudan kontrol etmese de gürültünün ölçüm verileri üzerindeki etkisini belirleyebilir. Sonraki bölümlerde, gürültünün uygulamada nasıl etkilenebileceğini inceleyeceğiz.

Bunu yapmadan önce gürültünün nasıl uygulandığına daha yakından bakalım.

Yakınlaştırma: Gürültü nasıl uygulanır?

Tek gürültü dağıtımı

Gürültü, aşağıdaki parametrelerle Laplace dağılımından alınır:

  • 0 ortalama (μ) Bu, en olası gürültü değerinin 0 (gürültü eklenmedi) olduğu ve gürültülü değerin orijinal değerden küçük olma olasılığının büyük olma olasılığıyla aynı olduğu anlamına gelir (buna bazen tarafsız denir).
  • b = CONTRIBUTION_BUDGET / epsilon ölçek parametresi.
    • CONTRIBUTION_BUDGET tarayıcıda tanımlanmışsa
    • epsilon, Aggregation Service'te kullanılır.

Aşağıdaki şemada, μ=0, b = 20 olan bir Laplace dağılımının olasılık yoğunluk fonksiyonu gösterilmektedir:

μ=0, b = 20 olan bir Laplace dağılımı için olasılık yoğunluk fonksiyonu
μ=0, b = 20 olan bir Laplace dağılımı için olasılık yoğunluk fonksiyonu

Rastgele gürültü değerleri, tek bir gürültü dağılımı

Bir reklam teknolojisi şirketinin, key1 ve key2 olmak üzere iki toplama anahtarı için özet raporlar istediğini varsayalım.

Toplama hizmeti, aynı gürültü dağılımını izleyerek x1 ve x2 olmak üzere iki gürültü değeri seçer. x1, key1 için özet değerine, x2 ise key2 için özet değerine eklenir.

Şemalarda gürültü değerlerini aynı olarak gösteririz. Bu bir basitleştirmedir. Gerçekte, gürültü değerleri dağıtımdan rastgele çekildikleri için değişiklik gösterir.

Bu, gürültü değerlerinin hepsinin aynı dağılımdan geldiğini ve uygulandıkları özet değerinden bağımsız olduğunu gösterir.

Gürültünün diğer özellikleri

Boş olanlar (0) dahil olmak üzere her özet değerine gürültü uygulanır.

Boş özet değerleri bile gürültüye tabidir.
Boş özet değerleri bile gürültüye tabidir.

Örneğin, belirli bir anahtarın gerçek özet değeri 0 olsa bile bu anahtarın özet raporunda göreceğiniz gürültülü özet değeri (büyük olasılıkla) 0 olmayacaktır.

Gürültü pozitif veya negatif bir sayı olabilir.

Pozitif ve negatif gürültü örnekleri.
Olumlu ve olumsuz gürültü örnekleri.

Örneğin, gürültü öncesi satın alma tutarı 327.000 ise gürültü +6.000 veya -6.000 olabilir (bunlar rastgele örnek değerlerdir).

Gürültüyü değerlendirme

Gürültünün standart sapmasını hesaplama

Gürültünün standart sapması:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Örnek

Epsilon = 10 olduğunda gürültünün standart sapması:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Ölçüm farklılıklarının önemli olup olmadığını değerlendirme

Toplama hizmeti tarafından her değere eklenen gürültünün standart sapmasını bildiğiniz için, gözlemlenen farklılıkların gürültüden kaynaklanıp kaynaklanmadığını belirlemek üzere karşılaştırma için uygun eşikler belirleyebilirsiniz.

Örneğin, bir değere eklenen gürültü yaklaşık +/- 10 ise (ölçeklendirme hesaba katılarak) ve iki kampanya arasındaki değer farkı 100'ün üzerindeyse her kampanya arasında ölçülen değer farkının yalnızca gürültüden kaynaklanmadığı sonucuna varmak muhtemelen güvenlidir.

Etkileşim kurma ve geri bildirim paylaşma

Bu API'yi kullanabilir ve deneyebilirsiniz.

Sonraki adımlar