Gürültünün ne anlama geldiğini, nereye eklendiğini ve ölçüm çalışmalarınızı nasıl etkilediğini öğrenin.
Özet raporlar, toplanabilir raporların toplanmasıyla elde edilen sonuçlardır. Toplanabilir raporlar bir toplayıcı tarafından gruplandırılıp toplama hizmeti tarafından işlendiğinde, sonuçta elde edilen özet raporlara rastgele bir veri miktarı olan gürültü eklenir. Kullanıcı gizliliğini korumak için gürültü eklenir. Bu mekanizmanın amacı, diferansiyel gizliliğe sahip ölçümü destekleyebilecek bir çerçeve oluşturmaktır.
Özet raporlardaki gürültüye giriş
Gürültü eklemek günümüzde genellikle reklam ölçümünün bir parçası olmasa da çoğu durumda eklenen gürültü, sonuçlarınızı yorumlama şeklinizi önemli ölçüde değiştirmez.
Bu durumu şu şekilde düşünebilirsiniz: Belirli bir veri gürültülü olmasaydı bu veriye dayanarak karar vermekten emin olur muydunuz?
Örneğin, bir reklamveren Kampanya A'nın 15, Kampanya B'nin ise 16 dönüşüm elde etmesine dayanarak kampanya stratejisini veya bütçelerini değiştirmekten emin olur mu?
Cevap hayırsa gürültü alakasızdır.
Yapmak isteyeceğiniz şey, API kullanımınızı şu şekilde yapılandırmaktır:
- Sorunun cevabı evet.
- Gürültü, belirli verilere dayalı olarak karar verme yeteneğinizi önemli ölçüde etkilemeyecek şekilde yönetilir. Bu durumu şu şekilde ele alabilirsiniz: Beklenen minimum dönüşüm sayısı için toplanan metrikteki gürültüyü belirli bir yüzdenin altında tutmak istiyorsunuz.
Bu bölümde ve sonraki bölümde, 2. hedefe ulaşmaya yönelik stratejileri özetleyeceğiz.
Temel kavramlar
Toplama hizmeti, bir özet raporu her istendiğinde her özet değerine (yani anahtar başına bir kez) bir kez gürültü ekler.
Bu gürültü değerleri, aşağıdaki gibi belirli bir olasılık dağılımından rastgele olarak alınır.
Gürültüyü etkileyen tüm öğeler iki temel kavrama dayanır.
Gürültü dağılımı (ayrıntılar aşağıda), özet değerinden (düşük veya yüksek) bağımsız olarak aynıdır. Bu nedenle, özet değeri ne kadar yüksek olursa varyansın bu değer üzerindeki etkisi de o kadar az olur.
Örneğin, hem 20.000 TL'lik toplam toplu satın alma değerinin hem de 200 TL'lik toplam toplu satın alma değerinin aynı dağılımdan seçilen gürültüye tabi olduğunu varsayalım.
Bu dağılımdan gelen gürültünün yaklaşık olarak -100 ile +100 arasında değiştiğini varsayalım.
- 20.000 ABD doları tutarındaki özet satın alma değeri için gürültü, 0 ile 100/20.000=%0,5 arasında değişir.
- 200 ABD doları tutarındaki özet satın alma değeri için gürültü, 0 ile 100/200=%50 arasında değişir.
Bu nedenle, gürültünün 20.000 ABD doları tutarındaki toplu satın alma değeri üzerindeki etkisi,200 ABD doları tutarındaki değer üzerindeki etkisinden daha az olacaktır. Nispeten konuşmak gerekirse 20.000 ABD doları daha az gürültülü olacaktır. Yani sinyal-gürültü oranı daha yüksek olacaktır.
Daha yüksek toplu değerler, nispeten daha düşük gürültü etkisine sahiptir. Bu durumun, bir sonraki bölümde açıklanan birkaç önemli pratik sonucu vardır. Bu mekanizma, API tasarımının bir parçasıdır ve pratik etkileri uzun vadeli olur. Reklam teknolojileri çeşitli toplama stratejileri tasarlayıp değerlendirirken bu teknolojiler önemli bir rol oynamaya devam edecektir.
Gürültü, özet değerinden bağımsız olarak aynı dağılımdan alınsa da bu dağılım çeşitli parametrelere bağlıdır. Bu parametrelerden biri olan epsilon, çeşitli yardımcı program/gizlilik ayarlamalarını değerlendirmek için tamamlanan kaynak denemesi sırasında reklam teknolojileri tarafından değiştirilebilir. Ancak epsilon değerini ayarlama özelliğinin geçici olduğunu unutmayın. Kullanım alanlarınız ve iyi sonuç veren epsilon değerleri hakkındaki geri bildirimlerinizi bekliyoruz.
Bir reklam teknolojisi şirketi, gürültünün eklenme şekillerini doğrudan kontrol etmese de gürültünün ölçüm verileri üzerindeki etkisini belirleyebilir. Sonraki bölümlerde, gürültünün uygulamada nasıl etkilenebileceğini inceleyeceğiz.
Bunu yapmadan önce gürültünün nasıl uygulandığına daha yakından bakalım.
Yakınlaştırma: Gürültü nasıl uygulanır?
Tek gürültü dağıtımı
Gürültü, aşağıdaki parametrelerle Laplace dağılımından alınır:
- 0 ortalama (
μ) Bu, en olası gürültü değerinin 0 (gürültü eklenmedi) olduğu ve gürültülü değerin orijinal değerden küçük olma olasılığının büyük olma olasılığıyla aynı olduğu anlamına gelir (buna bazen tarafsız denir). b = CONTRIBUTION_BUDGET/epsilonölçek parametresi.CONTRIBUTION_BUDGETtarayıcıda tanımlanmışsaepsilon, Aggregation Service'te kullanılır.
Aşağıdaki şemada, μ=0, b = 20 olan bir Laplace dağılımının olasılık yoğunluk fonksiyonu gösterilmektedir:
Rastgele gürültü değerleri, tek bir gürültü dağılımı
Bir reklam teknolojisi şirketinin, key1 ve key2 olmak üzere iki toplama anahtarı için özet raporlar istediğini varsayalım.
Toplama hizmeti, aynı gürültü dağılımını izleyerek x1 ve x2 olmak üzere iki gürültü değeri seçer. x1, key1 için özet değerine, x2 ise key2 için özet değerine eklenir.
Şemalarda gürültü değerlerini aynı olarak gösteririz. Bu bir basitleştirmedir. Gerçekte, gürültü değerleri dağıtımdan rastgele çekildikleri için değişiklik gösterir.
Bu, gürültü değerlerinin hepsinin aynı dağılımdan geldiğini ve uygulandıkları özet değerinden bağımsız olduğunu gösterir.
Gürültünün diğer özellikleri
Boş olanlar (0) dahil olmak üzere her özet değerine gürültü uygulanır.
Örneğin, belirli bir anahtarın gerçek özet değeri 0 olsa bile bu anahtarın özet raporunda göreceğiniz gürültülü özet değeri (büyük olasılıkla) 0 olmayacaktır.
Gürültü pozitif veya negatif bir sayı olabilir.
Örneğin, gürültü öncesi satın alma tutarı 327.000 ise gürültü +6.000 veya -6.000 olabilir (bunlar rastgele örnek değerlerdir).
Gürültüyü değerlendirme
Gürültünün standart sapmasını hesaplama
Gürültünün standart sapması:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Örnek
Epsilon = 10 olduğunda gürültünün standart sapması:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Ölçüm farklılıklarının önemli olup olmadığını değerlendirme
Toplama hizmeti tarafından her değere eklenen gürültünün standart sapmasını bildiğiniz için, gözlemlenen farklılıkların gürültüden kaynaklanıp kaynaklanmadığını belirlemek üzere karşılaştırma için uygun eşikler belirleyebilirsiniz.
Örneğin, bir değere eklenen gürültü yaklaşık +/- 10 ise (ölçeklendirme hesaba katılarak) ve iki kampanya arasındaki değer farkı 100'ün üzerindeyse her kampanya arasında ölçülen değer farkının yalnızca gürültüden kaynaklanmadığı sonucuna varmak muhtemelen güvenlidir.
Etkileşim kurma ve geri bildirim paylaşma
Bu API'yi kullanabilir ve deneyebilirsiniz.
- Toplanabilir raporlar ve toplama hizmeti hakkında bilgi edinin, soru sorun ve geri bildirimde bulunun.
- İlişkilendirme raporlama kılavuzlarını okuyun.
Sonraki adımlar
- Sinyal-gürültü oranını iyileştirmek için hangi değişkenleri kontrol edebileceğinizi öğrenmek istiyorsanız Gürültüyle çalışma başlıklı makaleyi inceleyin.
- Toplama raporlama stratejilerinizi planlama konusunda yardım almak için Özet rapor tasarım kararlarıyla deneme başlıklı makaleyi inceleyin.
- Gürültü laboratuvarını deneyin.