Memahami derau dalam laporan ringkasan

Pelajari arti derau, tempat derau ditambahkan, dan pengaruhnya terhadap upaya pengukuran Anda.

Laporan ringkasan adalah hasil penggabungan laporan yang dapat digabungkan. Saat laporan yang dapat digabungkan dikelompokkan oleh pengumpul dan diproses oleh layanan agregasi, derau—sejumlah data acak—ditambahkan ke laporan ringkasan yang dihasilkan. Derau ditambahkan untuk melindungi privasi pengguna. Tujuan mekanisme ini adalah memiliki framework yang dapat mendukung pengukuran pribadi diferensial.

Derau ditambahkan dalam laporan ringkasan akhir.
Derau ditambahkan dalam laporan ringkasan akhir.

Pengantar derau dalam laporan ringkasan

Meskipun penambahan derau biasanya bukan bagian dari pengukuran iklan saat ini, dalam banyak kasus, derau yang ditambahkan tidak akan mengubah secara substansial cara Anda menafsirkan hasil.

Anda dapat memikirkannya dengan cara berikut: Apakah Anda yakin dalam mengambil keputusan berdasarkan sepotong data tertentu jika data tersebut tidak berisik?

Misalnya, apakah pengiklan akan yakin untuk mengubah strategi atau anggaran kampanye mereka, berdasarkan fakta bahwa Kampanye A memiliki 15 konversi dan Kampanye B memiliki 16 konversi?

Jika jawabannya tidak, derau tidak relevan.

Yang perlu Anda lakukan adalah mengonfigurasi penggunaan API sedemikian rupa sehingga:

  1. Jawaban atas pertanyaan tersebut adalah ya.
  2. Derau dikelola dengan cara yang tidak memengaruhi kemampuan Anda secara signifikan untuk membuat keputusan berdasarkan data tertentu. Anda dapat melakukannya sebagai berikut: untuk jumlah konversi minimum yang diharapkan, Anda ingin menjaga derau dalam metrik yang dikumpulkan di bawah persentase tertentu.

Di bagian ini dan berikutnya, kami akan menguraikan strategi untuk mencapai 2.

Konsep inti

Layanan agregasi menambahkan derau sekali ke setiap nilai ringkasan—yaitu, sekali per kunci—setiap kali laporan ringkasan diminta.

Nilai derau ini diambil secara acak dari distribusi probabilitas tertentu, sebagai berikut.

Semua elemen yang memengaruhi kebisingan bergantung pada dua konsep utama.

  1. Distribusi derau (detail di bawah) sama terlepas dari nilai ringkasan, rendah atau tinggi. Oleh karena itu, semakin tinggi nilai ringkasan, semakin kecil kemungkinan derau akan berdampak, relatif terhadap nilai ini.

    Misalnya, asumsikan total nilai pembelian gabungan sebesar $20.000 dan total nilai pembelian gabungan sebesar $200 tunduk pada derau yang dipilih dari distribusi yang sama.

    Asumsikan derau dari distribusi ini bervariasi kira-kira antara -100 dan +100.

    • Untuk nilai pembelian ringkasan sebesar $20.000, derau bervariasi antara 0 dan 100/20.000=0,5%.
    • Untuk nilai pembelian ringkasan sebesar $200, derau bervariasi antara 0 dan 100/200=50%.

    Oleh karena itu, gangguan cenderung memiliki dampak yang lebih rendah pada nilai pembelian gabungan sebesar Rp20.000.000 daripada pada nilai Rp200.000. Secara relatif, $20.000 cenderung lebih tidak bising, yaitu cenderung memiliki rasio sinyal terhadap derau yang lebih tinggi.

    Nilai gabungan yang lebih tinggi memiliki dampak derau yang relatif lebih rendah.
    Nilai gabungan yang lebih tinggi memiliki dampak derau yang relatif lebih rendah.

    Hal ini memiliki beberapa implikasi praktis penting yang diuraikan di bagian berikutnya. Mekanisme ini adalah bagian dari desain API, dan implikasi praktisnya bersifat jangka panjang. Cookie ini akan terus memainkan peran penting saat teknologi iklan mendesain dan mengevaluasi berbagai strategi penggabungan.

  2. Meskipun derau diambil dari distribusi yang sama terlepas dari nilai ringkasan, distribusi tersebut bergantung pada beberapa parameter. Salah satu parameter ini, epsilon, dapat diubah oleh teknologi iklan selama uji coba origin yang telah selesai untuk mengevaluasi berbagai penyesuaian utilitas/privasi. Namun, pertimbangkan kemampuan untuk menyesuaikan epsilon sebagai hal yang sementara. Kami menerima masukan Anda tentang kasus penggunaan dan nilai epsilon yang berfungsi dengan baik.

Meskipun perusahaan teknologi iklan tidak secara langsung mengontrol cara derau ditambahkan, perusahaan tersebut dapat memengaruhi dampak derau pada data pengukurannya. Di bagian berikutnya, kita akan mempelajari bagaimana pengaruh derau dalam praktiknya.

Sebelum melakukannya, mari kita lihat lebih dekat cara penerapan derau.

Memperbesar: cara penerapan derau

Distribusi satu kebisingan

Derau diambil dari distribusi Laplace, dengan parameter berikut:

  • Rata-rata (μ) 0. Artinya, nilai derau yang paling mungkin adalah 0 (tidak ada derau yang ditambahkan), dan nilai yang berisi derau sama-sama mungkin lebih kecil atau lebih besar daripada nilai aslinya (ini terkadang disebut tidak bias).
  • Parameter skala darib = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ditentukan di browser.
    • epsilon digunakan di Layanan Agregasi.

Diagram berikut menunjukkan fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20:

Fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20
Fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20

Nilai derau acak, satu distribusi derau

Misalkan teknologi iklan meminta laporan ringkasan untuk dua kunci agregasi, key1 dan key2.

Layanan agregasi memilih dua nilai derau x1 dan x2, mengikuti distribusi derau yang sama. x1 ditambahkan ke nilai ringkasan untuk key1, dan x2 ditambahkan ke nilai ringkasan untuk key2.

Dalam diagram, kita akan merepresentasikan nilai derau sebagai identik. Ini adalah penyederhanaan; pada kenyataannya, nilai derau akan bervariasi, karena diambil secara acak dari distribusi.

Hal ini menunjukkan bahwa semua nilai derau berasal dari distribusi yang sama, dan tidak bergantung pada nilai ringkasan yang diterapkan.

Properti kebisingan lainnya

Derau diterapkan ke setiap nilai ringkasan, termasuk yang kosong (0).

Bahkan nilai ringkasan kosong pun dapat terkena derau.
Bahkan nilai ringkasan kosong pun tunduk pada derau.

Misalnya, meskipun nilai ringkasan sebenarnya untuk kunci tertentu adalah 0, nilai ringkasan yang bernoise yang akan Anda lihat dalam laporan ringkasan untuk kunci ini (kemungkinan) bukan 0.

Derau dapat berupa angka positif atau negatif.

Contoh derau positif dan negatif.
Contoh derau positif dan negatif.

Misalnya, untuk jumlah pembelian sebelum derau sebesar 327.000, derau dapat berupa +6.000 atau -6.000 (ini adalah nilai contoh arbitrer).

Mengevaluasi derau

Menghitung simpangan baku derau

Simpangan baku derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Contoh

Dengan epsilon = 10, standar deviasi derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Mengevaluasi kapan perbedaan pengukuran signifikan

Karena Anda akan mengetahui standar deviasi derau yang ditambahkan ke setiap nilai yang dihasilkan oleh layanan agregasi, Anda dapat menentukan nilai minimum yang sesuai untuk perbandingan guna menentukan apakah perbedaan yang diamati dapat disebabkan oleh derau.

Misalnya, jika derau yang ditambahkan ke nilai sekitar +/- 10 (dengan memperhitungkan penskalaan) dan perbedaan nilai antara dua kampanye lebih dari 100, kemungkinan aman untuk menyimpulkan bahwa perbedaan nilai yang diukur antara setiap kampanye bukan hanya disebabkan oleh derau.

Berinteraksi dan memberikan masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya