Menangani derau

Pelajari cara menggunakan, memperhitungkan, dan mengurangi dampak derau dalam laporan agregat Anda.

Sebelum memulai

Sebelum melanjutkan, untuk pemahaman mendalam tentang apa itu derau dan dampaknya, lihat Memahami derau dalam laporan ringkasan.

Kontrol Anda terhadap suara bising

Meskipun Anda tidak dapat mengontrol derau yang ditambahkan ke laporan agregat secara langsung, ada langkah-langkah yang dapat Anda lakukan untuk meminimalkan efeknya. Bagian berikut menjelaskan strategi ini.

Menskalakan ke anggaran kontribusi

Seperti yang dijelaskan dalam Memahami derau, derau yang diterapkan ke nilai ringkasan untuk setiap kunci didasarkan pada skala 0-65.536 (0-CONTRIBUTION_BUDGET).

Distribusi derau didasarkan pada anggaran.

Oleh karena itu, untuk memaksimalkan sinyal relatif terhadap derau, Anda harus meningkatkan skala setiap nilai sebelum menetapkannya sebagai nilai agregat—yaitu, mengalikan setiap nilai dengan faktor tertentu, faktor penskalaan, sekaligus memastikannya tetap berada dalam anggaran kontribusi.

Derau relatif dengan dan tanpa penskalaan.

Menghitung faktor penskalaan

Faktor penskalaan menunjukkan seberapa besar Anda ingin menskalakan nilai agregat tertentu. Nilainya harus berupa anggaran kontribusi dibagi dengan nilai agregat maksimum untuk kunci tertentu.

Menentukan faktor penskalaan berdasarkan anggaran kontribusi.

Misalnya, asumsikan pengiklan ingin mengetahui total nilai pembelian. Anda tahu bahwa nilai pembelian maksimum yang diharapkan dari setiap pembelian adalah $2.000, kecuali untuk beberapa outlier yang Anda putuskan untuk diabaikan:

  • Hitung faktor penskalaan:
    • Untuk memaksimalkan rasio sinyal-derau, Anda perlu menskalakan nilai ini menjadi 65.536 (anggaran kontribusi).
    • Hal ini menghasilkan faktor penskalaan 65.536 / 2.000 atau sekitar 32x. Dalam praktiknya, Anda dapat membulatkan faktor ini ke atas atau ke bawah.
  • Menskalakan nilai sebelum agregasi. Untuk setiap pembelian sebesar $1, tambahkan metrik yang dilacak sebesar 32. Misalnya, untuk pembelian sebesar $120, tetapkan nilai agregat 120*32 = 3.840.
  • Perkecil nilai Anda setelah agregasi. Setelah Anda menerima laporan ringkasan yang berisi nilai pembelian yang dijumlahkan di beberapa pengguna, skalakan nilai ringkasan menggunakan faktor penskalaan yang Anda gunakan sebelum agregasi. Dalam contoh ini, kami telah menggunakan faktor penskalaan pra-agregasi 32, sehingga kita perlu membagi nilai ringkasan yang diterima dalam laporan ringkasan dengan 32. Oleh karena itu, jika nilai pembelian ringkasan untuk kunci tertentu dalam laporan ringkasan adalah 76.800, nilai pembelian ringkasan (dengan derau) adalah 76.800/32 = $2.400.

Membagi anggaran

Jika memiliki beberapa sasaran pengukuran—misalnya, jumlah pembelian dan nilai pembelian—sebaiknya bagi anggaran Anda ke sasaran ini.

Dalam hal ini, faktor penskalaan Anda akan berbeda untuk nilai agregat yang berbeda, bergantung pada nilai maksimum yang diharapkan dari nilai agregat tertentu.

Baca detailnya di Memahami kunci agregasi.

Misalnya, Anda melacak jumlah pembelian dan nilai pembelian, dan memutuskan untuk mengalokasikan anggaran secara merata.

65.536 / 2 = 32.768 dapat dialokasikan per jenis pengukuran dan per sumber.

  • Jumlah pembelian:
    • Anda hanya melacak satu pembelian, sehingga jumlah maksimum pembelian untuk konversi tertentu adalah 1.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk jumlah pembelian menjadi 32.768 / 1 = 32.768.
  • Nilai pembelian:
    • Misalkan nilai pembelian maksimum yang diharapkan dari setiap pembelian adalah $2.000.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk nilai pembelian menjadi 32.768 / 2.000 = 16.384 atau sekitar 16.

Kunci agregasi yang lebih kasar meningkatkan rasio sinyal terhadap derau

Karena kunci kasar menangkap lebih banyak peristiwa konversi daripada kunci terperinci, kunci kasar umumnya menghasilkan nilai ringkasan yang lebih tinggi.

Nilai ringkasan yang lebih tinggi kurang terpengaruh oleh derau dibandingkan nilai yang lebih rendah; derau pada nilai ini cenderung lebih rendah, relatif terhadap nilai ini.

Nilai yang dikumpulkan dengan kunci yang lebih kasar cenderung relatif lebih sedikit deraunya daripada nilai yang dikumpulkan dengan kunci yang lebih terperinci.

Contoh

Jika semua hal lainnya sama, kunci yang melacak nilai pembelian secara global (dijumlahkan di semua negara) akan menghasilkan nilai pembelian ringkasan yang lebih tinggi (dan jumlah konversi ringkasan yang lebih tinggi) daripada kunci yang melacak konversi di tingkat negara.

Oleh karena itu, derau relatif pada total nilai pembelian untuk negara tertentu akan lebih tinggi daripada derau relatif pada total nilai pembelian untuk semua negara.

Demikian pula, jika semua hal lainnya sama, nilai total pembelian untuk sepatu lebih rendah daripada nilai total pembelian untuk semua item (termasuk sepatu).

Oleh karena itu, derau relatif pada total nilai pembelian untuk sepatu akan lebih tinggi daripada derau relatif pada total nilai pembelian untuk semua item.

Dampak derau dengan kunci terperinci versus kunci kasar.

Menjumlahkan nilai ringkasan (gabungan) juga akan menjumlahkan deraunya

Dengan menjumlahkan nilai ringkasan dari laporan ringkasan untuk mengakses data tingkat yang lebih tinggi, Anda juga menjumlahkan derau dari nilai ringkasan ini.

Tingkat derau dengan kunci terperinci dengan gabungan versus kunci kasar tanpa gabungan

Mari kita lihat dua pendekatan yang berbeda: - Pendekatan A: Anda menyertakan ID Geografi dalam kunci. Laporan ringkasan menampilkan kunci tingkat ID geografis, yang masing-masing dikaitkan dengan nilai pembelian ringkasan di tingkat ID Geografis tertentu. - Pendekatan B: Anda tidak menyertakan ID geografi dalam kunci. Laporan ringkasan langsung menampilkan nilai pembelian ringkasan untuk semua ID / lokasi geografi.

Untuk mengakses nilai pembelian tingkat negara: - Dengan pendekatan A, Anda menjumlahkan nilai ringkasan tingkat ID geografis, sehingga juga menjumlahkan deraunya. Hal ini kemungkinan akan menyebabkan lebih banyak derau ditambahkan ke nilai pembelian tingkat ID geografis akhir. - Dengan pendekatan B, Anda langsung melihat data yang ditampilkan dalam laporan ringkasan. Derau hanya ditambahkan sekali ke data tersebut.

Oleh karena itu, nilai pembelian ringkasan untuk ID geografis tertentu kemungkinan akan lebih berisik dengan pendekatan A.

Demikian pula, menyertakan dimensi tingkat kode pos dalam kunci Anda kemungkinan akan menghasilkan lebih banyak derau daripada menggunakan kunci yang lebih kasar dengan dimensi tingkat wilayah.

Menggabungkan selama jangka waktu yang lebih lama akan meningkatkan rasio sinyal terhadap derau

Meminta laporan ringkasan lebih jarang berarti setiap nilai ringkasan kemungkinan akan lebih tinggi daripada jika Anda meminta laporan lebih sering; lebih banyak konversi kemungkinan akan terjadi dalam rentang waktu yang lebih lama.

Seperti yang disebutkan sebelumnya, semakin tinggi nilai ringkasan, semakin rendah kemungkinan derau relatif. Oleh karena itu, meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi (lebih baik).

Meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi

Berikut adalah contoh untuk mengilustrasikannya:

  • Jika Anda meminta laporan ringkasan per jam selama 24 jam, lalu menjumlahkan nilai ringkasan dari setiap laporan per jam untuk mengakses data tingkat hari, derau akan ditambahkan 24 kali.
  • Dalam satu laporan ringkasan harian, derau hanya ditambahkan satu kali.

Epsilon lebih tinggi, derau lebih rendah

Makin tinggi nilai epsilon, makin rendah derau dan makin rendah perlindungan privasi.

Memanfaatkan pemfilteran dan penghapusan duplikat

Bagian penting dari mengalokasikan anggaran di antara berbagai kunci adalah memahami frekuensi terjadinya peristiwa tertentu. Misalnya, pengiklan mungkin hanya peduli dengan satu pembelian untuk setiap klik, tetapi mungkin tertarik dengan maksimal 3 konversi "tampilan halaman produk". Untuk mendukung kasus penggunaan ini, sebaiknya Anda juga memanfaatkan fitur API berikut yang memungkinkan Anda mengontrol jumlah laporan yang dihasilkan, dan konversi mana yang dihitung:

Bereksperimen dengan epsilon

Teknologi iklan dapat menetapkan epsilon ke nilai yang lebih besar dari 0 dan hingga dan termasuk 64. Rentang ini memungkinkan pengujian yang fleksibel. Nilai epsilon yang lebih rendah memberikan perlindungan privasi yang lebih besar. Sebaiknya Anda memulai dengan epsilon=10.

Rekomendasi untuk bereksperimen

Sebaiknya lakukan tindakan berikut: - Mulai dengan epsilon = 10. - Jika hal ini menyebabkan masalah utilitas yang signifikan, tingkatkan epsilon secara bertahap. - Berikan masukan tentang titik belok tertentu yang mungkin Anda temukan terkait kegunaan data.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya