Menangani derau

Pelajari cara menggunakan, memperhitungkan, dan mengurangi dampak derau dalam laporan yang dapat digabungkan.

Sebelum memulai

Sebelum melanjutkan, untuk memahami secara mendalam apa itu derau dan dampaknya, lihat Memahami derau dalam laporan ringkasan.

Kontrol Anda terhadap kebisingan

Meskipun Anda tidak dapat secara langsung mengontrol derau yang ditambahkan ke laporan yang dapat digabungkan, ada langkah-langkah yang dapat Anda lakukan untuk meminimalkan efeknya. Bagian berikut menjelaskan strategi ini.

Meningkatkan anggaran kontribusi

Seperti yang dijelaskan dalam Memahami derau, derau yang diterapkan pada nilai ringkasan untuk setiap kunci didasarkan pada skala 0-65.536 (0-CONTRIBUTION_BUDGET).

Distribusi derau didasarkan pada anggaran.
Distribusi derau didasarkan pada anggaran.

Oleh karena itu, untuk memaksimalkan sinyal relatif terhadap derau, Anda harus menskalakan setiap nilai sebelum menetapkannya sebagai nilai yang dapat diagregasi—yaitu, mengalikan setiap nilai dengan faktor tertentu, faktor penskalaan, sambil memverifikasi bahwa nilai tersebut tetap berada dalam anggaran kontribusi.

Derau relatif dengan dan tanpa penskalaan.
Derau relatif dengan dan tanpa penskalaan.

Menghitung faktor penskalaan

Faktor penskalaan menunjukkan seberapa besar Anda ingin menskalakan nilai yang dapat diagregasi tertentu. Nilainya harus berupa anggaran kontribusi dibagi dengan nilai maksimum yang dapat diagregasi untuk kunci tertentu.

Menentukan faktor penskalaan berdasarkan anggaran kontribusi.
Menentukan faktor penskalaan berdasarkan anggaran kontribusi.

Misalnya, asumsikan pengiklan ingin mengetahui total nilai pembelian. Anda tahu bahwa nilai pembelian maksimum yang diharapkan untuk setiap pembelian adalah $2.000, kecuali untuk beberapa pencilan yang Anda putuskan untuk diabaikan:

  • Menghitung faktor penskalaan:
    • Untuk memaksimalkan rasio sinyal terhadap derau, Anda harus menskalakan nilai ini menjadi 65.536 (anggaran kontribusi).
    • Hal ini menghasilkan faktor penskalaan 65.536 / 2.000 atau sekitar 32x. Dalam praktiknya, Anda dapat membulatkan faktor ini ke atas atau ke bawah.
  • Menskalakan nilai sebelum agregasi. Untuk setiap pembelian senilai $1, tambahkan metrik yang dilacak sebesar 32. Misalnya, untuk pembelian sebesar $120, tetapkan nilai yang dapat diagregasi sebesar 120*32 = 3.840.
  • Menurunkan nilai setelah agregasi. Setelah Anda menerima laporan ringkasan yang berisi nilai pembelian yang dijumlahkan di beberapa pengguna, kecilkan nilai ringkasan menggunakan faktor penskalaan yang Anda gunakan sebelum penggabungan. Dalam contoh ini, kami menggunakan faktor penskalaan 32 sebelum penggabungan, jadi kami perlu membagi nilai ringkasan yang diterima dalam laporan ringkasan dengan 32. Oleh karena itu, jika nilai pembelian ringkasan untuk kunci tertentu dalam laporan ringkasan adalah 76.800, nilai pembelian ringkasan (dengan derau) adalah 76.800/32 = $2.400.

Membagi anggaran

Jika memiliki beberapa sasaran pengukuran—misalnya, jumlah pembelian dan nilai pembelian—Anda mungkin ingin membagi anggaran di seluruh sasaran ini.

Dalam hal ini, faktor penskalaan Anda akan berbeda untuk nilai yang dapat diagregasi yang berbeda, bergantung pada nilai maksimum yang diharapkan dari nilai yang dapat diagregasi tertentu.

Baca detailnya di Memahami kunci agregasi.

Misalnya, asumsikan Anda melacak jumlah pembelian dan nilai pembelian, dan Anda memutuskan untuk mengalokasikan anggaran secara merata.

65.536 / 2 = 32.768 dapat dialokasikan per jenis pengukuran dan per sumber.

  • Jumlah pembelian:
    • Anda hanya melacak satu pembelian, sehingga jumlah maksimum pembelian untuk konversi tertentu adalah 1.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk jumlah pembelian menjadi 32.768 / 1 = 32.768.
  • Nilai pembelian:
    • Misalkan nilai pembelian maksimum yang diharapkan dari setiap pembelian adalah $2.000.
    • Oleh karena itu, Anda memutuskan untuk menetapkan faktor penskalaan untuk nilai pembelian menjadi 32.768 / 2.000 = 16.384 atau sekitar 16.

Kunci agregasi yang lebih kasar meningkatkan rasio sinyal terhadap kebisingan

Karena kunci kasar mencakup lebih banyak peristiwa konversi daripada kunci terperinci, kunci kasar umumnya menghasilkan nilai ringkasan yang lebih tinggi.

Nilai ringkasan yang lebih tinggi tidak terlalu terpengaruh oleh derau dibandingkan nilai yang lebih rendah; derau pada nilai ini cenderung lebih rendah, dibandingkan dengan nilai ini.

Nilai yang dikumpulkan dengan kunci yang lebih kasar cenderung relatif lebih tidak bising daripada nilai yang dikumpulkan dengan kunci yang lebih terperinci.

Contoh

Jika semua hal lainnya dianggap sama, kunci yang melacak nilai pembelian secara global (dijumlahkan di semua negara) akan menghasilkan nilai pembelian ringkasan yang lebih tinggi (dan jumlah konversi ringkasan yang lebih tinggi) daripada kunci yang melacak konversi di tingkat negara.

Oleh karena itu, derau relatif pada total nilai pembelian untuk negara tertentu akan lebih tinggi daripada derau relatif pada total nilai pembelian untuk semua negara.

Demikian pula, jika semua hal lainnya dianggap sama, total nilai pembelian untuk sepatu lebih rendah daripada total nilai pembelian untuk semua item (termasuk sepatu).

Oleh karena itu, derau relatif pada total nilai pembelian sepatu akan lebih tinggi daripada derau relatif pada total nilai pembelian semua item.

Dampak derau dengan kunci terperinci versus kunci kasar.
Dampak derau dengan kunci terperinci versus kunci kasar.

Menjumlahkan nilai ringkasan (rollup) juga menjumlahkan derau

Dengan menjumlahkan nilai ringkasan dari laporan ringkasan untuk mengakses data tingkat yang lebih tinggi, Anda juga menjumlahkan derau dari nilai ringkasan ini.

Tingkat derau dengan kunci terperinci dengan rollup versus kunci kasar tanpa rollup.
Tingkat derau dengan kunci terperinci dengan penggabungan versus kunci kasar tanpa penggabungan.

Mari kita lihat dua pendekatan yang berbeda:

  • Pendekatan A: Anda menyertakan ID Geografi dalam kunci Anda. Laporan ringkasan menampilkan kunci tingkat ID geografis, yang masing-masing terkait dengan nilai pembelian ringkasan di tingkat ID Geografis tertentu.
  • Pendekatan B: Anda tidak menyertakan ID geografi dalam kunci Anda. Laporan ringkasan secara langsung menampilkan nilai pembelian ringkasan untuk semua ID / lokasi geografis.

Untuk mengakses nilai pembelian tingkat negara:

  • Dengan pendekatan A, Anda menjumlahkan nilai ringkasan tingkat geo-ID dan dengan demikian juga menjumlahkan derau. Hal ini cenderung menyebabkan lebih banyak derau ditambahkan ke nilai pembelian tingkat ID geografis akhir.
  • Dengan pendekatan B, Anda langsung melihat data yang ditampilkan dalam laporan ringkasan. Derau hanya ditambahkan satu kali ke data tersebut.

Oleh karena itu, nilai pembelian ringkasan untuk ID geo tertentu cenderung lebih bervariasi dengan pendekatan A.

Demikian pula, menyertakan dimensi tingkat kode pos dalam kunci Anda kemungkinan akan menghasilkan hasil yang lebih bising daripada menggunakan kunci yang lebih kasar dengan dimensi tingkat wilayah.

Menggabungkan data selama jangka waktu yang lebih lama akan meningkatkan rasio sinyal terhadap kebisingan

Meminta laporan ringkasan lebih jarang berarti setiap nilai ringkasan kemungkinan akan lebih tinggi daripada jika Anda meminta laporan lebih sering; lebih banyak konversi kemungkinan akan terjadi dalam rentang waktu yang lebih lama.

Seperti yang disebutkan sebelumnya, makin tinggi nilai ringkasan, makin rendah kemungkinan derau relatifnya. Oleh karena itu, meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi (lebih baik).

Meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi
Meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi.

Berikut contoh untuk mengilustrasikannya:

  • Jika Anda meminta laporan ringkasan per jam selama lebih dari 24 jam, lalu menjumlahkan nilai ringkasan dari setiap laporan per jam untuk mengakses data tingkat harian, derau akan ditambahkan 24 kali.
  • Dalam satu laporan ringkasan harian, derau hanya ditambahkan satu kali.

Epsilon yang lebih tinggi, derau yang lebih rendah

Makin tinggi nilai epsilon, makin rendah derau dan makin rendah perlindungan privasi.

Memanfaatkan pemfilteran dan penghapusan duplikat

Bagian penting dari pengalokasian anggaran di antara berbagai kunci adalah memahami berapa kali peristiwa tertentu dapat terjadi. Misalnya, pengiklan mungkin hanya peduli dengan satu pembelian untuk setiap klik, tetapi mungkin tertarik dengan hingga 3 konversi "penayangan halaman produk". Untuk mendukung kasus penggunaan ini, Anda juga dapat menggunakan fitur API berikut yang memungkinkan Anda mengontrol jumlah laporan yang dibuat dan konversi yang dihitung:

Bereksperimen dengan epsilon

Teknologi iklan dapat menetapkan epsilon ke nilai yang lebih besar dari 0 dan hingga 64. Rentang ini memungkinkan pengujian yang fleksibel. Nilai epsilon yang lebih rendah memberikan perlindungan privasi yang lebih besar. Sebaiknya mulai dengan epsilon=10.

Rekomendasi untuk bereksperimen

Sebaiknya lakukan tindakan berikut:

  • Mulai dengan epsilon = 10.
  • Jika hal ini menyebabkan masalah utilitas yang signifikan, tingkatkan epsilon secara bertahap.
  • Berikan masukan Anda tentang titik infleksi tertentu yang mungkin Anda temukan terkait kegunaan data.

Berinteraksi dan memberikan masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya