ดูวิธีจัดการ คำนึงถึง และลดผลกระทบของสัญญาณรบกวนในรายงานที่รวบรวมได้
ก่อนเริ่มต้น
ก่อนดำเนินการต่อ โปรดดูทำความเข้าใจสัญญาณรบกวนในรายงานสรุปเพื่อทำความเข้าใจอย่างละเอียดเกี่ยวกับสัญญาณรบกวนและผลกระทบของสัญญาณ
การควบคุมเสียง
แม้ว่าจะควบคุมสัญญาณรบกวนที่เพิ่มลงในรายงานที่รวบรวมได้โดยตรงไม่ได้ แต่ก็มีขั้นตอนที่คุณสามารถทำได้เพื่อลดผลกระทบ ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้
เพิ่มงบประมาณสูงสุด
ดังที่อธิบายไว้ในส่วนทำความเข้าใจสัญญาณรบกวน สัญญาณรบกวนที่ใช้กับค่าสรุปสำหรับแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET)
ด้วยเหตุนี้ เพื่อเพิ่มสัญญาณให้ได้มากที่สุดเมื่อเทียบกับสัญญาณรบกวน คุณควรปรับขนาดแต่ละค่าก่อนที่จะตั้งค่าเป็นค่าที่รวบรวมได้ นั่นคือคูณแต่ละค่าด้วยปัจจัยหนึ่ง ซึ่งก็คือปัจจัยการปรับขนาด ขณะเดียวกันก็ตรวจสอบว่าค่าดังกล่าวอยู่ภายในงบประมาณการมีส่วนร่วม
การคำนวณค่าตัวคูณมาตราส่วน
ปัจจัยการปรับขนาดแสดงถึงระดับที่คุณต้องการปรับขนาดมูลค่าที่รวบรวมได้ ค่าของงบประมาณการมีส่วนร่วมควรเป็นงบประมาณการมีส่วนร่วมหารด้วยค่าที่รวบรวมได้สูงสุดสำหรับคีย์หนึ่งๆ
ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อที่คาดการณ์สูงสุดของการซื้อแต่ละครั้งคือ $2,000 ยกเว้นค่าผิดปกติบางรายการที่คุณตัดสินใจที่จะไม่สนใจ
- คำนวณค่าตัวคูณมาตราส่วน
- หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนให้สูงสุด คุณต้องปรับค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
- ซึ่งส่งผลให้มีค่าตัวคูณมาตราส่วนเท่ากับ 65,536 / 2,000 หรือประมาณ 32x ในทางปฏิบัติ คุณอาจปัดขึ้นหรือลงสำหรับปัจจัยนี้
- ปรับมูลค่าก่อนการรวบรวม ทุกๆ การซื้อ $1 ให้เพิ่มเมตริกที่ติดตามขึ้น 32 เช่น สำหรับการซื้อ $120 ให้ตั้งค่าที่รวบรวมได้เป็น 120*32 = 3,840
- ลดค่าลงหลังจากรวบรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่รวมกันของผู้ใช้หลายราย ให้ลดขนาดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่คุณใช้ก่อนการรวบรวม ในตัวอย่างนี้ เราใช้ปัจจัยการปรับขนาด 32 ก่อนการรวบรวม ดังนั้นเราจึงต้องหารค่าสรุปที่ได้รับในรายงานสรุปด้วย 32 ดังนั้น หากมูลค่าการซื้อรวมสำหรับคีย์หนึ่งๆ ในรายงานสรุปคือ 76,800 มูลค่าการซื้อรวม (ที่มีการเพิ่มสัญญาณรบกวน) จะเท่ากับ 76,800/32 = $2,400
แบ่งงบประมาณ
หากมีเป้าหมายการวัดผลหลายอย่าง เช่น จำนวนการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณให้กับเป้าหมายเหล่านี้
ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างกันสำหรับค่าที่รวบรวมได้ต่างๆ โดยขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้ที่กำหนด
อ่านรายละเอียดได้ในทำความเข้าใจคีย์การรวบรวม
ตัวอย่างเช่น สมมติว่าคุณกำลังติดตามทั้งจำนวนการซื้อและมูลค่าการซื้อ และตัดสินใจที่จะจัดสรรงบประมาณเท่าๆ กัน
65,536 / 2 = 32,768 สามารถจัดสรรต่อประเภทการวัดผลและต่อแหล่งที่มา
- จำนวนการซื้อ
- คุณติดตามการซื้อเพียงรายการเดียว ดังนั้นจำนวนการซื้อสูงสุดสำหรับ Conversion ที่ระบุคือ 1
- ดังนั้น คุณจึงตัดสินใจตั้งค่าปัจจัยการปรับขนาดจำนวนการซื้อเป็น 32,768 / 1 = 32,768
- มูลค่าการซื้อ
- สมมติว่ามูลค่าการซื้อที่คาดไว้สูงสุดของการซื้อแต่ละครั้งคือ $2,000
- ดังนั้น คุณจึงตัดสินใจตั้งค่าตัวคูณการปรับขนาดสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16
คีย์การรวมที่หยาบกว่าจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน
เนื่องจากคีย์แบบคร่าวๆ จะบันทึกเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด คีย์แบบคร่าวๆ จึงมักทําให้ค่าสรุปสูงขึ้น
ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า และสัญญาณรบกวนในค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่าเมื่อเทียบกับค่านี้
ค่าที่รวบรวมด้วยคีย์ที่หยาบกว่ามีแนวโน้มที่จะมีสัญญาณรบกวนน้อยกว่าค่าที่รวบรวมด้วยคีย์ที่มีรายละเอียดมากกว่า
ตัวอย่าง
เมื่อพิจารณาจากปัจจัยอื่นๆ ที่เท่ากัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมในทุกประเทศ) จะทําให้มูลค่าการซื้อรวมสูงขึ้น (และจํานวน Conversion รวมสูงขึ้น) มากกว่าคีย์ที่ติดตาม Conversion ในระดับประเทศ
ดังนั้น ความคลาดเคลื่อนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับประเทศหนึ่งๆ จะสูงกว่าความคลาดเคลื่อนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับทุกประเทศ
ในทำนองเดียวกัน เมื่อพิจารณาจากปัจจัยอื่นๆ ที่เท่ากัน มูลค่าการซื้อทั้งหมดสำหรับรองเท้าจะต่ำกว่ามูลค่าการซื้อทั้งหมดสำหรับสินค้าทั้งหมด (รวมถึงรองเท้า)
ดังนั้น ความคลาดเคลื่อนสัมพัทธ์ของมูลค่าการซื้อรองเท้ารวมจะสูงกว่าความคลาดเคลื่อนสัมพัทธ์ของมูลค่าการซื้อสินค้าทั้งหมดรวม
การรวมค่าสรุป (การสะสม) จะรวมสัญญาณรบกวนด้วย
การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลระดับที่สูงขึ้นยังเป็นการรวมสัญญาณรบกวนจากค่าสรุปเหล่านี้ด้วย
มาดู 2 วิธีที่แตกต่างกัน
- วิธีที่ 1: คุณระบุรหัสภูมิศาสตร์ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสทางภูมิศาสตร์ ซึ่งแต่ละคีย์จะเชื่อมโยงกับมูลค่าการซื้อสรุปที่ระดับรหัสทางภูมิศาสตร์ที่เฉพาะเจาะจง
- วิธีที่ 2: คุณไม่รวมรหัสภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อสรุปสําหรับรหัสภูมิศาสตร์ / สถานที่ตั้งทั้งหมดโดยตรง
วิธีเข้าถึงมูลค่าการซื้อระดับประเทศ
- เมื่อใช้วิธี A คุณจะรวมค่าสรุประดับรหัสทางภูมิศาสตร์และรวมสัญญาณรบกวนด้วย ซึ่งอาจทำให้ค่าการซื้อระดับรหัสทางภูมิศาสตร์สุดท้ายมีสัญญาณรบกวนมากขึ้น
- ในแนวทาง B คุณจะดูข้อมูลที่แสดงในรายงานสรุปโดยตรง ระบบจะเพิ่มข้อมูลรบกวนลงในข้อมูลดังกล่าวเพียงครั้งเดียว
ดังนั้น มูลค่าการซื้อโดยรวมสำหรับรหัสภูมิศาสตร์ที่กำหนดจึงมีแนวโน้มที่จะมีความผันผวนมากขึ้นเมื่อใช้แนวทาง ก.
ในทำนองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์มีแนวโน้มที่จะทำให้ผลลัพธ์มีความผันผวนมากกว่าการใช้คีย์ที่หยาบกว่าซึ่งมีมิติข้อมูลระดับภูมิภาค
การรวบรวมข้อมูลในช่วงระยะเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน
การขอรายงานสรุปน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าในกรณีที่คุณขอรายงานบ่อยขึ้น เนื่องจากมีแนวโน้มที่จะเกิด Conversion มากขึ้นในช่วงระยะเวลาที่นานขึ้น
ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูงเท่าใด ความผันผวนสัมพัทธ์ก็จะยิ่งต่ำลงเท่านั้น ดังนั้นการขอรายงานสรุปบ่อยน้อยลงจะทําให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น (ดีขึ้น)
ตัวอย่าง
- หากคุณขอรายงานสรุปรายชั่วโมงในช่วง 24 ชั่วโมง แล้วนำค่าสรุปจากรายงานรายชั่วโมงแต่ละรายการมารวมกันเพื่อเข้าถึงข้อมูลระดับวัน ระบบจะเพิ่มสัญญาณรบกวน 24 ครั้ง
- ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว
ค่าเอปซิลอนสูงขึ้น สัญญาณรบกวนน้อยลง
ยิ่งค่าเอปซิลอนสูงเท่าใด เสียงรบกวนก็จะยิ่งต่ำลงและการปกป้องความเป็นส่วนตัวก็จะยิ่งต่ำลง
ใช้ประโยชน์จากการกรองและการขจัดข้อมูลที่ซ้ำกัน
ส่วนสําคัญของการจัดสรรงบประมาณระหว่างคีย์ต่างๆ คือการทําความเข้าใจว่าเหตุการณ์หนึ่งๆ เกิดขึ้นได้กี่ครั้ง เช่น ผู้ลงโฆษณาอาจสนใจเฉพาะการซื้อ 1 ครั้งต่อการคลิก 1 ครั้ง แต่อาจสนใจ Conversion "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ หากต้องการรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ฟีเจอร์ API ต่อไปนี้ด้วย ซึ่งจะช่วยให้คุณควบคุมจำนวนรายงานที่สร้างขึ้นและ Conversion ที่นับได้
- การกรอง อ่านเพิ่มเติมเกี่ยวกับการกรอง
- การกรองข้อมูลที่ซ้ำกันออก อ่านเพิ่มเติมเกี่ยวกับการขจัดข้อมูลที่ซ้ำกัน
การทดลองกับเอปซิลอน
เทคโนโลยีโฆษณาสามารถตั้งค่าเอปซิลอนเป็นค่าที่มากกว่า 0 และไม่เกิน 64 ช่วงนี้ช่วยให้ทดสอบได้อย่างยืดหยุ่น ค่าเอปซิลอนที่ต่ำกว่าจะช่วยให้การคุ้มครองความเป็นส่วนตัวดีขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10
คำแนะนำในการทดสอบ
เราขอแนะนำให้ทำดังนี้
- เริ่มต้นด้วยเอปซิลอน = 10
- ในกรณีที่ทำให้เกิดปัญหาด้านยูทิลิตีที่สำคัญ ให้เพิ่มค่า epsilon ทีละน้อย
- แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนที่เฉพาะเจาะจงที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล
มีส่วนร่วมและแชร์ความคิดเห็น
คุณเข้าร่วมและทดลองใช้ API นี้ได้
- อ่านเกี่ยวกับรายงานที่รวบรวมได้และบริการรวบรวมข้อมูล ถามคำถาม และเสนอความคิดเห็น
- อ่านคู่มือการรายงานการระบุแหล่งที่มา
ขั้นตอนถัดไป
- ดูข้อมูลเพิ่มเติมเกี่ยวกับปัจจัยที่มีผลต่อการรายงาน เช่น ตัวแปรแคมเปญ ความถี่ในการจัดกลุ่ม และระดับความละเอียดของมิติข้อมูลได้ที่ทดสอบการตัดสินใจออกแบบรายงานสรุป
- ลองใช้ห้องทดลองเสียง