ดูวิธีจัดการ พิจารณา และลดผลกระทบของสัญญาณรบกวนในรายงานที่รวบรวมได้
ก่อนเริ่มต้น
ก่อนดำเนินการต่อ โปรดดูการทำความเข้าใจสัญญาณรบกวนในรายงานสรุปเพื่อให้เข้าใจความหมายและผลกระทบของสัญญาณรบกวนอย่างละเอียด
การควบคุมเสียงรบกวน
แม้ว่าคุณจะควบคุมระดับสัญญาณรบกวนซึ่งเพิ่มลงในรายงานที่รวบรวมได้โดยตรงไม่ได้ แต่ก็มีขั้นตอนที่คุณทําได้เพื่อลดผลกระทบ ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้
ปรับงบประมาณให้สูงขึ้นเป็นงบประมาณการมีส่วนร่วม
ตามที่อธิบายไว้ใน "การทำความเข้าใจสัญญาณรบกวน" สัญญาณรบกวนที่ใช้กับค่าสรุปสำหรับแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET
)

ด้วยเหตุนี้ คุณจึงควรปรับขนาดค่าแต่ละค่าก่อนตั้งค่าเป็นค่าที่รวบรวมได้ เพื่อเพิ่มสัญญาณให้มากที่สุดเมื่อเทียบกับสัญญาณรบกวน ซึ่งก็คือการคูณค่าแต่ละค่าด้วยปัจจัยหนึ่งๆ หรือปัจจัยการปรับขนาด และตรวจสอบว่าค่าดังกล่าวอยู่ภายในงบประมาณการมีส่วนร่วม

การคำนวณค่าตัวคูณมาตราส่วน
ตัวคูณการปรับขนาดแสดงถึงจํานวนที่ต้องการปรับขนาดค่าที่รวบรวมได้ ค่าของเมตริกนี้ควรเป็นงบประมาณการมีส่วนร่วมหารด้วยค่ารวมสูงสุดสําหรับคีย์หนึ่งๆ

ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ $2,000 ยกเว้นค่าเบี่ยงเบนค่าเล็กน้อย 2-3 รายการที่คุณเลือกที่จะไม่สนใจ
- คำนวณค่าตัวคูณมาตราส่วน
- หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนให้สูงสุด คุณต้องปรับขนาดค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
- ผลลัพธ์ที่ได้คือ 65,536 / 2,000 ซึ่งเป็นค่าตัวคูณมาตราส่วนประมาณ 32x ในทางปฏิบัติ คุณอาจปัดเศษปัจจัยนี้ขึ้นหรือลง
- ปรับค่าให้สูงขึ้นก่อนการรวม สําหรับการซื้อทุกๆ $1 ให้เพิ่มเมตริกที่ติดตามขึ้น 32 เช่น สําหรับการซื้อมูลค่า $120 ให้กําหนดค่าที่รวบรวมได้ 120*32 = 3,840
- ปรับค่าลงหลังจากการรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่รวมจากผู้ใช้หลายราย ให้ปรับลดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่คุณใช้ก่อนการรวม ในตัวอย่างนี้ เราใช้ตัวคูณการปรับขนาด 32 ก่อนการรวมข้อมูล ดังนั้นเราต้องหารค่าสรุปที่ได้รับในรายงานสรุปด้วย 32 ดังนั้น หากมูลค่าการซื้อสรุปของคีย์หนึ่งๆ ในรายงานสรุปคือ 76,800 มูลค่าการซื้อสรุป (ที่มีสัญญาณรบกวน) คือ 76,800/32 = 2,400 บาท
แบ่งงบประมาณ
หากคุณมีเป้าหมายการวัดผลหลายรายการ เช่น จํานวนการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณตามเป้าหมายเหล่านี้
ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างกันไปตามค่าที่รวบรวมได้ต่างๆ โดยขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้หนึ่งๆ
อ่านรายละเอียดในการทำความเข้าใจคีย์การรวม
ตัวอย่างเช่น สมมติว่าคุณติดตามทั้งจํานวนการซื้อและมูลค่าการซื้อ และคุณตัดสินใจจัดสรรงบประมาณอย่างเท่าๆ กัน
65,536 / 2 = 32,768 รายการต่อประเภทการวัดผลและต่อแหล่งที่มา
- จํานวนการซื้อ:
- คุณติดตามการซื้อเพียงรายการเดียว จำนวนการซื้อสูงสุดสําหรับ Conversion หนึ่งๆ จึงเท่ากับ 1
- คุณจึงตัดสินใจที่จะตั้งค่าตัวคูณการปรับขนาดสําหรับจํานวนการซื้อเป็น 32,768 / 1 = 32,768
- มูลค่าการซื้อ:
- สมมติว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ 6,000 บาท
- คุณจึงตัดสินใจตั้งค่าตัวคูณการปรับขนาดสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16
คีย์การรวมข้อมูลแบบหยาบจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน
เนื่องจากคีย์แบบหยาบจะจับเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด โดยทั่วไปแล้วคีย์แบบหยาบจึงทําให้ค่าสรุปสูงกว่า
ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า เนื่องจากสัญญาณรบกวนสำหรับค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่าเมื่อเทียบกับค่านี้
ค่าที่รวบรวมด้วยคีย์แบบหยาบมีแนวโน้มที่จะมีความผันผวนน้อยกว่าค่าที่รวบรวมด้วยคีย์แบบละเอียด
ตัวอย่าง
เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมจากทุกประเทศ) จะทําให้มูลค่าการซื้อสรุป (และจํานวน Conversion สรุป) สูงกว่าคีย์ที่ติดตาม Conversion ที่ระดับประเทศ
ดังนั้น ระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับบางประเทศจะสูงกว่าระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับทุกประเทศ
ในทํานองเดียวกัน เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน มูลค่าการซื้อทั้งหมดสําหรับรองเท้าจะต่ำกว่ามูลค่าการซื้อทั้งหมดสําหรับสินค้าทั้งหมด (รวมถึงรองเท้า)
ดังนั้น ระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับรองเท้าจะสูงกว่าระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับสินค้าทั้งหมด

การรวมค่าสรุป (การรวมข้อมูล) จะรวมค่ารบกวนด้วย
การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลในระดับที่สูงขึ้นจะเป็นการรวมสัญญาณรบกวนจากค่าสรุปเหล่านี้ด้วย

มาดูแนวทาง 2 แบบกัน - แนวทาง ก: คุณใส่รหัสทางภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสภูมิศาสตร์ ซึ่งแต่ละรายการเชื่อมโยงกับมูลค่าการซื้อโดยรวมที่ระดับรหัสภูมิศาสตร์ที่เฉพาะเจาะจง - แนวทางที่ 2: คุณไม่ได้ใส่รหัสภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อสรุปสำหรับรหัส / สถานที่ตั้งทางภูมิศาสตร์ทั้งหมดโดยตรง
วิธีเข้าถึงมูลค่าการซื้อระดับประเทศมีดังนี้ - เมื่อใช้แนวทาง ก. คุณจะรวมค่าสรุประดับรหัสภูมิศาสตร์และรวมค่ารบกวนด้วย ซึ่งอาจทําให้ค่าการซื้อระดับรหัสทางภูมิศาสตร์สุดท้ายมีความคลาดเคลื่อนมากขึ้น - แนวทาง ข. ให้คุณดูข้อมูลที่แสดงในรายงานสรุปได้โดยตรง มีการเพิ่มข้อมูลรบกวนลงในข้อมูลนั้นเพียงครั้งเดียว
ดังนั้น มูลค่าการซื้อโดยสรุปสําหรับรหัสทางภูมิศาสตร์หนึ่งๆ จึงมีแนวโน้มที่จะมีความผันผวนมากกว่าเมื่อใช้แนวทาง ก
ในทํานองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์มีแนวโน้มที่จะทําให้ผลลัพธ์มีข้อมูลที่ไม่เกี่ยวข้องมากกว่าการใช้คีย์ที่ละเอียดกว่าซึ่งมีมิติข้อมูลระดับภูมิภาค
การรวบรวมข้อมูลในระยะเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน
การขอรายงานสรุปน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าในกรณีที่คุณขอรายงานบ่อยขึ้น เนื่องจากมีแนวโน้มที่ Conversion จะเกิดขึ้นมากขึ้นในระยะเวลาที่นานขึ้น
ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูงเท่าใด โอกาสที่จะมีสัญญาณรบกวนที่เกี่ยวข้องก็ยิ่งต่ำลงเท่านั้น ดังนั้น การขอรายงานสรุปเป็นครั้งคราวจะช่วยให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น (ดีกว่า)

ต่อไปนี้เป็นตัวอย่างที่แสดงให้เห็น
- หากคุณขอรายงานสรุปรายชั่วโมงในช่วง 24 ชั่วโมง แล้วรวมค่าสรุปจากรายงานรายชั่วโมงแต่ละฉบับเพื่อเข้าถึงข้อมูลระดับวัน ระบบจะเพิ่มสัญญาณรบกวน 24 ครั้ง
- ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว
ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำ
ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำลง และการคุ้มครองความเป็นส่วนตัวก็จะยิ่งต่ำลงด้วย
ใช้ประโยชน์จากการกรองและการกรองข้อมูลที่ซ้ำกันออก
สิ่งสำคัญในการกําหนดงบประมาณระหว่างคีย์ต่างๆ คือการทำความเข้าใจจํานวนครั้งที่เหตุการณ์หนึ่งๆ อาจเกิดขึ้น เช่น ผู้ลงโฆษณาอาจสนใจเฉพาะการซื้อ 1 ครั้งต่อการคลิกแต่ละครั้ง แต่อาจสนใจ Conversion "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ หากต้องการรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ประโยชน์จากฟีเจอร์ API ต่อไปนี้ด้วย ซึ่งจะช่วยให้คุณควบคุมจํานวนรายงานที่สร้างขึ้นและ Conversion ที่นับได้
- การกรอง อ่านเพิ่มเติมเกี่ยวกับการกรอง
- การกรองข้อมูลที่ซ้ำกันออก อ่านเพิ่มเติมเกี่ยวกับการกรองข้อมูลที่ซ้ำกันออก
การทดสอบกับ epsilon
เทคโนโลยีโฆษณาสามารถตั้งค่า epsilon เป็นค่าที่มากกว่า 0 และไม่เกิน 64 ช่วงนี้ช่วยให้การทดสอบมีความยืดหยุ่น ค่า epsilon ที่ต่ำลงจะให้การคุ้มครองความเป็นส่วนตัวมากขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10
คําแนะนําในการทดสอบ
เราขอแนะนําดังนี้ - เริ่มต้นด้วย epsilon = 10 - ในกรณีที่ปัญหานี้ทําให้ยูทิลิตีทำงานผิดปกติ ให้เพิ่ม epsilon ทีละน้อย - แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนแปลงที่เฉพาะเจาะจงที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล
มีส่วนร่วมและแชร์ความคิดเห็น
คุณสามารถเข้าร่วมและทดสอบกับ API นี้
- อ่านเกี่ยวกับรายงานที่รวบรวมได้และบริการรวบรวมข้อมูล ถามคำถาม และแนะนำความคิดเห็น
- อ่านคู่มือการรายงานการระบุแหล่งที่มา
- ถามคำถามและเข้าร่วมการสนทนาในที่เก็บการสนับสนุนนักพัฒนาซอฟต์แวร์ Privacy Sandbox
ขั้นตอนถัดไป
- ดูข้อมูลเพิ่มเติมเกี่ยวกับปัจจัยที่ส่งผลต่อการรายงาน เช่น ตัวแปรของแคมเปญ ความถี่ในการแบ่งกลุ่ม และความละเอียดของมิติข้อมูลได้ที่ทดสอบการตัดสินใจเกี่ยวกับการออกแบบรายงานสรุป
- ลองใช้ Noise Lab