การทำงานกับเสียงรบกวน

ดูวิธีจัดการ พิจารณา และลดผลกระทบของสัญญาณรบกวนในรายงานที่รวบรวมได้

ก่อนเริ่มต้น

ก่อนดำเนินการต่อ โปรดดูการทำความเข้าใจสัญญาณรบกวนในรายงานสรุปเพื่อให้เข้าใจความหมายและผลกระทบของสัญญาณรบกวนอย่างละเอียด

การควบคุมเสียงรบกวน

แม้ว่าคุณจะควบคุมระดับสัญญาณรบกวนซึ่งเพิ่มลงในรายงานที่รวบรวมได้โดยตรงไม่ได้ แต่ก็มีขั้นตอนที่คุณทําได้เพื่อลดผลกระทบ ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้

ปรับงบประมาณให้สูงขึ้นเป็นงบประมาณการมีส่วนร่วม

ตามที่อธิบายไว้ใน "การทำความเข้าใจสัญญาณรบกวน" สัญญาณรบกวนที่ใช้กับค่าสรุปสำหรับแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET)

การกระจายเสียงรบกวนจะอิงตามงบประมาณ

ด้วยเหตุนี้ คุณจึงควรปรับขนาดค่าแต่ละค่าก่อนตั้งค่าเป็นค่าที่รวบรวมได้ เพื่อเพิ่มสัญญาณให้มากที่สุดเมื่อเทียบกับสัญญาณรบกวน ซึ่งก็คือการคูณค่าแต่ละค่าด้วยปัจจัยหนึ่งๆ หรือปัจจัยการปรับขนาด และตรวจสอบว่าค่าดังกล่าวอยู่ภายในงบประมาณการมีส่วนร่วม

สัญญาณรบกวนสัมพัทธ์ที่มีและไม่มีการปรับขนาด

การคำนวณค่าตัวคูณมาตราส่วน

ตัวคูณการปรับขนาดแสดงถึงจํานวนที่ต้องการปรับขนาดค่าที่รวบรวมได้ ค่าของเมตริกนี้ควรเป็นงบประมาณการมีส่วนร่วมหารด้วยค่ารวมสูงสุดสําหรับคีย์หนึ่งๆ

การกำหนดค่าตัวคูณมาตราส่วนตามงบประมาณการมีส่วนร่วม

ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ $2,000 ยกเว้นค่าเบี่ยงเบนค่าเล็กน้อย 2-3 รายการที่คุณเลือกที่จะไม่สนใจ

  • คำนวณค่าตัวคูณมาตราส่วน
    • หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนให้สูงสุด คุณต้องปรับขนาดค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
    • ผลลัพธ์ที่ได้คือ 65,536 / 2,000 ซึ่งเป็นค่าตัวคูณมาตราส่วนประมาณ 32x ในทางปฏิบัติ คุณอาจปัดเศษปัจจัยนี้ขึ้นหรือลง
  • ปรับค่าให้สูงขึ้นก่อนการรวม สําหรับการซื้อทุกๆ $1 ให้เพิ่มเมตริกที่ติดตามขึ้น 32 เช่น สําหรับการซื้อมูลค่า $120 ให้กําหนดค่าที่รวบรวมได้ 120*32 = 3,840
  • ปรับค่าลงหลังจากการรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่รวมจากผู้ใช้หลายราย ให้ปรับลดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่คุณใช้ก่อนการรวม ในตัวอย่างนี้ เราใช้ตัวคูณการปรับขนาด 32 ก่อนการรวมข้อมูล ดังนั้นเราต้องหารค่าสรุปที่ได้รับในรายงานสรุปด้วย 32 ดังนั้น หากมูลค่าการซื้อสรุปของคีย์หนึ่งๆ ในรายงานสรุปคือ 76,800 มูลค่าการซื้อสรุป (ที่มีสัญญาณรบกวน) คือ 76,800/32 = 2,400 บาท

แบ่งงบประมาณ

หากคุณมีเป้าหมายการวัดผลหลายรายการ เช่น จํานวนการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณตามเป้าหมายเหล่านี้

ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างกันไปตามค่าที่รวบรวมได้ต่างๆ โดยขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้หนึ่งๆ

อ่านรายละเอียดในการทำความเข้าใจคีย์การรวม

ตัวอย่างเช่น สมมติว่าคุณติดตามทั้งจํานวนการซื้อและมูลค่าการซื้อ และคุณตัดสินใจจัดสรรงบประมาณอย่างเท่าๆ กัน

65,536 / 2 = 32,768 รายการต่อประเภทการวัดผลและต่อแหล่งที่มา

  • จํานวนการซื้อ:
    • คุณติดตามการซื้อเพียงรายการเดียว จำนวนการซื้อสูงสุดสําหรับ Conversion หนึ่งๆ จึงเท่ากับ 1
    • คุณจึงตัดสินใจที่จะตั้งค่าตัวคูณการปรับขนาดสําหรับจํานวนการซื้อเป็น 32,768 / 1 = 32,768
  • มูลค่าการซื้อ:
    • สมมติว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ 6,000 บาท
    • คุณจึงตัดสินใจตั้งค่าตัวคูณการปรับขนาดสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16

คีย์การรวมข้อมูลแบบหยาบจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน

เนื่องจากคีย์แบบหยาบจะจับเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด โดยทั่วไปแล้วคีย์แบบหยาบจึงทําให้ค่าสรุปสูงกว่า

ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า เนื่องจากสัญญาณรบกวนสำหรับค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่าเมื่อเทียบกับค่านี้

ค่าที่รวบรวมด้วยคีย์แบบหยาบมีแนวโน้มที่จะมีความผันผวนน้อยกว่าค่าที่รวบรวมด้วยคีย์แบบละเอียด

ตัวอย่าง

เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมจากทุกประเทศ) จะทําให้มูลค่าการซื้อสรุป (และจํานวน Conversion สรุป) สูงกว่าคีย์ที่ติดตาม Conversion ที่ระดับประเทศ

ดังนั้น ระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับบางประเทศจะสูงกว่าระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับทุกประเทศ

ในทํานองเดียวกัน เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน มูลค่าการซื้อทั้งหมดสําหรับรองเท้าจะต่ำกว่ามูลค่าการซื้อทั้งหมดสําหรับสินค้าทั้งหมด (รวมถึงรองเท้า)

ดังนั้น ระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับรองเท้าจะสูงกว่าระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับสินค้าทั้งหมด

ผลกระทบจากข้อผิดพลาดเมื่อใช้คีย์แบบละเอียดเทียบกับแบบหยาบ

การรวมค่าสรุป (การรวมข้อมูล) จะรวมค่ารบกวนด้วย

การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลในระดับที่สูงขึ้นจะเป็นการรวมสัญญาณรบกวนจากค่าสรุปเหล่านี้ด้วย

ระดับของสัญญาณรบกวนเมื่อใช้คีย์แบบละเอียดที่มีการรวมช่องกับคีย์แบบหยาบที่ไม่มีการรวมช่อง

มาดูแนวทาง 2 แบบกัน - แนวทาง ก: คุณใส่รหัสทางภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสภูมิศาสตร์ ซึ่งแต่ละรายการเชื่อมโยงกับมูลค่าการซื้อโดยรวมที่ระดับรหัสภูมิศาสตร์ที่เฉพาะเจาะจง - แนวทางที่ 2: คุณไม่ได้ใส่รหัสภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อสรุปสำหรับรหัส / สถานที่ตั้งทางภูมิศาสตร์ทั้งหมดโดยตรง

วิธีเข้าถึงมูลค่าการซื้อระดับประเทศมีดังนี้ - เมื่อใช้แนวทาง ก. คุณจะรวมค่าสรุประดับรหัสภูมิศาสตร์และรวมค่ารบกวนด้วย ซึ่งอาจทําให้ค่าการซื้อระดับรหัสทางภูมิศาสตร์สุดท้ายมีความคลาดเคลื่อนมากขึ้น - แนวทาง ข. ให้คุณดูข้อมูลที่แสดงในรายงานสรุปได้โดยตรง มีการเพิ่มข้อมูลรบกวนลงในข้อมูลนั้นเพียงครั้งเดียว

ดังนั้น มูลค่าการซื้อโดยสรุปสําหรับรหัสทางภูมิศาสตร์หนึ่งๆ จึงมีแนวโน้มที่จะมีความผันผวนมากกว่าเมื่อใช้แนวทาง ก

ในทํานองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์มีแนวโน้มที่จะทําให้ผลลัพธ์มีข้อมูลที่ไม่เกี่ยวข้องมากกว่าการใช้คีย์ที่ละเอียดกว่าซึ่งมีมิติข้อมูลระดับภูมิภาค

การรวบรวมข้อมูลในระยะเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน

การขอรายงานสรุปน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าในกรณีที่คุณขอรายงานบ่อยขึ้น เนื่องจากมีแนวโน้มที่ Conversion จะเกิดขึ้นมากขึ้นในระยะเวลาที่นานขึ้น

ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูงเท่าใด โอกาสที่จะมีสัญญาณรบกวนที่เกี่ยวข้องก็ยิ่งต่ำลงเท่านั้น ดังนั้น การขอรายงานสรุปเป็นครั้งคราวจะช่วยให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น (ดีกว่า)

การขอรายงานสรุปน้อยลงจะทำให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น

ต่อไปนี้เป็นตัวอย่างที่แสดงให้เห็น

  • หากคุณขอรายงานสรุปรายชั่วโมงในช่วง 24 ชั่วโมง แล้วรวมค่าสรุปจากรายงานรายชั่วโมงแต่ละฉบับเพื่อเข้าถึงข้อมูลระดับวัน ระบบจะเพิ่มสัญญาณรบกวน 24 ครั้ง
  • ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว

ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำ

ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำลง และการคุ้มครองความเป็นส่วนตัวก็จะยิ่งต่ำลงด้วย

ใช้ประโยชน์จากการกรองและการกรองข้อมูลที่ซ้ำกันออก

สิ่งสำคัญในการกําหนดงบประมาณระหว่างคีย์ต่างๆ คือการทำความเข้าใจจํานวนครั้งที่เหตุการณ์หนึ่งๆ อาจเกิดขึ้น เช่น ผู้ลงโฆษณาอาจสนใจเฉพาะการซื้อ 1 ครั้งต่อการคลิกแต่ละครั้ง แต่อาจสนใจ Conversion "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ หากต้องการรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ประโยชน์จากฟีเจอร์ API ต่อไปนี้ด้วย ซึ่งจะช่วยให้คุณควบคุมจํานวนรายงานที่สร้างขึ้นและ Conversion ที่นับได้

การทดสอบกับ epsilon

เทคโนโลยีโฆษณาสามารถตั้งค่า epsilon เป็นค่าที่มากกว่า 0 และไม่เกิน 64 ช่วงนี้ช่วยให้การทดสอบมีความยืดหยุ่น ค่า epsilon ที่ต่ำลงจะให้การคุ้มครองความเป็นส่วนตัวมากขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10

คําแนะนําในการทดสอบ

เราขอแนะนําดังนี้ - เริ่มต้นด้วย epsilon = 10 - ในกรณีที่ปัญหานี้ทําให้ยูทิลิตีทำงานผิดปกติ ให้เพิ่ม epsilon ทีละน้อย - แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนแปลงที่เฉพาะเจาะจงที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล

มีส่วนร่วมและแชร์ความคิดเห็น

คุณสามารถเข้าร่วมและทดสอบกับ API นี้

ขั้นตอนถัดไป