การทำงานกับเสียงรบกวน

ดูวิธีจัดการ พิจารณา และลดผลกระทบของสัญญาณรบกวนในรายงานที่รวบรวมได้

ก่อนเริ่มต้น

ก่อนดำเนินการต่อ โปรดดูการทำความเข้าใจสัญญาณรบกวนในรายงานสรุปเพื่อให้ทราบข้อมูลเชิงลึกเกี่ยวกับสัญญาณรบกวนและผลกระทบ

การควบคุมเสียง

แม้ว่าคุณจะควบคุมสัญญาณรบกวนซึ่งเพิ่มลงในรายงานที่รวบรวมข้อมูลได้โดยตรงไม่ได้ แต่ก็มีขั้นตอนที่คุณทําได้เพื่อลดผลกระทบ ส่วนต่อไปนี้จะอธิบายกลยุทธ์เหล่านี้

ปรับงบประมาณให้สูงขึ้นเป็นงบประมาณการมีส่วนร่วม

ตามที่อธิบายไว้ใน "การทำความเข้าใจสัญญาณรบกวน" สัญญาณรบกวนที่ใช้กับค่าสรุปสำหรับแต่ละคีย์จะอิงตามมาตราส่วน 0-65,536 (0-CONTRIBUTION_BUDGET)

การกระจายเสียงรบกวนจะอิงตามงบประมาณ
การกระจายเสียงรบกวนจะอิงตามงบประมาณ

ด้วยเหตุนี้ คุณจึงควรปรับมูลค่าให้สูงขึ้นก่อนตั้งค่าเป็นมูลค่าที่รวบรวมได้ เพื่อเพิ่มสัญญาณให้มากที่สุดเมื่อเทียบกับสัญญาณรบกวน ซึ่งก็คือการคูณแต่ละค่าด้วยปัจจัยหนึ่งๆ หรือปัจจัยการปรับขนาด พร้อมกับตรวจสอบว่าค่าดังกล่าวอยู่ภายในงบประมาณการมีส่วนร่วม

สัญญาณรบกวนสัมพัทธ์ที่มีและไม่มีการปรับขนาด
สัญญาณรบกวนสัมพัทธ์ที่มีและไม่มีการปรับสเกล

การคำนวณค่าตัวคูณมาตราส่วน

ตัวคูณการปรับขนาดแสดงถึงจํานวนที่ต้องการปรับขนาดค่าที่รวบรวมได้ ค่าของเมตริกนี้ควรเป็นงบประมาณการมีส่วนร่วมหารด้วยค่ารวมสูงสุดสําหรับคีย์หนึ่งๆ

การกำหนดค่าตัวคูณมาตราส่วนตามงบประมาณการมีส่วนร่วม
การกำหนดตัวคูณมาตราส่วนตามงบประมาณการมีส่วนร่วม

ตัวอย่างเช่น สมมติว่าผู้ลงโฆษณาต้องการทราบมูลค่าการซื้อทั้งหมด คุณทราบว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ $2,000 ยกเว้นค่าเบี่ยงเบน 2-3 รายการที่คุณเลือกที่จะไม่สนใจ

  • คำนวณค่าตัวคูณมาตราส่วน
    • หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวนให้สูงสุด คุณต้องปรับขนาดค่านี้เป็น 65,536 (งบประมาณการมีส่วนร่วม)
    • ผลลัพธ์ที่ได้คือ 65,536 / 2,000 ซึ่งเป็นค่าตัวคูณมาตราส่วนประมาณ 32x ในทางปฏิบัติ คุณอาจปัดเศษปัจจัยนี้ขึ้นหรือลง
  • ปรับค่าให้สูงขึ้นก่อนการรวม สําหรับการซื้อทุกๆ $1 ให้เพิ่มเมตริกที่ติดตามขึ้น 32 เช่น สําหรับการซื้อมูลค่า $120 ให้กําหนดค่าที่รวบรวมได้ 120*32 = 3,840
  • ปรับค่าลงหลังจากการรวม เมื่อได้รับรายงานสรุปที่มีมูลค่าการซื้อที่รวมจากผู้ใช้หลายราย ให้ปรับลดมูลค่าสรุปโดยใช้ปัจจัยการปรับขนาดที่คุณใช้ก่อนการรวม ในตัวอย่างนี้ เราใช้ตัวคูณการปรับขนาด 32 ก่อนการรวมข้อมูล ดังนั้นเราต้องหารค่าสรุปที่ได้รับในรายงานสรุปด้วย 32 ดังนั้น หากมูลค่าการซื้อสรุปของคีย์หนึ่งๆ ในรายงานสรุปคือ 76,800 มูลค่าการซื้อสรุป (ที่มีสัญญาณรบกวน) คือ 76,800/32 = 2,400

แบ่งงบประมาณ

หากคุณมีเป้าหมายการวัดผลหลายรายการ เช่น จํานวนการซื้อและมูลค่าการซื้อ คุณอาจต้องแบ่งงบประมาณตามเป้าหมายเหล่านี้

ในกรณีนี้ ปัจจัยการปรับขนาดจะแตกต่างกันไปตามค่าที่รวบรวมได้ต่างๆ โดยขึ้นอยู่กับค่าสูงสุดที่คาดไว้ของค่าที่รวบรวมได้หนึ่งๆ

อ่านรายละเอียดในการทำความเข้าใจคีย์การรวม

ตัวอย่างเช่น สมมติว่าคุณติดตามทั้งจํานวนการซื้อและมูลค่าการซื้อ และตัดสินใจจัดสรรงบประมาณอย่างเท่าๆ กัน

65,536 / 2 = 32,768 รายการต่อประเภทการวัดผลและต่อแหล่งที่มา

  • จํานวนการซื้อ:
    • คุณติดตามการซื้อเพียงรายการเดียว จำนวนการซื้อสูงสุดสําหรับ Conversion หนึ่งๆ จึงเท่ากับ 1
    • คุณจึงตัดสินใจตั้งค่าตัวคูณการปรับขนาดสําหรับจํานวนการซื้อเป็น 32,768 / 1 = 32,768
  • มูลค่าการซื้อ:
    • สมมติว่ามูลค่าการซื้อสูงสุดที่คาดไว้ของการซื้อแต่ละรายการคือ 6,000 บาท
    • คุณจึงตัดสินใจที่จะตั้งค่าตัวคูณการปรับขนาดสำหรับมูลค่าการซื้อเป็น 32,768 / 2,000 = 16.384 หรือประมาณ 16

คีย์การรวมข้อมูลแบบหยาบจะช่วยปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน

เนื่องจากคีย์แบบหยาบจะจับเหตุการณ์ Conversion ได้มากกว่าคีย์แบบละเอียด โดยทั่วไปแล้วคีย์แบบหยาบจึงทําให้ค่าสรุปสูงขึ้น

ค่าสรุปที่สูงกว่าจะได้รับผลกระทบจากสัญญาณรบกวนน้อยกว่าค่าที่ต่ำกว่า เนื่องจากสัญญาณรบกวนสำหรับค่าเหล่านี้มีแนวโน้มที่จะต่ำกว่าเมื่อเทียบกับค่านี้

ค่าที่รวบรวมด้วยคีย์แบบหยาบมีแนวโน้มที่จะมีความผันผวนน้อยกว่าค่าที่รวบรวมด้วยคีย์แบบละเอียด

ตัวอย่าง

เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน คีย์ที่ติดตามมูลค่าการซื้อทั่วโลก (รวมจากทุกประเทศ) จะทําให้มูลค่าการซื้อสรุป (และจํานวน Conversion สรุป) สูงกว่าคีย์ที่ติดตาม Conversion ที่ระดับประเทศ

ดังนั้น ระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับบางประเทศจะสูงกว่าระดับความผันผวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับทุกประเทศ

ในทํานองเดียวกัน เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน มูลค่าการซื้อทั้งหมดสําหรับรองเท้าจะต่ำกว่ามูลค่าการซื้อทั้งหมดสําหรับสินค้าทั้งหมด (รวมถึงรองเท้า)

ดังนั้น ระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับรองเท้าจะสูงกว่าระดับความแปรปรวนสัมพัทธ์ของมูลค่าการซื้อทั้งหมดสำหรับสินค้าทั้งหมด

ผลกระทบจากข้อผิดพลาดเมื่อใช้คีย์แบบละเอียดเทียบกับแบบหยาบ
ผลกระทบจากข้อผิดพลาดเมื่อใช้คีย์แบบละเอียดเทียบกับแบบหยาบ

การรวมค่าสรุป (การรวมข้อมูล) จะรวมค่ารบกวนด้วย

การรวมค่าสรุปจากรายงานสรุปเพื่อเข้าถึงข้อมูลในระดับที่สูงขึ้นจะเป็นการรวมสัญญาณรบกวนจากค่าสรุปเหล่านี้ด้วย

ระดับของสัญญาณรบกวนที่มีคีย์แบบละเอียดที่มีการรวมข้อมูลเทียบกับคีย์แบบหยาบที่ไม่มีการรวมข้อมูล
ระดับสัญญาณรบกวนเมื่อใช้คีย์แบบละเอียดที่มีการรวมกลุ่มเทียบกับคีย์แบบหยาบที่ไม่มีการจัดกลุ่ม

มาดู 2 วิธีกัน

  • แนวทางที่ 1: คุณระบุรหัสภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงคีย์ระดับรหัสภูมิศาสตร์ ซึ่งแต่ละรายการเชื่อมโยงกับมูลค่าการซื้อโดยรวมที่ระดับรหัสภูมิศาสตร์ที่เฉพาะเจาะจง
  • แนวทางที่ 2: คุณไม่ได้ใส่รหัสภูมิศาสตร์ไว้ในคีย์ รายงานสรุปจะแสดงมูลค่าการซื้อสรุปสำหรับรหัส / สถานที่ตั้งทางภูมิศาสตร์ทั้งหมดโดยตรง

วิธีเข้าถึงมูลค่าการซื้อระดับประเทศ

  • เมื่อใช้แนวทาง ก คุณจะรวมค่าสรุประดับรหัสภูมิศาสตร์และรวมสัญญาณรบกวนด้วย ซึ่งอาจทําให้ค่าการซื้อระดับรหัสทางภูมิศาสตร์สุดท้ายมีความคลาดเคลื่อนมากขึ้น
  • เมื่อใช้แนวทาง ข. คุณจะดูข้อมูลที่แสดงในรายงานสรุปได้โดยตรง มีการเพิ่มข้อมูลรบกวนลงในข้อมูลนั้นเพียงครั้งเดียว

ดังนั้น ค่าการซื้อสรุปสําหรับรหัสทางภูมิศาสตร์หนึ่งๆ จึงมีแนวโน้มที่จะมีความผันผวนมากกว่าเมื่อใช้แนวทาง ก

ในทํานองเดียวกัน การรวมมิติข้อมูลระดับรหัสไปรษณีย์ไว้ในคีย์มีแนวโน้มที่จะทําให้ผลลัพธ์มีข้อมูลที่ไม่เกี่ยวข้องมากกว่าการใช้คีย์ที่ละเอียดกว่าซึ่งมีมิติข้อมูลระดับภูมิภาค

การรวบรวมข้อมูลในระยะเวลาที่นานขึ้นจะเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน

การขอรายงานสรุปน้อยลงหมายความว่าค่าสรุปแต่ละค่ามีแนวโน้มที่จะสูงกว่าในกรณีที่คุณขอรายงานบ่อยขึ้น เนื่องจากมีแนวโน้มที่ Conversion จะเกิดขึ้นมากขึ้นในระยะเวลาที่นานขึ้น

ดังที่กล่าวไว้ก่อนหน้านี้ ยิ่งค่าสรุปสูง โอกาสที่จะมีสัญญาณรบกวนที่เกี่ยวข้องก็จะยิ่งต่ำ ดังนั้น การขอรายงานสรุปเป็นครั้งคราวจะช่วยให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น (ดีกว่า)

การขอรายงานสรุปน้อยลงจะทำให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น
การขอรายงานสรุปน้อยลงจะทําให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น

ต่อไปนี้เป็นตัวอย่างที่แสดงให้เห็น

  • หากคุณขอรายงานสรุปรายชั่วโมงในช่วง 24 ชั่วโมง แล้วรวมค่าสรุปจากรายงานรายชั่วโมงแต่ละฉบับเพื่อเข้าถึงข้อมูลระดับวัน ระบบจะเพิ่มสัญญาณรบกวน 24 ครั้ง
  • ในรายงานสรุปรายวัน 1 ฉบับ ระบบจะเพิ่มสัญญาณรบกวนเพียงครั้งเดียว

ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำ

ยิ่งค่า epsilon สูง สัญญาณรบกวนก็จะยิ่งต่ำลง และการคุ้มครองความเป็นส่วนตัวก็จะยิ่งต่ำลงด้วย

ใช้ประโยชน์จากการกรองและการกรองข้อมูลที่ซ้ำกันออก

สิ่งสำคัญในการกําหนดงบประมาณระหว่างคีย์ต่างๆ คือการทำความเข้าใจจํานวนครั้งที่เหตุการณ์หนึ่งๆ อาจเกิดขึ้น เช่น ผู้ลงโฆษณาอาจสนใจเฉพาะการซื้อ 1 ครั้งต่อการคลิกแต่ละครั้ง แต่อาจสนใจ Conversion "การดูหน้าผลิตภัณฑ์" สูงสุด 3 รายการ หากต้องการรองรับกรณีการใช้งานเหล่านี้ คุณอาจต้องใช้ฟีเจอร์ API ต่อไปนี้ด้วย ซึ่งจะช่วยให้คุณควบคุมจํานวนรายงานที่สร้างขึ้นและ Conversion ที่นับได้

การทดสอบกับ epsilon

เทคโนโลยีโฆษณาสามารถตั้งค่า epsilon เป็นค่าที่มากกว่า 0 และไม่เกิน 64 ช่วงนี้ช่วยให้การทดสอบมีความยืดหยุ่น ค่า epsilon ที่ต่ำลงจะให้การคุ้มครองความเป็นส่วนตัวมากขึ้น เราขอแนะนำให้เริ่มต้นด้วย epsilon=10

คําแนะนําในการทดสอบ

เราขอแนะนําให้ทําดังนี้

  • เริ่มต้นด้วย epsilon = 10
  • ในกรณีที่ปัญหานี้ทําให้เกิดปัญหาด้านยูทิลิตีที่เห็นได้ชัด ให้เพิ่ม epsilon ทีละน้อย
  • แชร์ความคิดเห็นเกี่ยวกับจุดเปลี่ยนแปลงที่เฉพาะเจาะจงที่คุณอาจพบเกี่ยวกับความสามารถในการใช้งานข้อมูล

มีส่วนร่วมและแชร์ความคิดเห็น

คุณสามารถเข้าร่วมและทดสอบกับ API นี้

ขั้นตอนถัดไป