Noiselab

เกี่ยวกับเอกสารนี้

การอ่านเอกสารนี้จะช่วยให้คุณทำสิ่งต่อไปนี้ได้

  • ทําความเข้าใจว่าควรสร้างกลยุทธ์ใดก่อนสร้างรายงานสรุป
  • พบกับ Noise Lab ซึ่งเป็นเครื่องมือที่ช่วยให้เห็นผลของพารามิเตอร์ต่างๆ ของเสียงรบกวน และช่วยให้สำรวจและประเมินกลยุทธ์การจัดการเสียงรบกวนต่างๆ ได้อย่างรวดเร็ว
ภาพหน้าจอของ Noise Lab
Noise Lab

แชร์ความคิดเห็น

แม้ว่าเอกสารนี้จะสรุปหลักการบางส่วนสำหรับใช้กับรายงานสรุป แต่ก็มีแนวทางการจัดการสัญญาณรบกวนหลายวิธีที่ไม่ได้แสดงในเอกสารนี้ เรายินดีรับฟังคำแนะนำ ข้อมูลเพิ่มเติม และคำถามของคุณ

  • หากต้องการแสดงความคิดเห็นต่อสาธารณะเกี่ยวกับกลยุทธ์การจัดการเสียงรบกวน ประโยชน์หรือความเป็นส่วนตัวของ API (epsilon) และแชร์สิ่งที่สังเกตเห็นเมื่อจำลองด้วย Noise Lab ให้แสดงความคิดเห็นเกี่ยวกับปัญหานี้
  • หากต้องการแสดงความคิดเห็นแบบสาธารณะเกี่ยวกับ Noise Lab (ถามคําถาม รายงานข้อบกพร่อง ขอฟีเจอร์) ให้สร้างปัญหาใหม่ที่นี่
  • หากต้องการแสดงความคิดเห็นแบบสาธารณะเกี่ยวกับแง่มุมอื่นๆ ของ API ให้สร้างปัญหาใหม่ที่นี่

ก่อนจะเริ่ม

  1. อ่านการรายงานการระบุแหล่งที่มา: รายงานสรุปและภาพรวมระบบการรายงานการระบุแหล่งที่มาแบบสมบูรณ์เพื่อดูข้อมูลเบื้องต้น
  2. อ่านการทำความเข้าใจสัญญาณรบกวนและการทำความเข้าใจคีย์การรวมเพื่อให้ใช้คู่มือนี้ได้อย่างคุ้มค่าที่สุด

การตัดสินใจเกี่ยวกับการออกแบบ

หลักการออกแบบหลัก

คุกกี้ของบุคคลที่สามและรายงานสรุปทํางานแตกต่างกันโดยพื้นฐาน ความแตกต่างที่สําคัญอย่างหนึ่งคือสัญญาณรบกวนที่เพิ่มลงในข้อมูลการวัดในรายงานสรุป อีกอย่างหนึ่งคือวิธีตั้งเวลารายงาน

หากต้องการเข้าถึงข้อมูลการวัดผลของรายงานสรุปที่มีอัตราส่วนสัญญาณต่อสัญญาณรบกวนสูงขึ้น แพลตฟอร์มฝั่งดีมานด์ (DSP) และผู้ให้บริการวัดผลโฆษณาจะต้องทํางานร่วมกับผู้ลงโฆษณาเพื่อพัฒนากลยุทธ์การจัดการสัญญาณรบกวน DSP และผู้ให้บริการการวัดผลต้องตัดสินใจเกี่ยวกับการออกแบบเพื่อพัฒนากลยุทธ์เหล่านี้ การตัดสินใจเหล่านี้เกี่ยวข้องกับแนวคิดสําคัญข้อหนึ่ง

แม้ว่าค่าสัญญาณรบกวนของข้อมูลประชากรจะมาจากพารามิเตอร์เพียง 2 รายการเท่านั้น⏤epsilon และงบประมาณการมีส่วนร่วม⏤แต่คุณก็ยังมีการควบคุมอื่นๆ อีกหลายอย่างที่จะส่งผลต่ออัตราส่วนสัญญาณต่อสัญญาณรบกวนของข้อมูลการวัดผลเอาต์พุต

แม้ว่าเราคาดหวังว่ากระบวนการที่ต้องทำซ้ำๆ จะนำไปสู่การตัดสินใจที่ดีที่สุด แต่รูปแบบการตัดสินใจแต่ละรูปแบบจะนำไปสู่การใช้งานที่แตกต่างกันเล็กน้อย ดังนั้นจึงต้องตัดสินใจก่อนเขียนการเขียนโค้ดซ้ำแต่ละครั้ง (และก่อนแสดงโฆษณา)

การตัดสินใจ: รายละเอียดของมิติข้อมูล

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหาข้อมูล Conversion ของคุณ
  3. ดูพารามิเตอร์เริ่มต้น โดยค่าเริ่มต้น จํานวน Conversion ที่มีการระบุแหล่งที่มาทั้งหมดประจําวันคือ 1, 000 ซึ่งมีค่าเฉลี่ยประมาณ 40 รายการต่อที่เก็บข้อมูล 1 รายการหากคุณใช้การตั้งค่าเริ่มต้น (มิติข้อมูลเริ่มต้น จํานวนค่าเริ่มต้นที่แตกต่างกันที่เป็นไปได้สําหรับมิติข้อมูลแต่ละรายการ กลยุทธ์สําคัญ ก) โปรดทราบว่าค่าคือ 40 ในจํานวน Conversion ที่เกิดจากแหล่งที่มาเฉลี่ยรายวันต่อการใส่ข้อมูล 1 กลุ่ม
  4. คลิก "จําลอง" เพื่อเรียกใช้การจําลองด้วยพารามิเตอร์เริ่มต้น
  5. ในแผงด้านข้างของพารามิเตอร์ ให้มองหามิติข้อมูล เปลี่ยนชื่อภูมิศาสตร์เป็นเมือง และเปลี่ยนจํานวนค่าที่แตกต่างกันที่เป็นไปได้เป็น 50
  6. ดูว่าการเปลี่ยนแปลงนี้ส่งผลต่อจํานวน Conversion ที่เกิดจากแหล่งที่มาเฉลี่ยรายวันต่อกลุ่มอย่างไร ตอนนี้มีจำนวนลดลงอย่างมาก เนื่องจากหากคุณเพิ่มจํานวนค่าที่เป็นไปได้ภายในมิติข้อมูลนี้โดยไม่เปลี่ยนแปลงสิ่งอื่นใด จะเป็นการเพิ่มจํานวนกลุ่มทั้งหมดโดยไม่เปลี่ยนแปลงจํานวนเหตุการณ์ Conversion ที่จะเกิดขึ้นในแต่ละกลุ่ม
  7. คลิก "จำลอง"
  8. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้ อัตราส่วนสัญญาณรบกวนตอนนี้สูงกว่าการจําลองครั้งก่อน

เมื่อพิจารณาจากหลักการสําคัญในการออกแบบ ค่าสรุปขนาดเล็กมีแนวโน้มที่จะมีความผันผวนมากกว่าค่าสรุปขนาดใหญ่ ดังนั้น ตัวเลือกการกําหนดค่าจึงส่งผลต่อจํานวนเหตุการณ์ Conversion ที่ระบุแหล่งที่มาซึ่งจะปรากฏในแต่ละที่เก็บข้อมูล (หรือที่เรียกว่าคีย์การรวมข้อมูล) และจํานวนดังกล่าวจะส่งผลต่อสัญญาณรบกวนในรายงานสรุปเอาต์พุตสุดท้าย

การตัดสินใจด้านการออกแบบอย่างหนึ่งที่ส่งผลต่อจํานวนเหตุการณ์ Conversion ที่ระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือความละเอียดของมิติข้อมูล ลองดูตัวอย่างคีย์การรวมและมิติข้อมูลของคีย์ต่อไปนี้

  • แนวทางที่ 1: โครงสร้างคีย์เดียวที่มีมิติข้อมูลแบบหยาบ ได้แก่ ประเทศ x แคมเปญโฆษณา (หรือที่เก็บรวบรวมข้อมูลแคมเปญที่ใหญ่ที่สุด) x ประเภทผลิตภัณฑ์ (จากประเภทผลิตภัณฑ์ที่เป็นไปได้ 10 ประเภท)
  • แนวทางที่ 2: โครงสร้างคีย์เดียวที่มีมิติข้อมูลแบบละเอียด: เมือง x รหัสครีเอทีฟโฆษณา x ผลิตภัณฑ์ (จากผลิตภัณฑ์ที่เป็นไปได้ 100 รายการ)

เมืองเป็นมิติข้อมูลที่ละเอียดกว่าประเทศ รหัสครีเอทีฟโฆษณาเป็นมิติข้อมูลที่ละเอียดกว่าแคมเปญ และผลิตภัณฑ์เป็นมิติข้อมูลที่ละเอียดกว่าประเภทผลิตภัณฑ์ ดังนั้น แนวทางที่ 2 จะมีจํานวนเหตุการณ์ (Conversion) ต่อที่เก็บข้อมูล (= ต่อคีย์) น้อยกว่าในเอาต์พุตรายงานสรุปเมื่อเทียบกับแนวทางที่ 1 เนื่องจากสัญญาณรบกวนซึ่งเพิ่มลงในเอาต์พุตไม่เกี่ยวข้องกับจํานวนเหตุการณ์ในที่เก็บข้อมูล ข้อมูลการวัดในรายงานสรุปจึงจะมีสัญญาณรบกวนมากกว่าเมื่อใช้แนวทางที่ 2 สําหรับผู้ลงโฆษณาแต่ละราย ให้ทดสอบการประนีประนอมระดับรายละเอียดต่างๆ ในการออกแบบคีย์เพื่อให้ได้ผลลัพธ์สูงสุด

การตัดสินใจ: โครงสร้างหลัก

ในโหมดง่าย ระบบจะใช้โครงสร้างคีย์เริ่มต้น ในโหมดขั้นสูง คุณจะทดสอบโครงสร้างคีย์ต่างๆ ได้ ระบบจะรวมมิติข้อมูลตัวอย่างบางส่วนไว้ด้วย ซึ่งคุณก็แก้ไขได้เช่นกัน

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์สําคัญ สังเกตว่ากลยุทธ์เริ่มต้นชื่อ A ในเครื่องมือใช้โครงสร้างคีย์แบบละเอียด 1 รายการซึ่งมีมิติข้อมูลทั้งหมด ได้แก่ ภูมิศาสตร์ x รหัสแคมเปญ x หมวดหมู่ผลิตภัณฑ์
  3. คลิก "จำลอง"
  4. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้
  5. เปลี่ยนกลยุทธ์หลักเป็น B ซึ่งจะแสดงการควบคุมเพิ่มเติมให้คุณกําหนดค่าโครงสร้างคีย์
  6. กำหนดค่าโครงสร้างคีย์ เช่น ดังนี้
    1. จํานวนโครงสร้างคีย์: 2
    2. โครงสร้างคีย์ 1 = ภูมิศาสตร์ x หมวดหมู่ผลิตภัณฑ์
    3. โครงสร้างคีย์ 2 = รหัสแคมเปญ x หมวดหมู่ผลิตภัณฑ์
  7. คลิก "จำลอง"
  8. โปรดทราบว่าตอนนี้คุณจะได้รับรายงานสรุป 2 ฉบับต่อประเภทเป้าหมายการวัด (2 ฉบับสําหรับจํานวนการซื้อ 2 ฉบับสําหรับมูลค่าการซื้อ) ในกรณีที่คุณใช้โครงสร้างคีย์ที่แตกต่างกัน 2 รายการ ดูอัตราส่วนสัญญาณรบกวน
  9. นอกจากนี้ คุณยังลองใช้กับมิติข้อมูลที่กำหนดเองของคุณเองได้ด้วย โดยค้นหาข้อมูลที่ต้องการติดตาม: มิติข้อมูล ลองนํามิติข้อมูลตัวอย่างออก แล้วสร้างมิติข้อมูลของคุณเองโดยใช้ปุ่มเพิ่ม/นําออก/รีเซ็ตใต้มิติข้อมูลล่าสุด

อีกทางเลือกในการออกแบบที่จะส่งผลต่อจํานวนเหตุการณ์ Conversion ที่มีการระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือโครงสร้างคีย์ที่คุณเลือกที่จะใช้ ลองดูตัวอย่างคีย์การรวมต่อไปนี้

  • โครงสร้างคีย์ 1 รายการที่มีมิติข้อมูลทั้งหมด เรียกว่ากลยุทธ์คีย์ ก
  • โครงสร้างสําคัญ 2 รายการ โดยแต่ละรายการมีมิติข้อมูลชุดย่อย เรียกกลยุทธ์นี้ว่า กลยุทธ์สําคัญ ข
แผนภาพ

กลยุทธ์ ก. นั้นง่ายกว่า แต่คุณอาจต้องรวม (หาผลรวม) ค่าสรุปที่มีรายละเอียดมากซึ่งรวมอยู่ในรายงานสรุปเพื่อเข้าถึงข้อมูลเชิงลึกบางอย่าง การรวมค่าเหล่านี้จะรวมสัญญาณรบกวนด้วย เมื่อใช้กลยุทธ์ ข. ค่าสรุปที่แสดงในรายงานสรุปอาจให้ข้อมูลที่คุณต้องการอยู่แล้ว ซึ่งหมายความว่ากลยุทธ์ ข. มีแนวโน้มที่จะให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนดีกว่ากลยุทธ์ ก. อย่างไรก็ตาม กลยุทธ์ ก อาจยอมรับสัญญาณรบกวนอยู่แล้ว คุณจึงอาจยังเลือกที่จะใช้กลยุทธ์ ก เพื่อความสะดวก ดูข้อมูลเพิ่มเติมในตัวอย่างโดยละเอียดที่อธิบายกลยุทธ์ทั้ง 2 นี้

การจัดการคีย์เป็นหัวข้อที่ละเอียด คุณอาจพิจารณาใช้เทคนิคที่ซับซ้อนหลายอย่างเพื่อปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน 1 รายการอธิบายไว้ในการจัดการคีย์ขั้นสูง

การตัดสินใจ: ความถี่ในการแบ่งกลุ่ม

  1. ไปที่โหมดง่าย (หรือโหมดขั้นสูง ซึ่งทั้ง 2 โหมดทำงานในลักษณะเดียวกันเมื่อพูดถึงความถี่ของกลุ่ม)
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวม > ความถี่การรวมกลุ่ม หมายถึงความถี่ในการรวมกลุ่มของรายงานที่รวบรวมข้อมูลได้ซึ่งประมวลผลด้วยบริการรวบรวมข้อมูลในงานเดียว
  3. ดูความถี่การแบ่งกลุ่มเริ่มต้น: ระบบจะจําลองความถี่การแบ่งกลุ่มเป็นรายวันโดยค่าเริ่มต้น
  4. คลิก "จำลอง"
  5. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้
  6. เปลี่ยนความถี่การแบ่งกลุ่มเป็นรายสัปดาห์
  7. ดูอัตราส่วนสัญญาณรบกวนของผลการจําลอง: ตอนนี้อัตราส่วนสัญญาณรบกวนลดลง (ดีกว่า) จากการจําลองครั้งก่อน

อีกทางเลือกในการออกแบบที่จะส่งผลต่อจํานวนเหตุการณ์ Conversion ที่ระบุแหล่งที่มาภายในที่เก็บข้อมูลเดียวคือความถี่การรวมกลุ่มที่คุณเลือกที่จะใช้ ความถี่การรวมกลุ่มคือความถี่ที่คุณประมวลผลรายงานที่รวบรวมได้

รายงานที่ตั้งเวลาให้รวบรวมข้อมูลบ่อยขึ้น (เช่น ทุกชั่วโมง) จะมีเหตุการณ์ Conversion รวมอยู่น้อยกว่ารายงานเดียวกันที่มีกําหนดเวลาการรวบรวมข้อมูลน้อยลง (เช่น ทุกสัปดาห์) ด้วยเหตุนี้ รายงานรายชั่วโมงจึงจะมีข้อมูลรบกวนมากกว่า รวมถึงรวมเหตุการณ์ Conversion น้อยกว่ารายงานเดียวกันที่มีกําหนดเวลาการรวบรวมข้อมูลน้อยลง (เช่น แต่ละสัปดาห์) ด้วยเหตุนี้ รายงานรายชั่วโมงจึงมีอัตราส่วนสัญญาณต่อสัญญาณรบกวนต่ำกว่ารายงานรายสัปดาห์เมื่อปัจจัยอื่นๆ เท่ากัน ทดสอบข้อกำหนดในการรายงานที่ความถี่ต่างๆ และประเมินอัตราส่วนสัญญาณต่อสัญญาณรบกวนของแต่ละรายการ

ดูข้อมูลเพิ่มเติมในการรวมและการรวมข้อมูลในระยะเวลาที่นานขึ้น

การตัดสินใจ: ตัวแปรของแคมเปญที่ส่งผลต่อ Conversion ที่มีการระบุแหล่งที่มา

แม้ว่าการคาดการณ์นี้จะทำได้ยากและอาจมีความผันผวนอย่างมากนอกเหนือจากผลกระทบตามฤดูกาล แต่ให้ลองประมาณจํานวน Conversion จากการสัมผัสครั้งเดียวที่ระบุแหล่งที่มาได้ประจําวันเป็นจํานวนเต็มของ 10 ที่ใกล้ที่สุด เช่น 10, 100, 1,000 หรือ 10,000

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหาข้อมูล Conversion ของคุณ
  3. ดูพารามิเตอร์เริ่มต้น โดยค่าเริ่มต้น จํานวน Conversion ที่มีการระบุแหล่งที่มาทั้งหมดประจําวันคือ 1, 000 ซึ่งมีค่าเฉลี่ยประมาณ 40 รายการต่อที่เก็บข้อมูล 1 รายการหากคุณใช้การตั้งค่าเริ่มต้น (มิติข้อมูลเริ่มต้น จํานวนค่าเริ่มต้นที่แตกต่างกันที่เป็นไปได้สําหรับมิติข้อมูลแต่ละรายการ กลยุทธ์สําคัญ ก) โปรดทราบว่าค่าคือ 40 ในจํานวน Conversion ที่เกิดจากแหล่งที่มาเฉลี่ยรายวันต่อการใส่ข้อมูล 1 กลุ่ม
  4. คลิก "จําลอง" เพื่อเรียกใช้การจําลองด้วยพารามิเตอร์เริ่มต้น
  5. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้
  6. ตอนนี้ให้ตั้งค่าจํานวน Conversion ทั้งหมดที่ระบุแหล่งที่มาได้ประจําวันเป็น 100 โปรดทราบว่าการดําเนินการนี้จะลดค่าจํานวน Conversion เฉลี่ยรายวันที่ระบุแหล่งที่มาต่อที่เก็บข้อมูล
  7. คลิก "จำลอง"
  8. โปรดทราบว่าตอนนี้อัตราส่วนสัญญาณรบกวนสูงขึ้น เนื่องจากเมื่อคุณมี Conversion ต่อที่เก็บข้อมูลน้อยลง ระบบจะใช้สัญญาณรบกวนมากขึ้นเพื่อรักษาความเป็นส่วนตัว

สิ่งที่สําคัญในการแยกความแตกต่างคือจํานวน Conversion ที่เป็นไปได้ทั้งหมดสําหรับผู้ลงโฆษณา เทียบกับจํานวน Conversion ที่เป็นไปได้ทั้งหมดซึ่งมีการระบุแหล่งที่มา รายงานสรุปสุดท้ายจะได้รับผลกระทบจากปัจจัยหลัง Conversion ที่มีการระบุแหล่งที่มาคือกลุ่มย่อยของ Conversion ทั้งหมดที่มีแนวโน้มจะได้รับผลกระทบจากตัวแปรของแคมเปญ เช่น งบประมาณโฆษณาและการกําหนดเป้าหมายโฆษณา ตัวอย่างเช่น คุณควรคาดหวังว่าแคมเปญโฆษณามูลค่า 300 ล้านบาทจะมีจํานวน Conversion ที่มีการระบุแหล่งที่มามากกว่าแคมเปญโฆษณามูลค่า 30,000 บาท หากปัจจัยอื่นๆ เท่ากัน

สิ่งที่จะต้องพิจารณามีดังนี้

  • ประเมิน Conversion ที่มีการระบุแหล่งที่มาเทียบกับรูปแบบการระบุแหล่งที่มาแบบสัมผัสเดียวจากอุปกรณ์เดียวกัน เนื่องจากข้อมูลเหล่านี้อยู่ในขอบเขตของรายงานสรุปที่รวบรวมด้วย Attribution Reporting API
  • พิจารณาทั้งจํานวนเหตุการณ์ที่เลวร้ายที่สุดและจํานวนเหตุการณ์ที่ดีที่สุดสําหรับ Conversion ที่มีการระบุแหล่งที่มา ตัวอย่างเช่น เมื่อพิจารณาปัจจัยอื่นๆ เท่าๆ กัน ให้พิจารณางบประมาณแคมเปญขั้นต่ำและสูงสุดที่เป็นไปได้สําหรับผู้ลงโฆษณา จากนั้นคาดการณ์ Conversion ที่ระบุแหล่งที่มาสําหรับทั้ง 2 ผลลัพธ์เป็นข้อมูลสําหรับการจําลอง
  • หากคุณพิจารณาใช้ Privacy Sandbox ของ Android ให้พิจารณา Conversion ที่มีการระบุแหล่งที่มาแบบข้ามแพลตฟอร์มในการคำนวณ

การตัดสินใจ: การใช้การปรับขนาด

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวมข้อมูล > การปรับขนาด ซึ่งค่าเริ่มต้นคือ "ใช่"
  3. หากต้องการทำความเข้าใจผลดีของการลดขนาดต่ออัตราส่วนสัญญาณรบกวน ให้ตั้งค่า "การลดขนาด" เป็น "ไม่" ก่อน
  4. คลิก "จำลอง"
  5. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้
  6. ตั้งค่าการปรับขนาดเป็น "ใช่" โปรดทราบว่า Noise Lab จะคํานวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติโดยอิงตามช่วง (ค่าเฉลี่ยและค่าสูงสุด) ของเป้าหมายการวัดสําหรับสถานการณ์ของคุณ ในระบบจริงหรือการตั้งค่าการทดลองใช้ต้นทาง คุณควรใช้การคำนวณปัจจัยการปรับขนาดของคุณเอง
  7. คลิก "จำลอง"
  8. โปรดสังเกตว่าอัตราส่วนสัญญาณรบกวนลดลง (ดีกว่า) ในการจําลองครั้งที่ 2 นี้ เนื่องจากคุณใช้การปรับขนาด

เมื่อมีหลักการสําคัญในการออกแบบ สัญญาณรบกวนที่จะเพิ่มจะขึ้นอยู่กับงบประมาณการมีส่วนร่วม

ดังนั้น หากต้องการเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน คุณอาจเลือกเปลี่ยนรูปแบบค่าที่รวบรวมระหว่างเหตุการณ์ Conversion โดยปรับขนาดเทียบกับงบประมาณการมีส่วนร่วม (และปรับขนาดออกหลังจากการรวมข้อมูล) ใช้การปรับขนาดเพื่อเพิ่มอัตราส่วนสัญญาณต่อสัญญาณรบกวน

การตัดสินใจ: จํานวนเป้าหมายการวัดผลและการแบ่งงบประมาณด้านความเป็นส่วนตัว

การดำเนินการนี้เกี่ยวข้องกับการปรับขนาด โปรดอ่านการใช้การปรับขนาด

เป้าหมายการวัดคือจุดข้อมูลที่แยกต่างหากซึ่งรวบรวมในเหตุการณ์ Conversion

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหาข้อมูลที่คุณต้องการติดตาม ซึ่งได้แก่ เป้าหมายการวัดผล โดยค่าเริ่มต้น คุณจะมีเป้าหมายการวัดผล 2 รายการ ได้แก่ มูลค่าการซื้อและจํานวนการซื้อ
  3. คลิก "จําลอง" เพื่อเรียกใช้การจําลองที่มีเป้าหมายเริ่มต้น
  4. คลิก "นำออก" ซึ่งจะนําเป้าหมายการวัดผลล่าสุดออก (จํานวนการซื้อในกรณีนี้)
  5. คลิก "จำลอง"
  6. โปรดสังเกตว่าตอนนี้อัตราส่วนสัญญาณรบกวนสำหรับมูลค่าการซื้อลดลง (ดีกว่า) ในการจําลองครั้งที่ 2 นี้ เนื่องจากคุณมีเป้าหมายการวัดผลน้อยกว่า ตอนนี้เป้าหมายการวัดผลรายการเดียวจึงได้รับงบประมาณการมีส่วนร่วมทั้งหมด
  7. คลิก "รีเซ็ต" ตอนนี้คุณมีเป้าหมายการวัดผล 2 รายการ ได้แก่ มูลค่าการซื้อและจํานวนการซื้อ โปรดทราบว่า Noise Lab จะคํานวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติตามช่วง (ค่าเฉลี่ยและค่าสูงสุด) ของเป้าหมายการวัดสําหรับสถานการณ์ของคุณ โดยค่าเริ่มต้น Noise Lab จะแบ่งงบประมาณเท่าๆ กันให้กับเป้าหมายการวัดผล
  8. คลิก "จำลอง"
  9. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้ จดบันทึกตัวคูณการปรับขนาดที่แสดงในการจําลอง
  10. ทีนี้มาปรับแต่งการแยกงบประมาณความเป็นส่วนตัวเพื่อให้ได้อัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดียิ่งขึ้น
  11. ปรับเปอร์เซ็นต์งบประมาณที่กำหนดไว้สำหรับเป้าหมายการวัดผลแต่ละรายการ เมื่อพิจารณาจากพารามิเตอร์เริ่มต้น เป้าหมายการวัด 1 ซึ่งเป็นมูลค่าการซื้อจะมีช่วงกว้างกว่ามาก (ระหว่าง 0 ถึง 1,000) เมื่อเทียบกับเป้าหมายการวัด 2 ซึ่งเป็นจํานวนการซื้อ (ระหว่าง 1 ถึง 1 กล่าวคือเท่ากับ 1 เสมอ) ด้วยเหตุนี้ จึงต้องมี "พื้นที่ในการปรับขนาดมากขึ้น": การกำหนดงบประมาณการมีส่วนร่วมให้กับเป้าหมายการวัด 1 มากกว่าเป้าหมายการวัด 2 จึงเป็นตัวเลือกที่เหมาะสม เพื่อให้ปรับขนาดได้อย่างมีประสิทธิภาพมากขึ้น (ดูการปรับขนาด) และด้วยเหตุนี้
  12. กําหนดงบประมาณ 70% ให้กับเป้าหมายการวัดผล 1 กําหนด 30% ให้กับเป้าหมายการวัดผล 2
  13. คลิก "จำลอง"
  14. ดูอัตราส่วนสัญญาณรบกวนของการจําลองที่ได้ สําหรับมูลค่าการซื้อ ตอนนี้อัตราส่วนสัญญาณรบกวนลดลงอย่างมาก (ดีกว่า) เมื่อเทียบกับการจําลองครั้งก่อน สําหรับจํานวนการซื้อ ตัวเลขเหล่านี้แทบไม่เปลี่ยนแปลง
  15. ปรับการแบ่งงบประมาณตามเมตริกต่างๆ ต่อไป ดูว่าการตั้งค่านี้ส่งผลต่อเสียงรบกวนอย่างไร

โปรดทราบว่าคุณสามารถตั้งค่าเป้าหมายการวัดที่กําหนดเองได้โดยใช้ปุ่มเพิ่ม/นําออก/รีเซ็ต


หากคุณวัดจุดข้อมูล 1 จุด (เป้าหมายการวัด) ในเหตุการณ์ Conversion เช่น จํานวน Conversion จุดข้อมูลนั้นจะได้รับงบประมาณการมีส่วนร่วมทั้งหมด (65536) หากคุณตั้งเป้าหมายการวัดผลหลายรายการในเหตุการณ์ Conversion เช่น จํานวน Conversion และมูลค่าการซื้อ จุดข้อมูลเหล่านั้นจะต้องใช้งบประมาณการมีส่วนร่วมร่วมกัน ซึ่งหมายความว่าคุณจะมีขอบเขตในการเพิ่มมูลค่าน้อยลง

ดังนั้น ยิ่งคุณมีเป้าหมายการวัดผลมากเท่าใด อัตราส่วนสัญญาณต่อสัญญาณรบกวนก็ยิ่งมีแนวโน้มที่จะต่ำลง (สัญญาณรบกวนสูงขึ้น)

อีกการตัดสินใจหนึ่งเกี่ยวกับเป้าหมายการวัดผลคือการแยกงบประมาณ หากคุณแบ่งงบประมาณการมีส่วนร่วมเท่าๆ กันระหว่างจุดข้อมูล 2 จุด จุดข้อมูลแต่ละจุดจะได้รับงบประมาณ 65536/2 = 32768 ซึ่งอาจเหมาะหรือไม่เหมาะก็ได้ ทั้งนี้ขึ้นอยู่กับค่าสูงสุดที่เป็นไปได้ของจุดข้อมูลแต่ละจุด ตัวอย่างเช่น หากคุณกําลังวัดจํานวนการซื้อที่มีค่าสูงสุด 1 และมูลค่าการซื้อที่มีค่าต่ำสุด 1 และสูงสุด 120 มูลค่าการซื้อจะได้รับประโยชน์จากการมี "พื้นที่มากขึ้น" เพื่อปรับขนาด ซึ่งก็คือการได้รับสัดส่วนงบประมาณการมีส่วนร่วมมากขึ้น คุณจะเห็นได้ว่าควรให้ความสําคัญกับเป้าหมายการวัดผลบางรายการมากกว่าเป้าหมายอื่นๆ หรือไม่ โดยพิจารณาจากผลกระทบของปัจจัยภายนอก

การตัดสินใจ: การจัดการค่าผิดปกติ

เป้าหมายการวัดคือจุดข้อมูลที่แยกต่างหากซึ่งรวบรวมในเหตุการณ์ Conversion

  1. ไปที่โหมดขั้นสูง
  2. ในแผงด้านข้างของพารามิเตอร์ ให้มองหากลยุทธ์การรวมข้อมูล > การปรับขนาด
  3. ตรวจสอบว่าได้ตั้งค่าการปรับขนาดเป็น "ใช่" โปรดทราบว่า Noise Lab จะคํานวณปัจจัยการปรับขนาดที่จะใช้โดยอัตโนมัติ โดยอิงตามช่วง (ค่าเฉลี่ยและค่าสูงสุด) ที่คุณระบุไว้สําหรับเป้าหมายการวัด
  4. สมมติว่าการซื้อครั้งใหญ่ที่สุดที่เคยเกิดขึ้นคือ $2, 000 แต่การซื้อส่วนใหญ่เกิดขึ้นในช่วง $10-$120 ก่อนอื่น มาดูกันว่าจะเกิดอะไรขึ้นหากเราใช้วิธีการปรับขนาดตามตัวอักษร (ไม่แนะนํา) โดยป้อน $2000 เป็นค่าสูงสุดสําหรับ purchaseValue
  5. คลิก "จำลอง"
  6. สังเกตว่าอัตราส่วนสัญญาณรบกวนสูง เนื่องจากปัจจุบันเราคำนวณปัจจัยการปรับขนาดตามมูลค่า $2, 000 แต่มูลค่าการซื้อส่วนใหญ่จะต่ำกว่ามูลค่าดังกล่าวอย่างเห็นได้ชัด
  7. ตอนนี้มาลองใช้วิธีการปรับขนาดที่ใช้งานได้จริงกัน เปลี่ยนมูลค่าการซื้อสูงสุดเป็น $120
  8. คลิก "จำลอง"
  9. สังเกตว่าอัตราส่วนสัญญาณรบกวนลดลง (ดีกว่า) ในการจําลองครั้งที่ 2 นี้

หากต้องการใช้การปรับขนาด โดยทั่วไปคุณจะต้องคํานวณปัจจัยการปรับขนาดตามค่าสูงสุดที่เป็นไปได้สําหรับเหตุการณ์ Conversion หนึ่งๆ (ดูข้อมูลเพิ่มเติมในตัวอย่างนี้)

อย่างไรก็ตาม โปรดหลีกเลี่ยงการใช้ค่าสูงสุดตามตัวอักษรเพื่อคํานวณปัจจัยการปรับขนาดนั้น เนื่องจากจะทำให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนแย่ลง แต่ให้นําค่าที่ผิดปกติออกและใช้ค่าสูงสุดที่ใช้งานได้จริง

การจัดการค่าผิดปกติเป็นหัวข้อที่ละเอียด คุณอาจพิจารณาใช้เทคนิคที่ซับซ้อนหลายอย่างเพื่อปรับปรุงอัตราส่วนสัญญาณต่อสัญญาณรบกวน 1 รายการอธิบายไว้ในการจัดการค่าผิดปกติขั้นสูง

ขั้นตอนถัดไป

เมื่อประเมินกลยุทธ์การจัดการสัญญาณรบกวนต่างๆ สําหรับกรณีการใช้งานแล้ว คุณก็พร้อมที่จะเริ่มทดสอบรายงานสรุปด้วยการรวบรวมข้อมูลการวัดผลจริงผ่านการทดสอบต้นทาง อ่านคู่มือและเคล็ดลับเพื่อลองใช้ API

ภาคผนวก

Noise Lab ช่วยให้คุณประเมินและเปรียบเทียบกลยุทธ์การจัดการเสียงรบกวนอย่างรวดเร็ว โดยใช้เพื่อวัตถุประสงค์ต่อไปนี้

  • ทําความเข้าใจพารามิเตอร์หลักที่อาจส่งผลต่อสัญญาณรบกวน และผลที่ตามมา
  • จําลองผลกระทบของสัญญาณรบกวนต่อข้อมูลการวัดผลเอาต์พุตจากการตัดสินใจด้านการออกแบบที่แตกต่างกัน ปรับแต่งพารามิเตอร์การออกแบบจนกว่าคุณจะได้อัตราส่วนสัญญาณต่อสัญญาณรบกวนที่เหมาะสมกับกรณีการใช้งาน
  • แชร์ความคิดเห็นเกี่ยวกับประโยชน์ของรายงานสรุป เช่น ค่าพารามิเตอร์ epsilon และ noise ใดที่เหมาะกับคุณบ้าง จุดเปลี่ยนเว้าอยู่ตรงไหน

ให้คิดว่านี่เป็นขั้นตอนเตรียมความพร้อม ห้องทดลองเสียงจะสร้างข้อมูลการวัดเพื่อจําลองเอาต์พุตรายงานสรุปตามข้อมูลที่คุณป้อน โดยจะไม่เก็บหรือแชร์ข้อมูลใดๆ

ห้องทดลองเสียงมี 2 โหมด ได้แก่

  1. โหมดง่าย: ทำความเข้าใจพื้นฐานของการควบคุมที่มีเกี่ยวกับเสียงรบกวน
  2. โหมดขั้นสูง: ทดสอบกลยุทธ์การจัดการสัญญาณรบกวนต่างๆ และประเมินว่ากลยุทธ์ใดให้อัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดีที่สุดสำหรับ Use Case ของคุณ

คลิกปุ่มในเมนูด้านบนเพื่อสลับระหว่าง 2 โหมด (#1 ในภาพหน้าจอด้านล่าง)

โหมดง่าย
  • โหมดง่ายช่วยให้คุณควบคุมพารามิเตอร์ (ดูได้ที่ด้านซ้ายมือหรือ#2 ในภาพหน้าจอด้านล่าง) เช่น Epsilon และดูว่าพารามิเตอร์เหล่านี้ส่งผลต่อสัญญาณรบกวนอย่างไร
  • พารามิเตอร์แต่ละรายการจะมีเคล็ดลับเครื่องมือ (ปุ่ม "?") คลิกเพื่อดูคำอธิบายของพารามิเตอร์แต่ละรายการ (#3 ในภาพหน้าจอด้านล่าง)
  • ในการเริ่มต้น ให้คลิกปุ่ม "จําลอง" และดูลักษณะเอาต์พุต (#4 ในภาพหน้าจอด้านล่าง)
  • ในส่วนเอาต์พุต คุณจะเห็นรายละเอียดต่างๆ องค์ประกอบบางอย่างจะมีเครื่องหมาย "?" อยู่ข้างๆ โปรดสละเวลาคลิกเครื่องหมาย "?" แต่ละรายการเพื่อดูคำอธิบายข้อมูลต่างๆ
  • ภายในส่วนเอาต์พุต ให้คลิกปุ่มเปิด/ปิดรายละเอียดหากต้องการดูตารางเวอร์ชันขยาย (#5 ในภาพหน้าจอด้านล่าง)
  • ด้านล่างตารางข้อมูลแต่ละตารางในส่วนเอาต์พุตจะมีตัวเลือกให้ดาวน์โหลดตารางเพื่อใช้งานแบบออฟไลน์ นอกจากนี้ ที่มุมขวาล่างยังมีตัวเลือกให้ดาวน์โหลดตารางข้อมูลทั้งหมด (#6. ในภาพหน้าจอด้านล่าง)
  • ทดสอบการตั้งค่าต่างๆ สําหรับพารามิเตอร์ในส่วนพารามิเตอร์ แล้วคลิก "จําลอง" เพื่อดูว่าการตั้งค่าเหล่านั้นส่งผลต่อเอาต์พุตอย่างไร
    เสียงรบกวน
    อินเทอร์เฟซ Noise Lab สําหรับโหมดง่าย
โหมดขั้นสูง
  • ในโหมดขั้นสูง คุณจะควบคุมพารามิเตอร์ได้มากขึ้น คุณสามารถเพิ่มเป้าหมายการวัดและมิติข้อมูลที่กําหนดเองได้ (#1 และ #2 ในภาพหน้าจอด้านล่าง)
  • เลื่อนลงในส่วนพารามิเตอร์และดูตัวเลือกกลยุทธ์หลัก ซึ่งสามารถใช้ทดสอบโครงสร้างคีย์ต่างๆ ได้ (#3 ในภาพหน้าจอด้านล่าง)
    • หากต้องการทดสอบโครงสร้างคีย์ต่างๆ ให้เปลี่ยนกลยุทธ์คีย์เป็น "B"
    • ป้อนจํานวนโครงสร้างคีย์ที่แตกต่างกันที่ต้องการใช้ (ค่าเริ่มต้นคือ "2")
    • คลิกสร้างโครงสร้างคีย์
    • คุณจะเห็นตัวเลือกในการระบุโครงสร้างคีย์โดยคลิกช่องทําเครื่องหมายข้างคีย์ที่ต้องการรวมไว้ในโครงสร้างคีย์แต่ละรายการ
    • คลิก "จําลอง" เพื่อดูเอาต์พุต
      โหมดขั้นสูงมีการควบคุมเป้าหมายการวัดและมิติข้อมูลที่จะติดตาม ซึ่งไฮไลต์อยู่ในแถบด้านข้าง
      อินเทอร์เฟซ Noise Lab สำหรับโหมดขั้นสูง
      โหมดขั้นสูงยังมีตัวเลือกกลยุทธ์สําคัญในส่วนพารามิเตอร์ของแถบด้านข้างด้วย
      อินเทอร์เฟซของ Noise Lab สำหรับโหมดขั้นสูง

แนวคิดหลัก

ระบบจะเพิ่มเสียงรบกวนเพื่อปกป้องความเป็นส่วนตัวของผู้ใช้แต่ละราย

ค่าสัญญาณรบกวนสูงบ่งชี้ว่าที่เก็บข้อมูล/คีย์มีจำนวนน้อยและมีข้อมูลจากเหตุการณ์ที่มีความละเอียดอ่อนจํากัด ซึ่ง Noise Lab จะดำเนินการโดยอัตโนมัติเพื่อให้บุคคล "ซ่อนตัวอยู่ในฝูงชน" หรือกล่าวคือ ปกป้องความเป็นส่วนตัวของบุคคลเหล่านี้ด้วยการเพิ่มสัญญาณรบกวน

ค่าสัญญาณรบกวนต่ำบ่งชี้ว่าการตั้งค่าข้อมูลได้รับการออกแบบในลักษณะที่ช่วยให้บุคคล "ซ่อนตัวอยู่ในกลุ่ม" อยู่แล้ว ซึ่งหมายความว่าที่เก็บข้อมูลมีข้อมูลจากเหตุการณ์จํานวนมากพอที่จะปกป้องความเป็นส่วนตัวของผู้ใช้แต่ละราย

ข้อความนี้ใช้ได้กับทั้งข้อผิดพลาดเป็นเปอร์เซ็นต์เฉลี่ย (APE) และ RMSRE_T (ข้อผิดพลาดสัมพัทธ์แบบค่าเฉลี่ยความคลาดเคลื่อนกำลังสองที่มีเกณฑ์)

APE (ข้อผิดพลาดเฉลี่ยเป็นเปอร์เซ็นต์)

APE คืออัตราส่วนของสัญญาณรบกวนต่อสัญญาณ ซึ่งก็คือค่าสรุปจริงp> ค่า APE ที่ต่ำลงหมายถึงอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดียิ่งขึ้น

สูตร

สําหรับรายงานสรุปหนึ่งๆ APE จะคํานวณดังนี้

สมการของ APE ค่าต้องเป็นค่าสัมบูรณ์ เนื่องจากสัญญาณรบกวนอาจเป็นค่าลบได้

True คือค่าสรุปจริง APE คือค่าเฉลี่ยของสัญญาณรบกวนในแต่ละค่าสรุปจริง โดยคํานวณจากค่าทั้งหมดในรายงานสรุป ใน Noise Lab ระบบจะคูณค่านี้ด้วย 100 เพื่อให้เป็นเปอร์เซ็นต์

ข้อดีและข้อเสีย

กลุ่มที่มีขนาดเล็กจะมีผลต่อค่าสุดท้ายของ APE อย่างไม่สมส่วน ซึ่งอาจทำให้เข้าใจผิดเมื่อประเมินเสียงรบกวน ด้วยเหตุนี้ เราจึงเพิ่มเมตริก RMSRE_T อีกหนึ่งรายการที่ออกแบบมาเพื่อลดข้อจํากัดนี้ของ APE โปรดดูรายละเอียดในตัวอย่าง

รหัส

ตรวจสอบซอร์สโค้ดเพื่อหาการคํานวณ APE

RMSRE_T (ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองสัมพัทธ์ที่มีเกณฑ์)

RMSRE_T (ค่าเฉลี่ยความคลาดเคลื่อนกำลังสองสัมพัทธ์ที่มีเกณฑ์) คือการวัดเสียงรบกวนอีกวิธีหนึ่ง

วิธีตีความ RMSRE_T

ค่า RMSRE_T ที่ต่ำลงหมายถึงอัตราส่วนสัญญาณต่อสัญญาณรบกวนที่ดียิ่งขึ้น
ตัวอย่างเช่น หากอัตราส่วนสัญญาณรบกวนที่ยอมรับได้สำหรับกรณีการใช้งานของคุณคือ 20% และ RMSRE_T คือ 0.2 คุณจะมั่นใจได้ว่าระดับสัญญาณรบกวนอยู่ในช่วงที่ยอมรับได้

สูตร

สําหรับรายงานสรุปหนึ่งๆ RMSRE_T จะคํานวณดังนี้

สูตร
สมการสำหรับ RMSRE_T ค่าต้องเป็นค่าสัมบูรณ์ เนื่องจากสัญญาณรบกวนอาจเป็นค่าลบได้
ข้อดีและข้อเสีย

RMSRE_T มีความซับซ้อนกว่า APE เล็กน้อย อย่างไรก็ตาม เครื่องมือนี้มีข้อดีบางประการที่ทำให้เหมาะสําหรับการวิเคราะห์สัญญาณรบกวนในรายงานสรุปมากกว่า APE ในบางกรณี ดังนี้

  • RMSRE_T มีความเสถียรมากกว่า "T" คือเกณฑ์ "T" ใช้เพื่อลดน้ำหนักในการคำนวณ RMSRE_T ของกลุ่มที่มี Conversion น้อยกว่า และมีความไวต่อสัญญาณรบกวนมากกว่าเนื่องจากมีขนาดเล็ก เมื่อใช้ T เมตริกจะไม่เพิ่มขึ้นอย่างรวดเร็วในที่เก็บข้อมูลที่มี Conversion น้อย หาก T เท่ากับ 5 ค่าของสัญญาณรบกวนเพียง 1 ในที่เก็บที่มี Conversion 0 จะไม่แสดงเป็นมากกว่า 1 แต่จะมีขีดจํากัดสูงสุดที่ 0.2 ซึ่งเทียบเท่ากับ 1/5 เนื่องจาก T เท่ากับ 5 การให้น้ำหนักน้อยลงกับที่เก็บข้อมูลขนาดเล็กซึ่งจะไวต่อสัญญาณรบกวนมากกว่า ทําให้เมตริกนี้มีความเสถียรมากขึ้น และช่วยให้เปรียบเทียบการจําลอง 2 รายการได้ง่ายขึ้น
  • RMSRE_T ช่วยให้รวบรวมข้อมูลได้ง่าย การทราบ RMSRE_T ของที่เก็บข้อมูลหลายรายการพร้อมกับจํานวนจริงของที่เก็บข้อมูลเหล่านั้นจะช่วยให้คุณคํานวณ RMSRE_T ของผลรวมได้ นอกจากนี้ คุณยังเพิ่มประสิทธิภาพสําหรับ RMSRE_T สําหรับค่ารวมเหล่านี้ได้ด้วย

แม้ว่า APE จะรวมข้อมูลได้ แต่สูตรค่อนข้างซับซ้อนเนื่องจากเกี่ยวข้องกับค่าสัมบูรณ์ของผลรวมของสัญญาณรบกวน Laplace ซึ่งทำให้เพิ่มประสิทธิภาพ APE ได้ยากขึ้น

รหัส

ตรวจสอบซอร์สโค้ดสําหรับการคํานวณ RMSRE_T

ตัวอย่าง

รายงานสรุปที่มีกลุ่มเป้าหมาย 3 กลุ่ม ได้แก่

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

รายงานสรุปที่มีกลุ่มเป้าหมาย 3 กลุ่ม ได้แก่

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

รายงานสรุปที่มีกลุ่มเป้าหมาย 3 กลุ่ม ได้แก่

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + Infinity) / 3 = Infinity

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

DSP หรือบริษัทวัดผลโฆษณาอาจมีลูกค้าโฆษณาทั่วโลกหลายพันราย ซึ่งครอบคลุมหลายอุตสาหกรรม สกุลเงิน และโอกาสในการซื้อ ซึ่งหมายความว่าการสร้างและจัดการคีย์การรวมข้อมูล 1 คีย์ต่อผู้ลงโฆษณาอาจไม่เหมาะอย่างยิ่ง นอกจากนี้ การเลือกมูลค่าและงบประมาณการรวมสูงสุดที่รวบรวมได้ซึ่งสามารถจำกัดผลกระทบจากปัจจัยรบกวนของผู้ลงโฆษณาทั่วโลกหลายพันรายเหล่านี้ก็เป็นเรื่องยากเช่นกัน แต่ให้ลองพิจารณาสถานการณ์ต่อไปนี้แทน

กลยุทธ์สําคัญ ก

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจที่จะสร้างและจัดการคีย์เดียวให้กับลูกค้าโฆษณาทั้งหมด การซื้อของผู้ลงโฆษณาทุกรายและสกุลเงินทั้งหมดมีตั้งแต่การซื้อระดับสูงในปริมาณต่ำไปจนถึงการซื้อระดับต่ำในปริมาณสูง ซึ่งจะทำให้เกิดคีย์ต่อไปนี้

คีย์ (หลายสกุลเงิน)
ค่ารวมสูงสุด 5,000,000
ช่วงมูลค่าการซื้อ [120 - 5000000]
กลยุทธ์สําคัญ ข

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจที่จะสร้างและจัดการคีย์ 2 รายการในลูกค้าด้านโฆษณาทั้งหมด จึงตัดสินใจแยกคีย์ตามสกุลเงิน การซื้อของผู้ลงโฆษณาทุกรายและสกุลเงินทั้งหมดมีตั้งแต่การซื้อระดับสูงในปริมาณต่ำไปจนถึงการซื้อระดับต่ำในปริมาณสูง เมื่อแยกตามสกุลเงิน ระบบจะสร้างคีย์ 2 รายการดังนี้

กุญแจ 1 (USD) กุญแจ 2 (¥)
ค่ารวมสูงสุด $40,000 ¥5,000,000
ช่วงมูลค่าการซื้อ [120 - 40,000] [15,000 - 5,000,000]

กลยุทธ์สําคัญ ข จะมีผลลัพธ์ที่มีสัญญาณรบกวนน้อยกว่ากลยุทธ์สําคัญ ก เนื่องจากค่าสกุลเงินไม่ได้กระจายอย่างสม่ำเสมอในสกุลเงินต่างๆ ตัวอย่างเช่น ให้พิจารณาว่าการซื้อในสกุลเงิน ¥ ที่รวมอยู่กับการซื้อในสกุลเงิน USD จะเปลี่ยนแปลงข้อมูลพื้นฐานและเอาต์พุตที่มีสัญญาณรบกวนได้อย่างไร

กลยุทธ์สําคัญ ค.

ผู้ให้บริการเทคโนโลยีโฆษณาตัดสินใจที่จะสร้างและจัดการคีย์ 4 รายการในลูกค้าโฆษณาทั้งหมด และแยกคีย์ตามสกุลเงิน x อุตสาหกรรมของผู้ลงโฆษณา ดังนี้

รหัส 1
(USD x ผู้ลงโฆษณาเครื่องประดับระดับสูง)
รายการที่ 2
(¥ x ผู้ลงโฆษณาเครื่องประดับระดับสูง)
หลัก 3
(USD x ผู้ลงโฆษณาที่เป็นร้านค้าปลีกเสื้อผ้า)
รหัส 4
(¥ x ผู้ลงโฆษณาที่เป็นร้านค้าปลีกเสื้อผ้า)
ค่ารวมสูงสุด $40,000 ¥5,000,000 $500 ¥65,000
ช่วงมูลค่าการซื้อ [10,000 - 40,000] [1,250,000 - 5,000,000] [120 - 500] [15,000 - 65,000]

กลยุทธ์สําคัญ ค จะมีผลลัพธ์ที่มีสัญญาณรบกวนน้อยกว่ากลยุทธ์สําคัญ ข เนื่องจากมูลค่าการซื้อของผู้ลงโฆษณาไม่ได้กระจายอย่างสม่ำเสมอไปทั่วผู้ลงโฆษณา ตัวอย่างเช่น ลองพิจารณาว่าการซื้อเครื่องประดับระดับสูงที่รวมอยู่กับการซื้อหมวกเบสบอลจะเปลี่ยนแปลงข้อมูลพื้นฐานและเอาต์พุตที่เกิดจากสัญญาณรบกวนได้อย่างไร

ลองสร้างค่ารวมสูงสุดที่แชร์และปัจจัยการปรับขนาดที่แชร์สำหรับสิ่งที่เหมือนกันในผู้ลงโฆษณาหลายรายเพื่อลดสัญญาณรบกวนในเอาต์พุต เช่น คุณอาจทดสอบกลยุทธ์ต่างๆ ด้านล่างนี้สําหรับผู้ลงโฆษณา

  • กลยุทธ์ 1 รายการที่คั่นด้วยสกุลเงิน (USD, ¥, CAD ฯลฯ)
  • กลยุทธ์เดียวที่แยกตามอุตสาหกรรมของผู้ลงโฆษณา (ประกันภัย ยานยนต์ ค้าปลีก ฯลฯ)
  • กลยุทธ์เดียวที่คั่นด้วยช่วงมูลค่าการซื้อที่คล้ายกัน ([100], [1000], [10000] ฯลฯ)

การสร้างกลยุทธ์หลักเกี่ยวกับสิ่งที่ผู้ลงโฆษณามีเหมือนกันจะช่วยให้จัดการคีย์และโค้ดที่เกี่ยวข้องได้ง่ายขึ้น และอัตราส่วนสัญญาณต่อสัญญาณรบกวนก็จะสูงขึ้น ทดสอบกลยุทธ์ต่างๆ กับลักษณะที่เหมือนกันของผู้ลงโฆษณาแต่ละรายเพื่อค้นหาจุดเปลี่ยนแปลงของผลกระทบจากสัญญาณรบกวนสูงสุดเทียบกับการจัดการโค้ด


มาดูสถานการณ์ของผู้ลงโฆษณา 2 รายกัน

  • ผู้ลงโฆษณา ก:
    • ราคาซื้อที่เป็นไปได้สำหรับผลิตภัณฑ์ทั้งหมดในเว็บไซต์ของผู้ลงโฆษณา ก คือระหว่าง [$120 - $1,000] โดยมีช่วงราคาอยู่ที่ $880
    • ราคาซื้อกระจายอย่างสม่ำเสมอในช่วง $880 โดยไม่มีค่าผิดปกติที่อยู่นอกความเบี่ยงเบนมาตรฐาน 2 เท่าจากราคาซื้อมัธยฐาน
  • ผู้ลงโฆษณา ข:
    • ราคาซื้อที่เป็นไปได้สำหรับผลิตภัณฑ์ทั้งหมดในเว็บไซต์ของผู้ลงโฆษณา ข อยู่ระหว่าง [$120 - $1,000] โดยมีช่วงราคาอยู่ที่ $880
    • ราคาซื้อมีแนวโน้มสูงที่จะอยู่ในช่วง $120 - $500 โดยมีการซื้อเพียง 5% ที่เกิดขึ้นในช่วง $500 - $1,000

เมื่อพิจารณาจากข้อกําหนดด้านงบประมาณการมีส่วนร่วมและวิธีการใช้สัญญาณรบกวนกับผลลัพธ์สุดท้าย ผู้ลงโฆษณา ข. จะมีเอาต์พุตที่มีสัญญาณรบกวนมากกว่าผู้ลงโฆษณา ก. โดยค่าเริ่มต้น เนื่องจากผู้ลงโฆษณา ข. มีแนวโน้มที่ค่าเบี่ยงเบนมาตรฐานจะส่งผลต่อการคำนวณพื้นฐานมากกว่า

คุณสามารถลดปัญหานี้ได้ด้วยการกําหนดค่าคีย์ที่เฉพาะเจาะจง ทดสอบกลยุทธ์หลักที่ช่วยจัดการข้อมูลค่าเบี่ยงเบน และกระจายมูลค่าการซื้อให้สม่ำเสมอมากขึ้นในช่วงการซื้อของคีย์

สําหรับผู้ลงโฆษณา ข. คุณอาจสร้างคีย์แยกกัน 2 คีย์เพื่อบันทึกช่วงมูลค่าการซื้อ 2 ช่วงที่แตกต่างกัน ในตัวอย่างนี้ เทคโนโลยีโฆษณาได้สังเกตเห็นว่าค่าที่ผิดปกติปรากฏขึ้นเหนือมูลค่าการซื้อ $500 ลองใช้คีย์แยกกัน 2 รายการสําหรับผู้ลงโฆษณารายนี้

  • โครงสร้างคีย์ 1 : คีย์ที่บันทึกเฉพาะการซื้อในช่วง $120 - $500 (ครอบคลุมปริมาณการซื้อทั้งหมดประมาณ 95%)
  • โครงสร้างคีย์ 2: คีย์ที่บันทึกเฉพาะการซื้อที่มากกว่า $500 (ครอบคลุมประมาณ 5% ของปริมาณการซื้อทั้งหมด)

การใช้กลยุทธ์สําคัญนี้ควรช่วยจัดการสัญญาณรบกวนได้ดียิ่งขึ้นสําหรับผู้ลงโฆษณา ข และช่วยเพิ่มประโยชน์สูงสุดจากรายงานสรุป เมื่อพิจารณาช่วงใหม่ที่แคบลง คีย์ A และคีย์ B ควรมีการกระจายข้อมูลอย่างสม่ำเสมอมากขึ้นในแต่ละคีย์ที่เกี่ยวข้องเมื่อเทียบกับคีย์เดียวก่อนหน้า ซึ่งจะส่งผลให้สัญญาณรบกวนน้อยลงในเอาต์พุตของคีย์แต่ละรายการเมื่อเทียบกับคีย์เดียวก่อนหน้านี้