เฟรมเวิร์กการทดสอบโหลดของบริการรวม

เรายินดีรับฟังความคิดเห็นเกี่ยวกับเอกสารนี้ในขณะที่เราเตรียมเพิ่มเอกสารนี้ลงใน ที่เก็บคำแนะนำสาธารณะ

เราขอแนะนำให้เทคโนโลยีโฆษณาทําการทดสอบโหลดกับการเข้าชมที่ใช้งานจริง 100%

  1. เทคโนโลยีโฆษณาควรเข้าถึงการวัดผลการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
  2. เทคโนโลยีโฆษณาควรตัดสินใจเรื่องการออกแบบในขณะที่ลดสัญญาณรบกวน (อ้างอิง: การตัดสินใจ ด้านการออกแบบที่จำลอง)
  3. ในระหว่างการทดสอบ เทคโนโลยีโฆษณาควรติดตามจำนวนงาน ที่เรียกใช้ต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การกระจายโดยประมาณของ ปริมาณเหตุการณ์ Conversion และจำนวนคีย์แบบรวมเป็นอินพุตต่องาน การประมวลผล (ดูพารามิเตอร์งาน output_domain_blob_prefix ในเอกสารประกอบ API ของบริการรวบรวมข้อมูล) และเหตุการณ์ Conversion โดยเฉลี่ยโดยประมาณต่อรายงานอินพุต
  4. สำหรับการทดสอบ เทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนำ จากตารางคำแนะนำในการกำหนดขนาดตามขนาดงานที่คาดไว้ (เช่น ปริมาณรายงาน ขนาดโดเมน) และกำหนดขนาดบริการรวบรวมข้อมูลที่ใช้งานจริง ตามนั้น ข้อมูลอ้างอิง: คำแนะนำ ในการกำหนดขนาดสำหรับบริการรวมข้อมูลใน AWS
  5. เทคโนโลยีโฆษณาควรเรียกใช้ชิ้นงานการรวบรวมสำหรับการทดสอบโหลด

เป้าหมาย

คําแนะนํานี้มีไว้สําหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม โดยเฉพาะ และจะรวมถึงวิธีการตั้งค่าและการกําหนดค่าที่สําคัญซึ่งมีไว้สําหรับการใช้งานโดยเทคโนโลยีโฆษณาเพื่อทําสิ่งต่อไปนี้

  • ประเมินความคาดหวังในการโหลดสำหรับการวัดผลการระบุแหล่งที่มาของ Conversion แบบรวม
  • เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับประสิทธิภาพและสัญญาณรบกวน ตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการ แบ่งกลุ่มของผู้ลงโฆษณา

วิชาบังคับก่อน

คู่มือนี้มีไว้สำหรับกลุ่มเป้าหมายที่เป็นผู้ใช้เทคโนโลยีโฆษณา ก่อนที่จะทำตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการจัดการสัญญาณรบกวน การตัดสินใจออกแบบรายงานข้อมูลสรุป และทดลองใช้ห้องทดลองสัญญาณรบกวน เพื่อการกำหนดค่าที่เหมาะสม

ขั้นตอน

1. กลยุทธ์การตั้งค่าคีย์การรวมข้อมูลเริ่มต้น

พิจารณาว่าคุณต้องการโครงสร้างหลัก (เช่น ชุดมิติข้อมูล) ที่แตกต่างกันกี่ชุดตามประเภทธุรกิจและ วัตถุประสงค์ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลด สัญญาณรบกวนในรายงานได้

จำนวนผู้ลงโฆษณาที่คุณมี
เช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย

ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
ควรประเมินความคล้ายคลึงกัน โดยอิงตามปริมาณ Conversion, มูลค่า Conversion ที่เกี่ยวข้อง และความครอบคลุมทั่วไปของลักษณะผู้ลงโฆษณา ยิ่งจัดกลุ่มได้คล้ายกันมากเท่าใด ผลลัพธ์ก็จะยิ่งปรับแต่งได้ดีขึ้นเท่านั้น (เนื่องจากค่าเอาต์พุตมีความแปรปรวนน้อยลง) และด้วยเหตุนี้ ผลกระทบของสัญญาณรบกวนก็จะยิ่งน้อยลง ดูรายละเอียดเพิ่มเติมได้ที่ การจัดการคีย์ขั้นสูง ตัวอย่างเช่น เทคโนโลยีโฆษณาสามารถแบ่งกลุ่มผู้ลงโฆษณาตาม อุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ได้ดังนี้

  • อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ ค้าปลีกที่เติบโต)
  • การใช้จ่าย (เช่น น้อยกว่า 1,500,000 บาท/ไตรมาส 1,500,000-4,500,000 บาท/ไตรมาส 4,500,000-7,500,000 บาท/ไตรมาส)
  • ปริมาณ Conversion (ต่ำ ปานกลาง สูง)

จํานวนโครงสร้างคีย์รวมที่จะสร้าง
เช่น 27 (3x3x3) : 3 อุตสาหกรรม, 3 ประเภทการใช้จ่าย และ 3 การจัดกลุ่มสําหรับ มูลค่า Conversion

2. ระบุมิติข้อมูลคีย์การรวม

จากนั้น ให้ระบุมิติข้อมูลสําคัญที่คุณต้องการติดตามสําหรับทั้ง การแสดงผลและ Conversion เพื่อประมาณจํานวนคีย์ฝั่งแหล่งที่มาและคีย์ฝั่งทริกเกอร์

สําหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ มิติข้อมูลที่สําคัญ ซึ่งคุณต้องติดตามการแสดงผลจะช่วยให้คุณกําหนด จํานวนคีย์ฝั่งแหล่งที่มาได้ มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณา เช่น อุตสาหกรรม การใช้จ่าย หรือ Conversion ตัวอย่างต่อไปนี้ ช่วยอธิบายมิติข้อมูล

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)

    • ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50 possibilities), Ad group (e.g.: 20 possibilities), Device type (e.g.: 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
      1. การผสมผสานมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ซึ่งแสดงถึงจำนวน ชุดค่าผสมมิติที่เป็นไปได้สำหรับคีย์ฝั่งแหล่งที่มาสำหรับโครงสร้างคีย์ 1
      2. ต้องจอง 18 บิต (18 บิต = ชุดค่าผสมที่เป็นไปได้ 262,144 ชุด)
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)

    • ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30 possibilities), กลุ่มโฆษณา (เช่น 80 possibilities), Ad type (e.g.: 3 possibilities), Geo (เช่น 50 ความเป็นไปได้)
      1. การผสมผสานมิติที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ซึ่งแสดงถึงจำนวน ชุดค่าผสมมิติข้อมูลหรือคีย์ฝั่งแหล่งที่มาที่เป็นไปได้สำหรับโครงสร้างคีย์ 2
      2. ต้องจอง 19 บิต (19 บิต) = ชุดค่าผสมที่เป็นไปได้ 524,288 ชุด)
  • โครงสร้างที่สำคัญ 3: ทำซ้ำ (วางแผนในลักษณะเดียวกันสำหรับโครงสร้างที่สำคัญทั้งหมดที่คุณมี)

สําหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ มิติข้อมูลที่สําคัญ ที่คุณต้องติดตามสําหรับ Conversion จะช่วยให้คุณกําหนด คีย์ฝั่งทริกเกอร์ได้ เช่น

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)

    • ตอบ: 2 มิติข้อมูล: หมวดหมู่ผลิตภัณฑ์ (เช่น 100 ความเป็นไปได้) ประเภท Conversion (เช่น 5 ความเป็นไปได้)
      1. การผสมผสานมิติข้อมูลที่เป็นไปได้ = 100 x 5 = 500
      2. ต้องสำรอง 9 บิต (9 บิต = 512 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)

    • ตอบ: 3 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50 ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
      1. การผสมผสานมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
      2. ต้องจอง 11 บิต (11 บิต = ชุดค่าผสมที่เป็นไปได้ 2,048 ชุด)
  • โครงสร้างที่สำคัญ 3: ทำซ้ำ (วางแผนในลักษณะเดียวกันสำหรับโครงสร้างที่สำคัญทั้งหมดที่คุณมี)

การประมาณค่าสำหรับคีย์รวม

  • โครงสร้างคีย์ 1: คีย์การแสดงผล 250,000 รายการ x คีย์ Conversion 500 รายการ = คีย์ 125,000,000 รายการ
  • โครงสร้างคีย์ 2: คีย์การแสดงผล 360,000 รายการ x คีย์ Conversion 1,500 รายการ = 540,000,000 คีย์
  • โครงสร้างหลัก 3: (วางแผนสำหรับโครงสร้างหลักทั้งหมดที่คุณมีในลักษณะเดียวกัน)
  • ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
  • คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07 พันล้านชุด)

ปริมาณ Conversion ที่คาดการณ์

สำหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณสามารถอธิบายปริมาณที่คาดการณ์ไว้ได้ โดยใช้ตัวอย่างต่อไปนี้

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)
    • ตอบ: คาดว่าโครงสร้างหลัก 1 จะมีมูลค่าการใช้จ่ายของผู้ลงโฆษณาประมาณ $500,000 ในไตรมาสถัดไป โดยมีราคา CPM เฉลี่ยอยู่ที่ $8 คาดการณ์ว่า การดำเนินการนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้งที่ต้องลงทะเบียน
    • คาดการณ์ว่าอัตราการแสดงผลต่อ Conversion โดยเฉลี่ยที่โครงสร้างคีย์ 1 จะมีในช่วงไตรมาสถัดไปคือ 0.08% ซึ่งจะส่งผลให้เกิด 50,000 Conversion ที่มาจากการระบุแหล่งที่มาซึ่งต้องบันทึก สําหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจํานวนการซื้อ
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)
    • ตอบ: คาดการณ์ว่าคีย์ 2 จะมีมูลค่าการใช้จ่ายประมาณ 8,000,000 บาทในไตรมาสถัดไป โดยมีราคา CPM เฉลี่ยอยู่ที่ 100 บาท คาดการณ์ว่าการดำเนินการนี้จะส่งผลให้เกิดการแสดงผล 80,000,000 ครั้ง ซึ่งต้องลงทะเบียน
    • คาดการณ์ว่าอัตราการแสดงผลต่อ Conversion โดยเฉลี่ยที่คีย์ 2 จะมีในช่วงไตรมาสถัดไปคือ 0.03125% ซึ่งจะส่งผลให้เกิด 25,000 Conversion ที่มาจากการระบุแหล่งที่มาซึ่งต้องบันทึก สําหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจํานวนการซื้อ
  • ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ

ความถี่ในการส่งรายงานและการจัดกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**

สำหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ คุณจะต้องมีรายงาน Conversion ที่ส่ง เป็นประจำ เราขอแนะนําให้เทคโนโลยีโฆษณาดําเนินการเป็นกลุ่มตามผู้ลงโฆษณา (เพื่อการแยกข้อมูลต่อรายงานที่ชัดเจนยิ่งขึ้นและการรวบรวมที่มีประสิทธิภาพมากขึ้น) และใช้ฟิลด์ shared_info.scheduled_report_time ของรายงานสําหรับการจัดกลุ่ม

  • ตอบ: รายชั่วโมง
  • ข: รายวัน
  • ค: รายสัปดาห์

หมายเหตุ

  • สำหรับการจัดกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
  • การจัดกลุ่มที่บ่อยขึ้นจะทำให้มีสัญญาณรบกวนต่อกลุ่มมากขึ้น (ดูที่ การตัดสินใจ: ความถี่ของกลุ่ม)

  • หากต้องการหลีกเลี่ยงข้อผิดพลาดเนื่องจากการจัดกลุ่มที่ไม่ถูกต้อง ให้ตรวจสอบว่ากลุ่มใช้ฟิลด์ scheduled_report_time ไม่ใช่ report arrival time เช่น หากคุณจัดกลุ่มทุกชั่วโมง กลุ่มสำหรับเวลา 11:00 น. ควรมีเฉพาะรายงานที่มี scheduled_report_time ระหว่างเวลา 10:00 น. ถึง 11:00 น. และไม่ใช่รายงานที่มาถึงระหว่างเวลา 10:00 น. ถึง 11:00 น. ที่มี scheduled_report_time อื่น (เช่น 9:00 น.)

การประมาณปริมาณรายงาน

  • โครงสร้างคีย์ 1: 50,000 Conversion ที่มาจากการระบุแหล่งที่มา / 2160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 24 รายการต่อชั่วโมงต่อผู้ลงโฆษณา (24 x ผู้ลงโฆษณา 1,000 ราย = รายงานสรุป 24,000 รายการ)
  • โครงสร้างคีย์ 2: 25,000 Conversion ที่ระบุแหล่งที่มา / 2160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 12 รายการต่อชั่วโมงต่อผู้ลงโฆษณา (12 x ผู้ลงโฆษณา 1,000 ราย = รายงานสรุป 12,000 รายการ)
  • โครงสร้างคีย์ 3: ทำซ้ำ
  • จำนวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 รายการสำหรับโครงสร้างคีย์ 1 + รายงานสรุป 12 รายการสำหรับโครงสร้างคีย์ 2 + ... = ... ต่อชั่วโมง ต่อผู้ลงโฆษณา

สรุปความคิดเห็น

การทำความเข้าใจการประมาณต่อไปนี้จากเทคโนโลยีโฆษณาช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับขนาดที่เทคโนโลยีโฆษณากำหนดได้ เราขอแนะนำให้คุณ แชร์ข้อมูลต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้ที่ คำแนะนำในการกำหนดขนาดสำหรับบริการรวบรวมข้อมูลใน AWS

  • คีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวม) ต่องานบริการรวมข้อมูล
  • ปริมาณรายงานอินพุตสูงสุดต่องาน (Conversion ที่ระบุแหล่งที่มา)
  • การมีส่วนร่วมโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
  • การกระจาย Conversion ที่มาจากการระบุแหล่งที่มาโดยประมาณต่องาน
  • การกระจายคีย์โดเมนโดยประมาณในงาน
  • จำนวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์