เฟรมเวิร์กการทดสอบโหลดของบริการรวม

เรายินดีรับฟังความคิดเห็นเกี่ยวกับเอกสารนี้ขณะที่เราเตรียมเพิ่มเอกสารดังกล่าวลงในที่เก็บคำแนะนำสาธารณะ

เราขอแนะนําให้นักพัฒนาเทคโนโลยีโฆษณาทําการทดสอบการโหลดกับการเข้าชมเวอร์ชันที่ใช้งานจริง 100% ดังนี้

  1. เทคโนโลยีโฆษณาควรเข้าถึงการวัดการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
  2. เทคโนโลยีโฆษณาควรตัดสินใจเรื่องการออกแบบโดยลดสัญญาณรบกวนให้เหลือน้อยที่สุด (ข้อมูลอ้างอิง: การออกแบบ การตัดสินใจโดยประมาณ)
  3. ขณะทดสอบ ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรติดตามจํานวนงานที่ทํางานต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การแจกแจงจํานวนเหตุการณ์ Conversion โดยประมาณ และจํานวนคีย์รวมเป็นอินพุตต่องานประมวลผล (ดูพารามิเตอร์งาน output_domain_blob_prefix ในเอกสารประกอบของ Aggregation Service API) และเหตุการณ์ Conversion เฉลี่ยโดยประมาณต่อรายงานอินพุต
  4. สําหรับการทดสอบ ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนําจากตารางคําแนะนําการปรับขนาดตามขนาดงานที่ต้องการ (เช่น ปริมาณรายงาน ขนาดโดเมน) และปรับขนาดบริการรวบรวมข้อมูลที่ติดตั้งใช้งานตามนั้น ข้อมูลอ้างอิง: คำแนะนำในการปรับขนาดสำหรับบริการแบบรวมใน AWS
  5. ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรเรียกใช้งานการรวมข้อมูลสําหรับการทดสอบการโหลด

เป้าหมาย

คำแนะนำนี้มีไว้สำหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวมโดยเฉพาะ และจะระบุวิธีการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับนักพัฒนาเทคโนโลยีโฆษณาเพื่อดำเนินการต่อไปนี้

  • ประมาณเวลาในการโหลดที่คาดไว้สําหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม
  • เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สําคัญสําหรับประสิทธิภาพและสัญญาณรบกวนโดยอิงตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการแบ่งกลุ่มของผู้ลงโฆษณา

วิชาบังคับก่อน

คู่มือนี้มีไว้สําหรับผู้ชมที่สนใจเทคโนโลยีโฆษณา ก่อนทำตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการจัดการกับสัญญาณรบกวน การตัดสินใจเกี่ยวกับการออกแบบรายงานสรุป และทดสอบห้องทดลองสัญญาณรบกวนเพื่อหาการกำหนดค่าที่เหมาะสมที่สุด

ขั้นตอน

1. กลยุทธ์การตั้งค่าคีย์การรวมข้อมูลเริ่มต้น

กำหนดจํานวนโครงสร้างคีย์ (ชุดมิติข้อมูล) ที่แตกต่างกันที่จําเป็นตามประเภทและวัตถุประสงค์ทางธุรกิจ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลดข้อมูลที่ไม่เกี่ยวข้องในรายงาน

จํานวนผู้ลงโฆษณาที่คุณมี
ตัวอย่างเช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย

ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
ควรประเมินความคล้ายคลึงกันโดยพิจารณาจากจํานวน Conversion, มูลค่า Conversion สัมพัทธ์ และการครอบคลุมทั่วไปของลักษณะผู้ลงโฆษณา ยิ่งคุณจัดกลุ่มได้คล้ายกันมากเท่าใด ผลลัพธ์ก็จะยิ่งปรับแต่งได้ละเอียดมากขึ้น (เนื่องจากค่าเอาต์พุตมีความแปรปรวนน้อยลง) และผลกระทบจากสัญญาณรบกวนก็จะยิ่งน้อยลง ดูรายละเอียดเพิ่มเติมได้ที่การจัดการคีย์ขั้นสูง ตัวอย่างเช่น เทคโนโลยีโฆษณาอาจแบ่งกลุ่มผู้ลงโฆษณาตามอุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ดังนี้

  • อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ ค้าปลีกแบบเติบโต)
  • การใช้จ่าย (เช่น <$50,000/ไตรมาส, $50-$150,000/ไตรมาส, $150,000-$250,000/ไตรมาส)
  • ปริมาณ Conversion (ต่ำ ปานกลาง สูง)

จํานวนโครงสร้างคีย์รวมที่จะสร้าง
ตัวอย่างเช่น 27 (3x3x3) : อุตสาหกรรม 3 ประเภท ประเภทการใช้จ่าย 3 ประเภท และการจัดกลุ่ม 3 กลุ่มสําหรับค่า Conversion

2. ระบุมิติข้อมูลคีย์การรวม

ถัดไป ให้ระบุมิติข้อมูลสําคัญที่คุณต้องการติดตามสําหรับทั้งการแสดงผลและ Conversion เพื่อประมาณจํานวนคีย์ด้านแหล่งที่มาและทริกเกอร์

สําหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลที่สําคัญซึ่งคุณต้องติดตามสําหรับการแสดงผลจะช่วยคุณกําหนดจํานวนคีย์ฝั่งแหล่งที่มา มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณา เช่น อุตสาหกรรม การใช้จ่าย หรือ Conversion ตัวอย่างต่อไปนี้ช่วยอธิบายมิติข้อมูล

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 ปริมาณ Conversion = ต่ำ)

    • ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50 ความเป็นไปได้), กลุ่มโฆษณา (เช่น 20 รายการ), ประเภทอุปกรณ์ (เช่น 5 ตัวเลือก), ภูมิศาสตร์ (เช่น 50 โอกาส)
      1. ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ค่านี้แสดงจํานวนการผสมผสานมิติข้อมูลได้สําหรับคีย์ฝั่งแหล่งที่มาของโครงสร้างคีย์ 1
      2. ต้องจอง 18 บิต (18 บิต = รูปแบบที่เป็นไปได้ 262,144 รูปแบบ)
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 จํานวน Conversion = ปานกลาง)

    • ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30 ตัวเลือก), กลุ่มโฆษณา (เช่น 80 รายการ), ประเภทโฆษณา (เช่น 3 ความเป็นไปได้), ภูมิศาสตร์ (เช่น 50 โอกาส)
      1. การผสมผสานมิติข้อมูลที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ค่านี้แสดงจํานวนการผสมผสานมิติข้อมูลหรือคีย์ฝั่งแหล่งที่มาที่เป็นไปได้สำหรับโครงสร้างคีย์ 2
      2. ต้องจอง 19 บิต (19 บิต) = การเข้ารหัสที่เป็นไปได้ 524,288 ชุด)
  • โครงสร้างคีย์ 3: ทำซ้ำ (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)

สําหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลที่สําคัญซึ่งคุณต้องติดตามสําหรับ Conversion จะช่วยคุณกําหนดคีย์ด้านทริกเกอร์ เช่น

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 ปริมาณ Conversion = ต่ำ)

    • ตอบ: 2 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100 ความเป็นไปได้), ประเภท Conversion (เช่น 5 โอกาส)
      1. การรวมมิติข้อมูลได้ = 100 x 5 = 500
      2. ต้องจอง 9 บิต (9 บิต = 512 รูปแบบที่เป็นไปได้)
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 จํานวน Conversion = ปานกลาง)

    • ตอบ: 3 มิติ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50 ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
      1. ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
      2. ต้องจอง 11 บิต (11 บิต = 2,048 ชุดค่าผสมที่เป็นไปได้)
  • โครงสร้างคีย์ 3: ทำซ้ำ (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)

ค่าประมาณสำหรับคีย์รวม

  • โครงสร้างคีย์ 1: คีย์การแสดงผล 250,000 คีย์ x คีย์ Conversion 500 คีย์ = 125,000,000 คีย์
  • โครงสร้างคีย์ 2: คีย์การแสดงผล 360,000 คีย์ x คีย์ Conversion 1,500 คีย์ = 540,000,000 คีย์
  • โครงสร้างคีย์ 3: (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)
  • ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
  • คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07 พันล้านชุด)

ปริมาณ Conversion ที่คาดไว้

โครงสร้างคีย์การรวมแต่ละรายการสามารถอธิบายปริมาณที่คาดไว้ได้โดยใช้ตัวอย่างต่อไปนี้

  • โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกัน, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)
    • ตอบ: คาดว่าโครงสร้างคีย์ 1 จะมีมูลค่าการใช้จ่ายของผู้ลงโฆษณาประมาณ 500,000 บาทในไตรมาสหน้า โดยมีราคา CPM เฉลี่ย 80 บาท คาดว่าการดำเนินการนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้งที่ต้องบันทึก
    • คาดว่าอัตรา Conversion เฉลี่ยจากการแสดงผลที่โครงสร้างคีย์ 1 จะสร้างขึ้นในช่วงไตรมาสหน้าจะเท่ากับ 0.08% ซึ่งจะส่งผลให้มี Conversion ที่ระบุแหล่งที่มา 50,000 รายการที่ต้องบันทึก วัดมูลค่าการซื้อและจํานวนการซื้อสําหรับ Conversion แต่ละรายการ
  • โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)
    • ตอบ: คาดว่าคีย์ 2 จะมีมูลค่าการใช้จ่ายประมาณ 800,000 บาทในไตรมาสหน้า โดยมีราคา CPM เฉลี่ย 3,000 บาท คาดว่าจะมีการแสดงผล 80,000,000 ครั้งที่ต้องบันทึก
    • คาดว่าอัตราเฉลี่ยของการแสดงผลต่อ Conversion ที่กุญแจ 2 จะทำให้เกิดในไตรมาสหน้าคือ 0.03125% ซึ่งจะส่งผลให้มี Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการที่ต้องบันทึก วัดมูลค่าการซื้อและจํานวนการซื้อสําหรับ Conversion แต่ละรายการ
  • ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ

ความถี่ในการส่งรายงานและการแบ่งกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**

สําหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณจะต้องส่งรายงาน Conversion เป็นประจํา เราขอแนะนําให้จัดกลุ่มเทคโนโลยีโฆษณาตามผู้ลงโฆษณา (เพื่อแยกข้อมูลต่อรายงานให้ชัดเจนยิ่งขึ้นและรวบรวมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น) และใช้ช่อง shared_info.scheduled_report_time ของรายงานเพื่อจัดกลุ่ม

  • ตอบ: รายชั่วโมง
  • ข: รายวัน
  • C: รายสัปดาห์

หมายเหตุ

  • สําหรับการแยกกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
  • การแบ่งกลุ่มที่บ่อยขึ้นจะมีสัญญาณรบกวนต่อกลุ่มสูงกว่า (ดูหัวข้อคําตัดสิน: ความถี่ของกลุ่ม)

  • ตรวจสอบว่ากลุ่มใช้ช่อง scheduled_report_time ไม่ใช่ report arrival time เพื่อหลีกเลี่ยงข้อผิดพลาดที่เกิดจากการจัดกลุ่มที่ไม่ถูกต้อง ตัวอย่างเช่น หากคุณแบ่งกลุ่มทุกชั่วโมง กลุ่มของเวลา 11:00 น. ควรมีเฉพาะรายงานที่มี scheduled_report_time ระหว่างเวลา 10:00 น. - 11:00 น. เท่านั้น และไม่ใช่รายงานที่มาถึงระหว่างเวลา 10:00 น. - 11:00 น. ที่มี scheduled_report_time อื่น (เช่น 9:00 น.)

ค่าประมาณสำหรับปริมาณรายงาน

  • โครงสร้างคีย์ 1: Conversion ที่ระบุแหล่งที่มา 50,000 รายการ / 2,160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 24 ฉบับต่อชั่วโมงต่อผู้ลงโฆษณา (ผู้ลงโฆษณา 24 x 1,000 = รายงานสรุป 24,000 ฉบับ)
  • โครงสร้างคีย์ 2: Conversion ที่ระบุแหล่งที่มา 25,000 รายการ / 2,160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 12 ฉบับต่อชั่วโมงต่อผู้ลงโฆษณา (12 x 1,000 ผู้ลงโฆษณา = รายงานสรุป 12,000 ฉบับ)
  • โครงสร้างคีย์ 3: ซ้ำ
  • จํานวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 ฉบับสําหรับโครงสร้างคีย์ 1 + รายงานสรุป 12 ฉบับสําหรับโครงสร้างคีย์ 2 + ... = ... ต่อชั่วโมงต่อการลงโฆษณา 1 ครั้ง

สรุปความคิดเห็น

การทำความเข้าใจค่าประมาณต่อไปนี้จากเทคโนโลยีโฆษณาจะช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับขนาดที่เทคโนโลยีโฆษณาจําเป็นต้องใช้ เราขอแนะนําให้คุณแชร์ข้อมูลต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้จากคําแนะนําในการปรับขนาดบริการรวบรวมข้อมูลใน AWS

  • คีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวมข้อมูล) ต่องานบริการรวมข้อมูล
  • ปริมาณรายงานอินพุตสูงสุดต่องาน (Conversion ที่มีการระบุแหล่งที่มา)
  • ผลงานโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
  • การแจกแจง Conversion ที่ได้รับโดยประมาณต่องาน
  • การแจกแจงคีย์โดเมนโดยประมาณในงาน
  • จํานวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์