เรายินดีรับฟังความคิดเห็นเกี่ยวกับเอกสารนี้ขณะที่เราเตรียมเพิ่มเอกสารดังกล่าวลงในที่เก็บคำแนะนำสาธารณะ
เราขอแนะนําให้นักพัฒนาเทคโนโลยีโฆษณาทําการทดสอบการโหลดกับการเข้าชมเวอร์ชันที่ใช้งานจริง 100% ดังนี้
- เทคโนโลยีโฆษณาควรเข้าถึงการวัดการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
- เทคโนโลยีโฆษณาควรตัดสินใจเรื่องการออกแบบโดยลดสัญญาณรบกวนให้เหลือน้อยที่สุด (ข้อมูลอ้างอิง: การออกแบบ การตัดสินใจโดยประมาณ)
- ขณะทดสอบ ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรติดตามจํานวนงานที่ทํางานต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การแจกแจงจํานวนเหตุการณ์ Conversion โดยประมาณ และจํานวนคีย์รวมเป็นอินพุตต่องานประมวลผล (ดูพารามิเตอร์งาน output_domain_blob_prefix ในเอกสารประกอบของ Aggregation Service API) และเหตุการณ์ Conversion เฉลี่ยโดยประมาณต่อรายงานอินพุต
- สําหรับการทดสอบ ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนําจากตารางคําแนะนําการปรับขนาดตามขนาดงานที่ต้องการ (เช่น ปริมาณรายงาน ขนาดโดเมน) และปรับขนาดบริการรวบรวมข้อมูลที่ติดตั้งใช้งานตามนั้น ข้อมูลอ้างอิง: คำแนะนำในการปรับขนาดสำหรับบริการแบบรวมใน AWS
- ผู้เชี่ยวชาญด้านเทคโนโลยีโฆษณาควรเรียกใช้งานการรวมข้อมูลสําหรับการทดสอบการโหลด
เป้าหมาย
คำแนะนำนี้มีไว้สำหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวมโดยเฉพาะ และจะระบุวิธีการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับนักพัฒนาเทคโนโลยีโฆษณาเพื่อดำเนินการต่อไปนี้
- ประมาณเวลาในการโหลดที่คาดไว้สําหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม
- เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สําคัญสําหรับประสิทธิภาพและสัญญาณรบกวนโดยอิงตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการแบ่งกลุ่มของผู้ลงโฆษณา
วิชาบังคับก่อน
คู่มือนี้มีไว้สําหรับผู้ชมที่สนใจเทคโนโลยีโฆษณา ก่อนทำตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการจัดการกับสัญญาณรบกวน การตัดสินใจเกี่ยวกับการออกแบบรายงานสรุป และทดสอบห้องทดลองสัญญาณรบกวนเพื่อหาการกำหนดค่าที่เหมาะสมที่สุด
ขั้นตอน
1. กลยุทธ์การตั้งค่าคีย์การรวมข้อมูลเริ่มต้น
กำหนดจํานวนโครงสร้างคีย์ (ชุดมิติข้อมูล) ที่แตกต่างกันที่จําเป็นตามประเภทและวัตถุประสงค์ทางธุรกิจ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลดข้อมูลที่ไม่เกี่ยวข้องในรายงาน
จํานวนผู้ลงโฆษณาที่คุณมี
ตัวอย่างเช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย
ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
ควรประเมินความคล้ายคลึงกันโดยพิจารณาจากจํานวน Conversion, มูลค่า Conversion สัมพัทธ์ และการครอบคลุมทั่วไปของลักษณะผู้ลงโฆษณา ยิ่งคุณจัดกลุ่มได้คล้ายกันมากเท่าใด ผลลัพธ์ก็จะยิ่งปรับแต่งได้ละเอียดมากขึ้น (เนื่องจากค่าเอาต์พุตมีความแปรปรวนน้อยลง) และผลกระทบจากสัญญาณรบกวนก็จะยิ่งน้อยลง ดูรายละเอียดเพิ่มเติมได้ที่การจัดการคีย์ขั้นสูง ตัวอย่างเช่น เทคโนโลยีโฆษณาอาจแบ่งกลุ่มผู้ลงโฆษณาตามอุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ดังนี้
- อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ ค้าปลีกแบบเติบโต)
- การใช้จ่าย (เช่น <$50,000/ไตรมาส, $50-$150,000/ไตรมาส, $150,000-$250,000/ไตรมาส)
- ปริมาณ Conversion (ต่ำ ปานกลาง สูง)
จํานวนโครงสร้างคีย์รวมที่จะสร้าง
ตัวอย่างเช่น
27 (3x3x3) : อุตสาหกรรม 3 ประเภท ประเภทการใช้จ่าย 3 ประเภท และการจัดกลุ่ม 3 กลุ่มสําหรับค่า Conversion
2. ระบุมิติข้อมูลคีย์การรวม
ถัดไป ให้ระบุมิติข้อมูลสําคัญที่คุณต้องการติดตามสําหรับทั้งการแสดงผลและ Conversion เพื่อประมาณจํานวนคีย์ด้านแหล่งที่มาและทริกเกอร์
สําหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลที่สําคัญซึ่งคุณต้องติดตามสําหรับการแสดงผลจะช่วยคุณกําหนดจํานวนคีย์ฝั่งแหล่งที่มา มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณา เช่น อุตสาหกรรม การใช้จ่าย หรือ Conversion ตัวอย่างต่อไปนี้ช่วยอธิบายมิติข้อมูล
โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 ปริมาณ Conversion = ต่ำ)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50
ความเป็นไปได้), กลุ่มโฆษณา (เช่น 20 รายการ), ประเภทอุปกรณ์ (เช่น 5 ตัวเลือก), ภูมิศาสตร์ (เช่น 50 โอกาส)
- ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ค่านี้แสดงจํานวนการผสมผสานมิติข้อมูลได้สําหรับคีย์ฝั่งแหล่งที่มาของโครงสร้างคีย์ 1
- ต้องจอง 18 บิต (18 บิต = รูปแบบที่เป็นไปได้ 262,144 รูปแบบ)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50
ความเป็นไปได้), กลุ่มโฆษณา (เช่น 20 รายการ), ประเภทอุปกรณ์ (เช่น 5 ตัวเลือก), ภูมิศาสตร์ (เช่น 50 โอกาส)
โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 จํานวน Conversion = ปานกลาง)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30
ตัวเลือก), กลุ่มโฆษณา (เช่น 80 รายการ), ประเภทโฆษณา (เช่น 3
ความเป็นไปได้), ภูมิศาสตร์ (เช่น 50 โอกาส)
- การผสมผสานมิติข้อมูลที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ค่านี้แสดงจํานวนการผสมผสานมิติข้อมูลหรือคีย์ฝั่งแหล่งที่มาที่เป็นไปได้สำหรับโครงสร้างคีย์ 2
- ต้องจอง 19 บิต (19 บิต) = การเข้ารหัสที่เป็นไปได้ 524,288 ชุด)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30
ตัวเลือก), กลุ่มโฆษณา (เช่น 80 รายการ), ประเภทโฆษณา (เช่น 3
ความเป็นไปได้), ภูมิศาสตร์ (เช่น 50 โอกาส)
โครงสร้างคีย์ 3: ทำซ้ำ (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)
สําหรับโครงสร้างคีย์การรวมแต่ละรายการ มิติข้อมูลที่สําคัญซึ่งคุณต้องติดตามสําหรับ Conversion จะช่วยคุณกําหนดคีย์ด้านทริกเกอร์ เช่น
โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 ปริมาณ Conversion = ต่ำ)
- ตอบ: 2 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100
ความเป็นไปได้), ประเภท Conversion (เช่น 5 โอกาส)
- การรวมมิติข้อมูลได้ = 100 x 5 = 500
- ต้องจอง 9 บิต (9 บิต = 512 รูปแบบที่เป็นไปได้)
- ตอบ: 2 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 100
ความเป็นไปได้), ประเภท Conversion (เช่น 5 โอกาส)
โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย การใช้จ่าย = <50,000 จํานวน Conversion = ปานกลาง)
- ตอบ: 3 มิติ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
- ชุดค่าผสมมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
- ต้องจอง 11 บิต (11 บิต = 2,048 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: 3 มิติ ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
โครงสร้างคีย์ 3: ทำซ้ำ (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)
ค่าประมาณสำหรับคีย์รวม
- โครงสร้างคีย์ 1: คีย์การแสดงผล 250,000 คีย์ x คีย์ Conversion 500 คีย์ = 125,000,000 คีย์
- โครงสร้างคีย์ 2: คีย์การแสดงผล 360,000 คีย์ x คีย์ Conversion 1,500 คีย์ = 540,000,000 คีย์
- โครงสร้างคีย์ 3: (วางแผนโครงสร้างคีย์ทั้งหมดที่คุณมีในลักษณะเดียวกัน)
- ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
- คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07 พันล้านชุด)
ปริมาณ Conversion ที่คาดไว้
โครงสร้างคีย์การรวมแต่ละรายการสามารถอธิบายปริมาณที่คาดไว้ได้โดยใช้ตัวอย่างต่อไปนี้
- โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกัน, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: คาดว่าโครงสร้างคีย์ 1 จะมีมูลค่าการใช้จ่ายของผู้ลงโฆษณาประมาณ 500,000 บาทในไตรมาสหน้า โดยมีราคา CPM เฉลี่ย 80 บาท คาดว่าการดำเนินการนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้งที่ต้องบันทึก
- คาดว่าอัตรา Conversion เฉลี่ยจากการแสดงผลที่โครงสร้างคีย์ 1 จะสร้างขึ้นในช่วงไตรมาสหน้าจะเท่ากับ 0.08% ซึ่งจะส่งผลให้มี Conversion ที่ระบุแหล่งที่มา 50,000 รายการที่ต้องบันทึก วัดมูลค่าการซื้อและจํานวนการซื้อสําหรับ Conversion แต่ละรายการ
- โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: คาดว่าคีย์ 2 จะมีมูลค่าการใช้จ่ายประมาณ 800,000 บาทในไตรมาสหน้า โดยมีราคา CPM เฉลี่ย 3,000 บาท คาดว่าจะมีการแสดงผล 80,000,000 ครั้งที่ต้องบันทึก
- คาดว่าอัตราเฉลี่ยของการแสดงผลต่อ Conversion ที่กุญแจ 2 จะทำให้เกิดในไตรมาสหน้าคือ 0.03125% ซึ่งจะส่งผลให้มี Conversion ที่มีการระบุแหล่งที่มา 25,000 รายการที่ต้องบันทึก วัดมูลค่าการซื้อและจํานวนการซื้อสําหรับ Conversion แต่ละรายการ
- ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
ความถี่ในการส่งรายงานและการแบ่งกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**
สําหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณจะต้องส่งรายงาน Conversion เป็นประจํา เราขอแนะนําให้จัดกลุ่มเทคโนโลยีโฆษณาตามผู้ลงโฆษณา (เพื่อแยกข้อมูลต่อรายงานให้ชัดเจนยิ่งขึ้นและรวบรวมข้อมูลได้อย่างมีประสิทธิภาพมากขึ้น) และใช้ช่อง shared_info.scheduled_report_time
ของรายงานเพื่อจัดกลุ่ม
- ตอบ: รายชั่วโมง
- ข: รายวัน
- C: รายสัปดาห์
หมายเหตุ
- สําหรับการแยกกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
การแบ่งกลุ่มที่บ่อยขึ้นจะมีสัญญาณรบกวนต่อกลุ่มสูงกว่า (ดูหัวข้อคําตัดสิน: ความถี่ของกลุ่ม)
ตรวจสอบว่ากลุ่มใช้ช่อง
scheduled_report_time
ไม่ใช่report arrival time
เพื่อหลีกเลี่ยงข้อผิดพลาดที่เกิดจากการจัดกลุ่มที่ไม่ถูกต้อง ตัวอย่างเช่น หากคุณแบ่งกลุ่มทุกชั่วโมง กลุ่มของเวลา 11:00 น. ควรมีเฉพาะรายงานที่มีscheduled_report_time
ระหว่างเวลา 10:00 น. - 11:00 น. เท่านั้น และไม่ใช่รายงานที่มาถึงระหว่างเวลา 10:00 น. - 11:00 น. ที่มีscheduled_report_time
อื่น (เช่น 9:00 น.)
ค่าประมาณสำหรับปริมาณรายงาน
- โครงสร้างคีย์ 1: Conversion ที่ระบุแหล่งที่มา 50,000 รายการ / 2,160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 24 ฉบับต่อชั่วโมงต่อผู้ลงโฆษณา (ผู้ลงโฆษณา 24 x 1,000 = รายงานสรุป 24,000 ฉบับ)
- โครงสร้างคีย์ 2: Conversion ที่ระบุแหล่งที่มา 25,000 รายการ / 2,160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 12 ฉบับต่อชั่วโมงต่อผู้ลงโฆษณา (12 x 1,000 ผู้ลงโฆษณา = รายงานสรุป 12,000 ฉบับ)
- โครงสร้างคีย์ 3: ซ้ำ
- จํานวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 ฉบับสําหรับโครงสร้างคีย์ 1 + รายงานสรุป 12 ฉบับสําหรับโครงสร้างคีย์ 2 + ... = ... ต่อชั่วโมงต่อการลงโฆษณา 1 ครั้ง
สรุปความคิดเห็น
การทำความเข้าใจค่าประมาณต่อไปนี้จากเทคโนโลยีโฆษณาจะช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับขนาดที่เทคโนโลยีโฆษณาจําเป็นต้องใช้ เราขอแนะนําให้คุณแชร์ข้อมูลต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้จากคําแนะนําในการปรับขนาดบริการรวบรวมข้อมูลใน AWS
- คีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวมข้อมูล) ต่องานบริการรวมข้อมูล
- ปริมาณรายงานอินพุตสูงสุดต่องาน (Conversion ที่มีการระบุแหล่งที่มา)
- ผลงานโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
- การแจกแจง Conversion ที่ได้รับโดยประมาณต่องาน
- การแจกแจงคีย์โดเมนโดยประมาณในงาน
- จํานวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์