เรายินดีรับฟังความคิดเห็นเกี่ยวกับเอกสารนี้ในขณะที่เราเตรียมเพิ่มเอกสารนี้ลงใน ที่เก็บคำแนะนำสาธารณะ
เราขอแนะนำให้เทคโนโลยีโฆษณาทําการทดสอบโหลดกับการเข้าชมที่ใช้งานจริง 100%
- เทคโนโลยีโฆษณาควรเข้าถึงการวัดผลการระบุแหล่งที่มาของ Conversion โดยใช้ Attribution Reporting API เป็นกรณีการใช้งานการรายงาน
- เทคโนโลยีโฆษณาควรตัดสินใจเรื่องการออกแบบในขณะที่ลดสัญญาณรบกวน (อ้างอิง: การตัดสินใจ ด้านการออกแบบที่จำลอง)
- ในระหว่างการทดสอบ เทคโนโลยีโฆษณาควรติดตามจำนวนงาน ที่เรียกใช้ต่อวัน (เช่น งานต่อผู้ลงโฆษณา) การกระจายโดยประมาณของ ปริมาณเหตุการณ์ Conversion และจำนวนคีย์แบบรวมเป็นอินพุตต่องาน การประมวลผล (ดูพารามิเตอร์งาน output_domain_blob_prefix ในเอกสารประกอบ API ของบริการรวบรวมข้อมูล) และเหตุการณ์ Conversion โดยเฉลี่ยโดยประมาณต่อรายงานอินพุต
- สำหรับการทดสอบ เทคโนโลยีโฆษณาควรค้นหาประเภทอินสแตนซ์ที่แนะนำ จากตารางคำแนะนำในการกำหนดขนาดตามขนาดงานที่คาดไว้ (เช่น ปริมาณรายงาน ขนาดโดเมน) และกำหนดขนาดบริการรวบรวมข้อมูลที่ใช้งานจริง ตามนั้น ข้อมูลอ้างอิง: คำแนะนำ ในการกำหนดขนาดสำหรับบริการรวมข้อมูลใน AWS
- เทคโนโลยีโฆษณาควรเรียกใช้ชิ้นงานการรวบรวมสำหรับการทดสอบโหลด
เป้าหมาย
คําแนะนํานี้มีไว้สําหรับการวัดการระบุแหล่งที่มาของ Conversion แบบรวม โดยเฉพาะ และจะรวมถึงวิธีการตั้งค่าและการกําหนดค่าที่สําคัญซึ่งมีไว้สําหรับการใช้งานโดยเทคโนโลยีโฆษณาเพื่อทําสิ่งต่อไปนี้
- ประเมินความคาดหวังในการโหลดสำหรับการวัดผลการระบุแหล่งที่มาของ Conversion แบบรวม
- เพิ่มประสิทธิภาพการตั้งค่าและการกำหนดค่าที่สำคัญสำหรับประสิทธิภาพและสัญญาณรบกวน ตามมิติข้อมูลและเป้าหมายที่ต้องการวัด รวมถึงขนาดและการ แบ่งกลุ่มของผู้ลงโฆษณา
วิชาบังคับก่อน
คู่มือนี้มีไว้สำหรับกลุ่มเป้าหมายที่เป็นผู้ใช้เทคโนโลยีโฆษณา ก่อนที่จะทำตามขั้นตอนต่อไปนี้ คุณควรอ่านเอกสารประกอบเกี่ยวกับการจัดการสัญญาณรบกวน การตัดสินใจออกแบบรายงานข้อมูลสรุป และทดลองใช้ห้องทดลองสัญญาณรบกวน เพื่อการกำหนดค่าที่เหมาะสม
ขั้นตอน
1. กลยุทธ์การตั้งค่าคีย์การรวมข้อมูลเริ่มต้น
พิจารณาว่าคุณต้องการโครงสร้างหลัก (เช่น ชุดมิติข้อมูล) ที่แตกต่างกันกี่ชุดตามประเภทธุรกิจและ วัตถุประสงค์ โปรดทราบว่าการเพิ่มประสิทธิภาพโครงสร้างคีย์อาจช่วยลด สัญญาณรบกวนในรายงานได้
จำนวนผู้ลงโฆษณาที่คุณมี
เช่น สมมติว่าคุณมีผู้ลงโฆษณา 1,000 ราย
ความคล้ายคลึงกันระหว่างผู้ลงโฆษณา
ควรประเมินความคล้ายคลึงกัน
โดยอิงตามปริมาณ Conversion, มูลค่า Conversion ที่เกี่ยวข้อง และความครอบคลุมทั่วไปของลักษณะผู้ลงโฆษณา ยิ่งจัดกลุ่มได้คล้ายกันมากเท่าใด ผลลัพธ์ก็จะยิ่งปรับแต่งได้ดีขึ้นเท่านั้น (เนื่องจากค่าเอาต์พุตมีความแปรปรวนน้อยลง) และด้วยเหตุนี้ ผลกระทบของสัญญาณรบกวนก็จะยิ่งน้อยลง
ดูรายละเอียดเพิ่มเติมได้ที่
การจัดการคีย์ขั้นสูง
ตัวอย่างเช่น เทคโนโลยีโฆษณาสามารถแบ่งกลุ่มผู้ลงโฆษณาตาม
อุตสาหกรรม การใช้จ่าย และปริมาณ Conversion ได้ดังนี้
- อุตสาหกรรม (เช่น ประกันภัย เครื่องประดับ ค้าปลีกที่เติบโต)
- การใช้จ่าย (เช่น น้อยกว่า 1,500,000 บาท/ไตรมาส 1,500,000-4,500,000 บาท/ไตรมาส 4,500,000-7,500,000 บาท/ไตรมาส)
- ปริมาณ Conversion (ต่ำ ปานกลาง สูง)
จํานวนโครงสร้างคีย์รวมที่จะสร้าง
เช่น
27 (3x3x3) : 3 อุตสาหกรรม, 3 ประเภทการใช้จ่าย และ 3 การจัดกลุ่มสําหรับ
มูลค่า Conversion
2. ระบุมิติข้อมูลคีย์การรวม
จากนั้น ให้ระบุมิติข้อมูลสําคัญที่คุณต้องการติดตามสําหรับทั้ง การแสดงผลและ Conversion เพื่อประมาณจํานวนคีย์ฝั่งแหล่งที่มาและคีย์ฝั่งทริกเกอร์
สําหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ มิติข้อมูลที่สําคัญ ซึ่งคุณต้องติดตามการแสดงผลจะช่วยให้คุณกําหนด จํานวนคีย์ฝั่งแหล่งที่มาได้ มิติข้อมูลจะขึ้นอยู่กับประเภทผู้ลงโฆษณา เช่น อุตสาหกรรม การใช้จ่าย หรือ Conversion ตัวอย่างต่อไปนี้ ช่วยอธิบายมิติข้อมูล
โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50
possibilities), Ad group (e.g.: 20 possibilities), Device type
(e.g.: 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
- การผสมผสานมิติข้อมูลที่เป็นไปได้ = 50 x 20 x 5 x 50 = 250,000 ซึ่งแสดงถึงจำนวน ชุดค่าผสมมิติที่เป็นไปได้สำหรับคีย์ฝั่งแหล่งที่มาสำหรับโครงสร้างคีย์ 1
- ต้องจอง 18 บิต (18 บิต = ชุดค่าผสมที่เป็นไปได้ 262,144 ชุด)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 50
possibilities), Ad group (e.g.: 20 possibilities), Device type
(e.g.: 5 ความเป็นไปได้) ภูมิศาสตร์ (เช่น 50 ความเป็นไปได้)
โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30
possibilities), กลุ่มโฆษณา (เช่น 80 possibilities), Ad type (e.g.: 3
possibilities), Geo (เช่น 50 ความเป็นไปได้)
- การผสมผสานมิติที่เป็นไปได้ = 30 x 80 x 3 x 50 = 360,000 ซึ่งแสดงถึงจำนวน ชุดค่าผสมมิติข้อมูลหรือคีย์ฝั่งแหล่งที่มาที่เป็นไปได้สำหรับโครงสร้างคีย์ 2
- ต้องจอง 19 บิต (19 บิต) = ชุดค่าผสมที่เป็นไปได้ 524,288 ชุด)
- ตอบ: 4 มิติข้อมูล ได้แก่ แคมเปญ (เช่น 30
possibilities), กลุ่มโฆษณา (เช่น 80 possibilities), Ad type (e.g.: 3
possibilities), Geo (เช่น 50 ความเป็นไปได้)
โครงสร้างที่สำคัญ 3: ทำซ้ำ (วางแผนในลักษณะเดียวกันสำหรับโครงสร้างที่สำคัญทั้งหมดที่คุณมี)
สําหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ มิติข้อมูลที่สําคัญ ที่คุณต้องติดตามสําหรับ Conversion จะช่วยให้คุณกําหนด คีย์ฝั่งทริกเกอร์ได้ เช่น
โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย = <50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: 2 มิติข้อมูล: หมวดหมู่ผลิตภัณฑ์ (เช่น 100
ความเป็นไปได้) ประเภท Conversion (เช่น 5 ความเป็นไปได้)
- การผสมผสานมิติข้อมูลที่เป็นไปได้ = 100 x 5 = 500
- ต้องสำรอง 9 บิต (9 บิต = 512 ชุดค่าผสมที่เป็นไปได้)
- ตอบ: 2 มิติข้อมูล: หมวดหมู่ผลิตภัณฑ์ (เช่น 100
ความเป็นไปได้) ประเภท Conversion (เช่น 5 ความเป็นไปได้)
โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, ค่าใช้จ่าย = <50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: 3 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
- การผสมผสานมิติข้อมูลที่เป็นไปได้ = 50 x 10 x 3 = 1,500
- ต้องจอง 11 บิต (11 บิต = ชุดค่าผสมที่เป็นไปได้ 2,048 ชุด)
- ตอบ: 3 มิติข้อมูล ได้แก่ หมวดหมู่ผลิตภัณฑ์ (เช่น 50
ความเป็นไปได้), ประเภทผลิตภัณฑ์ (10 ความเป็นไปได้), ประเภท Conversion (3 ความเป็นไปได้)
โครงสร้างที่สำคัญ 3: ทำซ้ำ (วางแผนในลักษณะเดียวกันสำหรับโครงสร้างที่สำคัญทั้งหมดที่คุณมี)
การประมาณค่าสำหรับคีย์รวม
- โครงสร้างคีย์ 1: คีย์การแสดงผล 250,000 รายการ x คีย์ Conversion 500 รายการ = คีย์ 125,000,000 รายการ
- โครงสร้างคีย์ 2: คีย์การแสดงผล 360,000 รายการ x คีย์ Conversion 1,500 รายการ = 540,000,000 คีย์
- โครงสร้างหลัก 3: (วางแผนสำหรับโครงสร้างหลักทั้งหมดที่คุณมีในลักษณะเดียวกัน)
- ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
- คีย์รวมสูงสุด = 540,000,000 คีย์ (ในโครงสร้างคีย์ทั้งหมด) ต้องจอง 30 บิต (30 บิต = ชุดค่าผสมที่เป็นไปได้ 1.07 พันล้านชุด)
ปริมาณ Conversion ที่คาดการณ์
สำหรับโครงสร้างคีย์การรวมแต่ละรายการ คุณสามารถอธิบายปริมาณที่คาดการณ์ไว้ได้ โดยใช้ตัวอย่างต่อไปนี้
- โครงสร้างคีย์ 1: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย =
<50,000, ปริมาณ Conversion = ต่ำ)
- ตอบ: คาดว่าโครงสร้างหลัก 1 จะมีมูลค่าการใช้จ่ายของผู้ลงโฆษณาประมาณ $500,000 ในไตรมาสถัดไป โดยมีราคา CPM เฉลี่ยอยู่ที่ $8 คาดการณ์ว่า การดำเนินการนี้จะส่งผลให้มีการแสดงผล 62,500,000 ครั้งที่ต้องลงทะเบียน
- คาดการณ์ว่าอัตราการแสดงผลต่อ Conversion โดยเฉลี่ยที่โครงสร้างคีย์ 1 จะมีในช่วงไตรมาสถัดไปคือ 0.08% ซึ่งจะส่งผลให้เกิด 50,000 Conversion ที่มาจากการระบุแหล่งที่มาซึ่งต้องบันทึก สําหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจํานวนการซื้อ
- โครงสร้างคีย์ 2: (อุตสาหกรรม = ประกันภัย, การใช้จ่าย =
<50,000, ปริมาณ Conversion = ปานกลาง)
- ตอบ: คาดการณ์ว่าคีย์ 2 จะมีมูลค่าการใช้จ่ายประมาณ 8,000,000 บาทในไตรมาสถัดไป โดยมีราคา CPM เฉลี่ยอยู่ที่ 100 บาท คาดการณ์ว่าการดำเนินการนี้จะส่งผลให้เกิดการแสดงผล 80,000,000 ครั้ง ซึ่งต้องลงทะเบียน
- คาดการณ์ว่าอัตราการแสดงผลต่อ Conversion โดยเฉลี่ยที่คีย์ 2 จะมีในช่วงไตรมาสถัดไปคือ 0.03125% ซึ่งจะส่งผลให้เกิด 25,000 Conversion ที่มาจากการระบุแหล่งที่มาซึ่งต้องบันทึก สําหรับ Conversion แต่ละรายการ ให้วัดมูลค่าการซื้อและจํานวนการซื้อ
- ทำซ้ำสำหรับโครงสร้างคีย์แต่ละรายการ
ความถี่ในการส่งรายงานและการจัดกลุ่ม (กลุ่มต่อผู้ลงโฆษณา)**
สำหรับโครงสร้างคีย์การรวบรวมแต่ละรายการ คุณจะต้องมีรายงาน Conversion ที่ส่ง
เป็นประจำ เราขอแนะนําให้เทคโนโลยีโฆษณาดําเนินการเป็นกลุ่มตามผู้ลงโฆษณา (เพื่อการแยกข้อมูลต่อรายงานที่ชัดเจนยิ่งขึ้นและการรวบรวมที่มีประสิทธิภาพมากขึ้น) และใช้ฟิลด์ shared_info.scheduled_report_time ของรายงานสําหรับการจัดกลุ่ม
- ตอบ: รายชั่วโมง
- ข: รายวัน
- ค: รายสัปดาห์
หมายเหตุ
- สำหรับการจัดกลุ่มตามผู้ลงโฆษณา ให้ยืนยัน SLA กับผู้ลงโฆษณา
การจัดกลุ่มที่บ่อยขึ้นจะทำให้มีสัญญาณรบกวนต่อกลุ่มมากขึ้น (ดูที่ การตัดสินใจ: ความถี่ของกลุ่ม)
หากต้องการหลีกเลี่ยงข้อผิดพลาดเนื่องจากการจัดกลุ่มที่ไม่ถูกต้อง ให้ตรวจสอบว่ากลุ่มใช้ฟิลด์
scheduled_report_timeไม่ใช่report arrival timeเช่น หากคุณจัดกลุ่มทุกชั่วโมง กลุ่มสำหรับเวลา 11:00 น. ควรมีเฉพาะรายงานที่มีscheduled_report_timeระหว่างเวลา 10:00 น. ถึง 11:00 น. และไม่ใช่รายงานที่มาถึงระหว่างเวลา 10:00 น. ถึง 11:00 น. ที่มีscheduled_report_timeอื่น (เช่น 9:00 น.)
การประมาณปริมาณรายงาน
- โครงสร้างคีย์ 1: 50,000 Conversion ที่มาจากการระบุแหล่งที่มา / 2160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 24 รายการต่อชั่วโมงต่อผู้ลงโฆษณา (24 x ผู้ลงโฆษณา 1,000 ราย = รายงานสรุป 24,000 รายการ)
- โครงสร้างคีย์ 2: 25,000 Conversion ที่ระบุแหล่งที่มา / 2160 (การรายงานรายชั่วโมง ชั่วโมงในไตรมาส) = รายงานสรุป 12 รายการต่อชั่วโมงต่อผู้ลงโฆษณา (12 x ผู้ลงโฆษณา 1,000 ราย = รายงานสรุป 12,000 รายการ)
- โครงสร้างคีย์ 3: ทำซ้ำ
- จำนวนรายงานสรุปทั้งหมดต่อชั่วโมง = รายงานสรุป 24 รายการสำหรับโครงสร้างคีย์ 1 + รายงานสรุป 12 รายการสำหรับโครงสร้างคีย์ 2 + ... = ... ต่อชั่วโมง ต่อผู้ลงโฆษณา
สรุปความคิดเห็น
การทำความเข้าใจการประมาณต่อไปนี้จากเทคโนโลยีโฆษณาช่วยให้เราวางแผนฟีเจอร์และการปรับปรุงเพื่อรองรับขนาดที่เทคโนโลยีโฆษณากำหนดได้ เราขอแนะนำให้คุณ แชร์ข้อมูลต่อไปนี้กับเรา ดูข้อมูลเพิ่มเติมได้ที่ คำแนะนำในการกำหนดขนาดสำหรับบริการรวบรวมข้อมูลใน AWS
- คีย์โดเมนอินพุตสูงสุด (คีย์ที่จะรวม) ต่องานบริการรวมข้อมูล
- ปริมาณรายงานอินพุตสูงสุดต่องาน (Conversion ที่ระบุแหล่งที่มา)
- การมีส่วนร่วมโดยประมาณต่อรายงาน (คู่คีย์/ค่าในรายงาน)
- การกระจาย Conversion ที่มาจากการระบุแหล่งที่มาโดยประมาณต่องาน
- การกระจายคีย์โดเมนโดยประมาณในงาน
- จำนวนงานโดยประมาณต่อชั่วโมง/วัน/สัปดาห์