บริการรวมข้อมูลจะให้ข้อมูลเชิงลึกด้านประสิทธิภาพที่เทคโนโลยีโฆษณาต้องการเพื่อปรับปรุงประสิทธิภาพของแคมเปญกับลูกค้า
เอกสารนี้ครอบคลุม
- คำศัพท์และแนวคิดสำคัญ
- วิธีการทำงานของบริการรวมข้อมูลเพื่อให้คุณได้รับข้อมูล Conversion แบบละเอียดและการวัดการเข้าถึงจากรายงานแบบรวมข้อมูลดิบ
- ภาพรวมเชิงแนวคิดของการจัดกลุ่มรายงานที่รวบรวมได้
- ภาพรวมเชิงแนวคิดของคอมโพเนนต์ระบบคลาวด์
เอกสารนี้มีไว้สำหรับใคร
หน้านี้ช่วยให้เทคโนโลยีโฆษณาและนักพัฒนาซอฟต์แวร์เข้าใจวิธีที่ API ของเราช่วยให้การวัดผลโฆษณาเป็นไปอย่างมีประสิทธิภาพและรักษาความเป็นส่วนตัว
เอกสารนี้ถือว่าคุณคุ้นเคยกับ Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage และTrusted Execution Environments
คำและแนวคิดสำคัญ
ทำความคุ้นเคยกับคำศัพท์สำคัญก่อนดำเนินการต่อ
อภิธานศัพท์
- เทคโนโลยีโฆษณา
-
แพลตฟอร์มโฆษณาคือบริษัทที่ให้บริการแสดงโฆษณา
- รายงานที่รวบรวมได้
-
รายงานที่รวบรวมได้คือรายงานที่เข้ารหัสซึ่งส่งจากอุปกรณ์ของผู้ใช้แต่ละราย รายงานเหล่านี้มีข้อมูลเกี่ยวกับพฤติกรรมของผู้ใช้และ Conversion ข้ามเว็บไซต์ ผู้ลงโฆษณาหรือเทคโนโลยีโฆษณาจะกําหนด Conversion (บางครั้งเรียกว่าเหตุการณ์ทริกเกอร์การระบุแหล่งที่มา) และเมตริกที่เกี่ยวข้อง แต่ละรายงานได้รับการเข้ารหัสเพื่อป้องกันไม่ให้บุคคลต่างๆ เข้าถึงข้อมูลพื้นฐาน
- การบัญชีรายงานที่รวบรวมได้
-
บัญชีแยกประเภทแบบกระจายที่อยู่ในผู้ประสานงานทั้ง 2 ราย ซึ่งติดตามงบประมาณความเป็นส่วนตัวที่จัดสรรและบังคับใช้กฎ "ไม่ซ้ำกัน" นี่เป็นกลไกการคุ้มครองความเป็นส่วนตัวที่ทำงานภายในผู้ประสานงาน ซึ่งช่วยให้มั่นใจว่าไม่มีรายงานใดส่งผ่านบริการรวบรวมข้อมูลเกินงบประมาณความเป็นส่วนตัวที่กำหนดไว้
อ่านเพิ่มเติมเกี่ยวกับความสัมพันธ์ระหว่างกลยุทธ์การแบ่งกลุ่มกับรายงานที่รวบรวมได้
- งบประมาณการบัญชีของรายงานที่รวบรวมได้
-
การอ้างอิงงบประมาณที่ช่วยให้มั่นใจว่าระบบจะไม่ประมวลผลรายงานแต่ละรายการมากกว่า 1 ครั้ง
- บริการรวมข้อมูล
-
บริการที่ดำเนินการโดยเทคโนโลยีโฆษณาซึ่งประมวลผลรายงานที่รวบรวมได้เพื่อสร้างรายงานสรุป
อ่านข้อมูลเพิ่มเติมเกี่ยวกับเบื้องหลังของบริการรวบรวมข้อมูลได้ในคำอธิบายและรายการข้อกำหนดฉบับเต็ม
- การรับรอง
-
กลไกในการตรวจสอบสิทธิ์ข้อมูลระบุตัวตนของซอฟต์แวร์ โดยปกติจะใช้แฮชการเข้ารหัสหรือลายเซ็น สำหรับการเสนอบริการรวบรวมข้อมูล การรับรองจะจับคู่โค้ดที่ทำงานในบริการรวบรวมข้อมูลที่คุณดำเนินการโดยเทคโนโลยีโฆษณากับโค้ดโอเพนซอร์ส
- การสร้างความผูกพันผ่านการมีส่วนร่วม
- ผู้ประสานงาน
-
หน่วยงานที่รับผิดชอบการจัดการคีย์และการบัญชีรายงานที่รวบรวมได้ ผู้ประสานงานจะดูแลรักษารายการแฮชของการกำหนดค่าบริการรวบรวมข้อมูลที่อนุมัติและกำหนดค่าการเข้าถึงคีย์การถอดรหัส
- สัญญาณรบกวนและการปรับขนาด
-
ข้อมูลรบกวนทางสถิติที่เพิ่มลงในรายงานสรุประหว่างกระบวนการรวบรวมเพื่อรักษาความเป็นส่วนตัวและตรวจสอบว่ารายงานสุดท้ายให้ข้อมูลการวัดผลโดยไม่ระบุตัวบุคคล
อ่านเพิ่มเติมเกี่ยวกับกลไกการเพิ่มสัญญาณรบกวนซึ่งดึงมาจากการแจกแจง Laplace
- แหล่งที่มาของการรายงาน
-
บุคคลที่รับรายงานที่รวบรวมได้ กล่าวคือ คุณหรือเทคโนโลยีโฆษณาที่เรียกใช้ Attribution Reporting API ระบบจะส่งรายงานที่รวบรวมได้จากอุปกรณ์ของผู้ใช้ไปยัง URL ที่รู้จักกันดีซึ่งเชื่อมโยงกับต้นทางการรายงาน ต้นทางการรายงานจะกําหนดในระหว่างการลงทะเบียน
- รหัสที่แชร์
-
ค่าที่คำนวณแล้วซึ่งประกอบด้วย
shared_info,reporting_origin,destination_site(สําหรับ Attribution Reporting API เท่านั้น),source_registration-time(สําหรับ Attribution Reporting API เท่านั้น),scheduled_report_timeและเวอร์ชันรายงานหลายรายการที่ใช้แอตทริบิวต์เดียวกันในช่อง
shared_infoควรมีรหัสที่แชร์เดียวกัน รหัสที่แชร์มีบทบาทสําคัญในบัญชีรายงานที่รวบรวมได้ - รายงานสรุป
-
ประเภทรายงาน Attribution Reporting API และ Private Aggregation API รายงานสรุปจะรวมข้อมูลผู้ใช้แบบรวม และอาจมีข้อมูล Conversion โดยละเอียดที่มีการเพิ่มสัญญาณรบกวน รายงานสรุปประกอบด้วยรายงานสรุป รายงานเหล่านี้มีความยืดหยุ่นมากขึ้นและมีโมเดลข้อมูลที่สมบูรณ์กว่าการรายงานระดับเหตุการณ์ โดยเฉพาะสําหรับกรณีการใช้งานบางรายการ เช่น มูลค่า Conversion
- สภาพแวดล้อมการดำเนินการที่เชื่อถือได้ (TEE)
-
การกําหนดค่าฮาร์ดแวร์และซอฟต์แวร์คอมพิวเตอร์ที่ปลอดภัยซึ่งช่วยให้บุคคลภายนอกตรวจสอบเวอร์ชันที่แน่นอนของซอฟต์แวร์ที่ทํางานบนเครื่องได้โดยไม่ต้องกลัวว่าข้อมูลจะรั่วไหล TEE อนุญาตให้บุคคลภายนอกตรวจสอบได้ว่าซอฟต์แวร์ทํางานตามที่ผู้ผลิตซอฟต์แวร์กล่าวอ้างไว้ทุกประการ
ดูข้อมูลเพิ่มเติมเกี่ยวกับ TEE ที่ใช้สำหรับข้อเสนอ Privacy Sandbox ได้ที่คำอธิบายบริการ Protected Audience API และคำอธิบายบริการรวบรวมข้อมูล
เวิร์กโฟลว์ของบริการรวมข้อมูล
บริการรวมข้อมูลจะสร้างรายงานสรุปของข้อมูล Conversion และการเข้าถึงแบบละเอียดจากรายงานแบบรวมที่ยังไม่ได้ประมวลผล ขั้นตอนการสร้างรายงานประกอบด้วยขั้นตอนต่อไปนี้
- เบราว์เซอร์จะดึงข้อมูลคีย์สาธารณะเพื่อสร้างรายงานที่เข้ารหัส
- ระบบจะส่งรายงานที่รวมได้ซึ่งเข้ารหัสแล้วไปยังเซิร์ฟเวอร์เทคโนโลยีโฆษณา
- เซิร์ฟเวอร์เทคโนโลยีโฆษณาจะจัดกลุ่มรายงาน (ในรูปแบบ avro) และส่งไปยังบริการรวมข้อมูล
- Aggregation Worker จะดึงข้อมูลรายงานที่รวบรวมไว้เพื่อถอดรหัส
- Worker การรวบรวมจะเรียกคีย์การถอดรหัสจาก Coordinator
- Aggregation Worker จะถอดรหัสรายงานเพื่อการรวมข้อมูลและการเพิ่มสัญญาณรบกวน
- บริการบัญชีรายงานที่รวมได้จะตรวจสอบว่ามีงบประมาณด้านความเป็นส่วนตัวเพียงพอที่จะสร้างรายงานสรุปสําหรับรายงานที่รวมได้ที่ระบุหรือไม่
- บริการรวมข้อมูลจะส่งรายงานสรุปสุดท้าย
แผนภาพต่อไปนี้แสดงการทํางานของบริการรวมข้อมูล ตั้งแต่เวลาที่ได้รับรายงานจากเว็บและอุปกรณ์เคลื่อนที่ ไปจนถึงเวลาที่บริการรวมข้อมูลสร้างรายงานสรุป
โดยสรุปแล้ว Attribution Reporting API หรือ Private Aggregation API จะสร้างรายงานจากอินสแตนซ์เบราว์เซอร์หลายรายการ Chrome จะรับคีย์สาธารณะที่หมุนเวียนทุก 7 วันจากบริการโฮสติงคีย์ในตัวประสานงานเพื่อเข้ารหัสรายงานก่อนส่งไปยังต้นทางการรายงานเทคโนโลยีโฆษณา ต้นทางของการรายงานเทคโนโลยีโฆษณารวบรวมและแปลงรายงานขาเข้าไปยังรูปแบบ Avro แล้วส่งไปยังบริการรวมข้อมูล เมื่อส่งคำขอแบบกลุ่มไปยังบริการรวมข้อมูลแล้ว บริการจะดึงคีย์การถอดรหัสจากบริการโฮสติงคีย์ ถอดรหัสรายงาน แล้วรวมและเพิ่มสัญญาณรบกวนเพื่อสร้างรายงานสรุป ตราบใดที่มีงบประมาณด้านความเป็นส่วนตัวเพียงพอที่จะสร้างรายงาน
ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมได้ในส่วนการติดตั้งใช้งาน
การจัดกลุ่มรายงานที่รวบรวมได้
ขั้นตอนการรายงานจะเสร็จสมบูรณ์ไม่ได้หากไม่มีความช่วยเหลือจากเซิร์ฟเวอร์ต้นทางสำหรับการรายงานที่กำหนด ซึ่งคุณระบุไว้ในกระบวนการลงทะเบียน ต้นทางการรายงานมีหน้าที่รวบรวม แปลง และจัดกลุ่มรายงานที่รวมได้ รวมถึงเตรียมรายงานเพื่อส่งไปยังบริการรวมข้อมูลใน Google Cloud หรือ Amazon Web Services อ่านเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมได้
คอมโพเนนต์ระบบคลาวด์
บริการรวมข้อมูลประกอบด้วยคอมโพเนนต์บริการระบบคลาวด์หลายรายการ คุณใช้สคริปต์ Terraform ที่ให้ไว้เพื่อจัดสรรและกำหนดค่าคอมโพเนนต์บริการคลาวด์ที่จำเป็นทั้งหมด
บริการฟรอนท์เอนด์
บริการระบบคลาวด์ที่มีการจัดการ: Cloud Functions (Google Cloud) / API Gateway (Amazon Web Services)
บริการส่วนหน้าคือเกตเวย์แบบไร้เซิร์ฟเวอร์ซึ่งเป็นจุดแรกเข้าหลักสำหรับการเรียกใช้ Aggregation API เพื่อสร้างงานและดึงข้อมูลสถานะงาน โดยมีหน้าที่รับคำขอจากผู้ใช้บริการรวมข้อมูล ตรวจสอบพารามิเตอร์อินพุต และเริ่มกระบวนการกำหนดเวลางานการรวมข้อมูล
บริการส่วนหน้ามี API 2 รายการที่พร้อมใช้งาน ดังนี้
| ปลายทาง | คำอธิบาย |
|---|---|
createJob |
API นี้จะทริกเกอร์งานบริการรวมข้อมูล หากต้องการทริกเกอร์งาน คุณจะต้องระบุข้อมูล เช่น รหัสงาน รายละเอียดพื้นที่เก็บข้อมูลอินพุต รายละเอียดพื้นที่เก็บข้อมูลเอาต์พุต และแหล่งที่มาของการรายงาน |
getJob |
API นี้จะแสดงสถานะของงานที่มีรหัสงานที่ระบุ โดยจะให้ข้อมูลเกี่ยวกับสถานะของงาน เช่น "ได้รับแล้ว" "กำลังดำเนินการ" หรือ "เสร็จสิ้นแล้ว" หากงานเสร็จสิ้นแล้ว ระบบจะแสดงผลลัพธ์ของงาน รวมถึงข้อความแสดงข้อผิดพลาดที่พบระหว่างการเรียกใช้งานด้วย |
ดูเอกสารประกอบเกี่ยวกับ API ของบริการรวมข้อมูล
คิวงาน
บริการระบบคลาวด์ที่มีการจัดการ: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
คิวงานคือคิวข้อความที่มีคำของานสำหรับบริการรวมข้อมูล บริการส่วนหน้าจะแทรกคำของานลงในคิว จากนั้น Aggregation Worker จะใช้คำขอเหล่านั้นเพื่อประมวลผล
Cloud Storage
บริการระบบคลาวด์ที่มีการจัดการ: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)
ระบบจะเก็บไฟล์อินพุตและเอาต์พุตที่ใช้โดยบริการรวมข้อมูล เช่น ไฟล์รายงานที่เข้ารหัสและรายงานสรุปเอาต์พุต ไว้ในที่เก็บข้อมูลระบบคลาวด์
ฐานข้อมูลข้อมูลเมตาของงาน
บริการระบบคลาวด์ที่มีการจัดการ: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
ระบบจะใช้ฐานข้อมูลข้อมูลเมตาของงานเพื่อจัดเก็บและติดตามสถานะของงานรวมข้อมูล โดยจะบันทึกข้อมูลเมตา เช่น เวลาที่สร้าง เวลาที่ขอ เวลาที่อัปเดต และสถานะ เช่น ได้รับแล้ว กำลังดำเนินการ หรือเสร็จสิ้น Aggregation Worker จะอัปเดตฐานข้อมูลข้อมูลเมตาของงานเมื่อมีการดำเนินการกับงาน
Aggregator Worker
บริการระบบคลาวด์ที่มีการจัดการ: Compute Engine ที่มีพื้นที่ Confidential (Google Cloud) / Amazon Web Services EC2 ที่มี Nitro Enclave (Amazon Web Services)
Aggregation Worker จะประมวลผลคำของานในคิวงาน และถอดรหัสอินพุตที่เข้ารหัสโดยใช้คีย์ที่ดึงมาจากบริการสร้างและแจกจ่ายคีย์ (KGDS) ใน Coordinator เพื่อลดเวลาในการประมวลผลงาน ผู้ปฏิบัติงานการรวบรวมจะแคชคีย์การถอดรหัสเป็นระยะเวลา 8 ชั่วโมง และใช้คีย์ดังกล่าวในงานที่ประมวลผล
Aggregator Worker จะทำงานภายในอินสแตนซ์สภาพแวดล้อมการดำเนินการที่เชื่อถือได้ (TEE) ผู้ปฏิบัติงานจะจัดการงานได้ครั้งละ 1 งานเท่านั้น คุณกำหนดค่าผู้ปฏิบัติงานหลายคนให้ประมวลผลงานแบบขนานได้โดยการตั้งค่าการปรับขนาดอัตโนมัติ หากใช้ การปรับขนาดอัตโนมัติจะปรับจำนวนผู้ปฏิบัติงานแบบไดนามิกตามจำนวนข้อความในคิวงาน คุณกำหนดค่าจำนวนผู้ปฏิบัติงานขั้นต่ำและสูงสุดสำหรับการปรับขนาดอัตโนมัติผ่านไฟล์สภาพแวดล้อม Terraform ได้ ดูข้อมูลเพิ่มเติมเกี่ยวกับการปรับขนาดอัตโนมัติได้ในสคริปต์ Terraform เหล่านี้: Amazon Web Services หรือ Google Cloud
Worker การรวมข้อมูลจะเรียกใช้บริการบันทึกการใช้งานรายงานที่รวบรวมได้เพื่อบันทึกการใช้งานรายงานที่รวบรวมได้ บริการนี้จะยืนยันว่าระบบจะเรียกใช้การดำเนินการก็ต่อเมื่อยังไม่เกินขีดจำกัดงบประมาณด้านความเป็นส่วนตัว (ดูกฎ"ห้ามซ้ำ") หากมีงบประมาณ ระบบจะสร้างรายงานสรุปโดยใช้การรวมข้อมูลที่มีการเพิ่มสัญญาณรบกวน อ่านรายละเอียดเพิ่มเติมเกี่ยวกับการบัญชีรายงานที่รวบรวมได้
Aggregator Worker จะอัปเดตข้อมูลเมตาของงานในฐานข้อมูลข้อมูลเมตาของงาน ข้อมูลนี้รวมถึงรหัสการคืนงานและตัวนับข้อผิดพลาดของรายงานในกรณีที่รายงานบางส่วนล้มเหลว ผู้ใช้สามารถดึงข้อมูลสถานะได้โดยใช้ getJobAPI การดึงข้อมูลสถานะของงาน
ดูคำอธิบายโดยละเอียดเกี่ยวกับบริการรวมข้อมูลได้ในคำอธิบายนี้
ขั้นตอนถัดไป
ตอนนี้คุณทราบวิธีการทำงานของบริการรวบรวมข้อมูลแล้ว ให้ทำตามคู่มือการเริ่มต้นใช้งานเพื่อติดตั้งใช้งานอินสแตนซ์ของคุณเองผ่าน Google Cloud หรือ Amazon Web Services