Dịch vụ tổng hợp cung cấp cho các công nghệ quảng cáo thông tin chi tiết về hiệu suất cần thiết để cải thiện hiệu quả của chiến dịch với khách hàng.
Tài liệu này đề cập đến:
- Các thuật ngữ và khái niệm chính
- Cách hoạt động của Dịch vụ tổng hợp để cung cấp cho bạn dữ liệu chi tiết về lượt chuyển đổi và thông tin đo lường phạm vi tiếp cận từ các báo cáo thô có thể tổng hợp
- Tổng quan về khái niệm phân lô báo cáo có thể tổng hợp
- Tổng quan về khái niệm các thành phần trên đám mây
Tài liệu này dành cho ai?
Trang này giúp các công nghệ quảng cáo và nhà phát triển hiểu cách các API của chúng tôi cho phép đo lường quảng cáo hiệu quả mà vẫn bảo vệ quyền riêng tư.
Tài liệu này giả định rằng bạn đã quen thuộc với Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage và Trusted Execution Environments.
Các thuật ngữ và khái niệm chính
Hãy làm quen với các thuật ngữ chính trước khi tiếp tục:
Bảng thuật ngữ
- Công nghệ quảng cáo
-
Nền tảng quảng cáo là công ty cung cấp dịch vụ phân phối quảng cáo.
- Các báo cáo tổng hợp
-
Báo cáo tổng hợp là các báo cáo được mã hoá được gửi từ thiết bị của từng người dùng. Các báo cáo này chứa dữ liệu về hành vi và lượt chuyển đổi của người dùng trên nhiều trang web. Lượt chuyển đổi (đôi khi được gọi là sự kiện kích hoạt phân bổ) và các chỉ số liên quan do nhà quảng cáo hoặc công nghệ quảng cáo xác định. Mỗi báo cáo được mã hoá để ngăn các bên khác nhau truy cập vào dữ liệu cơ bản.
- Hạch toán báo cáo tổng hợp
-
Sổ cái phân tán, nằm trong cả hai trình điều phối, theo dõi ngân sách quyền riêng tư được phân bổ và thực thi quy tắc "Không trùng lặp". Đây là cơ chế bảo đảm quyền riêng tư, nằm và chạy trong các trình điều phối, đảm bảo không có báo cáo nào đi qua Dịch vụ tổng hợp ngoài ngân sách quyền riêng tư được phân bổ.
Đọc thêm về mối quan hệ giữa chiến lược phân lô và báo cáo tổng hợp.
- Ngân sách hạch toán báo cáo tổng hợp
-
Tham chiếu đến ngân sách để đảm bảo các báo cáo riêng lẻ không được xử lý nhiều lần.
- Dịch vụ tổng hợp
-
Một dịch vụ do công nghệ quảng cáo vận hành, xử lý các báo cáo tổng hợp để tạo báo cáo tóm tắt.
Đọc thêm về câu chuyện đằng sau Dịch vụ tổng hợp trong bài viết giải thích và danh sách đầy đủ các điều khoản.
- Chứng thực
-
Cơ chế xác thực danh tính phần mềm, thường là bằng hàm băm mã hoá hoặc chữ ký. Đối với đề xuất dịch vụ tổng hợp, quy trình chứng thực sẽ so khớp mã chạy trong dịch vụ tổng hợp do công nghệ quảng cáo của bạn vận hành với mã nguồn mở.
- Liên kết đóng góp
- Điều phối viên
-
Các pháp nhân chịu trách nhiệm quản lý khoá và hạch toán báo cáo tổng hợp. Trình điều phối duy trì danh sách hàm băm của các cấu hình dịch vụ tổng hợp đã phê duyệt và định cấu hình quyền truy cập vào khoá giải mã.
- Độ nhiễu và tỷ lệ
-
Độ nhiễu thống kê được thêm vào báo cáo tóm tắt trong quá trình tổng hợp để bảo vệ quyền riêng tư và đảm bảo báo cáo cuối cùng cung cấp thông tin đo lường ẩn danh.
Đọc thêm về cơ chế nhiễu cộng thêm, được lấy từ phân phối Laplace.
- Nguồn gốc báo cáo
-
Pháp nhân nhận báo cáo tổng hợp – nói cách khác, bạn hoặc một công nghệ quảng cáo đã gọi API Báo cáo phân bổ. Báo cáo tổng hợp được gửi từ thiết bị của người dùng đến một URL phổ biến được liên kết với nguồn báo cáo. Nguồn gốc báo cáo được chỉ định trong quá trình đăng ký.
- Mã nhận dạng chung
-
Một giá trị được tính toán bao gồm
shared_info,reporting_origin,destination_site(chỉ dành cho Attribution Reporting API),source_registration-time(chỉ dành cho Attribution Reporting API),scheduled_report_timevà phiên bản.Nhiều báo cáo có cùng thuộc tính trong trường
shared_infophải có cùng một mã nhận dạng dùng chung. Mã nhận dạng dùng chung đóng vai trò quan trọng trong tính năng Hạch toán báo cáo tổng hợp. - Báo cáo tóm tắt
-
Loại báo cáo Attribution Reporting API và Private Aggregation API. Báo cáo tóm tắt bao gồm dữ liệu người dùng tổng hợp và có thể chứa dữ liệu chuyển đổi chi tiết kèm theo nhiễu. Báo cáo tóm tắt được tạo thành từ các báo cáo tổng hợp. Các báo cáo này cho phép linh hoạt hơn và cung cấp mô hình dữ liệu phong phú hơn so với báo cáo ở cấp sự kiện, đặc biệt là đối với một số trường hợp sử dụng như giá trị lượt chuyển đổi.
- Môi trường thực thi đáng tin cậy (TEE)
-
Cấu hình bảo mật của phần cứng và phần mềm máy tính cho phép các bên bên ngoài xác minh chính xác các phiên bản phần mềm đang chạy trên máy mà không sợ bị lộ. TEE cho phép các bên bên ngoài xác minh rằng phần mềm thực hiện chính xác những gì nhà sản xuất phần mềm tuyên bố.
Để tìm hiểu thêm về TEE được dùng cho các đề xuất về Hộp cát về quyền riêng tư, hãy đọc tài liệu giải thích về các dịch vụ Protected Audience API và tài liệu giải thích về Dịch vụ tổng hợp.
Quy trình làm việc của Dịch vụ tổng hợp
Aggregation Service tạo báo cáo tóm tắt về dữ liệu chi tiết về lượt chuyển đổi và phạm vi tiếp cận từ các báo cáo thô có thể tổng hợp. Quy trình tạo báo cáo bao gồm các bước sau:
- Trình duyệt tìm nạp khoá công khai để tạo báo cáo được mã hoá.
- Các báo cáo tổng hợp đã mã hoá được gửi đến máy chủ công nghệ quảng cáo.
- Máy chủ công nghệ quảng cáo phân lô các báo cáo (ở định dạng avro) và gửi các báo cáo đó đến Dịch vụ tổng hợp.
- Aggregation Worker truy xuất các báo cáo tổng hợp để giải mã.
- Aggregation Worker truy xuất các khoá giải mã từ một Coordinator.
- Aggregation Worker sẽ giải mã các báo cáo để tổng hợp và làm nhiễu.
- Dịch vụ kế toán báo cáo có thể tổng hợp sẽ kiểm tra xem có đủ hạn mức quyền riêng tư để tạo báo cáo tóm tắt cho các báo cáo có thể tổng hợp đã cho hay không.
- Dịch vụ tổng hợp gửi báo cáo tóm tắt cuối cùng.
Biểu đồ sau đây cho thấy cách thức hoạt động của Dịch vụ tổng hợp, từ thời điểm nhận báo cáo từ các thiết bị di động và web, cho đến thời điểm Dịch vụ tổng hợp tạo báo cáo tóm tắt.
Tóm lại, Attribution Reporting API hoặc Private Aggregation API tạo báo cáo từ nhiều phiên bản trình duyệt. Chrome lấy một khoá công khai (được xoay vòng 7 ngày một lần) từ Dịch vụ lưu trữ khoá trong Trình điều phối để mã hoá các báo cáo trước khi gửi đến nguồn báo cáo công nghệ quảng cáo. Nguồn gốc báo cáo của công nghệ quảng cáo sẽ thu thập và chuyển đổi các báo cáo đến sang định dạng avro, rồi gửi các báo cáo đó đến Dịch vụ tổng hợp. Sau đó, khi một yêu cầu theo lô được gửi đến Dịch vụ tổng hợp, dịch vụ này sẽ tìm nạp các khoá giải mã từ Dịch vụ lưu trữ khoá, giải mã các báo cáo, đồng thời tổng hợp và làm nhiễu các báo cáo đó để tạo báo cáo tóm tắt, miễn là có đủ ngân sách quyền riêng tư để tạo các báo cáo đó.
Tìm hiểu thêm về cách chuẩn bị báo cáo có thể tổng hợp trong phần triển khai.
Phân lô báo cáo tổng hợp
Quy trình báo cáo sẽ không hoàn tất nếu không có sự trợ giúp của máy chủ gốc báo cáo được chỉ định mà bạn đã chỉ định trong quy trình đăng ký. Nguồn báo cáo chịu trách nhiệm thu thập, chuyển đổi và phân lô các báo cáo có thể tổng hợp, đồng thời chuẩn bị các báo cáo đó để gửi đến Dịch vụ tổng hợp của bạn trong Google Cloud hoặc Amazon Web Services. Đọc thêm về cách chuẩn bị báo cáo có thể tổng hợp.
Thành phần đám mây
Dịch vụ tổng hợp bao gồm một số thành phần dịch vụ đám mây. Bạn sử dụng các tập lệnh Terraform được cung cấp để cung cấp và định cấu hình tất cả các thành phần dịch vụ đám mây cần thiết.
Dịch vụ giao diện người dùng
Dịch vụ đám mây được quản lý: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)
Dịch vụ giao diện người dùng là một cổng không máy chủ, là điểm truy cập chính cho các lệnh gọi Aggregation API để tạo công việc và truy xuất trạng thái công việc. Dịch vụ này chịu trách nhiệm nhận yêu cầu từ người dùng Dịch vụ tổng hợp, xác thực các tham số đầu vào và bắt đầu quy trình lập lịch cho tác vụ tổng hợp.
Dịch vụ giao diện người dùng có 2 API:
| Điểm cuối | Mô tả |
|---|---|
createJob |
API này kích hoạt một tác vụ của Dịch vụ tổng hợp. Để kích hoạt công việc, bạn cần cung cấp thông tin như mã nhận dạng công việc, thông tin chi tiết về bộ nhớ đầu vào, thông tin chi tiết về bộ nhớ đầu ra và nguồn gốc báo cáo. |
getJob |
API này trả về trạng thái của lệnh có mã lệnh được chỉ định. Thông tin này cung cấp thông tin về trạng thái của công việc, chẳng hạn như "Đã nhận", "Đang thực hiện" hoặc "Đã hoàn tất". Nếu tác vụ đã hoàn tất, thì tác vụ này cũng sẽ trả về kết quả của tác vụ, bao gồm cả mọi thông báo lỗi gặp phải trong quá trình thực thi tác vụ. |
Hãy xem Tài liệu về API Dịch vụ tổng hợp.
Hàng đợi công việc
Dịch vụ đám mây được quản lý: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
Hàng đợi công việc là một hàng đợi thông báo chứa các yêu cầu công việc cho Dịch vụ tổng hợp. Dịch vụ giao diện người dùng chèn các yêu cầu công việc vào hàng đợi, sau đó các yêu cầu này sẽ được các Aggregation Worker xử lý.
Bộ nhớ trên đám mây
Dịch vụ đám mây được quản lý: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)
Các tệp đầu vào và đầu ra mà Dịch vụ tổng hợp sử dụng (chẳng hạn như tệp báo cáo được mã hoá và báo cáo tóm tắt đầu ra) được lưu trữ trên đám mây.
Cơ sở dữ liệu siêu dữ liệu về công việc
Dịch vụ đám mây được quản lý: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
Cơ sở dữ liệu siêu dữ liệu về công việc được dùng để lưu trữ và theo dõi trạng thái của các công việc tổng hợp. Nó ghi lại siêu dữ liệu như thời gian tạo, thời gian yêu cầu, thời gian cập nhật và trạng thái như Đã nhận, Đang xử lý hoặc Đã hoàn tất. Aggregation Worker cập nhật Cơ sở dữ liệu siêu dữ liệu công việc khi công việc tiến triển.
Aggregation Worker
Dịch vụ đám mây được quản lý: Compute Engine có Không gian bảo mật (Google Cloud) / Amazon Web Services EC2 có Nitro Enclave (Amazon Web Services).
Aggregation Worker xử lý các yêu cầu về công việc trong Hàng đợi công việc và giải mã các đầu vào đã mã hoá bằng các khoá mà Aggregation Worker tìm nạp từ Dịch vụ tạo và phân phối khoá (KGDS) trong Điều phối viên. Để giảm thiểu độ trễ xử lý công việc, Aggregation Workers sẽ lưu khoá giải mã vào bộ nhớ đệm trong khoảng thời gian 8 giờ và sử dụng các khoá này trong các công việc mà chúng xử lý.
Aggregation Worker hoạt động trong một phiên bản Môi trường thực thi đáng tin cậy (TEE). Mỗi lần, một worker chỉ xử lý một công việc. Bạn có thể định cấu hình nhiều worker để xử lý các công việc song song bằng cách thiết lập cấu hình tự động mở rộng quy mô. Nếu được sử dụng, tính năng tự động mở rộng quy mô sẽ điều chỉnh động số lượng worker theo số lượng thông báo trong hàng đợi công việc. Bạn có thể định cấu hình số lượng worker tối thiểu và tối đa để tự động mở rộng quy mô thông qua tệp môi trường Terraform. Bạn có thể tìm thêm thông tin về tính năng tự động mở rộng quy mô trong các tập lệnh Terraform sau: Amazon Web Services hoặc Google Cloud.
Aggregation Worker gọi Dịch vụ hạch toán báo cáo tổng hợp để hạch toán báo cáo tổng hợp. Dịch vụ này xác minh rằng các công việc chỉ được chạy nếu chưa vượt quá hạn mức ngân sách quyền riêng tư. (Xem quy tắc "Không có nội dung trùng lặp".) Nếu có ngân sách, hệ thống sẽ tạo báo cáo tóm tắt bằng cách sử dụng các giá trị tổng hợp có nhiễu. Đọc thêm thông tin chi tiết về báo cáo có thể tổng hợp.
Aggregation Workers cập nhật siêu dữ liệu công việc trong Cơ sở dữ liệu siêu dữ liệu công việc. Thông tin này bao gồm mã trả về của công việc và bộ đếm lỗi báo cáo trong trường hợp báo cáo bị lỗi một phần. Người dùng có thể tìm nạp trạng thái bằng API truy xuất trạng thái công việc getJob.
Hãy xem tài liệu giải thích này để biết nội dung mô tả chi tiết hơn về Dịch vụ tổng hợp.
Các bước tiếp theo
Bây giờ bạn đã biết cách hoạt động của Dịch vụ tổng hợp, hãy làm theo hướng dẫn bắt đầu để triển khai phiên bản của riêng bạn thông qua Google Cloud hoặc Amazon Web Services.