Thông tin về tài liệu này
Khi đọc tài liệu này, bạn sẽ:
- Tìm hiểu những chiến lược cần tạo trước khi tạo báo cáo tóm tắt.
- Giới thiệu về Noise Lab (Phòng thí nghiệm tiếng ồn), một công cụ giúp nắm bắt hiệu ứng của nhiều tham số tiếng ồn, đồng thời cho phép khám phá và đánh giá nhanh nhiều chiến lược quản lý tiếng ồn.

Chia sẻ ý kiến phản hồi của bạn
Mặc dù tài liệu này tóm tắt một số nguyên tắc để xử lý báo cáo tóm tắt, nhưng có nhiều phương pháp quản lý tạp âm có thể không được phản ánh ở đây. Chúng tôi rất mong nhận được ý kiến đề xuất, nội dung bổ sung và câu hỏi của bạn!
- Để đưa ra ý kiến phản hồi công khai về các chiến lược quản lý tiếng ồn, về tính hữu ích hoặc quyền riêng tư của API (epsilon) và để chia sẻ những quan sát của bạn khi mô phỏng bằng Noise Lab: Bình luận về vấn đề này
- Để gửi ý kiến phản hồi công khai về Noise Lab (đặt câu hỏi, báo cáo lỗi, yêu cầu tính năng): Tạo vấn đề mới tại đây
- Để đưa ra ý kiến phản hồi công khai về một khía cạnh khác của API: Tạo vấn đề mới tại đây
Trước khi bắt đầu
- Hãy đọc bài viết Báo cáo phân bổ: báo cáo tóm tắt và Tổng quan về toàn bộ hệ thống Báo cáo phân bổ để tìm hiểu thông tin giới thiệu.
- Hãy xem bài viết Tìm hiểu về tạp âm và Tìm hiểu về khoá tổng hợp để khai thác hướng dẫn này một cách hiệu quả nhất.
Quyết định về thiết kế
Nguyên tắc thiết kế cốt lõi
Có sự khác biệt cơ bản giữa cách hoạt động của cookie của bên thứ ba và báo cáo tóm tắt. Một điểm khác biệt chính là nhiễu được thêm vào dữ liệu đo lường trong báo cáo tóm tắt. Một yếu tố khác là cách lên lịch báo cáo.
Để truy cập vào dữ liệu đo lường báo cáo tóm tắt có tỷ lệ tín hiệu trên tạp âm cao hơn, các nền tảng bên cầu (DSP) và nhà cung cấp dịch vụ đo lường quảng cáo sẽ cần phải hợp tác với nhà quảng cáo để phát triển các chiến lược quản lý tạp âm. Để phát triển các chiến lược này, DSP và nhà cung cấp dịch vụ đo lường cần đưa ra các quyết định về thiết kế. Những quyết định này xoay quanh một khái niệm thiết yếu:
Mặc dù giá trị nhiễu của phân phối được lấy từ, nói một cách tuyệt đối, chỉ phụ thuộc vào hai tham số⏤epsilon và ngân sách đóng góp⏤, nhưng bạn có một số chế độ kiểm soát khác sẽ ảnh hưởng đến tỷ lệ tín hiệu trên nhiễu của dữ liệu đo lường đầu ra.
Mặc dù chúng tôi dự kiến quy trình lặp lại sẽ đưa ra các quyết định tốt nhất, nhưng mỗi biến thể của các quyết định này sẽ dẫn đến cách triển khai hơi khác nhau. Do đó, bạn phải đưa ra các quyết định này trước khi viết từng lần lặp lại mã (và trước khi chạy quảng cáo).
Quyết định: Độ chi tiết của phương diện
Dùng thử trong Noise Lab
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên Thông số, hãy tìm Dữ liệu lượt chuyển đổi của bạn.
- Quan sát các tham số mặc định. Theo mặc định, TỔNG số lượt chuyển đổi phân bổ hằng ngày là 1.000. Số lượng này trung bình là khoảng 40 giá trị cho mỗi bộ chứa nếu bạn sử dụng chế độ thiết lập mặc định (phương diện mặc định, số lượng giá trị có thể khác nhau theo mặc định cho mỗi phương diện, Chiến lược chính A). Hãy lưu ý rằng giá trị là 40 trong mục nhập Số lượt chuyển đổi được phân bổ trung bình hằng ngày TRONG MỖI BUCKET.
- Nhấp vào Mô phỏng để chạy mô phỏng bằng các tham số mặc định.
- Trong bảng điều khiển bên Thông số, hãy tìm Phương diện. Đổi tên Địa lý thành Thành phố và thay đổi số lượng giá trị khác nhau có thể có thành 50.
- Quan sát cách điều này thay đổi Số lượt chuyển đổi trung bình hằng ngày có thể phân bổ THEO TÚI. Giờ đây, mức hao tổn này đã thấp hơn nhiều. Lý do là nếu tăng số lượng giá trị có thể có trong phương diện này mà không thay đổi bất kỳ giá trị nào khác, thì bạn sẽ tăng tổng số bộ chứa mà không thay đổi số lượng sự kiện chuyển đổi sẽ nằm trong mỗi bộ chứa.
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng: tỷ lệ nhiễu hiện cao hơn so với kết quả mô phỏng trước.
Do nguyên tắc thiết kế cốt lõi, các giá trị tóm tắt nhỏ có thể gây nhiễu nhiều hơn so với các giá trị tóm tắt lớn. Do đó, lựa chọn cấu hình của bạn ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ kết thúc trong mỗi bộ chứa (còn gọi là khoá tổng hợp) và số lượng đó ảnh hưởng đến độ nhiễu trong báo cáo tóm tắt đầu ra cuối cùng.
Một quyết định thiết kế ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một nhóm là mức độ chi tiết của phương diện. Hãy xem các ví dụ sau đây về khoá tổng hợp và phương diện của khoá:
- Phương pháp 1: một cấu trúc khoá có các phương diện thô: Quốc gia x Chiến dịch quảng cáo (hoặc nhóm tổng hợp chiến dịch lớn nhất) x Loại sản phẩm (trong số 10 loại sản phẩm có thể có)
- Phương pháp 2: một cấu trúc khoá có các phương diện chi tiết: Thành phố x Mã mẫu quảng cáo x Sản phẩm (trong số 100 sản phẩm có thể có)
Thành phố là phương diện chi tiết hơn Quốc gia; Mã mẫu quảng cáo chi tiết hơn Chiến dịch; và Sản phẩm chi tiết hơn Loại sản phẩm. Do đó, Phương pháp 2 sẽ có số sự kiện (lượt chuyển đổi) thấp hơn trên mỗi bộ chứa (= trên mỗi khoá) trong kết quả báo cáo tóm tắt so với Phương pháp 1. Do nhiễu được thêm vào đầu ra không liên quan đến số lượng sự kiện trong bộ chứa, dữ liệu đo lường trong báo cáo tóm tắt sẽ có nhiều nhiễu hơn với Phương pháp 2. Đối với mỗi nhà quảng cáo, hãy thử nghiệm nhiều mức độ chi tiết trong thiết kế khoá để có được kết quả hữu ích nhất.
Quyết định: Cấu trúc chính
Dùng thử trong Noise Lab
Ở chế độ Đơn giản, cấu trúc khoá mặc định sẽ được sử dụng. Ở chế độ Advanced (Nâng cao), bạn có thể thử nghiệm với nhiều cấu trúc khoá. Một số phương diện mẫu được đưa vào; bạn cũng có thể sửa đổi các phương diện này.
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên Parameters (Thông số), hãy tìm Key strategy (Chiến lược khoá). Hãy lưu ý rằng chiến lược mặc định (được đặt tên là A trong công cụ) sử dụng một cấu trúc khoá chi tiết bao gồm tất cả các phương diện: Vị trí địa lý x Mã chiến dịch x Danh mục sản phẩm.
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng.
- Thay đổi chiến lược chính thành B. Thao tác này sẽ hiển thị các chế độ điều khiển bổ sung để bạn định cấu hình cấu trúc khoá.
- Định cấu hình cấu trúc khoá, ví dụ:
- Số lượng cấu trúc khoá: 2
- Cấu trúc khoá 1 = Vị trí địa lý x Danh mục sản phẩm.
- Cấu trúc khoá 2 = Mã chiến dịch x Danh mục sản phẩm.
- Nhấp vào Mô phỏng.
- Lưu ý rằng giờ đây, bạn sẽ nhận được hai báo cáo tóm tắt cho mỗi loại mục tiêu đo lường (hai báo cáo cho số lượt mua, hai báo cáo cho giá trị giao dịch mua), vì bạn đang sử dụng hai cấu trúc khoá riêng biệt. Quan sát tỷ lệ nhiễu của các kênh đó.
- Bạn cũng có thể thử làm điều này với các phương diện tuỳ chỉnh của riêng mình. Để làm như vậy, hãy tìm mục Dữ liệu bạn muốn theo dõi: Phương diện. Hãy cân nhắc xoá các phương diện ví dụ và tạo phương diện của riêng bạn bằng cách sử dụng các nút Thêm/Xoá/Đặt lại bên dưới phương diện cuối cùng.
Một quyết định thiết kế khác sẽ ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một bộ chứa là cấu trúc khoá mà bạn quyết định sử dụng. Hãy xem các ví dụ sau đây về khoá tổng hợp:
- Một cấu trúc khoá có tất cả các phương diện; hãy gọi chiến lược khoá này là Chiến lược khoá A.
- Hai cấu trúc khoá, mỗi cấu trúc có một tập hợp con các phương diện; hãy gọi chiến lược khoá này là Chiến lược khoá B.

Chiến lược A đơn giản hơn, nhưng bạn có thể cần phải cuộn lên (tổng hợp) các giá trị tóm tắt gây nhiễu có trong báo cáo tóm tắt để truy cập vào một số thông tin chi tiết nhất định. Bằng cách cộng các giá trị này, bạn cũng đang cộng cả nhiễu. Với Chiến lược B, các giá trị tóm tắt hiển thị trong báo cáo tóm tắt có thể đã cung cấp cho bạn thông tin bạn cần. Điều này có nghĩa là Chiến lược B có thể dẫn đến tỷ lệ tín hiệu trên tạp âm tốt hơn Chiến lược A. Tuy nhiên, nhiễu có thể đã chấp nhận được với Chiến lược A, vì vậy, bạn vẫn có thể quyết định ưu tiên Chiến lược A để đơn giản hoá. Tìm hiểu thêm trong ví dụ chi tiết trình bày hai chiến lược này.
Quản lý khoá là một chủ đề chuyên sâu. Bạn có thể cân nhắc một số kỹ thuật phức tạp để cải thiện tỷ lệ tín hiệu trên tạp âm. Một trong số đó được mô tả trong phần Quản lý khoá nâng cao.
Quyết định: Tần suất tạo lô
Dùng thử trong Noise Lab
- Chuyển sang chế độ Đơn giản (hoặc chế độ Nâng cao – cả hai chế độ đều hoạt động giống nhau khi nói đến tần suất tạo lô)
- Trong bảng điều khiển bên về Thông số, hãy tìm Chiến lược tổng hợp > Tần suất tạo lô. Đây là tần suất gộp nhóm các báo cáo tổng hợp được xử lý bằng dịch vụ tổng hợp trong một công việc.
- Quan sát tần suất xử lý hàng loạt mặc định: theo mặc định, tần suất xử lý hàng loạt hằng ngày sẽ được mô phỏng.
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng.
- Thay đổi tần suất tạo lô thành hằng tuần.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng: tỷ lệ nhiễu hiện thấp hơn (tốt hơn) so với kết quả mô phỏng trước.
Một quyết định thiết kế khác sẽ ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một nhóm là tần suất tạo lô mà bạn quyết định sử dụng. Tần suất tạo lô là tần suất bạn xử lý các báo cáo tổng hợp.
Một báo cáo được lên lịch tổng hợp thường xuyên hơn (ví dụ: mỗi giờ) sẽ có ít sự kiện chuyển đổi hơn so với cùng một báo cáo có lịch tổng hợp ít thường xuyên hơn (ví dụ: mỗi tuần). Do đó, báo cáo hằng giờ sẽ có nhiều sự kiện nhiễu hơn.``` có ít sự kiện chuyển đổi hơn so với cùng một báo cáo có lịch tổng hợp ít thường xuyên hơn (ví dụ: mỗi tuần). Do đó, báo cáo hằng giờ sẽ có tỷ lệ tín hiệu trên tạp âm thấp hơn báo cáo hằng tuần, nếu tất cả các yếu tố khác đều bằng nhau. Thử nghiệm các yêu cầu báo cáo ở nhiều tần suất và đánh giá tỷ lệ tín hiệu/nhiễu cho từng yêu cầu.
Tìm hiểu thêm trong phần Gộp và Tổng hợp trong khoảng thời gian dài hơn.
Quyết định: Các biến chiến dịch ảnh hưởng đến lượt chuyển đổi có thể phân bổ
Dùng thử trong Noise Lab
Mặc dù khó dự đoán và có thể có sự khác biệt đáng kể ngoài hiệu ứng theo mùa, nhưng hãy cố gắng ước tính số lượt chuyển đổi một lần chạm có thể phân bổ hằng ngày theo số mũ 10 gần nhất: 10, 100, 1.000 hoặc 10.000.
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên Thông số, hãy tìm Dữ liệu lượt chuyển đổi của bạn.
- Quan sát các tham số mặc định. Theo mặc định, TỔNG số lượt chuyển đổi phân bổ hằng ngày là 1.000. Số lượng này trung bình là khoảng 40 giá trị cho mỗi bộ chứa nếu bạn sử dụng chế độ thiết lập mặc định (phương diện mặc định, số lượng giá trị có thể khác nhau theo mặc định cho mỗi phương diện, Chiến lược chính A). Hãy lưu ý rằng giá trị là 40 trong mục nhập Số lượt chuyển đổi được phân bổ trung bình hằng ngày TRONG MỖI BUCKET.
- Nhấp vào Mô phỏng để chạy mô phỏng bằng các tham số mặc định.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng.
- Bây giờ, hãy đặt TỔNG số lượt chuyển đổi có thể phân bổ hằng ngày thành 100. Hãy lưu ý rằng việc này sẽ làm giảm giá trị của Số lượt chuyển đổi trung bình hằng ngày có thể phân bổ TRONG MỖI BUCKET.
- Nhấp vào Mô phỏng.
- Hãy quan sát thấy tỷ lệ nhiễu hiện cao hơn: điều này là do khi bạn có ít lượt chuyển đổi hơn trên mỗi bộ chứa, hệ thống sẽ áp dụng nhiều nhiễu hơn để duy trì quyền riêng tư.
Một điểm khác biệt quan trọng là tổng số lượt chuyển đổi có thể xảy ra cho một nhà quảng cáo so với tổng số lượt chuyển đổi được phân bổ có thể xảy ra. Yếu tố sau cùng là yếu tố ảnh hưởng đến độ nhiễu trong báo cáo tóm tắt. Lượt chuyển đổi được phân bổ là một tập hợp con của tổng số lượt chuyển đổi dễ bị ảnh hưởng bởi các biến của chiến dịch, chẳng hạn như ngân sách quảng cáo và tiêu chí nhắm mục tiêu quảng cáo. Ví dụ: bạn sẽ thấy số lượt chuyển đổi được phân bổ cao hơn cho một chiến dịch quảng cáo trị giá 10 triệu đô la so với một chiến dịch quảng cáo trị giá 10 nghìn đô la, nếu tất cả các yếu tố khác đều như nhau.
Những điều cần cân nhắc:
- Đánh giá lượt chuyển đổi được phân bổ so với mô hình phân bổ một lượt chạm, cùng thiết bị, vì các lượt chuyển đổi này nằm trong phạm vi của báo cáo tóm tắt được thu thập bằng Attribution Reporting API.
- Hãy cân nhắc cả số lượt chuyển đổi trong trường hợp xấu nhất và số lượt chuyển đổi trong trường hợp tốt nhất cho lượt chuyển đổi được phân bổ. Ví dụ: giả sử mọi yếu tố khác đều như nhau, hãy cân nhắc ngân sách chiến dịch tối thiểu và tối đa có thể cho một nhà quảng cáo, sau đó dự đoán số lượt chuyển đổi có thể phân bổ cho cả hai kết quả dưới dạng dữ liệu đầu vào cho mô phỏng.
- Nếu bạn đang cân nhắc sử dụng Hộp cát về quyền riêng tư trên Android, hãy cân nhắc các lượt chuyển đổi được phân bổ trên nhiều nền tảng trong quá trình tính toán.
Quyết định: Sử dụng tính năng điều chỉnh theo tỷ lệ
Dùng thử trong Noise Lab
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên về Tham số, hãy tìm Chiến lược tổng hợp > Điều chỉnh theo tỷ lệ. Theo mặc định, giá trị này được đặt thành Có.
- Để hiểu rõ tác động tích cực của việc điều chỉnh theo tỷ lệ đối với tỷ lệ nhiễu, trước tiên, hãy đặt Scaling (Điều chỉnh theo tỷ lệ) thành No (Không).
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng.
- Đặt Scaling (Điều chỉnh theo tỷ lệ) thành Yes (Có). Xin lưu ý rằng Noise Lab sẽ tự động tính toán các hệ số tỷ lệ sẽ được sử dụng dựa trên phạm vi (giá trị trung bình và tối đa) của các mục tiêu đo lường cho trường hợp của bạn. Trong quá trình thiết lập thử nghiệm gốc hoặc hệ thống thực tế, bạn nên triển khai phương pháp tính toán riêng cho các hệ số điều chỉnh theo tỷ lệ.
- Nhấp vào Mô phỏng.
- Hãy quan sát thấy tỷ lệ nhiễu hiện thấp hơn (tốt hơn) trong quá trình mô phỏng thứ hai này. Điều này là do bạn đang sử dụng tính năng điều chỉnh theo tỷ lệ.
Do nguyên tắc thiết kế cốt lõi, nhiễu được thêm vào là một hàm của ngân sách đóng góp.
Do đó, để tăng tỷ lệ tín hiệu trên tạp âm, bạn có thể quyết định chuyển đổi các giá trị được thu thập trong một sự kiện chuyển đổi bằng cách điều chỉnh theo tỷ lệ các giá trị đó theo ngân sách đóng góp (và giảm tỷ lệ sau khi tổng hợp). Sử dụng tính năng điều chỉnh theo tỷ lệ để tăng tỷ lệ tín hiệu trên tạp âm.
Quyết định: Số lượng mục tiêu đo lường và mức phân chia ngân sách quyền riêng tư
Điều này liên quan đến việc Điều chỉnh theo tỷ lệ; hãy nhớ đọc bài viết Sử dụng tính năng điều chỉnh theo tỷ lệ.
Dùng thử trong Noise Lab
Mục tiêu đo lường là một điểm dữ liệu riêng biệt được thu thập trong các sự kiện chuyển đổi.
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên Tham số, hãy tìm mục Dữ liệu bạn muốn theo dõi: Mục tiêu đo lường. Theo mặc định, bạn có hai mục tiêu đo lường: giá trị giao dịch mua và số lượt mua.
- Nhấp vào Mô phỏng để chạy quy trình mô phỏng với các mục tiêu mặc định.
- Nhấp vào Xoá. Thao tác này sẽ xoá mục tiêu đo lường gần đây nhất (số lượt mua hàng trong trường hợp đó).
- Nhấp vào Mô phỏng.
- Lưu ý rằng tỷ lệ nhiễu cho giá trị giao dịch mua hiện thấp hơn (tốt hơn) trong quá trình mô phỏng thứ hai này. Lý do là bạn có ít mục tiêu đo lường hơn, vì vậy, một mục tiêu đo lường hiện sẽ nhận được toàn bộ ngân sách đóng góp.
- Nhấp vào Đặt lại. Giờ đây, bạn lại có hai mục tiêu đo lường: giá trị giao dịch mua và số lượt mua. Xin lưu ý rằng Noise Lab sẽ tự động tính toán các hệ số tỷ lệ sẽ được sử dụng dựa trên phạm vi (giá trị trung bình và tối đa) của các mục tiêu đo lường cho trường hợp của bạn. Theo mặc định, Noise Lab sẽ phân chia ngân sách đều cho các mục tiêu đo lường.
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng. Ghi lại các hệ số tỷ lệ hiển thị trên mô phỏng.
- Bây giờ, hãy tuỳ chỉnh mức phân chia ngân sách quyền riêng tư để đạt được tỷ lệ tín hiệu trên tạp âm tốt hơn.
- Điều chỉnh % ngân sách được chỉ định cho từng mục tiêu đo lường. Với các tham số mặc định, Mục tiêu đo lường 1 (tức là giá trị giao dịch mua) có phạm vi rộng hơn nhiều (từ 0 đến 1000) so với Mục tiêu đo lường 2 (tức là số lượt mua hàng) (từ 1 đến 1, tức là luôn bằng 1). Do đó, mục tiêu này cần "nhiều không gian hơn để mở rộng quy mô": Tốt nhất là bạn nên chỉ định nhiều ngân sách đóng góp hơn cho Mục tiêu đo lường 1 so với Mục tiêu đo lường 2 để có thể mở rộng quy mô một cách hiệu quả hơn (xem phần Mở rộng quy mô) và do đó
- Chỉ định 70% ngân sách cho Mục tiêu đo lường 1. Chỉ định 30% cho Mục tiêu đo lường 2.
- Nhấp vào Mô phỏng.
- Quan sát tỷ lệ nhiễu của kết quả mô phỏng. Đối với giá trị giao dịch mua, tỷ lệ nhiễu hiện thấp hơn đáng kể (tốt hơn) so với mô phỏng trước đó. Đối với số lượt mua, các chỉ số này gần như không thay đổi.
- Tiếp tục điều chỉnh mức phân bổ ngân sách theo các chỉ số. Quan sát mức độ ảnh hưởng của việc này đến tiếng ồn.
Xin lưu ý rằng bạn có thể đặt mục tiêu đo lường tuỳ chỉnh của riêng mình bằng các nút Thêm/Xoá/Đặt lại.
Nếu bạn đo lường một điểm dữ liệu (mục tiêu đo lường) trên một sự kiện chuyển đổi, chẳng hạn như số lượt chuyển đổi, thì điểm dữ liệu đó có thể nhận được toàn bộ ngân sách đóng góp (65536). Nếu bạn đặt nhiều mục tiêu đo lường trên một sự kiện chuyển đổi, chẳng hạn như số lượt chuyển đổi và giá trị giao dịch mua, thì các điểm dữ liệu đó sẽ cần phải chia sẻ ngân sách đóng góp. Điều này có nghĩa là bạn có ít phạm vi để mở rộng giá trị hơn.
Do đó, bạn càng có nhiều mục tiêu đo lường thì tỷ lệ tín hiệu trên tạp âm càng thấp (tạp âm càng cao).
Một quyết định khác cần đưa ra liên quan đến mục tiêu đo lường là tỷ lệ phân bổ ngân sách. Nếu bạn chia ngân sách đóng góp đều cho hai điểm dữ liệu, thì mỗi điểm dữ liệu sẽ nhận được ngân sách là 65536/2 = 32768. Giá trị này có thể tối ưu hoặc không, tuỳ thuộc vào giá trị tối đa có thể có cho mỗi điểm dữ liệu. Ví dụ: nếu bạn đang đo lường số lượt mua có giá trị tối đa là 1 và giá trị giao dịch mua có giá trị tối thiểu là 1 và tối đa là 120, thì giá trị giao dịch mua sẽ được hưởng lợi khi có "không gian lớn hơn" để mở rộng quy mô, tức là được phân bổ tỷ lệ lớn hơn trong ngân sách đóng góp. Bạn sẽ biết liệu một số mục tiêu đo lường có nên được ưu tiên hơn các mục tiêu khác hay không liên quan đến tác động của nhiễu.
Quyết định: Quản lý giá trị ngoại lai
Dùng thử trong Noise Lab
Mục tiêu đo lường là một điểm dữ liệu riêng biệt được thu thập trong các sự kiện chuyển đổi.
- Chuyển sang Chế độ nâng cao.
- Trong bảng điều khiển bên về Tham số, hãy tìm Chiến lược tổng hợp > Điều chỉnh theo tỷ lệ.
- Đảm bảo bạn đã đặt chế độ Điều chỉnh theo tỷ lệ thành Có. Xin lưu ý rằng Noise Lab sẽ tự động tính toán các hệ số tỷ lệ cần sử dụng, dựa trên các khoảng (giá trị trung bình và tối đa) mà bạn đã cung cấp cho các mục tiêu đo lường.
- Giả sử giao dịch mua lớn nhất từng thực hiện là 2.000 đô la, nhưng hầu hết giao dịch mua đều diễn ra trong khoảng từ 10 đến 120 đô la. Trước tiên, hãy xem điều gì sẽ xảy ra nếu chúng ta sử dụng phương pháp điều chỉnh theo tỷ lệ theo nghĩa đen (không nên dùng): nhập $2000 làm giá trị tối đa cho purchaseValue.
- Nhấp vào Mô phỏng.
- Quan sát thấy tỷ lệ nhiễu cao. Nguyên nhân là do hệ số điều chỉnh theo tỷ lệ hiện được tính dựa trên 2.000 đô la, trong khi thực tế hầu hết giá trị giao dịch mua sẽ thấp hơn đáng kể.
- Bây giờ, hãy sử dụng phương pháp mở rộng quy mô thực tế hơn. Thay đổi giá trị giao dịch mua tối đa thành 120 đô la.
- Nhấp vào Mô phỏng.
- Hãy quan sát tỷ lệ nhiễu thấp hơn (tốt hơn) trong quá trình mô phỏng thứ hai này.
Để triển khai tính năng điều chỉnh theo tỷ lệ, bạn thường sẽ tính hệ số điều chỉnh theo tỷ lệ dựa trên giá trị tối đa có thể có cho một sự kiện chuyển đổi nhất định (tìm hiểu thêm trong ví dụ này).
Tuy nhiên, hãy tránh sử dụng giá trị tối đa theo nghĩa đen để tính hệ số tỷ lệ đó, vì điều này sẽ làm xấu đi tỷ lệ tín hiệu trên tạp âm. Thay vào đó, hãy xoá các giá trị ngoại lai và sử dụng giá trị tối đa thực tế.
Quản lý dữ liệu ngoại lai là một chủ đề chuyên sâu. Bạn có thể cân nhắc một số kỹ thuật phức tạp để cải thiện tỷ lệ tín hiệu trên tạp âm. Một phương pháp được mô tả trong phần Quản lý dữ liệu ngoại lai nâng cao.
Các bước tiếp theo
Giờ đây, khi đã đánh giá nhiều chiến lược quản lý tạp âm cho trường hợp sử dụng của mình, bạn đã sẵn sàng bắt đầu thử nghiệm với báo cáo tóm tắt bằng cách thu thập dữ liệu đo lường thực tế thông qua thử nghiệm gốc. Xem hướng dẫn và mẹo để Dùng thử API.
Phụ lục
Tham quan nhanh Phòng thí nghiệm tiếng ồn
Noise Lab giúp bạn nhanh chóng đánh giá và so sánh các chiến lược quản lý tiếng ồn. Bạn có thể sử dụng kỹ thuật này để:
- Tìm hiểu các thông số chính có thể ảnh hưởng đến độ nhiễu và tác động của các thông số đó.
- Mô phỏng hiệu ứng của nhiễu trên dữ liệu đo lường đầu ra dựa trên các quyết định thiết kế khác nhau. Điều chỉnh các tham số thiết kế cho đến khi bạn đạt được hệ số tín hiệu trên tạp âm phù hợp với trường hợp sử dụng của mình.
- Hãy chia sẻ ý kiến phản hồi của bạn về tính hữu ích của báo cáo tóm tắt: giá trị nào của tham số epsilon và nhiễu phù hợp với bạn, giá trị nào không phù hợp? Điểm uốn nằm ở đâu?
Hãy xem đây là bước chuẩn bị. Noise Lab tạo dữ liệu đo lường để mô phỏng đầu ra của báo cáo tóm tắt dựa trên dữ liệu đầu vào của bạn. Cookie này không tồn tại hoặc chia sẻ bất kỳ dữ liệu nào.
Có hai chế độ trong Noise Lab:
- Chế độ đơn giản: tìm hiểu các nguyên tắc cơ bản về các chế độ điều khiển tiếng ồn.
- Chế độ nâng cao: kiểm thử nhiều chiến lược quản lý tạp âm và đánh giá xem chiến lược nào mang lại tỷ lệ tín hiệu/tạp âm tốt nhất cho các trường hợp sử dụng của bạn.
Nhấp vào các nút trong trình đơn trên cùng để chuyển đổi giữa hai chế độ (#1. trong ảnh chụp màn hình bên dưới).
Chế độ đơn giản
- Với chế độ Đơn giản, bạn có thể kiểm soát các Tham số (nằm ở bên trái hoặc #2. trong ảnh chụp màn hình bên dưới) như Epsilon và xem các tham số này ảnh hưởng như thế nào đến độ nhiễu.
- Mỗi tham số có một chú giải công cụ (nút "?"). Nhấp vào các thông số này để xem giải thích về từng thông số (#3. trong ảnh chụp màn hình bên dưới)
- Để bắt đầu, hãy nhấp vào nút "Simulate" (Mô phỏng) và quan sát kết quả (#4. trong ảnh chụp màn hình bên dưới)
- Trong phần Đầu ra, bạn có thể thấy nhiều thông tin chi tiết. Một số phần tử có dấu "?" bên cạnh. Hãy dành thời gian nhấp vào từng dấu "?" để xem nội dung giải thích về nhiều thông tin.
- Trong mục Đầu ra, hãy nhấp vào nút bật/tắt Chi tiết nếu bạn muốn xem phiên bản mở rộng của bảng (#5. trong ảnh chụp màn hình bên dưới)
- Bên dưới mỗi bảng dữ liệu trong phần đầu ra, có một tuỳ chọn để tải bảng xuống để sử dụng ngoại tuyến. Ngoài ra, ở góc dưới cùng bên phải, bạn có thể tải tất cả bảng dữ liệu xuống (số 6 trong ảnh chụp màn hình bên dưới)
- Thử nghiệm các chế độ cài đặt khác nhau cho các tham số trong mục Tham số rồi nhấp vào Mô phỏng để xem các chế độ cài đặt đó ảnh hưởng như thế nào đến kết quả:
Giao diện Noise Lab cho chế độ Đơn giản.
Chế độ nâng cao
- Ở chế độ Nâng cao, bạn có nhiều quyền kiểm soát hơn đối với các Tham số. Bạn có thể thêm Mục tiêu đo lường và Phương diện tuỳ chỉnh (số 1 và số 2 trong ảnh chụp màn hình bên dưới)
- Di chuyển xuống phần Thông số và xem tuỳ chọn Chiến lược chính. Bạn có thể dùng tính năng này để thử nghiệm nhiều cấu trúc khoá khác nhau (#3 trong ảnh chụp màn hình bên dưới)
- Để thử nghiệm nhiều Cấu trúc khoá, hãy chuyển Chiến lược khoá thành "B"
- Nhập số lượng cấu trúc khoá khác nhau mà bạn muốn sử dụng (mặc định được đặt thành "2")
- Nhấp vào Tạo cấu trúc khoá
- Bạn sẽ thấy các tuỳ chọn để chỉ định cấu trúc khoá bằng cách nhấp vào hộp đánh dấu bên cạnh các khoá mà bạn muốn đưa vào cho mỗi cấu trúc khoá
- Nhấp vào Simulate (Mô phỏng) để xem kết quả.
Giao diện Noise Lab (Phòng thí nghiệm tiếng ồn) cho chế độ Advanced (Nâng cao). Giao diện Noise Lab (Phòng thí nghiệm nhiễu) cho chế độ Advanced (Nâng cao).
Chỉ số tiếng ồn
Khái niệm cốt lõi
Âm thanh được thêm vào để bảo vệ quyền riêng tư của từng người dùng.
Giá trị nhiễu cao cho biết các bộ chứa/khoá thưa thớt và chứa các giá trị đóng góp từ một số sự kiện nhạy cảm. Việc này được Noise Lab thực hiện tự động để cho phép các cá nhân "ẩn mình trong đám đông", hay nói cách khác là bảo vệ quyền riêng tư của những cá nhân bị hạn chế này bằng một lượng tạp âm lớn hơn.
Giá trị nhiễu thấp cho biết rằng chế độ thiết lập dữ liệu được thiết kế sao cho cho phép các cá nhân "ẩn mình trong đám đông". Điều này có nghĩa là các bộ chứa chứa các đóng góp từ đủ số lượng sự kiện để đảm bảo quyền riêng tư của từng người dùng được bảo vệ.
Câu nhận định này đúng cho cả tỷ lệ phần trăm lỗi trung bình (APE) và RMSRE_T (lỗi tương đối trung bình bình phương gốc có ngưỡng).
APE (sai số phần trăm trung bình)
APE là tỷ lệ nhiễu trên tín hiệu, tức là giá trị tóm tắt thực sự.p> Giá trị APE thấp hơn có nghĩa là tỷ lệ tín hiệu trên nhiễu tốt hơn.
Công thức
Đối với một báo cáo tóm tắt nhất định, APE được tính như sau:

True là giá trị tóm tắt thực. APE là giá trị trung bình của độ nhiễu trên mỗi giá trị tóm tắt thực, được tính trung bình trên tất cả các mục trong báo cáo tóm tắt. Trong Noise Lab, giá trị này được nhân với 100 để cho ra tỷ lệ phần trăm.
Ưu và nhược điểm
Các bộ chứa có kích thước nhỏ hơn có tác động không cân xứng đến giá trị cuối cùng của APE. Điều đó có thể gây hiểu lầm khi đánh giá độ nhiễu. Đó là lý do chúng tôi thêm một chỉ số khác là RMSRE_T để giảm thiểu hạn chế này của APE. Hãy xem ví dụ để biết thông tin chi tiết.
Mã
Xem lại mã nguồn để tính toán APE.
RMSRE_T (sai số tương đối căn bậc hai trung bình có ngưỡng)
RMSRE_T (lỗi tương đối trung bình bình phương gốc có ngưỡng) là một chỉ số khác về độ nhiễu.
Cách diễn giải RMSRE_T
Giá trị RMSRE_T thấp hơn có nghĩa là tỷ lệ tín hiệu trên tạp âm tốt hơn.
Ví dụ: nếu tỷ lệ nhiễu chấp nhận được cho trường hợp sử dụng của bạn là 20% và RMSRE_T là 0,2, thì bạn có thể yên tâm rằng mức nhiễu nằm trong phạm vi chấp nhận được.
Công thức
Đối với một báo cáo tóm tắt nhất định, RMSRE_T được tính như sau:

Ưu và nhược điểm
RMSRE_T phức tạp hơn một chút so với APE. Tuy nhiên, trong một số trường hợp, phương pháp này có một số ưu điểm khiến nó phù hợp hơn APE để phân tích tạp âm trong báo cáo tóm tắt:
- RMSRE_T ổn định hơn. "T" là ngưỡng. "T" được dùng để giảm trọng số trong phép tính RMSRE_T cho các bộ chứa có ít lượt chuyển đổi hơn và do đó nhạy cảm hơn với độ nhiễu do kích thước nhỏ. Với T, chỉ số này không tăng đột biến trên các bộ chứa có ít lượt chuyển đổi. Nếu T bằng 5, thì giá trị nhiễu nhỏ như 1 trên một bộ chứa có 0 lượt chuyển đổi sẽ không hiển thị là vượt quá 1. Thay vào đó, giá trị này sẽ được giới hạn ở mức 0,2, tương đương với 1/5, vì T bằng 5. Bằng cách giảm trọng số cho các bộ chứa nhỏ hơn (do đó nhạy cảm hơn với độ nhiễu), chỉ số này sẽ ổn định hơn, nhờ đó giúp bạn dễ dàng so sánh hai mô phỏng.
- RMSRE_T cho phép tổng hợp dễ dàng. Khi biết RMSRE_T của nhiều bộ chứa cùng với số lượng thực tế của các bộ chứa đó, bạn có thể tính toán RMSRE_T của tổng các bộ chứa đó. Điều này cũng cho phép bạn tối ưu hoá cho RMSRE_T cho các giá trị kết hợp này.
Mặc dù có thể tổng hợp APE, nhưng công thức này khá phức tạp vì liên quan đến giá trị tuyệt đối của tổng tiếng ồn Laplace. Điều này khiến APE khó tối ưu hoá hơn.
Mã
Xem lại mã nguồn để tính RMSRE_T.
Ví dụ
Báo cáo tóm tắt có 3 nhóm:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Báo cáo tóm tắt có 3 nhóm:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Báo cáo tóm tắt có 3 nhóm:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + Vô hạn) / 3 = Vô hạn
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Quản lý khoá nâng cao
Một DSP hoặc công ty đo lường quảng cáo có thể có hàng nghìn khách hàng quảng cáo trên toàn cầu, trải rộng trên nhiều ngành, đơn vị tiền tệ và tiềm năng giá mua. Điều này có nghĩa là việc tạo và quản lý một khoá tổng hợp cho mỗi nhà quảng cáo có thể sẽ không thực tế. Ngoài ra, sẽ rất khó để chọn một giá trị tổng hợp tối đa và ngân sách tổng hợp có thể hạn chế tác động của sự nhiễu trên hàng nghìn nhà quảng cáo trên toàn cầu này. Thay vào đó, hãy xem xét các trường hợp sau:
Chiến lược chính A
Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý một khoá trên tất cả các khách hàng quảng cáo của mình. Trên tất cả nhà quảng cáo và tất cả đơn vị tiền tệ, phạm vi giao dịch mua sẽ khác nhau, từ giao dịch mua số lượng thấp, sản phẩm cao cấp đến giao dịch mua số lượng lớn, sản phẩm cấp thấp. Điều này dẫn đến khoá sau:
Khoá (nhiều đơn vị tiền tệ) | |
---|---|
Giá trị tổng hợp tối đa | 5.000.000 |
Phạm vi giá trị giao dịch mua | [120 – 5000000] |
Chiến lược chính B
Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý hai khoá trên tất cả các khách hàng quảng cáo của mình. Họ quyết định tách các khoá theo đơn vị tiền tệ. Trên tất cả nhà quảng cáo và tất cả đơn vị tiền tệ, phạm vi giao dịch mua sẽ khác nhau, từ giao dịch mua số lượng thấp, sản phẩm cao cấp đến giao dịch mua số lượng lớn, sản phẩm cấp thấp. Phân tách theo đơn vị tiền tệ, họ tạo 2 khoá:
Khoá 1 (USD) | Phím 2 (¥) | |
---|---|---|
Giá trị tổng hợp tối đa | 40.000 đô la | 5.000.000 yên Nhật |
Phạm vi giá trị giao dịch mua | [120 – 40.000] | [15.000 – 5.000.000] |
Chiến lược khoá B sẽ có ít tạp âm hơn trong kết quả so với Chiến lược khoá A, vì giá trị đơn vị tiền tệ không được phân phối đồng đều trên các đơn vị tiền tệ. Ví dụ: hãy xem xét cách các giao dịch mua bằng ¥ kết hợp với các giao dịch mua bằng USD sẽ làm thay đổi dữ liệu cơ bản và kết quả đầu ra bị nhiễu.
Chiến lược chính C
Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý 4 khoá trên tất cả khách hàng quảng cáo, đồng thời tách các khoá đó theo đơn vị tiền tệ x ngành của nhà quảng cáo:
Khoá 1 (USD x Nhà quảng cáo trang sức cao cấp) |
Khoá 2 (¥ x Nhà quảng cáo trang sức cao cấp) |
Khoá 3 (USD x Nhà quảng cáo là nhà bán lẻ quần áo) |
Khoá 4 (¥ x Nhà quảng cáo là nhà bán lẻ quần áo) |
|
---|---|---|---|---|
Giá trị tổng hợp tối đa | 40.000 đô la | 5.000.000 yên Nhật | 500 USD | 65.000 yên Nhật |
Phạm vi giá trị giao dịch mua | [10.000 – 40.000] | [1.250.000 – 5.000.000] | [120 – 500] | [15.000 – 65.000] |
Chiến lược chính C sẽ có kết quả ít nhiễu hơn Chiến lược chính B, vì giá trị giao dịch mua của nhà quảng cáo không được phân phối đồng đều giữa các nhà quảng cáo. Ví dụ: hãy cân nhắc việc các giao dịch mua trang sức cao cấp kết hợp với các giao dịch mua mũ bóng chày sẽ làm thay đổi dữ liệu cơ bản và kết quả đầu ra bị nhiễu.
Cân nhắc việc tạo các giá trị tổng hợp tối đa và hệ số điều chỉnh chung cho các điểm chung giữa nhiều nhà quảng cáo để giảm độ nhiễu trong kết quả. Ví dụ: bạn có thể thử nghiệm với các chiến lược dưới đây cho nhà quảng cáo:
- Một chiến lược được phân tách theo đơn vị tiền tệ (USD, ¥, CAD, v.v.)
- Một chiến lược được phân tách theo ngành của nhà quảng cáo (Bảo hiểm, Ô tô, Bán lẻ, v.v.)
- Một chiến lược được phân tách theo các dải giá trị giao dịch mua tương tự nhau ([100], [1.000], [10.000], v.v.)
Bằng cách tạo các chiến lược chính xoay quanh những điểm chung của nhà quảng cáo, bạn có thể dễ dàng quản lý khoá và mã tương ứng, đồng thời tỷ lệ tín hiệu trên tạp âm sẽ cao hơn. Thử nghiệm nhiều chiến lược với các điểm chung khác nhau của nhà quảng cáo để khám phá các điểm chuyển đổi trong việc tối đa hoá tác động của tiếng ồn so với việc quản lý mã.
Quản lý dữ liệu ngoại lai nâng cao
Hãy xem xét một tình huống giữa hai nhà quảng cáo:
- Nhà quảng cáo A:
- Trên tất cả sản phẩm trên trang web của Nhà quảng cáo A, giá mua có thể nằm trong khoảng [$120 – $1.000] , với phạm vi là 880 đô la.
- Giá mua được phân phối đều trong phạm vi 880 đô la, không có giá trị ngoại lai nằm ngoài hai độ lệch chuẩn so với giá mua trung bình.
- Nhà quảng cáo B:
- Trên tất cả sản phẩm trên trang web của Nhà quảng cáo B, giá mua có thể nằm trong khoảng [$120 – $1.000] , với khoảng giá là 880 đô la.
- Giá mua hàng tập trung chủ yếu ở khoảng từ 120 đến 500 USD, trong đó chỉ có 5% giao dịch mua hàng diễn ra ở khoảng từ 500 đến 1.000 USD.
Do các yêu cầu về ngân sách đóng góp và phương pháp áp dụng độ nhiễu cho kết quả cuối cùng, theo mặc định, Nhà quảng cáo B sẽ có kết quả nhiễu hơn Nhà quảng cáo A, vì Nhà quảng cáo B có nhiều khả năng có giá trị ngoại lai hơn tác động đến các phép tính cơ bản.
Bạn có thể giảm thiểu vấn đề này bằng cách thiết lập khoá cụ thể. Thử nghiệm các chiến lược chính giúp quản lý dữ liệu ngoại lai và phân phối giá trị giao dịch mua một cách đồng đều hơn trên phạm vi giao dịch mua của khoá.
Đối với Nhà quảng cáo B, bạn có thể tạo hai khoá riêng biệt để thu thập hai phạm vi giá trị giao dịch mua khác nhau. Trong ví dụ này, công nghệ quảng cáo đã ghi nhận rằng các giá trị ngoại lai xuất hiện ở trên giá trị giao dịch mua là 500 đô la. Hãy thử triển khai hai khoá riêng biệt cho nhà quảng cáo này:
- Cấu trúc khoá 1 : Khoá chỉ ghi lại các giao dịch mua trong khoảng từ 120 đến 500 đô la Mỹ (chiếm khoảng 95% tổng số giao dịch mua).
- Cấu trúc khoá 2: Khoá chỉ ghi lại các giao dịch mua có giá trị trên 500 USD (chiếm khoảng 5% tổng số giao dịch mua).
Việc triển khai chiến lược chính này sẽ giúp Nhà quảng cáo B quản lý tốt hơn sự nhiễu và giúp họ khai thác tối đa báo cáo tóm tắt. Do các dải mới nhỏ hơn, Khoá A và Khoá B hiện sẽ có mức phân phối dữ liệu đồng đều hơn trên từng khoá tương ứng so với khoá đơn trước đó. Điều này sẽ làm giảm tác động của nhiễu trong đầu ra của mỗi khoá so với khoá đơn trước đó.