Noiselab

Thông tin về tài liệu này

Khi đọc tài liệu này, bạn sẽ:

  • Tìm hiểu những chiến lược cần tạo trước khi tạo báo cáo tóm tắt.
  • Làm quen với Noise Lab, một công cụ giúp nắm bắt tác động của nhiều thông số nhiễu, đồng thời cho phép khám phá và đánh giá nhanh nhiều chiến lược quản lý nhiễu.
Ảnh chụp màn hình Noise Lab.
Phòng thí nghiệm tiếng ồn

Chia sẻ ý kiến phản hồi của bạn

Mặc dù tài liệu này tóm tắt một số nguyên tắc để làm việc với báo cáo tóm tắt, nhưng có nhiều phương pháp quản lý nhiễu có thể không được phản ánh ở đây. Chúng tôi rất mong nhận được đề xuất, thông tin bổ sung và câu hỏi của bạn!

  • Để đưa ra ý kiến phản hồi công khai về các chiến lược quản lý tiếng ồn, về tính hữu ích hoặc quyền riêng tư của API (epsilon) và để chia sẻ những quan sát của bạn khi mô phỏng bằng Noise Lab, hãy làm như sau: Bình luận về vấn đề này
  • Để đưa ra ý kiến phản hồi công khai về một khía cạnh khác của API, hãy tạo một vấn đề mới tại đây

Trước khi bắt đầu

  1. Hãy đọc bài viết Attribution Reporting: báo cáo tóm tắtTổng quan về toàn bộ hệ thống Attribution Reporting để biết thông tin giới thiệu.
  2. Hãy xem phần Tìm hiểu về nhiễuTìm hiểu về khoá tổng hợp để khai thác tối đa hướng dẫn này.

Quyết định về thiết kế

Nguyên tắc thiết kế cốt lõi

Có những điểm khác biệt cơ bản giữa cách cookie của bên thứ ba và báo cáo tóm tắt hoạt động. Một điểm khác biệt chính là nhiễu được thêm vào dữ liệu đo lường trong báo cáo tóm tắt. Một cách khác là lên lịch cho báo cáo.

Để truy cập dữ liệu đo lường báo cáo tóm tắt với tỷ lệ tín hiệu trên nhiễu cao hơn, các nền tảng bên cầu (DSP) và nhà cung cấp dịch vụ đo lường quảng cáo sẽ cần hợp tác với nhà quảng cáo để phát triển chiến lược quản lý nhiễu. Để phát triển các chiến lược này, DSP và nhà cung cấp dịch vụ đo lường cần đưa ra các quyết định về thiết kế. Những quyết định này xoay quanh một khái niệm thiết yếu:

Mặc dù các giá trị nhiễu phân phối được rút ra, nói một cách tuyệt đối, chỉ phụ thuộc vào hai tham số ⏤ epsilon và ngân sách đóng góp ⏤ bạn có một số chế độ kiểm soát khác theo ý mình sẽ ảnh hưởng đến tỷ lệ tín hiệu trên nhiễu của dữ liệu đo lường đầu ra.

Mặc dù chúng tôi kỳ vọng một quy trình lặp lại sẽ dẫn đến những quyết định tốt nhất, nhưng mỗi biến thể của những quyết định này sẽ dẫn đến một cách triển khai hơi khác một chút. Do đó, bạn phải đưa ra những quyết định này trước khi viết từng lần lặp lại mã (và trước khi chạy quảng cáo).

Quyết định: Độ chi tiết của phương diện

Dùng thử trong Noise Lab

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên Thông số, hãy tìm Dữ liệu lượt chuyển đổi của bạn.
  3. Quan sát các tham số mặc định. Theo mặc định, TỔNG số lượt chuyển đổi có thể phân bổ hằng ngày là 1.000. Nếu bạn sử dụng chế độ thiết lập mặc định (các phương diện mặc định, số lượng giá trị khác nhau có thể có mặc định cho mỗi phương diện, Chiến lược chính A), thì trung bình sẽ có khoảng 40 lượt cho mỗi nhóm. Lưu ý rằng giá trị là 40 trong mục đầu vào Số lượt chuyển đổi được phân bổ trung bình hằng ngày CHO MỖI NHÓM.
  4. Nhấp vào Mô phỏng để chạy mô phỏng bằng các thông số mặc định.
  5. Trong bảng điều khiển bên Thông số, hãy tìm mục Phương diện. Đổi tên Địa lý thành Thành phố và thay đổi số lượng giá trị khác nhau có thể có thành 50.
  6. Quan sát xem điều này thay đổi Số lượt chuyển đổi được phân bổ trung bình hằng ngày CHO MỖI NHÓM như thế nào. Hiện tại, mức này đã giảm đi đáng kể. Lý do là nếu bạn tăng số lượng giá trị có thể có trong phương diện này mà không thay đổi bất kỳ điều gì khác, thì bạn sẽ tăng tổng số nhóm mà không thay đổi số lượng sự kiện chuyển đổi sẽ nằm trong mỗi nhóm.
  7. Nhấp vào Mô phỏng.
  8. Quan sát tỷ lệ nhiễu của mô phỏng thu được: tỷ lệ nhiễu hiện cao hơn so với mô phỏng trước đó.

Theo nguyên tắc thiết kế cốt lõi, các giá trị tóm tắt nhỏ có khả năng chứa nhiều dữ liệu nhiễu hơn so với các giá trị tóm tắt lớn. Do đó, lựa chọn cấu hình của bạn sẽ ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong mỗi nhóm (nếu không, được gọi là khoá tổng hợp), và số lượng đó sẽ ảnh hưởng đến nhiễu trong báo cáo tóm tắt đầu ra cuối cùng.

Một quyết định thiết kế ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một nhóm là độ chi tiết của phương diện. Hãy xem xét các ví dụ sau về khoá tổng hợp và phương diện của khoá đó:

  • Cách 1: một cấu trúc khoá với các phương diện thô: Quốc gia x Chiến dịch quảng cáo (hoặc nhóm chiến dịch tổng hợp lớn nhất) x Loại sản phẩm (trong số 10 loại sản phẩm có thể có)
  • Cách 2: một cấu trúc khoá có các phương diện chi tiết: Thành phố x Mã mẫu quảng cáo x Sản phẩm (trong số 100 sản phẩm có thể có)

Thành phố là một phương diện chi tiết hơn so với Quốc gia; Mã nhận dạng mẫu quảng cáo chi tiết hơn so với Chiến dịch; và Sản phẩm chi tiết hơn so với Loại sản phẩm. Do đó, Phương pháp 2 sẽ có số lượng sự kiện (lượt chuyển đổi) thấp hơn trên mỗi nhóm (= trên mỗi khoá) trong đầu ra báo cáo tóm tắt so với Phương pháp 1. Vì nhiễu được thêm vào đầu ra không phụ thuộc vào số lượng sự kiện trong nhóm, nên dữ liệu đo lường trong báo cáo tóm tắt sẽ có nhiều nhiễu hơn với Phương pháp 2. Đối với mỗi nhà quảng cáo, hãy thử nghiệm nhiều sự đánh đổi về độ chi tiết trong thiết kế khoá để có được tiện ích tối đa trong kết quả.

Quyết định: Cấu trúc chính

Dùng thử trong Noise Lab

Ở chế độ Đơn giản, cấu trúc khoá mặc định sẽ được sử dụng. Ở chế độ Nâng cao, bạn có thể thử nghiệm nhiều cấu trúc khoá. Một số phương diện mẫu được đưa vào; bạn cũng có thể sửa đổi các phương diện này.

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên Thông số, hãy tìm Chiến lược chính. Lưu ý rằng chiến lược mặc định (được đặt tên là A trong công cụ) sử dụng một cấu trúc khoá chi tiết bao gồm tất cả các phương diện: Vị trí địa lý x Mã chiến dịch x Danh mục sản phẩm.
  3. Nhấp vào Mô phỏng.
  4. Quan sát tỷ lệ nhiễu của mô phỏng thu được.
  5. Thay đổi chiến lược khoá thành B. Thao tác này sẽ hiển thị các chế độ kiểm soát bổ sung để bạn định cấu hình cấu trúc khoá.
  6. Định cấu hình cấu trúc khoá, ví dụ: như sau:
    1. Số lượng cấu trúc chính: 2
    2. Cấu trúc khoá 1 = Địa lý x Danh mục sản phẩm.
    3. Cấu trúc khoá 2 = Mã chiến dịch x Danh mục sản phẩm.
  7. Nhấp vào Mô phỏng.
  8. Lưu ý rằng giờ đây, bạn sẽ nhận được 2 báo cáo tóm tắt cho mỗi loại mục tiêu đo lường (2 báo cáo cho số lượt mua, 2 báo cáo cho giá trị lượt mua), giả sử bạn đang sử dụng 2 cấu trúc khoá riêng biệt. Quan sát tỷ lệ nhiễu của chúng.
  9. Bạn cũng có thể thử cách này với các phương diện tuỳ chỉnh của riêng mình. Để làm như vậy, hãy tìm Dữ liệu bạn muốn theo dõi: Phương diện. Hãy cân nhắc việc xoá các phương diện ví dụ và tạo phương diện của riêng bạn bằng cách sử dụng các nút Thêm/Xoá/Đặt lại bên dưới phương diện cuối cùng.

Một quyết định thiết kế khác sẽ ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một nhóm duy nhất là cấu trúc khoá mà bạn quyết định sử dụng. Hãy xem xét các ví dụ sau về khoá tổng hợp:

  • Một cấu trúc khoá với tất cả các phương diện; hãy gọi đây là Chiến lược khoá A.
  • Hai cấu trúc khoá, mỗi cấu trúc có một tập hợp con gồm các phương diện; hãy gọi đây là Chiến lược khoá B.
Các nhóm cho Chiến lược chính A và B.
Các nhóm cho Chiến lược A và B chính.

Chiến lược A đơn giản hơn, nhưng bạn có thể cần tổng hợp (tính tổng) các giá trị tóm tắt gây nhiễu có trong báo cáo tóm tắt để truy cập vào một số thông tin chi tiết nhất định. Khi cộng các giá trị này, bạn cũng đang cộng cả nhiễu. Với Chiến lược B, các giá trị tóm tắt xuất hiện trong báo cáo tóm tắt có thể đã cung cấp cho bạn thông tin cần thiết. Điều này có nghĩa là Chiến lược B có khả năng mang lại tỷ lệ tín hiệu trên nhiễu tốt hơn so với Chiến lược A. Tuy nhiên, độ nhiễu có thể đã ở mức chấp nhận được với Chiến lược A, vì vậy, bạn vẫn có thể quyết định ưu tiên Chiến lược A để đơn giản hoá. Tìm hiểu thêm trong ví dụ chi tiết nêu rõ 2 chiến lược này.

Quản lý khoá là một chủ đề chuyên sâu. Bạn có thể cân nhắc một số kỹ thuật phức tạp để cải thiện tỷ lệ tín hiệu trên tạp âm. Một trong số đó được mô tả trong phần Quản lý khoá nâng cao.

Quyết định: Tần suất theo lô

Dùng thử trong Noise Lab

  1. Chuyển sang Chế độ đơn giản (hoặc Chế độ nâng cao – cả hai chế độ này đều hoạt động theo cùng một cách khi nói đến tần suất theo lô)
  2. Trong bảng điều khiển bên Thông số, hãy tìm mục Chiến lược tổng hợp > Tần suất theo lô. Đây là tần suất gộp nhóm của các báo cáo có thể tổng hợp được xử lý bằng dịch vụ tổng hợp trong một công việc duy nhất.
  3. Quan sát tần suất phân lô mặc định: theo mặc định, tần suất phân lô hằng ngày sẽ được mô phỏng.
  4. Nhấp vào Mô phỏng.
  5. Quan sát tỷ lệ nhiễu của mô phỏng thu được.
  6. Thay đổi tần suất gửi theo lô thành hằng tuần.
  7. Quan sát tỷ lệ nhiễu của mô phỏng thu được: tỷ lệ nhiễu hiện thấp hơn (tốt hơn) so với mô phỏng trước đó.

Một quyết định khác về thiết kế sẽ ảnh hưởng đến số lượng sự kiện chuyển đổi được phân bổ trong một nhóm là tần suất phân lô mà bạn quyết định sử dụng. Tần suất phân lô là tần suất bạn xử lý các báo cáo có thể tổng hợp.

Một báo cáo được lên lịch tổng hợp thường xuyên hơn (ví dụ: mỗi giờ) sẽ có ít sự kiện chuyển đổi hơn so với cùng một báo cáo có lịch tổng hợp ít thường xuyên hơn (ví dụ: mỗi tuần). Do đó, báo cáo hằng giờ sẽ có nhiều dữ liệu nhiễu hơn và có ít sự kiện chuyển đổi hơn so với cùng một báo cáo có lịch tổng hợp ít thường xuyên hơn (ví dụ: mỗi tuần). Do đó, báo cáo hằng giờ sẽ có tỷ lệ tín hiệu trên nhiễu thấp hơn so với báo cáo hằng tuần, trong điều kiện các yếu tố khác đều bằng nhau. Thử nghiệm các yêu cầu báo cáo ở nhiều tần suất và đánh giá tỷ lệ tín hiệu trên nhiễu cho từng yêu cầu.

Tìm hiểu thêm trong phần Xử lý hàng loạtTổng hợp trong khoảng thời gian dài hơn.

Quyết định: Các biến chiến dịch ảnh hưởng đến lượt chuyển đổi có thể quy nạp

Dùng thử trong Noise Lab

Mặc dù khó dự đoán và có thể có những biến động đáng kể ngoài các tác động của tính thời vụ, nhưng hãy cố gắng ước tính số lượt chuyển đổi được phân bổ cho một lượt tương tác duy nhất mỗi ngày theo luỹ thừa gần nhất của 10: 10, 100, 1.000 hoặc 10.000.

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên Thông số, hãy tìm Dữ liệu lượt chuyển đổi của bạn.
  3. Quan sát các tham số mặc định. Theo mặc định, TỔNG số lượt chuyển đổi có thể phân bổ hằng ngày là 1.000. Nếu bạn sử dụng chế độ thiết lập mặc định (các phương diện mặc định, số lượng giá trị khác nhau có thể có mặc định cho mỗi phương diện, Chiến lược chính A), thì trung bình sẽ có khoảng 40 lượt cho mỗi nhóm. Lưu ý rằng giá trị là 40 trong mục đầu vào Số lượt chuyển đổi được phân bổ trung bình hằng ngày CHO MỖI NHÓM.
  4. Nhấp vào Mô phỏng để chạy mô phỏng bằng các thông số mặc định.
  5. Quan sát tỷ lệ nhiễu của mô phỏng thu được.
  6. Bây giờ, hãy đặt TỔNG số lượt chuyển đổi được phân bổ hằng ngày thành 100. Lưu ý rằng điều này làm giảm giá trị của Số lượt chuyển đổi được phân bổ trung bình hằng ngày TRÊN MỖI NHÓM.
  7. Nhấp vào Mô phỏng.
  8. Lưu ý rằng tỷ lệ nhiễu hiện cao hơn: điều này là do khi bạn có ít lượt chuyển đổi hơn trên mỗi nhóm, thì nhiều nhiễu hơn sẽ được áp dụng để duy trì quyền riêng tư.

Một điểm khác biệt quan trọng là tổng số lượt chuyển đổi có thể có cho một nhà quảng cáo, so với tổng số lượt chuyển đổi được phân bổ có thể có. Yếu tố thứ hai là yếu tố cuối cùng ảnh hưởng đến nhiễu trong báo cáo tóm tắt. Lượt chuyển đổi được phân bổ là một nhóm nhỏ trong tổng số lượt chuyển đổi có xu hướng phụ thuộc vào các biến số của chiến dịch, chẳng hạn như ngân sách quảng cáo và tiêu chí nhắm mục tiêu quảng cáo. Ví dụ: bạn sẽ kỳ vọng có số lượt chuyển đổi được phân bổ cao hơn cho một chiến dịch quảng cáo trị giá 10 triệu USD so với một chiến dịch quảng cáo trị giá 10.000 USD, trong điều kiện các yếu tố khác đều bằng nhau.

Những điều cần cân nhắc:

  • Đánh giá lượt chuyển đổi được phân bổ dựa trên mô hình phân bổ một lượt tương tác trên cùng một thiết bị, vì những lượt chuyển đổi này nằm trong phạm vi của báo cáo tóm tắt được thu thập bằng Attribution Reporting API.
  • Hãy cân nhắc cả số lượt chuyển đổi được phân bổ trong trường hợp xấu nhất và trường hợp tốt nhất. Ví dụ: trong điều kiện mọi yếu tố khác đều không đổi, hãy cân nhắc ngân sách tối thiểu và tối đa có thể của chiến dịch cho một nhà quảng cáo, sau đó dự đoán số lượt chuyển đổi có thể quy nạp cho cả hai kết quả làm dữ liệu đầu vào cho mô phỏng của bạn.
  • Nếu bạn đang cân nhắc sử dụng Hộp cát về quyền riêng tư trên Android, hãy cân nhắc các lượt chuyển đổi được phân bổ trên nhiều nền tảng trong quá trình tính toán.

Quyết định: Sử dụng tính năng chia tỷ lệ

Dùng thử trong Noise Lab

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên về Thông số, hãy tìm Chiến lược tổng hợp của bạn > Chia tỷ lệ. Theo mặc định, chế độ này được đặt thành Có.
  3. Để hiểu rõ những tác động tích cực của việc điều chỉnh tỷ lệ đối với tỷ lệ nhiễu, trước tiên, hãy đặt tỷ lệ thành Không.
  4. Nhấp vào Mô phỏng.
  5. Quan sát tỷ lệ nhiễu của mô phỏng thu được.
  6. Đặt Scaling (Chia tỷ lệ) thành Yes (Có). Xin lưu ý rằng Noise Lab tự động tính toán các hệ số tỷ lệ sẽ được sử dụng dựa trên các phạm vi (giá trị trung bình và giá trị tối đa) của các mục tiêu đo lường cho trường hợp của bạn. Trong một hệ thống thực hoặc thiết lập thử nghiệm nguồn gốc, bạn nên triển khai phương thức tính toán của riêng mình cho các hệ số tỷ lệ.
  7. Nhấp vào Mô phỏng.
  8. Nhận thấy rằng tỷ lệ nhiễu hiện thấp hơn (tốt hơn) trong mô phỏng thứ hai này. Nguyên nhân là do bạn đang sử dụng tính năng chia tỷ lệ.

Theo nguyên tắc thiết kế cốt lõi, nhiễu được thêm vào là một hàm của ngân sách đóng góp.

Do đó, để tăng tỷ lệ tín hiệu trên nhiễu, bạn có thể quyết định chuyển đổi các giá trị được thu thập trong một sự kiện chuyển đổi bằng cách điều chỉnh tỷ lệ các giá trị đó dựa trên ngân sách đóng góp (và giảm tỷ lệ sau khi tổng hợp). Sử dụng tính năng mở rộng quy mô để tăng tỷ lệ tín hiệu trên nhiễu.

Quyết định: Số lượng mục tiêu đo lường và mức phân bổ ngân sách quyền riêng tư

Điều này liên quan đến việc Điều chỉnh tỷ lệ; hãy nhớ đọc phần Sử dụng tính năng điều chỉnh tỷ lệ.

Dùng thử trong Noise Lab

Mục tiêu đo lường là một điểm dữ liệu riêng biệt được thu thập trong các sự kiện chuyển đổi.

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên của mục Tham số, hãy tìm Dữ liệu bạn muốn theo dõi: Mục tiêu đo lường. Theo mặc định, bạn có 2 mục tiêu đo lường: giá trị mua hàng và số lượt mua hàng.
  3. Nhấp vào Mô phỏng để chạy mô phỏng với các mục tiêu mặc định.
  4. Nhấp vào Xoá. Thao tác này sẽ xoá mục tiêu đo lường cuối cùng (trong trường hợp này là số lượt mua).
  5. Nhấp vào Mô phỏng.
  6. Lưu ý rằng tỷ lệ nhiễu cho giá trị mua hiện thấp hơn (tốt hơn) đối với mô phỏng thứ hai này. Điều này là do bạn có ít mục tiêu đo lường hơn, nên một mục tiêu đo lường hiện tại sẽ nhận được toàn bộ ngân sách đóng góp.
  7. Nhấp vào Đặt lại. Giờ đây, bạn có 2 mục tiêu đo lường: giá trị lượt mua hàng và số lượt mua hàng. Xin lưu ý rằng Noise Lab tự động tính toán các hệ số tỷ lệ sẽ được sử dụng dựa trên các phạm vi (giá trị trung bình và tối đa) của các mục tiêu đo lường cho trường hợp của bạn. Theo mặc định, Noise Lab sẽ chia đều ngân sách cho các mục tiêu đo lường.
  8. Nhấp vào Mô phỏng.
  9. Quan sát tỷ lệ nhiễu của mô phỏng thu được. Ghi lại các hệ số tỷ lệ xuất hiện trên mô phỏng.
  10. Giờ đây, hãy tuỳ chỉnh mức phân bổ ngân sách quyền riêng tư để đạt được tỷ lệ tín hiệu trên nhiễu tốt hơn.
  11. Điều chỉnh tỷ lệ phần trăm ngân sách được chỉ định cho từng mục tiêu đo lường. Với các thông số mặc định, Mục tiêu đo lường 1 (cụ thể là giá trị lượt mua) có phạm vi rộng hơn nhiều (từ 0 đến 1000) so với Mục tiêu đo lường 2 (cụ thể là số lượt mua, từ 1 đến 1, tức là luôn bằng 1). Vì lý do này, bạn cần "thêm không gian để mở rộng quy mô": bạn nên phân bổ nhiều ngân sách đóng góp hơn cho Mục tiêu đo lường 1 so với Mục tiêu đo lường 2, để có thể mở rộng quy mô hiệu quả hơn (xem phần Mở rộng quy mô), và do đó
  12. Chỉ định 70% ngân sách cho Mục tiêu đo lường 1. Chỉ định 30% cho Mục tiêu đo lường 2.
  13. Nhấp vào Mô phỏng.
  14. Quan sát tỷ lệ nhiễu của mô phỏng thu được. Đối với giá trị mua hàng, tỷ lệ nhiễu hiện thấp hơn (tốt hơn) đáng kể so với mô phỏng trước đó. Đối với số lượt mua, các chỉ số này hầu như không thay đổi.
  15. Tiếp tục điều chỉnh mức phân chia ngân sách trên các chỉ số. Quan sát mức độ ảnh hưởng của việc này đến tiếng ồn.

Xin lưu ý rằng bạn có thể đặt mục tiêu đo lường tuỳ chỉnh của riêng mình bằng các nút Thêm/Xoá/Đặt lại.


Nếu bạn đo lường một điểm dữ liệu (mục tiêu đo lường) trên một sự kiện chuyển đổi, chẳng hạn như số lượt chuyển đổi, thì điểm dữ liệu đó có thể nhận được toàn bộ ngân sách đóng góp (65536). Nếu bạn đặt nhiều mục tiêu đo lường cho một sự kiện chuyển đổi (chẳng hạn như số lượt chuyển đổi và giá trị giao dịch mua), thì những điểm dữ liệu đó sẽ cần chia sẻ ngân sách đóng góp. Điều này có nghĩa là bạn có ít dư địa hơn để tăng giá trị của mình.

Do đó, bạn càng có nhiều mục tiêu đo lường thì tỷ lệ tín hiệu trên nhiễu càng thấp (nhiễu càng cao).

Một quyết định khác cần đưa ra liên quan đến mục tiêu đo lường là việc phân chia ngân sách. Nếu bạn chia đều ngân sách đóng góp cho 2 điểm dữ liệu, thì mỗi điểm dữ liệu sẽ nhận được ngân sách là 65536/2 = 32768. Điều này có thể phù hợp hoặc không phù hợp tuỳ thuộc vào giá trị tối đa có thể có cho mỗi điểm dữ liệu. Ví dụ: nếu bạn đang đo lường số lượt mua có giá trị tối đa là 1 và giá trị giao dịch mua có giá trị tối thiểu là 1 và giá trị tối đa là 120, thì giá trị giao dịch mua sẽ được hưởng lợi từ việc có "nhiều không gian" hơn để tăng quy mô – tức là được phân bổ tỷ lệ lớn hơn trong ngân sách đóng góp. Bạn sẽ thấy liệu một số mục tiêu đo lường có nên được ưu tiên hơn những mục tiêu khác hay không liên quan đến tác động của nhiễu.

Quyết định: Quản lý giá trị ngoại lệ

Dùng thử trong Noise Lab

Mục tiêu đo lường là một điểm dữ liệu riêng biệt được thu thập trong các sự kiện chuyển đổi.

  1. Chuyển sang Chế độ nâng cao.
  2. Trong bảng điều khiển bên về Thông số, hãy tìm Chiến lược tổng hợp của bạn > Chia tỷ lệ.
  3. Đảm bảo bạn đã đặt chế độ Thu phóng thành Có. Xin lưu ý rằng Noise Lab sẽ tự động tính toán các hệ số tỷ lệ cần sử dụng, dựa trên các phạm vi (giá trị trung bình và tối đa) mà bạn đã cung cấp cho các mục tiêu đo lường.
  4. Giả sử giao dịch mua lớn nhất từng được thực hiện là 2.000 đô la, nhưng hầu hết các giao dịch mua đều nằm trong khoảng từ 10 đến 120 đô la. Trước tiên, hãy xem điều gì sẽ xảy ra nếu chúng ta sử dụng phương pháp mở rộng quy mô theo nghĩa đen (không nên dùng): nhập 2.000 đô la làm giá trị tối đa cho purchaseValue.
  5. Nhấp vào Mô phỏng.
  6. Quan sát thấy tỷ lệ nhiễu cao. Điều này là do hệ số mở rộng của chúng tôi được tính dựa trên 2.000 đô la, trong khi trên thực tế, hầu hết các giá trị mua hàng sẽ thấp hơn đáng kể so với giá trị đó.
  7. Bây giờ, hãy sử dụng một phương pháp mở rộng quy mô thực tế hơn. Thay đổi giá trị mua tối đa thành 1.200.000 VND.
  8. Nhấp vào Mô phỏng.
  9. Nhận thấy rằng tỷ lệ nhiễu thấp hơn (tốt hơn) trong mô phỏng thứ hai này.

Để triển khai việc mở rộng quy mô, bạn thường sẽ tính toán hệ số mở rộng quy mô dựa trên giá trị tối đa có thể cho một sự kiện chuyển đổi nhất định (tìm hiểu thêm trong ví dụ này).

Tuy nhiên, hãy tránh sử dụng giá trị tối đa theo nghĩa đen để tính hệ số tỷ lệ đó, vì điều này sẽ làm giảm tỷ lệ tín hiệu trên nhiễu. Thay vào đó, hãy loại bỏ các giá trị ngoại lệ và sử dụng giá trị tối đa thực tế.

Quản lý giá trị ngoại lệ là một chủ đề chuyên sâu. Bạn có thể cân nhắc một số kỹ thuật phức tạp để cải thiện tỷ lệ tín hiệu trên tạp âm. Một trong số đó được mô tả trong phần Quản lý giá trị ngoại lệ nâng cao.

Các bước tiếp theo

Giờ đây, khi đã đánh giá nhiều chiến lược quản lý nhiễu cho trường hợp sử dụng của mình, bạn có thể bắt đầu thử nghiệm với báo cáo tóm tắt bằng cách thu thập dữ liệu đo lường thực tế thông qua một thử nghiệm nguồn. Xem hướng dẫn và mẹo để Dùng thử API.

Phụ lục

Tìm hiểu nhanh về Noise Lab

Noise Lab giúp bạn nhanh chóng đánh giá và so sánh các chiến lược quản lý độ nhiễu. Bạn có thể sử dụng kỹ thuật này để:

  • Hiểu rõ các thông số chính có thể ảnh hưởng đến nhiễu và tác động của các thông số đó.
  • Mô phỏng ảnh hưởng của nhiễu đến dữ liệu đo lường đầu ra dựa trên các quyết định thiết kế khác nhau. Điều chỉnh các tham số thiết kế cho đến khi bạn đạt được tỷ lệ tín hiệu trên nhiễu phù hợp với trường hợp sử dụng của mình.
  • Chia sẻ ý kiến phản hồi của bạn về tính hữu ích của báo cáo tóm tắt: giá trị nào của các thông số epsilon và nhiễu phù hợp với bạn, giá trị nào không? Các điểm uốn nằm ở đâu?

Hãy xem đây là một bước chuẩn bị. Noise Lab tạo dữ liệu đo lường để mô phỏng kết quả báo cáo tóm tắt dựa trên thông tin đầu vào của bạn. Ứng dụng này không lưu trữ hoặc chia sẻ bất kỳ dữ liệu nào.

Noise Lab có 2 chế độ:

  1. Chế độ đơn giản: hiểu rõ những điều cơ bản về các chế độ kiểm soát tiếng ồn.
  2. Chế độ nâng cao: kiểm thử các chiến lược quản lý nhiễu khác nhau và đánh giá xem chiến lược nào mang lại tỷ lệ tín hiệu trên nhiễu tốt nhất cho các trường hợp sử dụng của bạn.

Nhấp vào các nút trong trình đơn trên cùng để chuyển đổi giữa hai chế độ (1. trong ảnh chụp màn hình sau).

Chế độ đơn giản
  • Với Chế độ đơn giản, bạn có thể kiểm soát các Tham số (ở bên trái hoặc #2 trong ảnh chụp màn hình sau), chẳng hạn như Epsilon và xem cách các tham số này ảnh hưởng đến nhiễu.
  • Mỗi tham số đều có một chú thích (nút "?"). Nhấp vào các tham số này để xem phần giải thích về từng tham số (số 3 trong ảnh chụp màn hình sau)
  • Để bắt đầu, hãy nhấp vào nút "Mô phỏng" và quan sát kết quả đầu ra (#4 trong ảnh chụp màn hình sau)
  • Trong phần Output (Đầu ra), bạn có thể xem nhiều thông tin chi tiết. Một số phần tử có dấu "?" bên cạnh. Hãy dành thời gian nhấp vào từng dấu "?" để xem giải thích về nhiều thông tin.
  • Trong phần Đầu ra, hãy nhấp vào nút bật/tắt Chi tiết nếu bạn muốn xem phiên bản mở rộng của bảng (#5 trong ảnh chụp màn hình sau)
  • Sau mỗi bảng dữ liệu trong phần đầu ra, sẽ có một lựa chọn để tải bảng xuống để sử dụng ngoại tuyến. Ngoài ra, ở góc dưới cùng bên phải, bạn có thể tải tất cả các bảng dữ liệu xuống (mục 6 trong ảnh chụp màn hình sau)
  • Thử nghiệm các chế độ cài đặt khác nhau cho các thông số trong phần Thông số và nhấp vào Mô phỏng để xem các chế độ cài đặt này ảnh hưởng đến đầu ra như thế nào:
    Giao diện Noise Lab ở Chế độ đơn giản.
    Giao diện Noise Lab ở chế độ Đơn giản.
Chế độ nâng cao
  • Ở chế độ Nâng cao, bạn có nhiều quyền kiểm soát hơn đối với các Tham số. Bạn có thể thêm Mục tiêu đo lường và Phương diện tuỳ chỉnh (mục 1 và 2 trong ảnh chụp màn hình sau)
  • Di chuyển xuống dưới trong phần Thông số và xem lựa chọn Chiến lược chính. Bạn có thể dùng tính năng này để kiểm thử các cấu trúc khoá khác nhau (#3 trong ảnh chụp màn hình sau)
    • Để thử nghiệm các Cấu trúc khoá khác nhau, hãy chuyển Chiến lược khoá thành "B"
    • Nhập số lượng cấu trúc khoá khác nhau mà bạn muốn sử dụng (mặc định là "2")
    • Nhấp vào Tạo cấu trúc khoá
    • Bạn sẽ thấy các lựa chọn để chỉ định cấu trúc khoá bằng cách nhấp vào hộp đánh dấu bên cạnh các khoá mà bạn muốn đưa vào cho từng cấu trúc khoá
    • Nhấp vào Mô phỏng để xem kết quả.
      Chế độ nâng cao cung cấp các chế độ kiểm soát cho mục tiêu và phương diện đo lường để theo dõi, được làm nổi bật trong thanh bên.
      Giao diện Noise Lab cho Chế độ nâng cao.
      Chế độ nâng cao cũng là một lựa chọn Chiến lược chính trong mục Thông số của thanh bên.
      Giao diện Noise Lab cho Chế độ nâng cao.

Chỉ số về tiếng ồn

Khái niệm cốt lõi

Độ nhiễu được thêm vào để bảo vệ quyền riêng tư của từng người dùng.

Giá trị nhiễu cao cho biết các nhóm/khoá thưa thớt và chỉ chứa thông tin đóng góp từ một số ít sự kiện nhạy cảm. Việc này được Noise Lab thực hiện tự động để cho phép các cá nhân "ẩn mình trong đám đông" hoặc nói cách khác, bảo vệ quyền riêng tư của những cá nhân này bằng cách thêm một lượng nhiễu lớn hơn.

Giá trị nhiễu thấp cho biết rằng chế độ thiết lập dữ liệu được thiết kế theo cách cho phép các cá nhân "ẩn mình trong đám đông". Điều này có nghĩa là các nhóm chứa thông tin đóng góp từ một số lượng đủ các sự kiện để xác minh rằng quyền riêng tư của từng người dùng được bảo vệ.

Câu lệnh này đúng cho cả sai số phần trăm trung bình (APE) và RMSRE_T (sai số tương đối trung bình bình phương có ngưỡng).

APE (sai số phần trăm trung bình)

APE là tỷ lệ giữa độ nhiễu và tín hiệu, cụ thể là giá trị tóm tắt thực.

Giá trị APE thấp hơn có nghĩa là tỷ lệ tín hiệu trên nhiễu tốt hơn.

Công thức

Đối với một báo cáo tóm tắt cụ thể, APE được tính như sau:

Phương trình cho APE. Bạn phải sử dụng giá trị tuyệt đối vì nhiễu có thể là số âm.
Phương trình cho APE. Bạn phải sử dụng giá trị tuyệt đối vì nhiễu có thể là số âm.

True là giá trị tóm tắt thực. APE là mức trung bình của nhiễu trên mỗi giá trị tóm tắt thực, được tính trung bình trên tất cả các mục trong một báo cáo tóm tắt. Trong Noise Lab, giá trị này sau đó được nhân với 100 để cho ra tỷ lệ phần trăm.

Ưu điểm và nhược điểm

Các nhóm có kích thước nhỏ hơn sẽ có tác động không cân xứng đến giá trị cuối cùng của APE. Điều đó có thể gây hiểu lầm khi đánh giá tiếng ồn. Đó là lý do chúng tôi đã thêm một chỉ số khác là RMSRE_T, được thiết kế để giảm thiểu hạn chế này của APE. Hãy xem ví dụ để biết thông tin chi tiết.

Xem lại mã nguồn để tính toán APE.

RMSRE_T (sai số tương đối căn quân phương có ngưỡng)

RMSRE_T (sai số tương đối bình phương trung bình có ngưỡng) là một chỉ số khác cho tạp âm.

Cách diễn giải RMSRE_T

Giá trị RMSRE_T càng thấp thì tỷ lệ tín hiệu trên nhiễu càng cao.
Ví dụ: nếu tỷ lệ nhiễu chấp nhận được cho trường hợp sử dụng của bạn là 20% và RMSRE_T là 0,2, thì bạn có thể yên tâm rằng mức độ nhiễu nằm trong phạm vi chấp nhận được.

Công thức

Đối với một báo cáo tóm tắt nhất định, RMSRE_T được tính như sau:

Công thức
Phương trình cho RMSRE_T. Bạn phải sử dụng giá trị tuyệt đối vì nhiễu có thể là số âm.
Ưu điểm và nhược điểm

RMSRE_T phức tạp hơn APE một chút. Tuy nhiên, chỉ số này có một số ưu điểm khiến trong một số trường hợp, chỉ số này phù hợp hơn APE để phân tích nhiễu trong báo cáo tóm tắt:

  • RMSRE_T ổn định hơn. "T" là một ngưỡng. "T" được dùng để giảm trọng số trong phép tính RMSRE_T cho những nhóm có ít lượt chuyển đổi hơn và do đó nhạy cảm hơn với nhiễu do kích thước nhỏ. Với T, chỉ số này không tăng đột biến trên những nhóm có ít lượt chuyển đổi. Nếu T bằng 5, thì giá trị nhiễu nhỏ bằng 1 trên một nhóm có 0 lượt chuyển đổi sẽ không hiển thị là lớn hơn 1. Thay vào đó, giá trị này sẽ bị giới hạn ở mức 0,2 (tương đương với 1/5) vì T bằng 5. Bằng cách giảm trọng số cho các nhóm nhỏ hơn (do đó nhạy cảm hơn với độ nhiễu), chỉ số này ổn định hơn và do đó giúp bạn dễ dàng so sánh hai mô phỏng.
  • RMSRE_T cho phép tổng hợp một cách đơn giản. Khi biết RMSRE_T của nhiều nhóm cùng với số lượng thực tế của các nhóm đó, bạn có thể tính toán RMSRE_T của tổng các nhóm. Điều này cũng cho phép bạn tối ưu hoá cho RMSRE_T đối với những giá trị kết hợp này.

Mặc dù có thể tổng hợp cho APE, nhưng công thức này khá phức tạp vì liên quan đến giá trị tuyệt đối của tổng các nhiễu Laplace. Điều này khiến APE khó tối ưu hoá hơn.

Xem xét mã nguồn để tính RMSRE_T.

Ví dụ

Báo cáo tóm tắt có 3 nhóm:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

Báo cáo tóm tắt có 3 nhóm:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0,1 + 0,2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Báo cáo tóm tắt có 3 nhóm:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + Vô cực) / 3 = Vô cực

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Quản lý khoá nâng cao

Một DSP hoặc công ty đo lường quảng cáo có thể có hàng nghìn khách hàng quảng cáo trên toàn cầu, trải rộng trên nhiều ngành, đơn vị tiền tệ và mức giá mua tiềm năng. Điều này có nghĩa là việc tạo và quản lý một khoá tổng hợp cho mỗi nhà quảng cáo có thể sẽ rất khó thực hiện. Ngoài ra, việc chọn giá trị có thể tổng hợp tối đa và ngân sách tổng hợp có thể hạn chế tác động của nhiễu đối với hàng nghìn nhà quảng cáo trên toàn cầu này sẽ rất khó khăn. Thay vào đó, hãy xem xét các trường hợp sau:

Chiến lược chính A

Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý một khoá trên tất cả khách hàng quảng cáo của mình. Đối với tất cả nhà quảng cáo và tất cả đơn vị tiền tệ, phạm vi giao dịch mua rất đa dạng, từ giao dịch mua số lượng thấp, cao cấp đến giao dịch mua số lượng lớn, bình dân. Điều này dẫn đến khoá sau:

Khoá (nhiều đơn vị tiền tệ)
Giá trị tối đa có thể tổng hợp 5.000.000
Phạm vi giá trị giao dịch mua [120 – 5.000.000]
Chiến lược chính B

Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý 2 khoá trên tất cả khách hàng quảng cáo của mình. Họ quyết định tách riêng các khoá theo đơn vị tiền tệ. Đối với tất cả nhà quảng cáo và tất cả đơn vị tiền tệ, phạm vi giao dịch mua rất đa dạng, từ giao dịch mua cao cấp với số lượng thấp đến giao dịch mua bình dân với số lượng lớn. Tách theo đơn vị tiền tệ, họ tạo 2 khoá:

Khoá 1 (USD) Khoá 2 (¥)
Giá trị tối đa có thể tổng hợp 40.000 USD 5.000.000 yên Nhật
Phạm vi giá trị giao dịch mua [120 – 40.000] [15.000 – 5.000.000]

Chiến lược chính B sẽ có ít nhiễu hơn trong kết quả so với Chiến lược chính A, vì các giá trị tiền tệ không được phân phối đồng đều giữa các đơn vị tiền tệ. Ví dụ: hãy xem xét cách các giao dịch mua bằng ¥ kết hợp với các giao dịch mua bằng USD sẽ làm thay đổi dữ liệu cơ bản và kết quả đầu ra nhiễu.

Chiến lược chính C

Nhà cung cấp công nghệ quảng cáo quyết định tạo và quản lý 4 khoá cho tất cả khách hàng quảng cáo của mình, đồng thời phân tách các khoá này theo Đơn vị tiền tệ x Ngành của nhà quảng cáo:

Khoá 1
(USD x Nhà quảng cáo trang sức cao cấp)
Khoá 2
(¥ x Nhà quảng cáo trang sức cao cấp)
Khoá 3
(USD x Nhà quảng cáo bán lẻ quần áo)
Khoá 4
(¥ x Nhà quảng cáo bán lẻ quần áo)
Giá trị tối đa có thể tổng hợp 40.000 USD 5.000.000 yên Nhật 500 USD ¥65.000
Phạm vi giá trị giao dịch mua [10.000 – 40.000] [1.250.000 – 5.000.000] [120 – 500] [15.000 – 65.000]

Chiến lược chính C sẽ có ít nhiễu hơn trong kết quả so với Chiến lược chính B, vì giá trị mua của nhà quảng cáo không được phân bổ đồng đều giữa các nhà quảng cáo. Ví dụ: hãy xem xét cách các giao dịch mua trang sức cao cấp lẫn với các giao dịch mua mũ bóng chày sẽ làm thay đổi dữ liệu cơ bản và kết quả đầu ra nhiễu.

Hãy cân nhắc việc tạo các giá trị tổng hợp tối đa được chia sẻ và hệ số tỷ lệ được chia sẻ cho những điểm chung của nhiều nhà quảng cáo để giảm nhiễu trong kết quả. Ví dụ: bạn có thể thử nghiệm các chiến lược sau cho nhà quảng cáo của mình:

  • Một chiến lược được phân tách theo đơn vị tiền tệ (USD, ¥, CAD, v.v.)
  • Một chiến lược được phân tách theo ngành của nhà quảng cáo (Bảo hiểm, Ô tô, Bán lẻ, v.v.)
  • Một chiến lược được phân tách theo các phạm vi giá trị giao dịch mua tương tự ([100], [1000], [10000], v.v.)

Bằng cách tạo các chiến lược chính dựa trên điểm chung, khoá và mã tương ứng của nhà quảng cáo, bạn sẽ dễ dàng quản lý hơn và tỷ lệ tín hiệu trên nhiễu cũng cao hơn. Thử nghiệm nhiều chiến lược với nhiều điểm chung của nhà quảng cáo để khám phá các điểm uốn trong việc tối đa hoá tác động của nhiễu so với việc quản lý mã.


Quản lý giá trị ngoại lệ nâng cao

Hãy xem xét một tình huống của hai nhà quảng cáo:

  • Nhà quảng cáo A:
    • Đối với tất cả sản phẩm trên trang web của Nhà quảng cáo A, giá mua có thể dao động từ [1.200.000 VND – 10.000.000 VND] , tức là chênh lệch 8.800.000 VND.
    • Giá mua được phân bổ đều trong phạm vi 880 USD, không có giá trị ngoại lệ nào nằm ngoài 2 độ lệch chuẩn so với giá mua trung bình.
  • Nhà quảng cáo B:
    • Đối với tất cả sản phẩm trên trang web của Nhà quảng cáo B, các mức giá mua có thể có là từ [1.200.000 VND đến 10.000.000 VND] , với mức chênh lệch là 8.800.000 VND.
    • Giá mua có xu hướng nghiêng về khoảng từ 1.200.000 VND đến 5.000.000 VND, chỉ có 5% giao dịch mua nằm trong khoảng từ 5.000.000 VND đến 10.000.000 VND.

Do các yêu cầu về ngân sách đóng góp và phương pháp mà nhiễu được áp dụng cho kết quả cuối cùng, theo mặc định, Nhà quảng cáo B sẽ có kết quả đầu ra nhiều nhiễu hơn Nhà quảng cáo A, vì Nhà quảng cáo B có khả năng cao hơn về việc các giá trị ngoại lai sẽ ảnh hưởng đến các phép tính cơ bản.

Bạn có thể giảm thiểu vấn đề này bằng một chế độ thiết lập khoá cụ thể. Thử nghiệm các chiến lược chính giúp quản lý dữ liệu ngoại lệ và phân phối giá trị mua một cách đồng đều hơn trong phạm vi mua của khoá.

Đối với Nhà quảng cáo B, bạn có thể tạo 2 khoá riêng biệt để ghi lại 2 khoảng giá trị mua hàng khác nhau. Trong ví dụ này, công nghệ quảng cáo đã lưu ý rằng các giá trị ngoại lệ xuất hiện trên giá trị mua hàng là 5.000.000 VND. Hãy thử triển khai 2 khoá riêng biệt cho nhà quảng cáo này:

  • Cấu trúc khoá 1 : Khoá chỉ ghi nhận các giao dịch mua trong khoảng từ 1.200.000 VND đến 5.000.000 VND (chiếm khoảng 95% tổng khối lượng giao dịch mua).
  • Cấu trúc khoá 2: Khoá chỉ ghi nhận những giao dịch mua có giá trị cao hơn 5.000.000 VND (chiếm khoảng 5% tổng số giao dịch mua).

Việc triển khai chiến lược chính này sẽ giúp Nhà quảng cáo B quản lý tốt hơn các tín hiệu nhiễu và tối đa hoá tiện ích cho họ từ báo cáo tóm tắt. Với các dải khoá mới nhỏ hơn, Khoá A và Khoá B hiện sẽ có sự phân phối dữ liệu đồng đều hơn trên mỗi khoá tương ứng so với khoá đơn trước đó. Điều này sẽ giúp giảm tác động của nhiễu trong đầu ra của mỗi khoá so với một khoá duy nhất trước đó.