Tìm hiểu cách xử lý, tính đến và giảm thiểu tác động của sự nhiễu trong báo cáo tổng hợp.
Trước khi bắt đầu
Trước khi tiếp tục, để hiểu rõ hơn về tiếng ồn và tác động của tiếng ồn, hãy tham khảo bài viết Tìm hiểu về tiếng ồn trong báo cáo tóm tắt.
Các chế độ điều khiển tiếng ồn
Mặc dù không thể trực tiếp kiểm soát tạp âm được thêm vào báo cáo tổng hợp, nhưng bạn có thể thực hiện một số bước để giảm thiểu tác động của tạp âm. Các phần sau đây giải thích những chiến lược này.
Mở rộng quy mô ngân sách đóng góp
Như đã giải thích trong phần Tìm hiểu về độ nhiễu, độ nhiễu được áp dụng cho giá trị tóm tắt cho mỗi khoá dựa trên thang điểm 0-65.536 (0-CONTRIBUTION_BUDGET
).

Do đó, để tối đa hoá tín hiệu so với nhiễu, bạn nên mở rộng quy mô từng giá trị trước khi đặt giá trị đó làm giá trị tổng hợp, tức là nhân từng giá trị với một hệ số nhất định, hệ số điều chỉnh theo tỷ lệ, đồng thời đảm bảo giá trị đó nằm trong ngân sách đóng góp.

Tính hệ số tỷ lệ
Hệ số tỷ lệ biểu thị mức độ bạn muốn điều chỉnh theo tỷ lệ một giá trị tổng hợp nhất định. Giá trị của thuộc tính này phải là ngân sách đóng góp chia cho giá trị tổng hợp tối đa cho một khoá nhất định.

Ví dụ: giả sử nhà quảng cáo muốn biết tổng giá trị giao dịch mua. Bạn biết rằng giá trị giao dịch mua dự kiến tối đa của mỗi giao dịch mua riêng lẻ là 2.000 đô la, ngoại trừ một vài giá trị ngoại lai mà bạn quyết định bỏ qua:
- Tính hệ số tỷ lệ:
- Để tối đa hoá tỷ lệ tín hiệu trên tạp âm, bạn cần điều chỉnh tỷ lệ này thành 65.536 (ngân sách đóng góp).
- Điều này dẫn đến hệ số tỷ lệ 65.536 / 2.000, tương đương với 32x. Trong thực tế, bạn có thể làm tròn hệ số này lên hoặc xuống.
- Điều chỉnh theo tỷ lệ các giá trị trước khi tổng hợp. Cứ mỗi 1 đô la chi tiêu cho giao dịch mua, chỉ số được theo dõi sẽ tăng thêm 32. Ví dụ: đối với giao dịch mua trị giá 120 đô la Mỹ, hãy đặt giá trị tổng hợp là 120*32 = 3.840.
- Điều chỉnh giảm các giá trị sau khi tổng hợp. Sau khi bạn nhận được báo cáo tóm tắt chứa giá trị giao dịch mua được tổng hợp trên nhiều người dùng, hãy giảm giá trị tóm tắt bằng hệ số điều chỉnh mà bạn đã sử dụng trước khi tổng hợp. Trong ví dụ này, chúng ta đã sử dụng hệ số điều chỉnh là 32 trước khi tổng hợp, vì vậy, chúng ta cần chia giá trị tóm tắt nhận được trong báo cáo tóm tắt cho 32. Do đó, nếu giá trị mua hàng tóm tắt cho một khoá nhất định trong báo cáo tóm tắt là 76.800, thì giá trị mua hàng tóm tắt (có nhiễu) là 76.800/32 = 2.400 đô la.
Phân chia ngân sách
Nếu có nhiều mục tiêu đo lường (ví dụ: số lượt mua hàng và giá trị lượt mua hàng), bạn nên chia ngân sách cho các mục tiêu này.
Trong trường hợp này, hệ số điều chỉnh sẽ khác nhau đối với các giá trị tổng hợp, tuỳ thuộc vào giá trị tối đa dự kiến của một giá trị tổng hợp nhất định.
Đọc thông tin chi tiết trong bài viết Tìm hiểu về khoá tổng hợp.
Ví dụ: giả sử bạn đang theo dõi cả số lượt mua và giá trị giao dịch mua, đồng thời quyết định phân bổ ngân sách một cách công bằng.
Bạn có thể phân bổ 65.536 / 2 = 32.768 cho mỗi loại đo lường và mỗi nguồn.
- Số lượt mua:
- Bạn chỉ theo dõi một giao dịch mua, vì vậy, số lượng giao dịch mua tối đa cho một lượt chuyển đổi nhất định là 1.
- Do đó, bạn quyết định đặt hệ số tỷ lệ cho số lượt mua là 32.768 / 1 = 32.768.
- Giá trị giao dịch mua:
- Giả sử giá trị giao dịch mua dự kiến tối đa của mỗi giao dịch mua là 2.000 đô la.
- Do đó, bạn quyết định đặt hệ số tỷ lệ cho giá trị giao dịch mua là 32.768 / 2.000 = 16.384 hoặc xấp xỉ 16.
Khoá tổng hợp thô hơn giúp cải thiện tỷ lệ tín hiệu trên tạp âm
Vì khoá thô thu thập nhiều sự kiện chuyển đổi hơn khoá chi tiết, nên khoá thô thường dẫn đến giá trị tóm tắt cao hơn.
Giá trị tóm tắt cao hơn ít bị ảnh hưởng bởi nhiễu hơn so với giá trị thấp hơn; nhiễu trên các giá trị này có thể thấp hơn so với giá trị này.
Các giá trị được thu thập bằng khoá thô có thể ít nhiễu hơn so với các giá trị được thu thập bằng khoá chi tiết hơn.
Ví dụ:
Nếu các yếu tố khác không thay đổi, thì khoá theo dõi giá trị giao dịch mua trên toàn cầu (tổng hợp trên tất cả các quốc gia) sẽ dẫn đến giá trị giao dịch mua tóm tắt cao hơn (và số lượt chuyển đổi tóm tắt cao hơn) so với khoá theo dõi lượt chuyển đổi ở cấp quốc gia.
Do đó, độ nhiễu tương đối về tổng giá trị giao dịch mua của một quốc gia cụ thể sẽ cao hơn độ nhiễu tương đối về tổng giá trị giao dịch mua của tất cả các quốc gia.
Tương tự, khi tất cả các yếu tố khác không thay đổi, tổng giá trị giao dịch mua giày sẽ thấp hơn tổng giá trị giao dịch mua tất cả các mặt hàng (bao gồm cả giày).
Do đó, độ nhiễu tương đối về tổng giá trị giao dịch mua giày sẽ cao hơn độ nhiễu tương đối về tổng giá trị giao dịch mua của tất cả các mặt hàng.

Việc cộng các giá trị tóm tắt (cộng dồn) cũng cộng cả độ nhiễu của các giá trị đó
Khi cộng các giá trị tóm tắt từ báo cáo tóm tắt để truy cập vào dữ liệu cấp cao hơn, bạn cũng cộng cả độ nhiễu từ các giá trị tóm tắt này.

Hãy xem xét hai phương pháp khác nhau: - Phương pháp A: bạn thêm Mã địa lý vào khoá. Báo cáo tóm tắt hiển thị các khoá ở cấp mã nhận dạng địa lý, mỗi khoá liên kết với giá trị mua hàng tóm tắt ở cấp một mã nhận dạng địa lý cụ thể. – Phương pháp B: bạn không đưa mã nhận dạng địa lý vào khoá. Báo cáo tóm tắt trực tiếp hiển thị giá trị tóm tắt của giao dịch mua cho tất cả mã địa lý / vị trí.
Cách truy cập giá trị giao dịch mua ở cấp quốc gia: – Với phương pháp A, bạn cộng các giá trị tóm tắt ở cấp mã địa lý, do đó cũng cộng cả độ nhiễu của các giá trị đó. Điều này có thể làm tăng độ nhiễu cho giá trị giao dịch mua cuối cùng ở cấp mã nhận dạng địa lý. – Với phương pháp B, bạn trực tiếp xem dữ liệu được hiển thị trong báo cáo tóm tắt. Chỉ thêm nhiễu một lần vào dữ liệu đó.
Do đó, giá trị tóm tắt của giao dịch mua cho một mã địa lý nhất định có thể sẽ có nhiều giá trị sai lệch hơn với phương pháp A.
Tương tự, việc đưa phương diện cấp mã zip vào khoá có thể dẫn đến kết quả nhiễu hơn so với việc sử dụng khoá thô hơn có phương diện cấp khu vực.
Việc tổng hợp trong khoảng thời gian dài hơn sẽ làm tăng tỷ lệ tín hiệu trên tạp âm
Việc yêu cầu báo cáo tóm tắt ít thường xuyên hơn có nghĩa là mỗi giá trị tóm tắt có thể sẽ cao hơn so với khi bạn yêu cầu báo cáo thường xuyên hơn; nhiều lượt chuyển đổi có thể xảy ra trong khoảng thời gian dài hơn.
Như đã đề cập trước đó, giá trị tóm tắt càng cao thì độ nhiễu tương đối càng thấp. Do đó, việc yêu cầu báo cáo tóm tắt ít thường xuyên hơn sẽ dẫn đến tỷ lệ tín hiệu trên tạp âm cao hơn (tốt hơn).

Sau đây là ví dụ minh hoạ:
- Nếu bạn yêu cầu báo cáo tóm tắt hằng giờ trong 24 giờ rồi tổng hợp giá trị tóm tắt từ mỗi báo cáo hằng giờ để truy cập vào dữ liệu ở cấp ngày, thì độ nhiễu sẽ được thêm 24 lần.
- Trong một báo cáo tóm tắt hằng ngày, hệ thống chỉ thêm tiếng ồn một lần.
Epsilon cao hơn, độ nhiễu thấp hơn
Giá trị epsilon càng cao thì độ nhiễu càng thấp và khả năng bảo vệ quyền riêng tư càng thấp.
Tận dụng tính năng lọc và loại bỏ trùng lặp
Một phần quan trọng trong việc phân bổ ngân sách giữa các khoá khác nhau là hiểu được số lần một sự kiện nhất định có thể xảy ra. Ví dụ: một nhà quảng cáo có thể chỉ quan tâm đến một lượt mua hàng cho mỗi lượt nhấp, nhưng có thể quan tâm đến tối đa 3 lượt chuyển đổi "lượt xem trang sản phẩm". Để hỗ trợ các trường hợp sử dụng này, bạn cũng nên tận dụng các tính năng API sau đây để kiểm soát số lượng báo cáo được tạo và những lượt chuyển đổi được tính:
- Lọc. Đọc thêm về tính năng lọc.
- Loại bỏ trùng lặp. Đọc thêm về tính năng loại bỏ trùng lặp.
Thử nghiệm với epsilon
Công nghệ quảng cáo có thể đặt epsilon thành một giá trị lớn hơn 0 và tối đa là 64. Phạm vi này cho phép kiểm thử linh hoạt. Giá trị epsilon thấp hơn sẽ giúp bảo vệ quyền riêng tư tốt hơn. Bạn nên bắt đầu với epsilon=10.
Đề xuất để thử nghiệm
Bạn nên làm như sau: – Bắt đầu với epsilon = 10. – Trong trường hợp điều này gây ra các vấn đề đáng chú ý về tiện ích, hãy tăng dần epsilon. – Chia sẻ ý kiến phản hồi của bạn về các điểm chuyển đổi cụ thể mà bạn có thể tìm thấy liên quan đến khả năng hữu dụng của dữ liệu.
Thu hút và chia sẻ ý kiến phản hồi
Bạn có thể tham gia và thử nghiệm với API này.
- Đọc về báo cáo tổng hợp và dịch vụ tổng hợp, đặt câu hỏi và đề xuất ý kiến phản hồi.
- Đọc Hướng dẫn về báo cáo phân bổ.
- Đặt câu hỏi và tham gia thảo luận về kho lưu trữ Hỗ trợ nhà phát triển Hộp cát về quyền riêng tư.
Các bước tiếp theo
- Để biết thêm thông tin về các yếu tố ảnh hưởng đến báo cáo, chẳng hạn như biến chiến dịch, tần suất tạo lô và mức độ chi tiết của phương diện, hãy tham khảo bài viết Thử nghiệm với các quyết định thiết kế báo cáo tóm tắt .
- Dùng thử Noise lab.