瞭解如何處理可匯總報表中的雜訊、將雜訊納入考量,以及減少雜訊的影響。
事前準備
如要深入瞭解雜訊及其影響,請先參閱「瞭解摘要報表中的雜訊」。
噪音控制選項
雖然您無法直接控制匯總報表加入的雜訊,但可以採取一些步驟來盡量減少影響。以下各節將說明這些策略。
提高至貢獻預算
如「瞭解雜訊」一文所述,系統會根據 0 到 65,536 的比例 (0 到 CONTRIBUTION_BUDGET),為每個鍵套用摘要值雜訊。
因此,為了盡量提高訊號相對於雜訊的比例,您應先放大每個值,再將其設為可匯總的值,也就是將每個值乘以特定係數 (縮放比例),同時確認值維持在貢獻預算內。
計算縮放比例係數
比例因數代表您要將特定可匯總值縮放多少。 這個值應為貢獻預算除以特定鍵可彙整的最大值。
舉例來說,假設廣告主想瞭解購買總價值,您知道任何單筆交易的預期最高購買價值為 $2,000 美元,但有幾個離群值,您決定忽略這些值:
- 計算縮放比例係數:
- 如要盡量提高訊號雜訊比,請將這個值調整為 65,536 (貢獻預算)。
- 因此,縮放比例係數為 65,536 / 2,000,約為 32x 倍。實務上,你可能會將這個因素向上或向下取整。
- 在匯總前放大值。每筆交易金額為 $1 美元,追蹤的指標就增加 32。舉例來說,如果購物金額為 $120,可匯總的值應設為 120*32 = 3,840。
- 匯總後縮減值。收到摘要報表 (內含多位使用者的購買價值總和) 後,請使用匯總前使用的縮放比例,縮減摘要值。在本例中,我們在匯總前使用了 32 的縮放比例,因此需要將摘要報表中收到的摘要值除以 32。因此,如果匯總報表中特定鍵的匯總購買價值為 76,800,則匯總購買價值 (含雜訊) 為 76,800/32 = $2,400 美元。
分割預算
如果您有多個評估目標 (例如購買次數和購買價值),不妨將預算分配給這些目標。
在這種情況下,不同可彙整值的縮放比例會有所不同,具體取決於特定可彙整值的預期上限。
詳情請參閱「瞭解匯總鍵」。
舉例來說,假設您同時追蹤購買次數和購買價值,並決定平均分配預算。
每個評估類型和每個來源可分配 65,536 / 2 = 32,768 個。
- 購買次數:
- 您只追蹤一筆購買交易,因此單次轉換最多只會計入 1 筆購買交易。
- 因此,您決定將購買次數的縮放比例係數設為 32,768 / 1 = 32,768。
- 購物價值:
- 假設任何單筆交易的預期最高購物價值為 $2,000 美元。
- 因此,您決定將購買價值的縮放比例係數設為 32,768 / 2,000 = 16.384,或約 16。
較粗略的匯總鍵可提升訊號雜訊比
由於粗略索引鍵比精細索引鍵擷取的轉換事件更多,因此粗略索引鍵通常會產生較高的摘要值。
相較於較低的值,較高的摘要值較不受干擾影響;相對於這個值,這些值上的干擾可能較低。
與使用更精細的鍵收集的值相比,使用較粗略的鍵收集的值雜訊相對較少。
範例
在其他條件相同的情況下,如果某個鍵會追蹤全球的購買價值 (所有國家/地區的總和),那麼與追蹤國家/地區層級轉換的鍵相比,這個鍵會帶來更高的摘要購買價值 (以及更高的摘要轉換次數)。
因此,特定國家/地區的總購買價值相對雜訊會高於所有國家/地區的總購買價值相對雜訊。
同樣地,在其他條件相同的情況下,鞋子的總購買價值會低於所有商品 (包括鞋子) 的總購買價值。
因此,鞋類總購物價值的相對雜訊會高於所有商品總購物價值的相對雜訊。
加總摘要值 (匯總) 時,也會加總雜訊
將摘要報表中的摘要值加總,即可存取更高層級的資料,但同時也會加總這些摘要值中的雜訊。
以下介紹兩種不同的做法:
- 方法 A:在金鑰中加入地理位置 ID。摘要報表會公開地理區域 ID 層級的鍵,每個鍵都與特定地理區域 ID 層級的摘要購物價值相關聯。
- 方法 B:不在鍵中加入地理位置 ID。摘要報表會直接顯示所有地理位置 ID / 地點的摘要購買價值。
如要存取國家/地區層級的購買價值,請按照下列步驟操作:
- 採用方法 A 時,您會加總地理區域 ID 層級的摘要值,因此也會加總這些值的雜訊。這可能會導致最終的地理區域 ID 層級購買價值加入更多雜訊。
- 方法 B 則是直接查看摘要報表中的資料。該資料只加入過一次雜訊。
因此,使用方法 A 時,特定地理 ID 的購買價值摘要可能會有更多雜訊。
同樣地,在索引鍵中加入郵遞區號層級的維度,可能會比使用較粗略的索引鍵和區域層級的維度,產生更多雜訊。
匯總較長的時間範圍可提高信號雜訊比
如果減少索取摘要報表的頻率,每個摘要值可能會比頻繁索取報表時更高,因為轉換可能發生在較長的時間範圍內。
如先前所述,摘要值越高,相對雜訊就越低。因此,減少要求摘要報表的頻率,可提高訊號雜訊比 (越高品質越好)。
以下範例說明:
- 如果您要求每小時產生摘要報表,並加總每份報表的摘要值來取得每日資料,系統就會加入 24 次雜訊。
- 在每日摘要報表中,雜訊只會加入一次。
Epsilon 越高,雜訊越少
Epsilon 值越高,雜訊越少,隱私權保護程度越低。
善用篩選和重複資料刪除功能
在不同目標之間分配預算時,瞭解特定事件的發生次數非常重要。舉例來說,廣告主可能只關心每次點擊的購買次數,但對最多 3 次的「產品頁面瀏覽」轉換感興趣。為支援這些用途,您可能也想使用下列 API 功能,控管產生的報表數量,以及計入的轉換次數:
- 篩選。進一步瞭解篩選功能。
- 簡化。進一步瞭解重複資料刪除程序。
測試 epsilon
廣告技術可將 epsilon 設為大於 0 且小於或等於 64 的值。這個範圍可讓您靈活測試。epsilon 值越小,隱私權保護程度越高。建議您從 epsilon=10 開始。
建議進行的實驗
建議您採取以下做法:
- 從 epsilon = 10 開始。
- 如果這會導致顯著的實用性問題,請逐步增加 epsilon。
- 分享您對資料可用性特定轉折點的意見。
參與討論及分享意見
歡迎參與並試用這項 API。
後續步驟
- 如要進一步瞭解影響報表的因素,例如廣告活動變數、批次處理頻率和維度精細度,請參閱「實驗摘要報表設計決策」。
- 試試噪音實驗室。