匯總服務負載測試架構

我們準備將這份文件加入公開指南存放區,歡迎您提供意見回饋

我們建議廣告技術人員對 100% 的正式版流量執行負載測試:

  1. 廣告技術應使用 Attribution Reporting API 做為報表用途,存取轉換歸因評估資料。
  2. 廣告技術應在盡量減少雜訊的情況下做出設計決策 (參考:模擬設計決策)
  3. 進行測試時,廣告技術人員應追蹤每天執行的工作數量 (例如每個廣告客戶的工作)、轉換事件數量的預估分布情形,以及每個處理工作中做為輸入的匯總鍵數量 (請參閱 Aggregation Service API 說明文件中的 output_domain_blob_prefix 工作參數),以及每份輸入報表的平均轉換事件數。
  4. 進行測試時,廣告技術人員應根據預期的工作大小 (即報表數量、網域大小),從大小指南表格中查詢建議的執行個體類型,並據此調整已部署的匯總服務。參考資料:AWS 匯總服務的大小設定指南
  5. 廣告技術應執行匯總工作,以便進行工作負載測試。

目標

這份指南專門針對匯總轉換歸因評估提供建議,並包含廣告技術人員可用來執行下列操作的重要設定和設定說明:

  • 預估集合轉換歸因評估的負載預期值
  • 根據要評估的維度和目標,以及廣告主的規模和區隔,針對成效和雜訊最佳化主要設定和配置。

修課條件

本指南適用於廣告技術目標對象。在執行下列步驟前,請先詳閱說明處理雜訊摘要報表設計決策的相關文件,並嘗試使用雜訊實驗室,找出最佳設定。

步驟

1. 初始匯總鍵設定策略

根據業務類型和目標,決定需要多少個關鍵結構 (即一組維度)。請注意,最佳化主要結構有助於減少報表中的雜訊。

廣告主人數
舉例來說,假設您有 1,000 位廣告主

廣告客戶之間的相似性
相似性應根據轉換量、相對轉換價值和廣告客戶特徵的一般涵蓋率進行評估。您能將越相似的資料分組,結果就越精確 (因為輸出值的差異越小),雜訊的影響也越小。詳情請參閱「進階金鑰管理」一文。舉例來說,廣告技術可以依產業、支出和轉換量來區隔廣告客戶,如下所示:

  • 產業 (例如:保險、珠寶、成長型零售)
  • 支出 (例如:<$50,000/季度, $50-$150,000/季度, $150,000-$250,000/季度)
  • 轉換量 (低、中、高)

要建立的匯總鍵結構數量
舉例來說,27 (3x3x3):3 個產業、3 種支出類型和 3 個轉換值分組。

2. 找出匯總鍵值維度

接著,請找出您想追蹤曝光和轉換的重要維度,以便估算來源和觸發事件側邊鍵的數量。

對於每個匯總鍵結構,您需要追蹤曝光次數的相關維度,這有助於您判斷來源端鍵的數量。維度取決於廣告主類型,例如產業、支出或轉換。以下範例說明維度:

  • 重點結構 1:(產業 = 保險、支出 = <50,000、轉換量 = 低)

    • 答:4 個維度:廣告活動 (例如:50 種可能值)、廣告群組 (例如:20 種可能值),裝置類型 (例如:5 種可能值)、地理區域 (例如:50 種可能性)
      1. 可能的維度組合 = 50 x 20 x 5 x 50 = 250,000。這項屬性代表鍵結構 1 來源側鍵的可能維度組合數量。
      2. 需要保留 18 位元 (18 位元 = 262,144 個可能組合)
  • 關鍵結構 2:(產業 = 保險、支出 = <50,000、轉換量 = 中等)

    • 答:4 個維度:廣告活動 (例如:30 種可能的值)、廣告群組 (例如:80 種可能值)、廣告類型 (例如:3 種可能)、地理位置 (例如:50 種可能性)。
      1. 可能的維度組合 = 30 x 80 x 3 x 50 = 360,000。代表索引鍵結構 2 的可能維度組合或來源側鍵數。
      2. 需要保留 19 位元 (19 位元 = 524,288 個可能組合)
  • 主要結構 3:重複 (同樣地為您擁有的所有主要結構進行規劃)

針對每個匯總鍵結構,您需要追蹤轉換的相關重要維度,有助於判斷觸發側鍵。例如:

  • 重點結構 1:(產業 = 保險、支出 = <50,000、轉換量 = 低)

    • 答:2 個維度:產品類別 (例如:100 種可能性)、轉換類型 (例如:5 種可能性)
      1. 可能的維度組合 = 100 x 5 = 500
      2. 需要保留 9 位元 (9 位元 = 512 種可能組合)
  • 關鍵結構 2:(產業 = 保險、支出 = <50,000、轉換量 = 中等)

    • 答:3 個維度:產品類別 (例如:50 種可能性)、產品類型 (10 種可能性)、轉換類型 (3 種可能性)
      1. 可能的維度組合 = 50 x 10 x 3 = 1,500
      2. 需要保留 11 位元 (11 位元 = 2,048 種可能組合)
  • 主要結構體 3:重複 (同樣規劃所有主要結構體)

匯總鍵的預估值

  • 鍵結構 1:250,000 個曝光鍵 x 500 個轉換鍵 = 125,000,000 個鍵
  • 鍵結構 2:360,000 曝光鍵 x 1.5k 轉換鍵 = 540,000,000 個鍵
  • 主要結構體 3:(同樣為您擁有的所有主要結構體規劃)
  • 針對每個 Key Structure 重複上述步驟
  • 匯總鍵的最大值 = 540,000,000 個鍵 (涵蓋所有鍵結構)。需要保留 30 位元 (30 位元 = 1.07B 個可能組合)

預估轉換量

針對每個匯總鍵結構,您可以使用下列範例說明預期的音量:

  • 主要結構 1:(產業 = 保險、支出 = <50,000、轉換量 = 低)
    • 答:預期在下個季度,重點結構 1 將帶來約 $500,000 美元的廣告主支出,平均千次曝光出價為 $8 美元。這會導致需要註冊 62,500,000 次曝光。
    • 預期在下一季,關鍵結構體 1 的平均曝光轉換率為 0.08%,因此需要擷取 50,000 次歸因轉換。針對每次轉換,評估購買價值和購買次數。
  • 關鍵結構 2:(產業 = 保險、支出 = <50,000、轉換量 = 中等)
    • 答:預期下個季度,關鍵 2 的支出金額約為 $800,000 美元,平均千次曝光出價為 $10 美元。這會導致需要註冊 80,000,000 次曝光。
    • 預期在下一季,Key 2 的平均曝光轉換率為 0.03125%,因此需要擷取 25,000 個歸因轉換。針對每次轉換,評估購買價值和購買次數。
  • 針對每個 Key Structure 重複上述步驟

回報放送和批次處理頻率 (每位廣告主的批次)**

您必須針對每個匯總鍵結構定期提交轉換報表。建議廣告技術人員依廣告主分批處理 (以便更清楚區分每份報表的資料,並更有效率地進行匯總),並使用報表的 shared_info.scheduled_report_time 欄位進行分批處理。

  • 答:按時數計費
  • B:每日
  • C:每週

附註

  • 如果是依廣告主分批處理,請向廣告主確認服務水準協議。
  • 批次處理的頻率越高,每批次的雜訊就會越多。(參見「決策:批次頻率」)。

  • 為避免因不正確的批次處理作業而發生錯誤,請務必使用 scheduled_report_time 欄位,而非 report arrival time 欄位。舉例來說,如果您每小時產生批次報表,則 11 點的批次報表應只包含 scheduled_report_time 介於上午 10 點至 11 點之間的報表,而非上午 10 點至 11 點之間的報表 (例如:scheduled_report_time上午 9 點)。

報表量預估

  • 關鍵結構 1:50,000 個歸因轉換 / 2160 (每小時報表、季度內小時數) = 廣告主每小時 24 份摘要報表 (24 x 1000 個廣告主 = 24, 000 份摘要報表)
  • 關鍵結構 2:25,000 個歸因轉換 / 2160 (每小時報表、季度內小時數) = 廣告主每小時 12 份摘要報表 (12 x 1000 個廣告主 = 12, 000 份摘要報表)
  • 關鍵結構 3:重複
  • 每小時的摘要報表總數 = 關鍵結構體 1 的 24 份摘要報表 + 關鍵結構體 2 的 12 份摘要報表 + ... = ... 每小時每位廣告主

意見回饋摘要

瞭解下列廣告技術估算值,有助我們規劃功能和改善項目,以因應廣告技術所需的規模。建議您提供下列資訊給我們。詳情請參閱 AWS 匯總服務的大小設定指南

  • 每個匯總服務工作可輸入的網域鍵 (要匯總的鍵) 數量上限
  • 每項工作 (歸因轉換) 的輸入報表數量上限
  • 每份報表的預估貢獻度 (報表中的鍵/值組合)
  • 每項工作預估歸因轉換次數分布情形
  • 工作中網域鍵的預估分布情形
  • 每小時/天/週的預估工作數