匯總服務負載測試架構

我們準備將這份文件新增至公開指南存放區,歡迎提供意見回饋。

我們建議廣告技術公司對 100% 的正式版流量執行負載測試:

  1. 廣告技術應使用 Attribution Reporting API 做為報表用途,存取轉換歸因評估資料。
  2. 廣告技術應做出設計決策,同時盡量減少干擾 (參考:設計決策模型)
  3. 測試期間,廣告技術供應商應追蹤每天執行的工作數量 (例如每個廣告主的工作數量)、轉換事件量的預估分配情形,以及每個處理工作輸入的匯總鍵數量 (請參閱匯總服務 API 說明文件中的 output_domain_blob_prefix 工作參數),並預估每個輸入報表的平均轉換事件數。
  4. 為進行測試,廣告技術人員應根據預期工作大小 (即報表量、網域大小),從大小調整指南表格中查閱建議的執行個體類型,並據此調整部署的匯總服務大小。參考資料:AWS 上的匯總服務大小調整指南
  5. 廣告技術人員應執行工作負載測試的匯總作業。

目標

本指南專門介紹匯總轉換歸因評估,並提供重要的設定和配置說明,供廣告技術人員參考,以便:

  • 預估匯總轉換歸因評估的負載期望
  • 根據廣告主打算評估的維度和目標,以及廣告主的大小和區隔,針對成效和干擾最佳化主要設定和配置。

修課條件

本指南的目標對象為廣告技術人員。請先詳閱處理干擾摘要報告設計決策干擾實驗室相關文件,再按照下列步驟操作,以取得最佳設定。

步驟

1. 初始匯總鍵設定策略

根據業務類型和目標,決定需要多少不同的索引鍵結構 (即維度集)。請注意,最佳化金鑰結構有助於減少報表中的雜訊。

廣告主數量
舉例來說,假設您有 1,000 位廣告主

廣告主之間的相似性
評估相似性時,應考量轉換量、相對轉換價值,以及廣告主特徵的一般涵蓋範圍。分組越相似,結果就越精確 (因為輸出值差異較小),因此雜訊的影響也越小。詳情請參閱進階金鑰管理。舉例來說,廣告技術可以依據產業、支出和轉換量,將廣告主細分成不同區隔,如下所示:

  • 產業 (例如:保險、珠寶、成長零售)
  • 支出 (例如:<每季 $50,000 美元、 每季 $50,000 美元至 $150,000 美元、每季 $150,000 美元至 $250,000 美元)
  • 轉換量 (低、中、高)

要建立的匯總鍵結構數量
舉例來說, 27 (3x3x3):3 個產業、3 種支出類型,以及 3 個轉換價值分組。

2. 找出匯總鍵維度

接著,找出您要追蹤的重要曝光和轉換維度,估算來源和觸發端金鑰的數量。

針對每個匯總鍵結構,您需要追蹤曝光次數的重要維度,這有助於判斷來源端鍵的數量。維度取決於廣告主類型,例如產業、支出或轉換。以下範例有助於說明維度:

  • 主要結構 1:(產業 = 保險,支出 = <50,000,轉換量 = 低)

    • 答:4 個維度:廣告活動 (例如:50 種可能性)、廣告群組 (例如:20 種可能性)、裝置類型 (例如:5 種可能性)、地理區域 (例如:50 種可能性)
      1. 可能的維度組合 = 50 x 20 x 5 x 50 = 250,000。這代表鍵結構 1 的來源端鍵可能維度組合數量。
      2. 需要保留 18 位元 (18 位元 = 262,144 種可能的組合)
  • 關鍵字結構 2:(產業 = 保險、支出 = <50,000、轉換量 = 中等)

    • 答:4 個維度:廣告活動 (例如:30 種可能性)、廣告群組 (例如:80 種可能性)、廣告類型 (例如:3 possibilities)、地理區域 (例如:50 種可能性)。
      1. 可能的尺寸組合 = 30 x 80 x 3 x 50 = 360,000。這代表索引鍵結構 2 的可能維度組合或來源端索引鍵數量。
      2. 需要保留 19 位元 (19 位元) = 524,288 種可能的組合)
  • 金鑰結構 3:重複 (同樣為所有金鑰結構規劃)

針對每個匯總鍵結構,您需要追蹤轉換的重要維度,這有助於判斷觸發端鍵。例如:

  • 主要結構 1:(產業 = 保險,支出 = <50,000,轉換量 = 低)

    • A:2 個維度:產品類別 (例如:100 種可能性)、轉換類型 (例如:5 種可能性)
      1. 可能的尺寸組合 = 100 x 5 = 500
      2. 需要保留 9 位元 (9 位元 = 512 種可能的組合)
  • 關鍵字結構 2:(產業 = 保險、支出 = <50,000、轉換量 = 中等)

    • 答:3 個維度:產品類別 (例如:50 種可能性)、產品類型 (10 種可能性)、轉換類型 (3 種可能性)
      1. 可能的尺寸組合 = 50 x 10 x 3 = 1,500
      2. 需要保留 11 個位元 (11 個位元 = 2,048 種可能的組合)
  • 主要結構 3:重複 (同樣為所有主要結構規劃)

匯總鍵的預估值

  • 金鑰結構 1:250,000 個曝光金鑰 x 500 個轉換金鑰 = 125,000,000 個金鑰
  • 金鑰結構 2:360,000 個曝光金鑰 x 1,500 個轉換金鑰 = 540,000,000 個金鑰
  • 主要結構 3:(同樣為所有主要結構規劃)
  • 針對每個金鑰結構重複執行上述步驟
  • 匯總鍵上限 = 540,000,000 個鍵 (所有鍵結構)。需要保留 30 位元 (30 位元 = 10.7 億種可能的組合)

預期轉換量

針對每個匯總索引鍵結構,預期量可透過下列範例說明:

  • 主要結構 1:(產業 = 保險,支出 = <50,000,轉換量 = 低)
    • 答:預計在下個季度,主要結構 1 的廣告主支出約為 $500,000 美元,平均千次曝光出價為 $8 美元。預期這會產生 6,250 萬次曝光,需要註冊。
    • 預期主要結構 1 在下個季度的平均曝光到轉換率為 0.08%,因此需要擷取 50,000 次歸因轉換。針對每次轉換, 評估購買價值和購買次數。
  • 主要結構 2:(產業 = 保險,支出 = <50,000,轉換量 = 中)
    • 答:預計在下個季度,主要關鍵字 2 的支出約為 $800,000 美元,平均千次曝光出價為 $10 美元。預期這會產生 80,000,000 次曝光,需要註冊。
    • 預期 Key 2 在下個季度的平均曝光至轉換率為 0.03125%,因此需要擷取 25,000 次歸因轉換。針對每次轉換, 評估購買價值和購買次數。
  • 針對每個金鑰結構重複執行上述步驟

報表傳送和批次處理頻率 (每個廣告主一個批次)**

您需要定期傳送每個匯總鍵結構的轉換報表。建議廣告技術依廣告主分批處理 (以便更清楚地區分每份報表的資料,並提高匯總效率),並使用報表的 shared_info.scheduled_report_time 欄位進行分批處理。

  • A:每小時
  • B:每日
  • C:每週

附註

  • 如要依廣告主分批處理,請與廣告主確認服務水準協議。
  • 批次處理頻率越高,每個批次包含的雜訊就越多。(請參閱「決策:批次頻率」)。

  • 為避免因批次處理錯誤而發生錯誤,請確保批次使用 scheduled_report_time 欄位,而非 report arrival time。舉例來說,如果您每小時批次處理一次,上午 11 點的批次應只包含 scheduled_report_time 介於上午 10 點到上午 11 點的報表,不應包含 scheduled_report_time 不同 (例如:上午 9 點)。

報表量預估

  • 主要結構 1:50,000 個已歸因轉換 / 2160 (每小時報表,每季的小時數) = 每位廣告主每小時 24 份摘要報表 (24 x 1000 位廣告主 = 24, 000 份摘要報表)
  • 主要結構 2:25,000 個歸因轉換 / 2160 (每小時報表,每季的小時數) = 每位廣告主每小時 12 份摘要報表 (12 x 1000 位廣告主 = 12, 000 份摘要報表)
  • 按鍵結構 3:重複
  • 每小時的摘要報表總數 = 結構 1 的 24 份摘要報表 + 結構 2 的 12 份摘要報表 + ... = 每個廣告主每小時...

意見回饋摘要

瞭解廣告技術的下列預估值,有助於我們規劃功能和改善項目,以支援廣告技術所需的規模。建議您提供下列資訊給我們。詳情請參閱我們的 AWS 匯總服務大小調整指南

  • 每個匯總服務工作的輸入網域鍵 (要匯總的鍵) 數量上限
  • 每項工作可輸入的報表數量上限 (歸因轉換)
  • 每份報表的預估貢獻度 (報表中的鍵/值組合)
  • 預估每個職位歸因轉換次數的分布情形
  • 作業中網域金鑰的預估分布情形
  • 預估每小時/每天/每週的工作數量