Noiselab

이 문서에 관한 정보

이 문서를 읽으면 다음을 할 수 있습니다.

  • 요약 보고서를 생성하기 전에 어떤 전략을 수립해야 하는지 파악하세요.
  • 다양한 소음 매개변수의 영향을 파악하고 다양한 소음 관리 전략을 빠르게 탐색하고 평가할 수 있는 도구인 Noise Lab을 소개합니다.
Noise Lab 스크린샷
Noise Lab

의견 공유

이 문서에서는 요약 보고서 작업에 관한 몇 가지 원칙을 요약하지만, 여기에 반영되지 않은 노이즈 관리 방법이 여러 가지 있습니다. 제안, 추가, 질문을 환영합니다.

  • 노이즈 관리 전략, API (엡실론)의 유용성 또는 개인 정보 보호에 관한 공개 의견을 제공하고 노이즈 연구소로 시뮬레이션할 때 관찰한 내용을 공유하려면 다음 단계를 따르세요. 이 문제에 댓글 달기
  • API의 다른 측면에 관해 공개적으로 의견을 제공하려면 여기에서 새 문제를 만드세요.

시작하기 전에

  1. Attribution Reporting: 요약 보고서Attribution Reporting 전체 시스템 개요를 읽어 보세요.
  2. 이 가이드를 최대한 활용하려면 노이즈 이해집계 키 이해를 스캔하세요.

설계 결정

핵심 설계 원칙

서드 파티 쿠키와 요약 보고서의 작동 방식에는 근본적인 차이가 있습니다. 한 가지 중요한 차이점은 요약 보고서의 측정 데이터에 추가되는 노이즈입니다. 또 다른 요소는 보고서가 예약되는 방식입니다.

신호 대 노이즈 비율이 높은 요약 보고서 측정 데이터에 액세스하려면 수요측 플랫폼 (DSP)과 광고 측정 제공업체가 광고주와 협력하여 노이즈 관리 전략을 개발해야 합니다. 이러한 전략을 개발하려면 DSP와 측정 제공업체가 설계 결정을 내려야 합니다. 이러한 결정은 하나의 필수 개념을 중심으로 이루어집니다.

분포 노이즈 값은 엄밀히 말해 엡실론과 기여도 예산이라는 두 매개변수에만 의존하지만, 출력 측정 데이터의 신호 대 노이즈 비율에 영향을 미치는 다른 여러 컨트롤을 사용할 수 있습니다.

반복적인 프로세스를 통해 최적의 결정을 내릴 수 있지만, 이러한 결정의 각 변형은 약간 다른 구현으로 이어지므로 각 코드 반복을 작성하기 전 (및 광고를 게재하기 전)에 이러한 결정을 내려야 합니다.

결정: 측정기준 세부사항

Noise Lab에서 사용해 보기

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 '내 전환 데이터'를 찾습니다.
  3. 기본 매개변수를 확인합니다. 기본적으로 일일 기여 전환수 총계는 1, 000입니다. 기본 설정 (기본 측정기준, 각 측정기준의 가능한 서로 다른 값의 기본 수, 키 전략 A)을 사용하는 경우 버킷당 평균 약 40개가 됩니다. 입력된 버킷당 평균 일일 기여 전환수 값이 40입니다.
  4. 시뮬레이션을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
  5. '매개변수' 측면 패널에서 '측정기준'을 찾습니다. 지역도시로 이름을 바꾸고 가능한 서로 다른 값의 수를 50으로 변경합니다.
  6. 이로 인해 버킷당 평균 기여 전환수가 어떻게 달라지는지 확인합니다. 이제 훨씬 낮아졌습니다. 다른 항목을 변경하지 않고 이 측정기준 내에서 가능한 값의 수를 늘리면 각 버킷에 포함되는 전환 이벤트 수는 변경되지 않지만 총 버킷 수가 늘어나기 때문입니다.
  7. 시뮬레이션을 클릭합니다.
  8. 결과 시뮬레이션의 노이즈 비율을 확인합니다. 이제 노이즈 비율이 이전 시뮬레이션보다 높습니다.

핵심 설계 원칙에 따라 작은 요약 값은 큰 요약 값보다 노이즈가 많을 수 있습니다. 따라서 구성 선택은 각 버킷에 포함되는 기여 분석 전환 이벤트 수 (집계 키라고도 함)에 영향을 미치며, 이 수량은 최종 출력 요약 보고서의 노이즈에 영향을 미칩니다.

단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 설계 결정 중 하나는 측정기준 세부사항입니다. 다음은 집계 키와 해당 측정기준의 예입니다.

  • 접근 방식 1: 대략적인 측정기준이 있는 하나의 주요 구조: 국가 x 광고 캠페인 (또는 가장 큰 캠페인 집계 버킷) x 제품 유형 (가능한 10가지 제품 유형 중)
  • 접근 방식 2: 세부적인 측정기준이 포함된 하나의 키 구조: 도시 x 광고 소재 ID x 제품 (가능한 제품 100개 중)

도시국가보다 세분화된 측정기준이고, 광고 소재 ID캠페인보다 세분화된 측정기준이며, 제품제품 유형보다 세분화된 측정기준입니다. 따라서 접근 방식 2의 요약 보고서 출력에는 접근 방식 1보다 버킷당 (= 키당) 이벤트 (전환) 수가 적습니다. 출력에 추가되는 노이즈는 버킷의 이벤트 수와 독립적이므로 접근 방식 2를 사용하면 요약 보고서의 측정 데이터에 노이즈가 더 많이 추가됩니다. 각 광고주에 대해 결과에서 유용성을 극대화하기 위해 키 설계에서 다양한 세부사항 트레이드오프를 실험합니다.

결정: 주요 구조

Noise Lab에서 사용해 보기

Simple 모드에서는 기본 키 구조가 사용됩니다. 고급 모드에서는 다양한 키 구조를 실험해 볼 수 있습니다. 예시 측정기준이 포함되어 있으며 이를 수정할 수도 있습니다.

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 '주요 전략'을 찾습니다. 도구에서 A라는 기본 전략은 모든 측정기준(지역 x 캠페인 ID x 제품 카테고리)을 포함하는 하나의 세부 키 구조를 사용합니다.
  3. 시뮬레이션을 클릭합니다.
  4. 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
  5. 키 전략을 B로 변경합니다. 이렇게 하면 키 구조를 구성할 수 있는 추가 컨트롤이 표시됩니다.
  6. 다음과 같이 키 구조를 구성합니다.
    1. 주요 구조 수: 2
    2. 주요 구조 1 = 지역 x 제품 카테고리
    3. 주요 구조 2 = 캠페인 ID x 제품 카테고리
  7. 시뮬레이션을 클릭합니다.
  8. 이제 서로 다른 두 가지 키 구조를 사용하므로 측정 목표 유형별로 두 개의 요약 보고서(구매 수에 대한 보고서 2개, 구매 금액에 대한 보고서 2개)가 표시됩니다. 소음 비율을 관찰합니다.
  9. 자체 맞춤 측정기준으로도 시도해 볼 수 있습니다. 이렇게 하려면 추적하려는 데이터(측정기준)를 찾습니다. 예시 측정기준을 삭제하고 마지막 측정기준 아래에 있는 추가/삭제/재설정 버튼을 사용하여 직접 만드는 것이 좋습니다.

단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하기로 결정한 키 구조입니다. 다음 집계 키의 예를 참고하세요.

  • 모든 측정기준이 포함된 하나의 주요 구조(Key Strategy A)
  • 두 가지 주요 구조(각각 측정기준의 하위 집합 포함)를 사용합니다. 이를 주요 전략 B라고 하겠습니다.
주요 전략 A 및 B의 버킷입니다.
주요 전략 A 및 B의 버킷

전략 A는 더 간단하지만 특정 유용한 정보를 확인하려면 요약 보고서에 포함된 노이즈가 있는 요약 값을 합산해야 할 수 있습니다. 이러한 값을 합산하면 노이즈도 합산됩니다. 전략 B를 사용하면 요약 보고서에 표시된 요약 값에서 필요한 정보를 얻을 수 있습니다. 즉, 전략 B가 전략 A보다 신호 대 노이즈 비율이 더 높을 가능성이 큽니다. 하지만 전략 A로도 이미 노이즈가 허용될 수 있으므로 단순성을 위해 전략 A를 선호할 수도 있습니다. 이 두 전략을 설명하는 자세한 예에서 자세히 알아보세요.

키 관리는 심도 있는 주제입니다. 신호 대 잡음비를 개선하기 위해 여러 정교한 기법을 고려할 수 있습니다. 하나는 고급 키 관리에 설명되어 있습니다.

결정: 배치 빈도

Noise Lab에서 사용해 보기

  1. 단순 모드 (또는 고급 모드)로 이동합니다. 일괄 처리 빈도와 관련해서는 두 모드가 동일한 방식으로 작동합니다.
  2. '매개변수' 측면 패널에서 '집계 전략' > '일괄 처리 빈도'를 찾습니다. 단일 작업에서 집계 서비스로 처리되는 집계 가능한 보고서의 일괄 처리 빈도를 나타냅니다.
  3. 기본 일괄 처리 빈도를 관찰합니다. 기본적으로 일일 일괄 처리 빈도가 시뮬레이션됩니다.
  4. 시뮬레이션을 클릭합니다.
  5. 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
  6. 일괄 처리 빈도를 주 단위로 변경합니다.
  7. 결과 시뮬레이션의 노이즈 비율을 관찰합니다. 이제 노이즈 비율이 이전 시뮬레이션보다 낮아졌습니다 (더 좋음).

단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하기로 결정한 일괄 처리 빈도입니다. 일괄 처리 빈도는 집계 가능한 보고서를 처리하는 빈도입니다.

더 자주 집계되도록 예약된 보고서 (예: 매시간)에는 집계 일정이 덜 자주인 동일한 보고서 (예: 매주)보다 전환 이벤트가 적게 포함됩니다. 따라서 시간별 보고서에 노이즈가 더 많이 포함됩니다.``` 집계 일정이 덜 빈번한 (예: 매주) 동일한 보고서보다 포함된 전환 이벤트가 적습니다. 따라서 다른 조건이 동일한 경우 시간별 보고서의 신호 대 잡음 비율이 주간 보고서보다 낮습니다. 다양한 빈도로 보고 요구사항을 실험하고 각 요구사항의 신호 대 노이즈 비율을 평가합니다.

일괄 처리장기간 집계에서 자세히 알아보세요.

결정: 기여도 분석이 가능한 전환에 영향을 미치는 캠페인 변수

Noise Lab에서 사용해 보기

예측하기 어려울 수 있고 시즌성 효과 외에도 상당한 변동이 있을 수 있지만, 일일 단일 터치 기여 전환수를 가장 가까운 10의 거듭제곱(10, 100, 1,000 또는 10,000)으로 추정해 보세요.

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 '내 전환 데이터'를 찾습니다.
  3. 기본 매개변수를 확인합니다. 기본적으로 일일 기여 전환수 총계는 1, 000입니다. 기본 설정 (기본 측정기준, 각 측정기준의 가능한 서로 다른 값의 기본 수, 키 전략 A)을 사용하는 경우 버킷당 평균 약 40개가 됩니다. 입력된 버킷당 평균 일일 기여 전환수 값이 40입니다.
  4. 시뮬레이션을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
  5. 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
  6. 이제 일일 기여 전환수 합계를 100으로 설정합니다. 이렇게 하면 버킷당 평균 일일 기여 전환수가 낮아집니다.
  7. 시뮬레이션을 클릭합니다.
  8. 이제 노이즈 비율이 높아졌습니다. 버킷당 전환수가 적을수록 개인 정보 보호를 위해 더 많은 노이즈가 적용되기 때문입니다.

광고주의 총 전환수와 총 기여 전환수 간에는 중요한 차이가 있습니다. 후자가 요약 보고서의 노이즈에 궁극적으로 영향을 미칩니다. 기여도가 부여된 전환은 광고 예산 및 광고 타겟팅과 같은 캠페인 변수에 영향을 받는 총 전환의 하위 집합입니다. 예를 들어 다른 모든 조건이 동일하다면 1,000만 달러 광고 캠페인의 기여 전환수가 1만 달러 광고 캠페인보다 많을 것으로 예상됩니다.

고려 사항:

  • 단일 터치, 동일 기기 기여 분석 모델에 대해 기여 분석된 전환을 평가합니다. 이러한 전환은 Attribution Reporting API로 수집된 요약 보고서의 범위 내에 있기 때문입니다.
  • 기여 전환에 대해 최악의 시나리오 수와 최상의 시나리오 수를 모두 고려합니다. 예를 들어 다른 모든 조건이 동일한 경우 광고주의 최소 및 최대 캠페인 예산을 고려한 다음 두 결과의 기여 전환수를 시뮬레이션의 입력으로 예측합니다.
  • Android 개인 정보 보호 샌드박스를 사용하려는 경우 계산 시 교차 플랫폼 기여 전환을 고려하세요.

결정: 확장 사용

Noise Lab에서 사용해 보기

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 '집계 전략' > '확장'을 찾습니다. 기본적으로 '예'로 설정되어 있습니다.
  3. 노이즈 비율에 대한 스케일링의 긍정적 효과를 이해하려면 먼저 스케일링을 '아니요'로 설정하세요.
  4. 시뮬레이션을 클릭합니다.
  5. 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
  6. 크기 조절을 예로 설정합니다. Noise Lab은 시나리오의 측정 목표 범위 (평균 및 최댓값)를 고려하여 사용할 배율을 자동으로 계산합니다. 실제 시스템이나 오리진 트라이얼 설정에서는 확장 요소에 대한 자체 계산을 구현해야 합니다.
  7. 시뮬레이션을 클릭합니다.
  8. 두 번째 시뮬레이션에서는 노이즈 비율이 더 낮아졌습니다 (더 좋음). 확장을 사용하고 있기 때문입니다.

핵심 설계 원칙에 따라 추가되는 노이즈는 기여 예산의 함수입니다.

따라서 신호 대 노이즈 비율을 높이기 위해 전환 이벤트 중에 수집된 값을 기여도 예산에 대해 확장 (집계 후 축소)하여 변환할 수 있습니다. 스케일링을 사용하여 신호 대 노이즈 비율을 높입니다.

결정: 측정 목표 수 및 개인 정보 보호 예산 분할

이는 확장과 관련이 있습니다. 확장 사용을 참고하세요.

Noise Lab에서 사용해 보기

측정 목표는 전환 이벤트에서 수집되는 고유한 데이터 포인트입니다.

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 추적할 데이터를 찾습니다. 측정 목표. 기본적으로 구매 금액과 구매 건수라는 두 가지 측정 목표가 있습니다.
  3. 시뮬레이션을 클릭하여 기본 목표로 시뮬레이션을 실행합니다.
  4. '삭제'를 클릭합니다. 이렇게 하면 마지막 측정 목표 (이 경우 구매 수)가 삭제됩니다.
  5. 시뮬레이션을 클릭합니다.
  6. 이제 이 두 번째 시뮬레이션에서 구매 값의 노이즈 비율이 더 낮아졌습니다(더 좋음). 측정 목표가 적기 때문에 이제 하나의 측정 목표가 모든 기여 예산을 가져옵니다.
  7. '재설정'을 클릭합니다. 이제 구매 금액과 구매 수라는 두 가지 측정 목표가 다시 표시됩니다. Noise Lab은 시나리오의 측정 목표 범위 (평균 및 최댓값)를 고려하여 사용할 배율을 자동으로 계산합니다. 기본적으로 Noise Lab은 측정 목표에 예산을 균등하게 분할합니다.
  8. 시뮬레이션을 클릭합니다.
  9. 결과 시뮬레이션의 노이즈 비율을 관찰합니다. 시뮬레이션에 표시된 배율을 기록합니다.
  10. 이제 개인 정보 보호 예산 분할을 맞춤설정하여 신호 대 노이즈 비율을 개선해 보겠습니다.
  11. 각 측정 목표에 할당된 예산 비율을 조정합니다. 기본 매개변수가 지정된 경우 측정 목표 1(구매 금액)의 범위(0~1,000)가 측정 목표 2(구매 수, 1~1, 즉 항상 1)보다 훨씬 넓습니다. 따라서 '확장할 공간이 더 필요'합니다. 더 효율적으로 확장할 수 있도록 (확장 참고) 측정 목표 2보다 측정 목표 1에 더 많은 기여도 예산을 할당하는 것이 이상적입니다.
  12. 예산의 70% 를 측정 목표 1에 할당합니다. 측정 목표 2에 30% 를 할당합니다.
  13. 시뮬레이션을 클릭합니다.
  14. 결과 시뮬레이션의 노이즈 비율을 관찰합니다. 구매 가치의 경우 노이즈 비율이 이전 시뮬레이션보다 훨씬 낮아졌습니다 (더 나음). 구매 수는 거의 변하지 않았습니다.
  15. 측정항목 간 예산 분할을 계속 조정합니다. 이 설정이 소음에 미치는 영향을 관찰합니다.

추가/삭제/재설정 버튼을 사용하여 자체 맞춤 측정 목표를 설정할 수 있습니다.


전환 수와 같은 전환 이벤트에서 하나의 데이터 포인트 (측정 목표)를 측정하는 경우 해당 데이터 포인트는 모든 기여 예산 (65536)을 가져올 수 있습니다. 전환 이벤트에 전환수 및 구매 가치와 같은 여러 측정 목표를 설정하면 이러한 데이터 포인트가 기여 예산을 공유해야 합니다. 즉, 값을 확장할 여지가 적습니다.

따라서 측정 목표가 많을수록 신호 대 노이즈 비율이 낮아질 가능성이 높습니다 (노이즈가 높음).

측정 목표와 관련해 내려야 하는 또 다른 결정은 예산 분할입니다. 기여도 예산을 두 데이터 포인트에 균등하게 분할하면 각 데이터 포인트에 65536/2 = 32768의 예산이 할당됩니다. 이는 각 데이터 포인트의 최대 가능 값에 따라 최적일 수도 있고 아닐 수도 있습니다. 예를 들어 최댓값이 1인 구매수와 최솟값이 1이고 최댓값이 120인 구매 금액을 측정하는 경우 구매 금액은 확장될 '여지'가 더 많으므로 기여도 예산의 더 큰 비율이 할당됩니다. 노이즈의 영향과 관련하여 다른 측정 목표보다 우선순위를 지정해야 하는 측정 목표가 있는지 확인할 수 있습니다.

결정: 이상치 관리

Noise Lab에서 사용해 보기

측정 목표는 전환 이벤트에서 수집되는 고유한 데이터 포인트입니다.

  1. 고급 모드로 이동합니다.
  2. '매개변수' 측면 패널에서 '집계 전략' > '확장'을 찾습니다.
  3. 확장이 '예'로 설정되어 있는지 확인합니다. Noise Lab은 측정 목표에 대해 제공한 범위 (평균 및 최대 값)를 기반으로 사용할 배율을 자동으로 계산합니다.
  4. 지금까지 이루어진 가장 큰 구매가 2, 000달러이지만 대부분의 구매는 10~120달러 범위에서 이루어진다고 가정해 보겠습니다. 먼저 리터럴 확장 접근 방식을 사용하는 경우 (권장하지 않음) 어떻게 되는지 살펴보겠습니다. purchaseValue의 최대값으로 $2, 000를 입력합니다.
  5. 시뮬레이션을 클릭합니다.
  6. 노이즈 비율이 높습니다. 실제로 대부분의 구매 금액이 2, 000달러보다 훨씬 낮기 때문에 이러한 문제가 발생합니다.
  7. 이제 더 실용적인 확장 접근 방식을 사용해 보겠습니다. 최대 구매 가치를 120달러로 변경합니다.
  8. 시뮬레이션을 클릭합니다.
  9. 두 번째 시뮬레이션에서는 노이즈 비율이 더 낮습니다 (더 좋음).

확장을 구현하려면 일반적으로 특정 전환 이벤트의 최대 가능 값에 따라 확장 요소를 계산합니다(이 예에서 자세히 알아보기).

하지만 신호 대 노이즈 비율이 악화되므로 리터럴 최대값을 사용하여 스케일링 요소를 계산하지 마세요. 대신 이상치를 삭제하고 실용적인 최댓값을 사용하세요.

이상치 관리는 심도 있는 주제입니다. 신호 대 잡음비를 개선하기 위해 여러 정교한 기법을 고려할 수 있습니다. 하나는 고급 이상치 관리에 설명되어 있습니다.

다음 단계

이제 사용 사례에 맞는 다양한 소음 관리 전략을 평가했으므로 오리진 트라이얼을 사용하여 실제 측정 데이터를 수집하여 요약 보고서를 실험할 수 있습니다. 가이드와 팁을 검토하여 API를 사용해 보세요.

부록

Noise Lab 둘러보기

Noise Lab을 사용하면 노이즈 관리 전략을 빠르게 평가하고 비교할 수 있습니다. 다음과 같은 용도로 사용할 수 있습니다.

  • 노이즈에 영향을 미칠 수 있는 주요 매개변수와 그 효과를 이해합니다.
  • 다양한 설계 결정을 고려하여 출력 측정 데이터에 노이즈가 미치는 영향을 시뮬레이션합니다. 사용 사례에 적합한 신호 대 잡음비에 도달할 때까지 설계 매개변수를 조정합니다.
  • 요약 보고서의 유용성에 관한 의견을 공유해 주세요. 어떤 입실론 및 노이즈 매개변수 값이 적합하고 어떤 값이 적합하지 않나요? 변곡점은 어디에 있나요?

준비 단계라고 생각하면 됩니다. Noise Lab은 입력에 따라 요약 보고서 출력을 시뮬레이션하는 측정 데이터를 생성합니다. 데이터를 유지하거나 공유하지 않습니다.

노이즈 연구소에는 두 가지 모드가 있습니다.

  1. 간단 모드: 소음에 대한 제어의 기본사항을 이해합니다.
  2. 고급 모드: 다양한 노이즈 관리 전략을 테스트하고 사용 사례에 가장 적합한 신호 대 노이즈 비율을 제공하는 전략을 평가합니다.

상단 메뉴의 버튼을 클릭하여 두 모드 간에 전환합니다 (#1. 다음 스크린샷).

간단 모드
  • 단순 모드에서는 Epsilon과 같은 매개변수 (왼쪽 또는 다음 스크린샷의 2번)를 제어하고 이러한 매개변수가 노이즈에 미치는 영향을 확인할 수 있습니다.
  • 각 매개변수에는 도움말 (`?` 버튼)이 있습니다. 각 매개변수에 대한 설명을 보려면 이를 클릭하세요 (다음 스크린샷의 3번).
  • 먼저 '시뮬레이션' 버튼을 클릭하고 출력이 어떻게 표시되는지 확인합니다 (아래 스크린샷의 4번).
  • '출력' 섹션에서 다양한 세부정보를 확인할 수 있습니다. 일부 요소 옆에는 `?` 가 있습니다. 각 `?` 를 클릭하여 다양한 정보에 대한 설명을 확인하세요.
  • 출력 섹션에서 표의 확장 버전을 보려면 세부정보 전환 버튼을 클릭합니다 (다음 스크린샷의 5번).
  • 출력 섹션의 각 데이터 테이블 뒤에는 오프라인 사용을 위해 테이블을 다운로드하는 옵션이 있습니다. 또한 오른쪽 하단에 모든 데이터 테이블을 다운로드하는 옵션이 있습니다 (다음 스크린샷의 6번).
  • '파라미터' 섹션에서 파라미터의 다양한 설정을 테스트하고 '시뮬레이션'을 클릭하여 출력이 어떻게 달라지는지 확인합니다.
    단순 모드의 노이즈 실험실 인터페이스
    단순 모드의 노이즈 실험실 인터페이스
고급 모드
  • 고급 모드에서는 매개변수를 더 세부적으로 관리할 수 있습니다. 맞춤 측정 목표 및 측정기준 (다음 스크린샷의 1번 및 2번)을 추가할 수 있습니다.
  • '매개변수' 섹션에서 아래로 스크롤하여 '주요 전략' 옵션을 확인합니다. 이를 사용하여 다양한 키 구조(다음 스크린샷의#3)를 테스트할 수 있습니다.
    • 다양한 키 구조를 테스트하려면 키 전략을 'B'로 전환하세요.
    • 사용할 다양한 키 구조의 수를 입력합니다(기본값은 '2'로 설정됨).
    • 키 구조 생성 클릭
    • 각 키 구조에 포함할 키 옆의 체크박스를 클릭하여 키 구조를 지정하는 옵션이 표시됩니다.
    • '시뮬레이션'을 클릭하여 출력을 확인합니다.
      고급 모드에서는 추적할 측정 목표와 측정기준을 제어할 수 있으며, 이는 사이드바에 강조 표시됩니다.
      고급 모드의 노이즈 실험실 인터페이스
      고급 모드에는 사이드바의 '매개변수' 섹션에 '주요 전략' 옵션도 있습니다.
      고급 모드의 노이즈 실험실 인터페이스

노이즈 측정항목

핵심 개념

개별 사용자 개인 정보를 보호하기 위해 노이즈가 추가됩니다.

노이즈 값이 높으면 버킷/키가 드물고 제한된 수의 민감한 이벤트의 기여도가 포함되어 있음을 나타냅니다. 이는 개인이 '군중 속에 숨을' 수 있도록, 즉 소수의 개인의 개인 정보를 더 많은 노이즈를 추가하여 보호할 수 있도록 Noise Lab에서 자동으로 실행됩니다.

노이즈 값이 낮으면 개인이 '군중 속에 숨을' 수 있도록 데이터 설정이 설계되었음을 나타냅니다. 즉, 버킷에는 개별 사용자 개인 정보가 보호되는지 확인할 수 있을 만큼 충분한 수의 이벤트의 기여가 포함됩니다.

이 문은 평균 백분율 오류 (APE)와 RMSRE_T (기준이 있는 평균 제곱근 상대 오류) 모두에 적용됩니다.

APE (평균 백분율 오차)

APE는 신호에 대한 노이즈의 비율, 즉 실제 요약 값입니다.

APE 값이 낮을수록 신호 대 노이즈 비율이 더 좋습니다.

수식

특정 요약 보고서의 경우 APE는 다음과 같이 계산됩니다.

APE 방정식입니다. 노이즈는 음수일 수 있으므로 절대값이 필요합니다.
APE의 방정식입니다. 노이즈는 음수일 수 있으므로 절댓값이 필요합니다.

True는 실제 요약 값입니다. APE는 각 실제 요약 값에 대한 노이즈의 평균으로, 요약 보고서의 모든 항목에 대해 평균을 냅니다. 소음 연구소에서는 이 값을 100으로 곱하여 백분율을 구합니다.

장단점

크기가 작은 버킷은 APE의 최종 값에 불균형한 영향을 미칩니다. 소음을 평가할 때 혼동을 줄 수 있습니다. 이러한 이유로 APE의 이러한 제한사항을 완화하기 위해 RMSRE_T라는 또 다른 측정항목이 추가되었습니다. 자세한 내용은 예시를 참고하세요.

코드

APE 계산을 위한 소스 코드를 검토합니다.

RMSRE_T (기준점을 사용한 평균 제곱근 상대 오차)

RMSRE_T (기준점을 사용한 평균 제곱근 상대 오차)는 노이즈를 측정하는 또 다른 방법입니다.

RMSRE_T 해석 방법

RMSRE_T 값이 낮을수록 신호대 잡음비가 더 좋습니다.
예를 들어 사용 사례에 허용되는 노이즈 비율이 20%이고 RMSRE_T가 0.2인 경우 노이즈 수준이 허용되는 범위에 속한다고 확신할 수 있습니다.

수식

특정 요약 보고서의 경우 RMSRE_T는 다음과 같이 계산됩니다.

수식
RMSRE_T의 방정식입니다. 노이즈는 음수일 수 있으므로 절댓값이 필요합니다.
장단점

RMSRE_T는 APE보다 이해하기가 약간 더 복잡합니다. 하지만 요약 보고서에서 노이즈를 분석할 때 APE보다 더 적합한 몇 가지 장점이 있습니다.

  • RMSRE_T가 더 안정적입니다. 'T'는 기준점입니다. 'T'는 전환수가 적어 크기가 작기 때문에 노이즈에 더 민감한 버킷에 RMSRE_T 계산에서 더 적은 가중치를 부여하는 데 사용됩니다. T를 사용하면 전환이 적은 버킷에서 측정항목이 급증하지 않습니다. T가 5인 경우 전환수가 0인 버킷의 노이즈 값이 1만큼 작더라도 1을 훨씬 초과하는 값으로 표시되지 않습니다. 대신 T가 5이므로 1/5에 해당하는 0.2로 제한됩니다. 따라서 노이즈에 더 민감한 작은 버킷에 더 적은 가중치를 부여함으로써 이 측정항목은 더 안정적이며 따라서 두 시뮬레이션을 더 쉽게 비교할 수 있습니다.
  • RMSRE_T를 사용하면 간단하게 집계할 수 있습니다. 여러 버킷의 RMSRE_T와 실제 개수를 알면 합계의 RMSRE_T를 계산할 수 있습니다. 이렇게 하면 이러한 결합된 값에 대해 RMSRE_T를 최적화할 수도 있습니다.

APE의 경우 집계가 가능하지만 라플라스 노이즈의 합계의 절댓값이 포함되어 공식이 다소 복잡합니다. 따라서 APE를 최적화하기가 더 어려워집니다.

코드

RMSRE_T 계산을 위한 소스 코드를 검토합니다.

버킷이 3개인 요약 보고서:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

버킷이 3개인 요약 보고서:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

버킷이 3개인 요약 보고서:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + 무한대) / 3 = 무한대

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

고급 키 관리

DSP 또는 광고 측정 회사에는 여러 업종, 통화, 구매 가격 잠재력을 아우르는 수천 개의 글로벌 광고 고객이 있을 수 있습니다. 즉, 광고주당 하나의 집계 키를 만들고 관리하는 것은 매우 비실용적일 수 있습니다. 또한 이러한 수천 개의 글로벌 광고주 전반에서 노이즈의 영향을 제한할 수 있는 최대 집계 가능 값과 집계 예산을 선택하기가 어려울 것입니다. 대신 다음 시나리오를 고려해 보겠습니다.

주요 전략 A

광고 기술 제공업체는 모든 광고 고객에 걸쳐 하나의 키를 만들고 관리하기로 결정합니다. 모든 광고주와 모든 통화에서 구매 범위는 소량의 고급 구매부터 대량의 저가 구매까지 다양합니다. 그러면 다음과 같은 키가 생성됩니다.

키 (여러 통화)
최대 집계 가능 값 5,000,000
구매 가치 범위 [120~5,000,000]
주요 전략 B

광고 기술 제공업체는 모든 광고 고객에 걸쳐 두 개의 키를 만들고 관리하기로 결정합니다. 통화별로 키를 분리하기로 결정합니다. 모든 광고주와 모든 통화에서 구매 범위는 구매량이 적은 고급 구매부터 구매량이 많은 저가 구매까지 다양합니다. 통화별로 구분하여 다음 2개의 키를 만듭니다.

Key 1 (USD) 키 2 (¥)
최대 집계 가능 값 $40,000 5,000,000엔
구매 가치 범위 [120~40,000] [15,000~5,000,000]

통화 값이 통화 전반에 균등하게 분포되지 않기 때문에 핵심 전략 B의 결과에는 핵심 전략 A보다 노이즈가 적습니다. 예를 들어 ¥로 표시된 구매가 USD로 표시된 구매와 혼합되면 기본 데이터와 결과로 발생하는 노이즈가 어떻게 달라지는지 생각해 보세요.

주요 전략 C

광고 기술 제공업체는 모든 광고 고객에 걸쳐 4개의 키를 만들고 관리하며 통화 x 광고주 업계별로 구분하기로 결정합니다.

키 1
(미국 달러 x 고급 주얼리 광고주)
키 2
(¥ x 고급 주얼리 광고주)
주요 3개
(USD x 의류 소매업 광고주)
주요 4
(¥ x 의류 소매업체 광고주)
최대 집계 가능 값 $40,000 5,000,000엔 $500 ¥65,000
구매 가치 범위 [10,000~40,000] [1,250,000~5,000,000] [120~500] [15,000~65,000]

광고주 구매 가치가 광고주 전반에 균등하게 분포되어 있지 않기 때문에 핵심 전략 C의 결과에는 핵심 전략 B보다 노이즈가 적습니다. 예를 들어 고급 주얼리 구매와 야구 모자 구매가 혼합되면 기본 데이터와 결과적으로 노이즈가 많은 출력이 어떻게 달라지는지 생각해 보세요.

출력의 노이즈를 줄이려면 여러 광고주 간의 공통점에 대해 공유 최대 집계 값과 공유 배율을 만드는 것이 좋습니다. 예를 들어 광고주를 위해 다음과 같은 전략을 실험해 볼 수 있습니다.

  • 통화 (USD, ¥, CAD 등)별 전략 1개
  • 광고주 업계 (보험, 자동차, 소매 등)별로 구분된 전략
  • 유사한 구매 가치 범위로 구분된 전략(예: [100], [1000], [10000])

광고주 공통점, 키, 해당 코드에 관한 주요 전략을 만들면 키와 코드를 더 쉽게 관리할 수 있고 신호 대 노이즈 비율이 높아집니다. 다양한 광고주 공통점을 가진 다양한 전략을 실험하여 노이즈 영향 극대화와 코드 관리의 변곡점을 파악합니다.


고급 이상치 관리

두 광고주에 걸친 시나리오를 고려해 보겠습니다.

  • 광고주 A:
    • 광고주 A 사이트의 모든 제품에서 구매 가격은 [$120~$1,000]이며 범위는 $880입니다.
    • 구매 가격은 880달러 범위에 균등하게 분포되어 있으며, 중위 구매 가격에서 표준 편차 2를 벗어나는 이상치는 없습니다.
  • 광고주 B:
    • 광고주 B 사이트의 모든 제품에서 구매 가격은 [$120~$1,000]이며 범위는 $880입니다.
    • 구매 가격은 120~500달러 범위에 크게 치우쳐 있으며, 500~1,000달러 범위에서 발생하는 구매는 5% 에 불과합니다.

기여도 예산 요구사항과 최종 결과에 노이즈가 적용되는 방식을 고려할 때 광고주 B는 기본적으로 광고주 A보다 노이즈가 많은 출력을 갖게 됩니다. 광고주 B가 이상치로 인해 기본 계산에 영향을 미칠 가능성이 더 높기 때문입니다.

특정 키 설정으로 이 문제를 완화할 수 있습니다. 이상치 데이터를 관리하고 키의 구매 범위에 구매 가치를 더 균등하게 분배하는 데 도움이 되는 주요 전략을 테스트합니다.

광고주 B의 경우 두 개의 별도 키를 만들어 두 개의 서로 다른 구매 가치 범위를 포착할 수 있습니다. 이 예에서 광고 기술은 이상치가 500달러 구매 가치 위에 표시된다고 언급했습니다. 이 광고주에 대해 별도의 키 두 개를 구현해 보세요.

  • 주요 구조 1 : $120~$500 범위의 구매만 포착하는 키입니다 (총 구매량의 약 95% 포함).
  • 주요 구조 2: 500달러 이상의 구매만 캡처하는 키(전체 구매량의 약 5% 를 차지함)

이 핵심 전략을 구현하면 광고주 B의 노이즈를 더 잘 관리하고 요약 보고서의 유용성을 극대화할 수 있습니다. 새로운 더 작은 범위를 고려할 때 키 A와 키 B는 이전 단일 키에 비해 각 키에 걸쳐 데이터가 더 균일하게 분포되어야 합니다. 이렇게 하면 이전 단일 키에 비해 각 키의 출력에서 노이즈 영향이 줄어듭니다.