이 문서에 관한 정보
이 문서를 읽으면 다음을 수행할 수 있습니다.
- 요약 보고서를 생성하기 전에 어떤 전략을 만들어야 하는지 이해합니다.
- 다양한 노이즈 매개변수의 효과를 파악하고 다양한 노이즈 관리 전략을 빠르게 탐색하고 평가할 수 있는 도구인 Noise Lab을 소개합니다.

의견 공유
이 문서에서는 요약 보고서를 사용하는 몇 가지 원칙을 요약하지만 여기에는 반영되지 않을 수 있는 노이즈 관리에 관한 여러 가지 접근 방식이 있습니다. 제안, 추가사항, 질문이 있으면 언제든지 알려주세요.
- 노이즈 관리 전략, API의 유용성 또는 개인 정보 보호 (epsilon)에 관한 공개 의견을 제공하고 Noise Lab으로 시뮬레이션할 때 관찰한 사항을 공유하려면 이 문제에 관한 의견을 작성하세요.
- Noise Lab에 공개 의견을 제공하려면 (질문하기, 버그 신고, 기능 요청) 여기에서 새 문제를 만드세요.
- API의 다른 측면에 관한 공개 의견을 제공하려면 다음 단계를 따르세요. 여기에서 새 문제를 만듭니다.
시작하기 전에
- 기여도 보고: 요약 보고서 및 기여도 보고 전체 시스템 개요에서 소개를 확인하세요.
- 이 가이드를 최대한 활용하려면 노이즈 이해 및 집계 키 이해를 살펴보세요.
디자인 결정
핵심 설계 원칙
서드 파티 쿠키와 요약 보고서의 작동 방식에는 근본적인 차이가 있습니다. 한 가지 중요한 차이점은 요약 보고서의 측정 데이터에 추가되는 노이즈입니다. 또 다른 방법은 보고서를 예약하는 방법입니다.
신호 대 노이즈 비율이 더 높은 요약 보고서 측정 데이터에 액세스하려면 수요 측 플랫폼 (DSP) 및 광고 측정 서비스 제공업체가 광고주와 협력하여 노이즈 관리 전략을 수립해야 합니다. 이러한 전략을 개발하려면 DSP와 측정 서비스 제공업체가 설계 결정을 내려야 합니다. 이러한 결정은 하나의 필수 개념을 중심으로 이루어집니다.
배포 노이즈 값은 절대적으로 말해 두 가지 매개변수⏤이피론 및 기여도 예산⏤에만 종속되지만, 출력 측정 데이터의 신호 대 노이즈 비율에 영향을 미치는 다른 여러 설정을 사용할 수 있습니다.
반복 프로세스를 통해 최선의 결정을 내릴 수 있지만, 이러한 결정의 각 변형은 약간 다른 구현으로 이어집니다. 따라서 각 코드 반복을 작성하기 전에 (및 광고를 실행하기 전에) 이러한 결정을 내려야 합니다.
결정: 측정기준 세부사항
Noise Lab에서 사용해 보기
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 '내 전환 데이터'를 찾습니다.
- 기본 매개변수를 확인합니다. 기본적으로 기여도가 있는 일일 총전환수는 1, 000입니다. 기본 설정 (기본 측정기준, 각 측정기준에 가능한 기본 값의 수, 주요 전략 A)을 사용하는 경우 버킷당 평균 40개 정도입니다. 버킷당 입력된 평균 일일 기여도 전환수 값은 40입니다.
- '시뮬레이션'을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
- 매개변수 측면 패널에서 측정기준을 찾습니다. 지리를 도시로 이름을 바꾸고 가능한 다양한 값의 수를 50으로 변경합니다.
- 이렇게 하면 버킷당 발생한 전환의 평균 일일 수가 어떻게 달라지는지 확인할 수 있습니다. 이제 훨씬 낮아졌습니다. 다른 값을 변경하지 않고 이 측정기준 내에서 가능한 값의 수를 늘리면 각 버킷에 포함되는 전환 이벤트 수를 변경하지 않고 총 버킷 수를 늘리게 되기 때문입니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 확인합니다. 노이즈 비율이 이전 시뮬레이션보다 높습니다.
핵심 설계 원칙에 따라 작은 요약 값은 큰 요약 값보다 노이즈가 더 많을 수 있습니다. 따라서 구성 선택사항에 따라 각 버킷에 기여도가 부여된 전환 이벤트의 수가 달라지며 (집계 키라고도 함) 이 수치는 최종 출력 요약 보고서의 노이즈에 영향을 미칩니다.
단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 설계 결정 중 하나는 측정기준 세분성입니다. 집계 키와 측정기준의 다음 예를 고려해 보세요.
- 접근 방식 1: 대략적인 측정기준이 있는 하나의 키 구조: 국가 x 광고 캠페인 (또는 가장 큰 캠페인 집계 버킷) x 제품 유형 (가능한 10가지 제품 유형 중 하나)
- 접근 방식 2: 세분화된 측정기준이 있는 하나의 키 구조: 도시 x 광고 ID x 제품 (가능한 제품 100개 중)
도시는 국가보다 세분화된 측정기준이고, 광고 소재 ID는 캠페인보다 세분화된 측정기준이며, 제품은 제품 유형보다 세분화된 측정기준입니다. 따라서 접근 방식 2의 요약 보고서 출력에는 접근 방식 1보다 버킷당 (= 키당) 이벤트 (전환) 수가 적습니다. 출력에 추가된 노이즈는 버킷의 이벤트 수와 관계가 없으므로 접근 방식 2를 사용하면 요약 보고서의 측정 데이터에 더 많은 노이즈가 발생합니다. 각 광고주의 경우 결과의 유용성을 극대화하기 위해 키 설계에서 다양한 세부사항 절충점을 실험합니다.
결정: 주요 구조
Noise Lab에서 사용해 보기
간단한 모드에서는 기본 키 구조가 사용됩니다. 고급 모드에서는 다양한 키 구조를 실험할 수 있습니다. 몇 가지 측정기준 예시가 포함되어 있으며 이를 수정할 수도 있습니다.
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 '주요 전략'을 찾습니다. 도구에서 A라는 이름의 기본 전략은 모든 측정기준(지역 x 캠페인 ID x 제품 카테고리)을 포함하는 하나의 세분화된 키 구조를 사용합니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
- 키 전략을 B로 변경합니다. 그러면 키 구조를 구성할 수 있는 추가 컨트롤이 표시됩니다.
- 키 구조를 구성합니다(예: 다음과 같이).
- 키 구조 수: 2
- 키 구조 1 = 지역 x 제품 카테고리
- 키 구조 2 = 캠페인 ID x 제품 카테고리
- '시뮬레이션'을 클릭합니다.
- 이제 두 가지 고유한 키 구조를 사용하고 있으므로 측정 목표 유형당 요약 보고서 2개(구매 건수 2개, 구매 금액 2개)가 표시됩니다. 노이즈 비율을 관찰합니다.
- 자체 맞춤 측정기준을 사용하여 이 작업을 시도해 볼 수도 있습니다. 이렇게 하려면 추적하려는 데이터: 측정기준을 찾습니다. 예시 측정기준을 삭제하고 마지막 측정기준 아래에 있는 추가/삭제/재설정 버튼을 사용하여 직접 만들어 보세요.
단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하려는 키 구조입니다. 다음과 같은 집계 키 예시를 고려해 보세요.
- 모든 측정기준이 포함된 하나의 키 구조입니다. 이를 키 전략 A라고 하겠습니다.
- 측정기준의 하위 집합이 각각 있는 두 가지 주요 구조. 이를 주요 전략 B라고 하겠습니다.

전략 A가 더 간단하지만 특정 통계에 액세스하려면 요약 보고서에 포함된 노이즈가 있는 요약 값을 롤업 (합산)해야 할 수 있습니다. 이러한 값을 합산하면 노이즈도 합산됩니다. 전략 B를 사용하면 요약 보고서에 노출된 요약 값에서 이미 필요한 정보를 얻을 수 있습니다. 즉, 전략 B는 전략 A보다 신호 대 노이즈 비율이 더 높을 수 있습니다. 하지만 전략 A로 이미 노이즈를 허용할 수 있으므로 단순성을 위해 전략 A를 선호할 수도 있습니다. 이 두 가지 전략을 설명하는 자세한 예시를 통해 자세히 알아보세요.
키 관리는 심층적인 주제입니다. 신호 대 잡음비를 개선하기 위해 여러 가지 정교한 기법을 고려할 수 있습니다. 하나는 고급 키 관리에 설명되어 있습니다.
결정: 일괄 처리 빈도
Noise Lab에서 사용해 보기
- 간단한 모드 (또는 고급 모드 - 일괄 처리 빈도와 관련하여 두 모드 모두 동일하게 작동)로 이동합니다.
- 매개변수 측면 패널에서 집계 전략 > 일괄 처리 빈도를 찾습니다. 이는 단일 작업에서 집계 서비스로 처리되는 집계 가능한 보고서의 일괄 처리 빈도를 나타냅니다.
- 기본 일괄 처리 빈도 관찰: 기본적으로 일일 일괄 처리 빈도가 시뮬레이션됩니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
- 일괄 처리 빈도를 주별로 변경합니다.
- 결과 시뮬레이션의 노이즈 비율을 확인합니다. 노이즈 비율이 이전 시뮬레이션보다 낮아졌습니다 (더 좋음).
단일 버킷 내에서 기여도가 부여된 전환 이벤트 수에 영향을 미치는 또 다른 설계 결정은 사용하려는 일괄 처리 빈도입니다. 일괄 처리 빈도는 집계 가능한 보고서를 처리하는 빈도입니다.
집계가 더 자주 예약된 보고서 (예: 매시간)에는 집계 일정이 덜 자주 예약된 동일한 보고서 (예: 매주)보다 전환 이벤트가 더 적게 포함됩니다. 따라서 시간별 보고서에는 노이즈가 더 많이 포함됩니다.``` 요약 빈도가 낮은 동일한 보고서 (예: 매주)보다 전환 이벤트가 적게 포함됩니다. 따라서 다른 조건이 동일하다면 시간별 보고서의 신호 대 노이즈 비율이 주간 보고서보다 낮습니다. 다양한 빈도로 보고 요구사항을 실험하고 각각의 신호 대 노이즈 비율을 평가합니다.
일괄 처리 및 장기간에 걸쳐 집계에서 자세히 알아보세요.
결정: 기여도 전환에 영향을 미치는 캠페인 변수
Noise Lab에서 사용해 보기
이를 예측하기는 어렵고 계절성 효과 외에도 상당한 변동이 있을 수 있지만, 일일 단일 터치 기여도 전환수를 10, 100, 1,000 또는 10,000과 가장 가까운 10의 거듭제곱으로 추정해 보세요.
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 '내 전환 데이터'를 찾습니다.
- 기본 매개변수를 확인합니다. 기본적으로 기여도가 있는 일일 총전환수는 1, 000입니다. 기본 설정 (기본 측정기준, 각 측정기준에 가능한 기본 값의 수, 주요 전략 A)을 사용하는 경우 버킷당 평균 40개 정도입니다. 버킷당 입력된 평균 일일 기여도 전환수 값은 40입니다.
- '시뮬레이션'을 클릭하여 기본 매개변수로 시뮬레이션을 실행합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
- 이제 일일 기여도 전환수 총계를 100으로 설정합니다. 이렇게 하면 버킷당 기여도가 있는 평균 일일 전환수가 감소합니다.
- '시뮬레이션'을 클릭합니다.
- 노이즈 비율이 더 높아진 것을 확인할 수 있습니다. 이는 버킷당 전환수가 적을수록 개인 정보를 보호하기 위해 더 많은 노이즈가 적용되기 때문입니다.
중요한 구분은 광고주가 발생시킬 수 있는 총 전환수와 발생할 수 있는 총 기여도 부여 전환수입니다. 후자가 요약 보고서의 노이즈에 궁극적으로 영향을 미칩니다. 기여도 전환은 광고 예산, 광고 타겟팅과 같은 캠페인 변수의 영향을 받을 수 있는 총 전환의 하위 집합입니다. 예를 들어 다른 조건이 동일하다면 1,000,000달러의 광고 캠페인보다 10,000달러의 광고 캠페인에서 기여 분석 전환수가 더 많을 것으로 예상됩니다.
고려 사항:
- 기여도가 부여된 전환은 Attribution Reporting API로 수집된 요약 보고서의 범위 내에 있으므로 원터치 동일 기기 기여 분석 모델을 기준으로 평가합니다.
- 기여도가 부여된 전환의 최악의 시나리오 수와 최선의 시나리오 수를 모두 고려하세요. 예를 들어 다른 모든 조건이 동일한 경우 광고주의 가능한 최소 및 최대 캠페인 예산을 고려한 다음 두 결과에 대한 기여도 전환수를 시뮬레이션의 입력으로 예측합니다.
- Android 개인 정보 보호 샌드박스를 사용하려는 경우 계산에서 교차 플랫폼 기여도 전환을 고려하세요.
결정: 확장 사용
Noise Lab에서 사용해 보기
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 집계 전략 > 확장 버튼을 찾습니다. 기본적으로 '예'로 설정되어 있습니다.
- 확장이 노이즈 비율에 미치는 긍정적인 영향을 이해하려면 먼저 확장을 '아니요'로 설정합니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다.
- Scaling(크기 조절)을 Yes(예)로 설정합니다. Noise Lab은 시나리오의 측정 목표 범위 (평균 및 최대 값)를 고려하여 사용할 배율을 자동으로 계산합니다. 실제 시스템 또는 출처 무료 체험판 설정의 경우 확장 계수에 대한 자체 계산을 구현해야 합니다.
- '시뮬레이션'을 클릭합니다.
- 이 두 번째 시뮬레이션에서 노이즈 비율이 낮아졌습니다 (더 좋음). 확장을 사용하기 때문입니다.
핵심 설계 원칙에 따라 추가된 노이즈는 기여도 예산의 함수입니다.
따라서 신호 대 노이즈 비율을 높이려면 전환 이벤트 중에 수집된 값을 기여도 예산에 따라 조정하고 집계 후 조정을 해제하여 변환할 수 있습니다. 확장을 사용하여 신호 대 노이즈 비율을 높입니다.
결정: 측정 목표 수 및 개인 정보 보호 예산 분할
이는 확장과 관련이 있습니다. 확장 사용을 참고하세요.
Noise Lab에서 사용해 보기
측정 목표는 전환 이벤트에서 수집된 고유한 데이터 포인트입니다.
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 추적할 데이터: 측정 목표를 찾습니다. 기본적으로 구매 가치와 구매 횟수라는 두 가지 측정 목표가 있습니다.
- '시뮬레이션'을 클릭하여 기본 목표로 시뮬레이션을 실행합니다.
- 삭제를 클릭합니다. 이렇게 하면 마지막 측정 목표 (이 경우 구매 수)가 삭제됩니다.
- '시뮬레이션'을 클릭합니다.
- 이 두 번째 시뮬레이션에서는 구매 금액의 노이즈 비율이 더 낮아졌습니다(더 좋음). 측정 목표가 줄었기 때문에 이제 하나의 측정 목표에 모든 기여도 예산이 할당됩니다.
- 재설정을 클릭합니다. 이제 구매 가치와 구매 횟수라는 두 가지 측정 목표가 다시 표시됩니다. Noise Lab은 시나리오의 측정 목표 범위 (평균 및 최대 값)를 고려하여 사용해야 할 배율을 자동으로 계산합니다. 기본적으로 Noise Lab은 측정 목표에 예산을 균등하게 분할합니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다. 시뮬레이션에 표시된 배율을 확인합니다.
- 이제 개인 정보 보호 예산 분할을 맞춤설정하여 신호 대 노이즈 비율을 개선해 보겠습니다.
- 각 측정 목표에 할당된 예산 비율을 조정합니다. 기본 매개변수를 고려할 때 측정 목표 1(구매 금액)의 범위(0~1,000)는 측정 목표 2(구매 건수, 1~1, 항상 1)보다 훨씬 넓습니다. 따라서 '확장할 여유 공간'이 더 필요합니다. 측정 목표 1에 측정 목표 2보다 더 많은 기여도 예산을 할당하여 더 효율적으로 확장할 수 있도록 하는 것이 이상적입니다 (확장 참고).
- 예산의 70% 를 측정 목표 1에 할당합니다. 측정 목표 2에 30% 를 할당합니다.
- '시뮬레이션'을 클릭합니다.
- 결과 시뮬레이션의 노이즈 비율을 관찰합니다. 구매 가치의 경우 이제 노이즈 비율이 이전 시뮬레이션보다 훨씬 낮습니다 (더 좋음). 구매 수는 거의 변하지 않았습니다.
- 측정항목별로 예산 분할을 계속 조정합니다. 이로 인해 노이즈에 미치는 영향을 관찰합니다.
추가/삭제/재설정 버튼을 사용하여 맞춤 측정 목표를 설정할 수 있습니다.
전환 이벤트에서 전환수와 같은 하나의 데이터 포인트 (측정 목표)를 측정하면 해당 데이터 포인트는 모든 기여도 예산 (65536)을 가져올 수 있습니다. 전환 이벤트에 전환수 및 구매 가치와 같은 여러 측정 목표를 설정하는 경우 이러한 데이터 포인트는 기여도 예산을 공유해야 합니다. 즉, 값을 확장할 여유가 줄어듭니다.
따라서 측정 목표가 많을수록 신호 대 노이즈 비율이 낮을 수 있습니다 (노이즈가 더 많음).
측정 목표와 관련하여 결정해야 할 또 다른 사항은 예산 분할입니다. 기여도 예산을 두 데이터 포인트로 동등하게 분할하면 각 데이터 포인트는 65536/2 = 32768의 예산을 받게 됩니다. 이는 각 데이터 포인트의 최대 가능한 값에 따라 최적일 수도 있고 아닐 수도 있습니다. 예를 들어 최대 값이 1이고 최솟값이 1, 최대값이 120인 구매 수를 측정하는 경우 구매 값은 확장할 '공간'이 더 많을수록, 즉 기여도 예산의 더 큰 비율을 할당받을수록 유리합니다. 노이즈의 영향과 관련하여 어떤 측정 목표에 우선순위를 둘지 확인할 수 있습니다.
결정: 이상치 관리
Noise Lab에서 사용해 보기
측정 목표는 전환 이벤트에서 수집된 고유한 데이터 포인트입니다.
- 고급 모드로 이동합니다.
- 매개변수 측면 패널에서 집계 전략 > 확장 버튼을 찾습니다.
- 확장이 '예'로 설정되어 있는지 확인합니다. Noise Lab은 측정 목표에 지정한 범위 (평균 및 최대 값)를 기반으로 사용해야 할 배율을 자동으로 계산합니다.
- 지금까지 이루어진 최대 구매 금액이 2, 000달러였지만 대부분의 구매가 10~120달러 범위에서 이루어진다고 가정해 보겠습니다. 먼저 리터럴 확장 접근 방식을 사용하면 어떻게 되는지 살펴봅니다 (권장하지 않음). purchaseValue의 최대 값으로 2, 000달러를 입력합니다.
- '시뮬레이션'을 클릭합니다.
- 노이즈 비율이 높습니다. 이는 현재 확장 계수가 2, 000달러를 기준으로 계산되지만 실제로는 대부분의 구매 금액이 이보다 훨씬 낮기 때문입니다.
- 이제 좀 더 실용적인 확장 접근 방식을 사용해 보겠습니다. 최대 구매 금액을 120달러로 변경합니다.
- '시뮬레이션'을 클릭합니다.
- 이 두 번째 시뮬레이션에서는 노이즈 비율이 낮습니다 (더 좋음).
확장을 구현하려면 일반적으로 특정 전환 이벤트의 최대 가능한 값을 기반으로 확장 계수를 계산합니다(이 예에서 자세히 알아보기).
그러나 최대 값을 사용하여 이 크기 조정 계수를 계산하면 신호 대 노이즈 비율이 악화되므로 주의하세요. 대신 이상치를 삭제하고 실용적인 최대값을 사용하세요.
이상치 관리는 심층적인 주제입니다. 신호 대 잡음비를 개선하기 위해 여러 가지 정교한 기법을 고려할 수 있습니다. 하나는 고급 외부 항목 관리에 설명되어 있습니다.
다음 단계
이제 사용 사례에 적합한 다양한 노이즈 관리 전략을 평가했으므로 출처 무료 체험을 통해 실제 측정 데이터를 수집하여 요약 보고서를 실험할 수 있습니다. API 사용해 보기 가이드와 팁을 검토하세요.
부록
Noise Lab 빠르게 둘러보기
Noise Lab을 사용하면 소음 관리 전략을 빠르게 평가하고 비교할 수 있습니다. 다음과 같은 용도로 사용할 수 있습니다.
- 노이즈에 영향을 줄 수 있는 주요 매개변수와 그 효과를 이해합니다.
- 다양한 설계 결정에 따라 출력 측정 데이터에 미치는 노이즈의 영향을 시뮬레이션합니다. 사용 사례에 적합한 신호 대 노이즈 비율이 될 때까지 설계 매개변수를 조정합니다.
- 요약 보고서의 유용성에 관한 의견을 공유해 주세요. 어떤 에피론 및 노이즈 매개변수 값이 유용하고 어떤 값이 유용하지 않은가요? 변곡점은 어디에 있나요?
이는 준비 단계라고 생각하면 됩니다. Noise Lab은 입력에 따라 측정 데이터를 생성하여 요약 보고서 출력을 시뮬레이션합니다. 데이터를 유지하거나 공유하지 않습니다.
Noise Lab에는 두 가지 모드가 있습니다.
- 간단한 모드: 노이즈에 대한 제어의 기본사항을 이해합니다.
- 고급 모드: 다양한 노이즈 관리 전략을 테스트하고 사용 사례에 가장 적합한 신호 대 노이즈 비율을 제공하는 전략을 평가합니다.
상단 메뉴의 버튼을 클릭하여 두 모드 간에 전환합니다 (아래 스크린샷의 1번).
간단한 모드
- 간단한 모드를 사용하면 에피론과 같은 매개변수 (왼쪽 또는 아래 스크린샷의 2번)를 제어하고 노이즈에 미치는 영향을 확인할 수 있습니다.
- 각 매개변수에는 도움말('?' 버튼)이 있습니다. 클릭하면 각 매개변수에 관한 설명이 표시됩니다 (아래 스크린샷의 3번).
- 시작하려면 '시뮬레이션' 버튼을 클릭하고 출력 결과를 확인합니다 (아래 스크린샷의 4.).
- 출력 섹션에서 다양한 세부정보를 확인할 수 있습니다. 일부 요소 옆에는 `?` 가 표시됩니다. 각 `?` 를 클릭하여 다양한 정보에 관한 설명을 확인하세요.
- 표의 펼쳐진 버전을 보려면 출력 섹션에서 세부정보 전환 버튼을 클릭합니다 (아래 스크린샷의 5번).
- 출력 섹션의 각 데이터 표 아래에는 오프라인에서 사용할 수 있도록 표를 다운로드하는 옵션이 있습니다. 또한 오른쪽 하단에는 모든 데이터 표를 다운로드하는 옵션이 있습니다 (아래 스크린샷의 6번).
- '매개변수' 섹션에서 매개변수의 다양한 설정을 테스트하고 '시뮬레이션'을 클릭하여 출력에 미치는 영향을 확인합니다.
간단한 모드용 노이즈 실험실 인터페이스
고급 모드
- 고급 모드에서는 매개변수를 더 세부적으로 제어할 수 있습니다. 맞춤 측정 목표 및 측정기준을 추가할 수 있습니다 (아래 스크린샷의 1번과 2번).
- 매개변수 섹션 아래로 스크롤하여 '주요 전략' 옵션을 확인합니다. 이를 사용하여 다양한 키 구조를 테스트할 수 있습니다(아래 스크린샷의 3번).
- 다양한 키 구조를 테스트하려면 키 전략을 'B'로 전환합니다.
- 사용할 다양한 키 구조의 수를 입력합니다(기본값은 '2'로 설정됨).
- '키 구조 생성'을 클릭합니다.
- 각 키 구조에 포함할 키 옆의 체크박스를 클릭하면 키 구조를 지정할 수 있는 옵션이 표시됩니다.
- '시뮬레이션'을 클릭하여 결과를 확인합니다.
고급 모드용 Noise Lab 인터페이스 고급 모드용 Noise Lab 인터페이스
노이즈 측정항목
핵심 개념
개별 사용자의 개인 정보를 보호하기 위해 노이즈가 추가됩니다.
노이즈 값이 높으면 버킷/키가 희소하고 민감한 이벤트가 제한적으로 포함되어 있음을 나타냅니다. 이는 Noise Lab에서 자동으로 처리하여 개인이 '군중 속에 숨을 수' 있도록 하거나, 다시 말해 더 많은 노이즈를 추가하여 이러한 제한된 개인의 개인 정보를 보호합니다.
노이즈 값이 낮으면 이미 개인이 '군중 속에 숨을 수' 있도록 데이터 설정이 설계되었음을 나타냅니다. 즉, 버킷에는 개인 사용자 개인 정보 보호를 보장하기에 충분한 수의 이벤트가 포함되어 있습니다.
이 문장은 평균 비율 오류 (APE)와 RMSRE_T (기준점이 있는 평균 제곱근 상대 오류) 모두에 적용됩니다.
APE (평균 백분율 오류)
APE는 신호 대비 노이즈의 비율, 즉 실제 요약 값입니다.p> APE 값이 낮을수록 신호 대 노이즈 비율이 더 좋습니다.
수식
특정 요약 보고서의 APE는 다음과 같이 계산됩니다.

true는 실제 요약 값입니다. APE는 각 실제 요약 값에 대한 노이즈의 평균으로, 요약 보고서의 모든 항목에 대해 평균을 내어 계산합니다. Noise Lab에서는 이 값에 100을 곱하여 백분율을 표시합니다.
장단점
크기가 작은 버킷은 APE의 최종 값에 불균형한 영향을 미칩니다. 이는 소음을 평가할 때 혼동을 줄 수 있습니다. 이러한 이유로 APE의 이 제한을 완화하도록 설계된 다른 측정항목인 RMSRE_T를 추가했습니다. 자세한 내용은 예시를 참고하세요.
코드
APE 계산을 위한 소스 코드를 검토합니다.
RMSRE_T (기준점과 함께 평균 제곱근 상대 오류)
RMSRE_T (기준점과 함께한 평균 제곱근 상대 오차)는 노이즈를 측정하는 또 다른 방법입니다.
RMSRE_T 해석 방법
RMSRE_T 값이 낮을수록 신호 대 잡음비가 더 높습니다.
예를 들어 사용 사례에 허용되는 노이즈 비율이 20%이고 RMSRE_T가 0.2이면 노이즈 수준이 허용 범위에 속한다고 확신할 수 있습니다.
수식
특정 요약 보고서의 경우 RMSRE_T는 다음과 같이 계산됩니다.

장단점
RMSRE_T는 APE보다 이해하기가 조금 더 복잡합니다. 하지만 요약 보고서의 노이즈를 분석하는 데 APE보다 적합한 경우도 있습니다.
- RMSRE_T가 더 안정적입니다. 'T'는 임곗값입니다. 'T'는 전환수가 적고 따라서 크기가 작아 노이즈에 더 민감한 버킷에 RMSRE_T 계산에서 가중치를 더 적게 적용하는 데 사용됩니다. T를 사용하면 전환이 적은 버킷에서 측정항목이 급증하지 않습니다. T가 5이면 전환이 0인 버킷의 노이즈 값이 1만큼 작아도 1을 훨씬 넘게 표시되지 않습니다. 대신 T가 5이므로 1/5에 해당하는 0.2로 제한됩니다. 노이즈에 더 민감한 작은 버킷에 가중치를 덜 부여하므로 이 측정항목은 더 안정적이므로 두 시뮬레이션을 더 쉽게 비교할 수 있습니다.
- RMSRE_T를 사용하면 쉽게 집계할 수 있습니다. 여러 버킷의 RMSRE_T와 실제 개수를 알면 합계의 RMSRE_T를 계산할 수 있습니다. 이렇게 하면 이러한 결합된 값에 대해 RMSRE_T를 최적화할 수도 있습니다.
APE의 경우 집계가 가능하지만 라플라스 노이즈 합계의 절댓값이 포함되므로 수식이 매우 복잡합니다. 따라서 APE를 최적화하기가 더 어려워집니다.
코드
RMSRE_T 계산을 위한 소스 코드를 검토합니다.
예
3개의 버킷이 있는 요약 보고서:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = 노이즈: 20, trueSummaryValue: 100
- bucket_3 = 노이즈: 20, trueSummaryValue: 200
APE = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
3개의 버킷이 있는 요약 보고서:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = 노이즈: 20, trueSummaryValue: 100
- bucket_3 = 노이즈: 20, trueSummaryValue: 20
APE = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
3개의 버킷이 있는 요약 보고서:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = 노이즈: 20, trueSummaryValue: 100
- bucket_3 = 노이즈: 20, trueSummaryValue: 0
APE = (0.1 + 0.2 + 무한대) / 3 = 무한대
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
고급 키 관리
DSP 또는 광고 측정 회사는 여러 업계, 통화, 구매 가격 잠재력에 걸쳐 수천 명의 글로벌 광고 고객을 보유하고 있을 수 있습니다. 즉, 광고주당 하나의 집계 키를 만들고 관리하는 것은 매우 비실용적일 수 있습니다. 또한 수천 명의 전 세계 광고주에 걸쳐 노이즈의 영향을 제한할 수 있는 최대 집계 가능 값과 집계 예산을 선택하는 것은 쉽지 않습니다. 대신 다음 시나리오를 고려해 보겠습니다.
주요 전략 A
광고 기술 제공업체는 모든 광고 고객에 대해 하나의 키를 만들고 관리하기로 결정합니다. 모든 광고주와 모든 통화를 기준으로 구매 범위는 소규모 고가 구매에서 대규모 저가 구매까지 다양합니다. 그러면 다음과 같은 키가 생성됩니다.
키 (여러 통화) | |
---|---|
집계 가능한 최대 값 | 5,000,000 |
구매 가치 범위 | [120~5000000] |
주요 전략 B
광고 기술 제공업체는 모든 광고 고객에 대해 두 개의 키를 만들고 관리하기로 결정합니다. 통화별로 키를 구분하기로 합니다. 모든 광고주와 모든 통화에서 구매 범위는 소규모 고급 구매에서 대규모 저가 구매까지 다양합니다. 통화별로 구분하여 다음과 같이 2개의 키를 만듭니다.
키 1 (USD) | 키 2 (¥) | |
---|---|---|
집계 가능한 최대 값 | $40,000 | ¥5,000,000 |
구매 가치 범위 | [120~40,000] | [15,000~5,000,000] |
통화 값이 통화 간에 균등하게 분포되지 않으므로 키 전략 B의 결과에는 키 전략 A보다 노이즈가 적습니다. 예를 들어 ¥로 표시된 구매가 USD로 표시된 구매와 혼합되면 기본 데이터와 결과물의 노이즈가 어떻게 변경되는지 생각해 보세요.
주요 전략 C
광고 기술 제공업체는 모든 광고 고객에 대해 4개의 키를 만들고 관리하며 통화 x 광고주 업계별로 구분하기로 결정합니다.
키 1 (USD x 고급 주얼리 광고주) |
키 2 (¥ x 고급 주얼리 광고주) |
주요 3개 (USD x 의류 소매업체 광고주) |
키 4 (¥ x 의류 소매업체 광고주) |
|
---|---|---|---|---|
집계 가능한 최대 값 | $40,000 | ¥5,000,000 | $500 | ¥65,000 |
구매 가치 범위 | [10,000~40,000] | [1,250,000~5,000,000] | [120~500] | [15,000~65,000] |
광고주 구매 가치가 광고주 간에 균등하게 분포되지 않으므로 핵심 전략 C의 결과에는 핵심 전략 B보다 노이즈가 적습니다. 예를 들어 고급 주얼리 구매가 야구 모자 구매와 혼합되면 기본 데이터가 변경되고 노이즈가 있는 결과가 나올 수 있습니다.
출력의 노이즈를 줄이기 위해 여러 광고주 간에 공통적인 항목에 대해 공유 최대 집계 값과 공유 크기 조정 계수를 만드는 것이 좋습니다. 예를 들어 광고주를 위해 아래의 다양한 전략을 실험해 볼 수 있습니다.
- 통화 (USD, ¥, CAD 등)별로 구분된 하나의 전략
- 광고주 업종 (보험, 자동차, 소매 등)별로 구분된 하나의 전략
- 유사한 구매 금액 범위 ([100], [1,000], [10,000] 등)로 구분된 하나의 전략
광고주 공통점을 중심으로 주요 전략을 세우면 키와 해당 코드를 더 쉽게 관리하고 신호 대 노이즈 비율을 높일 수 있습니다. 다양한 광고주 공통분모를 고려하여 다양한 전략을 실험하여 노이즈 영향과 코드 관리 간의 변곡점을 파악합니다.
고급 외부값 관리
두 광고주의 시나리오를 생각해 보겠습니다.
- 광고주 A:
- 광고주 A의 사이트에 있는 모든 제품의 구매 가격은 [120달러~1,000달러]이며 범위는 880달러입니다.
- 구매 가격은 880달러 범위에 고르게 분포되어 있으며, 구매 가격 중간값에서 2개의 표준 편차를 벗어난 외부값은 없습니다.
- 광고주 B:
- 광고주 B의 사이트에 있는 모든 제품의 구매 가격은 [120달러~1,000달러]이며 범위는 880달러입니다.
- 구매 가격은 120~500달러 범위에 크게 편향되어 있으며, 500~1,000달러 범위에서 이루어지는 구매는 5% 에 불과합니다.
참여도 예산 요구사항과 최종 결과에 노이즈가 적용되는 방법론을 고려할 때, 광고주 B는 기본적으로 광고주 A보다 노이즈가 많은 출력을 보입니다. 광고주 B의 경우, 이상치가 기본 계산에 영향을 줄 가능성이 더 높기 때문입니다.
특정 키 설정을 통해 이 문제를 완화할 수 있습니다. 이상치 데이터를 관리하고 키의 구매 범위 전반에 구매 가치를 더 고르게 분산하는 데 도움이 되는 주요 전략을 테스트합니다.
광고주 B의 경우 두 개의 서로 다른 구매 가치 범위를 포착하기 위해 두 개의 별도 키를 만들 수 있습니다. 이 예에서 광고 기술은 구매 금액이 500달러를 초과하는 경우 외부값이 표시된다고 확인했습니다. 이 광고주에 대해 다음과 같이 두 개의 키를 구현해 보세요.
- 키 구조 1 : 120~500달러 범위의 구매만 캡처하는 키 (총 구매량의 약 95% 를 차지함)
- 키 구조 2: 500달러를 초과하는 구매만 캡처하는 키(총 구매량의 약 5% 를 차지함)
이 주요 전략을 구현하면 광고주 B의 노이즈를 더 효과적으로 관리하고 요약 보고서에서 광고주 B의 유용성을 극대화하는 데 도움이 됩니다. 이제 더 작은 새로운 범위를 고려할 때 키 A와 키 B는 이전의 단일 키에 비해 각 키에 더 균일하게 데이터가 분포되어야 합니다. 이렇게 하면 이전의 단일 키보다 각 키의 출력에 노이즈 영향이 줄어듭니다.