집계 가능한 보고서에서 노이즈를 처리하고, 노이즈를 고려하고, 노이즈의 영향을 줄이는 방법을 알아보세요.
시작하기 전에
계속하기 전에 노이즈가 무엇인지, 노이즈가 미치는 영향을 자세히 알아보려면 요약 보고서의 노이즈 이해를 참고하세요.
소음 제어
집계 가능한 보고서에 추가되는 노이즈를 직접 제어할 수는 없지만 영향을 최소화하기 위한 단계를 취할 수 있습니다. 다음 섹션에서는 이러한 전략을 설명합니다.
기여 예산까지 확장
노이즈 이해에 설명된 대로 각 키의 요약 값에 적용된 노이즈는 0~65,536 (0~CONTRIBUTION_BUDGET) 스케일을 기반으로 합니다.
따라서 노이즈에 비해 신호를 최대화하려면 집계 가능한 값으로 설정하기 전에 각 값을 스케일 업해야 합니다. 즉, 기여도 예산 내에 있는지 확인하면서 각 값에 특정 계수(스케일링 계수)를 곱합니다.
배율 계산
배율은 지정된 집계 가능 값을 얼마나 확장할지 나타냅니다. 이 값은 기여 예산을 특정 키의 최대 집계 가능 값으로 나눈 값이어야 합니다.
예를 들어 광고주가 총 구매 금액을 알고 싶어 한다고 가정해 보겠습니다. 몇몇 이상치를 무시하기로 결정한 경우를 제외하고 개별 구매의 최대 예상 구매 가치가 2,000달러임을 알고 있습니다.
- 배율 계산:
- 신호 대 잡음비를 최대화하려면 이 값을 65,536 (기여 예산)으로 조정해야 합니다.
- 따라서 65,536 / 2,000으로 약 32x의 확장 요소가 됩니다. 실제로 이 요소를 올림하거나 내림할 수 있습니다.
- 집계 전에 값을 스케일 업합니다. 구매 금액이 $1일 때마다 추적된 측정항목을 32씩 늘립니다. 예를 들어 120달러를 구매한 경우 집계 가능한 값을 120*32 = 3,840으로 설정합니다.
- 집계 후 값 축소 여러 사용자의 구매 값이 합산된 요약 보고서를 수신하면 집계 전에 사용한 스케일링 요소를 사용하여 요약 값을 축소합니다. 이 예에서는 집계 전 스케일링 계수 32를 사용했으므로 요약 보고서에서 수신한 요약 값을 32로 나눠야 합니다. 따라서 요약 보고서의 특정 키에 대한 요약 구매 값이 76,800인 경우 요약 구매 값 (노이즈 포함)은 76,800/32 = $2,400입니다.
예산 분할
구매 수와 구매 가치 등 측정 목표가 여러 개인 경우 이러한 목표에 예산을 분배하는 것이 좋습니다.
이 경우 특정 집계 가능 값의 예상 최대값에 따라 집계 가능 값마다 확장 요소가 달라집니다.
자세한 내용은 집계 키 이해를 참고하세요.
예를 들어 구매 수와 구매 가치를 모두 추적하고 예산을 균등하게 할당하기로 결정했다고 가정해 보겠습니다.
측정 유형 및 소스당 65,536 / 2 = 32,768이 할당될 수 있습니다.
- 구매 수:
- 구매를 한 번만 추적하므로 특정 전환의 최대 구매 수는 1입니다.
- 따라서 구매 수의 배율을 32,768 / 1 = 32,768로 설정합니다.
- 구매 가치:
- 개별 구매의 최대 예상 구매 가치가 2,000달러라고 가정해 보겠습니다.
- 따라서 구매 가치의 확장 인수를 32,768 / 2,000 = 16.384 또는 약 16으로 설정하기로 결정합니다.
더 거친 집계 키는 신호 대 노이즈 비율을 개선합니다.
대략적인 키는 세부적인 키보다 더 많은 전환 이벤트를 포착하므로 일반적으로 대략적인 키가 더 높은 요약 값을 생성합니다.
요약 값이 높을수록 낮은 값보다 노이즈의 영향을 덜 받습니다. 이러한 값의 노이즈는 이 값에 비해 낮을 가능성이 높습니다.
더 세부적인 키로 수집된 값보다 더 거친 키로 수집된 값이 상대적으로 노이즈가 적을 수 있습니다.
예
다른 모든 조건이 동일한 경우 전 세계 구매 가치를 추적하는 키 (모든 국가에서 합산)는 국가 수준에서 전환을 추적하는 키보다 요약 구매 가치 (및 요약 전환수)가 더 높습니다.
따라서 특정 국가의 총 구매 금액에 대한 상대적 노이즈가 모든 국가의 총 구매 금액에 대한 상대적 노이즈보다 높습니다.
마찬가지로 다른 모든 조건이 동일한 경우 신발의 총 구매 가치는 신발을 포함한 모든 상품의 총 구매 가치보다 낮습니다.
따라서 신발의 총 구매 가치에 대한 상대적 노이즈는 모든 상품의 총 구매 가치에 대한 상대적 노이즈보다 높습니다.
요약 값 (롤업)을 합산하면 노이즈도 합산됩니다.
요약 보고서의 요약 값을 합산하여 상위 수준 데이터에 액세스하면 이러한 요약 값의 노이즈도 합산됩니다.
두 가지 접근 방식을 살펴보겠습니다.
- 접근 방식 A: 키에 지역 ID를 포함합니다. 요약 보고서는 지역 ID 수준 키를 노출하며, 각 키는 특정 지역 ID 수준의 요약 구매 가치와 연결됩니다.
- 접근 방식 B: 키에 지역 ID를 포함하지 않습니다. 요약 보고서는 모든 지역 ID / 위치의 요약 구매 가치를 직접 노출합니다.
국가별 구매 가치에 액세스하려면 다음 단계를 따르세요.
- 접근 방식 A를 사용하면 지역 ID 수준 요약 값을 합산하므로 노이즈도 합산됩니다. 이렇게 하면 최종 지역 ID 수준 구매 값에 더 많은 노이즈가 추가될 수 있습니다.
- B 접근 방식에서는 요약 보고서에 표시된 데이터를 직접 확인합니다. 노이즈가 해당 데이터에 한 번만 추가되었습니다.
따라서 특정 지역 ID의 요약 구매 가치는 A 접근법을 사용할 때 더 노이즈가 많을 수 있습니다.
마찬가지로 키에 우편번호 수준 측정기준을 포함하면 지역 수준 측정기준이 있는 더 거친 키를 사용하는 것보다 노이즈가 더 많은 결과가 나올 수 있습니다.
더 긴 기간에 걸쳐 집계하면 신호 대 노이즈 비율이 증가합니다.
요약 보고서를 더 자주 요청하는 경우보다 요약 보고서를 덜 자주 요청하는 경우 각 요약 값이 더 높을 가능성이 높습니다. 더 긴 기간에 더 많은 전환이 발생할 수 있기 때문입니다.
앞서 언급한 것처럼 요약 값이 높을수록 상대적 노이즈가 낮아질 가능성이 높습니다. 따라서 요약 보고서를 더 적은 빈도로 요청하면 신호 대 노이즈 비율이 높아집니다.
다음은 이를 보여주는 예시입니다.
- 24시간 동안 시간별 요약 보고서를 요청한 다음 각 시간별 보고서의 요약 값을 합산하여 일별 데이터에 액세스하는 경우 노이즈가 24번 추가됩니다.
- 일일 요약 보고서에서는 노이즈가 한 번만 추가됩니다.
엡실론이 높을수록 노이즈가 줄어듭니다.
엡실론 값이 높을수록 노이즈가 낮아지고 개인 정보 보호 수준이 낮아집니다.
필터링 및 중복 삭제 활용
다양한 키 간에 예산을 할당할 때 중요한 부분은 특정 이벤트가 발생할 수 있는 횟수를 파악하는 것입니다. 예를 들어 광고주는 클릭당 구매 1건에만 관심이 있을 수 있지만 최대 3건의 '제품 페이지 조회' 전환에 관심이 있을 수 있습니다. 이러한 사용 사례를 지원하기 위해 생성되는 보고서 수와 집계되는 전환을 제어할 수 있는 다음 API 기능을 사용할 수도 있습니다.
- 필터링 필터링에 대해 자세히 알아보기
- 중복 삭제 중복 삭제에 대해 자세히 알아보기
입실론 실험
광고 기술은 0보다 크고 64 이하인 값으로 입실론을 설정할 수 있습니다. 이 범위를 사용하면 유연한 테스트가 가능합니다. 엡실론 값이 낮을수록 개인 정보 보호가 강화됩니다. epsilon=10으로 시작하는 것이 좋습니다.
실험 권장사항
다음을 권장합니다.
- epsilon = 10으로 시작합니다.
- 이로 인해 눈에 띄는 유틸리티 문제가 발생하는 경우 입실론을 점진적으로 늘리세요.
- 데이터 유용성과 관련하여 발견한 특정 변곡점에 관한 의견을 공유하세요.
참여 및 의견 공유
이 API에 참여하고 실험할 수 있습니다.
- 집계 가능한 보고서 및 집계 서비스에 대해 알아보고, 질문하고, 의견을 제안하세요.
- 기여 분석 보고 가이드를 읽어보세요.
다음 단계
- 캠페인 변수, 일괄 처리 빈도, 측정기준 세부사항과 같이 보고에 영향을 미치는 요인에 대한 자세한 내용은 요약 보고서 설계 결정 실험을 참고하세요 .
- 노이즈 실험실을 사용해 보세요.