노이즈 처리

집계 가능한 보고서에서 노이즈를 처리하고, 고려하고, 그 영향을 줄이는 방법을 알아보세요.

시작하기 전에

계속하기 전에 노이즈의 정의와 영향에 대해 자세히 알아보려면 요약 보고서의 노이즈 이해하기를 참고하세요.

소음 제어

집계 가능한 보고서에 추가된 노이즈를 직접 제어할 수는 없지만 영향을 최소화하기 위해 취할 수 있는 조치가 있습니다. 다음 섹션에서는 이러한 전략을 설명합니다.

참여 예산으로 확장

노이즈 이해에서 설명한 대로 각 키의 요약 값에 적용되는 노이즈는 0~65,536 (0~CONTRIBUTION_BUDGET) 척도를 기반으로 합니다.

노이즈 분포는 예산을 기준으로 합니다.

따라서 노이즈에 비해 신호를 극대화하려면 각 값을 집계 가능한 값으로 설정하기 전에 확장해야 합니다. 즉, 각 값에 특정 계수인 확장 계수를 곱하면서 기여도 예산 내에 유지해야 합니다.

확장 여부에 따른 상대적 노이즈

배율 계산

배율은 지정된 집계 가능한 값을 얼마나 확장할지 나타냅니다. 이 값은 기여 예산을 특정 키의 최대 집계 가능 값으로 나눈 값이어야 합니다.

기여 예산을 기반으로 배율을 결정합니다.

예를 들어 광고주가 총 구매 금액을 알고 싶다고 가정해 보겠습니다. 무시하기로 한 몇 가지 예외를 제외하고 개별 구매의 예상 최대 구매 금액은 2,000달러임을 알고 있습니다.

  • 배율 계산:
    • 신호 대 노이즈 비율을 극대화하려면 이 값을 65,536 (참여 예산)으로 조정해야 합니다.
    • 따라서 65,536 / 2,000으로 약 32x 배율이 됩니다. 실제로는 이 계수를 반올림하거나 올림할 수 있습니다.
  • 집계하기 전에 값을 확장합니다. 구매 금액이 1달러마다 추적 측정항목이 32씩 증가합니다. 예를 들어 120달러를 구매한 경우 집계 가능한 값을 120*32 = 3,840으로 설정합니다.
  • 집계 후 값 축소 여러 사용자의 합산된 구매 금액이 포함된 요약 보고서를 수신하면 집계 전에 사용한 크기 조정 계수를 사용하여 요약 값을 축소합니다. 이 예에서는 집계 전의 크기 조정 계수로 32를 사용했으므로 요약 보고서에서 수신된 요약 값을 32로 나눠야 합니다. 따라서 요약 보고서에서 특정 키의 요약 구매 금액이 76,800인 경우 요약 구매 금액 (노이즈 포함)은 76,800/32 = 2,400달러입니다.

예산 분할

측정 목표가 여러 개인 경우(예: 구매 건수 및 구매 금액) 이러한 목표에 예산을 분할하는 것이 좋습니다.

이 경우 집계 가능한 값마다 집계 가능한 값의 예상 최대값에 따라 확장 계수가 달라집니다.

집계 키 이해에서 세부정보를 확인하세요.

예를 들어 구매 건수와 구매 금액을 모두 추적하고 예산을 동등하게 할당한다고 가정해 보겠습니다.

측정 유형 및 소스별로 65,536 / 2 = 32,768을 할당할 수 있습니다.

  • 구매 수:
    • 구매 1건만 추적하므로 특정 전환의 최대 구매 수는 1입니다.
    • 따라서 구매 수의 배율을 32,768 / 1 = 32,768로 설정합니다.
  • 구매 가치:
    • 개별 구매의 최대 예상 구매 가치가 2,000원이라고 가정해 보겠습니다.
    • 따라서 구매 금액의 배율을 32,768 / 2,000 = 16.384 또는 약 16으로 설정합니다.

대략적인 집계 키를 사용하면 신호 대 노이즈 비율이 개선됨

대략적인 키는 세부적인 키보다 더 많은 전환 이벤트를 포착하므로 대략적인 키는 일반적으로 더 높은 요약 값을 가져옵니다.

요약 값이 클수록 노이즈의 영향을 덜 받습니다. 이러한 값의 노이즈는 이 값에 비해 낮을 수 있습니다.

대략적인 키로 수집된 값은 더 상세한 키로 수집된 값보다 상대적으로 노이즈가 적을 수 있습니다.

다른 조건이 동일한 경우 전 세계적으로 구매 가치를 추적하는 키 (모든 국가에서 합산)는 국가 수준에서 전환을 추적하는 키보다 요약 구매 가치 (및 요약 전환수)가 더 높습니다.

따라서 특정 국가의 총 구매 금액에 대한 상대적 노이즈는 모든 국가의 총 구매 금액에 대한 상대적 노이즈보다 높습니다.

마찬가지로 다른 모든 조건이 동일하다면 신발의 총 구매 금액은 신발을 포함한 모든 상품의 총 구매 금액보다 낮습니다.

따라서 신발의 총 구매 금액에 대한 상대적 노이즈는 모든 상품의 총 구매 금액에 대한 상대적 노이즈보다 높습니다.

세분화된 키와 대략적인 키의 노이즈 영향 비교

요약 값 (롤업)을 합산하면 노이즈도 합산됩니다.

요약 보고서의 요약 값을 합산하여 상위 수준의 데이터에 액세스하면 이러한 요약 값의 노이즈도 합산됩니다.

롤업이 있는 세분화된 키의 노이즈 수준과 롤업이 없는 대략적인 키의 노이즈 수준

두 가지 접근 방식을 살펴보겠습니다. - 접근 방식 A: 키에 지역 ID를 포함합니다. 요약 보고서에는 각 지역 ID 수준의 요약 구매 가치와 연결된 지역 ID 수준 키가 표시됩니다. - 접근 방식 B: 키에 지역 ID를 포함하지 않습니다. 요약 보고서는 모든 지역 ID / 위치의 요약 구매 가치를 직접 노출합니다.

국가 수준 구매 가치에 액세스하려면 다음 단계를 따르세요. - 접근 방식 A를 사용하면 지역 ID 수준의 요약 값을 합산하므로 노이즈도 합산됩니다. 이로 인해 최종 지역 ID 수준 구매 가치에 더 많은 노이즈가 추가될 수 있습니다. - 접근 방식 B를 사용하면 요약 보고서에 노출된 데이터를 직접 확인할 수 있습니다. 이 데이터에 노이즈가 한 번만 추가되었습니다.

따라서 접근 방식 A를 사용하면 특정 지역 ID의 요약 구매 금액에 노이즈가 더 많을 수 있습니다.

마찬가지로 키에 우편번호 수준 측정기준을 포함하면 지역 수준 측정기준과 함께 더 대략적인 키를 사용하는 것보다 노이즈가 더 많은 결과가 나올 수 있습니다.

더 긴 기간에 걸쳐 집계하면 신호 대 노이즈 비율이 증가합니다.

요약 보고서를 더 자주 요청하지 않으면 각 요약 값이 더 자주 보고서를 요청한 경우보다 높을 수 있습니다. 더 긴 기간 동안 더 많은 전환이 발생할 수 있기 때문입니다.

앞서 언급했듯이 요약 값이 높을수록 상대적 노이즈가 낮을 수 있습니다. 따라서 요약 보고서를 덜 자주 요청하면 신호 대 노이즈 비율이 더 높아집니다.

요약 보고서를 덜 자주 요청하면 신호 대 노이즈 비율이 높아집니다.

다음은 이를 보여주는 예시입니다.

  • 24시간 동안 시간별 요약 보고서를 요청한 후 각 시간별 보고서의 요약 값을 합산하여 일 수준 데이터에 액세스하는 경우 노이즈가 24번 추가됩니다.
  • 일일 요약 보고서 하나에 노이즈가 한 번만 추가됩니다.

엡실론이 높을수록 노이즈가 줄어듭니다.

엡실론 값이 높을수록 노이즈가 줄어들고 개인 정보 보호가 저하됩니다.

필터링 및 중복 삭제 활용

여러 키 간에 예산을 할당할 때 중요한 부분은 특정 이벤트가 발생할 수 있는 횟수를 파악하는 것입니다. 예를 들어 광고주는 클릭당 하나의 구매만 중요하게 생각하지만 '제품 페이지 조회' 전환은 최대 3개까지 관심을 가질 수 있습니다. 이러한 사용 사례를 지원하려면 보고서 생성 수와 집계되는 전환을 제어할 수 있는 다음 API 기능을 활용하는 것이 좋습니다.

에피론 실험

광고 기술은 에피론을 0보다 크고 64 이하의 값으로 설정할 수 있습니다. 이 범위를 사용하면 유연하게 테스트할 수 있습니다. 엡실론 값이 낮을수록 개인 정보 보호가 강화됩니다. epsilon=10으로 시작하는 것이 좋습니다.

실험 권장사항

다음을 따르는 것이 좋습니다. - epsilon = 10으로 시작합니다. - 이로 인해 유틸리티 문제가 발생하면 에피론을 점진적으로 늘립니다. - 데이터 사용성에 관해 발견한 특정 변동 지점에 관한 의견을 공유해 주세요.

참여 및 의견 공유

이 API에 참여하여 실험해 보세요.

다음 단계