处理噪声

了解如何在可汇总的报告中处理、考虑和减少噪声的影响。

准备工作

在继续操作之前,如需深入了解噪声是什么及其影响,请参阅了解汇总报告中的噪声

噪声控制

虽然您无法直接控制添加到可汇总报告中的噪声,但可以采取一些措施来尽可能减少其影响。以下部分介绍了这些策略。

扩大到贡献预算

如“了解噪声”中所述,应用于每个键的摘要值的噪声基于 0-65,536 范围(0-CONTRIBUTION_BUDGET)。

噪声分布基于预算。
噪声分布基于预算。

因此,为了最大限度地提高信噪比,您应在将每个值设置为可汇总的值之前,先按比例放大每个值,即用某个系数(缩放系数)乘以每个值,同时验证它是否在贡献预算范围内。

有缩放和无缩放时的相对噪声。
有缩放和无缩放时的相对噪声。

计算缩放比例

缩放比例表示您要将给定的可汇总值缩放多少。 其值应为贡献预算除以某个键的最大可汇总值。

根据贡献预算确定缩放比例。
根据贡献预算确定缩放比例。

例如,假设广告客户想知道总购买价值。您知道,任何单次购买交易的预期购买价值上限为 2,000 美元,但少数异常值除外,您决定忽略这些异常值:

  • 计算缩放比例
    • 为了最大限度地提高信噪比,您需要将此值缩放到 65,536(贡献预算)。
    • 这会产生 65,536 / 2,000 的缩放比例,约为 32x。在实践中,您可能会将此系数向上或向下舍入。
  • 在汇总之前按比例调高值。每消费 1 美元,将跟踪的指标递增 32。例如,对于 120 美元的购买交易,可汇总的值应设置为 120*32 = 3,840。
  • 在汇总后缩减值。收到包含多位用户购买价值总和的汇总报告后,请使用汇总前使用的缩放比例缩小汇总价值。在我们的示例中,我们使用了 32 的预汇总缩放比例,因此需要将汇总报告中收到的汇总值除以 32。因此,如果总结报告中某个键的总结购买价值为 76,800,则总结购买价值(含噪声)为 76,800/32 = 2,400 美元。

分配预算

如果您有多个衡量目标(例如购买次数和购买价值),不妨将预算分配给这些目标。

在这种情况下,您的缩放比例因子将因不同的可汇总值而异,具体取决于给定可汇总值的预期最大值。

如需了解详情,请参阅了解汇总键

例如,假设您同时跟踪购买次数和购买价值,并决定平均分配预算。

每种衡量类型和每个来源可分配 65,536 / 2 = 32,768 个。

  • 购买次数:
    • 您只跟踪一次购买交易,因此单次转化的购买交易次数上限为 1。
    • 因此,您决定将购买次数的缩放比例设置为 32,768 / 1 = 32,768。
  • 购买价值:
    • 假设任何单次购买的最高预期购买价值为 2,000 美元。
    • 因此,您决定将购买价值的缩放比例设置为 32,768 / 2,000 = 16.384,即大约 16。

更粗略的汇总键可提高信噪比

由于粗略键比精细键捕获的转化事件更多,因此粗略键通常会带来更高的汇总价值。

与较低的摘要值相比,较高的摘要值受噪声的影响较小;相对于此值,这些值上的噪声可能较低。

与使用更精细的键收集的值相比,使用更粗略的键收集的值可能相对来说噪声更少。

示例

在其他条件相同的情况下,跟踪全球购买价值(所有国家/地区的总和)的键会带来比跟踪国家/地区级转化的键更高的汇总购买价值(以及更高的汇总转化次数)。

因此,特定国家/地区的总购买价值的相对噪声会高于所有国家/地区的总购买价值的相对噪声。

同样,在其他条件相同的情况下,鞋类的总购买价值低于所有商品(包括鞋类)的总购买价值。

因此,鞋类的总购买价值的相对噪声将高于所有商品的总购买价值的相对噪声。

使用精细键与粗略键时的噪声影响。
使用精细密钥与粗略密钥时的噪声影响。

对汇总值(汇总)求和也会对相应噪声求和

通过汇总摘要报告中的摘要值来获取更高级别的数据时,您也会汇总这些摘要值中的噪声。

具有汇总功能的细粒度键与不具有汇总功能的粗粒度键的噪声程度。
具有汇总功能的细化键与不具有汇总功能的粗化键之间的噪声程度。

我们来看看两种不同的方法:

  • 方法 A:在密钥中添加地理位置 ID。摘要报告会公开地理位置 ID 级密钥,每个密钥都与特定地理位置 ID 级的汇总购买价值相关联。
  • 方法 B:您不在密钥中添加地理位置 ID。摘要报告直接显示所有地理位置 ID / 位置的购买价值摘要。

如需访问国家/地区级购买价值,请执行以下操作:

  • 采用方法 A 时,您需要汇总地理位置 ID 级汇总值,因此也会汇总其噪声。这可能会导致最终的地理位置 ID 级购买价值中添加更多噪声。
  • 采用方法 B 时,您可以直接查看汇总报告中显示的数据。噪声仅向相应数据添加了一次。

因此,采用方法 A 时,指定地理位置 ID 的汇总购买价值可能会更加嘈杂。

同样,在键中包含邮政编码级维度可能会导致结果的噪声比使用包含区域级维度的粗略键更大。

汇总较长时间段的数据可提高信噪比

请求摘要报告的频率越低,每个摘要值就可能越高;在较长的时间范围内,可能会发生更多转化。

如前所述,汇总值越高,相对噪声可能越低。因此,请求摘要报告的频率越低,信噪比就越高(效果越好)。

降低请求摘要报告的频率有助于提高信噪比
降低摘要报告的请求频率可提高信噪比。

下面举例说明:

  • 如果您请求 24 小时内的每小时摘要报告,然后将每个每小时报告中的摘要值相加来获取天级数据,系统会添加 24 次噪声。
  • 在一个每日摘要报告中,只会添加一次噪声。

epsilon 值越大,噪声越小

epsilon 值越高,噪声越低,隐私保护程度越低。

利用过滤和去重功能

在不同键之间分配预算时,一个重要环节是了解特定事件的发生次数。例如,某广告客户可能只关心每次点击带来的 1 次购买,但可能对最多 3 次“产品页面浏览”转化感兴趣。为了支持这些使用情形,您可能还需要使用以下 API 功能,以便控制生成报告的数量以及统计哪些转化:

尝试不同的 epsilon 值

广告技术平台可以将 epsilon 设置为大于 0 且小于或等于 64 的值。此范围可实现灵活的测试。epsilon 值越低,隐私保护程度越高。建议您从 epsilon=10 开始。

建议尝试的实验

我们建议您执行以下操作:

  • 从 epsilon = 10 开始。
  • 如果这导致了明显的实用性问题,请逐步增加 epsilon。
  • 分享您在数据可用性方面发现的特定拐点方面的反馈。

互动并分享反馈

您可以参与并试用此 API

后续步骤