处理噪声

了解如何处理、考虑和减少可汇总报告中的噪声影响。

准备工作

在继续操作之前,请参阅了解摘要报告中的噪声,深入了解噪声及其影响。

对噪声的控制

虽然您无法直接控制添加到可汇总报告中的噪声,但可以采取一些措施来尽可能减少影响。以下部分介绍了这些策略。

扩展到贡献预算

如“了解噪声”中所述,对每个键的摘要值应用的噪声基于 0-65,536 的范围 (0-CONTRIBUTION_BUDGET)。

噪声分布取决于预算。

因此,为了最大限度地提高信号与噪声之比,您应先放大每个值,然后再将其设置为可聚合的值,也就是说,将每个值乘以一个特定系数(即放大系数),同时确保其保持在贡献预算范围内。

启用和不启用缩放功能时的相对噪声。

计算缩放比例

缩放比例表示您希望对给定可汇总值进行的缩放比例。其值应为贡献预算除以某个键的可汇总最大值。

根据贡献预算确定缩放因子。

例如,假设广告客户想要知道总购买金额。您知道,除了您决定忽略的几个离群值之外,任何单笔购买交易的预期最高购买金额均为 2,000 美元:

  • 计算缩放比例
    • 如需最大限度地提高信噪比,您需要将此值扩大到 65,536(贡献预算)。
    • 这会导致 65,536 / 2,000 大约为 32x的缩放系数。在实践中,您可以向上或向下舍入此系数。
  • 在汇总之前扩大值。每消费 1 美元,跟踪的指标就会递增 32。例如,对于 120 美元的购买交易,请将可汇总的价值设置为 120*32 = 3,840。
  • 在汇总后缩小值。收到包含多位用户总购买金额的摘要报告后,请使用您在汇总前使用的缩放因子缩小摘要值。在我们的示例中,我们在汇总之前使用了缩放因子 32,因此需要将在摘要报告中收到的摘要值除以 32。因此,如果摘要报告中给定键的摘要购买金额为 76,800,则摘要购买金额(含噪声)为 76,800/32 = 2,400 美元。

拆分预算

如果您有多个衡量目标(例如购买次数和购买价值),则可能需要将预算分配给这些目标。

在这种情况下,不同可汇总值的放大系数会有所不同,具体取决于给定可汇总值的预期上限。

如需了解详情,请参阅了解汇总键

例如,假设您同时跟踪购买次数和购买价值,并且决定平均分配预算。

每个衡量类型和每个来源可以分配 65,536 / 2 = 32,768 个标识符。

  • 购买次数:
    • 您仅跟踪一笔购买交易,因此给定转化的购买交易次数上限为 1。
    • 因此,您决定将购买次数的缩放系数设置为 32,768 / 1 = 32,768。
  • 购买价值:
    • 假设任何单次购买的预期购买价值上限为 2,000 美元。
    • 因此,您决定将购买金额的缩放比例设置为 32,768 / 2,000 = 16.384,即大约 16。

使用更粗粒的汇总键可提高信噪比

由于粗略键会捕获比精细键更多的转化事件,因此粗略键通常会产生较高的汇总价值。

与较低的摘要值相比,较高的摘要值受噪声的影响较小;相对于此值,这些值的噪声可能较低。

与使用更精细键收集的值相比,使用粗略键收集的值的噪声相对较小。

示例

在所有其他条件不变的情况下,与跟踪国家/地区级转化的键相比,跟踪全球购买价值(所有国家/地区的总和)的键会带来更高的汇总购买价值(以及更高的汇总转化次数)。

因此,特定国家/地区的购买总价值的相对噪声将高于所有国家/地区的购买总价值的相对噪声。

同样,在所有其他条件不变的情况下,鞋子的购买总价值低于所有商品(包括鞋子)的购买总价值。

因此,鞋子的购买总价值的相对噪声将高于所有商品的购买总价值的相对噪声。

使用精细键与粗略键时的噪声影响。

对汇总值(汇总)求和时,其噪声也会被求和

通过对摘要报告中的摘要值进行求和来获取更高级别的数据,您还会对这些摘要值中的噪声进行求和。

使用启用了汇总功能的精细键与未启用汇总功能的粗略键的噪声程度

我们来看看两种不同的方法: - 方法 A:您在键中添加地理位置 ID。摘要报告会显示地理位置 ID 级别的键,每个键都与特定地理位置 ID 级别的摘要购买价值相关联。- 方法 B:您不将地理位置 ID 添加到键中。摘要报告会直接显示所有地理位置 ID / 地理位置的摘要购买价值。

如需访问国家/地区级购买交易价值,请执行以下操作: - 采用方法 A,您可以对地理 ID 级摘要值求和,从而也对其噪声求和。这可能会导致最终的地理位置 ID 级购买价值添加更多噪声。- 采用方法 B 时,您可以直接查看摘要报告中显示的数据。系统只会向这些数据添加一次噪声。

因此,采用方法 A 时,给定地理位置 ID 的摘要购买金额可能会更不准确。

同样,与使用包含地区级维度的粗略键相比,在键中添加邮政编码级维度可能会导致结果噪声更大。

对更长时间段进行汇总可提高信噪比

请求摘要报告的频率越低,每个摘要值就越有可能高于请求报告的频率较高时;在更长的时间跨度内,可能会发生更多转化。

如前所述,摘要值越高,相对噪声就可能越低。因此,请求摘要报告的频率越低,信噪比就越高(越好)。

请求摘要报告的频率越低,信噪比就越高

下面举例说明:

  • 如果您请求 24 小时内的每小时摘要报告,然后对每个小时报告中的摘要值进行求和以获取日级数据,系统会添加 24 次噪声。
  • 在一份每日摘要报告中,系统只会添加一次噪声。

epsilon 越大,噪声越小

epsilon 值越高,噪声越小,隐私保护程度越低。

利用过滤和去重功能

在不同键之间分配预算时,了解给定事件可能发生的次数是一项重要工作。例如,广告客户可能只关心每次点击带来的一次购买,但可能最多关心 3 次“产品页面浏览”转化。为了支持这些用例,您可能还需要利用以下 API 功能来控制生成的报告数量以及统计哪些转化:

使用 epsilon 进行实验

广告技术平台可以将 epsilon 设置为大于 0 且小于或等于 64 的值。此范围支持灵活的测试。epsilon 值越小,隐私保护程度越高。我们建议您先从 epsilon=10 开始。

实验建议

我们建议您执行以下操作: - 从 epsilon = 10 开始。 - 如果这会导致明显的实用性问题,请逐步增加 epsilon。 - 分享您在数据易用性方面可能发现的具体拐点的反馈。

互动和分享反馈

您可以参与试用并试用此 API

后续步骤