التعامل مع التشويش

تعرَّف على كيفية التعامل مع التشويش في تقاريرك القابلة للتجميع وكيفية احتسابه وتقليل تأثيره.

قبل البدء

قبل المتابعة، للحصول على فهم معمّق لماهية التشويش وتأثيره، يُرجى الرجوع إلى مقالة فهم التشويش في التقارير الموجزة.

عناصر التحكّم في الضوضاء

على الرغم من أنّه لا يمكنك التحكّم بشكل مباشر في التشويش المُضاف إلى تقاريرك القابلة للتجميع، يمكنك اتّخاذ خطوات لتقليل التأثيرات. توضّح الأقسام التالية هذه الاستراتيجيات.

زيادة الميزانية المخصّصة للمساهمة

كما هو موضّح في مقالة "فهم التشويش"، يستند التشويش المطبَّق على قيمة الملخّص لكل مفتاح إلى المقياس من 0 إلى 65,536 (من 0 إلى CONTRIBUTION_BUDGET).

يعتمد توزيع الضوضاء على الميزانية.
يستند توزيع الضوضاء إلى الميزانية.

لهذا السبب، ولتحقيق الحدّ الأقصى من الإشارة مقارنةً بالتشويش، عليك زيادة كل قيمة قبل ضبطها كقيمة قابلة للتجميع، أي ضرب كل قيمة في عامل معيّن، وهو عامل القياس، مع التأكّد من أنّها تظل ضمن ميزانية المساهمة.

الضوضاء النسبية مع زيادة النسبة المئوية وبدونها
الضوضاء النسبية مع زيادة بنسبة مئوية معينة وبدونها

حساب عامل قياس

يمثّل عامل القياس مقدار القياس الذي تريد تطبيقه على قيمة قابلة للتجميع معيّنة. يجب أن تكون قيمته هي ميزانية المساهمة مقسومة على الحد الأقصى للقيمة القابلة للتجميع لمفتاح معيّن.

تحديد عامل القياس استنادًا إلى ميزانية المساهمة
تحديد عامل القياس استنادًا إلى ميزانية المساهمة:

على سبيل المثال، لنفترض أنّ المعلِنين يريدون معرفة إجمالي قيمة الشراء. تعرف أنّ الحد الأقصى لقيمة الشراء المتوقّعة لأي عملية شراء فردية هو 2,000 دولار أمريكي، باستثناء بعض القيم الشاذة التي قرّرت تجاهلها:

  • احتساب عامل القياس:
    • لتحقيق الحدّ الأقصى من نسبة الإشارة إلى الضوضاء، عليك قياس هذه القيمة إلى 65,536 (ميزانية المساهمة).
    • ويؤدي ذلك إلى عامل قياس يبلغ 65,536 / 2,000، أي 32x تقريبًا. في الواقع، يمكنك تقريب هذا العامل للأعلى أو للأسفل.
  • زيادة قيمك قبل التجميع: مقابل كل دولار أمريكي واحد يتم إنفاقه، يجب زيادة المقياس الذي يتم تتبُّعه بمقدار 32. على سبيل المثال، لعملية شراء بقيمة 120 دولار أمريكي، اضبط قيمة قابلة للتجميع تبلغ 120*32 = 3,840.
  • تقليل قيمك بعد التجميع: بعد تلقّي التقرير الموجز الذي يتضمّن قيمة الشراء المجمّعة على مستوى عدّة مستخدمين، قلِّل قيمة التقرير الموجز باستخدام عامل القياس الذي استخدمته قبل التجميع. في مثالنا، استخدمنا عامل قياس بمقدار 32 قبل التجميع، لذا علينا قسمة القيمة الموجزة المستلَمة في التقرير الموجز على 32. لذلك، إذا كانت قيمة الشراء الموجزة لمفتاح معيّن في التقرير الموجز هي 76,800، تكون قيمة الشراء الموجزة (مع التشويش) هي 76,800/32 = 2,400 دولار أمريكي.

تقسيم ميزانيتك

إذا كانت لديك عدة أهداف قياس، مثل عدد عمليات الشراء وقيمة عمليات الشراء، يمكنك تقسيم ميزانيتك على هذه الأهداف.

في هذه الحالة، ستختلف عوامل القياس للقيم القابلة للتجميع المختلفة، وذلك حسب الحدّ الأقصى المتوقّع لقيمة قابلة للتجميع معيّنة.

يمكنك الاطّلاع على التفاصيل في مقالة فهم مفاتيح التجميع.

على سبيل المثال، لنفترض أنّك تتتبّع عدد عمليات الشراء وقيمة عمليات الشراء، وأنّك قرّرت تخصيص ميزانيتك بالتساوي.

يمكن تخصيص 32,768 معرّفًا لكل نوع قياس ولكل مصدر.

  • عدد عمليات الشراء:
    • أنت تتتبّع عملية شراء واحدة فقط، لذا فإنّ الحد الأقصى لعدد عمليات الشراء لإحالة ناجحة معيّنة هو 1.
    • لذلك، قرّرت ضبط عامل القياس لعدد عمليات الشراء على 32,768 / 1 = 32,768.
  • قيمة الشراء:
    • لنفترض أنّ الحدّ الأقصى لقيمة الشراء المتوقّعة لأي عملية شراء فردية هو 2,000 دولار أمريكي.
    • لذلك، قرّرت ضبط عامل القياس لقيمة الشراء على 32,768 / 2,000 = 16.384 أو 16 تقريبًا.

تعمل مفاتيح التجميع الأقل دقة على تحسين نسبة الإشارة إلى الضوضاء.

بما أنّ المفاتيح المجزّأة تجمع أحداث إحالات ناجحة أكثر من المفاتيح الدقيقة، تؤدي المفاتيح المجزّأة بشكل عام إلى قيم ملخّصة أعلى.

تتأثر قيم الملخّص الأعلى بالتشويش بشكل أقل من القيم الأدنى، ومن المرجّح أن يكون التشويش على هذه القيم أقل مقارنةً بهذه القيمة.

من المرجّح أن تكون القيم التي يتم جمعها باستخدام مفاتيح أكثر دقة أقل تشويشًا نسبيًا من القيم التي يتم جمعها باستخدام مفاتيح أكثر تفصيلاً.

مثال

مع ثبات كل العوامل الأخرى، سيؤدي المفتاح الذي يتتبّع قيمة الشراء على مستوى العالم (المجموع في جميع البلدان) إلى قيمة شراء إجمالية أعلى (وعدد إجمالي أعلى للإحالات الناجحة) من المفتاح الذي يتتبّع الإحالات الناجحة على مستوى البلد.

وبالتالي، سيكون التشويش النسبي على القيمة الإجمالية للشراء في بلد معيّن أعلى من التشويش النسبي على القيمة الإجمالية للشراء في جميع البلدان.

وبالمثل، مع ثبات كل العوامل الأخرى، تكون القيمة الإجمالية لعمليات شراء الأحذية أقل من القيمة الإجمالية لعمليات شراء جميع السلع (بما في ذلك الأحذية).

لذلك، سيكون التشويش النسبي على القيمة الإجمالية لعمليات شراء الأحذية أعلى من التشويش النسبي على القيمة الإجمالية لعمليات شراء جميع السلع.

تأثير التشويش باستخدام مفاتيح دقيقة مقابل مفاتيح غير دقيقة
تأثير التشويش باستخدام مفاتيح دقيقة مقابل مفاتيح غير دقيقة:

يؤدي جمع القيم الموجزة (عمليات التجميع) إلى جمع التشويش أيضًا

من خلال جمع قيم الملخّص من التقارير الملخّصة للوصول إلى بيانات أعلى مستوى، يمكنك أيضًا جمع التشويش من قيم الملخّص هذه.

درجة التشويش باستخدام مفاتيح دقيقة مع عمليات تجميع مقارنةً بالمفاتيح الخشنة بدون عمليات تجميع
درجة الضوضاء مع المفاتيح الدقيقة التي تتضمّن عمليات تجميع مقارنةً بالمفاتيح غير الدقيقة التي لا تتضمّن عمليات تجميع

لنطّلع على أسلوبَين مختلفَين:

  • الطريقة (أ): يمكنك تضمين معرّف جغرافي في مفاتيحك. تعرض تقارير الملخّص مفاتيح على مستوى المعرّف الجغرافي، ويرتبط كلّ منها بقيمة الشراء الملخّصة على مستوى معرّف جغرافي معيّن.
  • الطريقة (ب): لا يتم تضمين معرّف الموقع الجغرافي في مفاتيحك. تعرض تقارير الملخّص مباشرةً قيمة الشراء الملخّصة لجميع أرقام التعريف الجغرافية / المواقع الجغرافية.

للوصول إلى قيمة الشراء على مستوى البلد، اتّبِع الخطوات التالية:

  • باستخدام الطريقة (أ)، يمكنك جمع قيم الملخّص على مستوى المعرّف الجغرافي، وبالتالي جمع التشويش أيضًا. من المرجّح أن يؤدي ذلك إلى إضافة المزيد من التشويش إلى قيمة الشراء النهائية على مستوى المعرّف الجغرافي.
  • باستخدام الطريقة (ب)، يمكنك الاطّلاع مباشرةً على البيانات المعروضة في التقارير الموجزة. تمت إضافة التشويش مرة واحدة فقط إلى هذه البيانات.

لذلك، من المرجّح أن تكون قيمة الشراء الموجزة لمعرّف جغرافي معيّن أكثر تشويشًا باستخدام الطريقة (أ).

وبالمثل، من المرجّح أن يؤدي تضمين سمة على مستوى الرمز البريدي في مفاتيحك إلى نتائج أكثر تشويشًا من استخدام مفاتيح أكثر دقة مع سمة على مستوى المنطقة.

تؤدي عملية التجميع على مدى فترات زمنية أطول إلى زيادة نسبة الإشارة إلى الضجيج.

يعني طلب التقارير الموجزة بشكل أقل تكرارًا أنّه من المرجّح أن تكون قيمة كل ملخّص أعلى ممّا لو طلبت التقارير بشكل أكثر تكرارًا، ومن المرجّح أن تحدث المزيد من الإحالات الناجحة في فترات زمنية أطول.

كما ذكرنا سابقًا، كلما زادت قيمة الملخّص، قلّت نسبة التشويش النسبي. لذلك، يؤدي طلب التقارير الموجزة بشكل أقل تكرارًا إلى الحصول على نسبة إشارة إلى ضوضاء أعلى (أفضل).

يؤدي طلب تقارير الملخّص بشكل أقل تكرارًا إلى زيادة نسبة الإشارة إلى الضوضاء.
يؤدي طلب التقارير الموجزة بشكل أقل تكرارًا إلى زيادة نسبة الإشارة إلى الضوضاء.

في ما يلي مثال توضيحي:

  • إذا كنت تطلب تقارير موجزة كل ساعة على مدار 24 ساعة ثم تجمع قيمة الملخّص من كل تقرير كل ساعة للوصول إلى البيانات على مستوى اليوم، تتم إضافة التشويش 24 مرة.
  • في تقرير الملخّص اليومي الواحد، تتم إضافة الضوضاء مرة واحدة فقط.

قيمة إبسيلون أعلى، ضوضاء أقل

كلما زادت قيمة إبسيلون، قلّ التشويش وقلّت حماية الخصوصية.

الاستفادة من الفلترة وإزالة التكرار

من الأجزاء المهمة في تخصيص الميزانية بين المفاتيح المختلفة فهم عدد المرات التي يمكن أن يحدث فيها حدث معيّن. على سبيل المثال، قد يهتمّ المعلِن بعملية شراء واحدة فقط لكل نقرة، ولكن قد يهتمّ بما يصل إلى 3 إحالات ناجحة من نوع "مشاهدة صفحة المنتج". لدعم حالات الاستخدام هذه، يمكنك أيضًا استخدام ميزات واجهة برمجة التطبيقات التالية التي تتيح لك التحكّم في عدد التقارير التي يتم إنشاؤها والإحالات الناجحة التي يتم احتسابها:

تجربة قيمة إبسيلون

يمكن لشركات تكنولوجيا الإعلان ضبط قيمة إبسيلون على قيمة أكبر من 0 وحتى 64 ضِمنًا. يتيح هذا النطاق إجراء اختبارات مرنة. توفّر القيم المنخفضة لإبسيلون حماية أكبر للخصوصية. ننصحك بالبدء بقيمة epsilon=10.

اقتراحات لتجربتها

ننصحك بما يلي:

  • ابدأ بقيمة epsilon تساوي 10.
  • في حال تسبّب ذلك في مشاكل ملحوظة في الأداء، يمكنك زيادة قيمة إبسيلون بشكل تدريجي.
  • شارِك ملاحظاتك حول نقاط الانعطاف المحدّدة التي قد تجدها في ما يتعلّق بقابلية استخدام البيانات.

التفاعل مع الملاحظات ومشاركتها

يمكنك المشاركة في هذه الواجهة وتجربتها.

الخطوات التالية