تعرَّف على كيفية التعامل مع التشويش في تقاريرك القابلة للتجميع وكيفية احتسابه وتقليل تأثيره.
قبل البدء
قبل المتابعة، للحصول على فهم معمّق لماهية التشويش وتأثيره، يُرجى الرجوع إلى مقالة فهم التشويش في التقارير الموجزة.
عناصر التحكّم في التشويش
على الرغم من أنّه لا يمكنك التحكّم بشكلٍ مباشر في التشويش المضاف إلى تقاريرك القابلة للتجميع، يمكنك اتّخاذ خطوات للحد من تأثيره. توضّح الأقسام التالية هذه الاستراتيجيات.
زيادة مقدار المساهمة
كما هو موضّح في مقالة "فهم التشويش"، يستند التشويش المطبَّق على قيمة الملخّص لكل مفتاح إلى المقياس من 0 إلى 65,536 (من 0 إلى CONTRIBUTION_BUDGET).
لذلك، ولزيادة نسبة الإشارة إلى التشويش، عليك زيادة كل قيمة قبل ضبطها كقيمة قابلة للتجميع، وذلك عبر ضربها في عامل محدّد يُعرف بعامل القياس، مع الحرص على بقائها ضمن حدود مقدار المساهمة.
حساب عامل قياس
يمثّل عامل القياس مقدار القياس الذي تريد تطبيقه على قيمة معيّنة قابلة للتجميع. يجب أن تكون قيمته هي مقدار المساهمة مقسومًا على الحد الأقصى للقيمة القابلة للتجميع لمفتاح معيّن.
على سبيل المثال، لنفترض أنّ المعلِنين يريدون معرفة إجمالي قيمة الشراء. تعرف أنّ الحد الأقصى لقيمة الشراء المتوقّعة لأي عملية شراء فردية هو 2,000 دولار أمريكي، باستثناء بعض القيم الشاذة التي قرّرت تجاهلها:
- احتساب عامل القياس:
- لزيادة نسبة الإشارة إلى التشويش، عليك ضبط هذه القيمة على 65,536 (مقدار المساهمة).
- ويؤدي ذلك إلى عامل قياس يبلغ 65,536 / 2,000، أي 32x تقريبًا. في الواقع، يمكنك تقريب هذا العامل للأعلى أو للأسفل.
- زيادة قيمك قبل التجميع: مقابل كل دولار أمريكي واحد يتم إنفاقه، يجب زيادة المقياس الذي يتم تتبُّعه بمقدار 32. على سبيل المثال، لعملية شراء بقيمة 120 دولار أمريكي، اضبط قيمة قابلة للتجميع تبلغ 120*32 = 3,840.
- تقليل قيمك بعد التجميع: بعد تلقّي التقرير الموجز الذي يتضمّن قيمة الشراء المجمّعة على مستوى عدّة مستخدمين، قلِّل قيمة التقرير الموجز باستخدام عامل القياس الذي استخدمته قبل التجميع. في مثالنا، استخدمنا عامل قياس بمقدار 32 قبل التجميع، لذا علينا قسمة القيمة الموجزة المستلَمة في التقرير الموجز على 32. لذلك، إذا كانت قيمة الشراء الموجزة لمفتاح معيّن في التقرير الموجز هي 76,800، تكون قيمة الشراء الموجزة (مع التشويش) هي 76,800/32 = 2,400 دولار أمريكي.
تقسيم مقدار المساهمة
إذا كانت لديك عدة أهداف قياس، مثل عدد عمليات الشراء وقيمة عمليات الشراء، يمكنك تقسيم مقدار المساهمة على هذه الأهداف.
في هذه الحالة، ستختلف عوامل القياس للقيم القابلة للتجميع المختلفة، وذلك حسب الحدّ الأقصى المتوقّع لقيمة قابلة للتجميع معيّنة.
يمكنك الاطّلاع على التفاصيل في مقالة فهم مفاتيح التجميع.
على سبيل المثال، لنفترض أنّك تتتبّع عدد عمليات الشراء وقيمة عمليات الشراء، وأنّك قرّرت تخصيص مقدار المساهمة بالتساوي.
يمكن تخصيص 32,768 معرّفًا لكل نوع قياس ولكل مصدر.
- عدد عمليات الشراء:
- أنت تتتبّع عملية شراء واحدة فقط، لذا فإنّ الحد الأقصى لعدد عمليات الشراء لإحالة ناجحة معيّنة هو 1.
- لذلك، قرّرت ضبط عامل القياس لعدد عمليات الشراء على 32,768 / 1 = 32,768.
- قيمة الشراء:
- لنفترض أنّ الحدّ الأقصى لقيمة الشراء المتوقّعة لأي عملية شراء فردية هو 2,000 دولار أمريكي.
- لذلك، قرّرت ضبط عامل القياس لقيمة الشراء على 32,768 / 2,000 = 16.384 أو 16 تقريبًا.
تعمل مفاتيح التجميع الأقل دقة على تحسين نسبة الإشارة إلى التشويش.
بما أنّ المفاتيح المجزّأة تجمع أحداث إحالات ناجحة أكثر من المفاتيح الدقيقة، تؤدي المفاتيح المجزّأة بشكل عام إلى قيم ملخّصة أعلى.
تتأثر قيم الملخّص الأعلى بالتشويش بشكل أقل من القيم الأدنى، ومن المرجّح أن يكون التشويش على هذه القيم أقل مقارنةً بهذه القيمة.
من المرجّح أن تكون القيم التي يتم جمعها باستخدام مفاتيح أكثر دقة أقل تشويشًا نسبيًا من القيم التي يتم جمعها باستخدام مفاتيح أكثر تفصيلاً.
مثال
مع ثبات جميع العوامل الأخرى، سيؤدي المفتاح الذي يتتبع قيمة الشراء على المستوى العالمي (أي المجموع عبر جميع البلدان) إلى قيمة شراء إجمالية أعلى، وكذلك إلى عدد إجمالي أكبر من الإحالات الناجحة، مقارنةً بالمفتاح الذي يتتبع الإحالات الناجحة على مستوى البلد.
وبالتالي، سيكون التشويش النسبي على القيمة الإجمالية للشراء في بلد معيّن أعلى من التشويش النسبي على القيمة الإجمالية للشراء في جميع البلدان.
وبالمثل، مع ثبات كل العوامل الأخرى، تكون القيمة الإجمالية لعمليات شراء الأحذية أقل من القيمة الإجمالية لعمليات شراء جميع السلع (بما في ذلك الأحذية).
لذلك، سيكون التشويش النسبي على القيمة الإجمالية لعمليات شراء الأحذية أعلى من التشويش النسبي على القيمة الإجمالية لعمليات شراء جميع السلع.
يؤدي جمع القيم الموجزة (عمليات التجميع) إلى جمع التشويش أيضًا
من خلال جمع قيم الملخّص من التقارير الملخّصة للوصول إلى بيانات بمستوى أعلى، يمكنك أيضًا جمع التشويش الناتج من هذه القيم الملخّصة.
لنطّلع على أسلوبَين مختلفَين:
- الطريقة (أ): يمكنك تضمين معرّف جغرافي في مفاتيحك. تعرض تقارير الملخّص مفاتيح على مستوى المعرّف الجغرافي، ويرتبط كلّ منها بقيمة الشراء الملخّصة على مستوى معرّف جغرافي معيّن.
- الطريقة (ب): لا يتم تضمين معرّف الموقع الجغرافي في مفاتيحك. تعرض تقارير الملخّص مباشرةً قيمة الشراء الملخّصة لجميع أرقام التعريف الجغرافية / المواقع الجغرافية.
للوصول إلى قيمة الشراء على مستوى البلد، اتّبِع الخطوات التالية:
- باستخدام الطريقة (أ)، يمكنك جمع قيم الملخّص على مستوى المعرّف الجغرافي، وبالتالي جمع التشويش أيضًا. من المرجّح أن يؤدي ذلك إلى إضافة المزيد من التشويش إلى قيمة الشراء النهائية على مستوى المعرّف الجغرافي.
- باستخدام الطريقة (ب)، يمكنك الاطّلاع مباشرةً على البيانات المعروضة في التقارير الموجزة. تمت إضافة التشويش مرة واحدة فقط إلى هذه البيانات.
لذلك، من المرجّح أن تكون قيمة الشراء الموجزة لمعرّف جغرافي معيّن أكثر تشويشًا باستخدام الطريقة (أ).
وبالمثل، من المرجّح أن يؤدي تضمين سمة على مستوى الرمز البريدي في مفاتيحك إلى نتائج أكثر تشويشًا من استخدام مفاتيح أكثر دقة مع سمة على مستوى المنطقة.
تؤدي عملية التجميع على مدى فترات زمنية أطول إلى زيادة نسبة الإشارة إلى التشويش.
يعني طلب التقارير الموجزة بشكل أقل تكرارًا أنّه من المرجّح أن تكون قيمة كل ملخّص أعلى ممّا لو طلبت التقارير بشكل أكثر تكرارًا، ومن المرجّح أن تحدث المزيد من الإحالات الناجحة في فترات زمنية أطول.
كما ذكرنا سابقًا، كلما زادت قيمة الملخّص، قلّت نسبة التشويش النسبي. لذلك، يؤدي طلب التقارير الموجزة بشكل أقل تكرارًا إلى الحصول على نسبة إشارة إلى تشويش أعلى (أفضل).
في ما يلي مثال توضيحي:
- إذا كنت تطلب تقارير موجزة كل ساعة على مدار 24 ساعة ثم تجمع قيمة الملخّص من كل تقرير كل ساعة للوصول إلى البيانات على مستوى اليوم، تتم إضافة التشويش 24 مرة.
- في تقرير الملخّص اليومي الواحد، تتم إضافة التشويش مرة واحدة فقط.
قيمة إبسيلون أعلى، تشويش أقل
كلما زادت قيمة إبسيلون، قلّ التشويش وقلّت حماية الخصوصية.
الاستفادة من الفلترة وإزالة التكرار
من الأجزاء المهمة في تخصيص الميزانية بين المفاتيح المختلفة فهم عدد المرات التي يمكن أن يحدث فيها حدث معيّن. على سبيل المثال، قد يهتمّ المعلِن بعملية شراء واحدة فقط لكل نقرة، ولكن قد يهتمّ بما يصل إلى 3 إحالات ناجحة من نوع "مشاهدة صفحة المنتج". لدعم حالات الاستخدام هذه، يمكنك أيضًا استخدام ميزات واجهة برمجة التطبيقات التالية التي تتيح لك التحكّم في عدد التقارير التي يتم إنشاؤها والإحالات الناجحة التي يتم احتسابها:
- التصفية: مزيد من المعلومات حول الفلترة
- إزالة التكرار مزيد من المعلومات حول إزالة التكرار
تجربة قيمة إبسيلون
يمكن لشركات تكنولوجيا الإعلان ضبط قيمة إبسيلون على قيمة أكبر من 0 وحتى 64 ضِمنًا. يتيح هذا النطاق إجراء اختبارات مرنة. توفّر القيم المنخفضة لإبسيلون حماية أكبر للخصوصية. ننصحك بالبدء بقيمة epsilon=10.
اقتراحات لتجربتها
ننصحك بما يلي:
- ابدأ بقيمة epsilon تساوي 10.
- في حال تسبّب ذلك في مشاكل ملحوظة في الأداء، يمكنك زيادة قيمة إبسيلون بشكل تدريجي.
- شارِك ملاحظاتك حول نقاط الانعطاف المحدّدة التي قد تجدها في ما يتعلّق بقابلية استخدام البيانات.
التفاعل مع الملاحظات ومشاركتها
يمكنك المشاركة في هذه الواجهة وتجربتها.
- يمكنك الاطّلاع على التقارير القابلة للتجميع وخدمة تجميع البيانات وطرح الأسئلة واقتراح الملاحظات.
- اطّلِع على أدلّة "تقارير تحديد المصدر".
الخطوات التالية
- لمزيد من المعلومات عن العوامل التي تؤثر في إعداد التقارير، مثل متغيّرات الحملة وتكرار التجميع ومستوى تفصيل السمة، يمكنك الاطّلاع على التجربة مع قرارات تصميم التقارير الموجزة .
- جرِّب مختبر التشويش.