تعرَّف على معنى التشويش ومكان إضافته وكيفية تأثيره في جهود القياس.
التقارير الموجَزة هي نتيجة تجميع التقارير القابلة للتجميع. عندما يجمع أحد أدوات الجمع التقارير القابلة للتجميع في حِزم وتعالجها "خدمة تجميع البيانات"، تتم إضافة تشويش، وهو كمية عشوائية من البيانات، إلى التقارير الموجَزة الناتجة. تتم إضافة تشويش لحماية خصوصية المستخدم. والهدف من هذه الآلية هو توفير إطار عمل يمكنه إتاحة قياس الخصوصية التفاضلية.
مقدمة حول التشويش في التقارير الموجزة
على الرغم من أنّ إضافة التشويش لا تشكّل عادةً جزءًا من قياس الإعلانات اليوم، لن يؤدي التشويش المُضاف في كثير من الحالات إلى تغيير كبير في طريقة تفسير نتائجك.
قد يساعدك التفكير في الأمر بالطريقة التالية: هل ستكون واثقًا من اتّخاذ قرار استنادًا إلى جزء معيّن من البيانات إذا لم تكن هذه البيانات مشوّشة؟
على سبيل المثال، هل سيكون المعلِن واثقًا من تغيير استراتيجية حملته أو ميزانياتها، استنادًا إلى أنّ "الحملة أ" حقّقت 15 إحالة ناجحة و"الحملة ب" حقّقت 16 إحالة ناجحة؟
إذا كانت الإجابة لا، يصبح التشويش غير ذي صلة.
عليك ضبط استخدام واجهة برمجة التطبيقات على النحو التالي:
- الإجابة عن السؤال هي نعم.
- تتم إدارة التشويش بطريقة لا تؤثّر بشكل كبير في قدرتك على اتّخاذ قرار استنادًا إلى بيانات معيّنة. يمكنك التعامل مع ذلك على النحو التالي: بالنسبة إلى الحدّ الأدنى المتوقّع لعدد الإحالات الناجحة، عليك إبقاء التشويش في المقياس الذي تمّ جمعه أقل من نسبة مئوية معيّنة.
في هذا القسم والقسم التالي، سنوضّح استراتيجيات لتحقيق النقطة 2.
المفاهيم الأساسية
تضيف خدمة التجميع تشويشًا مرة واحدة إلى كل قيمة موجزة، أي مرة واحدة لكل مفتاح، في كل مرة يتم فيها طلب تقرير موجز.
يتم اختيار قيم التشويش هذه عشوائيًا من توزيع احتمالي محدّد، على النحو التالي.
تعتمد جميع العناصر التي تؤثر في التشويش على مفهومَين أساسيَّين.
يكون توزيع التشويش (التفاصيل أدناه) هو نفسه بغض النظر عن القيمة الموجزة، سواء كانت منخفضة أو مرتفعة. لذلك، كلما زادت قيمة الملخّص، قلّ تأثير التشويش على هذه القيمة.
على سبيل المثال، لنفترض أنّ كلاً من إجمالي قيمة الشراء المجمّعة البالغ 20,000 دولار أمريكي وإجمالي قيمة الشراء المجمّعة البالغ 200 دولار أمريكي يخضعان للتشويش الذي تم اختياره من التوزيع نفسه.
لنفترض أنّ التشويش من هذا التوزيع يتراوح تقريبًا بين -100 و+100.
- بالنسبة إلى قيمة الشراء الموجزة البالغة 20,000 دولار أمريكي، تتراوح نسبة التشويش بين 0 و100/20,000=0.5%.
- بالنسبة إلى قيمة الشراء الموجزة البالغة 200 دولار أمريكي، تتراوح الضوضاء بين 0 و100/200=50%.
لذلك، من المحتمل أن يكون للتشويش تأثير أقل على قيمة الشراء المجمّعة البالغة 20,000 دولار أمريكي مقارنةً بالقيمة البالغة 200 دولار أمريكي. وبالمقارنة، من المرجّح أن يكون مبلغ 20,000 دولار أمريكي أقل تشويشًا، أي من المرجّح أن يكون لديه نسبة إشارة إلى ضوضاء أعلى.
تكون القيم المجمّعة الأعلى أقل تأثّرًا بالتشويش. ولهذا الأمر بعض الآثار العملية المهمة التي تم توضيحها في القسم التالي. هذه الآلية هي جزء من تصميم واجهة برمجة التطبيقات، والآثار العملية طويلة الأمد. وستستمر في لعب دور مهم عندما تصمّم تكنولوجيات الإعلان وتقيّم استراتيجيات تجميع مختلفة.
على الرغم من أنّ الضوضاء يتم استخلاصها من التوزيع نفسه بغض النظر عن قيمة الملخّص، يعتمد هذا التوزيع على عدّة مَعلمات. يمكن أن تعدّل تكنولوجيات الإعلان إحدى هذه المَعلمات، وهي إبسيلون، أثناء التجربة الأصلية المنتهية لتقييم التعديلات المختلفة على الفائدة/الخصوصية. ومع ذلك، يجب اعتبار إمكانية تعديل إبسيلون مؤقتة. نرحّب بملاحظاتك حول حالات الاستخدام وقيم إبسيلون التي تعمل بشكل جيد.
على الرغم من أنّ شركة تكنولوجيا الإعلان لا تتحكّم بشكل مباشر في طرق إضافة التشويش، يمكنها التأثير في تأثير التشويش على بيانات القياس. في الأقسام التالية، سنتعمّق في كيفية التأثير في التشويش عمليًا.
قبل ذلك، دعونا نلقي نظرة فاحصة على طريقة تطبيق التشويش.
التكبير: كيفية تطبيق التشويش
توزيع واحد للضوضاء
يتم استخلاص الضوضاء من توزيع لابلاس، مع المَعلمات التالية:
- متوسط (
μ) يساوي 0 وهذا يعني أنّ قيمة التشويش الأكثر احتمالاً هي 0 (لم تتم إضافة أي تشويش)، وأنّ القيمة المشوّشة من المرجّح أن تكون أصغر من القيمة الأصلية بقدر ما من المرجّح أن تكون أكبر منها (يُطلق على ذلك أحيانًا اسم غير متحيز). - مَعلمة مقياس بقيمة
b = CONTRIBUTION_BUDGET/epsilon- يتم تحديد
CONTRIBUTION_BUDGETفي المتصفّح. - يتم استخدام
epsilonفي "خدمة تجميع البيانات".
- يتم تحديد
يوضّح الرسم البياني التالي دالة الكثافة الاحتمالية لتوزيع لابلاس مع μ=0 وb = 20:
قيم التشويش العشوائي، توزيع تشويش واحد
لنفترض أنّ إحدى تكنولوجيات الإعلان تطلب تقارير موجزة لمفتاحَي تجميع، وهما key1 وkey2.
تختار خدمة التجميع قيمتَي تشويش x1 وx2، باتّباع توزيع التشويش نفسه. تتم إضافة x1 إلى قيمة الملخّص للمفتاح 1، وتتم إضافة x2 إلى قيمة الملخّص للمفتاح 2.
في المخططات، سنمثّل قيم التشويش على أنّها متطابقة. هذا تبسيط، ففي الواقع، ستختلف قيم التشويش، لأنّها يتم اختيارها عشوائيًا من التوزيع.
يوضّح ذلك أنّ قيم التشويش كلها تأتي من التوزيع نفسه، وهي مستقلة عن قيمة الملخّص التي يتم تطبيقها عليها.
خصائص أخرى للضوضاء
يتم تطبيق التشويش على كل قيمة موجزة، بما في ذلك القيم الفارغة (0).
على سبيل المثال، حتى إذا كانت قيمة الملخّص الفعلية لمفتاح معيّن هي 0، فإنّ قيمة الملخّص التي تتضمّن تشويشًا والتي ستظهر لك في تقرير الملخّص لهذا المفتاح لن تكون 0 (على الأرجح).
يمكن أن تكون الضوضاء رقمًا موجبًا أو سالبًا.
على سبيل المثال، إذا كان مبلغ الشراء قبل إضافة التشويش 327,000، قد يكون التشويش +6,000 أو -6,000 (هذه قيم عشوائية).
تقييم الضوضاء
حساب الانحراف المعياري للضوضاء
الانحراف المعياري للضوضاء هو:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
مثال
عندما تكون قيمة إبسيلون = 10، يكون الانحراف المعياري للضوضاء كما يلي:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
تقييم الحالات التي تكون فيها الاختلافات في القياس مهمة
بما أنّك ستعرف الانحراف المعياري للتشويش المضاف إلى كل قيمة ناتجة عن خدمة التجميع، يمكنك تحديد الحدود المناسبة للمقارنة لتحديد ما إذا كانت الاختلافات الملحوظة قد تكون بسبب التشويش.
على سبيل المثال، إذا كانت الضوضاء المضافة إلى قيمة معيّنة تبلغ +/- 10 تقريبًا (مع مراعاة القياس)، وكان الفرق في القيمة بين حملتَين يزيد عن 100، من المحتمل أن يكون من الآمن الاستنتاج أنّ الفرق في القيمة المقاسة بين كل حملة لا يرجع إلى الضوضاء وحدها.
التفاعل مع الملاحظات ومشاركتها
يمكنك المشاركة في هذه الواجهة وتجربتها.
- يمكنك الاطّلاع على التقارير القابلة للتجميع وخدمة تجميع البيانات وطرح الأسئلة واقتراح الملاحظات.
- اطّلِع على أدلّة "تقارير تحديد المصدر".
الخطوات التالية
- للاطّلاع على المتغيّرات التي يمكنك التحكّم فيها لتحسين نسبة الإشارة إلى التشويش، يُرجى الرجوع إلى التعامل مع التشويش.
- راجِع التجربة مع قرارات تصميم تقرير الملخّص للحصول على مساعدة في التخطيط لاستراتيجيات إعداد تقارير التجميع.
- جرِّب مختبر الضوضاء.