لمحة عن هذا المستند
من خلال قراءة هذا المستند، ستتمكّن من:
- التعرّف على الاستراتيجيات التي يجب إنشاؤها قبل إنشاء تقارير الملخّصات
- التعرّف على مختبر الضوضاء، وهي أداة تساعد في فهم تأثيرات مَعلمات الضوضاء المختلفة، وتتيح استكشاف وتقييم استراتيجيات إدارة الضوضاء المختلفة بسرعة
مشاركة ملاحظاتك
على الرغم من أنّ هذا المستند يلخّص بعض المبادئ للعمل مع التقارير الموجزة، إلا أنّ هناك طرقًا متعددة لإدارة التشويش قد لا تظهر هنا. نرحّب باقتراحاتك وإضافاتك وأسئلتك.
- لتقديم ملاحظات عامة حول استراتيجيات إدارة التشويش، أو حول فائدة واجهة برمجة التطبيقات أو خصوصيتها (إبسيلون)، ولمشاركة ملاحظاتك عند محاكاة التشويش باستخدام Noise Lab، يُرجى التعليق على هذه المشكلة.
- لتقديم ملاحظات عامة حول جانب آخر من واجهة برمجة التطبيقات: إنشاء بطاقة مشكلة جديدة هنا
قبل البدء
- يمكنك الاطّلاع على Attribution Reporting: التقارير الموجزة ونظرة عامة على نظام Attribution Reporting الكامل للحصول على مقدّمة.
- اطّلِع على فهم التشويش وفهم مفاتيح التجميع للاستفادة إلى أقصى حدّ من هذا الدليل.
قرارات التصميم
مبدأ التصميم الأساسي
هناك اختلافات أساسية بين طريقة عمل ملفات تعريف الارتباط التابعة لجهات خارجية والتقارير الموجزة. أحد الاختلافات الرئيسية هو التشويش الذي تتم إضافته إلى بيانات القياس في التقارير الموجزة. أما الأمر الآخر، فهو كيفية جدولة التقارير.
للوصول إلى بيانات قياس التقارير الموجزة التي تتضمّن نسب إشارة إلى ضوضاء أعلى، على منصات عرض الطلب (DSP) ومزوّدي خدمة قياس الإعلانات العمل مع المعلِنين لوضع استراتيجيات لإدارة الضوضاء. لوضع هذه الاستراتيجيات، على منصّات العرض من جهة الطلب ومقدّمي خدمات القياس اتّخاذ قرارات بشأن التصميم. تتمحور هذه القرارات حول مفهوم أساسي واحد:
مع أنّ قيم التشويش في التوزيع يتم استخلاصها، من الناحية المطلقة، من مَعلمتَين فقط، وهما إبسيلون وميزانية المساهمة، تتوفّر لك عدة عناصر تحكّم أخرى ستؤثّر في نسبة الإشارة إلى التشويش لبيانات القياس الناتجة.
مع أنّنا نتوقّع أن تؤدي العملية التكرارية إلى اتّخاذ أفضل القرارات، سيؤدي كل اختلاف في هذه القرارات إلى تنفيذ مختلف قليلاً، وبالتالي يجب اتّخاذ هذه القرارات قبل كتابة كل تكرار للرمز (وقبل عرض الإعلانات).
القرار: مستوى دقة السمة
تجربة الميزة في Noise Lab
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن "بيانات الإحالات الناجحة".
- لاحظ المَعلمات التلقائية. بشكلٍ تلقائي، يبلغ إجمالي عدد الإحالات الناجحة اليومية التي يمكن تحديد مصدرها 1, 000. ويبلغ متوسط هذا العدد 40 تقريبًا لكل مجموعة إذا كنت تستخدم الإعداد التلقائي (السمات التلقائية، والعدد التلقائي للقيم المختلفة المحتملة لكل سمة، والاستراتيجية الرئيسية A). لاحظ أنّ القيمة هي 40 في عدد الإحالات الناجحة المنسوبة اليومية المتوسطة لكل مجموعة.
- انقر على "محاكاة" لتشغيل محاكاة باستخدام المَعلمات التلقائية.
- في اللوحة الجانبية "المَعلمات"، ابحث عن "السمات". أعِد تسمية الجغرافيا إلى المدينة وغيِّر عدد القيم المختلفة المحتملة إلى 50.
- لاحظ كيف يؤدي ذلك إلى تغيير عدد الإحالات الناجحة التي يمكن تحديد مصدرها يوميًا لكل مجموعة. وقد انخفضت الآن بشكل كبير. ويرجع ذلك إلى أنّه في حال زيادة عدد القيم المحتملة ضمن هذا السمة بدون تغيير أي شيء آخر، ستزيد إجمالي عدد التصنيفات بدون تغيير عدد أحداث الإحالات الناجحة التي سيتم إدراجها في كل تصنيف.
- انقر على "محاكاة".
- لاحظ نسب التشويش في المحاكاة الناتجة: نسب التشويش أعلى الآن من المحاكاة السابقة.
بالنظر إلى مبدأ التصميم الأساسي، من المرجّح أن تكون قيم الملخّصات الصغيرة أكثر تشويشًا من قيم الملخّصات الكبيرة. لذلك، يؤثّر اختيارك للإعدادات في عدد أحداث الإحالات الناجحة المحدّدة المصدر التي تنتهي في كل مجموعة (المعروفة أيضًا باسم مفتاح التجميع)، ويؤثّر هذا العدد في التشويش في التقارير الموجزة للنتائج النهائية.
أحد قرارات التصميم التي تؤثر في عدد أحداث الإحالات الناجحة المنسوبة ضمن مجموعة واحدة هو دقة السمة. في ما يلي أمثلة على مفاتيح التجميع وسماتها:
- الطريقة 1: بنية مفتاح واحدة ذات أبعاد تقريبية: البلد x الحملة الإعلانية (أو أكبر مجموعة من الحملات) x نوع المنتج (من بين 10 أنواع منتجات محتملة)
- الأسلوب 2: بنية مفتاح واحدة تتضمّن سمات دقيقة: المدينة × معرّف التصميم × المنتج (من أصل 100 منتج محتمل)
المدينة هي سمة أكثر تفصيلاً من البلد، ومعرّف تصميم الإعلان هو سمة أكثر تفصيلاً من الحملة، والمنتج هو سمة أكثر تفصيلاً من نوع المنتج. وبالتالي، سيحتوي النهج 2 على عدد أقل من الأحداث (الإحالات الناجحة) لكل مجموعة (أي لكل مفتاح) في ناتج التقرير الموجز مقارنةً بالنهج 1. بما أنّ التشويش المضاف إلى الناتج مستقل عن عدد الأحداث في المجموعة، ستكون بيانات القياس في التقارير الموجزة أكثر تشويشًا باستخدام "الطريقة 2". بالنسبة إلى كل معلِن، جرِّب مقايضات مختلفة بين مستوى التفصيل والخصوصية في تصميم المفتاح من أجل تحقيق أقصى فائدة من النتائج.
القرار: البُنى الأساسية
تجربة الميزة في Noise Lab
في "الوضع البسيط"، يتم استخدام بنية المفتاح التلقائية. في الوضع المتقدّم، يمكنك تجربة بنى مفاتيح مختلفة. يتم تضمين بعض الأمثلة على السمات، ويمكنك أيضًا تعديلها.
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن "الاستراتيجية الرئيسية". لاحظ أنّ الاستراتيجية التلقائية، التي تحمل الاسم A في الأداة، تستخدم بنية مفتاح دقيقًا واحدًا يتضمّن جميع السمات: الموقع الجغرافي × رقم تعريف الحملة × فئة المنتج.
- انقر على "محاكاة".
- راقِب نسب التشويش في المحاكاة الناتجة.
- غيِّر الاستراتيجية الرئيسية إلى B. تعرض هذه السمة عناصر تحكّم إضافية لتتمكّن من ضبط بنية المفتاح.
- اضبط بنية المفتاح على النحو التالي مثلاً:
- عدد البُنى الأساسية: 2
- البنية الأساسية 1 = الموقع الجغرافي × فئة المنتج
- بنية المفتاح 2 = رقم تعريف الحملة × فئة المنتج
- انقر على "محاكاة".
- لاحظ أنّك تتلقّى الآن تقريرَين موجزَين لكل نوع من أنواع أهداف القياس (تقريرَين لعدد عمليات الشراء، وتقريرَين لقيمة عمليات الشراء)، وذلك لأنّك تستخدم بنيتَين مختلفتَين للمفاتيح. مراقبة نسب التشويش
- يمكنك أيضًا تجربة ذلك باستخدام سماتك المخصّصة. لإجراء ذلك، ابحث عن البيانات التي تريد تتبُّعها: السمات. ننصحك بإزالة سمات المثال وإنشاء سماتك الخاصة باستخدام أزرار "إضافة" أو "إزالة" أو "إعادة الضبط" أسفل آخر سمة.
هناك قرار تصميم آخر سيؤثر في عدد أحداث الإحالات الناجحة المنسوبة ضمن مجموعة واحدة، وهو البُنى الأساسية التي تقرّر استخدامها. في ما يلي أمثلة على مفاتيح التجميع:
- بنية أساسية واحدة تتضمّن جميع السمات، لنسمّيها "الاستراتيجية الأساسية أ".
- بنيتان رئيسيتان، لكلّ منهما مجموعة فرعية من السمات، لنسمِّ هذه البنية "الاستراتيجية الرئيسية ب".
الاستراتيجية (أ) أبسط، ولكن قد تحتاج إلى تجميع (جمع) قيم الملخّص غير الواضحة المُضمّنة في تقارير الملخّص للوصول إلى إحصاءات معيّنة. ومن خلال جمع هذه القيم، يتم أيضًا جمع التشويش. باستخدام "الاستراتيجية ب"، قد تمنحك القيم الموجزة المعروضة في التقارير الموجزة المعلومات التي تحتاج إليها. وهذا يعني أنّ الاستراتيجية "ب" ستؤدي على الأرجح إلى نسب إشارة إلى ضوضاء أفضل من الاستراتيجية "أ". ومع ذلك، قد يكون مستوى التشويش مقبولاً في "الاستراتيجية أ"، لذا قد تختار الاستمرار في استخدامها لسهولتها. مزيد من المعلومات في المثال التفصيلي الذي يوضّح هاتين الاستراتيجيتَين
إدارة المفاتيح موضوع معقّد. يمكن استخدام عدد من الأساليب المعقّدة لتحسين نسب الإشارة إلى الضوضاء. يتم توضيح أحدها في مقالة الإدارة المتقدّمة للمفاتيح.
القرار: عدد مرات التجميع
تجربة الميزة في Noise Lab
- انتقِل إلى "الوضع البسيط" (أو "الوضع المتقدّم"، فكلا الوضعين يعملان بالطريقة نفسها عندما يتعلّق الأمر بتكرار التجميع على دفعات)
- في اللوحة الجانبية "المَعلمات"، ابحث عن "استراتيجية التجميع" > "معدّل تكرار التجميع". يشير ذلك إلى معدّل تجميع التقارير القابلة للتجميع التي تتم معالجتها باستخدام خدمة تجميع البيانات في مهمة واحدة.
- لاحظ معدّل التجميع التلقائي: يتم تلقائيًا محاكاة معدّل تجميع يومي.
- انقر على "محاكاة".
- راقِب نسب التشويش في المحاكاة الناتجة.
- غيِّر معدّل تكرار التجميع إلى أسبوعي.
- لاحظ نسب التشويش في المحاكاة الناتجة: نسب التشويش أصبحت الآن أقل (أفضل) من المحاكاة السابقة.
هناك قرار تصميم آخر سيؤثر في عدد أحداث الإحالات الناجحة المنسوبة ضمن مجموعة واحدة، وهو معدّل تكرار التجميع الذي تقرّر استخدامه. معدّل تكرار تجميع البيانات هو عدد المرات التي تتم فيها معالجة التقارير القابلة للتجميع.
سيتضمّن التقرير الذي تمّت جدولة تجميع بياناته بشكل متكرّر أكثر (مثل كل ساعة) عددًا أقل من أحداث الإحالات الناجحة مقارنةً بالتقرير نفسه الذي تمّت جدولة تجميع بياناته بشكل أقل تكرارًا (مثل كل أسبوع). نتيجةً لذلك، سيتضمّن التقرير كل ساعة المزيد من البيانات غير الدقيقة، وسيتضمّن عددًا أقل من أحداث الإحالات الناجحة مقارنةً بالتقرير نفسه الذي يتضمّن جدول تجميع أقل تكرارًا (مثل كل أسبوع). نتيجةً لذلك، سيحتوي التقرير كل ساعة على نسبة إشارة إلى ضوضاء أقل من التقرير الأسبوعي، مع تساوي جميع العوامل الأخرى. جرِّب متطلبات إعداد التقارير بمعدّلات تكرار مختلفة، وقيِّم نسب الإشارة إلى الضوضاء لكلّ منها.
يمكنك الاطّلاع على مزيد من المعلومات في مقالتَي تجميع البيانات وتجميع البيانات على مدى فترات زمنية أطول.
القرار: متغيّرات الحملة التي تؤثّر في الإحالات الناجحة المنسوبة
تجربة الميزة في Noise Lab
على الرغم من صعوبة توقّع ذلك وإمكانية حدوث اختلافات كبيرة بالإضافة إلى التأثيرات الموسمية، حاوِل تقدير عدد الإحالات الناجحة اليومية التي يمكن تحديد مصدرها بنقرة واحدة، وذلك لأقرب قوة من قوى العدد 10: 10 أو 100 أو 1,000 أو 10,000.
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن "بيانات الإحالات الناجحة".
- لاحظ المَعلمات التلقائية. بشكلٍ تلقائي، يبلغ إجمالي عدد الإحالات الناجحة اليومية التي يمكن تحديد مصدرها 1, 000. ويبلغ متوسط هذا العدد 40 تقريبًا لكل مجموعة إذا كنت تستخدم الإعداد التلقائي (السمات التلقائية، والعدد التلقائي للقيم المختلفة المحتملة لكل سمة، والاستراتيجية الرئيسية A). لاحظ أنّ القيمة هي 40 في عدد الإحالات الناجحة المنسوبة اليومية المتوسطة لكل مجموعة.
- انقر على "محاكاة" لتشغيل محاكاة باستخدام المَعلمات التلقائية.
- راقِب نسب التشويش في المحاكاة الناتجة.
- الآن، اضبط إجمالي عدد الإحالات الناجحة اليومية المنسوبة إلى مصدر الإحالة على 100. لاحظ أنّ ذلك يؤدي إلى خفض قيمة عدد الإحالات الناجحة المنسوبة إلى كل مجموعة.
- انقر على "محاكاة".
- لاحظ أنّ نسب التشويش أصبحت الآن أعلى، وذلك لأنّه عند توفّر عدد أقل من الإحالات الناجحة لكل مجموعة، يتم تطبيق المزيد من التشويش للحفاظ على الخصوصية.
من المهم التمييز بين إجمالي عدد الإحالات الناجحة المحتملة لأحد المعلِنين وإجمالي عدد الإحالات الناجحة المحتملة المحدَّدة المصدر. وهذا الأخير هو ما يؤثّر في النهاية في التشويش في التقارير الموجزة. الإحالات الناجحة المنسوبة هي مجموعة فرعية من إجمالي الإحالات الناجحة المعرَّضة لمتغيرات الحملة، مثل ميزانية الإعلان واستهداف الإعلان. على سبيل المثال، من المتوقّع أن يكون عدد الإحالات الناجحة المنسوبة إلى حملة إعلانية بقيمة 10 ملايين دولار أمريكي أكبر من عدد الإحالات الناجحة المنسوبة إلى حملة إعلانية بقيمة 10 آلاف دولار أمريكي، مع تساوي جميع العوامل الأخرى.
أمور تجب مراعاتها:
- تقييم الإحالات الناجحة المنسوبة إلى مصدر معيّن استنادًا إلى نموذج إحالة بمصدر واحد وعلى الجهاز نفسه، لأنّ هذه الإحالات تندرج ضمن نطاق التقارير الموجزة التي يتم جمعها باستخدام Attribution Reporting API
- ضَع في اعتبارك عدد الإحالات الناجحة التي تم تحديد مصدرها في أسوأ سيناريو وأفضل سيناريو. على سبيل المثال، مع ثبات جميع العوامل الأخرى، ضع في اعتبارك الحدّ الأدنى والحدّ الأقصى لميزانيات الحملات المحتملة لأحد المعلِنين، ثمّ حدِّد الإحالات الناجحة التي يمكن تحديد مصدرها لكلتا النتيجتين كمدخلات في عملية المحاكاة.
- إذا كنت تفكّر في استخدام مبادرة حماية الخصوصية على Android، ضَع في اعتبارك الإحالات الناجحة التي تم تحديد مصدرها على عدّة منصات في عملية الاحتساب.
القرار: استخدام التحجيم
تجربة الميزة في Noise Lab
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن "استراتيجية التجميع" > "التوسيع". يتم ضبطه على "نعم" تلقائيًا.
- لفهم التأثيرات الإيجابية لتغيير الحجم على نسبة الإشارة إلى الضوضاء، اضبط أولاً خيار "تغيير الحجم" على "لا".
- انقر على "محاكاة".
- راقِب نسب التشويش في المحاكاة الناتجة.
- اضبط "تغيير الحجم" على "نعم". يُرجى العِلم أنّ "مختبر الضوضاء" يحسب تلقائيًا عوامل القياس التي سيتم استخدامها وفقًا للنطاقات (متوسط القيم وقيمها القصوى) الخاصة بأهداف القياس في السيناريو الخاص بك. في نظام حقيقي أو إعداد تجريبي من المصدر، عليك تنفيذ عملية حسابية خاصة بك لعوامل القياس.
- انقر على "محاكاة".
- لاحظ أنّ نسب التشويش أصبحت الآن أقل (أفضل) في عملية المحاكاة الثانية هذه. والسبب هو أنّك تستخدم ميزة تغيير الحجم.
بالنظر إلى مبدأ التصميم الأساسي، فإنّ الضوضاء المضافة هي دالة لميزانية المساهمة.
لذلك، لزيادة نسب الإشارة إلى الضوضاء، يمكنك اختيار تحويل القيم التي يتم جمعها أثناء حدث إحالة ناجحة من خلال توسيع نطاقها مقارنةً بميزانية المساهمة (وتصغير نطاقها بعد التجميع). استخدِم القياس لزيادة نسب الإشارة إلى الضوضاء.
القرار: عدد أهداف القياس وتقسيم ميزانية الخصوصية
يرتبط ذلك بميزة "تغيير الحجم"، لذا احرص على قراءة مقالة استخدام ميزة تغيير الحجم.
تجربة الميزة في Noise Lab
هدف القياس هو نقطة بيانات مميّزة يتم جمعها في أحداث الإحالات الناجحة.
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن البيانات التي تريد تتبُّعها: أهداف القياس: تلقائيًا، لديك هدفان للقياس، وهما قيمة الشراء وعدد عمليات الشراء.
- انقر على "محاكاة" لتنفيذ محاكاة باستخدام الأهداف التلقائية.
- انقر على "إزالة". سيؤدي ذلك إلى إزالة هدف القياس الأخير (عدد عمليات الشراء في هذه الحالة).
- انقر على "محاكاة".
- لاحظ أنّ نسب التشويش لقيمة الشراء أصبحت الآن أقل (أفضل) في عملية المحاكاة الثانية هذه. ويرجع ذلك إلى أنّ لديك عددًا أقل من أهداف القياس، وبالتالي يحصل هدف القياس الواحد الآن على كل ميزانية المساهمة.
- انقر على "إعادة الضبط". أصبح لديك الآن هدفان للقياس: قيمة الشراء وعدد عمليات الشراء. يُرجى العِلم أنّ "مختبر الضوضاء" يحسب تلقائيًا عوامل القياس التي سيتم استخدامها وفقًا للنطاقات (متوسط القيم وقيمها القصوى) لأهداف القياس في السيناريو الخاص بك. بشكل تلقائي، يقسّم Noise Lab الميزانية بالتساوي على أهداف القياس.
- انقر على "محاكاة".
- راقِب نسب التشويش في المحاكاة الناتجة. دوِّن عوامل القياس المعروضة في المحاكاة.
- لنخصّص الآن تقسيم ميزانية الخصوصية لتحقيق نسب أفضل بين الإشارة والضوضاء.
- عدِّل "نسبة الميزانية" المخصّصة لكل هدف قياس. بالنظر إلى المَعلمات التلقائية، يتضمّن هدف القياس 1، أي قيمة الشراء، نطاقًا أوسع بكثير (بين 0 و1000) من هدف القياس 2، أي عدد عمليات الشراء (بين 1 و1، أي يساوي 1 دائمًا). لهذا السبب، تحتاج إلى "مساحة أكبر للتوسّع": من الأفضل تخصيص ميزانية مساهمة أكبر "لهدف القياس 1" مقارنةً "بهدف القياس 2"، حتى يمكن توسيع نطاقها بشكل أكثر فعالية (راجِع قسم "التوسّع")، وبالتالي
- خصِّص% 70 من الميزانية لهدف القياس 1. عيِّن 30% لهدف القياس 2.
- انقر على "محاكاة".
- راقِب نسب التشويش في المحاكاة الناتجة. بالنسبة إلى قيمة الشراء، أصبحت نسب التشويش الآن أقل (أفضل) بشكل ملحوظ من المحاكاة السابقة. أما بالنسبة إلى عدد عمليات الشراء، فلم يتغيّر كثيرًا.
- استمرّ في تعديل تقسيم الميزانية على مستوى المقاييس. لاحظ كيف يؤثر ذلك في مستوى الضوضاء.
يُرجى العِلم أنّه يمكنك ضبط أهداف قياس مخصّصة باستخدام أزرار الإضافة والإزالة وإعادة الضبط.
إذا كنت تقيس نقطة بيانات واحدة (هدف القياس) في حدث إحالة ناجحة، مثل عدد الإحالات الناجحة، يمكن أن تحصل نقطة البيانات هذه على كل ميزانية المساهمة (65536). إذا حدّدت أهداف قياس متعدّدة لحدث إحالة ناجحة، مثل عدد الإحالات الناجحة وقيمة الشراء، يجب أن تتشارك نقاط البيانات هذه ميزانية المساهمة. وهذا يعني أنّ لديك مجالًا أقل لتوسيع نطاق قيمك.
لذلك، كلما زاد عدد أهداف القياس، من المرجّح أن تنخفض نسبة الإشارة إلى التشويش (يزداد التشويش).
هناك قرار آخر يجب اتّخاذه بشأن أهداف القياس وهو تقسيم الميزانية. إذا قسّمت ميزانية المساهمة بالتساوي على نقطتَي بيانات، ستحصل كل نقطة بيانات على ميزانية قدرها 65536/2 = 32768. قد يكون هذا الإعداد هو الأفضل أو لا يكون كذلك، وذلك حسب الحد الأقصى المحتمل لكل نقطة بيانات. على سبيل المثال، إذا كنت تقيس عدد عمليات الشراء التي تبلغ قيمتها القصوى 1، وقيمة الشراء التي تبلغ قيمتها الدنيا 1 وقيمتها القصوى 120، ستستفيد قيمة الشراء من توفّر "مساحة أكبر" لتوسيع نطاقها، أي الحصول على نسبة أكبر من ميزانية المساهمة. ستعرف ما إذا كان يجب إعطاء الأولوية لبعض أهداف القياس على غيرها في ما يتعلّق بتأثير التشويش.
القرار: إدارة القيم الشاذة
تجربة الميزة في Noise Lab
هدف القياس هو نقطة بيانات مميّزة يتم جمعها في أحداث الإحالات الناجحة.
- انتقِل إلى "الوضع المتقدّم".
- في اللوحة الجانبية "المَعلمات"، ابحث عن "استراتيجية التجميع" > "التوسيع".
- تأكَّد من ضبط "تغيير الحجم" على "نعم". يُرجى العِلم أنّ "مختبر الضوضاء" يحتسب تلقائيًا عوامل القياس التي سيتم استخدامها، وذلك استنادًا إلى النطاقات (متوسط القيم والحد الأقصى لها) التي قدّمتها لأهداف القياس.
- لنفترض أنّ أكبر عملية شراء تم إجراؤها على الإطلاق كانت بقيمة 2, 000 دولار أمريكي، ولكن معظم عمليات الشراء تتراوح بين 10 و120 دولارًا أمريكيًا. لنرى أولاً ما سيحدث إذا استخدمنا أسلوبًا حرفيًا لتحديد المقياس (لا يُنصح به): أدخِل 2000 دولار أمريكي كقيمة قصوى لـ purchaseValue.
- انقر على "محاكاة".
- لاحظ أنّ نسب التشويش مرتفعة. ويرجع ذلك إلى أنّ عامل القياس يتم احتسابه استنادًا إلى 2, 000 دولار أمريكي، في حين أنّ معظم قيم عمليات الشراء ستكون أقل من ذلك بشكل ملحوظ.
- الآن، لنستخدم أسلوبًا أكثر واقعية لتحديد الحجم. غيِّر الحدّ الأقصى لقيمة الشراء إلى 120 دولارًا أمريكيًا.
- انقر على "محاكاة".
- لاحظ أنّ نسب التشويش أقل (أفضل) في عملية المحاكاة الثانية هذه.
لتنفيذ عملية التحجيم، عليك عادةً احتساب عامل التحجيم استنادًا إلى الحد الأقصى المحتمل لقيمة حدث إحالة ناجحة معيّن (مزيد من المعلومات في هذا المثال).
ومع ذلك، تجنَّب استخدام قيمة قصوى حرفية لاحتساب عامل التحجيم هذا، لأنّ ذلك سيؤدي إلى تفاقم نسب الإشارة إلى الضوضاء. بدلاً من ذلك، أزِل القيم الشاذة واستخدِم قيمة قصوى واقعية.
إدارة القيم الشاذة موضوع معقّد. يمكن استخدام عدد من الأساليب المعقّدة لتحسين نسب الإشارة إلى الضوضاء. يتم توضيح أحدها في مقالة الإدارة المتقدّمة للقيم الشاذة.
الخطوات التالية
بعد تقييم استراتيجيات مختلفة لإدارة التشويش في حالة الاستخدام الخاصة بك، أنت الآن جاهز لبدء تجربة التقارير الموجزة من خلال جمع بيانات قياس حقيقية باستخدام تجربة أصل. راجِع الأدلة والنصائح لتجربة واجهة برمجة التطبيقات.
الملحق
جولة سريعة في "استوديو إنشاء الأصوات"
تساعدك أداة Noise Lab في تقييم استراتيجيات إدارة التشويش ومقارنتها بسرعة. يُستخدم من أجل:
- فهم المَعلمات الرئيسية التي يمكن أن تؤثر في الضوضاء وتأثيرها
- محاكاة تأثير التشويش على بيانات قياس الإخراج مع مراعاة القرارات المختلفة المتعلقة بالتصميم عدِّل مَعلمات التصميم إلى أن تصل إلى نسبة إشارة إلى ضوضاء تناسب حالة الاستخدام.
- يُرجى مشاركة ملاحظاتك حول فائدة التقارير الموجزة: ما هي قيم مَعلمتَي إبسيلون والتشويش التي تناسبك وتلك التي لا تناسبك؟ أين تقع نقاط الانعطاف؟
اعتبِر ذلك خطوة تحضيرية. تنشئ أداة Noise Lab بيانات القياس لمحاكاة نواتج التقارير الموجزة استنادًا إلى البيانات التي تدخلها. ولا يتم الاحتفاظ بأي بيانات أو مشاركتها.
يتوفّر وضعان مختلفان في "مختبر الضوضاء":
- الوضع البسيط: فهم أساسيات عناصر التحكّم المتوفّرة لديك بشأن الضوضاء
- الوضع المتقدّم: يمكنك اختبار استراتيجيات مختلفة لإدارة التشويش وتقييم الاستراتيجية التي تؤدي إلى أفضل نسب إشارة إلى تشويش لحالات الاستخدام.
انقر على الأزرار في القائمة العلوية للتبديل بين الوضعَين (1 في لقطة الشاشة التالية).
الوضع البسيط
- باستخدام "الوضع البسيط"، يمكنك التحكّم في "المَعلمات" (الموجودة على الجانب الأيمن، أو #2 في لقطة الشاشة التالية)، مثل "إبسيلون"، والاطّلاع على تأثيرها في الضوضاء.
- تحتوي كل مَعلمة على تلميح (زرّ `?`). انقر على هذه الرموز للاطّلاع على شرح لكل مَعلمة (الخطوة 3 في لقطة الشاشة التالية).
- للبدء، انقر على الزر "محاكاة" ولاحظ شكل الناتج (#4 في لقطة الشاشة التالية).
- في قسم "الناتج"، يمكنك الاطّلاع على مجموعة متنوعة من التفاصيل. يظهر الرمز `?` بجانب بعض العناصر. يُرجى تخصيص بعض الوقت للنقر على كل علامة استفهام `?` للاطّلاع على شرح حول مختلف المعلومات.
- ضمن قسم "النتائج"، انقر على مفتاح التبديل "التفاصيل" إذا كنت تريد الاطّلاع على نسخة موسّعة من الجدول (الخطوة 5 في لقطة الشاشة التالية).
- بعد كل جدول بيانات في قسم الإخراج، يتوفّر خيار لتنزيل الجدول واستخدامه بلا إنترنت. بالإضافة إلى ذلك، يتوفّر في أسفل يسار الصفحة خيار لتنزيل جميع جداول البيانات (#6 في لقطة الشاشة التالية).
- جرِّب إعدادات مختلفة للمَعلمات في قسم "المَعلمات"، ثم انقر على "محاكاة" لمعرفة تأثيرها في الناتج:
واجهة Noise Lab في الوضع "بسيط"
الوضع المتقدم
- في "الوضع المتقدّم"، يمكنك التحكّم بشكل أكبر في "المَعلمات". يمكنك إضافة أهداف وسمات قياس مخصّصة (1 و2 في لقطة الشاشة التالية).
- انتقِل إلى أسفل قسم "المَعلمات" واطّلِع على خيار "استراتيجية المفتاح". يمكن استخدام ذلك لاختبار بنى مفاتيح مختلفة
(#3 في لقطة الشاشة التالية)
- لاختبار "البُنى الأساسية" المختلفة، بدِّل "الاستراتيجية الأساسية" إلى "ب".
- أدخِل عدد بنى المفاتيح المختلفة التي تريد استخدامها (القيمة التلقائية هي "2").
- انقر على "إنشاء بنى المفاتيح"
- ستظهر لك خيارات لتحديد بنى المفاتيح من خلال النقر على مربّعات الاختيار بجانب المفاتيح التي تريد تضمينها لكل بنية مفتاح.
- انقر على "محاكاة" للاطّلاع على الناتج.
واجهة Noise Lab في "الوضع المتقدّم"
واجهة Noise Lab في "الوضع المتقدّم"
مقاييس الضوضاء
المفهوم الأساسي
تتم إضافة التشويش لحماية خصوصية المستخدمين الفرديين.
تشير قيمة التشويش المرتفعة إلى أنّ الحِزم/المفاتيح متفرّقة وتتضمّن مساهمات من عدد محدود من الأحداث الحسّاسة. يتم ذلك تلقائيًا من خلال Noise Lab، ما يسمح للأفراد "بالاختفاء في الزحام"، أو بعبارة أخرى، يحمي خصوصية هؤلاء الأفراد المحدودين من خلال إضافة قدر أكبر من التشويش.
تشير قيمة التشويش المنخفضة إلى أنّ إعداد البيانات تم تصميمه بطريقة تتيح للأفراد "الاختفاء بين الحشود". وهذا يعني أنّ الحِزم تحتوي على مساهمات من عدد كافٍ من الأحداث للتحقّق من حماية خصوصية المستخدمين الفرديين.
تنطبق هذه العبارة على كلّ من متوسط الخطأ النسبي (APE) وRMSRE_T (متوسط الخطأ النسبي التربيعي مع حدّ أدنى).
APE (متوسط الخطأ المئوي)
APE هي نسبة التشويش إلى الإشارة، أي قيمة الملخّص الحقيقية.
تشير قيم APE المنخفضة إلى نسب إشارة إلى ضوضاء أفضل.
الصيغة
بالنسبة إلى تقرير ملخّص معيّن، يتم احتساب متوسط الأرباح لكل مستخدم على النحو التالي:
True هي قيمة الملخّص الصحيحة. APE هو متوسط الضوضاء على مستوى كل قيمة ملخّص صحيحة، ويتم احتسابه على مستوى جميع الإدخالات في تقرير الملخّص. في "مختبر الضوضاء"، يتم ضرب هذا الرقم في 100 للحصول على نسبة مئوية.
المزايا والعيوب
يكون للمجموعات ذات الأحجام الأصغر تأثير غير متناسب على القيمة النهائية لمعدّل APE. وقد يكون ذلك مضلِّلاً عند تقييم الضوضاء. لهذا السبب، أضفنا مقياسًا آخر، وهو RMSRE_T، مصمّمًا للحدّ من هذا القيد في مقياس APE. راجِع الأمثلة لمعرفة التفاصيل.
الرمز
راجِع رمز المصدر لاحتساب APE.
RMSRE_T (جذر متوسط الخطأ النسبي المربّع مع حدّ)
RMSRE_T (جذر متوسط الخطأ النسبي التربيعي مع حدّ) هو مقياس آخر للتشويش.
كيفية تفسير مقياس RMSRE_T
تشير قيم RMSRE_T المنخفضة إلى تحسُّن نسب الإشارة إلى الضوضاء.
على سبيل المثال، إذا كانت نسبة التشويش المقبولة لحالة الاستخدام هي %20، وكانت قيمة RMSRE_T هي 0.2، يمكنك التأكّد من أنّ مستويات التشويش تقع ضمن النطاق المقبول.
الصيغة
بالنسبة إلى تقرير ملخّص معيّن، يتم احتساب RMSRE_T على النحو التالي:
المزايا والعيوب
يصعب فهم مقياس RMSRE_T أكثر من مقياس APE. ومع ذلك، يتضمّن هذا المقياس بعض المزايا التي تجعله في بعض الحالات أكثر ملاءمةً من مقياس APE لتحليل التشويش في التقارير الموجزة:
- RMSRE_T أكثر استقرارًا. "T" هي قيمة حدّ. يتم استخدام "T" لإعطاء وزن أقل في عملية حساب RMSRE_T للمجموعات التي تتضمّن عددًا أقل من الإحالات الناجحة، وبالتالي تكون أكثر حساسية للتشويش بسبب صغر حجمها. باستخدام مقياس T، لا يرتفع المقياس بشكل حاد في المجموعات التي تتضمّن عددًا قليلاً من الإحالات الناجحة. إذا كانت قيمة T تساوي 5، لن يتم عرض قيمة تشويش صغيرة مثل 1 في مجموعة تتضمّن 0 إحالات ناجحة على أنّها أكبر من 1 بكثير. بدلاً من ذلك، سيتم تحديد الحد الأقصى عند 0.2، أي ما يعادل 1/5، لأنّ T تساوي 5. من خلال منح وزن أقل للمجموعات الأصغر حجمًا التي تكون بالتالي أكثر حساسية للتشويش، يصبح هذا المقياس أكثر استقرارًا، وبالتالي يسهّل مقارنة محاكاتَين.
- تسمح مقياس RMSRE_T بالتجميع المباشر. من خلال معرفة RMSRE_T لعدة حِزم، بالإضافة إلى أعدادها الفعلية، يمكنك احتساب RMSRE_T لمجموعها. يسمح لك ذلك أيضًا بتحسين RMSRE_T لهذه القيم المجمّعة.
على الرغم من إمكانية التجميع في مقياس APE، إلا أنّ الصيغة معقّدة جدًا لأنّها تتضمّن القيمة المطلقة لمجموع الضوضاء في لابلاس. ويصعّب ذلك تحسين مقياس APE.
الرمز
راجِع رمز المصدر لاحتساب RMSRE_T.
أمثلة
تقرير ملخّص يتضمّن ثلاث مجموعات:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
تقرير ملخّص يتضمّن ثلاث مجموعات:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 20
APE = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
تقرير ملخّص يتضمّن ثلاث مجموعات:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 0
APE = (0.1 + 0.2 + Infinity) / 3 = Infinity
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
الإدارة المتقدّمة للمفاتيح
قد يكون لدى منصة DSP أو شركة قياس أداء الإعلانات آلاف العملاء العالميين في مجال الإعلان، ويشمل ذلك عدة صناعات وعملات وإمكانات أسعار الشراء. وهذا يعني أنّ إنشاء مفتاح تجميع واحد وإدارته لكل معلِن سيكون على الأرجح أمرًا غير عملي على الإطلاق. بالإضافة إلى ذلك، سيكون من الصعب اختيار قيمة قصوى قابلة للتجميع وميزانية تجميع يمكن أن تحدّ من تأثير التشويش على آلاف المعلِنين العالميين هؤلاء. بدلاً من ذلك، لنفكّر في السيناريوهات التالية:
الاستراتيجية الرئيسية (أ)
يقرّر مزوّد تكنولوجيا الإعلان إنشاء مفتاح واحد وإدارته لجميع عملائه من المعلِنين. في ما يتعلّق بجميع المعلِنين وجميع العملات، يتراوح نطاق عمليات الشراء بين عمليات شراء بكمية قليلة وبأسعار مرتفعة وعمليات شراء بكمية كبيرة وبأسعار منخفضة. ينتج عن ذلك المفتاح التالي:
| المفتاح (عملات متعدّدة) | |
|---|---|
| الحدّ الأقصى للقيمة القابلة للتجميع | 5,000,000 |
| نطاق قيمة الشراء | [120 - 5000000] |
الاستراتيجية الرئيسية B
يقرّر مزوّد تكنولوجيا الإعلان إنشاء وإدارة مفتاحَين لجميع عملائه من المعلِنين. يقرّرون فصل المفاتيح حسب العملة. تتفاوت عمليات الشراء بين جميع المعلِنين وجميع العملات، بدءًا من عمليات الشراء المنخفضة الكمية والمرتفعة السعر إلى عمليات الشراء المرتفعة الكمية والمنخفضة السعر. يتم الفصل حسب العملة، ويتم إنشاء مفتاحَين:
| المفتاح 1 (بالدولار الأمريكي) | المفتاح 2 (¥) | |
|---|---|---|
| الحدّ الأقصى للقيمة القابلة للتجميع | 40,000 دولار أمريكي | 5,000,000 ين ياباني |
| نطاق قيمة الشراء | [120 - 40,000] | [15,000 - 5,000,000] |
ستتضمّن "الاستراتيجية الرئيسية ب" تشويشًا أقل في نتائجها مقارنةً "بالاستراتيجية الرئيسية أ"، لأنّ قيم العملات ليست موزّعة بشكل موحّد على مستوى العملات. على سبيل المثال، فكِّر في كيف أنّ عمليات الشراء بالين الياباني المختلطة مع عمليات الشراء بالدولار الأمريكي ستؤدي إلى تغيير البيانات الأساسية والنتائج غير الدقيقة.
الاستراتيجية الرئيسية (ج)
يقرّر مزوّد تكنولوجيا الإعلان إنشاء أربعة مفاتيح وإدارتها لدى جميع عملائه من المعلِنين، وفصلها حسب "العملة x مجال المعلِن":
| المفتاح 1 (دولار أمريكي × معلِنو المجوهرات الفاخرة) |
المفتاح 2 (¥ x معلِنو المجوهرات الفاخرة) |
المفتاح 3 (المعلِنون من بائعي الملابس بالتجزئة في الولايات المتحدة) |
المفتاح 4 (¥ x المعلِنون من بائعي التجزئة للملابس) |
|
|---|---|---|---|---|
| الحدّ الأقصى للقيمة القابلة للتجميع | 40,000 دولار أمريكي | 5,000,000 ين ياباني | 500 دولار أمريكي | 65,000 ين ياباني |
| نطاق قيمة الشراء | [10,000 - 40,000] | [1,250,000 - 5,000,000] | [120 - 500] | [15,000 - 65,000] |
ستتضمّن "الاستراتيجية الرئيسية ج" تشويشًا أقل في نتائجها مقارنةً "بالاستراتيجية الرئيسية ب"، لأنّ قيم الشراء لدى المعلِنين ليست موزّعة بشكل موحّد على جميع المعلِنين. على سبيل المثال، فكِّر في كيف أنّ عمليات شراء المجوهرات الراقية التي يتم دمجها مع عمليات شراء قبعات البيسبول ستؤدي إلى تغيير البيانات الأساسية والنتائج المشوّشة الناتجة.
ننصحك بإنشاء قيم إجمالية قصوى مشتركة وعوامل قياس مشتركة للعناصر المشتركة بين عدة معلِنين من أجل تقليل التشويش في النتائج. على سبيل المثال، يمكنك تجربة الاستراتيجيات التالية للمعلِنين:
- استراتيجية واحدة مفصولة بالعملة (USD أو ¥ أو CAD أو غير ذلك)
- استراتيجية واحدة مفصولة حسب مجال المعلِن (التأمين والسيارات والبيع بالتجزئة وما إلى ذلك)
- استراتيجية واحدة مفصولة بنطاقات قيمة شراء مشابهة ([100]، [1000]، [10000]، وما إلى ذلك)
من خلال إنشاء استراتيجيات أساسية تستند إلى أوجه التشابه بين المعلِنين، يصبح من الأسهل إدارة المفاتيح والرمز ذي الصلة، وتصبح نسب الإشارة إلى الضوضاء أعلى. جرِّب استراتيجيات مختلفة تتضمّن سمات مشتركة مختلفة للمعلِنين من أجل تحديد نقاط التحوّل في زيادة تأثير الضوضاء إلى أقصى حد مقارنةً بإدارة الرموز.
الإدارة المتقدّمة للقيم الشاذة
لنفكّر في سيناريو يخصّ معلِنَين:
- المعلن (أ):
- في جميع المنتجات على موقع المعلِن (أ)، تتراوح أسعار الشراء بين 120 دولارًا أمريكيًا و1,000 دولار أمريكي، أي بنطاق يبلغ 880 دولارًا أمريكيًا.
- تتوزّع أسعار الشراء بالتساوي على نطاق 880 دولارًا أمريكيًا بدون أي قيم متطرفة خارج الانحرافَين المعياريَين عن متوسط سعر الشراء.
- المعلِن (ب):
- في جميع المنتجات على موقع المعلِن (ب)، تتراوح أسعار الشراء بين 120 دولارًا أمريكيًا و1,000 دولار أمريكي، أي بنطاق يبلغ 880 دولارًا أمريكيًا.
- تميل أسعار الشراء بشكل كبير إلى النطاق من 120 دولارًا أمريكيًا إلى 500 دولار أمريكي، حيث تم إجراء% 5 فقط من عمليات الشراء في النطاق من 500 دولار أمريكي إلى 1,000 دولار أمريكي.
بالنظر إلى متطلبات ميزانية المساهمة والمنهجية التي يتم من خلالها تطبيق التشويش على النتائج النهائية، سيحصل المعلِن (ب) تلقائيًا على نتائج مشوّشة أكثر من المعلِن (أ)، لأنّ المعلِن (ب) لديه احتمال أكبر لتأثير القيم الشاذة في الحسابات الأساسية.
يمكن الحدّ من ذلك من خلال إعداد مفتاح محدّد. اختبِر الاستراتيجيات الأساسية التي تساعد في إدارة البيانات الشاذة وتوزيع قيم الشراء بشكل أكثر توازناً على مستوى نطاق الشراء الخاص بالمفتاح.
بالنسبة إلى المعلِن (ب)، يمكنك إنشاء مفتاحَين منفصلَين لتسجيل نطاقَين مختلفَين من قيم الشراء. في هذا المثال، لاحظت تكنولوجيا الإعلان أنّ القيم الشاذة تظهر فوق قيمة الشراء البالغة 500 دولار أمريكي. جرِّب تنفيذ مفتاحَين منفصلَين لهذا المعلِن:
- بنية المفتاح 1 : مفتاح لا يسجّل سوى عمليات الشراء التي تتراوح قيمتها بين 120 دولارًا أمريكيًا و500 دولار أمريكي (تغطّي حوالي% 95 من إجمالي حجم عمليات الشراء).
- بنية المفتاح 2: مفتاح لا يسجّل سوى عمليات الشراء التي تزيد قيمتها عن 500 دولار أمريكي (تغطّي حوالي% 5 من إجمالي حجم عمليات الشراء).
من المفترض أن يؤدي تنفيذ هذه الاستراتيجية الأساسية إلى إدارة التشويش بشكل أفضل بالنسبة إلى "المعلِن ب" والمساعدة في زيادة الفائدة التي يحصل عليها من التقارير الموجزة. وبالنظر إلى النطاقات الجديدة الأصغر، من المفترض أن يكون المفتاحان (أ) و(ب) الآن أكثر اتساقًا في توزيع البيانات على كل مفتاح على حدة مقارنةً بالمفتاح الفردي السابق. سيؤدي ذلك إلى تقليل تأثير التشويش في ناتج كل مفتاح مقارنةً بالمفتاح الفردي السابق.