Noiselab

درباره این سند

با خواندن این سند، شما:

  • قبل از تهیه گزارش‌های خلاصه، استراتژی‌هایی را که باید ایجاد کنید، درک کنید.
  • با آزمایشگاه نویز آشنا شوید، ابزاری که به درک اثرات پارامترهای مختلف نویز کمک می‌کند و امکان بررسی و ارزیابی سریع استراتژی‌های مختلف مدیریت نویز را فراهم می‌کند.
تصویر از آزمایشگاه نویز.
آزمایشگاه نویز

بازخورد خود را به اشتراک بگذارید

اگرچه این سند چند اصل برای کار با گزارش‌های خلاصه را خلاصه می‌کند، رویکردهای متعددی برای مدیریت نویز وجود دارد که ممکن است در اینجا منعکس نشده باشند. از پیشنهادات، اضافات و سوالات شما استقبال می‌شود!

قبل از شروع

  1. برای آشنایی بیشتر ، گزارش‌های خلاصه گزارش‌های انتسابی و مرور کلی سیستم گزارش انتسابی را مطالعه کنید.
  2. برای استفاده بهینه از این راهنما، درک نویز و درک کلیدهای تجمیع را بررسی کنید.

تصمیمات طراحی

اصل طراحی هسته

تفاوت‌های اساسی بین نحوه عملکرد کوکی‌های شخص ثالث و گزارش‌های خلاصه وجود دارد. یکی از تفاوت‌های کلیدی، نویز اضافه شده به داده‌های اندازه‌گیری در گزارش‌های خلاصه است. تفاوت دیگر، نحوه زمان‌بندی گزارش‌ها است.

برای دسترسی به داده‌های اندازه‌گیری گزارش خلاصه با نسبت سیگنال به نویز بالاتر، پلتفرم‌های سمت تقاضا (DSP) و ارائه‌دهندگان اندازه‌گیری تبلیغات باید با تبلیغ‌کنندگان خود برای توسعه استراتژی‌های مدیریت نویز همکاری کنند. برای توسعه این استراتژی‌ها، DSPها و ارائه‌دهندگان اندازه‌گیری باید تصمیمات طراحی بگیرند. این تصمیمات حول یک مفهوم اساسی می‌چرخند:

اگرچه مقادیر نویز توزیع از دو پارامتر - اپسیلون و بودجه مشارکت - استخراج می‌شوند، اما شما تعدادی کنترل دیگر در اختیار دارید که بر نسبت سیگنال به نویز داده‌های اندازه‌گیری خروجی شما تأثیر می‌گذارند.

اگرچه انتظار داریم یک فرآیند تکراری به بهترین تصمیمات منجر شود، اما هر تغییر در این تصمیمات منجر به پیاده‌سازی کمی متفاوت خواهد شد - بنابراین این تصمیمات باید قبل از نوشتن هر تکرار کد (و قبل از اجرای تبلیغات) گرفته شوند.

تصمیم: جزئیات ابعاد

آن را در آزمایشگاه نویز امتحان کنید

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال داده‌های تبدیل خود (Your conversion data) بگردید.
  3. پارامترهای پیش‌فرض را رعایت کنید. به طور پیش‌فرض، تعداد کل تبدیل‌های قابل انتساب روزانه ۱۰۰۰ است. اگر از تنظیمات پیش‌فرض استفاده کنید (ابعاد پیش‌فرض، تعداد پیش‌فرض مقادیر مختلف ممکن برای هر بُعد، استراتژی کلیدی A)، این مقدار به طور متوسط ​​تقریباً ۴۰ برای هر سطل می‌شود. توجه داشته باشید که مقدار ورودی Average daily attributable conversion count PER BUCKET برابر با ۴۰ است.
  4. برای اجرای شبیه‌سازی با پارامترهای پیش‌فرض، روی «شبیه‌سازی» کلیک کنید.
  5. در پنل کناری پارامترها، به دنبال Dimensions بگردید. نام Geography را به City تغییر دهید و تعداد مقادیر مختلف ممکن را به ۵۰ تغییر دهید.
  6. مشاهده کنید که چگونه این تغییر، میانگین تعداد تبدیل‌های قابل انتساب روزانه به ازای هر سطل را تغییر می‌دهد. اکنون بسیار کمتر است. دلیل این امر این است که اگر تعداد مقادیر ممکن را در این بُعد بدون تغییر هیچ چیز دیگری افزایش دهید، تعداد کل سطل‌ها را بدون تغییر تعداد رویدادهای تبدیل در هر سطل افزایش می‌دهید.
  7. روی شبیه‌سازی کلیک کنید.
  8. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید: نسبت‌های نویز اکنون بالاتر از شبیه‌سازی قبلی هستند.

با توجه به اصل طراحی اصلی ، مقادیر خلاصه کوچک احتمالاً نویز بیشتری نسبت به مقادیر خلاصه بزرگ دارند. بنابراین، انتخاب پیکربندی شما بر تعداد رویدادهای تبدیل نسبت داده شده در هر سطل (که در غیر این صورت به عنوان کلید تجمیع شما نامیده می‌شود) تأثیر می‌گذارد و این مقدار بر نویز در گزارش‌های خلاصه خروجی نهایی تأثیر می‌گذارد.

یکی از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر می‌گذارد، دانه‌بندی ابعاد است. مثال‌های زیر از کلیدهای تجمیع و ابعاد آنها را در نظر بگیرید:

  • رویکرد ۱: یک ساختار کلیدی با ابعاد کلی: کشور × کمپین تبلیغاتی (یا بزرگترین مجموعه کمپین) × نوع محصول (از بین ۱۰ نوع محصول ممکن)
  • رویکرد ۲: یک ساختار کلیدی با ابعاد جزئی: شهر × هویت خلاق × محصول (از بین ۱۰۰ محصول ممکن)

شهر بُعد جزئی‌تری نسبت به کشور دارد؛ شناسه خلاق جزئی‌تر از کمپین است؛ و محصول جزئی‌تر از نوع محصول است. بنابراین، رویکرد ۲ در خروجی گزارش خلاصه خود تعداد کمتری رویداد (تبدیل) در هر سطل (= در هر کلید) نسبت به رویکرد ۱ خواهد داشت. با توجه به اینکه نویز اضافه شده به خروجی مستقل از تعداد رویدادهای موجود در سطل است، داده‌های اندازه‌گیری در گزارش‌های خلاصه با رویکرد ۲ نویز بیشتری خواهند داشت. برای هر تبلیغ‌کننده، با مصالحه‌های جزئی مختلف در طراحی کلید آزمایش کنید تا حداکثر سودمندی را در نتایج داشته باشید.

تصمیم: ساختارهای کلیدی

آن را در آزمایشگاه نویز امتحان کنید

در حالت ساده، از ساختار کلید پیش‌فرض استفاده می‌شود. در حالت پیشرفته، می‌توانید ساختارهای کلید متفاوتی را آزمایش کنید. چند نمونه از ابعاد گنجانده شده است؛ همچنین می‌توانید این ابعاد را تغییر دهید.

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال استراتژی کلیدی باشید. توجه داشته باشید که استراتژی پیش‌فرض، که در ابزار با نام A شناخته می‌شود، از یک ساختار کلیدی دقیق استفاده می‌کند که شامل همه ابعاد است: جغرافیا x شناسه کمپین x دسته محصول.
  3. روی شبیه‌سازی کلیک کنید.
  4. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید.
  5. استراتژی کلید را به B تغییر دهید. این کار کنترل‌های بیشتری را برای پیکربندی ساختار کلید شما نمایش می‌دهد.
  6. ساختار کلید خود را به صورت زیر پیکربندی کنید:
    1. تعداد ساختارهای کلیدی: ۲
    2. ساختار کلیدی ۱ = جغرافیا × دسته‌بندی محصول.
    3. ساختار کلیدی ۲ = شناسه کمپین × دسته محصول.
  7. روی شبیه‌سازی کلیک کنید.
  8. توجه داشته باشید که اکنون با توجه به اینکه از دو ساختار کلیدی متمایز استفاده می‌کنید، برای هر نوع هدف اندازه‌گیری، دو گزارش خلاصه دریافت می‌کنید (دو گزارش برای تعداد خرید، دو گزارش برای ارزش خرید). نسبت‌های نویز آنها را مشاهده کنید.
  9. همچنین می‌توانید این کار را با ابعاد سفارشی خودتان امتحان کنید. برای انجام این کار، به دنبال داده‌هایی باشید که می‌خواهید ردیابی کنید: ابعاد. حذف ابعاد نمونه و ایجاد ابعاد خودتان را با استفاده از دکمه‌های افزودن/حذف/تنظیم مجدد در زیر آخرین بعد در نظر بگیرید.

یکی دیگر از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر می‌گذارد، ساختارهای کلیدی است که تصمیم به استفاده از آنها دارید. مثال‌های زیر از کلیدهای تجمیع را در نظر بگیرید:

  • یک ساختار کلیدی با تمام ابعاد؛ بیایید آن را استراتژی کلیدی A بنامیم.
  • دو ساختار کلیدی، هر کدام با زیرمجموعه‌ای از ابعاد؛ بیایید این را استراتژی کلیدی B بنامیم.
سطل‌های مربوط به استراتژی کلیدی A و B.
سطل‌های مربوط به استراتژی کلیدی A و B.

استراتژی الف ساده‌تر است - اما ممکن است لازم باشد مقادیر خلاصه نویزدار شامل گزارش‌های خلاصه را برای دسترسی به بینش‌های خاص، جمع کنید (یا به اصطلاح roll up کنید). با جمع کردن این مقادیر، نویز را نیز جمع می‌کنید. با استراتژی ب، مقادیر خلاصه‌ای که در گزارش‌های خلاصه نمایش داده می‌شوند، ممکن است از قبل اطلاعات مورد نیاز شما را در اختیارتان قرار دهند. این بدان معناست که استراتژی ب احتمالاً منجر به نسبت سیگنال به نویز بهتری نسبت به استراتژی الف خواهد شد. با این حال، نویز ممکن است از قبل با استراتژی الف قابل قبول باشد، بنابراین ممکن است همچنان به دلیل سادگی، استراتژی الف را ترجیح دهید. در مثال مفصلی که این دو استراتژی را شرح می‌دهد، اطلاعات بیشتری کسب کنید .

مدیریت کلید موضوع عمیقی است. تعدادی تکنیک پیچیده را می‌توان برای بهبود نسبت سیگنال به نویز در نظر گرفت. یکی از آنها در مدیریت کلید پیشرفته توضیح داده شده است.

تصمیم: فرکانس دسته بندی

آن را در آزمایشگاه نویز امتحان کنید

  1. به حالت ساده (یا حالت پیشرفته - هر دو حالت در مورد فرکانس دسته بندی به یک شکل کار می کنند) بروید
  2. در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > فراوانی دسته بندی باشید. این به فراوانی دسته بندی گزارش‌های قابل تجمیع اشاره دارد که با سرویس تجمیع در یک کار واحد پردازش می‌شوند.
  3. به فرکانس پیش‌فرض دسته‌بندی توجه کنید: به‌طور پیش‌فرض، فرکانس دسته‌بندی روزانه شبیه‌سازی می‌شود.
  4. روی شبیه‌سازی کلیک کنید.
  5. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید.
  6. فرکانس دسته بندی را به هفتگی تغییر دهید.
  7. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید: نسبت‌های نویز اکنون کمتر (بهتر) از شبیه‌سازی قبلی هستند.

یکی دیگر از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر می‌گذارد، فرکانس دسته بندی است که شما تصمیم به استفاده از آن دارید. فرکانس دسته بندی این است که چند بار گزارش‌های قابل جمع آوری را پردازش می‌کنید.

گزارشی که برای تجمیع با فواصل زمانی بیشتر (مثلاً هر ساعت) برنامه‌ریزی شده باشد، رویدادهای تبدیل کمتری نسبت به همان گزارش با برنامه تجمیع با فواصل زمانی کمتر (مثلاً هر هفته) خواهد داشت. در نتیجه، گزارش ساعتی نویز بیشتری را شامل خواهد شد. در صورت برابر بودن سایر شرایط، گزارش ساعتی نسبت سیگنال به نویز کمتری نسبت به گزارش هفتگی خواهد داشت. الزامات گزارش‌دهی را در فرکانس‌های مختلف آزمایش کنید و نسبت سیگنال به نویز را برای هر کدام ارزیابی کنید.

برای کسب اطلاعات بیشتر به بخش دسته‌بندی و تجمیع در بازه‌های زمانی طولانی‌تر مراجعه کنید.

تصمیم: متغیرهای کمپین که بر تبدیل‌های قابل انتساب تأثیر می‌گذارند

آن را در آزمایشگاه نویز امتحان کنید

اگرچه پیش‌بینی این موضوع می‌تواند دشوار باشد و علاوه بر اثرات فصلی، می‌تواند تغییرات قابل توجهی داشته باشد، سعی کنید تعداد تبدیل‌های قابل انتساب روزانه با یک لمس را به نزدیکترین توان ۱۰ تخمین بزنید: ۱۰، ۱۰۰، ۱۰۰۰ یا ۱۰۰۰۰.

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال داده‌های تبدیل خود (Your conversion data) بگردید.
  3. پارامترهای پیش‌فرض را رعایت کنید. به طور پیش‌فرض، تعداد کل تبدیل‌های قابل انتساب روزانه ۱۰۰۰ است. اگر از تنظیمات پیش‌فرض استفاده کنید (ابعاد پیش‌فرض، تعداد پیش‌فرض مقادیر مختلف ممکن برای هر بُعد، استراتژی کلیدی A)، این مقدار به طور متوسط ​​تقریباً ۴۰ برای هر سطل می‌شود. توجه داشته باشید که مقدار ورودی Average daily attributable conversion count PER BUCKET برابر با ۴۰ است.
  4. برای اجرای شبیه‌سازی با پارامترهای پیش‌فرض، روی «شبیه‌سازی» کلیک کنید.
  5. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید.
  6. حالا تعداد کل تبدیل‌های قابل انتساب روزانه را روی ۱۰۰ تنظیم کنید. توجه داشته باشید که این کار، مقدار میانگین تعداد تبدیل‌های قابل انتساب روزانه به ازای هر سطل را کاهش می‌دهد.
  7. روی شبیه‌سازی کلیک کنید.
  8. توجه داشته باشید که نسبت نویز اکنون بالاتر است: دلیل این امر این است که وقتی تعداد تبدیل‌ها در هر سطل کمتر است، نویز بیشتری برای حفظ حریم خصوصی اعمال می‌شود.

یک تمایز مهم، تعداد کل تبدیل‌های ممکن برای یک تبلیغ‌کننده در مقابل تعداد کل تبدیل‌های نسبت داده شده‌ی ممکن است. مورد دوم در نهایت بر نویز در گزارش‌های خلاصه تأثیر می‌گذارد. تبدیل‌های نسبت داده شده زیرمجموعه‌ای از کل تبدیل‌ها هستند که مستعد متغیرهای کمپین، مانند بودجه تبلیغات و هدف‌گذاری تبلیغات، هستند. به عنوان مثال، انتظار می‌رود تعداد تبدیل‌های نسبت داده شده برای یک کمپین تبلیغاتی ۱۰ میلیون دلاری در مقایسه با یک کمپین تبلیغاتی ۱۰ هزار دلاری، در صورت برابر بودن سایر موارد، بیشتر باشد.

مواردی که باید در نظر گرفته شوند:

  • تبدیل‌های نسبت داده شده را در برابر یک مدل نسبت‌دهی تک لمسی و مشابه دستگاه ارزیابی کنید، زیرا این موارد در محدوده گزارش‌های خلاصه جمع‌آوری شده با API گزارش‌دهی نسبت‌دهی قرار دارند.
  • برای تبدیل‌های نسبت داده شده، هم تعداد بدترین حالت و هم تعداد بهترین حالت را در نظر بگیرید. به عنوان مثال، با فرض ثابت بودن سایر شرایط، حداقل و حداکثر بودجه کمپین ممکن برای یک تبلیغ‌کننده را در نظر بگیرید، سپس تبدیل‌های نسبت داده شده را برای هر دو نتیجه به عنوان ورودی در شبیه‌سازی خود پیش‌بینی کنید.
  • اگر به استفاده از Android Privacy Sandbox فکر می‌کنید، تبدیل‌های نسبت داده شده بین پلتفرمی را در محاسبه در نظر بگیرید.

تصمیم: استفاده از مقیاس‌بندی

آن را در آزمایشگاه نویز امتحان کنید

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > مقیاس‌بندی باشید. این گزینه به طور پیش‌فرض روی بله تنظیم شده است.
  3. برای درک اثرات مثبت مقیاس‌بندی بر نسبت نویز، ابتدا Scaling را روی No تنظیم کنید.
  4. روی شبیه‌سازی کلیک کنید.
  5. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید.
  6. مقیاس‌بندی را روی بله تنظیم کنید. توجه داشته باشید که Noise Lab به طور خودکار ضرایب مقیاس‌بندی مورد استفاده را با توجه به محدوده‌های (مقادیر متوسط ​​و حداکثر) اهداف اندازه‌گیری برای سناریوی شما محاسبه می‌کند. در یک سیستم واقعی یا تنظیمات آزمایشی مبدا، بهتر است محاسبات خود را برای ضرایب مقیاس‌بندی پیاده‌سازی کنید.
  7. روی شبیه‌سازی کلیک کنید.
  8. مشاهده کنید که نسبت‌های نویز در این شبیه‌سازی دوم اکنون کمتر (بهتر) هستند. این به این دلیل است که شما از مقیاس‌بندی استفاده می‌کنید.

با توجه به اصل طراحی اصلی ، نویز اضافه شده تابعی از بودجه مشارکت است.

بنابراین، برای افزایش نسبت سیگنال به نویز، می‌توانید تصمیم بگیرید که مقادیر جمع‌آوری‌شده در طول یک رویداد تبدیل را با مقیاس‌بندی آنها در برابر بودجه مشارکت (و کاهش مقیاس آنها پس از تجمیع) تبدیل کنید. از مقیاس‌بندی برای افزایش نسبت سیگنال به نویز استفاده کنید.

تصمیم: تعداد اهداف اندازه‌گیری و تقسیم بودجه حریم خصوصی

این مربوط به مقیاس‌بندی است؛ حتماً بخش «استفاده از مقیاس‌بندی» را مطالعه کنید.

آن را در آزمایشگاه نویز امتحان کنید

هدف اندازه‌گیری، یک نقطه داده متمایز است که در رویدادهای تبدیل جمع‌آوری می‌شود.

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال داده‌هایی باشید که می‌خواهید پیگیری کنید: اهداف اندازه‌گیری. به طور پیش‌فرض، شما دو هدف اندازه‌گیری دارید: ارزش خرید و تعداد خرید.
  3. برای اجرای شبیه‌سازی با اهداف پیش‌فرض، روی «شبیه‌سازی» کلیک کنید.
  4. روی حذف کلیک کنید. این کار آخرین هدف اندازه‌گیری (در این مورد تعداد خرید) را حذف می‌کند.
  5. روی شبیه‌سازی کلیک کنید.
  6. مشاهده کنید که نسبت‌های نویز برای ارزش خرید اکنون برای این شبیه‌سازی دوم کمتر (بهتر) هستند. دلیل این امر این است که شما اهداف اندازه‌گیری کمتری دارید، بنابراین اکنون یک هدف اندازه‌گیری شما تمام بودجه مشارکت را به خود اختصاص می‌دهد.
  7. روی تنظیم مجدد کلیک کنید. اکنون دوباره دو هدف اندازه‌گیری دارید: ارزش خرید و تعداد خرید. توجه داشته باشید که Noise Lab به طور خودکار عوامل مقیاس‌بندی مورد استفاده را با توجه به محدوده‌ها (مقادیر متوسط ​​و حداکثر) اهداف اندازه‌گیری برای سناریوی شما محاسبه می‌کند. به طور پیش‌فرض، Noise Lab بودجه را به طور مساوی بین اهداف اندازه‌گیری تقسیم می‌کند.
  8. روی شبیه‌سازی کلیک کنید.
  9. نسبت‌های نویز شبیه‌سازی حاصل را مشاهده کنید. به ضرایب مقیاس‌بندی نمایش داده شده در شبیه‌سازی توجه کنید.
  10. حالا، بیایید تقسیم بودجه حریم خصوصی را سفارشی کنیم تا به نسبت سیگنال به نویز بهتری دست یابیم.
  11. درصد بودجه اختصاص داده شده برای هر هدف اندازه‌گیری را تغییر دهید. با توجه به پارامترهای پیش‌فرض، هدف اندازه‌گیری ۱، یعنی ارزش خرید، دامنه بسیار وسیع‌تری (بین ۰ تا ۱۰۰۰) نسبت به هدف اندازه‌گیری ۲، یعنی تعداد خرید (بین ۱ تا ۱ یعنی همیشه برابر با ۱) دارد. به همین دلیل، به "فضای بیشتری برای مقیاس‌بندی" نیاز دارد: ایده‌آل این است که بودجه مشارکت بیشتری به هدف اندازه‌گیری ۱ نسبت به هدف اندازه‌گیری ۲ اختصاص داده شود تا بتوان آن را به طور کارآمدتری مقیاس‌بندی کرد (به مقیاس‌بندی مراجعه کنید) و از این رو
  12. ۷۰٪ از بودجه را به هدف اندازه‌گیری ۱ اختصاص دهید. ۳۰٪ را به هدف اندازه‌گیری ۲ اختصاص دهید.
  13. روی شبیه‌سازی کلیک کنید.
  14. به نسبت‌های نویز شبیه‌سازی حاصل توجه کنید. برای ارزش خرید، نسبت‌های نویز اکنون به طور قابل توجهی پایین‌تر (بهتر) از شبیه‌سازی قبلی هستند. برای تعداد خرید، تقریباً بدون تغییر باقی مانده‌اند.
  15. به تغییر تدریجی تقسیم بودجه بین معیارها ادامه دهید. مشاهده کنید که چگونه این امر بر نویز تأثیر می‌گذارد.

توجه داشته باشید که می‌توانید اهداف اندازه‌گیری سفارشی خود را با دکمه‌های افزودن/حذف/تنظیم مجدد تنظیم کنید.


اگر یک نقطه داده (هدف اندازه‌گیری) را در یک رویداد تبدیل، مانند تعداد تبدیل، اندازه‌گیری کنید، آن نقطه داده می‌تواند تمام بودجه مشارکت (۶۵۵۳۶) را دریافت کند. اگر چندین هدف اندازه‌گیری را در یک رویداد تبدیل، مانند تعداد تبدیل و ارزش خرید، تعیین کنید، آن نقاط داده باید بودجه مشارکت را به اشتراک بگذارند. این بدان معناست که شما آزادی عمل کمتری برای افزایش مقادیر خود دارید.

بنابراین، هرچه اهداف اندازه‌گیری بیشتری داشته باشید، احتمالاً نسبت سیگنال به نویز پایین‌تری خواهید داشت (نویز بالاتر).

تصمیم دیگری که باید در مورد اهداف اندازه‌گیری گرفته شود، تقسیم بودجه است. اگر بودجه مشارکت را به طور مساوی بین دو نقطه داده تقسیم کنید، هر نقطه داده بودجه‌ای برابر با ۶۵۵۳۶/۲ = ۳۲۷۶۸ دریافت می‌کند. این بسته به حداکثر مقدار ممکن برای هر نقطه داده، ممکن است بهینه باشد یا نباشد. به عنوان مثال، اگر تعداد خرید را با حداکثر مقدار ۱ و ارزش خرید را با حداقل ۱ و حداکثر ۱۲۰ اندازه‌گیری می‌کنید، ارزش خرید از داشتن «فضای بیشتر» برای افزایش مقیاس - یعنی اختصاص بخش بزرگتری از بودجه مشارکت - سود می‌برد. خواهید دید که آیا برخی از اهداف اندازه‌گیری باید در رابطه با تأثیر نویز بر سایرین اولویت‌بندی شوند یا خیر.

تصمیم: مدیریت داده‌های پرت

آن را در آزمایشگاه نویز امتحان کنید

هدف اندازه‌گیری، یک نقطه داده متمایز است که در رویدادهای تبدیل جمع‌آوری می‌شود.

  1. به حالت پیشرفته بروید.
  2. در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > مقیاس‌بندی باشید.
  3. مطمئن شوید که مقیاس‌بندی روی بله تنظیم شده است. توجه داشته باشید که Noise Lab به طور خودکار ضرایب مقیاس‌بندی مورد استفاده را بر اساس محدوده‌هایی (مقادیر میانگین و حداکثر) که برای اهداف اندازه‌گیری ارائه داده‌اید، محاسبه می‌کند.
  4. بیایید فرض کنیم که بزرگترین خریدی که تاکنون انجام شده ۲۰۰۰ دلار بوده است، اما بیشتر خریدها در محدوده ۱۰ تا ۱۲۰ دلار اتفاق می‌افتند. ابتدا، بیایید ببینیم اگر از رویکرد مقیاس‌بندی تحت‌اللفظی استفاده کنیم (توصیه نمی‌شود) چه اتفاقی می‌افتد: ۲۰۰۰ دلار را به عنوان حداکثر مقدار برای purchaseValue وارد کنید.
  5. روی شبیه‌سازی کلیک کنید.
  6. توجه داشته باشید که نسبت‌های نویز بالا هستند. دلیل این امر این است که ضریب مقیاس‌بندی ما بر اساس ۲۰۰۰ دلار محاسبه شده است، در حالی که در واقعیت، اکثر مقادیر خرید به طور قابل توجهی کمتر از این مقدار خواهند بود.
  7. حالا، بیایید از یک رویکرد مقیاس‌بندی عملی‌تر استفاده کنیم. حداکثر ارزش خرید را به ۱۲۰ دلار تغییر دهید.
  8. روی شبیه‌سازی کلیک کنید.
  9. مشاهده کنید که نسبت‌های نویز در این شبیه‌سازی دوم کمتر (بهتر) هستند.

برای پیاده‌سازی مقیاس‌بندی، معمولاً یک ضریب مقیاس‌بندی را بر اساس حداکثر مقدار ممکن برای یک رویداد تبدیل معین محاسبه می‌کنید ( برای اطلاعات بیشتر به این مثال مراجعه کنید ).

با این حال، از استفاده از یک مقدار حداکثر واقعی برای محاسبه آن ضریب مقیاس‌بندی خودداری کنید، زیرا این کار نسبت سیگنال به نویز شما را بدتر می‌کند. در عوض، داده‌های پرت را حذف کرده و از یک مقدار حداکثر عملی استفاده کنید.

مدیریت داده‌های پرت موضوع عمیقی است. تعدادی تکنیک پیچیده را می‌توان برای بهبود نسبت سیگنال به نویز در نظر گرفت. یکی از آنها در مدیریت پیشرفته داده‌های پرت توضیح داده شده است.

مراحل بعدی

اکنون که استراتژی‌های مختلف مدیریت نویز را برای مورد استفاده خود ارزیابی کرده‌اید، آماده‌اید تا با جمع‌آوری داده‌های اندازه‌گیری واقعی با استفاده از یک آزمایش مبدا، آزمایش گزارش‌های خلاصه را آغاز کنید. راهنماها و نکات را برای امتحان کردن API مرور کنید.

پیوست

تور سریع آزمایشگاه نویز

آزمایشگاه نویز به شما کمک می‌کند تا به سرعت استراتژی‌های مدیریت نویز را ارزیابی و مقایسه کنید. از آن برای موارد زیر استفاده کنید:

  • پارامترهای اصلی که می‌توانند بر نویز تأثیر بگذارند و تأثیر آنها را درک کنید.
  • با توجه به تصمیمات طراحی مختلف، تأثیر نویز را بر داده‌های اندازه‌گیری خروجی شبیه‌سازی کنید. پارامترهای طراحی را تا زمانی که به نسبت سیگنال به نویزی برسید که برای مورد استفاده شما مناسب باشد، تغییر دهید.
  • بازخورد خود را در مورد کاربرد گزارش‌های خلاصه به اشتراک بگذارید: کدام مقادیر پارامترهای اپسیلون و نویز برای شما کار می‌کنند، کدام‌ها نه؟ نقاط عطف کجا هستند؟

این را به عنوان یک مرحله آماده‌سازی در نظر بگیرید. Noise Lab داده‌های اندازه‌گیری را برای شبیه‌سازی خروجی‌های گزارش خلاصه بر اساس ورودی شما تولید می‌کند. این ابزار هیچ داده‌ای را ذخیره یا به اشتراک نمی‌گذارد.

دو حالت مختلف در Noise Lab وجود دارد:

  1. حالت ساده: اصول کنترل‌هایی که روی نویز دارید را درک کنید.
  2. حالت پیشرفته: استراتژی‌های مختلف مدیریت نویز را آزمایش کنید و ارزیابی کنید که کدام یک منجر به بهترین نسبت سیگنال به نویز برای موارد استفاده شما می‌شود.

برای تغییر بین دو حالت ( حالت اول در تصویر زیر ) روی دکمه‌های منوی بالا کلیک کنید.

حالت ساده
  • با حالت ساده، شما پارامترهایی (که در سمت چپ یا شماره ۲ در تصویر زیر یافت می‌شوند) مانند اپسیلون را کنترل می‌کنید و می‌بینید که چگونه بر نویز تأثیر می‌گذارند.
  • هر پارامتر یک راهنمای ابزار (دکمه `?`) دارد. برای دیدن توضیح هر پارامتر، روی آنها کلیک کنید ( شماره ۳. در تصویر زیر ).
  • برای شروع، روی دکمه‌ی «شبیه‌سازی» کلیک کنید و خروجی را مشاهده کنید ( شماره ۴. در تصویر زیر )
  • در بخش خروجی می‌توانید جزئیات متنوعی را مشاهده کنید. کنار برخی از عناصر علامت `?` وجود دارد. برای دیدن توضیحی در مورد بخش‌های مختلف اطلاعات، روی هر `?` کلیک کنید.
  • اگر می‌خواهید نسخه‌ی بسط‌یافته‌ی جدول را ببینید ( شماره ۵ در تصویر زیر )، در بخش خروجی (Output)، روی گزینه‌ی جزئیات (Details) کلیک کنید.
  • بعد از هر جدول داده در بخش خروجی، گزینه‌ای برای دانلود جدول برای استفاده آفلاین وجود دارد. علاوه بر این، در گوشه پایین سمت راست گزینه‌ای برای دانلود تمام جداول داده وجود دارد ( شماره ۶. در تصویر زیر ).
  • تنظیمات مختلف را برای پارامترها در بخش Parameters امتحان کنید و روی Simulate کلیک کنید تا ببینید چگونه بر خروجی تأثیر می‌گذارند:
    رابط کاربری Noise Lab برای حالت ساده.
    رابط کاربری Noise Lab برای حالت ساده.
حالت پیشرفته
  • در حالت پیشرفته، کنترل بیشتری روی پارامترها دارید. می‌توانید اهداف اندازه‌گیری و ابعاد سفارشی ( شماره ۱ و شماره ۲ در تصویر زیر ) اضافه کنید.
  • در بخش پارامترها به پایین اسکرول کنید و گزینه Key Strategy را ببینید. از این گزینه می‌توان برای آزمایش ساختارهای کلیدی مختلف استفاده کرد ( شماره ۳. در تصویر زیر ).
    • برای آزمایش ساختارهای کلیدی مختلف، استراتژی کلیدی را به «ب» تغییر دهید.
    • تعداد ساختارهای کلیدی مختلفی که می‌خواهید استفاده کنید را وارد کنید (پیش‌فرض روی "2" تنظیم شده است)
    • روی ایجاد ساختارهای کلیدی کلیک کنید
    • با کلیک روی کادرهای انتخاب کنار کلیدهایی که می‌خواهید برای هر ساختار کلیدی لحاظ کنید، گزینه‌هایی برای مشخص کردن ساختارهای کلیدی خود مشاهده خواهید کرد.
    • برای مشاهده خروجی، روی شبیه‌سازی کلیک کنید.
      حالت پیشرفته، کنترل‌هایی را برای اهداف اندازه‌گیری و ابعاد قابل پیگیری ارائه می‌دهد که در نوار کناری برجسته شده‌اند.
      رابط کاربری Noise Lab برای حالت پیشرفته.
      حالت پیشرفته همچنین یک گزینه استراتژی کلیدی در بخش پارامترها در نوار کناری است.
      رابط کاربری Noise Lab برای حالت پیشرفته.

معیارهای نویز

مفهوم اصلی

برای محافظت از حریم خصوصی کاربران، نویز اضافه می‌شود.

مقدار بالای نویز نشان می‌دهد که سطل‌ها/کلیدها پراکنده هستند و شامل مشارکت‌هایی از تعداد محدودی از رویدادهای حساس می‌باشند. این کار به طور خودکار توسط Noise Lab انجام می‌شود تا به افراد اجازه دهد "در میان جمعیت پنهان شوند" یا به عبارت دیگر، از حریم خصوصی این افراد محدود با مقدار بیشتری نویز اضافه شده محافظت کند.

مقدار نویز کم نشان می‌دهد که تنظیمات داده‌ها به گونه‌ای طراحی شده است که از قبل به افراد اجازه می‌دهد «در میان جمعیت پنهان شوند.» این بدان معناست که سطل‌ها حاوی داده‌هایی از تعداد کافی رویداد هستند تا تأیید شود که از حریم خصوصی کاربران محافظت می‌شود.

این جمله هم برای میانگین درصد خطا (APE) و هم برای RMSRE_T (ریشه میانگین مربعات خطای نسبی با آستانه) صادق است.

میانگین درصد خطا (APE)

APE نسبت نویز به سیگنال است، یعنی مقدار خلاصه واقعی.

مقادیر پایین‌تر APE به معنای نسبت سیگنال به نویز بهتر است.

فرمول

برای یک گزارش خلاصه داده شده، APE به صورت زیر محاسبه می‌شود:

معادله APE. مقادیر مطلق مورد نیاز هستند، زیرا نویز می‌تواند منفی باشد.
معادله APE. مقادیر مطلق مورد نیاز هستند، زیرا نویز می‌تواند منفی باشد.

مقدار خلاصه واقعی True است. APE میانگین نویز روی هر مقدار خلاصه واقعی است که روی تمام ورودی‌های یک گزارش خلاصه به طور میانگین محاسبه شده است. در Noise Lab، این مقدار در ۱۰۰ ضرب می‌شود تا درصد آن به دست آید.

مزایا و معایب

سطل‌هایی با اندازه‌های کوچکتر، تأثیر نامتناسبی بر مقدار نهایی APE دارند. این می‌تواند هنگام ارزیابی نویز گمراه‌کننده باشد. به همین دلیل است که ما معیار دیگری به نام RMSRE_T اضافه کرده‌ایم که برای کاهش این محدودیت APE طراحی شده است. برای جزئیات بیشتر، مثال‌ها را مرور کنید.

کد

کد منبع محاسبه APE را بررسی کنید.

RMSRE_T (ریشه میانگین مربعات خطای نسبی با یک آستانه)

RMSRE_T (ریشه میانگین مربعات خطای نسبی با یک آستانه) معیار دیگری برای نویز است.

نحوه تفسیر RMSRE_T

مقادیر پایین‌تر RMSRE_T به معنای نسبت سیگنال به نویز بهتر است.
برای مثال، اگر نسبت نویز قابل قبول برای مورد استفاده شما 20٪ و RMSRE_T برابر با 0.2 باشد، می‌توانید مطمئن باشید که سطح نویز در محدوده قابل قبول شما قرار می‌گیرد.

فرمول

برای یک گزارش خلاصه داده شده، RMSRE_T به صورت زیر محاسبه می‌شود:

فرمول
معادله RMSRE_T. مقادیر مطلق مورد نیاز هستند، زیرا نویز می‌تواند منفی باشد.
مزایا و معایب

درک RMSRE_T کمی پیچیده‌تر از APE است. با این حال، مزایایی دارد که در برخی موارد آن را برای تحلیل نویز در گزارش‌های خلاصه، مناسب‌تر از APE می‌کند:

  • RMSRE_T پایدارتر است. "T" یک آستانه است. "T" برای دادن وزن کمتر در محاسبه RMSRE_T به سطل‌هایی که تبدیل‌های کمتری دارند و بنابراین به دلیل اندازه کوچکشان به نویز حساس‌تر هستند، استفاده می‌شود. با T، این معیار روی سطل‌هایی با تبدیل‌های کم، جهش نمی‌کند. اگر T برابر با 5 باشد، مقدار نویزی به کوچکی 1 روی سطلی با 0 تبدیل، خیلی بیشتر از 1 نمایش داده نمی‌شود. در عوض، به 0.2 محدود می‌شود که معادل 1/5 است، زیرا T برابر با 5 است. با دادن وزن کمتر به سطل‌های کوچکتر که در نتیجه به نویز حساس‌تر هستند، این معیار پایدارتر است و بنابراین مقایسه دو شبیه‌سازی را آسان‌تر می‌کند.
  • RMSRE_T امکان تجمیع ساده را فراهم می‌کند. دانستن RMSRE_T چندین سطل، همراه با تعداد واقعی آنها، به شما امکان می‌دهد RMSRE_T حاصل جمع آنها را محاسبه کنید. این همچنین به شما امکان می‌دهد RMSRE_T را برای این مقادیر ترکیبی بهینه کنید.

اگرچه تجمیع برای APE امکان‌پذیر است، اما فرمول آن بسیار پیچیده است زیرا شامل مقدار مطلق مجموع نویزهای لاپلاس می‌شود. این امر بهینه‌سازی APE را دشوارتر می‌کند.

کد

کد منبع محاسبه RMSRE_T را بررسی کنید.

مثال‌ها

گزارش خلاصه با سه بخش:

  • bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_3 = نویز: ۲۰، مقدار trueSummaryValue: ۲۰۰

میانگین اثر بخشی (APE) = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

گزارش خلاصه با سه بخش:

  • bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_3 = نویز: 20، مقدار trueSummaryValue: 20

میانگین اثر بخشی (APE) = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

گزارش خلاصه با سه بخش:

  • bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
  • bucket_3 = نویز: ۲۰، مقدار trueSummaryValue: ۰

APE = (0.1 + 0.2 + بی‌نهایت) / 3 = بی‌نهایت

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

مدیریت پیشرفته کلید

یک شرکت DSP یا سنجش تبلیغات ممکن است هزاران مشتری تبلیغاتی جهانی داشته باشد که صنایع، ارزها و پتانسیل‌های قیمت خرید متعددی را در بر می‌گیرند. این بدان معناست که ایجاد و مدیریت یک کلید تجمیع برای هر تبلیغ‌کننده احتمالاً بسیار غیرعملی خواهد بود. علاوه بر این، انتخاب حداکثر ارزش قابل تجمیع و بودجه تجمیع که بتواند تأثیر نویز را در بین این هزاران تبلیغ‌کننده جهانی محدود کند، چالش برانگیز خواهد بود. در عوض، بیایید سناریوهای زیر را در نظر بگیریم:

استراتژی کلیدی الف

ارائه‌دهنده فناوری تبلیغات تصمیم می‌گیرد یک کلید واحد را برای همه مشتریان تبلیغاتی خود ایجاد و مدیریت کند. در بین همه تبلیغ‌کنندگان و همه ارزها، طیف خریدها از خریدهای کم‌حجم و گران‌قیمت تا خریدهای پرحجم و ارزان‌قیمت متغیر است. این منجر به کلید زیر می‌شود:

کلید (چندین ارز)
حداکثر مقدار قابل تجمیع ۵،۰۰۰،۰۰۰
محدوده ارزش خرید [۱۲۰ - ۵۰۰۰۰۰]
استراتژی کلیدی ب

ارائه‌دهنده فناوری تبلیغات تصمیم می‌گیرد دو کلید را برای همه مشتریان تبلیغاتی خود ایجاد و مدیریت کند. آنها تصمیم می‌گیرند کلیدها را بر اساس واحد پول از هم جدا کنند. در بین همه تبلیغ‌کنندگان و همه واحد پول‌ها، طیف خریدها از خریدهای کم‌حجم و گران‌قیمت تا خریدهای پرحجم و ارزان‌قیمت متفاوت است. با جدا کردن بر اساس واحد پول، آنها دو کلید ایجاد می‌کنند:

کلید ۱ (دلار آمریکا) کلید ۲ (¥)
حداکثر مقدار قابل تجمیع ۴۰،۰۰۰ دلار ۵،۰۰۰،۰۰۰ ین
محدوده ارزش خرید [120 - 40,000] [۱۵۰۰۰ - ۵۰۰۰۰۰۰]

استراتژی کلیدی B در نتیجه خود نسبت به استراتژی کلیدی A نویز کمتری خواهد داشت، زیرا ارزش ارزها به طور یکنواخت بین ارزها توزیع نشده است. به عنوان مثال، در نظر بگیرید که چگونه خریدهای تعیین شده بر اساس ین در کنار خریدهای تعیین شده بر اساس دلار آمریکا، داده‌های اساسی و خروجی نویزدار حاصل را تغییر می‌دهند.

استراتژی کلیدی ج

ارائه‌دهنده فناوری تبلیغات تصمیم می‌گیرد چهار کلید را در بین تمام مشتریان تبلیغاتی خود ایجاد و مدیریت کند و آنها را بر اساس صنعت ارز × تبلیغ‌کننده از هم جدا کند:

کلید ۱
(دلار آمریکا ضربدر تبلیغ‌کنندگان جواهرات لوکس)
کلید ۲
(¥ x تبلیغ‌کنندگان جواهرات لوکس)
کلید ۳
(دلار آمریکا ضربدر تبلیغ‌کنندگان خرده‌فروشی پوشاک)
کلید ۴
(¥ x تبلیغ‌کنندگان خرده‌فروشی پوشاک)
حداکثر مقدار قابل تجمیع ۴۰،۰۰۰ دلار ۵،۰۰۰،۰۰۰ ین ۵۰۰ دلار ۶۵۰۰۰ ین
محدوده ارزش خرید [۱۰،۰۰۰ - ۴۰،۰۰۰] [۱,۲۵۰,۰۰۰ - ۵,۰۰۰,۰۰۰] [120 - 500] [۱۵۰۰۰ - ۶۵۰۰۰]

استراتژی کلیدی C در نتیجه خود نسبت به استراتژی کلیدی B نویز کمتری خواهد داشت، زیرا ارزش خرید تبلیغ‌کننده به طور یکنواخت در بین تبلیغ‌کنندگان توزیع نشده است. به عنوان مثال، در نظر بگیرید که چگونه خرید جواهرات لوکس همراه با خرید کلاه بیسبال، داده‌های اساسی و خروجی نویزدار حاصل را تغییر می‌دهد.

ایجاد حداکثر مقادیر تجمعی مشترک و ضرایب مقیاس‌بندی مشترک برای نقاط مشترک در بین چندین تبلیغ‌کننده را در نظر بگیرید تا نویز در خروجی کاهش یابد. به عنوان مثال، می‌توانید استراتژی‌های زیر را برای تبلیغ‌کنندگان خود آزمایش کنید:

  • یک استراتژی که بر اساس ارز (USD، ین، CAD و غیره) جدا شده است
  • یک استراتژی مجزا بر اساس صنعت تبلیغ‌کننده (بیمه، خودرو، خرده‌فروشی و غیره)
  • یک استراتژی که با محدوده‌های ارزش خرید مشابه ([100]، [1000]، [10000] و غیره) از هم جدا شده است.

با ایجاد استراتژی‌های کلیدی پیرامون مشترکات تبلیغ‌کنندگان، مدیریت کلیدها و کد مربوطه آسان‌تر می‌شود و نسبت سیگنال به نویز بالاتر می‌رود. استراتژی‌های مختلف با مشترکات تبلیغ‌کنندگان مختلف را آزمایش کنید تا نقاط عطف را در به حداکثر رساندن تأثیر نویز در مقابل مدیریت کد کشف کنید.


مدیریت پیشرفته داده‌های پرت

بیایید سناریویی را برای دو تبلیغ‌کننده در نظر بگیریم:

  • آگهی دهنده الف:
    • در تمام محصولات موجود در سایت تبلیغ‌کننده A، گزینه‌های قیمت خرید بین [۱۲۰ تا ۱۰۰۰ دلار] است که در مجموع ۸۸۰ دلار می‌شود.
    • قیمت‌های خرید به طور مساوی در محدوده ۸۸۰ دلار توزیع شده‌اند و هیچ داده پرتی خارج از دو انحراف معیار از قیمت خرید میانه وجود ندارد.
  • تبلیغ کننده ب:
    • در تمام محصولات موجود در سایت تبلیغ‌کننده B، گزینه‌های قیمت خرید بین [۱۲۰ تا ۱۰۰۰ دلار] است که در مجموع ۸۸۰ دلار می‌شود.
    • قیمت‌های خرید به شدت به سمت محدوده ۱۲۰ تا ۵۰۰ دلار متمایل هستند و تنها ۵٪ از خریدها در محدوده ۵۰۰ تا ۱۰۰۰ دلار اتفاق می‌افتند.

با توجه به الزامات بودجه مشارکت و روشی که با آن نویز به نتایج نهایی اعمال می‌شود ، تبلیغ‌کننده B به طور پیش‌فرض خروجی نویزدارتری نسبت به تبلیغ‌کننده A خواهد داشت، زیرا تبلیغ‌کننده B پتانسیل بیشتری برای تأثیرگذاری داده‌های پرت بر محاسبات اساسی دارد.

می‌توان با تنظیم یک کلید خاص، این مشکل را کاهش داد. استراتژی‌های کلیدی را آزمایش کنید که به مدیریت داده‌های پرت و توزیع یکنواخت‌تر مقادیر خرید در محدوده خرید کلید کمک می‌کنند.

برای تبلیغ‌کننده‌ی ب، می‌توانید دو کلید جداگانه برای ثبت دو محدوده‌ی ارزش خرید مختلف ایجاد کنید. در این مثال، تکنسین تبلیغات متوجه شده است که داده‌های پرت (outlier) بالاتر از ارزش خرید ۵۰۰ دلار ظاهر می‌شوند. سعی کنید دو کلید جداگانه برای این تبلیغ‌کننده پیاده‌سازی کنید:

  • ساختار کلید ۱: کلیدی که فقط خریدهای بین ۱۲۰ تا ۵۰۰ دلار را در بر می‌گیرد (که تقریباً ۹۵٪ از کل حجم خرید را پوشش می‌دهد).
  • ساختار کلیدی ۲: کلیدی که فقط خریدهای بالای ۵۰۰ دلار را شامل می‌شود (حدود ۵٪ از کل حجم خرید را پوشش می‌دهد).

Implementing this key strategy should better manage noise for Advertiser B and help to maximize utility for them from summary reports. Given the new smaller ranges, Key A and Key B should now have a more uniform distribution of data across each respective key that for the previous single key. This will result in less noise impact in each key's output that for the previous single key.