درباره این سند
با خواندن این سند، شما:
- قبل از تهیه گزارشهای خلاصه، استراتژیهایی را که باید ایجاد کنید، درک کنید.
- با آزمایشگاه نویز آشنا شوید، ابزاری که به درک اثرات پارامترهای مختلف نویز کمک میکند و امکان بررسی و ارزیابی سریع استراتژیهای مختلف مدیریت نویز را فراهم میکند.

بازخورد خود را به اشتراک بگذارید
اگرچه این سند چند اصل برای کار با گزارشهای خلاصه را خلاصه میکند، رویکردهای متعددی برای مدیریت نویز وجود دارد که ممکن است در اینجا منعکس نشده باشند. از پیشنهادات، اضافات و سوالات شما استقبال میشود!
- برای ارائه بازخورد عمومی در مورد استراتژیهای مدیریت نویز، در مورد سودمندی یا حریم خصوصی API (اپسیلون)، و به اشتراک گذاشتن مشاهدات خود هنگام شبیهسازی با آزمایشگاه نویز: نظر خود را در مورد این موضوع بنویسید
- برای ارائه بازخورد عمومی در مورد جنبه دیگری از API: یک مشکل جدید در اینجا ایجاد کنید
قبل از شروع
- برای آشنایی بیشتر ، گزارشهای خلاصه گزارشهای انتسابی و مرور کلی سیستم گزارش انتسابی را مطالعه کنید.
- برای استفاده بهینه از این راهنما، درک نویز و درک کلیدهای تجمیع را بررسی کنید.
تصمیمات طراحی
اصل طراحی هسته
تفاوتهای اساسی بین نحوه عملکرد کوکیهای شخص ثالث و گزارشهای خلاصه وجود دارد. یکی از تفاوتهای کلیدی، نویز اضافه شده به دادههای اندازهگیری در گزارشهای خلاصه است. تفاوت دیگر، نحوه زمانبندی گزارشها است.
برای دسترسی به دادههای اندازهگیری گزارش خلاصه با نسبت سیگنال به نویز بالاتر، پلتفرمهای سمت تقاضا (DSP) و ارائهدهندگان اندازهگیری تبلیغات باید با تبلیغکنندگان خود برای توسعه استراتژیهای مدیریت نویز همکاری کنند. برای توسعه این استراتژیها، DSPها و ارائهدهندگان اندازهگیری باید تصمیمات طراحی بگیرند. این تصمیمات حول یک مفهوم اساسی میچرخند:
اگرچه مقادیر نویز توزیع از دو پارامتر - اپسیلون و بودجه مشارکت - استخراج میشوند، اما شما تعدادی کنترل دیگر در اختیار دارید که بر نسبت سیگنال به نویز دادههای اندازهگیری خروجی شما تأثیر میگذارند.
اگرچه انتظار داریم یک فرآیند تکراری به بهترین تصمیمات منجر شود، اما هر تغییر در این تصمیمات منجر به پیادهسازی کمی متفاوت خواهد شد - بنابراین این تصمیمات باید قبل از نوشتن هر تکرار کد (و قبل از اجرای تبلیغات) گرفته شوند.
تصمیم: جزئیات ابعاد
آن را در آزمایشگاه نویز امتحان کنید
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال دادههای تبدیل خود (Your conversion data) بگردید.
- پارامترهای پیشفرض را رعایت کنید. به طور پیشفرض، تعداد کل تبدیلهای قابل انتساب روزانه ۱۰۰۰ است. اگر از تنظیمات پیشفرض استفاده کنید (ابعاد پیشفرض، تعداد پیشفرض مقادیر مختلف ممکن برای هر بُعد، استراتژی کلیدی A)، این مقدار به طور متوسط تقریباً ۴۰ برای هر سطل میشود. توجه داشته باشید که مقدار ورودی Average daily attributable conversion count PER BUCKET برابر با ۴۰ است.
- برای اجرای شبیهسازی با پارامترهای پیشفرض، روی «شبیهسازی» کلیک کنید.
- در پنل کناری پارامترها، به دنبال Dimensions بگردید. نام Geography را به City تغییر دهید و تعداد مقادیر مختلف ممکن را به ۵۰ تغییر دهید.
- مشاهده کنید که چگونه این تغییر، میانگین تعداد تبدیلهای قابل انتساب روزانه به ازای هر سطل را تغییر میدهد. اکنون بسیار کمتر است. دلیل این امر این است که اگر تعداد مقادیر ممکن را در این بُعد بدون تغییر هیچ چیز دیگری افزایش دهید، تعداد کل سطلها را بدون تغییر تعداد رویدادهای تبدیل در هر سطل افزایش میدهید.
- روی شبیهسازی کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید: نسبتهای نویز اکنون بالاتر از شبیهسازی قبلی هستند.
با توجه به اصل طراحی اصلی ، مقادیر خلاصه کوچک احتمالاً نویز بیشتری نسبت به مقادیر خلاصه بزرگ دارند. بنابراین، انتخاب پیکربندی شما بر تعداد رویدادهای تبدیل نسبت داده شده در هر سطل (که در غیر این صورت به عنوان کلید تجمیع شما نامیده میشود) تأثیر میگذارد و این مقدار بر نویز در گزارشهای خلاصه خروجی نهایی تأثیر میگذارد.
یکی از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر میگذارد، دانهبندی ابعاد است. مثالهای زیر از کلیدهای تجمیع و ابعاد آنها را در نظر بگیرید:
- رویکرد ۱: یک ساختار کلیدی با ابعاد کلی: کشور × کمپین تبلیغاتی (یا بزرگترین مجموعه کمپین) × نوع محصول (از بین ۱۰ نوع محصول ممکن)
- رویکرد ۲: یک ساختار کلیدی با ابعاد جزئی: شهر × هویت خلاق × محصول (از بین ۱۰۰ محصول ممکن)
شهر بُعد جزئیتری نسبت به کشور دارد؛ شناسه خلاق جزئیتر از کمپین است؛ و محصول جزئیتر از نوع محصول است. بنابراین، رویکرد ۲ در خروجی گزارش خلاصه خود تعداد کمتری رویداد (تبدیل) در هر سطل (= در هر کلید) نسبت به رویکرد ۱ خواهد داشت. با توجه به اینکه نویز اضافه شده به خروجی مستقل از تعداد رویدادهای موجود در سطل است، دادههای اندازهگیری در گزارشهای خلاصه با رویکرد ۲ نویز بیشتری خواهند داشت. برای هر تبلیغکننده، با مصالحههای جزئی مختلف در طراحی کلید آزمایش کنید تا حداکثر سودمندی را در نتایج داشته باشید.
تصمیم: ساختارهای کلیدی
آن را در آزمایشگاه نویز امتحان کنید
در حالت ساده، از ساختار کلید پیشفرض استفاده میشود. در حالت پیشرفته، میتوانید ساختارهای کلید متفاوتی را آزمایش کنید. چند نمونه از ابعاد گنجانده شده است؛ همچنین میتوانید این ابعاد را تغییر دهید.
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال استراتژی کلیدی باشید. توجه داشته باشید که استراتژی پیشفرض، که در ابزار با نام A شناخته میشود، از یک ساختار کلیدی دقیق استفاده میکند که شامل همه ابعاد است: جغرافیا x شناسه کمپین x دسته محصول.
- روی شبیهسازی کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید.
- استراتژی کلید را به B تغییر دهید. این کار کنترلهای بیشتری را برای پیکربندی ساختار کلید شما نمایش میدهد.
- ساختار کلید خود را به صورت زیر پیکربندی کنید:
- تعداد ساختارهای کلیدی: ۲
- ساختار کلیدی ۱ = جغرافیا × دستهبندی محصول.
- ساختار کلیدی ۲ = شناسه کمپین × دسته محصول.
- روی شبیهسازی کلیک کنید.
- توجه داشته باشید که اکنون با توجه به اینکه از دو ساختار کلیدی متمایز استفاده میکنید، برای هر نوع هدف اندازهگیری، دو گزارش خلاصه دریافت میکنید (دو گزارش برای تعداد خرید، دو گزارش برای ارزش خرید). نسبتهای نویز آنها را مشاهده کنید.
- همچنین میتوانید این کار را با ابعاد سفارشی خودتان امتحان کنید. برای انجام این کار، به دنبال دادههایی باشید که میخواهید ردیابی کنید: ابعاد. حذف ابعاد نمونه و ایجاد ابعاد خودتان را با استفاده از دکمههای افزودن/حذف/تنظیم مجدد در زیر آخرین بعد در نظر بگیرید.
یکی دیگر از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر میگذارد، ساختارهای کلیدی است که تصمیم به استفاده از آنها دارید. مثالهای زیر از کلیدهای تجمیع را در نظر بگیرید:
- یک ساختار کلیدی با تمام ابعاد؛ بیایید آن را استراتژی کلیدی A بنامیم.
- دو ساختار کلیدی، هر کدام با زیرمجموعهای از ابعاد؛ بیایید این را استراتژی کلیدی B بنامیم.

استراتژی الف سادهتر است - اما ممکن است لازم باشد مقادیر خلاصه نویزدار شامل گزارشهای خلاصه را برای دسترسی به بینشهای خاص، جمع کنید (یا به اصطلاح roll up کنید). با جمع کردن این مقادیر، نویز را نیز جمع میکنید. با استراتژی ب، مقادیر خلاصهای که در گزارشهای خلاصه نمایش داده میشوند، ممکن است از قبل اطلاعات مورد نیاز شما را در اختیارتان قرار دهند. این بدان معناست که استراتژی ب احتمالاً منجر به نسبت سیگنال به نویز بهتری نسبت به استراتژی الف خواهد شد. با این حال، نویز ممکن است از قبل با استراتژی الف قابل قبول باشد، بنابراین ممکن است همچنان به دلیل سادگی، استراتژی الف را ترجیح دهید. در مثال مفصلی که این دو استراتژی را شرح میدهد، اطلاعات بیشتری کسب کنید .
مدیریت کلید موضوع عمیقی است. تعدادی تکنیک پیچیده را میتوان برای بهبود نسبت سیگنال به نویز در نظر گرفت. یکی از آنها در مدیریت کلید پیشرفته توضیح داده شده است.
تصمیم: فرکانس دسته بندی
آن را در آزمایشگاه نویز امتحان کنید
- به حالت ساده (یا حالت پیشرفته - هر دو حالت در مورد فرکانس دسته بندی به یک شکل کار می کنند) بروید
- در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > فراوانی دسته بندی باشید. این به فراوانی دسته بندی گزارشهای قابل تجمیع اشاره دارد که با سرویس تجمیع در یک کار واحد پردازش میشوند.
- به فرکانس پیشفرض دستهبندی توجه کنید: بهطور پیشفرض، فرکانس دستهبندی روزانه شبیهسازی میشود.
- روی شبیهسازی کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید.
- فرکانس دسته بندی را به هفتگی تغییر دهید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید: نسبتهای نویز اکنون کمتر (بهتر) از شبیهسازی قبلی هستند.
یکی دیگر از تصمیمات طراحی که بر تعداد رویدادهای تبدیل نسبت داده شده در یک سطل واحد تأثیر میگذارد، فرکانس دسته بندی است که شما تصمیم به استفاده از آن دارید. فرکانس دسته بندی این است که چند بار گزارشهای قابل جمع آوری را پردازش میکنید.
گزارشی که برای تجمیع با فواصل زمانی بیشتر (مثلاً هر ساعت) برنامهریزی شده باشد، رویدادهای تبدیل کمتری نسبت به همان گزارش با برنامه تجمیع با فواصل زمانی کمتر (مثلاً هر هفته) خواهد داشت. در نتیجه، گزارش ساعتی نویز بیشتری را شامل خواهد شد. در صورت برابر بودن سایر شرایط، گزارش ساعتی نسبت سیگنال به نویز کمتری نسبت به گزارش هفتگی خواهد داشت. الزامات گزارشدهی را در فرکانسهای مختلف آزمایش کنید و نسبت سیگنال به نویز را برای هر کدام ارزیابی کنید.
برای کسب اطلاعات بیشتر به بخش دستهبندی و تجمیع در بازههای زمانی طولانیتر مراجعه کنید.
تصمیم: متغیرهای کمپین که بر تبدیلهای قابل انتساب تأثیر میگذارند
آن را در آزمایشگاه نویز امتحان کنید
اگرچه پیشبینی این موضوع میتواند دشوار باشد و علاوه بر اثرات فصلی، میتواند تغییرات قابل توجهی داشته باشد، سعی کنید تعداد تبدیلهای قابل انتساب روزانه با یک لمس را به نزدیکترین توان ۱۰ تخمین بزنید: ۱۰، ۱۰۰، ۱۰۰۰ یا ۱۰۰۰۰.
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال دادههای تبدیل خود (Your conversion data) بگردید.
- پارامترهای پیشفرض را رعایت کنید. به طور پیشفرض، تعداد کل تبدیلهای قابل انتساب روزانه ۱۰۰۰ است. اگر از تنظیمات پیشفرض استفاده کنید (ابعاد پیشفرض، تعداد پیشفرض مقادیر مختلف ممکن برای هر بُعد، استراتژی کلیدی A)، این مقدار به طور متوسط تقریباً ۴۰ برای هر سطل میشود. توجه داشته باشید که مقدار ورودی Average daily attributable conversion count PER BUCKET برابر با ۴۰ است.
- برای اجرای شبیهسازی با پارامترهای پیشفرض، روی «شبیهسازی» کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید.
- حالا تعداد کل تبدیلهای قابل انتساب روزانه را روی ۱۰۰ تنظیم کنید. توجه داشته باشید که این کار، مقدار میانگین تعداد تبدیلهای قابل انتساب روزانه به ازای هر سطل را کاهش میدهد.
- روی شبیهسازی کلیک کنید.
- توجه داشته باشید که نسبت نویز اکنون بالاتر است: دلیل این امر این است که وقتی تعداد تبدیلها در هر سطل کمتر است، نویز بیشتری برای حفظ حریم خصوصی اعمال میشود.
یک تمایز مهم، تعداد کل تبدیلهای ممکن برای یک تبلیغکننده در مقابل تعداد کل تبدیلهای نسبت داده شدهی ممکن است. مورد دوم در نهایت بر نویز در گزارشهای خلاصه تأثیر میگذارد. تبدیلهای نسبت داده شده زیرمجموعهای از کل تبدیلها هستند که مستعد متغیرهای کمپین، مانند بودجه تبلیغات و هدفگذاری تبلیغات، هستند. به عنوان مثال، انتظار میرود تعداد تبدیلهای نسبت داده شده برای یک کمپین تبلیغاتی ۱۰ میلیون دلاری در مقایسه با یک کمپین تبلیغاتی ۱۰ هزار دلاری، در صورت برابر بودن سایر موارد، بیشتر باشد.
مواردی که باید در نظر گرفته شوند:
- تبدیلهای نسبت داده شده را در برابر یک مدل نسبتدهی تک لمسی و مشابه دستگاه ارزیابی کنید، زیرا این موارد در محدوده گزارشهای خلاصه جمعآوری شده با API گزارشدهی نسبتدهی قرار دارند.
- برای تبدیلهای نسبت داده شده، هم تعداد بدترین حالت و هم تعداد بهترین حالت را در نظر بگیرید. به عنوان مثال، با فرض ثابت بودن سایر شرایط، حداقل و حداکثر بودجه کمپین ممکن برای یک تبلیغکننده را در نظر بگیرید، سپس تبدیلهای نسبت داده شده را برای هر دو نتیجه به عنوان ورودی در شبیهسازی خود پیشبینی کنید.
- اگر به استفاده از Android Privacy Sandbox فکر میکنید، تبدیلهای نسبت داده شده بین پلتفرمی را در محاسبه در نظر بگیرید.
تصمیم: استفاده از مقیاسبندی
آن را در آزمایشگاه نویز امتحان کنید
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > مقیاسبندی باشید. این گزینه به طور پیشفرض روی بله تنظیم شده است.
- برای درک اثرات مثبت مقیاسبندی بر نسبت نویز، ابتدا Scaling را روی No تنظیم کنید.
- روی شبیهسازی کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید.
- مقیاسبندی را روی بله تنظیم کنید. توجه داشته باشید که Noise Lab به طور خودکار ضرایب مقیاسبندی مورد استفاده را با توجه به محدودههای (مقادیر متوسط و حداکثر) اهداف اندازهگیری برای سناریوی شما محاسبه میکند. در یک سیستم واقعی یا تنظیمات آزمایشی مبدا، بهتر است محاسبات خود را برای ضرایب مقیاسبندی پیادهسازی کنید.
- روی شبیهسازی کلیک کنید.
- مشاهده کنید که نسبتهای نویز در این شبیهسازی دوم اکنون کمتر (بهتر) هستند. این به این دلیل است که شما از مقیاسبندی استفاده میکنید.
با توجه به اصل طراحی اصلی ، نویز اضافه شده تابعی از بودجه مشارکت است.
بنابراین، برای افزایش نسبت سیگنال به نویز، میتوانید تصمیم بگیرید که مقادیر جمعآوریشده در طول یک رویداد تبدیل را با مقیاسبندی آنها در برابر بودجه مشارکت (و کاهش مقیاس آنها پس از تجمیع) تبدیل کنید. از مقیاسبندی برای افزایش نسبت سیگنال به نویز استفاده کنید.
تصمیم: تعداد اهداف اندازهگیری و تقسیم بودجه حریم خصوصی
این مربوط به مقیاسبندی است؛ حتماً بخش «استفاده از مقیاسبندی» را مطالعه کنید.
آن را در آزمایشگاه نویز امتحان کنید
هدف اندازهگیری، یک نقطه داده متمایز است که در رویدادهای تبدیل جمعآوری میشود.
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال دادههایی باشید که میخواهید پیگیری کنید: اهداف اندازهگیری. به طور پیشفرض، شما دو هدف اندازهگیری دارید: ارزش خرید و تعداد خرید.
- برای اجرای شبیهسازی با اهداف پیشفرض، روی «شبیهسازی» کلیک کنید.
- روی حذف کلیک کنید. این کار آخرین هدف اندازهگیری (در این مورد تعداد خرید) را حذف میکند.
- روی شبیهسازی کلیک کنید.
- مشاهده کنید که نسبتهای نویز برای ارزش خرید اکنون برای این شبیهسازی دوم کمتر (بهتر) هستند. دلیل این امر این است که شما اهداف اندازهگیری کمتری دارید، بنابراین اکنون یک هدف اندازهگیری شما تمام بودجه مشارکت را به خود اختصاص میدهد.
- روی تنظیم مجدد کلیک کنید. اکنون دوباره دو هدف اندازهگیری دارید: ارزش خرید و تعداد خرید. توجه داشته باشید که Noise Lab به طور خودکار عوامل مقیاسبندی مورد استفاده را با توجه به محدودهها (مقادیر متوسط و حداکثر) اهداف اندازهگیری برای سناریوی شما محاسبه میکند. به طور پیشفرض، Noise Lab بودجه را به طور مساوی بین اهداف اندازهگیری تقسیم میکند.
- روی شبیهسازی کلیک کنید.
- نسبتهای نویز شبیهسازی حاصل را مشاهده کنید. به ضرایب مقیاسبندی نمایش داده شده در شبیهسازی توجه کنید.
- حالا، بیایید تقسیم بودجه حریم خصوصی را سفارشی کنیم تا به نسبت سیگنال به نویز بهتری دست یابیم.
- درصد بودجه اختصاص داده شده برای هر هدف اندازهگیری را تغییر دهید. با توجه به پارامترهای پیشفرض، هدف اندازهگیری ۱، یعنی ارزش خرید، دامنه بسیار وسیعتری (بین ۰ تا ۱۰۰۰) نسبت به هدف اندازهگیری ۲، یعنی تعداد خرید (بین ۱ تا ۱ یعنی همیشه برابر با ۱) دارد. به همین دلیل، به "فضای بیشتری برای مقیاسبندی" نیاز دارد: ایدهآل این است که بودجه مشارکت بیشتری به هدف اندازهگیری ۱ نسبت به هدف اندازهگیری ۲ اختصاص داده شود تا بتوان آن را به طور کارآمدتری مقیاسبندی کرد (به مقیاسبندی مراجعه کنید) و از این رو
- ۷۰٪ از بودجه را به هدف اندازهگیری ۱ اختصاص دهید. ۳۰٪ را به هدف اندازهگیری ۲ اختصاص دهید.
- روی شبیهسازی کلیک کنید.
- به نسبتهای نویز شبیهسازی حاصل توجه کنید. برای ارزش خرید، نسبتهای نویز اکنون به طور قابل توجهی پایینتر (بهتر) از شبیهسازی قبلی هستند. برای تعداد خرید، تقریباً بدون تغییر باقی ماندهاند.
- به تغییر تدریجی تقسیم بودجه بین معیارها ادامه دهید. مشاهده کنید که چگونه این امر بر نویز تأثیر میگذارد.
توجه داشته باشید که میتوانید اهداف اندازهگیری سفارشی خود را با دکمههای افزودن/حذف/تنظیم مجدد تنظیم کنید.
اگر یک نقطه داده (هدف اندازهگیری) را در یک رویداد تبدیل، مانند تعداد تبدیل، اندازهگیری کنید، آن نقطه داده میتواند تمام بودجه مشارکت (۶۵۵۳۶) را دریافت کند. اگر چندین هدف اندازهگیری را در یک رویداد تبدیل، مانند تعداد تبدیل و ارزش خرید، تعیین کنید، آن نقاط داده باید بودجه مشارکت را به اشتراک بگذارند. این بدان معناست که شما آزادی عمل کمتری برای افزایش مقادیر خود دارید.
بنابراین، هرچه اهداف اندازهگیری بیشتری داشته باشید، احتمالاً نسبت سیگنال به نویز پایینتری خواهید داشت (نویز بالاتر).
تصمیم دیگری که باید در مورد اهداف اندازهگیری گرفته شود، تقسیم بودجه است. اگر بودجه مشارکت را به طور مساوی بین دو نقطه داده تقسیم کنید، هر نقطه داده بودجهای برابر با ۶۵۵۳۶/۲ = ۳۲۷۶۸ دریافت میکند. این بسته به حداکثر مقدار ممکن برای هر نقطه داده، ممکن است بهینه باشد یا نباشد. به عنوان مثال، اگر تعداد خرید را با حداکثر مقدار ۱ و ارزش خرید را با حداقل ۱ و حداکثر ۱۲۰ اندازهگیری میکنید، ارزش خرید از داشتن «فضای بیشتر» برای افزایش مقیاس - یعنی اختصاص بخش بزرگتری از بودجه مشارکت - سود میبرد. خواهید دید که آیا برخی از اهداف اندازهگیری باید در رابطه با تأثیر نویز بر سایرین اولویتبندی شوند یا خیر.
تصمیم: مدیریت دادههای پرت
آن را در آزمایشگاه نویز امتحان کنید
هدف اندازهگیری، یک نقطه داده متمایز است که در رویدادهای تبدیل جمعآوری میشود.
- به حالت پیشرفته بروید.
- در پنل کناری پارامترها، به دنبال استراتژی تجمیع شما > مقیاسبندی باشید.
- مطمئن شوید که مقیاسبندی روی بله تنظیم شده است. توجه داشته باشید که Noise Lab به طور خودکار ضرایب مقیاسبندی مورد استفاده را بر اساس محدودههایی (مقادیر میانگین و حداکثر) که برای اهداف اندازهگیری ارائه دادهاید، محاسبه میکند.
- بیایید فرض کنیم که بزرگترین خریدی که تاکنون انجام شده ۲۰۰۰ دلار بوده است، اما بیشتر خریدها در محدوده ۱۰ تا ۱۲۰ دلار اتفاق میافتند. ابتدا، بیایید ببینیم اگر از رویکرد مقیاسبندی تحتاللفظی استفاده کنیم (توصیه نمیشود) چه اتفاقی میافتد: ۲۰۰۰ دلار را به عنوان حداکثر مقدار برای purchaseValue وارد کنید.
- روی شبیهسازی کلیک کنید.
- توجه داشته باشید که نسبتهای نویز بالا هستند. دلیل این امر این است که ضریب مقیاسبندی ما بر اساس ۲۰۰۰ دلار محاسبه شده است، در حالی که در واقعیت، اکثر مقادیر خرید به طور قابل توجهی کمتر از این مقدار خواهند بود.
- حالا، بیایید از یک رویکرد مقیاسبندی عملیتر استفاده کنیم. حداکثر ارزش خرید را به ۱۲۰ دلار تغییر دهید.
- روی شبیهسازی کلیک کنید.
- مشاهده کنید که نسبتهای نویز در این شبیهسازی دوم کمتر (بهتر) هستند.
برای پیادهسازی مقیاسبندی، معمولاً یک ضریب مقیاسبندی را بر اساس حداکثر مقدار ممکن برای یک رویداد تبدیل معین محاسبه میکنید ( برای اطلاعات بیشتر به این مثال مراجعه کنید ).
با این حال، از استفاده از یک مقدار حداکثر واقعی برای محاسبه آن ضریب مقیاسبندی خودداری کنید، زیرا این کار نسبت سیگنال به نویز شما را بدتر میکند. در عوض، دادههای پرت را حذف کرده و از یک مقدار حداکثر عملی استفاده کنید.
مدیریت دادههای پرت موضوع عمیقی است. تعدادی تکنیک پیچیده را میتوان برای بهبود نسبت سیگنال به نویز در نظر گرفت. یکی از آنها در مدیریت پیشرفته دادههای پرت توضیح داده شده است.
مراحل بعدی
اکنون که استراتژیهای مختلف مدیریت نویز را برای مورد استفاده خود ارزیابی کردهاید، آمادهاید تا با جمعآوری دادههای اندازهگیری واقعی با استفاده از یک آزمایش مبدا، آزمایش گزارشهای خلاصه را آغاز کنید. راهنماها و نکات را برای امتحان کردن API مرور کنید.
پیوست
تور سریع آزمایشگاه نویز
آزمایشگاه نویز به شما کمک میکند تا به سرعت استراتژیهای مدیریت نویز را ارزیابی و مقایسه کنید. از آن برای موارد زیر استفاده کنید:
- پارامترهای اصلی که میتوانند بر نویز تأثیر بگذارند و تأثیر آنها را درک کنید.
- با توجه به تصمیمات طراحی مختلف، تأثیر نویز را بر دادههای اندازهگیری خروجی شبیهسازی کنید. پارامترهای طراحی را تا زمانی که به نسبت سیگنال به نویزی برسید که برای مورد استفاده شما مناسب باشد، تغییر دهید.
- بازخورد خود را در مورد کاربرد گزارشهای خلاصه به اشتراک بگذارید: کدام مقادیر پارامترهای اپسیلون و نویز برای شما کار میکنند، کدامها نه؟ نقاط عطف کجا هستند؟
این را به عنوان یک مرحله آمادهسازی در نظر بگیرید. Noise Lab دادههای اندازهگیری را برای شبیهسازی خروجیهای گزارش خلاصه بر اساس ورودی شما تولید میکند. این ابزار هیچ دادهای را ذخیره یا به اشتراک نمیگذارد.
دو حالت مختلف در Noise Lab وجود دارد:
- حالت ساده: اصول کنترلهایی که روی نویز دارید را درک کنید.
- حالت پیشرفته: استراتژیهای مختلف مدیریت نویز را آزمایش کنید و ارزیابی کنید که کدام یک منجر به بهترین نسبت سیگنال به نویز برای موارد استفاده شما میشود.
برای تغییر بین دو حالت ( حالت اول در تصویر زیر ) روی دکمههای منوی بالا کلیک کنید.
حالت ساده
- با حالت ساده، شما پارامترهایی (که در سمت چپ یا شماره ۲ در تصویر زیر یافت میشوند) مانند اپسیلون را کنترل میکنید و میبینید که چگونه بر نویز تأثیر میگذارند.
- هر پارامتر یک راهنمای ابزار (دکمه `?`) دارد. برای دیدن توضیح هر پارامتر، روی آنها کلیک کنید ( شماره ۳. در تصویر زیر ).
- برای شروع، روی دکمهی «شبیهسازی» کلیک کنید و خروجی را مشاهده کنید ( شماره ۴. در تصویر زیر )
- در بخش خروجی میتوانید جزئیات متنوعی را مشاهده کنید. کنار برخی از عناصر علامت `?` وجود دارد. برای دیدن توضیحی در مورد بخشهای مختلف اطلاعات، روی هر `?` کلیک کنید.
- اگر میخواهید نسخهی بسطیافتهی جدول را ببینید ( شماره ۵ در تصویر زیر )، در بخش خروجی (Output)، روی گزینهی جزئیات (Details) کلیک کنید.
- بعد از هر جدول داده در بخش خروجی، گزینهای برای دانلود جدول برای استفاده آفلاین وجود دارد. علاوه بر این، در گوشه پایین سمت راست گزینهای برای دانلود تمام جداول داده وجود دارد ( شماره ۶. در تصویر زیر ).
- تنظیمات مختلف را برای پارامترها در بخش Parameters امتحان کنید و روی Simulate کلیک کنید تا ببینید چگونه بر خروجی تأثیر میگذارند:

رابط کاربری Noise Lab برای حالت ساده.
حالت پیشرفته
- در حالت پیشرفته، کنترل بیشتری روی پارامترها دارید. میتوانید اهداف اندازهگیری و ابعاد سفارشی ( شماره ۱ و شماره ۲ در تصویر زیر ) اضافه کنید.
- در بخش پارامترها به پایین اسکرول کنید و گزینه Key Strategy را ببینید. از این گزینه میتوان برای آزمایش ساختارهای کلیدی مختلف استفاده کرد ( شماره ۳. در تصویر زیر ).
- برای آزمایش ساختارهای کلیدی مختلف، استراتژی کلیدی را به «ب» تغییر دهید.
- تعداد ساختارهای کلیدی مختلفی که میخواهید استفاده کنید را وارد کنید (پیشفرض روی "2" تنظیم شده است)
- روی ایجاد ساختارهای کلیدی کلیک کنید
- با کلیک روی کادرهای انتخاب کنار کلیدهایی که میخواهید برای هر ساختار کلیدی لحاظ کنید، گزینههایی برای مشخص کردن ساختارهای کلیدی خود مشاهده خواهید کرد.
- برای مشاهده خروجی، روی شبیهسازی کلیک کنید.

رابط کاربری Noise Lab برای حالت پیشرفته. 
رابط کاربری Noise Lab برای حالت پیشرفته.
معیارهای نویز
مفهوم اصلی
برای محافظت از حریم خصوصی کاربران، نویز اضافه میشود.
مقدار بالای نویز نشان میدهد که سطلها/کلیدها پراکنده هستند و شامل مشارکتهایی از تعداد محدودی از رویدادهای حساس میباشند. این کار به طور خودکار توسط Noise Lab انجام میشود تا به افراد اجازه دهد "در میان جمعیت پنهان شوند" یا به عبارت دیگر، از حریم خصوصی این افراد محدود با مقدار بیشتری نویز اضافه شده محافظت کند.
مقدار نویز کم نشان میدهد که تنظیمات دادهها به گونهای طراحی شده است که از قبل به افراد اجازه میدهد «در میان جمعیت پنهان شوند.» این بدان معناست که سطلها حاوی دادههایی از تعداد کافی رویداد هستند تا تأیید شود که از حریم خصوصی کاربران محافظت میشود.
این جمله هم برای میانگین درصد خطا (APE) و هم برای RMSRE_T (ریشه میانگین مربعات خطای نسبی با آستانه) صادق است.
میانگین درصد خطا (APE)
APE نسبت نویز به سیگنال است، یعنی مقدار خلاصه واقعی.
مقادیر پایینتر APE به معنای نسبت سیگنال به نویز بهتر است.
فرمول
برای یک گزارش خلاصه داده شده، APE به صورت زیر محاسبه میشود:

مقدار خلاصه واقعی True است. APE میانگین نویز روی هر مقدار خلاصه واقعی است که روی تمام ورودیهای یک گزارش خلاصه به طور میانگین محاسبه شده است. در Noise Lab، این مقدار در ۱۰۰ ضرب میشود تا درصد آن به دست آید.
مزایا و معایب
سطلهایی با اندازههای کوچکتر، تأثیر نامتناسبی بر مقدار نهایی APE دارند. این میتواند هنگام ارزیابی نویز گمراهکننده باشد. به همین دلیل است که ما معیار دیگری به نام RMSRE_T اضافه کردهایم که برای کاهش این محدودیت APE طراحی شده است. برای جزئیات بیشتر، مثالها را مرور کنید.
کد
کد منبع محاسبه APE را بررسی کنید.
RMSRE_T (ریشه میانگین مربعات خطای نسبی با یک آستانه)
RMSRE_T (ریشه میانگین مربعات خطای نسبی با یک آستانه) معیار دیگری برای نویز است.
نحوه تفسیر RMSRE_T
مقادیر پایینتر RMSRE_T به معنای نسبت سیگنال به نویز بهتر است.
برای مثال، اگر نسبت نویز قابل قبول برای مورد استفاده شما 20٪ و RMSRE_T برابر با 0.2 باشد، میتوانید مطمئن باشید که سطح نویز در محدوده قابل قبول شما قرار میگیرد.
فرمول
برای یک گزارش خلاصه داده شده، RMSRE_T به صورت زیر محاسبه میشود:

مزایا و معایب
درک RMSRE_T کمی پیچیدهتر از APE است. با این حال، مزایایی دارد که در برخی موارد آن را برای تحلیل نویز در گزارشهای خلاصه، مناسبتر از APE میکند:
- RMSRE_T پایدارتر است. "T" یک آستانه است. "T" برای دادن وزن کمتر در محاسبه RMSRE_T به سطلهایی که تبدیلهای کمتری دارند و بنابراین به دلیل اندازه کوچکشان به نویز حساستر هستند، استفاده میشود. با T، این معیار روی سطلهایی با تبدیلهای کم، جهش نمیکند. اگر T برابر با 5 باشد، مقدار نویزی به کوچکی 1 روی سطلی با 0 تبدیل، خیلی بیشتر از 1 نمایش داده نمیشود. در عوض، به 0.2 محدود میشود که معادل 1/5 است، زیرا T برابر با 5 است. با دادن وزن کمتر به سطلهای کوچکتر که در نتیجه به نویز حساستر هستند، این معیار پایدارتر است و بنابراین مقایسه دو شبیهسازی را آسانتر میکند.
- RMSRE_T امکان تجمیع ساده را فراهم میکند. دانستن RMSRE_T چندین سطل، همراه با تعداد واقعی آنها، به شما امکان میدهد RMSRE_T حاصل جمع آنها را محاسبه کنید. این همچنین به شما امکان میدهد RMSRE_T را برای این مقادیر ترکیبی بهینه کنید.
اگرچه تجمیع برای APE امکانپذیر است، اما فرمول آن بسیار پیچیده است زیرا شامل مقدار مطلق مجموع نویزهای لاپلاس میشود. این امر بهینهسازی APE را دشوارتر میکند.
کد
کد منبع محاسبه RMSRE_T را بررسی کنید.
مثالها
گزارش خلاصه با سه بخش:
- bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
- bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
- bucket_3 = نویز: ۲۰، مقدار trueSummaryValue: ۲۰۰
میانگین اثر بخشی (APE) = (0.1 + 0.2 + 0.1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
گزارش خلاصه با سه بخش:
- bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
- bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
- bucket_3 = نویز: 20، مقدار trueSummaryValue: 20
میانگین اثر بخشی (APE) = (0.1 + 0.2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
گزارش خلاصه با سه بخش:
- bucket_1 = نویز: ۱۰، مقدار trueSummaryValue: ۱۰۰
- bucket_2 = نویز: ۲۰، مقدار trueSummaryValue: ۱۰۰
- bucket_3 = نویز: ۲۰، مقدار trueSummaryValue: ۰
APE = (0.1 + 0.2 + بینهایت) / 3 = بینهایت
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
مدیریت پیشرفته کلید
یک شرکت DSP یا سنجش تبلیغات ممکن است هزاران مشتری تبلیغاتی جهانی داشته باشد که صنایع، ارزها و پتانسیلهای قیمت خرید متعددی را در بر میگیرند. این بدان معناست که ایجاد و مدیریت یک کلید تجمیع برای هر تبلیغکننده احتمالاً بسیار غیرعملی خواهد بود. علاوه بر این، انتخاب حداکثر ارزش قابل تجمیع و بودجه تجمیع که بتواند تأثیر نویز را در بین این هزاران تبلیغکننده جهانی محدود کند، چالش برانگیز خواهد بود. در عوض، بیایید سناریوهای زیر را در نظر بگیریم:
استراتژی کلیدی الف
ارائهدهنده فناوری تبلیغات تصمیم میگیرد یک کلید واحد را برای همه مشتریان تبلیغاتی خود ایجاد و مدیریت کند. در بین همه تبلیغکنندگان و همه ارزها، طیف خریدها از خریدهای کمحجم و گرانقیمت تا خریدهای پرحجم و ارزانقیمت متغیر است. این منجر به کلید زیر میشود:
| کلید (چندین ارز) | |
|---|---|
| حداکثر مقدار قابل تجمیع | ۵،۰۰۰،۰۰۰ |
| محدوده ارزش خرید | [۱۲۰ - ۵۰۰۰۰۰] |
استراتژی کلیدی ب
ارائهدهنده فناوری تبلیغات تصمیم میگیرد دو کلید را برای همه مشتریان تبلیغاتی خود ایجاد و مدیریت کند. آنها تصمیم میگیرند کلیدها را بر اساس واحد پول از هم جدا کنند. در بین همه تبلیغکنندگان و همه واحد پولها، طیف خریدها از خریدهای کمحجم و گرانقیمت تا خریدهای پرحجم و ارزانقیمت متفاوت است. با جدا کردن بر اساس واحد پول، آنها دو کلید ایجاد میکنند:
| کلید ۱ (دلار آمریکا) | کلید ۲ (¥) | |
|---|---|---|
| حداکثر مقدار قابل تجمیع | ۴۰،۰۰۰ دلار | ۵،۰۰۰،۰۰۰ ین |
| محدوده ارزش خرید | [120 - 40,000] | [۱۵۰۰۰ - ۵۰۰۰۰۰۰] |
استراتژی کلیدی B در نتیجه خود نسبت به استراتژی کلیدی A نویز کمتری خواهد داشت، زیرا ارزش ارزها به طور یکنواخت بین ارزها توزیع نشده است. به عنوان مثال، در نظر بگیرید که چگونه خریدهای تعیین شده بر اساس ین در کنار خریدهای تعیین شده بر اساس دلار آمریکا، دادههای اساسی و خروجی نویزدار حاصل را تغییر میدهند.
استراتژی کلیدی ج
ارائهدهنده فناوری تبلیغات تصمیم میگیرد چهار کلید را در بین تمام مشتریان تبلیغاتی خود ایجاد و مدیریت کند و آنها را بر اساس صنعت ارز × تبلیغکننده از هم جدا کند:
| کلید ۱ (دلار آمریکا ضربدر تبلیغکنندگان جواهرات لوکس) | کلید ۲ (¥ x تبلیغکنندگان جواهرات لوکس) | کلید ۳ (دلار آمریکا ضربدر تبلیغکنندگان خردهفروشی پوشاک) | کلید ۴ (¥ x تبلیغکنندگان خردهفروشی پوشاک) | |
|---|---|---|---|---|
| حداکثر مقدار قابل تجمیع | ۴۰،۰۰۰ دلار | ۵،۰۰۰،۰۰۰ ین | ۵۰۰ دلار | ۶۵۰۰۰ ین |
| محدوده ارزش خرید | [۱۰،۰۰۰ - ۴۰،۰۰۰] | [۱,۲۵۰,۰۰۰ - ۵,۰۰۰,۰۰۰] | [120 - 500] | [۱۵۰۰۰ - ۶۵۰۰۰] |
استراتژی کلیدی C در نتیجه خود نسبت به استراتژی کلیدی B نویز کمتری خواهد داشت، زیرا ارزش خرید تبلیغکننده به طور یکنواخت در بین تبلیغکنندگان توزیع نشده است. به عنوان مثال، در نظر بگیرید که چگونه خرید جواهرات لوکس همراه با خرید کلاه بیسبال، دادههای اساسی و خروجی نویزدار حاصل را تغییر میدهد.
ایجاد حداکثر مقادیر تجمعی مشترک و ضرایب مقیاسبندی مشترک برای نقاط مشترک در بین چندین تبلیغکننده را در نظر بگیرید تا نویز در خروجی کاهش یابد. به عنوان مثال، میتوانید استراتژیهای زیر را برای تبلیغکنندگان خود آزمایش کنید:
- یک استراتژی که بر اساس ارز (USD، ین، CAD و غیره) جدا شده است
- یک استراتژی مجزا بر اساس صنعت تبلیغکننده (بیمه، خودرو، خردهفروشی و غیره)
- یک استراتژی که با محدودههای ارزش خرید مشابه ([100]، [1000]، [10000] و غیره) از هم جدا شده است.
با ایجاد استراتژیهای کلیدی پیرامون مشترکات تبلیغکنندگان، مدیریت کلیدها و کد مربوطه آسانتر میشود و نسبت سیگنال به نویز بالاتر میرود. استراتژیهای مختلف با مشترکات تبلیغکنندگان مختلف را آزمایش کنید تا نقاط عطف را در به حداکثر رساندن تأثیر نویز در مقابل مدیریت کد کشف کنید.
بیایید سناریویی را برای دو تبلیغکننده در نظر بگیریم:
- آگهی دهنده الف:
- در تمام محصولات موجود در سایت تبلیغکننده A، گزینههای قیمت خرید بین [۱۲۰ تا ۱۰۰۰ دلار] است که در مجموع ۸۸۰ دلار میشود.
- قیمتهای خرید به طور مساوی در محدوده ۸۸۰ دلار توزیع شدهاند و هیچ داده پرتی خارج از دو انحراف معیار از قیمت خرید میانه وجود ندارد.
- تبلیغ کننده ب:
- در تمام محصولات موجود در سایت تبلیغکننده B، گزینههای قیمت خرید بین [۱۲۰ تا ۱۰۰۰ دلار] است که در مجموع ۸۸۰ دلار میشود.
- قیمتهای خرید به شدت به سمت محدوده ۱۲۰ تا ۵۰۰ دلار متمایل هستند و تنها ۵٪ از خریدها در محدوده ۵۰۰ تا ۱۰۰۰ دلار اتفاق میافتند.
با توجه به الزامات بودجه مشارکت و روشی که با آن نویز به نتایج نهایی اعمال میشود ، تبلیغکننده B به طور پیشفرض خروجی نویزدارتری نسبت به تبلیغکننده A خواهد داشت، زیرا تبلیغکننده B پتانسیل بیشتری برای تأثیرگذاری دادههای پرت بر محاسبات اساسی دارد.
میتوان با تنظیم یک کلید خاص، این مشکل را کاهش داد. استراتژیهای کلیدی را آزمایش کنید که به مدیریت دادههای پرت و توزیع یکنواختتر مقادیر خرید در محدوده خرید کلید کمک میکنند.
برای تبلیغکنندهی ب، میتوانید دو کلید جداگانه برای ثبت دو محدودهی ارزش خرید مختلف ایجاد کنید. در این مثال، تکنسین تبلیغات متوجه شده است که دادههای پرت (outlier) بالاتر از ارزش خرید ۵۰۰ دلار ظاهر میشوند. سعی کنید دو کلید جداگانه برای این تبلیغکننده پیادهسازی کنید:
- ساختار کلید ۱: کلیدی که فقط خریدهای بین ۱۲۰ تا ۵۰۰ دلار را در بر میگیرد (که تقریباً ۹۵٪ از کل حجم خرید را پوشش میدهد).
- ساختار کلیدی ۲: کلیدی که فقط خریدهای بالای ۵۰۰ دلار را شامل میشود (حدود ۵٪ از کل حجم خرید را پوشش میدهد).
Implementing this key strategy should better manage noise for Advertiser B and help to maximize utility for them from summary reports. Given the new smaller ranges, Key A and Key B should now have a more uniform distribution of data across each respective key that for the previous single key. This will result in less noise impact in each key's output that for the previous single key.