کار با نویز

یاد بگیرید که چگونه با نویز در گزارش‌های قابل جمع‌آوری خود کار کنید، آن را در نظر بگیرید و تأثیر آن را کاهش دهید.

قبل از اینکه شروع کنی

قبل از ادامه، برای درک عمیق‌تر از نویز و تأثیر آن، به درک نویز در گزارش‌های خلاصه مراجعه کنید.

کنترل‌های شما روی نویز

اگرچه نمی‌توانید مستقیماً نویز اضافه شده به گزارش‌های قابل جمع‌آوری خود را کنترل کنید، اما گام‌هایی وجود دارد که می‌توانید برای به حداقل رساندن اثرات آنها بردارید. بخش‌های بعدی این استراتژی‌ها را توضیح می‌دهند.

افزایش مقیاس به بودجه مشارکتی

همانطور که در بخش درک نویز توضیح داده شد، نویز اعمال شده بر روی مقدار خلاصه برای هر کلید بر اساس مقیاس 0-65,536 (0- CONTRIBUTION_BUDGET ) است.

توزیع صدا بر اساس بودجه است.
توزیع صدا بر اساس بودجه است.

به همین دلیل، برای به حداکثر رساندن سیگنال نسبت به نویز، باید قبل از تنظیم هر مقدار به عنوان یک مقدار قابل جمع، آن را مقیاس‌بندی کنید - یعنی هر مقدار را در یک ضریب خاص، ضریب مقیاس‌بندی ، ضرب کنید و در عین حال تأیید کنید که در محدوده بودجه مشارکت باقی می‌ماند.

نویز نسبی با و بدون مقیاس‌بندی.
نویز نسبی با و بدون مقیاس‌بندی.

محاسبه ضریب مقیاس‌بندی

ضریب مقیاس‌بندی نشان می‌دهد که شما چقدر می‌خواهید یک مقدار قابل تجمیع مشخص را مقیاس‌بندی کنید. مقدار آن باید برابر با بودجه مشارکت تقسیم بر حداکثر مقدار قابل تجمیع برای یک کلید خاص باشد.

تعیین ضریب مقیاس‌بندی بر اساس بودجه مشارکتی.
تعیین ضریب مقیاس‌بندی بر اساس بودجه مشارکتی.

برای مثال، فرض کنید تبلیغ‌کنندگان می‌خواهند ارزش کل خرید را بدانند. شما می‌دانید که حداکثر ارزش خرید مورد انتظار برای هر خرید جداگانه ۲۰۰۰ دلار است، به جز چند مورد استثنا که تصمیم دارید نادیده بگیرید:

  • ضریب مقیاس‌بندی را محاسبه کنید :
    • برای به حداکثر رساندن نسبت سیگنال به نویز، باید این مقدار را به 65536 (بودجه مشارکت) افزایش دهید.
    • این منجر به ۶۵,۵۳۶ / ۲۰۰۰ می‌شود که تقریباً ۳۲ برابر ضریب مقیاس‌بندی است. در عمل، می‌توانید این ضریب را به بالا یا پایین گرد کنید.
  • قبل از تجمیع، مقادیر خود را افزایش دهید . به ازای هر ۱ دلار خرید، معیار ردیابی شده را ۳۲ واحد افزایش دهید. به عنوان مثال، برای خرید ۱۲۰ دلار ، مقدار تجمیع‌پذیر را ۱۲۰*۳۲ = ۳۸۴۰ تعیین کنید.
  • مقادیر خود را پس از تجمیع کاهش دهید . پس از دریافت گزارش خلاصه که شامل ارزش خرید حاصل از جمع‌بندی چندین کاربر است، با استفاده از ضریب مقیاس‌بندی که قبل از تجمیع استفاده کرده‌اید، مقدار خلاصه را کاهش دهید. در مثال ما، ما از ضریب مقیاس‌بندی ۳۲ قبل از تجمیع استفاده کرده‌ایم، بنابراین باید مقدار خلاصه دریافت شده در گزارش خلاصه را بر ۳۲ تقسیم کنیم. بنابراین، اگر ارزش خرید خلاصه برای یک کلید مشخص در گزارش خلاصه ۷۶۸۰۰ باشد، ارزش خرید خلاصه (با نویز) ۷۶۸۰۰/۳۲ = ۲۴۰۰ دلار است.

بودجه‌تان را تقسیم‌بندی کنید

اگر چندین هدف اندازه‌گیری دارید - مثلاً تعداد خرید و ارزش خرید - می‌توانید بودجه خود را بین این اهداف تقسیم کنید.

در این حالت، بسته به حداکثر مورد انتظار از یک مقدار قابل تجمیع معین، ضرایب مقیاس‌بندی شما برای مقادیر قابل تجمیع مختلف متفاوت خواهد بود.

جزئیات را در بخش « درک کلیدهای تجمیع» بخوانید.

برای مثال، فرض کنید شما هم تعداد خرید و هم ارزش خرید را پیگیری می‌کنید و تصمیم دارید بودجه خود را به طور مساوی اختصاص دهید.

۶۵,۵۳۶ / ۲ = ۳۲۷۶۸ می‌تواند برای هر نوع اندازه‌گیری و برای هر منبع اختصاص داده شود.

  • تعداد خرید:
    • شما فقط یک خرید را پیگیری می‌کنید، بنابراین حداکثر تعداد خرید برای یک تبدیل معین ۱ است.
    • بنابراین، شما تصمیم می‌گیرید که ضریب مقیاس‌بندی خود را برای تعداد خرید روی ۳۲۷۶۸ / ۱ = ۳۲۷۶۸ تنظیم کنید.
  • ارزش خرید:
    • فرض کنید حداکثر ارزش خرید مورد انتظار هر خرید جداگانه ۲۰۰۰ دلار باشد.
    • بنابراین، شما تصمیم می‌گیرید که ضریب مقیاس‌بندی خود را برای ارزش خرید روی 32,768 / 2,000 = 16.384 یا تقریباً 16 تنظیم کنید.

کلیدهای تجمیع درشت‌تر، نسبت سیگنال به نویز را بهبود می‌بخشند

از آنجایی که کلیدهای درشت رویدادهای تبدیل بیشتری را نسبت به کلیدهای دانه‌ای ثبت می‌کنند، کلیدهای درشت معمولاً منجر به مقادیر خلاصه بالاتری می‌شوند.

مقادیر خلاصه بالاتر نسبت به مقادیر پایین‌تر، کمتر تحت تأثیر نویز قرار می‌گیرند؛ نویز روی این مقادیر احتمالاً نسبت به این مقدار کمتر است.

مقادیر جمع‌آوری‌شده با کلیدهای درشت‌تر، احتمالاً نویز نسبتاً کمتری نسبت به مقادیر جمع‌آوری‌شده با کلیدهای دانه‌ای‌تر دارند.

مثال

در صورت یکسان بودن سایر موارد، کلیدی که ارزش خرید را به صورت جهانی (جمع‌بندی شده در تمام کشورها) ردیابی می‌کند، نسبت به کلیدی که تبدیل‌ها را در سطح یک کشور ردیابی می‌کند، منجر به ارزش خرید خلاصه بالاتر (و تعداد تبدیل‌های خلاصه بالاتر) خواهد شد.

بنابراین، نویز نسبی روی کل ارزش خرید برای یک کشور خاص، بیشتر از نویز نسبی روی کل ارزش خرید برای همه کشورها خواهد بود.

به طور مشابه، با فرض ثابت بودن سایر شرایط، ارزش کل خرید کفش کمتر از ارزش کل خرید همه اقلام (از جمله کفش) است.

بنابراین، نویز نسبی بر ارزش کل خرید کفش‌ها بیشتر از نویز نسبی بر ارزش کل خرید همه اقلام خواهد بود.

تأثیر نویز با کلیدهای دانه‌ای در مقابل کلیدهای درشت.
تأثیر نویز با کلیدهای دانه‌ای در مقابل کلیدهای درشت.

جمع‌بندی مقادیر خلاصه (rollup) همچنین نویز آنها را جمع می‌کند.

با جمع کردن مقادیر خلاصه از گزارش‌های خلاصه برای دسترسی به داده‌های سطح بالاتر، شما همچنین نویز حاصل از این مقادیر خلاصه را جمع می‌کنید.

میزان نویز با کلیدهای دانه‌ای با قابلیت جمع شدن در مقابل کلیدهای درشت بدون قابلیت جمع شدن.
میزان نویز با کلیدهای دانه‌ای با قابلیت جمع شدن در مقابل کلیدهای درشت بدون قابلیت جمع شدن.

بیایید دو رویکرد متفاوت را بررسی کنیم:

  • رویکرد الف : شما یک شناسه جغرافیایی را در کلیدهای خود قرار می‌دهید. گزارش‌های خلاصه، کلیدهای سطح شناسه جغرافیایی را نمایش می‌دهند که هر کدام با ارزش خرید خلاصه در یک سطح شناسه جغرافیایی خاص مرتبط هستند.
  • رویکرد ب : شما شناسه جغرافیایی را در کلیدهای خود لحاظ نمی‌کنید. گزارش‌های خلاصه مستقیماً ارزش خرید خلاصه را برای همه شناسه‌ها/مکان‌های جغرافیایی نشان می‌دهند.

برای دسترسی به ارزش خرید در سطح کشور:

  • با رویکرد الف، شما مقادیر خلاصه‌شده در سطح شناسه جغرافیایی و در نتیجه نویز آنها را نیز جمع می‌کنید. این احتمالاً باعث می‌شود نویز بیشتری به ارزش خرید نهایی در سطح شناسه جغرافیایی اضافه شود.
  • با رویکرد ب، شما مستقیماً به داده‌های موجود در گزارش‌های خلاصه نگاه می‌کنید. نویز فقط یک بار به آن داده‌ها اضافه شده است.

بنابراین، ارزش خرید خلاصه برای یک شناسه جغرافیایی مشخص احتمالاً با رویکرد الف، نویز بیشتری خواهد داشت.

به همین ترتیب، گنجاندن یک بُعد در سطح کد پستی در کلیدهایتان احتمالاً منجر به نتایج نویزدارتری نسبت به استفاده از کلیدهای درشت‌تر با بُعد در سطح منطقه خواهد شد.

تجمیع در دوره‌های زمانی طولانی‌تر، نسبت سیگنال به نویز را افزایش می‌دهد.

درخواست کمتر گزارش‌های خلاصه به این معنی است که ارزش هر خلاصه احتمالاً بالاتر از زمانی خواهد بود که گزارش‌ها را بیشتر درخواست کنید؛ احتمالاً تبدیل‌های بیشتری در بازه‌های زمانی طولانی‌تر اتفاق می‌افتد.

همانطور که قبلاً ذکر شد، هرچه مقدار خلاصه بالاتر باشد، احتمالاً نویز نسبی کمتر خواهد بود. بنابراین، درخواست گزارش‌های خلاصه با دفعات کمتر منجر به نسبت سیگنال به نویز بالاتر (بهتر) می‌شود.

درخواست کمتر گزارش‌های خلاصه منجر به نسبت سیگنال به نویز بالاتر می‌شود.
درخواست گزارش‌های خلاصه با دفعات کمتر، منجر به نسبت سیگنال به نویز بالاتر می‌شود.

برای روشن شدن مطلب، مثالی می‌آوریم:

  • اگر گزارش‌های خلاصه ساعتی را در طول ۲۴ ساعت درخواست می‌کنید و سپس مقدار خلاصه را از هر گزارش ساعتی برای دسترسی به داده‌های سطح روز جمع می‌کنید، نویز ۲۴ برابر می‌شود.
  • در یک گزارش خلاصه روزانه، نویز فقط یک بار اضافه می‌شود.

اپسیلون بالاتر، نویز کمتر

هرچه مقدار اپسیلون بالاتر باشد، نویز کمتر و محافظت از حریم خصوصی کمتر است.

استفاده از فیلترینگ و حذف داده‌های تکراری

بخش مهمی از تخصیص بودجه بین کلیدهای مختلف، درک تعداد دفعاتی است که یک رویداد خاص می‌تواند رخ دهد. به عنوان مثال، یک تبلیغ‌کننده ممکن است فقط به یک خرید برای هر کلیک اهمیت دهد، اما ممکن است به حداکثر ۳ تبدیل «نمایش صفحه محصول» علاقه‌مند باشد. برای پشتیبانی از این موارد استفاده، ممکن است بخواهید از ویژگی‌های API زیر نیز استفاده کنید که به شما امکان می‌دهد تعداد گزارش‌های تولید شده و تبدیل‌های شمارش شده را کنترل کنید:

آزمایش با اپسیلون

تکنسین‌های تبلیغات می‌توانند اپسیلون را روی مقداری بزرگتر از ۰ و تا ۶۴ تنظیم کنند. این محدوده امکان آزمایش انعطاف‌پذیر را فراهم می‌کند. مقادیر پایین‌تر اپسیلون، محافظت از حریم خصوصی بیشتری را فراهم می‌کند. توصیه می‌کنیم با اپسیلون=۱۰ شروع کنید.

توصیه‌هایی برای آزمایش

موارد زیر را توصیه می‌کنیم:

  • با اپسیلون = ۱۰ شروع کنید.
  • در صورتی که این امر باعث مشکلات قابل توجه در کاربردپذیری شود، اپسیلون را به صورت تدریجی افزایش دهید.
  • بازخورد خود را در مورد نقاط عطف خاصی که ممکن است در رابطه با کاربردپذیری داده‌ها پیدا کنید، به اشتراک بگذارید.

مشارکت کنید و بازخورد خود را به اشتراک بگذارید

شما می‌توانید در این API شرکت کنید و آن را آزمایش کنید .

مراحل بعدی