چگونه کار می کند

سرویس تجمیع، بینش‌های عملکردی لازم برای بهبود اثربخشی کمپین با مشتریان را در اختیار تکنسین‌های تبلیغات قرار می‌دهد.

این سند موارد زیر را پوشش می‌دهد :

این سند برای کیست؟

این صفحه به تکنسین‌ها و توسعه‌دهندگان تبلیغات کمک می‌کند تا بفهمند چگونه APIهای ما امکان سنجش تبلیغات مؤثر و با حفظ حریم خصوصی را فراهم می‌کنند.

این سند فرض می‌کند که شما با APIهای Private Aggregation API ، Attribution Reporting API ، Protected Audience API ، Shared Storage و Trusted Execution Environments آشنا هستید.

اصطلاحات و مفاهیم کلیدی

قبل از ادامه با اصطلاحات کلیدی آشنا شوید:

واژه‌نامه

فناوری تبلیغات

پلتفرم تبلیغاتی شرکتی است که خدماتی را برای ارائه تبلیغات ارائه می دهد.

گزارش‌های قابل تجمیع

گزارش‌های انبوه، گزارش‌های رمزگذاری‌شده‌ای هستند که از دستگاه‌های کاربر جداگانه ارسال می‌شوند. این گزارش‌ها حاوی داده‌هایی درباره رفتار کاربران بین سایتی و تبدیل‌ها هستند. تبدیل‌ها (گاهی اوقات رویدادهای راه‌اندازی اسناد نامیده می‌شوند) و معیارهای مرتبط توسط تبلیغ‌کننده یا فناوری تبلیغات تعریف می‌شوند. هر گزارش برای جلوگیری از دسترسی طرف های مختلف به داده های اساسی رمزگذاری شده است.

درباره گزارش‌های جمع‌آوری‌شده بیشتر بیاموزید .

حسابداری گزارش‌های تجمیعی

یک دفتر کل توزیع شده، واقع در هر دو هماهنگ کننده، که بودجه حفظ حریم خصوصی اختصاص داده شده را ردیابی می کند و قانون "بدون تکرار" را اجرا می کند. این مکانیزم حفظ حریم خصوصی است که در هماهنگ‌کننده‌ها قرار گرفته و اجرا می‌شود، که تضمین می‌کند هیچ گزارشی فراتر از بودجه اختصاص داده شده از طریق سرویس تجمیع ارسال نمی‌شود.

در مورد نحوه ارتباط استراتژی های دسته بندی با گزارش های جمع آوری بیشتر بخوانید .

گزارش تجمیعی بودجه حسابداری

ارجاع به بودجه ای که تضمین می کند گزارش های فردی بیش از یک بار پردازش نمی شوند.

خدمات تجمیع

یک سرویس مبتنی بر فناوری تبلیغات که گزارش‌های جمع‌آوری‌شده را برای ایجاد یک گزارش خلاصه پردازش می‌کند.

در توضیح ما و فهرست کامل اصطلاحات، درباره پیشینه خدمات تجمع بیشتر بخوانید.

گواهی

مکانیزمی برای احراز هویت نرم افزار، معمولاً با هش ها یا امضاهای رمزنگاری . برای پیشنهاد سرویس تجمیع، گواهی کد اجرا شده در سرویس تجمیع فناوری تبلیغاتی شما را با کد منبع باز مطابقت می دهد.

در مورد گواهینامه بیشتر بخوانید .

ضمانت مشارکت
هماهنگ کننده

نهادهای مسئول مدیریت کلیدی و حسابداری گزارش انبوه. یک Coordinator فهرستی از هش‌های پیکربندی‌های سرویس تجمیع تایید شده را نگهداری می‌کند و دسترسی به کلیدهای رمزگشایی را پیکربندی می‌کند.

نویز و مقیاس‌بندی

نویز آماری که در طول فرآیند تجمیع به گزارش‌های خلاصه اضافه می‌شود تا حریم خصوصی حفظ شود و اطمینان حاصل شود که گزارش‌های نهایی اطلاعات اندازه‌گیری ناشناس را ارائه می‌کنند.

در مورد مکانیسم نویز افزایشی که از توزیع لاپلاس گرفته شده است بیشتر بخوانید.

مبدا گزارش

نهادی که گزارش‌های جمع‌آوری‌شده را دریافت می‌کند - به عبارت دیگر، شما یا یک فناوری تبلیغاتی که API گزارش Attribution نامیده می‌شود. گزارش‌های جمع‌آوری‌شده از دستگاه‌های کاربر به یک URL معروف مرتبط با منبع گزارش ارسال می‌شوند. مبدا گزارش در هنگام ثبت نام تعیین می شود.

شناسه مشترک

یک مقدار محاسبه‌شده که شامل shared_info ، reporting_origin ، destination_site (فقط برای Attribution Reporting API)، source_registration-time (فقط برای Attribution Reporting API)، scheduled_report_time و نسخه است.

گزارش‌های متعددی که ویژگی‌های یکسانی را در قسمت shared_info به اشتراک می‌گذارند باید دارای شناسه مشترک یکسان باشند. شناسه های مشترک نقش مهمی در حسابداری گزارش جمعی ایفا می کنند.

درباره سرورهای مورد اعتماد بیشتر بخوانید .

گزارش خلاصه

یک API گزارش انتساب و نوع گزارش API جمع‌آوری خصوصی. گزارش خلاصه شامل داده‌های کاربر جمع‌آوری شده است و می‌تواند حاوی داده‌های تبدیل دقیق با نویز اضافه شده باشد. گزارش های خلاصه از گزارش های انبوه تشکیل شده است. آنها به انعطاف پذیری بیشتری اجازه می دهند و مدل داده غنی تری را نسبت به گزارش در سطح رویداد ارائه می دهند، به ویژه برای برخی موارد استفاده مانند مقادیر تبدیل.

محیط اجرای قابل اعتماد ( TEE )

پیکربندی ایمن از سخت‌افزار و نرم‌افزار رایانه که به طرف‌های خارجی اجازه می‌دهد تا نسخه‌های دقیق نرم‌افزار در حال اجرا بر روی دستگاه را بدون ترس از قرار گرفتن در معرض آن تأیید کنند. TEE ها به طرف های خارجی اجازه می دهند تا تأیید کنند که نرم افزار دقیقاً همان کاری را که سازنده نرم افزار ادعا می کند انجام می دهد - نه بیشتر یا کمتر.

برای کسب اطلاعات بیشتر در مورد TEE های مورد استفاده برای پیشنهادات جعبه ایمنی حریم خصوصی، توضیح خدمات API مخاطبین محافظت شده و توضیح سرویس تجمع را بخوانید.

گردش کار سرویس تجمیع

سرویس تجمیع، گزارش‌های خلاصه‌ای از داده‌های تبدیل و دسترسی دقیق را از گزارش‌های خام قابل تجمیع تولید می‌کند. جریان تولید گزارش شامل مراحل زیر است:

  1. یک مرورگر برای تولید گزارش‌های رمزگذاری شده، یک کلید عمومی را دریافت می‌کند.
  2. گزارش‌های رمزگذاری‌شده و قابل جمع‌آوری به سرورهای فناوری تبلیغات ارسال می‌شوند.
  3. سرور فناوری تبلیغات، گزارش‌ها را (با فرمت avro ) دسته‌بندی کرده و آنها را به سرویس تجمیع ارسال می‌کند.
  4. یک کارگر تجمیع، گزارش‌های تجمیع‌شده را برای رمزگشایی بازیابی می‌کند.
  5. کارگر تجمیع، کلیدهای رمزگشایی را از یک هماهنگ‌کننده بازیابی می‌کند.
  6. کارگر تجمیع، گزارش‌ها را برای تجمیع و نویز رمزگشایی می‌کند.
  7. سرویس حسابداری گزارش‌های تجمیعی بررسی می‌کند که آیا بودجه حریم خصوصی کافی برای تولید گزارش خلاصه برای گزارش‌های تجمیعی داده شده وجود دارد یا خیر.
  8. سرویس تجمیع، گزارش خلاصه نهایی را ارائه می‌دهد.

نمودار زیر، سرویس تجمیع را در عمل، از زمانی که گزارش‌ها از دستگاه‌های وب و تلفن همراه دریافت می‌شوند، تا زمانی که یک گزارش خلاصه توسط سرویس تجمیع ایجاد می‌شود، نشان می‌دهد.

جریان سرویس تجمیع سرتاسری.
جریان سرویس تجمیع سرتاسری

به طور خلاصه، API گزارش‌دهی انتسابی یا API تجمیع خصوصی، گزارش‌هایی را از چندین نمونه مرورگر تولید می‌کنند. کروم یک کلید عمومی را که هر هفت روز یکبار تغییر می‌کند، از سرویس میزبانی کلید در هماهنگ‌کننده دریافت می‌کند تا گزارش‌ها را قبل از ارسال به مبدا گزارش‌دهی فناوری تبلیغات رمزگذاری کند. مبدا گزارش‌دهی فناوری تبلیغات، گزارش‌های ورودی را جمع‌آوری و به فرمت avro تبدیل می‌کند و آنها را به سرویس تجمیع ارسال می‌کند. هنگامی که یک درخواست دسته‌ای به سرویس تجمیع ارسال می‌شود، کلیدهای رمزگشایی را از سرویس میزبانی کلید دریافت می‌کند، گزارش‌ها را رمزگشایی می‌کند و آنها را تجمیع و نویز می‌کند تا یک گزارش خلاصه ایجاد کند، البته تا زمانی که بودجه حریم خصوصی کافی برای ایجاد آنها وجود داشته باشد.

برای کسب اطلاعات بیشتر در مورد نحوه تهیه گزارش‌های تجمیعی، به بخش پیاده‌سازی مراجعه کنید.

گزارش‌های تجمیعی و دسته‌بندی آنها

جریان گزارش‌دهی بدون کمک سرور مبدا گزارش‌دهی تعیین‌شده، که شما در طول فرآیند ثبت‌نام مشخص کرده‌اید، کامل نخواهد بود. مبدا گزارش‌دهی مسئول جمع‌آوری، تبدیل و دسته‌بندی گزارش‌های قابل تجمیع و آماده‌سازی آن‌ها برای ارسال به سرویس تجمیع شما در Google Cloud یا Amazon Web Services است. در مورد نحوه تهیه گزارش‌های قابل تجمیع خود بیشتر بخوانید.

اجزای ابری

سرویس تجمیع از چندین مؤلفه سرویس ابری تشکیل شده است. شما از اسکریپت‌های Terraform ارائه شده برای تهیه و پیکربندی تمام مؤلفه‌های لازم سرویس ابری استفاده می‌کنید.

اجزای ابری سرویس تجمیع.
اجزای ابری سرویس تجمیع.

خدمات فرانت‌اند

سرویس ابری مدیریت‌شده: عملکرد ابری (گوگل کلود) / درگاه API (خدمات وب آمازون)

سرویس Frontend یک دروازه بدون سرور است که نقطه ورود اصلی برای فراخوانی‌های API Aggregation برای ایجاد شغل و بازیابی وضعیت شغل است. این سرویس مسئول دریافت درخواست‌ها از کاربران سرویس Aggregation، اعتبارسنجی پارامترهای ورودی و آغاز فرآیند زمان‌بندی شغل Aggregation است.

سرویس Frontend دو API در دسترس دارد:

نقطه پایانی توضیحات
createJob این API یک کار سرویس تجمیع (Aggregation Service) را آغاز می‌کند. برای آغاز این کار، به اطلاعاتی مانند شناسه کار، جزئیات ذخیره‌سازی ورودی، جزئیات ذخیره‌سازی خروجی و مبدا گزارش نیاز است.
getJob این API وضعیت کار را با داشتن یک شناسه کار مشخص شده برمی‌گرداند. این API اطلاعاتی در مورد وضعیت کار، مانند "دریافت شده"، "در حال انجام" یا "پایان یافته" ارائه می‌دهد. اگر کار تمام شده باشد، نتیجه کار، از جمله هرگونه پیام خطایی که در طول اجرای کار با آن مواجه شده است را نیز برمی‌گرداند.

مستندات API سرویس تجمیع را بررسی کنید.

صف کار

سرویس ابری مدیریت‌شده: Pub/Sub (گوگل کلود) / Amazon SQS (خدمات وب آمازون)

صف کار (Job Queue) یک صف پیام است که شامل درخواست‌های کار برای سرویس تجمیع (Aggregation Service) می‌باشد. سرویس Frontend درخواست‌های کار را در صف قرار می‌دهد که سپس توسط Aggregation Workerهایی که آنها را پردازش می‌کنند، مصرف می‌شوند.

فضای ذخیره‌سازی ابری

سرویس ابری مدیریت‌شده: فضای ذخیره‌سازی ابری گوگل (گوگل کلود) / آمازون S3 (خدمات وب آمازون)

فایل‌های ورودی و خروجی مورد استفاده توسط سرویس تجمیع، مانند فایل‌های گزارش رمزگذاری شده و گزارش‌های خلاصه خروجی، در فضای ذخیره‌سازی ابری نگهداری می‌شوند.

پایگاه داده فراداده شغلی

سرویس ابری مدیریت‌شده: Spanner (گوگل کلود) / DynamoDB (خدمات وب آمازون)

پایگاه داده فراداده شغل برای ذخیره و پیگیری وضعیت شغل‌های تجمیعی استفاده می‌شود. این پایگاه داده فراداده‌هایی مانند زمان ایجاد، زمان درخواست، زمان به‌روزرسانی و وضعیتی مانند دریافت‌شده، در حال انجام یا پایان‌یافته را ثبت می‌کند. عامل‌های تجمیعی، پایگاه داده فراداده شغل را با پیشرفت شغل‌ها به‌روزرسانی می‌کنند.

کارگر تجمیع

سرویس ابری مدیریت‌شده: موتور محاسباتی با فضای محرمانه (گوگل کلود) / سرویس‌های وب آمازون EC2 با Nitro Enclave (سرویس‌های وب آمازون).

یک کارگر تجمیع، درخواست‌های کار را در صف کار پردازش می‌کند و ورودی‌های رمزگذاری شده را با استفاده از کلیدهایی که از سرویس تولید و توزیع کلید (KGDS) در هماهنگ‌کننده‌ها دریافت می‌کند، رمزگشایی می‌کند. برای به حداقل رساندن تأخیر پردازش کار، کارگران تجمیع، کلیدهای رمزگشایی را به مدت هشت ساعت ذخیره می‌کنند و از آنها در کارهایی که پردازش می‌کنند استفاده می‌کنند.

کارگران تجمعی در یک نمونه محیط اجرای قابل اعتماد (TEE) فعالیت می‌کنند. یک کارگر فقط یک کار را در یک زمان انجام می‌دهد. می‌توانید با تنظیم پیکربندی مقیاس‌بندی خودکار، چندین کارگر را برای پردازش موازی کارها پیکربندی کنید. در صورت استفاده، مقیاس‌بندی خودکار به صورت پویا تعداد کارگران را با توجه به تعداد پیام‌های موجود در صف کار تنظیم می‌کند. می‌توانید حداقل و حداکثر تعداد کارگران را برای مقیاس‌بندی خودکار از طریق فایل محیط Terraform پیکربندی کنید. اطلاعات بیشتر در مورد مقیاس‌بندی خودکار را می‌توانید در این اسکریپت‌های Terraform بیابید: Amazon Web Services یا Google Cloud .

کارگران تجمیع، سرویس حسابداری گزارش تجمیع‌پذیر را برای حسابداری گزارش تجمیع‌پذیر فراخوانی می‌کنند. این سرویس تأیید می‌کند که کارها فقط در صورتی اجرا می‌شوند که از محدودیت بودجه حریم خصوصی تجاوز نشده باشند. ( به قانون "عدم تکرار" مراجعه کنید.) اگر بودجه در دسترس باشد، یک گزارش خلاصه با استفاده از تجمیع‌های نویزی ایجاد می‌شود. جزئیات بیشتر در مورد حسابداری گزارش تجمیع‌پذیر را بخوانید.

عامل‌های تجمیع، فراداده‌های کار را در پایگاه داده فراداده‌های کار به‌روزرسانی می‌کنند. این اطلاعات شامل کدهای بازگشت کار و شمارنده‌های خطای گزارش در صورت خرابی جزئی گزارش است. کاربران می‌توانند با استفاده از API بازیابی وضعیت کار getJob وضعیت را دریافت کنند.

برای توضیحات بیشتر در مورد سرویس تجمیع، به این توضیح مراجعه کنید.

مراحل بعدی

اکنون که می‌دانید سرویس تجمیع چگونه کار می‌کند، راهنمای شروع به کار را دنبال کنید تا نمونه خود را از طریق Google Cloud یا Amazon Web Services مستقر کنید.