यह कैसे काम करता है

एग्रीगेशन सेवा, विज्ञापन टेक्नोलॉजी से जुड़ी कंपनियों को परफ़ॉर्मेंस की अहम जानकारी देती है. इससे उन्हें ग्राहकों के साथ कैंपेन की परफ़ॉर्मेंस को बेहतर बनाने में मदद मिलती है.

इस दस्तावेज़ में यह जानकारी दी गई है:

यह दस्तावेज़ किसके लिए है?

इस पेज से, विज्ञापन टेक्नोलॉजी और डेवलपर को यह समझने में मदद मिलती है कि हमारे एपीआई, निजता बनाए रखने वाले असरदार विज्ञापन मेज़रमेंट को कैसे चालू करते हैं.

इस दस्तावेज़ में यह मान लिया गया है कि आपको Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage, और Trusted Execution Environments के बारे में जानकारी है.

मुख्य शब्द और कॉन्सेप्ट

आगे बढ़ने से पहले, मुख्य शब्दों के बारे में जानें:

शब्दावली

विज्ञापन टेक्नोलॉजी

विज्ञापन प्लैटफ़ॉर्म, विज्ञापन दिखाने के लिए सेवाएं देने वाली कंपनी है.

एग्रीगेट की जा सकने वाली रिपोर्ट

एग्रीगेट की जा सकने वाली रिपोर्ट, एन्क्रिप्ट की गई रिपोर्ट होती हैं. इन्हें उपयोगकर्ता के अलग-अलग डिवाइसों से भेजा जाता है. इन रिपोर्ट में, क्रॉस-साइट उपयोगकर्ता के व्यवहार और कन्वर्ज़न का डेटा होता है. कन्वर्ज़न (जिन्हें कभी-कभी एट्रिब्यूशन ट्रिगर इवेंट भी कहा जाता है) और उनसे जुड़ी मेट्रिक, विज्ञापन देने वाला या विज्ञापन टेक्नोलॉजी कंपनी तय करती है. हर रिपोर्ट को एन्क्रिप्ट किया जाता है, ताकि अलग-अलग पक्ष उस डेटा को ऐक्सेस न कर सकें.

एग्रीगेट की जा सकने वाली रिपोर्ट के बारे में ज़्यादा जानें.

एग्रीगेट की जा सकने वाली रिपोर्टिंग

यह एक डिस्ट्रिब्यूटेड लेज़र है, जो दोनों कोऑर्डिनेटर में मौजूद होता है. यह निजता के लिए तय किए गए बजट को ट्रैक करता है और 'डुप्लीकेट नहीं है' नियम को लागू करता है. यह निजता बनाए रखने का एक तरीका है. यह कोऑर्डिनेटर में मौजूद होता है और वहां से चलाया जाता है. इससे यह पक्का होता है कि एग्रीगेशन सेवा में, निजता के लिए तय किए गए बजट से ज़्यादा डेटा न भेजा जाए.

बैच करने की रणनीतियों के बारे में ज़्यादा जानें, ताकि यह पता चल सके कि ये रणनीतियां, एग्रीगेट की जा सकने वाली रिपोर्ट से कैसे जुड़ी हैं.

एग्रीगेट की जा सकने वाली रिपोर्ट के लिए बजट

बजट के रेफ़रंस, जो यह पक्का करते हैं कि अलग-अलग रिपोर्ट एक से ज़्यादा बार प्रोसेस न की जाएं.

एग्रीगेशन सेवा

विज्ञापन टेक्नोलॉजी से संचालित एक सेवा, जो समरी रिपोर्ट बनाने के लिए, एग्रीगेट की जा सकने वाली रिपोर्ट को प्रोसेस करती है.

एग्रीगेशन सेवा के बारे में ज़्यादा जानने के लिए, एग्रीगेशन सेवा के बारे में जानकारी और शर्तों की पूरी सूची पढ़ें.

प्रमाणित करना

सॉफ़्टवेयर की पहचान की पुष्टि करने का तरीका. आम तौर पर, क्रिप्टोग्राफ़िक हैश या हस्ताक्षर की मदद से ऐसा किया जाता है. एग्रीगेशन सेवा के प्रस्ताव के लिए, पुष्टि करने की प्रक्रिया में, विज्ञापन टेक्नोलॉजी की मदद से आपकी एग्रीगेशन सेवा में चल रहे कोड की तुलना, ओपन सोर्स कोड से की जाती है.

पुष्टि करने के बारे में ज़्यादा जानें.

योगदान के आधार पर बोनस
कोऑर्डिनेटर

ये इकाइयां, अहम मैनेजमेंट और एग्रीगेट की जा सकने वाली रिपोर्ट के हिसाब-किताब के लिए ज़िम्मेदार होती हैं. कोऑर्डिनेटर, एग्रीगेशन सेवा के मंज़ूर किए गए कॉन्फ़िगरेशन के हैश की सूची रखता है. साथ ही, डिक्रिप्ट करने की कुंजियों के ऐक्सेस को कॉन्फ़िगर करता है.

शोर और स्केल करने की सुविधा

आंकड़ों से जुड़ी ग़ैर-ज़रूरी जानकारी, जो एग्रीगेशन की प्रोसेस के दौरान खास जानकारी वाली रिपोर्ट में जोड़ी जाती है. ऐसा, निजता बनाए रखने और यह पक्का करने के लिए किया जाता है कि आखिरी रिपोर्ट में, पहचान छिपाकर मेज़रमेंट की जानकारी दी जाए.

ऐडिटिव नॉइज़ मैकेनिज्म के बारे में ज़्यादा पढ़ें. इसे लाप्लास डिस्ट्रिब्यूशन से लिया गया है.

रिपोर्टिंग का सोर्स

वह इकाई जिसे एग्रीगेट की जा सकने वाली रिपोर्ट मिलती हैं. दूसरे शब्दों में, आप या कोई ऐसी विज्ञापन टेक्नोलॉजी कंपनी जिसने Attribution Reporting API को कॉल किया है. एग्रीगेट की जा सकने वाली रिपोर्ट, उपयोगकर्ता के डिवाइसों से, रिपोर्टिंग ऑरिजिन से जुड़े किसी लोकप्रिय यूआरएल पर भेजी जाती हैं. रिपोर्टिंग ऑरिजिन को रजिस्टर करने के दौरान तय किया जाता है.

शेयर किया गया आईडी

कैलकुलेट की गई वैल्यू, जिसमें shared_info, reporting_origin, destination_site (सिर्फ़ Attribution Reporting API के लिए), source_registration-time (सिर्फ़ Attribution Reporting API के लिए), scheduled_report_time, और वर्शन शामिल हैं.

shared_info फ़ील्ड में एक जैसे एट्रिब्यूट शेयर करने वाली कई रिपोर्ट का शेयर किया गया आईडी एक ही होना चाहिए. शेयर किए गए आईडी, एग्रीगेट की जा सकने वाली रिपोर्ट के हिसाब से अहम भूमिका निभाते हैं.

भरोसेमंद सर्वर के बारे में ज़्यादा जानें.

खास जानकारी वाली रिपोर्ट

Attribution Reporting API और Private Aggregation API रिपोर्ट टाइप. खास जानकारी वाली रिपोर्ट में, उपयोगकर्ता का इकट्ठा किया गया डेटा शामिल होता है. साथ ही, इसमें ग़ैर-ज़रूरी डेटा के साथ कन्वर्ज़न का पूरा डेटा भी शामिल हो सकता है. खास जानकारी वाली रिपोर्ट, एग्रीगेट रिपोर्ट से बनी होती हैं. ये इवेंट-लेवल की रिपोर्टिंग की तुलना में ज़्यादा सुविधाएं देते हैं और बेहतर डेटा मॉडल उपलब्ध कराते हैं. खास तौर पर, कन्वर्ज़न वैल्यू जैसे कुछ इस्तेमाल के उदाहरणों के लिए.

ट्रस्टेड एक्ज़ीक्यूशन एनवायरमेंट (TEE)

कंप्यूटर हार्डवेयर और सॉफ़्टवेयर का सुरक्षित कॉन्फ़िगरेशन, जिसकी मदद से बाहरी पक्ष, मशीन पर चल रहे सॉफ़्टवेयर के सटीक वर्शन की पुष्टि कर सकते हैं. टीईई की मदद से, बाहरी पक्ष यह पुष्टि कर सकते हैं कि सॉफ़्टवेयर ठीक वैसा ही काम करता है जैसा कि सॉफ़्टवेयर बनाने वाली कंपनी का दावा है. इसमें न तो ज़्यादा और न ही कम काम किया जाता है.

Privacy Sandbox के प्रस्तावों के लिए इस्तेमाल किए जाने वाले टीईई के बारे में ज़्यादा जानने के लिए, Protected Audience API की सेवाओं के बारे में जानकारी और एग्रीगेशन सेवा के बारे में जानकारी पढ़ें.

एग्रीगेशन सेवा का वर्कफ़्लो

एग्रीगेशन सेवा, एग्रीगेट की जा सकने वाली रॉ रिपोर्ट से, ज़्यादा जानकारी वाले कन्वर्ज़न और पहुंच के डेटा की खास जानकारी वाली रिपोर्ट जनरेट करती है. रिपोर्ट जनरेट करने की प्रोसेस में ये चरण शामिल होते हैं:

  1. ब्राउज़र, एन्क्रिप्ट की गई रिपोर्ट जनरेट करने के लिए, सार्वजनिक कुंजी फ़ेच करता है.
  2. एग्रीगेट की जा सकने वाली एन्क्रिप्ट (सुरक्षित) की गई रिपोर्ट, विज्ञापन से जुड़ी टेक्नोलॉजी के सर्वर को भेजी जाती हैं.
  3. विज्ञापन टेक्नोलॉजी का सर्वर, रिपोर्ट को बैच करता है. ये रिपोर्ट avro फ़ॉर्मैट में होती हैं. इसके बाद, सर्वर इन रिपोर्ट को एग्रीगेशन सेवा को भेजता है.
  4. एग्रीगेशन वर्कर, डिक्रिप्ट करने के लिए एग्रीगेट की गई रिपोर्ट को वापस पाता है.
  5. Aggregation Worker, Coordinator से डिक्रिप्शन कुंजियां वापस पाता है.
  6. एग्रीगेशन वर्कर, एग्रीगेशन और नॉइज़िंग के लिए रिपोर्ट को डिक्रिप्ट करता है.
  7. एग्रीगेट की जा सकने वाली रिपोर्टिंग सेवा यह जांच करती है कि एग्रीगेट की जा सकने वाली रिपोर्ट के लिए खास जानकारी वाली रिपोर्ट जनरेट करने के लिए, निजता बजट उपलब्ध है या नहीं.
  8. Aggregation Service, खास जानकारी वाली फ़ाइनल रिपोर्ट सबमिट करती है.

इस डायग्राम में, एग्रीगेशन सेवा को काम करते हुए दिखाया गया है. इसमें वेब और मोबाइल डिवाइसों से रिपोर्ट मिलने से लेकर, एग्रीगेशन सेवा के ज़रिए खास जानकारी वाली रिपोर्ट बनाने तक की प्रोसेस दिखाई गई है.

एग्रीगेशन सेवा के काम करने का पूरा फ़्लो.
एंड-टू-एंड एग्रीगेशन सेवा का फ़्लो

संक्षेप में, Attribution Reporting API या Private Aggregation API, कई ब्राउज़र इंस्टेंस से रिपोर्ट जनरेट करते हैं. Chrome, कोऑर्डिनेटर में मौजूद Key Hosting Service से एक सार्वजनिक कुंजी हासिल करता है. यह कुंजी हर सात दिन में बदलती है. इसका इस्तेमाल, रिपोर्ट को एन्क्रिप्ट (सुरक्षित) करने के लिए किया जाता है. इसके बाद, रिपोर्ट को विज्ञापन टेक्नोलॉजी की रिपोर्टिंग के ऑरिजिन पर भेजा जाता है. विज्ञापन टेक्नोलॉजी से जुड़ी रिपोर्टिंग का ऑरिजिन, आने वाली रिपोर्ट इकट्ठा करता है और उन्हें avro फ़ॉर्मैट में बदलता है. इसके बाद, उन्हें एग्रीगेशन सेवा को भेजता है. इसके बाद, जब बैच अनुरोध को Aggregation Service को भेजा जाता है, तो वह Key Hosting Service से डिक्रिप्शन कुंजियां फ़ेच करती है. इसके बाद, वह रिपोर्ट को डिक्रिप्ट करती है. साथ ही, निजता बजट के हिसाब से रिपोर्ट को एग्रीगेट और नॉइज़ करती है, ताकि खास जानकारी वाली रिपोर्ट बनाई जा सके.

लागू करने के सेक्शन में जाकर, एग्रीगेट की जा सकने वाली रिपोर्ट तैयार करने के बारे में ज़्यादा जानें.

एग्रीगेट की जा सकने वाली रिपोर्ट को बैच में भेजना

रजिस्ट्रेशन की प्रोसेस के दौरान आपने जिस रिपोर्टिंग ओरिजिन सर्वर के बारे में बताया था उसकी मदद के बिना, रिपोर्टिंग फ़्लो पूरा नहीं होगा. रिपोर्टिंग ऑरिजिन की ज़िम्मेदारी होती है कि वह एग्रीगेट की जा सकने वाली रिपोर्ट इकट्ठा करे, उन्हें बदले, और बैच में रखे. साथ ही, उन्हें Google Cloud या Amazon Web Services में मौजूद आपकी एग्रीगेशन सेवा को भेजने के लिए तैयार करे. एग्रीगेट की जा सकने वाली रिपोर्ट तैयार करने के तरीके के बारे में ज़्यादा जानें.

क्लाउड कॉम्पोनेंट

एग्रीगेशन सेवा में, क्लाउड सेवा के कई कॉम्पोनेंट होते हैं. आपने सभी ज़रूरी क्लाउड सेवा कॉम्पोनेंट को चालू करने और कॉन्फ़िगर करने के लिए, उपलब्ध कराई गई Terraform स्क्रिप्ट का इस्तेमाल किया हो.

एग्रीगेशन सेवा के क्लाउड कॉम्पोनेंट.
एग्रीगेशन सेवा के क्लाउड कॉम्पोनेंट.

फ़्रंटएंड सेवा

मैनेज की गई क्लाउड सेवा: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)

फ़्रंटएंड सेवा एक सर्वरलेस गेटवे है. यह नौकरी बनाने और नौकरी की स्थिति वापस पाने के लिए, Aggregation API कॉल का मुख्य एंट्री पॉइंट है. यह एग्रीगेशन सेवा के उपयोगकर्ताओं से अनुरोध पाने, इनपुट पैरामीटर की पुष्टि करने, और एग्रीगेशन जॉब शेड्यूल करने की प्रोसेस शुरू करने के लिए ज़िम्मेदार होता है.

फ़्रंटएंड सेवा के लिए, दो एपीआई उपलब्ध हैं:

एंडपॉइंट ब्यौरा
createJob यह एपीआई, एग्रीगेशन सेवा के काम को ट्रिगर करता है. इस जॉब को ट्रिगर करने के लिए, जॉब आईडी, इनपुट स्टोरेज की जानकारी, आउटपुट स्टोरेज की जानकारी, और रिपोर्टिंग ओरिजिन जैसी जानकारी की ज़रूरत होती है.
getJob यह एपीआई, तय किए गए जॉब आईडी वाले जॉब का स्टेटस दिखाता है. इससे नौकरी की स्थिति के बारे में जानकारी मिलती है. जैसे, "मिल गई", "जारी है" या "पूरी हो गई". अगर काम पूरा हो जाता है, तो यह काम के नतीजे भी दिखाता है. इसमें काम पूरा करते समय मिली गड़बड़ियों के मैसेज भी शामिल होते हैं.

Aggregation Service API से जुड़ा दस्तावेज़ देखें.

जॉब क्यू

मैनेज की जा रही क्लाउड सेवा: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)

जॉब क्यू, एक मैसेज क्यू है. इसमें एग्रीगेशन सेवा के लिए नौकरी के अनुरोध शामिल होते हैं. फ़्रंटएंड सेवा, नौकरी के अनुरोधों को कतार में डालती है. इसके बाद, एग्रीगेशन वर्कर इन अनुरोधों को इस्तेमाल करते हैं और उन्हें प्रोसेस करते हैं.

क्लाउड स्टोरेज

मैनेज की गई क्लाउड सेवा: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)

एग्रीगेशन सेवा इस्तेमाल करने वाली इनपुट और आउटपुट फ़ाइलें, क्लाउड स्टोरेज में सेव की जाती हैं. जैसे, एन्क्रिप्ट (सुरक्षित) की गई रिपोर्ट फ़ाइलें और आउटपुट की खास जानकारी वाली रिपोर्ट.

नौकरी के मेटाडेटा का डेटाबेस

मैनेज की गई क्लाउड सेवा: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)

जॉब मेटाडेटा डेटाबेस का इस्तेमाल, एग्रीगेशन जॉब की स्थिति को सेव करने और ट्रैक करने के लिए किया जाता है. यह मेटाडेटा रिकॉर्ड करता है. जैसे, बनाने का समय, अनुरोध किया गया समय, अपडेट किया गया समय, और स्थिति. जैसे, मिला, प्रोसेस में है या पूरा हो गया. काम की प्रोसेस होने के बाद, एग्रीगेशन वर्कर, जॉब मेटाडेटा डेटाबेस को अपडेट करते हैं.

एग्रीगेशन वर्कर

मैनेज की गई क्लाउड सेवा: Compute Engine with Confidential space (Google Cloud) / Amazon Web Services EC2 with Nitro Enclave (Amazon Web Services).

एग्रीगेशन वर्कर, जॉब क्यू में मौजूद जॉब के अनुरोधों को प्रोसेस करता है. साथ ही, यह कोऑर्डिनेटर में मौजूद Key Generation and Distribution Service (KGDS) से फ़ेच की गई कुंजियों का इस्तेमाल करके, एन्क्रिप्ट किए गए इनपुट को डिक्रिप्ट करता है. जॉब प्रोसेसिंग में लगने वाले समय को कम करने के लिए, एग्रीगेशन वर्कर आठ घंटे के लिए डिक्रिप्शन कुंजियों को कैश मेमोरी में सेव करते हैं. साथ ही, प्रोसेस किए जाने वाले सभी जॉब के लिए इनका इस्तेमाल करते हैं.

एग्रीगेशन वर्कर, ट्रस्टेड एक्ज़ीक्यूशन एनवायरमेंट (टीईई) इंस्टेंस में काम करते हैं. एक वर्कर, एक बार में सिर्फ़ एक जॉब हैंडल करता है. ऑटो स्केलिंग कॉन्फ़िगरेशन सेट करके, एक साथ कई वर्कर को जॉब प्रोसेस करने के लिए कॉन्फ़िगर किया जा सकता है. अगर ऑटो स्केलिंग का इस्तेमाल किया जाता है, तो यह जॉब क्यू में मौजूद मैसेज की संख्या के हिसाब से, वर्कर की संख्या को डाइनैमिक तौर पर घटाती-बढ़ाती है. टेराफ़ॉर्म एनवायरमेंट फ़ाइल के ज़रिए, ऑटो स्केलिंग के लिए वर्कर की कम से कम और ज़्यादा से ज़्यादा संख्या को कॉन्फ़िगर किया जा सकता है. ऑटोसकेलिंग के बारे में ज़्यादा जानकारी, इन Terraform स्क्रिप्ट में मिल सकती है: Amazon Web Services या Google Cloud.

Aggregation Workers, एग्रीगेट की जा सकने वाली रिपोर्ट की अकाउंटिंग के लिए, Aggregatable Report Accounting Service को कॉल करते हैं. यह सेवा पुष्टि करती है कि जॉब सिर्फ़ तब चलें, जब निजता बजट की सीमा पार न हुई हो. ("डुप्लीकेट नहीं" नियम देखें.) अगर बजट उपलब्ध है, तो नॉइज़ी एग्रीगेट का इस्तेमाल करके खास जानकारी वाली रिपोर्ट जनरेट की जाती है. एग्रीगेट की जा सकने वाली रिपोर्टिंग के लिए खाते के बारे में ज़्यादा जानकारी पढ़ें.

एग्रीगेशन वर्कर, जॉब मेटाडेटा डेटाबेस में जॉब मेटाडेटा अपडेट करते हैं. इस जानकारी में, नौकरी के रिटर्न कोड और रिपोर्ट में गड़बड़ी के काउंटर शामिल होते हैं. ऐसा तब होता है, जब रिपोर्ट पूरी तरह से जनरेट नहीं हो पाती है. उपयोगकर्ता, getJob जॉब की स्थिति वापस पाने वाले एपीआई का इस्तेमाल करके स्थिति पा सकते हैं.

एग्रीगेशन सेवा के बारे में ज़्यादा जानकारी के लिए, यह एक्सप्लेनर देखें.

अगले चरण

अब आपको पता चल गया है कि एग्रीगेशन सेवा कैसे काम करती है. Google Cloud या Amazon Web Services के ज़रिए अपना इंस्टेंस डिप्लॉय करने के लिए, शुरू करने से जुड़ी गाइड पढ़ें.