जानें कि नॉइज़ का क्या मतलब है, इसे कहां जोड़ा जाता है, और इससे मेज़रमेंट पर क्या असर पड़ता है.
खास जानकारी वाली रिपोर्ट, एग्रीगेट की जा सकने वाली रिपोर्ट को एग्रीगेट करके बनाई जाती हैं. जब एग्रीगेट की जा सकने वाली रिपोर्ट को कलेक्टर बैच करता है और एग्रीगेशन सेवा उन्हें प्रोसेस करती है, तब खास जानकारी वाली रिपोर्ट में नॉइज़ यानी कि रैंडम डेटा जोड़ा जाता है. उपयोगकर्ता की निजता को सुरक्षित रखने के लिए, नॉइज़ जोड़ा जाता है. इस मेकेनिज़्म का मकसद, एक ऐसा फ़्रेमवर्क तैयार करना है जो डिफ़रेंशियल प्राइवसी के साथ मेज़रमेंट कर सके.
खास जानकारी वाली रिपोर्ट में शोर के बारे में जानकारी
आजकल, आम तौर पर विज्ञापनों की परफ़ॉर्मेंस का आकलन करते समय नॉइज़ को शामिल नहीं किया जाता है. हालांकि, कई मामलों में नॉइज़ को शामिल करने से, आपके नतीजों के आकलन के तरीके में कोई खास बदलाव नहीं होगा.
इसे इस तरह से समझा जा सकता है: अगर किसी डेटा में नॉइज़ नहीं है, तो क्या आपको उस डेटा के आधार पर फ़ैसला लेने में कोई परेशानी होगी?
उदाहरण के लिए, क्या विज्ञापन देने वाला व्यक्ति या कंपनी, इस आधार पर अपने कैंपेन की रणनीति या बजट में बदलाव करने के बारे में सोच सकती है कि कैंपेन A में 15 कन्वर्ज़न हुए और कैंपेन B में 16 कन्वर्ज़न हुए?
अगर जवाब 'नहीं' है, तो नॉइज़ से कोई फ़र्क़ नहीं पड़ता.
आपको एपीआई के इस्तेमाल को इस तरह से कॉन्फ़िगर करना होगा कि:
- इस सवाल का जवाब हां है.
- नॉइज़ को इस तरह से मैनेज किया जाता है कि इससे, कुछ डेटा के आधार पर फ़ैसला लेने की आपकी क्षमता पर कोई खास असर न पड़े. इसे इस तरह से समझा जा सकता है: आपको उम्मीद है कि कम से कम इतने कन्वर्ज़न मिलेंगे. इसके लिए, आपको इकट्ठा की गई मेट्रिक में नॉइज़ को एक तय प्रतिशत से कम रखना है.
इस सेक्शन और इसके बाद वाले सेक्शन में, हम 2 को हासिल करने की रणनीतियों के बारे में बताएंगे.
मुख्य सिद्धांत
एग्रीगेशन सेवा, हर बार किसी समरी रिपोर्ट का अनुरोध किए जाने पर, हर समरी वैल्यू में एक बार नॉइज़ जोड़ती है. इसका मतलब है कि हर कुंजी के लिए एक बार नॉइज़ जोड़ा जाता है.
ये नॉइज़ वैल्यू, संभाव्यता के किसी खास डिस्ट्रिब्यूशन से रैंडम तरीके से ली जाती हैं. जैसे, यहां बताया गया है.
शोर पर असर डालने वाले सभी एलिमेंट, दो मुख्य सिद्धांतों पर निर्भर करते हैं.
नॉइज़ डिस्ट्रिब्यूशन (नीचे दी गई जानकारी देखें) एक जैसा होता है. भले ही, खास जानकारी की वैल्यू कम हो या ज़्यादा. इसलिए, समरी वैल्यू जितनी ज़्यादा होगी, इस वैल्यू के हिसाब से शोर का असर उतना ही कम होगा.
उदाहरण के लिए, मान लें कि कुल 20,000 डॉलर की खरीदारी की वैल्यू और कुल 200 डॉलर की खरीदारी की वैल्यू, दोनों में एक ही डिस्ट्रिब्यूशन से चुना गया नॉइज़ शामिल है.
मान लें कि इस डिस्ट्रिब्यूशन में नॉइज़, -100 से +100 के बीच है.
- अगर खरीदारी की कुल कीमत 20,000 डॉलर है, तो नॉइज़ 0 से 100/20,000=0.5% के बीच होती है.
- खरीदारी की कुल कीमत 200 डॉलर के लिए, नॉइज़ 0 से 100/200=50% के बीच होती है.
इसलिए, 20,000 डॉलर की कुल खरीदारी वैल्यू पर, 200 डॉलर की वैल्यू के मुकाबले नॉइज़ का असर कम पड़ने की संभावना है. तुलनात्मक रूप से, 20,000 डॉलर के बजट में कम नॉइज़ होने की संभावना है. इसका मतलब है कि इसमें सिग्नल-टू-नॉइज़ रेशियो ज़्यादा होने की संभावना है.
एग्रीगेट की गई ज़्यादा वैल्यू पर नॉइज़ का असर कम होता है. इसके कुछ अहम व्यावहारिक पहलू हैं, जिनके बारे में अगले सेक्शन में बताया गया है. यह तरीका, एपीआई डिज़ाइन का हिस्सा है. साथ ही, इसके व्यावहारिक असर लंबे समय तक दिखते हैं. विज्ञापन टेक्नोलॉजी कंपनियां, एग्रीगेशन की अलग-अलग रणनीतियां डिज़ाइन और उनका आकलन करते समय, इनका इस्तेमाल करती रहेंगी.
हालांकि, नॉइज़ को एक ही डिस्ट्रिब्यूशन से लिया जाता है, भले ही खास जानकारी की वैल्यू कुछ भी हो. हालांकि, यह डिस्ट्रिब्यूशन कई पैरामीटर पर निर्भर करता है. इनमें से एक पैरामीटर, epsilon है. ओरिजिन ट्रायल के दौरान, विज्ञापन टेक्नोलॉजी कंपनियां इसमें बदलाव कर सकती हैं. इससे वे अलग-अलग यूटिलिटी/निजता से जुड़े बदलावों का आकलन कर सकती हैं. हालांकि, इस बात का ध्यान रखें कि इप्सिलॉन को कुछ समय के लिए ही बदला जा सकता है. हम आपके इस्तेमाल के उदाहरणों और एप्साइलन की उन वैल्यू के बारे में आपके सुझाव/राय का स्वागत करते हैं जो अच्छी तरह से काम करती हैं.
विज्ञापन टेक्नोलॉजी से जुड़ी कंपनी के पास, नॉइज़ जोड़ने के तरीकों का सीधा कंट्रोल नहीं होता. हालांकि, वह मेज़रमेंट डेटा पर नॉइज़ के असर को कम कर सकती है. अगले सेक्शन में, हम इस बारे में विस्तार से जानेंगे कि व्यवहार में बदलाव से नॉइज़ पर कैसे असर पड़ सकता है.
इससे पहले, आइए देखते हैं कि नॉइज़ को कैसे लागू किया जाता है.
ज़ूम इन करने पर: नॉइज़ कैसे लागू होती है
एक नॉइज़ डिस्ट्रिब्यूशन
नॉइज़ को लैप्लस डिस्ट्रिब्यूशन से लिया जाता है. इसके पैरामीटर ये हैं:
μका मतलब 0 है. इसका मतलब है कि नॉइज़ की सबसे संभावित वैल्यू 0 है (कोई नॉइज़ नहीं जोड़ी गई है). साथ ही, नॉइज़ वाली वैल्यू के, ओरिजनल वैल्यू से कम या ज़्यादा होने की संभावना बराबर है. इसे कभी-कभी निष्पक्ष भी कहा जाता है.b = CONTRIBUTION_BUDGET/epsilonका स्केल पैरामीटर.CONTRIBUTION_BUDGETको ब्राउज़र में तय किया जाता है.epsilonका इस्तेमाल एग्रीगेशन सेवा में किया जाता है.
इस डायग्राम में, μ=0, b = 20 के साथ लैप्लस डिस्ट्रिब्यूशन के लिए प्रॉबेबिलिटी डेंसिटी फ़ंक्शन दिखाया गया है:
रैंडम नॉइज़ वैल्यू, एक नॉइज़ डिस्ट्रिब्यूशन
मान लें कि विज्ञापन टेक्नोलॉजी कंपनी, एग्रीगेशन की दो कुंजियों, key1 और key2 के लिए खास जानकारी वाली रिपोर्ट का अनुरोध करती है.
एग्रीगेशन सेवा, नॉइज़ के एक ही डिस्ट्रिब्यूशन के हिसाब से, नॉइज़ की दो वैल्यू x1 और x2 चुनती है. x1 को key1 की खास जानकारी वाली वैल्यू में जोड़ा जाता है और x2 को key2 की खास जानकारी वाली वैल्यू में जोड़ा जाता है.
डायग्राम में, हम नॉइज़ वैल्यू को एक जैसा दिखाएंगे. यह एक आसान उदाहरण है. असल में, नॉइज़ वैल्यू अलग-अलग होंगी, क्योंकि इन्हें डिस्ट्रिब्यूशन से रैंडम तरीके से लिया जाता है.
इससे पता चलता है कि नॉइज़ की सभी वैल्यू एक ही डिस्ट्रिब्यूशन से मिलती हैं. साथ ही, ये उस खास वैल्यू से अलग होती हैं जिस पर इन्हें लागू किया जाता है.
शोर की अन्य प्रॉपर्टी
हर खास जानकारी की वैल्यू में नॉइज़ जोड़ा जाता है. इसमें खाली वैल्यू (0) भी शामिल हैं.
उदाहरण के लिए, अगर किसी मुख्य वैल्यू के लिए सही खास जानकारी की वैल्यू 0 है, तो इस मुख्य वैल्यू के लिए खास जानकारी वाली रिपोर्ट में दिखने वाली नॉइज़ी खास जानकारी की वैल्यू (ज़्यादातर मामलों में) 0 नहीं होगी.
नॉइज़, पॉज़िटिव या नेगेटिव नंबर हो सकता है.
उदाहरण के लिए, अगर बिना किसी बदलाव के खरीदारी की रकम 3,27,000 है, तो इसमें +6,000 या -6,000 का बदलाव हो सकता है. ये उदाहरण के तौर पर दी गई वैल्यू हैं.
ग़ैर-ज़रूरी आवाज़ का आकलन किया जा रहा है
नॉइज़ के स्टैंडर्ड डेविएशन की गणना करना
नॉइज़ का स्टैंडर्ड डेविएशन यह है:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
उदाहरण
अगर इप्सिलॉन = 10 है, तो नॉइज़ का स्टैंडर्ड डेविएशन यह होगा:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
यह आकलन करना कि मेज़रमेंट में अंतर कब अहम होते हैं
आपको एग्रीगेशन सेवा से मिली हर वैल्यू में जोड़े गए नॉइज़ का स्टैंडर्ड डेविएशन पता होगा. इसलिए, तुलना करने के लिए सही थ्रेशोल्ड तय किए जा सकते हैं. इससे यह तय किया जा सकता है कि क्या मिले हुए अंतर, नॉइज़ की वजह से हो सकते हैं.
उदाहरण के लिए, अगर किसी वैल्यू में जोड़ा गया नॉइज़, स्केलिंग के हिसाब से करीब-करीब +/- 10 है और दो कैंपेन के बीच वैल्यू में अंतर 100 से ज़्यादा है, तो यह अनुमान लगाना सुरक्षित है कि हर कैंपेन के बीच मेज़र की गई वैल्यू में अंतर, सिर्फ़ नॉइज़ की वजह से नहीं है.
सुझाव/राय देना या शिकायत करना
इस एपीआई का इस्तेमाल किया जा सकता है और इस पर एक्सपेरिमेंट किया जा सकता है.
- एग्रीगेट की जा सकने वाली रिपोर्ट और एग्रीगेशन सेवा के बारे में पढ़ें. साथ ही, सवाल पूछें और सुझाव/राय दें या शिकायत करें.
- एट्रिब्यूशन रिपोर्टिंग की गाइड पढ़ें.
अगले चरण
- सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, कंट्रोल किए जा सकने वाले वैरिएबल के बारे में जानने के लिए, नॉइज़ के साथ काम करना लेख पढ़ें.
- एग्रीगेशन रिपोर्टिंग की रणनीतियां प्लान करने के लिए, खास जानकारी वाली रिपोर्ट के डिज़ाइन से जुड़े फ़ैसलों के साथ एक्सपेरिमेंट करना लेख पढ़ें.
- नॉइज़ लैब को आज़माएं.