जानें कि एग्रीगेट की जा सकने वाली रिपोर्ट में नॉइज़ के साथ कैसे काम किया जाता है, इसका हिसाब कैसे लगाया जाता है, और इसके असर को कैसे कम किया जाता है.
शुरू करने से पहले
आगे बढ़ने से पहले, नॉइज़ के बारे में ज़्यादा जानकारी और इसके असर के बारे में जानने के लिए, खास जानकारी वाली रिपोर्ट में नॉइज़ को समझना लेख पढ़ें.
गै़र-ज़रूरी आवाज़ों को कंट्रोल करने की सुविधा
हालांकि, एग्रीगेट की जा सकने वाली रिपोर्ट में जोड़े गए नॉइज़ को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इसके असर को कम करने के लिए कुछ तरीके अपनाए जा सकते हैं. यहां दिए गए सेक्शन में, इन रणनीतियों के बारे में बताया गया है.
योगदान बजट को बढ़ाना
नॉइज़ को समझने के बारे में जानकारी देने वाले लेख में बताया गया है कि हर कुंजी के लिए, खास जानकारी की वैल्यू पर लागू होने वाला नॉइज़, 0 से 65,536 (0 से CONTRIBUTION_BUDGET) के स्केल पर आधारित होता है.
इस वजह से, नॉइज़ के मुकाबले सिग्नल को बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट की जा सकने वाली वैल्यू के तौर पर सेट करने से पहले, उसे बढ़ाना चाहिए. इसका मतलब है कि हर वैल्यू को किसी फ़ैक्टर, यानी कि स्केलिंग फ़ैक्टर से गुणा करें. साथ ही, यह पुष्टि करें कि यह वैल्यू, कॉन्ट्रिब्यूशन बजट के दायरे में है.
स्केलिंग फ़ैक्टर का हिसाब लगाना
स्केलिंग फ़ैक्टर से पता चलता है कि आपको किसी एग्रीगेट की जा सकने वाली वैल्यू को कितना स्केल करना है. इसकी वैल्यू, कॉन्ट्रिब्यूशन बजट को किसी खास कुंजी के लिए एग्रीगेट की जा सकने वाली ज़्यादा से ज़्यादा वैल्यू से भाग देने पर मिलने वाली वैल्यू होनी चाहिए.
उदाहरण के लिए, मान लें कि विज्ञापन देने वाले लोगों या कंपनियों को खरीदारी की कुल वैल्यू के बारे में जानना है. आपको पता है कि किसी भी खरीदारी की ज़्यादा से ज़्यादा अनुमानित वैल्यू 2,000 डॉलर है. हालांकि, कुछ ऐसे आउटलायर हैं जिन्हें आपको अनदेखा करना है:
- स्केलिंग फ़ैक्टर का हिसाब लगाएं:
- सिग्नल-टू-नॉइज़ रेशियो को ज़्यादा से ज़्यादा करने के लिए, आपको इस वैल्यू को 65,536 (योगदान बजट) तक बढ़ाना होगा.
- इससे स्केलिंग फ़ैक्टर 65,536 / 2,000 यानी कि करीब 32x हो जाता है. हालांकि, इस फ़ैक्टर को ऊपर या नीचे की ओर राउंड किया जा सकता है.
- एग्रीगेशन से पहले अपनी वैल्यू बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 से बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, एग्रीगेट की जा सकने वाली वैल्यू 120*32 = 3,840 पर सेट करें.
- एग्रीगेशन के बाद, अपनी वैल्यू को कम करें. जब आपको ऐसी खास जानकारी वाली रिपोर्ट मिलती है जिसमें कई उपयोगकर्ताओं की खरीदारी की कुल वैल्यू शामिल होती है, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, खास जानकारी वाली वैल्यू को कम करें. हमारे उदाहरण में, हमने प्री-एग्रीगेशन के लिए 32 के स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें खास जानकारी वाली रिपोर्ट में मिली खास जानकारी की वैल्यू को 32 से भाग देना होगा. इसलिए, अगर खास जानकारी वाली रिपोर्ट में किसी कुंजी के लिए खरीदारी की कुल वैल्यू 76,800 है, तो खरीदारी की कुल वैल्यू (नॉइज़ के साथ) 76,800/32 = 2,400 डॉलर होगी.
अपने बजट को बांटना
अगर आपके पास मेज़रमेंट के कई लक्ष्य हैं, जैसे कि खरीदारी की संख्या और खरीदारी की वैल्यू, तो हो सकता है कि आपको अपने बजट को इन लक्ष्यों के हिसाब से बांटना पड़े.
इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए, आपके स्केलिंग फ़ैक्टर अलग-अलग होंगे. यह इस बात पर निर्भर करेगा कि एग्रीगेट की जा सकने वाली किसी वैल्यू की ज़्यादा से ज़्यादा संख्या कितनी हो सकती है.
एग्रीगेशन कुंजियों को समझना में दी गई जानकारी पढ़ें.
उदाहरण के लिए, मान लें कि आपको खरीदारी की संख्या और खरीदारी की वैल्यू, दोनों को ट्रैक करना है. साथ ही, आपने अपने बजट को बराबर हिस्सों में बांटने का फ़ैसला किया है.
हर मेज़रमेंट टाइप और हर सोर्स के लिए,32,768 कुकी असाइन की जा सकती हैं.
- खरीदारी की संख्या:
- सिर्फ़ एक खरीदारी को ट्रैक किया जा रहा है. इसलिए, किसी कन्वर्ज़न के लिए खरीदारी की ज़्यादा से ज़्यादा संख्या 1 है.
- इसलिए, आपने खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट करने का फ़ैसला किया.
- परचेज़ कन्वर्ज़न वैल्यू:
- मान लें कि किसी खरीदारी की ज़्यादा से ज़्यादा अनुमानित वैल्यू 2,000 डॉलर है.
- इसलिए, आपने खरीदारी की वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला किया.
ज़्यादा एग्रीगेशन की से, सिग्नल-शोर अनुपात बेहतर होता है
कोर्स की, ग्रैनुलर की के मुकाबले ज़्यादा कन्वर्ज़न इवेंट कैप्चर करती हैं. इसलिए, कोर्स की से आम तौर पर ज़्यादा खास जानकारी मिलती है.
ज़्यादा वैल्यू वाली खास जानकारी पर, कम वैल्यू वाली खास जानकारी की तुलना में नॉइज़ का असर कम पड़ता है. इन वैल्यू पर नॉइज़, इस वैल्यू की तुलना में कम हो सकता है.
ज़्यादा जानकारी वाले कुंजियों से इकट्ठा की गई वैल्यू की तुलना में, कम जानकारी वाली कुंजियों से इकट्ठा की गई वैल्यू में नॉइज़ कम होने की संभावना होती है.
उदाहरण
अन्य सभी चीज़ों को एक जैसा रखने पर, दुनिया भर में खरीदारी की वैल्यू (सभी देशों के लिए कुल) को ट्रैक करने वाले मुख्य कॉम्पोनेंट से, देश के हिसाब से कन्वर्ज़न को ट्रैक करने वाले मुख्य कॉम्पोनेंट की तुलना में, खरीदारी की ज़्यादा वैल्यू (और कन्वर्ज़न की ज़्यादा संख्या) मिलती है.
इसलिए, किसी देश के लिए खरीदारी की कुल वैल्यू में होने वाला बदलाव, सभी देशों के लिए खरीदारी की कुल वैल्यू में होने वाले बदलाव से ज़्यादा होगा.
इसी तरह, अन्य सभी चीज़ें एक जैसी होने पर, जूतों की कुल परचेज़ वैल्यू, सभी आइटम (जूते भी शामिल हैं) की कुल परचेज़ वैल्यू से कम होती है.
इसलिए, जूतों की कुल खरीदारी वैल्यू में, सभी आइटम की कुल खरीदारी वैल्यू की तुलना में ज़्यादा नॉइज़ होगा.
खास जानकारी वाली वैल्यू (रोलअप) को जोड़ने पर, उनमें मौजूद नॉइज़ भी जुड़ जाती है
ज़्यादा लेवल का डेटा ऐक्सेस करने के लिए, खास जानकारी वाली रिपोर्ट से खास जानकारी वाली वैल्यू को जोड़ने पर, इन खास जानकारी वाली वैल्यू से मिलने वाले नॉइज़ को भी जोड़ा जाता है.
आइए, दो अलग-अलग तरीकों पर नज़र डालते हैं:
- पहला तरीका: अपनी कुंजियों में, जगह का आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, भौगोलिक आईडी के लेवल की कुंजियां दिखती हैं. इनमें से हर कुंजी, किसी खास भौगोलिक आईडी के लेवल पर खरीदारी की कुल वैल्यू से जुड़ी होती है.
- दूसरा तरीका: इसमें कुंजियों में, जगह का आईडी शामिल नहीं किया जाता है. खास जानकारी वाली रिपोर्ट में, सभी जगह के आईडी / जगहों के लिए, खरीदारी की कुल वैल्यू की खास जानकारी सीधे तौर पर दिखती है.
देश के हिसाब से खरीदारी की वैल्यू ऐक्सेस करने के लिए:
- पहले तरीके में, भौगोलिक आईडी के लेवल पर मौजूद खास जानकारी की वैल्यू को जोड़ा जाता है. इसलिए, उनके नॉइज़ को भी जोड़ा जाता है. इससे, फ़ाइनल जियो-आईडी-लेवल की खरीदारी की वैल्यू में ज़्यादा नॉइज़ जुड़ सकता है.
- दूसरे तरीके में, सीधे तौर पर समरी रिपोर्ट में मौजूद डेटा देखा जाता है. उस डेटा में नॉइज़ सिर्फ़ एक बार जोड़ी गई हो.
इसलिए, किसी दिए गए भौगोलिक आईडी के लिए, खरीदारी की कुल वैल्यू में उतार-चढ़ाव होने की संभावना, एप्रोच A में ज़्यादा होती है.
इसी तरह, अपनी कुंजियों में पिन कोड-लेवल डाइमेंशन शामिल करने से, क्षेत्र-लेवल डाइमेंशन के साथ ज़्यादा मोटे कीवर्ड इस्तेमाल करने की तुलना में, ज़्यादा शोर वाले नतीजे मिलने की संभावना होती है.
डेटा को ज़्यादा समय तक इकट्ठा करने से, सिग्नल-टू-नॉइज़ रेशियो बढ़ता है
कम समय में खास जानकारी वाली रिपोर्ट का अनुरोध करने का मतलब है कि खास जानकारी वाली हर वैल्यू, उस वैल्यू से ज़्यादा होगी जो ज़्यादा समय में रिपोर्ट का अनुरोध करने पर मिलती है. साथ ही, ज़्यादा समय में ज़्यादा कन्वर्ज़न होने की संभावना होती है.
जैसा कि पहले बताया गया है, खास जानकारी की वैल्यू जितनी ज़्यादा होगी, नॉइज़ उतना ही कम होगा. इसलिए, कम बार खास जानकारी वाली रिपोर्ट का अनुरोध करने से, सिग्नल टू नॉइज़ रेशियो बेहतर होता है.
यहां एक उदाहरण दिया गया है:
- अगर आपको 24 घंटे से ज़्यादा समय के लिए, हर घंटे के हिसाब से खास जानकारी वाली रिपोर्ट चाहिए और फिर दिन के हिसाब से डेटा ऐक्सेस करने के लिए, हर घंटे की रिपोर्ट से खास जानकारी वाली वैल्यू को जोड़ा जाता है, तो नॉइज़ को 24 बार जोड़ा जाता है.
- हर दिन की खास जानकारी वाली रिपोर्ट में, नॉइज़ को सिर्फ़ एक बार जोड़ा जाता है.
एप्सिलॉन जितना ज़्यादा होगा, नॉइज़ उतना ही कम होगा
एपसिलॉन वैल्यू जितनी ज़्यादा होगी, नॉइज़ उतना ही कम होगा और निजता की सुरक्षा उतनी ही कम होगी.
फ़िल्टर करने और डुप्लीकेट हटाने की सुविधा का इस्तेमाल करना
अलग-अलग मुख्य इवेंट के बीच बजट बांटने का एक अहम हिस्सा यह समझना है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, विज्ञापन देने वाला कोई व्यक्ति या कंपनी, हर क्लिक के लिए सिर्फ़ एक खरीदारी को अहम मान सकती है. हालांकि, उसे "प्रॉडक्ट पेज व्यू" वाले तीन कन्वर्ज़न में दिलचस्पी हो सकती है. इन इस्तेमाल के उदाहरणों के लिए, आपको एपीआई की इन सुविधाओं का इस्तेमाल करना पड़ सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट की जाएं और किन कन्वर्ज़न को गिना जाए:
- फ़िल्टर करना. फ़िल्टर करने के बारे में ज़्यादा जानें.
- डुप्लीकेट कॉपी हटाने की तकनीक. डुप्लीकेट हटाने के बारे में ज़्यादा जानें.
एप्सिलॉन के साथ एक्सपेरिमेंट करना
विज्ञापन टेक्नोलॉजी कंपनियां, इप्सिलॉन को 0 से ज़्यादा और 64 तक की वैल्यू पर सेट कर सकती हैं. इस रेंज से, टेस्टिंग को अपनी ज़रूरत के हिसाब से किया जा सकता है. एपसिलॉन की वैल्यू जितनी कम होगी, निजता की सुरक्षा उतनी ही ज़्यादा होगी. हमारा सुझाव है कि आप शुरुआत में इप्सिलॉन=10 से शुरू करें.
एक्सपेरिमेंट करने के लिए सुझाव
हमारा सुझाव है कि आप ये काम करें:
- एपसिलॉन = 10 से शुरू करें.
- अगर इससे यूटिलिटी से जुड़ी समस्याएं होती हैं, तो इप्सिलॉन को धीरे-धीरे बढ़ाएं.
- डेटा के इस्तेमाल से जुड़े किसी खास बदलाव के बारे में सुझाव, शिकायत या राय शेयर करें.
सुझाव/राय देना या शिकायत करना
इस एपीआई का इस्तेमाल किया जा सकता है और इस पर एक्सपेरिमेंट किया जा सकता है.
- एग्रीगेट की जा सकने वाली रिपोर्ट और एग्रीगेशन सेवा के बारे में पढ़ें. साथ ही, सवाल पूछें और सुझाव/राय दें या शिकायत करें.
- एट्रिब्यूशन रिपोर्टिंग की गाइड पढ़ें.
अगले चरण
- रिपोर्टिंग पर असर डालने वाले फ़ैक्टर के बारे में ज़्यादा जानने के लिए, समरी रिपोर्ट के डिज़ाइन से जुड़े फ़ैसलों के साथ एक्सपेरिमेंट करना लेख पढ़ें. जैसे, कैंपेन वैरिएबल, बैचिंग फ़्रीक्वेंसी, और डाइमेंशन ग्रैनुलैरिटी.
- नॉइज़ लैब को आज़माएं.