एग्रीगेट की जा सकने वाली रिपोर्ट में, ग़ैर-ज़रूरी डेटा को शामिल करने, उसका हिसाब लगाने, और उसके असर को कम करने का तरीका जानें.
शुरू करने से पहले
आगे बढ़ने से पहले, खास जानकारी वाली रिपोर्ट में गड़बड़ी को समझना लेख पढ़ें. इससे आपको गड़बड़ी और उसके असर के बारे में पूरी जानकारी मिलेगी.
शोर को कंट्रोल करने की सुविधा
एग्रीगेट की जा सकने वाली रिपोर्ट में जोड़े गए शोर को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इसके असर को कम करने के लिए कुछ कदम उठाए जा सकते हैं. इन रणनीतियों के बारे में नीचे दिए गए सेक्शन में बताया गया है.
योगदान के बजट तक बढ़ाना
'गड़बड़ी को समझना' में बताया गया है कि हर कुंजी के लिए, खास जानकारी वाली वैल्यू पर गड़बड़ी 0 से 65,536 स्केल (0 से CONTRIBUTION_BUDGET
) पर आधारित होती है.

इस वजह से, ग़ैर-ज़रूरी डेटा के मुकाबले सिग्नल को बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट की जा सकने वाली वैल्यू के तौर पर सेट करने से पहले, उसे बढ़ाना चाहिए. इसका मतलब है कि हर वैल्यू को किसी फ़ैक्टर, स्केलिंग फ़ैक्टर से गुणा करें. साथ ही, यह पक्का करें कि यह योगदान बजट में हो.

स्केलिंग फ़ैक्टर का हिसाब लगाना
स्केलिंग फ़ैक्टर से पता चलता है कि आपको किसी एग्रीगेट की जा सकने वाली वैल्यू को कितना बढ़ाना है. इसकी वैल्यू, योगदान बजट को किसी खास कुंजी के लिए ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू से भाग देने पर मिलती है.

उदाहरण के लिए, मान लें कि विज्ञापन देने वाले को खरीदारी की कुल वैल्यू जाननी है. आपको पता है कि किसी भी खरीदारी की ज़्यादा से ज़्यादा अनुमानित वैल्यू 2,000 डॉलर है. हालांकि, कुछ आउटलायर को अनदेखा किया जा सकता है:
- स्केलिंग फ़ैक्टर का हिसाब लगाना:
- सिग्नल-टू-नॉइज़ रेशियो को बढ़ाने के लिए, आपको इस वैल्यू को 65,536 (योगदान का बजट) पर सेट करना होगा.
- इससे 65,536 / 2,000 यानी करीब 32x स्केलिंग फ़ैक्टर मिलता है. आम तौर पर, इस फ़ैक्टर को ऊपर या नीचे की ओर राउंड किया जा सकता है.
- एग्रीगेशन से पहले अपनी वैल्यू को बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 तक बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, 120*32 = 3,840 की वैल्यू सेट करें.
- एग्रीगेशन के बाद, अपनी वैल्यू को छोटा करें. जब आपको समरी रिपोर्ट मिल जाए, जिसमें कई उपयोगकर्ताओं की खरीदारी की वैल्यू शामिल हो, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, समरी वैल्यू को छोटा करें. हमारे उदाहरण में, हमने एग्रीगेशन से पहले 32 के स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें समरी रिपोर्ट में मिली समरी वैल्यू को 32 से भाग देना होगा. इसलिए, अगर खास जानकारी वाली रिपोर्ट में किसी खास कुंजी के लिए खास जानकारी वाली खरीदारी की वैल्यू 76,800 है, तो खास जानकारी वाली खरीदारी की वैल्यू (गड़बड़ी के साथ) 76,800/32 = 2,400 डॉलर होगी.
अपना बजट बांटना
अगर आपके पास कई मेज़रमेंट लक्ष्य हैं, जैसे कि परचेज़ की संख्या और परचेज़ वैल्यू, तो हो सकता है कि आप अपने बजट को इन लक्ष्यों के बीच बांटना चाहें.
इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए, आपके स्केलिंग फ़ैक्टर अलग-अलग होंगे. यह एग्रीगेट की जा सकने वाली किसी वैल्यू की अनुमानित ज़्यादा से ज़्यादा वैल्यू पर निर्भर करता है.
एग्रीगेशन कुंजियों को समझना लेख में ज़्यादा जानें.
उदाहरण के लिए, मान लें कि आपने परचेज़ की संख्या और परचेज़ वैल्यू, दोनों को ट्रैक किया है. साथ ही, आपने अपना बजट बराबर-बराबर बांटने का फ़ैसला किया है.
हर मेज़रमेंट टाइप और हर सोर्स के लिए, 65,536 / 2 = 32,768 कोटा असाइन किया जा सकता है.
- खरीदारी की संख्या:
- आपने सिर्फ़ एक खरीदारी को ट्रैक किया है. इसलिए, किसी कन्वर्ज़न के लिए ज़्यादा से ज़्यादा एक खरीदारी की जा सकती है.
- इसलिए, आपने खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट किया है.
- परचेज़ वैल्यू:
- मान लें कि किसी भी खरीदारी की अनुमानित ज़्यादा से ज़्यादा वैल्यू 2,000 डॉलर है.
- इसलिए, आपने खरीदारी की वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला लिया.
ज़्यादा एग्रीगेशन कुंजियों से, सिग्नल-शोर अनुपात बेहतर होता है
ज़्यादा जानकारी वाली कुंजियों के मुकाबले, सामान्य कुंजियां ज़्यादा कन्वर्ज़न इवेंट कैप्चर करती हैं. इसलिए, आम तौर पर सामान्य कुंजियों से खास जानकारी वाली कुंजियों के मुकाबले ज़्यादा खास जानकारी मिलती है.
कम वैल्यू की तुलना में, खास जानकारी वाली ज़्यादा वैल्यू पर नॉइज़ का असर कम पड़ता है. इस वैल्यू की तुलना में, इन वैल्यू पर नॉइज़ कम हो सकता है.
ज़्यादा जानकारी वाली कुंजियों से इकट्ठा की गई वैल्यू की तुलना में, कम जानकारी वाली कुंजियों से इकट्ठा की गई वैल्यू में गड़बड़ी की संभावना कम होती है.
उदाहरण
बाकी सभी चीज़ें एक जैसी होने पर, किसी देश के लेवल पर कन्वर्ज़न ट्रैक करने वाली कुंजी की तुलना में, दुनिया भर में खरीदारी की वैल्यू (सभी देशों में जोड़कर) ट्रैक करने वाली कुंजी से, खरीदारी की कुल वैल्यू (और कन्वर्ज़न की कुल संख्या) ज़्यादा होगी.
इसलिए, किसी देश के लिए खरीदारी की कुल वैल्यू पर रिलेटिव नॉइज़, सभी देशों के लिए खरीदारी की कुल वैल्यू पर रिलेटिव नॉइज़ से ज़्यादा होगा.
इसी तरह, बाकी सभी चीज़ों को बराबर रखते हुए, जूतों की कुल परचेज़ वैल्यू, जूतों के साथ-साथ सभी आइटम की कुल परचेज़ वैल्यू से कम होती है.
इसलिए, जूतों की कुल परचेज़ वैल्यू पर रिलेटिव नॉइज़, सभी आइटम की कुल परचेज़ वैल्यू पर रिलेटिव नॉइज़ से ज़्यादा होगा.

खास जानकारी वाली वैल्यू (रोलअप) का योग लगाने पर, उनमें मौजूद गड़बड़ी का योग भी जुड़ जाता है
बेहतर लेवल का डेटा ऐक्सेस करने के लिए, खास जानकारी वाली रिपोर्ट में मौजूद खास जानकारी की वैल्यू जोड़ने पर, इन खास जानकारी की वैल्यू में मौजूद गै़र-ज़रूरी डेटा भी जुड़ जाता है.

आइए, दो अलग-अलग तरीकों पर नज़र डालते हैं: - पहला तरीका: अपनी कुंजियों में भौगोलिक आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, जियो-आईडी-लेवल की कुंजियां दिखती हैं. हर कुंजी, किसी खास जियो आईडी के लेवल पर खास जानकारी वाली खरीदारी की वैल्यू से जुड़ी होती है. - दूसरा तरीका: अपनी कुंजियों में भौगोलिक आईडी शामिल न करें. खास जानकारी वाली रिपोर्ट में, सभी भौगोलिक आईडी / जगहों के लिए, खरीदारी की खास जानकारी वाली वैल्यू सीधे तौर पर दिखती है.
देश के हिसाब से परचेज़ वैल्यू ऐक्सेस करने के लिए: - पहले तरीके से, जियो-आईडी-लेवल की खास जानकारी वाली वैल्यू को जोड़ा जाता है. साथ ही, इन वैल्यू में मौजूद गड़बड़ियों को भी जोड़ा जाता है. इससे, भौगोलिक आईडी के लेवल पर खरीदारी की फ़ाइनल वैल्यू में ज़्यादा गड़बड़ी हो सकती है. - दूसरे तरीके से, सीधे समरी रिपोर्ट में मौजूद डेटा देखा जा सकता है. उस डेटा में ग़ैर-ज़रूरी आवाज़ें सिर्फ़ एक बार जोड़ी गई हैं.
इसलिए, किसी दिए गए जियो आईडी के लिए परचेज़ वैल्यू की खास जानकारी, पहले तरीके से ज़्यादा गड़बड़ हो सकती है.
इसी तरह, अपनी कीवर्ड में पिन कोड-लेवल का डाइमेंशन शामिल करने से, क्षेत्र-लेवल के डाइमेंशन के साथ ज़्यादा कीवर्ड का इस्तेमाल करने की तुलना में, ज़्यादा ग़ैर-ज़रूरी नतीजे मिलेंगे.
लंबी समयावधि के लिए डेटा इकट्ठा करने पर, सिग्नल-शोर अनुपात बढ़ जाता है
खास जानकारी वाली रिपोर्ट का अनुरोध कम बार करने का मतलब है कि हर खास जानकारी वाली वैल्यू, रिपोर्ट का अनुरोध ज़्यादा बार करने की तुलना में ज़्यादा होगी. लंबे समयावधि में ज़्यादा कन्वर्ज़न होने की संभावना होती है.
जैसा कि पहले बताया गया है, समरी वैल्यू जितनी ज़्यादा होगी, रिलेटिव नॉइज़ उतना ही कम होगा. इसलिए, खास जानकारी वाली रिपोर्ट का अनुरोध कम बार करने से, सिग्नल-टू-नॉइज़ रेशियो बेहतर होता है.

इसे समझने के लिए यहां एक उदाहरण दिया गया है:
- अगर 24 घंटे के दौरान हर घंटे की खास जानकारी वाली रिपोर्ट का अनुरोध किया जा रहा है और फिर दिन के लेवल का डेटा ऐक्सेस करने के लिए, हर घंटे की रिपोर्ट की खास जानकारी की वैल्यू को जोड़ा जा रहा है, तो ग़ैर-ज़रूरी डेटा 24 बार जोड़ा जाता है.
- हर दिन की खास जानकारी वाली रिपोर्ट में, गड़बड़ी की जानकारी सिर्फ़ एक बार जोड़ी जाती है.
ज़्यादा एप्सिलॉन, कम शोर
एप्सिलॉन वैल्यू जितनी ज़्यादा होगी, नॉइज़ उतना ही कम होगा और निजता की सुरक्षा उतनी ही कम होगी.
फ़िल्टर करने और डुप्लीकेट कॉपी हटाने की सुविधा का फ़ायदा लेना
अलग-अलग कुंजियों के बीच बजट का बंटवारा करने के लिए, यह समझना ज़रूरी है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, हो सकता है कि विज्ञापन देने वाले को हर क्लिक के लिए सिर्फ़ एक खरीदारी की परवाह हो, लेकिन उसकी दिलचस्पी तीन "प्रॉडक्ट पेज व्यू" कन्वर्ज़न में हो. इन इस्तेमाल के उदाहरणों के साथ काम करने के लिए, एपीआई की इन सुविधाओं का भी फ़ायदा लिया जा सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट की जाएं और किन कन्वर्ज़न की गिनती की जाए:
- फ़िल्टर करना. फ़िल्टर करने के बारे में ज़्यादा जानें.
- डुप्लीकेट कॉपी हटाने की तकनीक. डुप्लीकेट कॉपी हटाने के बारे में ज़्यादा जानें.
epsilon के साथ प्रयोग करना
विज्ञापन टेक्नोलॉजी, epsilon को 0 से ज़्यादा और 64 तक की वैल्यू पर सेट कर सकती हैं. इस रेंज की मदद से, आसानी से जांच की जा सकती है. epsilon की कम वैल्यू से निजता की ज़्यादा सुरक्षा मिलती है. हमारा सुझाव है कि आप epsilon=10 से शुरू करें.
एक्सपेरिमेंट के लिए सुझाव
हमारा सुझाव है कि: - epsilon = 10 से शुरू करें. - अगर इससे उपयोगिता से जुड़ी समस्याएं आती हैं, तो एप्सिलॉन को धीरे-धीरे बढ़ाएं. - डेटा के इस्तेमाल से जुड़े खास पॉइंट के बारे में अपना सुझाव, राय या शिकायत शेयर करें.
लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें
आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.
- एग्रीगेट करने लायक रिपोर्ट और एग्रीगेशन सेवा के बारे में पढ़ें, सवाल पूछें, और सुझाव दें.
- एट्रिब्यूशन रिपोर्टिंग गाइड पढ़ें.
- प्राइवसी सैंडबॉक्स डेवलपर सहायता रेपो पर सवाल पूछें और होने वाली चर्चाओं में शामिल हों.
अगले चरण
- रिपोर्टिंग पर असर डालने वाले फ़ैक्टर के बारे में ज़्यादा जानकारी के लिए, खास जानकारी वाली रिपोर्ट के डिज़ाइन से जुड़े फ़ैसलों के साथ प्रयोग करना लेख पढ़ें. इन फ़ैक्टर में कैंपेन वैरिएबल, बैच करने की फ़्रीक्वेंसी, और डाइमेंशन की बारीकी से जानकारी शामिल है.
- Noise Lab आज़माएं.