ग़ैर-ज़रूरी आवाज़ें कम करने की सुविधा का इस्तेमाल करना

एग्रीगेट की जा सकने वाली रिपोर्ट में नॉइज़ का असर कम करने, उसके साथ काम करने, और उसका हिसाब लगाने का तरीका जानें.

शुरू करने से पहले

आगे बढ़ने से पहले, खास जानकारी वाली रिपोर्ट में नॉइज़ को समझना लेख पढ़ें. इससे आपको नॉइज़ और उसके असर के बारे में पूरी जानकारी मिलेगी.

शोर को कंट्रोल करने की सुविधा

एग्रीगेट की जा सकने वाली रिपोर्ट में जोड़े गए नॉइज़ को सीधे तौर पर कंट्रोल नहीं किया जा सकता. हालांकि, इसके असर को कम करने के लिए कुछ कदम उठाए जा सकते हैं. इन रणनीतियों के बारे में नीचे दिए गए सेक्शन में बताया गया है.

योगदान के बजट तक बढ़ाना

'गड़बड़ी को समझना' में बताया गया है कि हर कुंजी के लिए, खास जानकारी वाली वैल्यू पर गड़बड़ी 0 से 65,536 स्केल (0 से CONTRIBUTION_BUDGET) पर आधारित होती है.

ग़ैर-ज़रूरी आवाज़ों को कम करने की सुविधा, बजट के आधार पर तय की जाती है.
नॉइज़ डिस्ट्रिब्यूशन, बजट के आधार पर होता है.

इसलिए, ग़ैर-ज़रूरी डेटा के मुकाबले सिग्नल को बढ़ाने के लिए, आपको हर वैल्यू को एग्रीगेट की जा सकने वाली वैल्यू के तौर पर सेट करने से पहले, उसे बढ़ाना चाहिए. इसका मतलब है कि हर वैल्यू को किसी फ़ैक्टर, स्केलिंग फ़ैक्टर से गुणा करें. साथ ही, यह भी पक्का करें कि यह योगदान बजट में हो.

स्केलिंग के साथ और बिना स्केलिंग के, ग़ैर-ज़रूरी आवाज़ों की तुलना.
स्केलिंग के साथ और बिना स्केलिंग के रिलेटिव नॉइज़.

स्केलिंग फ़ैक्टर का हिसाब लगाना

स्केलिंग फ़ैक्टर से पता चलता है कि आपको किसी एग्रीगेट की जा सकने वाली वैल्यू को कितना बढ़ाना है. इसकी वैल्यू, योगदान बजट को किसी खास कुंजी के लिए ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू से भाग देने पर मिलती है.

योगदान के बजट के आधार पर स्केलिंग फ़ैक्टर तय करना.
योगदान के बजट के आधार पर स्केलिंग फ़ैक्टर तय करना.

उदाहरण के लिए, मान लें कि विज्ञापन देने वाले को खरीदारी की कुल वैल्यू जाननी है. आपको पता है कि किसी भी खरीदारी की अनुमानित ज़्यादा से ज़्यादा वैल्यू 2,000 डॉलर है. हालांकि, कुछ आउटलायर को अनदेखा किया जा सकता है:

  • स्केलिंग फ़ैक्टर का हिसाब लगाना:
    • सिग्नल-टू-नॉइज़ रेशियो को बढ़ाने के लिए, आपको इस वैल्यू को 65,536 (योगदान बजट) पर सेट करना होगा.
    • इससे 65,536 / 2,000 यानी करीब 32x स्केलिंग फ़ैक्टर मिलता है. आम तौर पर, इस फ़ैक्टर को ऊपर या नीचे की ओर राउंड किया जा सकता है.
  • एग्रीगेशन से पहले अपनी वैल्यू को बढ़ाएं. हर 1 डॉलर की खरीदारी के लिए, ट्रैक की गई मेट्रिक को 32 तक बढ़ाएं. उदाहरण के लिए, 120 डॉलर की खरीदारी के लिए, 120*32 = 3,840 की वैल्यू सेट करें.
  • एग्रीगेशन के बाद, अपनी वैल्यू को छोटा करें. जब आपको समरी रिपोर्ट मिल जाए, जिसमें कई उपयोगकर्ताओं की खरीदारी की वैल्यू शामिल हो, तो एग्रीगेशन से पहले इस्तेमाल किए गए स्केलिंग फ़ैक्टर का इस्तेमाल करके, समरी वैल्यू को छोटा करें. हमारे उदाहरण में, हमने एग्रीगेशन से पहले 32 के स्केलिंग फ़ैक्टर का इस्तेमाल किया है. इसलिए, हमें समरी रिपोर्ट में मिली समरी वैल्यू को 32 से भाग देना होगा. इसलिए, अगर खास जानकारी वाली रिपोर्ट में किसी खास कुंजी के लिए खास जानकारी वाली परचेज़ वैल्यू 76,800 है, तो खास जानकारी वाली परचेज़ वैल्यू (नॉइज़ के साथ) 76,800/32 = 2,400 डॉलर होगी.

अपना बजट बांटना

अगर आपके पास कई मेज़रमेंट लक्ष्य हैं, जैसे कि परचेज़ की संख्या और परचेज़ वैल्यू, तो हो सकता है कि आप अपने बजट को इन लक्ष्यों के बीच बांटना चाहें.

इस मामले में, एग्रीगेट की जा सकने वाली अलग-अलग वैल्यू के लिए, आपके स्केलिंग फ़ैक्टर अलग-अलग होंगे. ये फ़ैक्टर, एग्रीगेट की जा सकने वाली किसी वैल्यू की अनुमानित ज़्यादा से ज़्यादा वैल्यू पर निर्भर करेंगे.

एग्रीगेशन कुंजियों को समझना लेख में ज़्यादा जानें.

उदाहरण के लिए, मान लें कि आपने परचेज़ की संख्या और परचेज़ वैल्यू, दोनों को ट्रैक किया है. साथ ही, आपने अपना बजट बराबर-बराबर बांटने का फ़ैसला लिया है.

हर मेज़रमेंट टाइप और हर सोर्स के लिए, 65,536 / 2 = 32,768 कोटा असाइन किया जा सकता है.

  • खरीदारी की संख्या:
    • आपने सिर्फ़ एक खरीदारी को ट्रैक किया है. इसलिए, किसी कन्वर्ज़न के लिए ज़्यादा से ज़्यादा एक खरीदारी की जा सकती है.
    • इसलिए, आपने खरीदारी की संख्या के लिए स्केलिंग फ़ैक्टर को 32,768 / 1 = 32,768 पर सेट किया है.
  • परचेज़ वैल्यू:
    • मान लें कि किसी भी खरीदारी की अनुमानित ज़्यादा से ज़्यादा वैल्यू 2,000 डॉलर है.
    • इसलिए, आपने खरीदारी की वैल्यू के लिए स्केलिंग फ़ैक्टर को 32,768 / 2,000 = 16.384 या करीब 16 पर सेट करने का फ़ैसला लिया.

ज़्यादा एग्रीगेशन कुंजियों से, सिग्नल-शोर अनुपात बेहतर होता है

ज़्यादा जानकारी वाली कुंजियों के मुकाबले, सामान्य कुंजियां ज़्यादा कन्वर्ज़न इवेंट कैप्चर करती हैं. इसलिए, सामान्य कुंजियों से आम तौर पर खास जानकारी वाली कुंजियों के मुकाबले ज़्यादा खास जानकारी मिलती है.

कम वैल्यू की तुलना में, खास जानकारी वाली ज़्यादा वैल्यू पर नॉइज़ का कम असर पड़ता है. इस वैल्यू की तुलना में, इन वैल्यू पर नॉइज़ कम हो सकता है.

ज़्यादा जानकारी वाली कुंजियों से इकट्ठा की गई वैल्यू की तुलना में, ज़्यादा जानकारी वाली कुंजियों से इकट्ठा की गई वैल्यू में गड़बड़ी की संभावना कम होती है.

उदाहरण

बाकी सभी चीज़ें एक जैसी होने पर, किसी देश के लेवल पर कन्वर्ज़न ट्रैक करने वाली कुंजी की तुलना में, दुनिया भर में परचेज़ वैल्यू (सभी देशों में जोड़कर) ट्रैक करने वाली कुंजी से, परचेज़ वैल्यू की खास जानकारी और कन्वर्ज़न की खास जानकारी ज़्यादा मिलेगी.

इसलिए, किसी देश के लिए खरीदारी की कुल वैल्यू पर रिलेटिव नॉइज़, सभी देशों के लिए खरीदारी की कुल वैल्यू पर रिलेटिव नॉइज़ से ज़्यादा होगा.

इसी तरह, बाकी सभी चीज़ों को बराबर रखते हुए, जूतों की कुल परचेज़ वैल्यू, जूतों के साथ-साथ सभी आइटम की कुल परचेज़ वैल्यू से कम होती है.

इसलिए, जूतों की कुल खरीदारी की वैल्यू पर रिलेटिव नॉइज़, सभी आइटम की कुल खरीदारी की वैल्यू पर रिलेटिव नॉइज़ से ज़्यादा होगा.

ज़्यादा जानकारी वाली बनाम कम जानकारी वाली कुंजियों के साथ नॉइज़ इंपैक्ट.
ज़्यादा जानकारी देने वाली बनाम कम जानकारी देने वाली कुंजियों के साथ नॉइज़ इंपैक्ट.

खास जानकारी वाली वैल्यू (रोलअप) का योग लगाने पर, उनमें मौजूद गड़बड़ी का योग भी जुड़ जाता है

बेहतर लेवल का डेटा ऐक्सेस करने के लिए, खास जानकारी वाली रिपोर्ट में मौजूद खास जानकारी की वैल्यू जोड़ने पर, इन खास जानकारी की वैल्यू में मौजूद गै़र-ज़रूरी डेटा भी जुड़ जाता है.

रोलअप के साथ ज़्यादा जानकारी वाली कुंजियों के मुकाबले, बिना रोलअप वाली कुंजियों में ग़ैर-ज़रूरी डेटा की डिग्री.
रोलअप के साथ ज़्यादा जानकारी वाली बटन के मुकाबले, बिना रोलअप वाली बटन में ग़ैर-ज़रूरी जानकारी की डिग्री.

आइए, दो अलग-अलग तरीकों पर नज़र डालते हैं:

  • पहला तरीका: अपनी कुंजियों में भौगोलिक आईडी शामिल करें. खास जानकारी वाली रिपोर्ट में, जियो-आईडी-लेवल की कुंजियां दिखती हैं. हर कुंजी, किसी खास जियो आईडी के लेवल पर खास जानकारी वाली खरीदारी की वैल्यू से जुड़ी होती है.
  • दूसरा तरीका: अपनी कुंजियों में भौगोलिक आईडी शामिल न करें. खास जानकारी वाली रिपोर्ट में, सभी भौगोलिक आईडी / जगहों के लिए, खरीदारी की खास जानकारी वाली वैल्यू सीधे तौर पर दिखती है.

देश के हिसाब से खरीदारी की वैल्यू ऐक्सेस करने के लिए:

  • पहले तरीके से, जियो-आईडी-लेवल की खास जानकारी वाली वैल्यू का जोड़ लगाया जाता है. इसलिए, उनके नॉइज़ का भी जोड़ लगाया जाता है. इससे, भौगोलिक आईडी के लेवल पर खरीदारी की फ़ाइनल वैल्यू में ज़्यादा गड़बड़ी हो सकती है.
  • दूसरे तरीके से, समरी रिपोर्ट में मौजूद डेटा को सीधे देखा जा सकता है. उस डेटा में ग़ैर-ज़रूरी आवाज़ें सिर्फ़ एक बार जोड़ी गई हैं.

इसलिए, किसी दिए गए भौगोलिक आईडी के लिए, खरीदारी की खास जानकारी वाली वैल्यू, पहले तरीके से ज़्यादा गड़बड़ हो सकती है.

इसी तरह, अपनी कीवर्ड में पिन कोड-लेवल का डाइमेंशन शामिल करने से, क्षेत्र-लेवल के डाइमेंशन के साथ ज़्यादा कीवर्ड का इस्तेमाल करने की तुलना में, ज़्यादा ग़ैर-ज़रूरी नतीजे मिलेंगे.

लंबी समयावधि के डेटा को इकट्ठा करने से, सिग्नल-शोर अनुपात बढ़ता है

खास जानकारी वाली रिपोर्ट का अनुरोध कम बार करने का मतलब है कि हर खास जानकारी वाली वैल्यू, रिपोर्ट का अनुरोध ज़्यादा बार करने की तुलना में ज़्यादा होगी. लंबे समयावधि में ज़्यादा कन्वर्ज़न होने की संभावना होती है.

जैसा कि पहले बताया गया है, समरी वैल्यू जितनी ज़्यादा होगी, रिलेटिव नॉइज़ उतना ही कम होगा. इसलिए, खास जानकारी वाली रिपोर्ट का अनुरोध कम बार करने से, सिग्नल-टू-नॉइज़ रेशियो बेहतर होता है.

खास जानकारी वाली रिपोर्ट का अनुरोध कम बार करने पर, सिग्नल-टू-नॉइज़ रेशियो ज़्यादा हो जाता है
खास जानकारी वाली रिपोर्ट कम बार मांगने पर, सिग्नल-टू-नॉइज़ रेशियो ज़्यादा हो जाता है.

इसे समझने के लिए यहां एक उदाहरण दिया गया है:

  • अगर 24 घंटे के दौरान हर घंटे की खास जानकारी वाली रिपोर्ट का अनुरोध किया जा रहा है और दिन के लेवल का डेटा ऐक्सेस करने के लिए, हर घंटे की खास जानकारी वाली रिपोर्ट की खास जानकारी की वैल्यू को जोड़ा जा रहा है, तो ग़ैर-ज़रूरी डेटा 24 बार जोड़ा जाता है.
  • हर दिन की खास जानकारी वाली रिपोर्ट में, ग़ैर-ज़रूरी आवाज़ें सिर्फ़ एक बार जोड़ी जाती हैं.

ज़्यादा एप्सिलॉन, कम शोर

एप्सिलॉन वैल्यू जितनी ज़्यादा होगी, नॉइज़ उतना ही कम होगा और निजता की सुरक्षा उतनी ही कम होगी.

फ़िल्टर करने और डुप्लीकेट कॉपी हटाने की सुविधा का फ़ायदा लेना

अलग-अलग कुंजियों के बीच बजट का बंटवारा करने के लिए, यह समझना ज़रूरी है कि कोई इवेंट कितनी बार हो सकता है. उदाहरण के लिए, हो सकता है कि विज्ञापन देने वाले को हर क्लिक के लिए सिर्फ़ एक खरीदारी की परवाह हो, लेकिन उसकी दिलचस्पी तीन "प्रॉडक्ट पेज व्यू" कन्वर्ज़न में हो. इन इस्तेमाल के उदाहरणों के साथ काम करने के लिए, एपीआई की इन सुविधाओं का इस्तेमाल भी किया जा सकता है. इनकी मदद से, यह कंट्रोल किया जा सकता है कि कितनी रिपोर्ट जनरेट की जाएं और किन कन्वर्ज़न की गिनती की जाए:

एप्सिलॉन के साथ प्रयोग करना

विज्ञापन टेक्नोलॉजी विशेषज्ञ, epsilon को 0 से ज़्यादा और 64 तक की वैल्यू पर सेट कर सकते हैं. इस रेंज की मदद से, अलग-अलग तरह से जांच की जा सकती है. epsilon की कम वैल्यू से निजता की ज़्यादा सुरक्षा मिलती है. हमारा सुझाव है कि आप epsilon=10 से शुरू करें.

एक्सपेरिमेंट के लिए सुझाव

हमारा सुझाव है कि:

  • epsilon = 10 से शुरू करें.
  • अगर इससे उपयोगिता से जुड़ी समस्याएं आती हैं, तो epsilon को धीरे-धीरे बढ़ाएं.
  • डेटा के इस्तेमाल से जुड़े खास पॉइंट के बारे में अपना सुझाव, राय या शिकायत शेयर करें.

लोगों से जुड़ें और सुझाव, शिकायत या राय शेयर करें

आपके पास इस एपीआई में हिस्सा लेने और इसका इस्तेमाल करने का विकल्प है.

अगले चरण