Noiselab

इस दस्तावेज़ के बारे में जानकारी

इस दस्तावेज़ को पढ़कर, आपको इन विषयों के बारे में जानकारी मिलेगी:

  • खास जानकारी वाली रिपोर्ट जनरेट करने से पहले, यह समझें कि कौनसी रणनीतियां बनानी हैं.
  • नॉइज़ लैब के बारे में जानें. यह एक ऐसा टूल है जो नॉइज़ के अलग-अलग पैरामीटर के असर को समझने में मदद करता है. साथ ही, नॉइज़ मैनेजमेंट की अलग-अलग रणनीतियों को तुरंत एक्सप्लोर और उनका आकलन करने में मदद करता है.
नॉइज़ लैब का स्क्रीनशॉट.
नॉइज़ लैब

सुझाव/राय दें या शिकायत करें

इस दस्तावेज़ में, खास जानकारी वाली रिपोर्ट के साथ काम करने के कुछ सिद्धांतों के बारे में बताया गया है. हालांकि, नॉइज़ मैनेजमेंट के कई तरीके हैं, जिनके बारे में यहां नहीं बताया गया है. हम आपके सुझावों, सवालों, और जोड़े गए कॉन्टेंट का स्वागत करते हैं!

  • शोर को मैनेज करने की रणनीतियों, एपीआई (एपसिलॉन) की सुविधा या निजता के बारे में सार्वजनिक तौर पर सुझाव/राय देने या शिकायत करने के लिए. साथ ही, Noise Lab के साथ सिम्युलेट करते समय अपनी टिप्पणियां शेयर करने के लिए: इस समस्या पर टिप्पणी करें
  • एपीआई के किसी अन्य पहलू के बारे में सार्वजनिक तौर पर सुझाव/राय देने या शिकायत करने के लिए: यहाँ नई समस्या की रिपोर्ट करें

शुरू करने से पहले

  1. इसके बारे में जानने के लिए, Attribution Reporting: खास जानकारी वाली रिपोर्ट और Attribution Reporting की पूरी सिस्टम की खास जानकारी पढ़ें.
  2. इस गाइड का बेहतर तरीके से इस्तेमाल करने के लिए, नॉइज़ को समझना और एग्रीगेशन कुंजियों को समझना लेख पढ़ें.

डिज़ाइन से जुड़े फ़ैसले

डिज़ाइन से जुड़ा मुख्य सिद्धांत

तीसरे पक्ष की कुकी और खास जानकारी वाली रिपोर्ट के काम करने के तरीके में बुनियादी अंतर होते हैं. मुख्य अंतर यह है कि खास जानकारी वाली रिपोर्ट में, मेज़रमेंट डेटा में नॉइज़ जोड़ा जाता है. दूसरा तरीका यह है कि रिपोर्ट को शेड्यूल कैसे किया जाता है.

ज़्यादा सिग्नल-टू-नॉइज़ रेशियो वाले मेज़रमेंट डेटा के साथ खास जानकारी वाली रिपोर्ट ऐक्सेस करने के लिए, डिमांड-साइड प्लैटफ़ॉर्म (डीएसपी) और विज्ञापन मेज़रमेंट सेवा देने वाली कंपनियों को, विज्ञापन देने वाले लोगों या कंपनियों के साथ मिलकर नॉइज़ मैनेजमेंट की रणनीतियां बनानी होंगी. इन रणनीतियों को डेवलप करने के लिए, डीएसएपी और मेज़रमेंट की सेवाएं देने वाली कंपनियों को डिज़ाइन से जुड़े फ़ैसले लेने होते हैं. ये फ़ैसले, एक ज़रूरी कॉन्सेप्ट के इर्द-गिर्द घूमते हैं:

डेटा के डिस्ट्रिब्यूशन में शामिल नॉइज़ वैल्यू सिर्फ़ दो पैरामीटर पर निर्भर करती हैं⏤एपसिलॉन और कॉन्ट्रिब्यूशन बजट⏤हालांकि, आपके पास कई अन्य कंट्रोल होते हैं. इनसे आपके आउटपुट मेज़रमेंट डेटा के सिग्नल-टू-नॉइज़ रेशियो पर असर पड़ता है.

हमें उम्मीद है कि बार-बार की जाने वाली प्रोसेस से बेहतर फ़ैसले लिए जा सकेंगे. हालांकि, इन फ़ैसलों में हर बदलाव से, लागू करने का तरीका थोड़ा अलग होगा. इसलिए, कोड के हर वर्शन को लिखने से पहले (और विज्ञापन दिखाने से पहले) ये फ़ैसले लिए जाने चाहिए.

फ़ैसला: डाइमेंशन की बारीकी

इसे Noise Lab में आज़माएं

  1. ऐडवांस मोड पर जाएं.
  2. पैरामीटर साइड पैनल में, अपना कन्वर्ज़न डेटा ढूंढें.
  3. डिफ़ॉल्ट पैरामीटर देखें. डिफ़ॉल्ट रूप से, हर दिन एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या 1,000 होती है. डिफ़ॉल्ट सेटअप (डिफ़ॉल्ट डाइमेंशन, हर डाइमेंशन के लिए संभावित अलग-अलग वैल्यू की डिफ़ॉल्ट संख्या, मुख्य रणनीति A) का इस्तेमाल करने पर, हर बकेट में औसतन 40 वैल्यू होती हैं. ध्यान दें कि इनपुट किए गए, एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या PER BUCKET में वैल्यू 40 है.
  4. डिफ़ॉल्ट पैरामीटर के साथ सिम्युलेशन चलाने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
  5. पैरामीटर साइड पैनल में, डाइमेंशन ढूंढें. Geography का नाम बदलकर City करें और संभावित अलग-अलग वैल्यू की संख्या को 50 पर सेट करें.
  6. देखें कि इससे, हर बकेट के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या में क्या बदलाव होता है. अब यह काफ़ी कम हो गया है. ऐसा इसलिए है, क्योंकि अगर इस डाइमेंशन में संभावित वैल्यू की संख्या बढ़ाई जाती है और बाकी चीज़ों में कोई बदलाव नहीं किया जाता है, तो बकेट की कुल संख्या बढ़ जाती है. हालांकि, इससे यह नहीं बदलता कि हर बकेट में कितने कन्वर्ज़न इवेंट शामिल होंगे.
  7. 'सिम्युलेट करें' पर क्लिक करें.
  8. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें: नॉइज़ रेशियो अब पिछले सिम्युलेशन के मुकाबले ज़्यादा हैं.

कोर डिज़ाइन सिद्धांत के मुताबिक, छोटी खास जानकारी वाली वैल्यू में बड़ी खास जानकारी वाली वैल्यू की तुलना में ज़्यादा नॉइज़ होने की संभावना होती है. इसलिए, कॉन्फ़िगरेशन के लिए चुने गए विकल्प से यह तय होता है कि एट्रिब्यूट किए गए कितने कन्वर्ज़न इवेंट, हर बकेट में शामिल होंगे. इसे एग्रीगेशन कुंजी भी कहा जाता है. साथ ही, इस संख्या से फ़ाइनल आउटपुट की खास जानकारी वाली रिपोर्ट में नॉइज़ पर असर पड़ता है.

डिज़ाइन से जुड़ा एक फ़ैसला, जो एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर असर डालता है. यह फ़ैसला, डाइमेंशन की बारीकी से जुड़ी जानकारी के बारे में होता है. एग्रीगेशन कुंजियों और उनके डाइमेंशन के ये उदाहरण देखें:

  • पहला तरीका: एक मुख्य स्ट्रक्चर, जिसमें मोटे तौर पर डाइमेंशन शामिल हों: देश x विज्ञापन कैंपेन (या सबसे बड़ा कैंपेन एग्रीगेशन बकेट) x प्रॉडक्ट टाइप (10 संभावित प्रॉडक्ट टाइप में से)
  • दूसरा तरीका: एक मुख्य स्ट्रक्चर, जिसमें ज़्यादा जानकारी वाले डाइमेंशन शामिल हों: शहर x क्रिएटिव आईडी x प्रॉडक्ट (100 संभावित प्रॉडक्ट में से)

शहर, देश की तुलना में ज़्यादा बारीकी से जानकारी देता है. क्रिएटिव आईडी, कैंपेन की तुलना में ज़्यादा बारीकी से जानकारी देता है. वहीं, प्रॉडक्ट, प्रॉडक्ट टाइप की तुलना में ज़्यादा बारीकी से जानकारी देता है. इसलिए, दूसरे तरीके में, खास जानकारी वाली रिपोर्ट के आउटपुट में, पहले तरीके की तुलना में हर बकेट (= हर कुंजी) के लिए इवेंट (कन्वर्ज़न) की संख्या कम होगी. आउटपुट में जोड़ा गया नॉइज़, बकेट में मौजूद इवेंट की संख्या से अलग होता है. इसलिए, खास जानकारी वाली रिपोर्ट में मेज़रमेंट डेटा, दूसरे तरीके से ज़्यादा नॉइज़ी होगा. विज्ञापन देने वाले हर व्यक्ति या कंपनी के लिए, कुंजी के डिज़ाइन में अलग-अलग ग्रैन्युलैरिटी ट्रेडऑफ़ के साथ एक्सपेरिमेंट करें, ताकि नतीजों में ज़्यादा से ज़्यादा फ़ायदे मिल सकें.

फ़ैसला: मुख्य स्ट्रक्चर

इसे Noise Lab में आज़माएं

सिंपल मोड में, डिफ़ॉल्ट कुंजी स्ट्रक्चर का इस्तेमाल किया जाता है. ऐडवांस मोड में, अलग-अलग कुंजी स्ट्रक्चर आज़माए जा सकते हैं. इसमें कुछ उदाहरण डाइमेंशन शामिल किए गए हैं. हालांकि, इनमें बदलाव भी किया जा सकता है.

  1. ऐडवांस मोड पर जाएं.
  2. पैरामीटर साइड पैनल में, मुख्य रणनीति ढूंढें. ध्यान दें कि टूल में डिफ़ॉल्ट रणनीति का नाम A है. यह एक ग्रेन्यूलर कुंजी संरचना का इस्तेमाल करती है, जिसमें सभी डाइमेंशन शामिल होते हैं: जगह x कैंपेन आईडी x प्रॉडक्ट कैटगरी.
  3. 'सिम्युलेट करें' पर क्लिक करें.
  4. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें.
  5. मुख्य रणनीति को B में बदलें. इससे आपको अपने कुंजी स्ट्रक्चर को कॉन्फ़िगर करने के लिए अतिरिक्त कंट्रोल दिखते हैं.
  6. अपने डिजिटल बटन के स्ट्रक्चर को कॉन्फ़िगर करें. उदाहरण के लिए, इस तरह:
    1. मुख्य स्ट्रक्चर की संख्या: 2
    2. मुख्य स्ट्रक्चर 1 = जगह x प्रॉडक्ट कैटगरी.
    3. मुख्य स्ट्रक्चर 2 = कैंपेन आईडी x प्रॉडक्ट कैटगरी.
  7. 'सिम्युलेट करें' पर क्लिक करें.
  8. ध्यान दें कि अब आपको मेज़रमेंट के हर लक्ष्य के टाइप के लिए दो खास जानकारी वाली रिपोर्ट मिलेंगी. जैसे, खरीदारी की संख्या के लिए दो और खरीदारी की वैल्यू के लिए दो. ऐसा इसलिए है, क्योंकि आपने दो अलग-अलग मुख्य स्ट्रक्चर का इस्तेमाल किया है. उनके नॉइज़ रेशियो पर ध्यान दें.
  9. इसे अपने कस्टम डाइमेंशन के साथ भी आज़माया जा सकता है. इसके लिए, उस डेटा को देखें जिसे आपको ट्रैक करना है: डाइमेंशन. उदाहरण के तौर पर दिए गए डाइमेंशन हटाकर, अपने डाइमेंशन बनाएं. इसके लिए, आखिरी डाइमेंशन के नीचे मौजूद, जोड़ें/हटाएं/रीसेट करें बटन का इस्तेमाल करें.

डिज़ाइन से जुड़ा एक और फ़ैसला है, मुख्य स्ट्रक्चर का इस्तेमाल करना. इससे एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर असर पड़ेगा. एग्रीगेशन कुंजियों के ये उदाहरण देखें:

  • सभी डाइमेंशन के साथ एक मुख्य स्ट्रक्चर; इसे मुख्य रणनीति A कहते हैं.
  • दो मुख्य स्ट्रक्चर, जिनमें से हर एक में डाइमेंशन का सबसेट है. इसे मुख्य रणनीति B कहते हैं.
मुख्य रणनीति A और B के लिए बकेट.
मुख्य रणनीति A और B के लिए बकेट.

रणनीति A आसान है. हालांकि, कुछ इनसाइट ऐक्सेस करने के लिए, आपको खास जानकारी वाली रिपोर्ट में शामिल नॉइज़ी खास जानकारी की वैल्यू को रोल अप (जोड़ना) करना पड़ सकता है. इन वैल्यू को जोड़ने पर, नॉइज़ भी जुड़ जाती है. रणनीति B में, खास जानकारी वाली रिपोर्ट में दिखाई गई खास जानकारी की वैल्यू से आपको पहले ही ज़रूरी जानकारी मिल सकती है. इसका मतलब है कि रणनीति B से, रणनीति A की तुलना में सिग्नल-टू-नॉइज़ रेशियो बेहतर मिलेगा. हालांकि, रणनीति A के साथ नॉइज़ पहले से ही स्वीकार्य हो सकती है. इसलिए, आसानी से काम करने के लिए अब भी रणनीति A को चुना जा सकता है. इन दोनों रणनीतियों के बारे में बताने वाले उदाहरण में ज़्यादा जानें.

कुंजी मैनेजमेंट एक जटिल विषय है. सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, कई तकनीकों का इस्तेमाल किया जा सकता है. इसके बारे में ऐडवांस कुंजी मैनेजमेंट में बताया गया है.

फ़ैसला: बैचिंग की फ़्रीक्वेंसी

इसे Noise Lab में आज़माएं

  1. सिंपल मोड पर जाएं या ऐडवांस मोड पर जाएं. बैचिंग फ़्रीक्वेंसी के मामले में, दोनों मोड एक ही तरह से काम करते हैं
  2. पैरामीटर वाले साइड पैनल में, एग्रीगेशन की रणनीति > बैचिंग की फ़्रीक्वेंसी ढूंढें. इससे एग्रीगेट की जा सकने वाली रिपोर्ट की बैचिंग फ़्रीक्वेंसी का पता चलता है. इन रिपोर्ट को एग्रीगेशन सेवा की मदद से एक ही जॉब में प्रोसेस किया जाता है.
  3. डिफ़ॉल्ट बैचिंग फ़्रीक्वेंसी देखें: डिफ़ॉल्ट रूप से, हर दिन की बैचिंग फ़्रीक्वेंसी का सिम्युलेशन किया जाता है.
  4. 'सिम्युलेट करें' पर क्लिक करें.
  5. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें.
  6. बैचिंग की फ़्रीक्वेंसी को हर हफ़्ते पर सेट करें.
  7. सिमुलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें: नॉइज़ रेशियो अब पिछले सिमुलेशन की तुलना में कम (बेहतर) हैं.

एक और डिज़ाइन फ़ैसला है, जिसका असर एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर पड़ेगा. यह फ़ैसला, बैचिंग की उस फ़्रीक्वेंसी से जुड़ा है जिसका इस्तेमाल आपको करना है. बैचिंग फ़्रीक्वेंसी से पता चलता है कि एग्रीगेट की जा सकने वाली रिपोर्ट को कितनी बार प्रोसेस किया जाता है.

अगर किसी रिपोर्ट को ज़्यादा बार (जैसे, हर घंटे) एग्रीगेट करने के लिए शेड्यूल किया जाता है, तो उसमें कम कन्वर्ज़न इवेंट शामिल होंगे. वहीं, अगर उसी रिपोर्ट को कम बार (जैसे, हर हफ़्ते) एग्रीगेट करने के लिए शेड्यूल किया जाता है, तो उसमें ज़्यादा कन्वर्ज़न इवेंट शामिल होंगे. इस वजह से, हर घंटे की रिपोर्ट में ज़्यादा नॉइज़ शामिल होगा.``` में कम कन्वर्ज़न इवेंट शामिल होंगे. ऐसा इसलिए होगा, क्योंकि एग्रीगेशन शेड्यूल कम बार होता है (जैसे, हर हफ़्ते). इस वजह से, हर घंटे की रिपोर्ट में, हफ़्ते की रिपोर्ट के मुकाबले सिग्नल-टू-नॉइज़ रेशियो कम होगा. अलग-अलग फ़्रीक्वेंसी पर रिपोर्टिंग की ज़रूरी शर्तों को आज़माएं. साथ ही, हर फ़्रीक्वेंसी के लिए सिग्नल-टू-नॉइज़ रेशियो का आकलन करें.

ज़्यादा जानकारी के लिए, बैचिंग और लंबे समय तक के डेटा को इकट्ठा करना लेख पढ़ें.

फ़ैसला: कैंपेन वैरिएबल, जिनसे एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न पर असर पड़ता है

इसे Noise Lab में आज़माएं

हालांकि, इसका अनुमान लगाना मुश्किल हो सकता है. साथ ही, सीज़न के हिसाब से होने वाले बदलावों के अलावा, इसमें काफ़ी अंतर भी हो सकता है. इसलिए, हर दिन सिंगल-टच एट्रिब्यूशन वाले कन्वर्ज़न की संख्या का अनुमान लगाने की कोशिश करें. इसके लिए, 10 की सबसे नज़दीकी पावर का इस्तेमाल करें: 10, 100, 1,000 या 10,000.

  1. ऐडवांस मोड पर जाएं.
  2. पैरामीटर साइड पैनल में, अपना कन्वर्ज़न डेटा ढूंढें.
  3. डिफ़ॉल्ट पैरामीटर देखें. डिफ़ॉल्ट रूप से, हर दिन एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या 1,000 होती है. डिफ़ॉल्ट सेटअप (डिफ़ॉल्ट डाइमेंशन, हर डाइमेंशन के लिए संभावित अलग-अलग वैल्यू की डिफ़ॉल्ट संख्या, मुख्य रणनीति A) का इस्तेमाल करने पर, हर बकेट में औसतन 40 वैल्यू होती हैं. ध्यान दें कि इनपुट किए गए, एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या PER BUCKET में वैल्यू 40 है.
  4. डिफ़ॉल्ट पैरामीटर के साथ सिम्युलेशन चलाने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
  5. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें.
  6. अब एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या को 100 पर सेट करें. ध्यान दें कि इससे, हर बकेट के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की औसत संख्या कम हो जाती है.
  7. 'सिम्युलेट करें' पर क्लिक करें.
  8. ध्यान दें कि नॉइज़ रेशियो अब ज़्यादा हैं: ऐसा इसलिए है, क्योंकि जब आपके पास हर बकेट के लिए कम कन्वर्ज़न होते हैं, तो निजता बनाए रखने के लिए ज़्यादा नॉइज़ लागू किया जाता है.

विज्ञापन देने वाले व्यक्ति या कंपनी के लिए, कन्वर्ज़न की कुल संख्या और एट्रिब्यूट किए गए कन्वर्ज़न की कुल संख्या में अंतर होता है. इनमें से दूसरी सेटिंग से, खास जानकारी वाली रिपोर्ट में मौजूद नॉइज़ पर असर पड़ता है. एट्रिब्यूट किए गए कन्वर्ज़न, कुल कन्वर्ज़न का सबसेट होते हैं. ये कैंपेन वैरिएबल के हिसाब से बदलते रहते हैं. जैसे, विज्ञापन का बजट और विज्ञापन की टारगेटिंग. उदाहरण के लिए, अगर बाकी सभी चीज़ें एक जैसी हैं, तो आपको 10 हज़ार डॉलर के विज्ञापन कैंपेन की तुलना में 1 करोड़ डॉलर के विज्ञापन कैंपेन के लिए, एट्रिब्यूट किए गए कन्वर्ज़न की संख्या ज़्यादा मिलेगी.

विचारणीय बातें:

  • एक ही टचपॉइंट और एक ही डिवाइस वाले एट्रिब्यूशन मॉडल के हिसाब से एट्रिब्यूट किए गए कन्वर्ज़न का आकलन करें. ऐसा इसलिए, क्योंकि ये Attribution Reporting API से इकट्ठा की गई खास जानकारी वाली रिपोर्ट के दायरे में आते हैं.
  • एट्रिब्यूट किए गए कन्वर्ज़न के लिए, सबसे कम और सबसे ज़्यादा कन्वर्ज़न की संख्या को ध्यान में रखें. उदाहरण के लिए, अगर बाकी सभी चीज़ें एक जैसी हैं, तो विज्ञापन देने वाले व्यक्ति या कंपनी के लिए, कैंपेन के कम से कम और ज़्यादा से ज़्यादा संभावित बजट पर विचार करें. इसके बाद, दोनों नतीजों के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न का अनुमान लगाएं और उन्हें अपने सिम्युलेशन में इनपुट के तौर पर इस्तेमाल करें.
  • अगर आपको Android Privacy Sandbox का इस्तेमाल करना है, तो कैलकुलेशन में क्रॉस-प्लैटफ़ॉर्म एट्रिब्यूट किए गए कन्वर्ज़न को शामिल करें.

फ़ैसला: स्केलिंग का इस्तेमाल करना

इसे Noise Lab में आज़माएं

  1. ऐडवांस मोड पर जाएं.
  2. पैरामीटर वाले साइड पैनल में, एग्रीगेशन की रणनीति > स्केलिंग ढूंढें. डिफ़ॉल्ट रूप से, इसे 'हां' पर सेट किया जाता है.
  3. नॉइज़ रेशियो पर स्केलिंग के सकारात्मक असर को समझने के लिए, पहले स्केलिंग को 'नहीं' पर सेट करें.
  4. 'सिम्युलेट करें' पर क्लिक करें.
  5. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें.
  6. स्केलिंग को 'हां' पर सेट करें. ध्यान दें कि Noise Lab, आपके इस्तेमाल के उदाहरण के लिए मेज़रमेंट के लक्ष्यों की रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के हिसाब से, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर अपने-आप कैलकुलेट करता है. किसी असली सिस्टम या ऑरिजिन ट्रायल सेटअप में, आपको स्केलिंग फ़ैक्टर के लिए अपनी कैलकुलेशन लागू करनी होगी.
  7. 'सिम्युलेट करें' पर क्लिक करें.
  8. ध्यान दें कि इस दूसरे सिम्युलेशन में, नॉइज़ रेशियो अब कम (बेहतर) हो गए हैं. ऐसा इसलिए है, क्योंकि आपने स्केलिंग का इस्तेमाल किया है.

मुख्य डिज़ाइन सिद्धांत के मुताबिक, जोड़ा गया नॉइज़, कॉन्ट्रिब्यूशन बजट का फ़ंक्शन होता है.

इसलिए, सिग्नल-टू-नॉइज़ रेशियो को बढ़ाने के लिए, कन्वर्ज़न इवेंट के दौरान इकट्ठा की गई वैल्यू को बदला जा सकता है. इसके लिए, उन्हें कॉन्ट्रिब्यूशन बजट के हिसाब से स्केल किया जा सकता है. साथ ही, एग्रीगेशन के बाद उन्हें डी-स्केल किया जा सकता है. सिग्नल-टू-नॉइज़ रेशियो बढ़ाने के लिए, स्केलिंग का इस्तेमाल करें.

फ़ैसला: मेज़रमेंट के लक्ष्यों की संख्या और निजता बजट का बंटवारा

यह स्केलिंग से जुड़ा है. स्केलिंग का इस्तेमाल करना लेख ज़रूर पढ़ें.

इसे Noise Lab में आज़माएं

मेज़रमेंट लक्ष्य, कन्वर्ज़न इवेंट में इकट्ठा किया गया एक अलग डेटा पॉइंट होता है.

  1. ऐडवांस मोड पर जाएं.
  2. साइड पैनल में मौजूद पैरामीटर में, वह डेटा ढूंढें जिसे आपको ट्रैक करना है: मेज़रमेंट के लक्ष्य. डिफ़ॉल्ट रूप से, आपके पास मेज़रमेंट के दो लक्ष्य होते हैं: खरीदारी की वैल्यू और खरीदारी की संख्या.
  3. डिफ़ॉल्ट लक्ष्यों के साथ सिम्युलेशन चलाने के लिए, सिम्युलेट करें पर क्लिक करें.
  4. 'हटाएं' पर क्लिक करें. इससे, मेज़रमेंट का आखिरी लक्ष्य (उस मामले में खरीदारी की संख्या) हट जाएगा.
  5. 'सिम्युलेट करें' पर क्लिक करें.
  6. ध्यान दें कि इस दूसरे सिम्युलेशन के लिए, परचेज़ वैल्यू के नॉइज़ रेशियो अब कम (बेहतर) हो गए हैं. ऐसा इसलिए है, क्योंकि आपके पास मेज़रमेंट के कम लक्ष्य हैं. इसलिए, अब आपके एक मेज़रमेंट लक्ष्य को पूरा कॉन्ट्रिब्यूशन बजट मिलता है.
  7. रीसेट करें पर क्लिक करें. अब आपके पास मेज़रमेंट के दो लक्ष्य हैं: खरीदारी की वैल्यू और खरीदारी की संख्या. ध्यान दें कि Noise Lab, आपके इस्तेमाल के उदाहरण के लिए मेज़रमेंट के लक्ष्यों की रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के हिसाब से, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर अपने-आप कैलकुलेट करता है. डिफ़ॉल्ट रूप से, नॉइज़ लैब बजट को मेज़रमेंट के लक्ष्यों के हिसाब से बराबर हिस्सों में बांटता है.
  8. 'सिम्युलेट करें' पर क्लिक करें.
  9. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें. सिमुलेशन में दिखाए गए स्केलिंग फ़ैक्टर पर ध्यान दें.
  10. अब, सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, निजता बजट के बंटवारे में बदलाव करते हैं.
  11. हर मेज़रमेंट लक्ष्य के लिए असाइन किए गए बजट के प्रतिशत में बदलाव करें. डिफ़ॉल्ट पैरामीटर के हिसाब से, मेज़रमेंट लक्ष्य 1 यानी खरीदारी की वैल्यू की रेंज, मेज़रमेंट लक्ष्य 2 यानी खरीदारी की संख्या की रेंज से ज़्यादा है.मेज़रमेंट लक्ष्य 1 की रेंज 0 से 1, 000 के बीच है, जबकि मेज़रमेंट लक्ष्य 2 की रेंज 1 से 1 के बीच है. इसका मतलब है कि मेज़रमेंट लक्ष्य 2 हमेशा 1 के बराबर होता है. इस वजह से, इसे "स्केल करने के लिए ज़्यादा जगह" की ज़रूरत होती है: मेज़रमेंट के लक्ष्य 1 को मेज़रमेंट के लक्ष्य 2 की तुलना में ज़्यादा कॉन्ट्रिब्यूशन बजट असाइन करना सबसे सही होगा, ताकि इसे ज़्यादा असरदार तरीके से बढ़ाया जा सके (स्केलिंग देखें). इसलिए,
  12. बजट का 70% हिस्सा, मेज़रमेंट के पहले लक्ष्य को असाइन करें. मेज़रमेंट लक्ष्य 2 को 30% असाइन करें.
  13. 'सिम्युलेट करें' पर क्लिक करें.
  14. सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें. खरीदारी की वैल्यू के लिए, नॉइज़ रेशियो अब पिछले सिम्युलेशन की तुलना में काफ़ी कम (बेहतर) हैं. खरीदारी की संख्या में कोई खास बदलाव नहीं हुआ है.
  15. अलग-अलग मेट्रिक के हिसाब से बजट के बंटवारे में बदलाव करते रहें. देखें कि इससे आवाज़ पर क्या असर पड़ता है.

ध्यान दें कि जोड़ें/हटाएं/रीसेट करें बटन की मदद से, मेज़रमेंट के लिए अपने कस्टम लक्ष्य सेट किए जा सकते हैं.


अगर कन्वर्ज़न इवेंट पर एक डेटा पॉइंट (मेज़रमेंट लक्ष्य) को मेज़र किया जाता है, जैसे कि कन्वर्ज़न की संख्या, तो उस डेटा पॉइंट को पूरा कॉन्ट्रिब्यूशन बजट (65536) मिल सकता है. अगर आपने किसी कन्वर्ज़न इवेंट पर एक से ज़्यादा मेज़रमेंट लक्ष्य सेट किए हैं, जैसे कि कन्वर्ज़न की संख्या और खरीदारी की वैल्यू, तो उन डेटा पॉइंट को कॉन्ट्रिब्यूशन बजट शेयर करना होगा. इसका मतलब है कि आपके पास वैल्यू को बढ़ाने के लिए कम विकल्प हैं.

इसलिए, मेज़रमेंट के जितने ज़्यादा लक्ष्य होंगे, सिग्नल-टू-नॉइज़ रेशियो उतना ही कम होगा (नॉइज़ ज़्यादा होगा).

मेज़रमेंट के लक्ष्यों के बारे में एक और फ़ैसला लेना होता है. यह फ़ैसला बजट के बंटवारे से जुड़ा होता है. अगर योगदान के बजट को दो डेटा पॉइंट के बीच बराबर बांटा जाता है, तो हर डेटा पॉइंट को 65536/2 = 32768 का बजट मिलता है. यह हर डेटा पॉइंट के लिए, ज़्यादा से ज़्यादा संभावित वैल्यू के हिसाब से सबसे सही हो सकता है या नहीं भी हो सकता. उदाहरण के लिए, अगर आपको खरीदारी की संख्या मेज़र करनी है, जिसकी ज़्यादा से ज़्यादा वैल्यू 1 है. साथ ही, खरीदारी की वैल्यू मेज़र करनी है, जिसकी कम से कम वैल्यू 1 और ज़्यादा से ज़्यादा वैल्यू 120 है, तो खरीदारी की वैल्यू को "ज़्यादा स्पेस" मिलने से फ़ायदा होगा. इसका मतलब है कि इसे कॉन्ट्रिब्यूशन बजट का ज़्यादा हिस्सा मिलेगा. आपको यह पता चलेगा कि नॉइज़ के असर को देखते हुए, कुछ मेज़रमेंट लक्ष्यों को दूसरों की तुलना में प्राथमिकता दी जानी चाहिए या नहीं.

फ़ैसला: आउटलायर मैनेजमेंट

इसे Noise Lab में आज़माएं

मेज़रमेंट लक्ष्य, कन्वर्ज़न इवेंट में इकट्ठा किया गया एक अलग डेटा पॉइंट होता है.

  1. ऐडवांस मोड पर जाएं.
  2. पैरामीटर वाले साइड पैनल में, एग्रीगेशन की रणनीति > स्केलिंग ढूंढें.
  3. पक्का करें कि 'स्केलिंग' सेटिंग 'हां' पर सेट हो. ध्यान दें कि Noise Lab, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर का हिसाब अपने-आप लगाता है. यह हिसाब, मेज़रमेंट के लक्ष्यों के लिए दी गई रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के आधार पर लगाया जाता है.
  4. मान लें कि अब तक की सबसे बड़ी खरीदारी 2,000 डॉलर की थी, लेकिन ज़्यादातर खरीदारी 10 से 120 डॉलर के बीच होती है. सबसे पहले, यह देखते हैं कि अगर हम लिटरल स्केलिंग का तरीका इस्तेमाल करते हैं, तो क्या होता है. हमारा सुझाव है कि आप इस तरीके का इस्तेमाल न करें: purchaseValue के लिए ज़्यादा से ज़्यादा वैल्यू के तौर पर 2,000 डॉलर डालें.
  5. 'सिम्युलेट करें' पर क्लिक करें.
  6. ध्यान दें कि नॉइज़ रेशियो ज़्यादा हैं. ऐसा इसलिए है, क्योंकि हमारा स्केलिंग फ़ैक्टर 2,000 डॉलर के आधार पर कैलकुलेट किया जाता है. हालांकि, असल में खरीदारी की ज़्यादातर वैल्यू इससे काफ़ी कम होती हैं.
  7. अब, आइए स्केलिंग के ज़्यादा व्यावहारिक तरीके का इस्तेमाल करें. ज़्यादा से ज़्यादा खरीदारी वैल्यू को 12,000 रुपये पर सेट करो.
  8. 'सिम्युलेट करें' पर क्लिक करें.
  9. ध्यान दें कि इस दूसरे सिम्युलेशन में, नॉइज़ रेशियो कम (बेहतर) हैं.

स्केलिंग लागू करने के लिए, आम तौर पर किसी कन्वर्ज़न इवेंट की ज़्यादा से ज़्यादा संभावित वैल्यू के आधार पर, स्केलिंग फ़ैक्टर का हिसाब लगाया जाता है (इस उदाहरण में ज़्यादा जानें).

हालांकि, उस स्केलिंग फ़ैक्टर का हिसाब लगाने के लिए, लिटरल मैक्सिमम वैल्यू का इस्तेमाल न करें, क्योंकि इससे सिग्नल-टू-नॉइज़ रेशियो खराब हो जाएगा. इसके बजाय, आउटलायर हटाएं और व्यावहारिक तौर पर ज़्यादा से ज़्यादा वैल्यू का इस्तेमाल करें.

आउटलायर मैनेजमेंट एक जटिल विषय है. सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, कई तकनीकों का इस्तेमाल किया जा सकता है. इनमें से एक के बारे में ऐडवांस आउटलायर मैनेजमेंट में बताया गया है.

अगले चरण

अब आपने अपने इस्तेमाल के उदाहरण के लिए, नॉइज़ मैनेजमेंट की अलग-अलग रणनीतियों का आकलन कर लिया है. इसलिए, अब आपके पास ओरिजिन ट्रायल का इस्तेमाल करके, मेज़रमेंट का असली डेटा इकट्ठा करने का विकल्प है. इससे आपको खास जानकारी वाली रिपोर्ट के साथ एक्सपेरिमेंट करने में मदद मिलेगी. एपीआई आज़माने के लिए, गाइड और सुझाव देखें.

अन्य जानकारी

Noise Lab के बारे में खास जानकारी

नॉइज़ लैब की मदद से, नॉइज़ मैनेजमेंट की रणनीतियों का तुरंत आकलन किया जा सकता है और उनकी तुलना की जा सकती है. इसका इस्तेमाल इन कामों के लिए करें:

  • उन मुख्य पैरामीटर के बारे में जानें जिनसे नॉइज़ पर असर पड़ सकता है. साथ ही, यह भी जानें कि इन पैरामीटर का नॉइज़ पर क्या असर पड़ता है.
  • अलग-अलग डिज़ाइन के फ़ैसलों के आधार पर, आउटपुट मेज़रमेंट डेटा पर नॉइज़ के असर का अनुमान लगाएं. जब तक आपको सिग्नल-शोर अनुपात का ऐसा लेवल न मिल जाए जो आपके इस्तेमाल के उदाहरण के लिए सही हो, तब तक डिज़ाइन पैरामीटर में बदलाव करें.
  • खास जानकारी वाली रिपोर्ट के बारे में अपनी राय दें: आपके लिए इप्सिलॉन और नॉइज़ पैरामीटर की कौनसी वैल्यू काम करती हैं और कौनसी नहीं? नत परिवर्तन बिंदु कहाँ हैं?

इसे तैयारी का एक चरण माना जाता है. नॉइज़ लैब, मेज़रमेंट डेटा जनरेट करता है. इससे, आपके इनपुट के आधार पर खास जानकारी वाली रिपोर्ट के आउटपुट को सिम्युलेट किया जा सकता है. यह किसी भी डेटा को सेव या शेयर नहीं करता है.

नॉइज़ लैब में दो अलग-अलग मोड होते हैं:

  1. आसान मोड: इसमें आपको आवाज़ को कंट्रोल करने के लिए उपलब्ध बुनियादी सेटिंग के बारे में जानकारी मिलती है.
  2. ऐडवांस मोड: नॉइज़ मैनेज करने की अलग-अलग रणनीतियों को टेस्ट करें. साथ ही, यह आकलन करें कि आपके इस्तेमाल के उदाहरणों के लिए, सिग्नल-टू-नॉइज़ रेशियो सबसे अच्छा किस रणनीति से मिलता है.

दोनों मोड के बीच टॉगल करने के लिए, सबसे ऊपर मौजूद मेन्यू में दिए गए बटन पर क्लिक करें (#1. इस स्क्रीनशॉट में).

सिंपल मोड
  • सिंपल मोड में, आपके पास पैरामीटर को कंट्रोल करने का विकल्प होता है. ये पैरामीटर, बाईं ओर या नीचे दिए गए स्क्रीनशॉट में#2 पर मौजूद होते हैं. जैसे, इप्सिलॉन. साथ ही, यह देखा जा सकता है कि ये पैरामीटर, नॉइज़ पर किस तरह असर डालते हैं.
  • हर पैरामीटर में एक टूलटिप (`?` बटन) होती है. हर पैरामीटर के बारे में जानकारी देखने के लिए, इन पर क्लिक करें (नीचे दिए गए स्क्रीनशॉट में#3)
  • शुरू करने के लिए, "सिम्युलेट करें" बटन पर क्लिक करें और देखें कि आउटपुट कैसा दिखता है (नीचे दिए गए स्क्रीनशॉट में#4)
  • आउटपुट सेक्शन में, आपको कई तरह की जानकारी दिख सकती है. कुछ एलिमेंट के बगल में `?` का निशान होता है. अलग-अलग तरह की जानकारी के बारे में जानने के लिए, हर `?` पर क्लिक करें.
  • अगर आपको टेबल का बड़ा किया गया वर्शन देखना है, तो आउटपुट सेक्शन में जाकर, जानकारी टॉगल करें (नीचे दिए गए स्क्रीनशॉट में#5) पर क्लिक करें
  • आउटपुट सेक्शन में मौजूद हर डेटा टेबल के बाद, टेबल को ऑफ़लाइन इस्तेमाल करने के लिए डाउनलोड करने का विकल्प होता है. इसके अलावा, सबसे नीचे दाएं कोने में, सभी डेटा टेबल डाउनलोड करने का विकल्प भी होता है (नीचे दिए गए स्क्रीनशॉट में#6)
  • पैरामीटर सेक्शन में मौजूद पैरामीटर के लिए, अलग-अलग सेटिंग आज़माएं और यह देखने के लिए कि उनका आउटपुट पर क्या असर पड़ता है, सिम्युलेट करें पर क्लिक करें:
    सिंपल मोड के लिए नॉइज़ लैब का इंटरफ़ेस.
    सिंपल मोड के लिए नॉइज़ लैब इंटरफ़ेस.
बेहतर मोड
  • ऐडवांस मोड में, पैरामीटर पर आपका ज़्यादा कंट्रोल होता है. कस्टम मेज़रमेंट लक्ष्य और डाइमेंशन जोड़े जा सकते हैं (नीचे दिए गए स्क्रीनशॉट में#1 और #2)
  • पैरामीटर सेक्शन में नीचे की ओर स्क्रोल करें और मुख्य रणनीति का विकल्प देखें. इसका इस्तेमाल अलग-अलग कुंजी स्ट्रक्चर को आज़माने के लिए किया जा सकता है (नीचे दिए गए स्क्रीनशॉट में#3)
    • अलग-अलग मुख्य स्ट्रक्चर आज़माने के लिए, मुख्य रणनीति को "B" पर स्विच करें
    • आपको जितने अलग-अलग मुख्य स्ट्रक्चर इस्तेमाल करने हैं उनकी संख्या डालें (डिफ़ॉल्ट रूप से "2" पर सेट है)
    • 'कुंजी के स्ट्रक्चर जनरेट करें' पर क्लिक करें
    • आपको मुख्य स्ट्रक्चर तय करने के विकल्प दिखेंगे. इसके लिए, आपको हर मुख्य स्ट्रक्चर के लिए, उन कुंजियों के बगल में मौजूद चेकबॉक्स पर क्लिक करना होगा जिन्हें आपको शामिल करना है
    • आउटपुट देखने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
      ऐडवांस मोड में, मेज़रमेंट के लक्ष्यों और ट्रैक किए जाने वाले डाइमेंशन के लिए कंट्रोल उपलब्ध होते हैं. ये साइडबार में हाइलाइट किए जाते हैं.
      ऐडवांस मोड के लिए, नॉइज़ लैब का इंटरफ़ेस.
      एडवांस मोड में, साइडबार के पैरामीटर सेक्शन में मुख्य रणनीति का विकल्प भी होता है.
      ऐडवांस मोड के लिए, नॉइज़ लैब का इंटरफ़ेस.

गै़र-ज़रूरी आवाज़ों से जुड़ी मेट्रिक

मुख्य सिद्धांत

किसी उपयोगकर्ता की निजता को सुरक्षित रखने के लिए, डेटा में नॉइज़ जोड़ा जाता है.

नॉइज़ वैल्यू ज़्यादा होने का मतलब है कि बकेट/कुंजी कम हैं और उनमें सीमित संख्या में संवेदनशील इवेंट का योगदान है. यह काम Noise Lab अपने-आप करता है, ताकि लोग "भीड़ में छिप सकें" या दूसरे शब्दों में कहें, तो यह सीमित लोगों की निजता को ज़्यादा नॉइज़ जोड़कर सुरक्षित रखता है.

नॉइज़ की कम वैल्यू से पता चलता है कि डेटा सेटअप को इस तरह से डिज़ाइन किया गया है कि लोग पहले से ही "भीड़ में छिप सकते हैं." इसका मतलब है कि बकेट में, निजता के थ्रेशोल्ड को पूरा करने के लिए ज़रूरी इवेंट शामिल हैं. इससे यह पुष्टि की जा सकती है कि किसी उपयोगकर्ता की निजता सुरक्षित है.

यह स्टेटमेंट, औसत प्रतिशत गड़बड़ी (एपीई) और RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव गड़बड़ी) दोनों के लिए सही है.

APE (औसत प्रतिशत गड़बड़ी)

एपीई, सिग्नल के मुकाबले नॉइज़ का अनुपात होता है. सिग्नल का मतलब, खास जानकारी वाली सही वैल्यू से है.

एपीई की वैल्यू कम होने का मतलब है कि सिग्नल-टू-नॉइज़ रेशियो बेहतर है.

फ़ॉर्मूला

किसी खास जानकारी वाली रिपोर्ट के लिए, APE की गणना इस तरह की जाती है:

एपीई का समीकरण. कुल वैल्यू देना ज़रूरी है, क्योंकि नॉइज़ नेगेटिव हो सकता है.
एपीई का समीकरण. निरपेक्ष वैल्यू ज़रूरी हैं, क्योंकि नॉइज़ नेगेटिव हो सकता है.

True, खास जानकारी की सही वैल्यू है. APE, हर सही खास जानकारी वाली वैल्यू के हिसाब से नॉइज़ का औसत होता है. यह खास जानकारी वाली रिपोर्ट की सभी एंट्री के हिसाब से औसत होता है. Noise Lab में, इसे 100 से गुणा करके प्रतिशत में बदला जाता है.

फ़ायदे और नुकसान

छोटे साइज़ वाले बकेट का, APE की फ़ाइनल वैल्यू पर काफ़ी असर पड़ता है. इससे नॉइज़ का आकलन करते समय, गुमराह करने वाली जानकारी मिल सकती है. इसलिए, हमने एक और मेट्रिक, RMSRE_T जोड़ी है. इसे APE की इस सीमा को कम करने के लिए डिज़ाइन किया गया है. ज़्यादा जानकारी के लिए, उदाहरण देखें.

कोड

एपीई की गिनती के लिए, सोर्स कोड की समीक्षा करें.

RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव एरर)

RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव एरर) भी नॉइज़ को मेज़र करने का एक तरीका है.

RMSRE_T को समझने का तरीका

RMSRE_T की वैल्यू कम होने का मतलब है कि सिग्नल-टू-नॉइज़ रेशियो बेहतर है.
उदाहरण के लिए, अगर आपके इस्तेमाल के उदाहरण के लिए स्वीकार्य नॉइज़ रेशियो 20% है और RMSRE_T 0.2 है, तो आपको भरोसा हो सकता है कि नॉइज़ लेवल आपकी स्वीकार्य सीमा में आते हैं.

फ़ॉर्मूला

किसी खास जानकारी वाली रिपोर्ट के लिए, RMSRE_T की गणना इस तरह की जाती है:

फ़ॉर्मूला
RMSRE_T के लिए समीकरण. निरपेक्ष वैल्यू ज़रूरी हैं, क्योंकि नॉइज़ नेगेटिव हो सकता है.
फ़ायदे और नुकसान

APE की तुलना में RMSRE_T को समझना थोड़ा मुश्किल है. हालांकि, इसके कुछ फ़ायदे हैं. इस वजह से, कुछ मामलों में यह एपीएस से ज़्यादा बेहतर है. जैसे, खास जानकारी वाली रिपोर्ट में नॉइज़ का विश्लेषण करने के लिए:

  • RMSRE_T ज़्यादा स्टेबल है. "T" थ्रेशोल्ड है. "T" का इस्तेमाल, RMSRE_T के हिसाब में उन बकेट को कम अहमियत देने के लिए किया जाता है जिनमें कम कन्वर्ज़न होते हैं. इसलिए, छोटे साइज़ की वजह से वे नॉइज़ के लिए ज़्यादा संवेदनशील होते हैं. टी का इस्तेमाल करने पर, कम कन्वर्ज़न वाले बकेट में मेट्रिक नहीं बढ़ती है. अगर T की वैल्यू 5 है, तो 0 कन्वर्ज़न वाले बकेट में नॉइज़ वैल्यू 1 से बहुत ज़्यादा नहीं दिखेगी. इसके बजाय, इसे 0.2 पर कैप किया जाएगा, जो 1/5 के बराबर है, क्योंकि T की वैल्यू 5 है. छोटी बकेट को कम वेट देने की वजह से, यह मेट्रिक ज़्यादा स्थिर होती है. इसलिए, दो सिम्युलेशन की तुलना करना आसान हो जाता है. छोटी बकेट में, नॉइज़ की वजह से ज़्यादा बदलाव होता है.
  • RMSRE_T से, आसानी से एग्रीगेशन किया जा सकता है. कई बकेट के RMSRE_T और उनकी सही संख्या जानने से, उनके योग का RMSRE_T कैलकुलेट किया जा सकता है. इससे आपको इन कंबाइंड वैल्यू के लिए, RMSRE_T को ऑप्टिमाइज़ करने की सुविधा भी मिलती है.

APE के लिए एग्रीगेशन किया जा सकता है. हालांकि, इसका फ़ॉर्मूला काफ़ी मुश्किल है, क्योंकि इसमें लैप्लस नॉइज़ के योग का निरपेक्ष मान शामिल होता है. इस वजह से, APE को ऑप्टिमाइज़ करना मुश्किल हो जाता है.

कोड

RMSRE_T की गिनती के लिए, सोर्स कोड की समीक्षा करें.

उदाहरण

तीन बकेट वाली खास जानकारी की रिपोर्ट:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

तीन बकेट वाली खास जानकारी की रिपोर्ट:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

तीन बकेट वाली खास जानकारी की रिपोर्ट:

  • bucket_1 = noise: 10, trueSummaryValue: 100
  • bucket_2 = noise: 20, trueSummaryValue: 100
  • bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + इनफ़िनिटी) / 3 = इनफ़िनिटी

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

ऐडवांस की मैनेजमेंट

किसी डीएसपी या विज्ञापन मेज़रमेंट कंपनी के पास, दुनिया भर में विज्ञापन देने वाले हज़ारों ग्राहक हो सकते हैं. ये ग्राहक, अलग-अलग इंडस्ट्री, मुद्राओं, और खरीदारी की संभावित कीमतों से जुड़े हो सकते हैं. इसका मतलब है कि हर विज्ञापन देने वाले व्यक्ति या कंपनी के लिए एक एग्रीगेशन कुंजी बनाना और उसे मैनेज करना, शायद ही व्यावहारिक हो. इसके अलावा, ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू और एग्रीगेशन बजट को चुनना भी मुश्किल होगा. इससे दुनिया भर के हज़ारों विज्ञापन देने वाले लोगों या कंपनियों के लिए, नॉइज़ के असर को कम किया जा सकता है. इसके बजाय, आइए इन स्थितियों पर विचार करें:

मुख्य रणनीति A

विज्ञापन टेक्नोलॉजी से जुड़ी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए एक मुख्य कुंजी बनाने और उसे मैनेज करने का फ़ैसला करती है. विज्ञापन देने वाले सभी लोगों या कंपनियों और सभी मुद्राओं के लिए, खरीदारी की रेंज अलग-अलग होती है. जैसे, कम वॉल्यूम में ज़्यादा कीमत वाली खरीदारी से लेकर ज़्यादा वॉल्यूम में कम कीमत वाली खरीदारी तक. इससे यह मुख्य कुंजी मिलती है:

कुंजी (एक से ज़्यादा मुद्राएं)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू 5,000,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा [120 - 5000000]
मुख्य रणनीति बी

विज्ञापन टेक्नोलॉजी से जुड़ी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए दो कुंजियां बनाने और उन्हें मैनेज करने का फ़ैसला करती है. उन्होंने मुद्रा के हिसाब से कुंजियों को अलग करने का फ़ैसला किया. विज्ञापन देने वाले सभी लोगों या कंपनियों और सभी मुद्राओं के लिए, खरीदारी की रेंज कम वॉल्यूम, ज़्यादा कीमत वाली खरीदारी से लेकर ज़्यादा वॉल्यूम, कम कीमत वाली खरीदारी तक अलग-अलग होती है. मुद्रा के हिसाब से अलग-अलग करने पर, ये दो कुंजियां बनाते हैं:

कुंजी 1 (डॉलर) कुंजी 2 (¥)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू 40,000 डॉलर ¥5,000,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा [120 - 40,000] [15,000 - 50,00,000]

मुख्य रणनीति B के नतीजे में, मुख्य रणनीति A के मुकाबले कम नॉइज़ होगा. ऐसा इसलिए, क्योंकि मुद्रा की वैल्यू, सभी मुद्राओं में एक जैसी नहीं होती. उदाहरण के लिए, मान लें कि ¥ में की गई खरीदारी को USD में की गई खरीदारी के साथ मिला दिया जाता है. इससे, दिए गए डेटा और नॉइज़ी आउटपुट में बदलाव होगा.

मुख्य रणनीति C

विज्ञापन टेक्नोलॉजी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए चार कुंजियां बनाती है और उन्हें मुद्रा x विज्ञापन देने वाले व्यक्ति या कंपनी के उद्योग के हिसाब से अलग-अलग करती है:

बटन 1
(USD x हाई-एंड गहने के विज्ञापन देने वाले लोग या कंपनियां)
मुख्य 2
(¥ x हाई-एंड ज्वैलरी के विज्ञापन देने वाले लोग या कंपनियां)
तीसरी मुख्य वजह
(अमेरिकी डॉलर x कपड़े बेचने वाले खुदरा दुकानदारों के विज्ञापन देने वाले लोग या कंपनियां)
मुख्य 4
(¥ x कपड़े बेचने वाले खुदरा दुकानदारों के विज्ञापन)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू 40,000 डॉलर ¥5,000,000 500 डॉलर ¥65,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा [10,000 - 40,000] [12,50,000 - 50,00,000] [120 - 500] [15,000 - 65,000]

मुख्य रणनीति C के नतीजे में, मुख्य रणनीति B के मुकाबले कम नॉइज़ होगा. ऐसा इसलिए, क्योंकि विज्ञापन देने वाले लोगों या कंपनियों की खरीदारी की वैल्यू, सभी के लिए एक जैसी नहीं होती. उदाहरण के लिए, इस बात पर विचार करें कि महंगी ज्वैलरी की खरीदारी के साथ-साथ बेसबॉल हैट की खरीदारी से, मौजूदा डेटा और उससे मिलने वाले आउटपुट में कैसे बदलाव होगा.

कई विज्ञापन देने वाले लोगों या कंपनियों के लिए, शेयर की गई ज़्यादा से ज़्यादा कुल वैल्यू और शेयर किए गए स्केलिंग फ़ैक्टर बनाएं. इससे आउटपुट में नॉइज़ कम करने में मदद मिलेगी. उदाहरण के लिए, विज्ञापन देने वाले लोगों या कंपनियों के लिए, इन रणनीतियों को आज़माया जा सकता है:

  • मुद्रा के हिसाब से अलग-अलग रणनीतियां (डॉलर, येन, कैनेडियन डॉलर वगैरह)
  • विज्ञापन देने वाले व्यक्ति या कंपनी के उद्योग के हिसाब से अलग-अलग रणनीतियां (बीमा, वाहन, खुदरा वगैरह)
  • एक ही रणनीति, जिसे खरीदारी के मिलते-जुलते वैल्यू रेंज ([100], [1000], [10000] वगैरह) के हिसाब से अलग किया गया हो

विज्ञापन देने वाले लोगों या कंपनियों की समानताएं, कुंजियां, और उनसे जुड़े कोड के आधार पर मुख्य रणनीतियां बनाने से, कुंजियों को मैनेज करना आसान हो जाता है. साथ ही, सिग्नल-टू-नॉइज़ रेशियो बेहतर हो जाता है. विज्ञापन देने वाले अलग-अलग लोगों या कंपनियों की समानताएं ध्यान में रखते हुए, अलग-अलग रणनीतियों के साथ एक्सपेरिमेंट करें. इससे यह पता चलेगा कि कोड मैनेजमेंट की तुलना में, नॉइज़ के असर को ज़्यादा से ज़्यादा बढ़ाने के लिए कौनसी रणनीतियां सबसे सही हैं.


डेटा में मौजूद असामान्य वैल्यू का बेहतर मैनेजमेंट

विज्ञापन देने वाले दो लोगों या कंपनियों के लिए, एक उदाहरण देखते हैं:

  • विज्ञापन देने वाला व्यक्ति या कंपनी A:
    • विज्ञापन देने वाले व्यक्ति या कंपनी A की साइट पर मौजूद सभी प्रॉडक्ट के लिए, खरीदारी की कीमत [$120 - $1,000] के बीच है. यह कीमत 880 डॉलर के अंतर में है.
    • खरीदारी के लिए तय की गई कीमतें, 880 डॉलर की रेंज में समान रूप से बंटी हुई हैं. साथ ही, खरीदारी के लिए तय की गई औसत कीमत से दो स्टैंडर्ड डेविएशन से बाहर कोई भी कीमत नहीं है.
  • विज्ञापन देने वाला व्यक्ति या कंपनी B:
    • विज्ञापन देने वाले व्यक्ति या कंपनी B की साइट पर मौजूद सभी प्रॉडक्ट के लिए, खरीदारी की कीमत [$120 - $1,000] के बीच है. यह 880 डॉलर की रेंज है.
    • खरीदारी की कीमतें, 120 से 500 डॉलर के बीच हैं. सिर्फ़ 5% खरीदारी, 500 से 1,000 डॉलर के बीच हुई.

योगदान बजट की ज़रूरी शर्तों और आखिरी नतीजों में नॉइज़ जोड़ने के तरीके को देखते हुए, विज्ञापन देने वाले व्यक्ति या कंपनी B के नतीजे, विज्ञापन देने वाले व्यक्ति या कंपनी A के मुकाबले ज़्यादा नॉइज़ी होंगे. ऐसा इसलिए, क्योंकि विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए, आउटलायर के असर से जुड़ी कैलकुलेशन पर असर पड़ने की संभावना ज़्यादा है.

किसी बटन को खास तौर पर सेट अप करके, इस समस्या को कम किया जा सकता है. उन अहम रणनीतियों को आज़माएं जिनसे आउटलायर डेटा को मैनेज करने में मदद मिलती है. साथ ही, उनसे कुंजी की खरीदारी की सीमा के हिसाब से, खरीदारी की वैल्यू को ज़्यादा समान रूप से डिस्ट्रिब्यूट करने में मदद मिलती है.

विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए, खरीदारी की वैल्यू की दो अलग-अलग रेंज कैप्चर करने के लिए, दो अलग-अलग कुंजियां बनाई जा सकती हैं. इस उदाहरण में, विज्ञापन टेक्नोलॉजी ने ध्यान दिया है कि 500 डॉलर से ज़्यादा की खरीदारी की वैल्यू वाले आउटलायर दिख रहे हैं. विज्ञापन देने वाले इस व्यक्ति या कंपनी के लिए, दो अलग-अलग कुंजियां लागू करके देखें:

  • कुंजी का स्ट्रक्चर 1 : ऐसी कुंजी जो सिर्फ़ 120 से 500 डॉलर के बीच की खरीदारी को कैप्चर करती है. इससे खरीदारी के कुल वॉल्यूम का ~95% हिस्सा कवर होता है.
  • मुख्य स्ट्रक्चर 2: ऐसी कुंजी जो सिर्फ़ 500 डॉलर से ज़्यादा की खरीदारी को कैप्चर करती है (खरीदारी के कुल वॉल्यूम का ~5% हिस्सा).

इस मुख्य रणनीति को लागू करने से, विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए नॉइज़ को बेहतर तरीके से मैनेज किया जा सकेगा. साथ ही, उन्हें खास जानकारी वाली रिपोर्ट से ज़्यादा से ज़्यादा फ़ायदा मिलेगा. नई छोटी रेंज के हिसाब से, कुंजी A और कुंजी B में अब डेटा का डिस्ट्रिब्यूशन ज़्यादा एक जैसा होना चाहिए. यह डिस्ट्रिब्यूशन, पिछली एक कुंजी के मुकाबले हर कुंजी के लिए होना चाहिए. इससे हर कुंजी के आउटपुट में, पिछली एक कुंजी की तुलना में कम नॉइज़ का असर दिखेगा.