Privacy Sandbox की कुछ टेक्नोलॉजी को बंद किया जा रहा है.

Privacy Sandbox की टेक्नोलॉजी के लिए प्लान से जुड़ा हमारा अपडेट देखें.

Privacy Sandbox की सुविधा की स्थिति से, अलग-अलग एपीआई और प्लैटफ़ॉर्म की सुविधाओं की स्थिति के बारे में ज़्यादा जानकारी मिलती है.

इस पेज का अनुवाद Cloud Translation API से किया गया है.

Noiselab

इस दस्तावेज़ के बारे में जानकारी

इस दस्तावेज़ को पढ़कर, आपको इनके बारे में जानकारी मिलेगी:

खास जानकारी वाली रिपोर्ट जनरेट करने से पहले, यह समझें कि कौनसी रणनीतियां बनानी हैं.
नॉइज़ लैब के बारे में जानें. यह एक ऐसा टूल है जो नॉइज़ के अलग-अलग पैरामीटर के असर को समझने में मदद करता है. साथ ही, नॉइज़ मैनेजमेंट की अलग-अलग रणनीतियों को तुरंत एक्सप्लोर और उनका आकलन करने में मदद करता है.

सुझाव/राय दें या शिकायत करें

इस दस्तावेज़ में, खास जानकारी वाली रिपोर्ट के साथ काम करने के कुछ सिद्धांतों के बारे में बताया गया है. हालांकि, नॉइज़ मैनेजमेंट के कई तरीके हैं, जिनके बारे में यहां नहीं बताया गया है. हम आपके सुझावों, सवालों, और जोड़े गए कॉन्टेंट का स्वागत करते हैं!

शोर को मैनेज करने की रणनीतियों, एपीआई (एपसिलॉन) की सुविधा या निजता के बारे में सार्वजनिक तौर पर सुझाव/राय देने या शिकायत करने के लिए. साथ ही, Noise Lab के साथ सिम्युलेट करते समय अपनी टिप्पणियां शेयर करने के लिए: इस समस्या पर टिप्पणी करें
एपीआई के किसी अन्य पहलू के बारे में सार्वजनिक तौर पर सुझाव/राय देने या शिकायत करने के लिए: यहाँ नई समस्या की रिपोर्ट करें

शुरू करने से पहले

इस बारे में जानने के लिए, Attribution Reporting: खास जानकारी वाली रिपोर्ट और Attribution Reporting की पूरी सिस्टम ओवरव्यू पढ़ें.
इस गाइड का बेहतर तरीके से इस्तेमाल करने के लिए, नॉइज़ को समझना और एग्रीगेशन कुंजियों को समझना लेख पढ़ें.

डिज़ाइन से जुड़े फ़ैसले

डिज़ाइन से जुड़ा मुख्य सिद्धांत

तीसरे पक्ष की कुकी और खास जानकारी वाली रिपोर्ट के काम करने के तरीके में बुनियादी अंतर होते हैं. मुख्य अंतर यह है कि खास जानकारी वाली रिपोर्ट में, मेज़रमेंट डेटा में नॉइज़ जोड़ा जाता है. दूसरा तरीका यह है कि रिपोर्ट को शेड्यूल किया जाए.

ज़्यादा सिग्नल-टू-नॉइज़ रेशियो वाले मेज़रमेंट डेटा के साथ खास जानकारी वाली रिपोर्ट ऐक्सेस करने के लिए, डिमांड-साइड प्लैटफ़ॉर्म (डीएसपी) और विज्ञापन मेज़रमेंट सेवा देने वाली कंपनियों को, विज्ञापन देने वाले लोगों या कंपनियों के साथ मिलकर नॉइज़ मैनेजमेंट की रणनीतियां बनानी होंगी. इन रणनीतियों को डेवलप करने के लिए, डीएसएपी और मेज़रमेंट की सेवाएं देने वाली कंपनियों को डिज़ाइन से जुड़े फ़ैसले लेने होते हैं. ये फ़ैसले, एक ज़रूरी कॉन्सेप्ट के इर्द-गिर्द घूमते हैं:

डेटा के डिस्ट्रिब्यूशन में शामिल नॉइज़ वैल्यू सिर्फ़ दो पैरामीटर पर निर्भर करती हैं⏤एपसिलॉन और कॉन्ट्रिब्यूशन बजट⏤हालांकि, आपके पास कई अन्य कंट्रोल होते हैं. इनसे आपके आउटपुट मेज़रमेंट डेटा के सिग्नल-टू-नॉइज़ रेशियो पर असर पड़ता है.

हमें उम्मीद है कि बार-बार की जाने वाली प्रोसेस से बेहतर फ़ैसले लिए जा सकेंगे. हालांकि, इन फ़ैसलों में हर बदलाव से, लागू करने का तरीका थोड़ा अलग होगा. इसलिए, कोड के हर वर्शन को लिखने से पहले (और विज्ञापन दिखाने से पहले) ये फ़ैसले लिए जाने चाहिए.

फ़ैसला: डाइमेंशन की बारीकी

इसे Noise Lab में आज़माएं

ऐडवांस मोड पर जाएं.
पैरामीटर साइड पैनल में, अपना कन्वर्ज़न डेटा ढूंढें.
डिफ़ॉल्ट पैरामीटर देखें. डिफ़ॉल्ट रूप से, हर दिन एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या 1,000 होती है. अगर डिफ़ॉल्ट सेटअप (डिफ़ॉल्ट डाइमेंशन, हर डाइमेंशन के लिए संभावित अलग-अलग वैल्यू की डिफ़ॉल्ट संख्या, मुख्य रणनीति A) का इस्तेमाल किया जाता है, तो हर बकेट में औसतन 40 वैल्यू होती हैं. ध्यान दें कि इनपुट किए गए, एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या PER BUCKET में वैल्यू 40 है.
डिफ़ॉल्ट पैरामीटर के साथ सिम्युलेशन चलाने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
पैरामीटर साइड पैनल में, डाइमेंशन ढूंढें. Geography का नाम बदलकर City करें और संभावित अलग-अलग वैल्यू की संख्या को 50 पर सेट करें.
देखें कि इससे, हर बकेट के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या में क्या बदलाव होता है. अब यह काफ़ी कम हो गया है. ऐसा इसलिए है, क्योंकि अगर इस डाइमेंशन में संभावित वैल्यू की संख्या बढ़ाई जाती है, तो कुल बकेट की संख्या बढ़ जाती है. हालांकि, इससे यह नहीं बदलता कि हर बकेट में कितने कन्वर्ज़न इवेंट शामिल होंगे.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के नतीजों में नॉइज़ रेशियो देखें: नॉइज़ रेशियो अब पिछले सिम्युलेशन के मुकाबले ज़्यादा हैं.

कोर डिज़ाइन सिद्धांत के मुताबिक, छोटी खास जानकारी वाली वैल्यू में बड़ी खास जानकारी वाली वैल्यू की तुलना में ज़्यादा नॉइज़ होने की संभावना होती है. इसलिए, कॉन्फ़िगरेशन के लिए चुने गए विकल्प से यह तय होता है कि एट्रिब्यूट किए गए कितने कन्वर्ज़न इवेंट, हर बकेट में शामिल होंगे. इसे एग्रीगेशन कुंजी भी कहा जाता है. साथ ही, इस संख्या से फ़ाइनल आउटपुट की खास जानकारी वाली रिपोर्ट में नॉइज़ पर असर पड़ता है.

डिज़ाइन से जुड़ा एक फ़ैसला, जो एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर असर डालता है. यह फ़ैसला, डाइमेंशन की बारीकी से जुड़ी जानकारी के बारे में होता है. एग्रीगेशन कुंजियों और उनके डाइमेंशन के ये उदाहरण देखें:

पहला तरीका: एक मुख्य स्ट्रक्चर, जिसमें मोटे तौर पर डाइमेंशन शामिल हों: देश x विज्ञापन कैंपेन (या सबसे बड़ा कैंपेन एग्रीगेशन बकेट) x प्रॉडक्ट टाइप (10 संभावित प्रॉडक्ट टाइप में से)
दूसरा तरीका: एक मुख्य स्ट्रक्चर, जिसमें ज़्यादा जानकारी वाले डाइमेंशन शामिल हों: शहर x क्रिएटिव आईडी x प्रॉडक्ट (100 संभावित प्रॉडक्ट में से)

शहर, देश की तुलना में ज़्यादा बारीकी से जानकारी देता है. क्रिएटिव आईडी, कैंपेन की तुलना में ज़्यादा बारीकी से जानकारी देता है. वहीं, प्रॉडक्ट, प्रॉडक्ट टाइप की तुलना में ज़्यादा बारीकी से जानकारी देता है. इसलिए, दूसरे तरीके में, खास जानकारी वाली रिपोर्ट के आउटपुट में, पहले तरीके की तुलना में हर बकेट (= हर कुंजी) के लिए इवेंट (कन्वर्ज़न) की संख्या कम होगी. आउटपुट में जोड़ा गया नॉइज़, बकेट में मौजूद इवेंट की संख्या से अलग होता है. इसलिए, खास जानकारी वाली रिपोर्ट में मेज़रमेंट डेटा, दूसरे तरीके से ज़्यादा नॉइज़ी होगा. विज्ञापन देने वाले हर व्यक्ति या कंपनी के लिए, कुंजी के डिज़ाइन में अलग-अलग ग्रैन्युलैरिटी ट्रेडऑफ़ के साथ एक्सपेरिमेंट करें, ताकि नतीजों में ज़्यादा से ज़्यादा फ़ायदे मिल सकें.

फ़ैसला: मुख्य स्ट्रक्चर

इसे Noise Lab में आज़माएं

सिंपल मोड में, डिफ़ॉल्ट कुंजी स्ट्रक्चर का इस्तेमाल किया जाता है. ऐडवांस मोड में, अलग-अलग कुंजी स्ट्रक्चर आज़माए जा सकते हैं. इसमें कुछ उदाहरण डाइमेंशन शामिल किए गए हैं. हालांकि, इनमें बदलाव भी किया जा सकता है.

ऐडवांस मोड पर जाएं.
पैरामीटर साइड पैनल में, मुख्य रणनीति ढूंढें. ध्यान दें कि टूल में डिफ़ॉल्ट रणनीति का नाम A है. यह एक ग्रेन्यूलर कुंजी स्ट्रक्चर का इस्तेमाल करती है, जिसमें सभी डाइमेंशन शामिल होते हैं: जगह x कैंपेन आईडी x प्रॉडक्ट कैटगरी.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें.
मुख्य रणनीति को B में बदलें. इससे आपको अपने कुंजी स्ट्रक्चर को कॉन्फ़िगर करने के लिए अतिरिक्त कंट्रोल दिखते हैं.
अपने डिजिटल बटन के स्ट्रक्चर को कॉन्फ़िगर करें. उदाहरण के लिए, इस तरह:
1. मुख्य स्ट्रक्चर की संख्या: 2
2. मुख्य स्ट्रक्चर 1 = जगह x प्रॉडक्ट कैटगरी.
3. मुख्य स्ट्रक्चर 2 = कैंपेन आईडी x प्रॉडक्ट कैटगरी.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि अब आपको मेज़रमेंट के हर लक्ष्य के टाइप के लिए दो खास जानकारी वाली रिपोर्ट मिलेंगी. जैसे, खरीदारी की संख्या के लिए दो और खरीदारी की वैल्यू के लिए दो. ऐसा इसलिए है, क्योंकि आपने दो अलग-अलग मुख्य स्ट्रक्चर का इस्तेमाल किया है. उनके नॉइज़ रेशियो पर ध्यान दें.
इसे अपने कस्टम डाइमेंशन के साथ भी आज़माया जा सकता है. इसके लिए, उस डेटा को देखें जिसे आपको ट्रैक करना है: डाइमेंशन. उदाहरण के तौर पर दिए गए डाइमेंशन हटाकर, अपने डाइमेंशन बनाएं. इसके लिए, आखिरी डाइमेंशन के नीचे मौजूद, जोड़ें/हटाएं/रीसेट करें बटन का इस्तेमाल करें.

डिज़ाइन से जुड़ा एक और फ़ैसला है, मुख्य स्ट्रक्चर का इस्तेमाल करना. इससे एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर असर पड़ेगा. एग्रीगेशन कुंजियों के ये उदाहरण देखें:

सभी डाइमेंशन के साथ एक मुख्य स्ट्रक्चर; इसे मुख्य रणनीति A कहते हैं.
दो मुख्य स्ट्रक्चर, जिनमें से हर एक में डाइमेंशन का सबसेट है. इसे मुख्य रणनीति B कहते हैं.

रणनीति A आसान है. हालांकि, कुछ इनसाइट ऐक्सेस करने के लिए, आपको खास जानकारी वाली रिपोर्ट में शामिल नॉइज़ी खास जानकारी की वैल्यू को रोल अप (जोड़ना) करना पड़ सकता है. इन वैल्यू को जोड़ने पर, नॉइज़ भी जुड़ जाती है. रणनीति B में, खास जानकारी वाली रिपोर्ट में दिखाई गई खास जानकारी की वैल्यू से आपको पहले ही ज़रूरी जानकारी मिल सकती है. इसका मतलब है कि रणनीति B से, रणनीति A की तुलना में सिग्नल-टू-नॉइज़ रेशियो बेहतर होने की संभावना है. हालांकि, रणनीति A के साथ नॉइज़ पहले से ही स्वीकार्य हो सकता है. इसलिए, आसानी से काम करने के लिए अब भी रणनीति A को चुना जा सकता है. इन दोनों रणनीतियों के बारे में बताने वाले उदाहरण में ज़्यादा जानें.

कुंजी मैनेजमेंट एक जटिल विषय है. सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, कई तकनीकों का इस्तेमाल किया जा सकता है. इसके बारे में ऐडवांस कुंजी प्रबंधन में बताया गया है.

फ़ैसला: बैचिंग की फ़्रीक्वेंसी

इसे Noise Lab में आज़माएं

सिंपल मोड पर जाएं या ऐडवांस मोड पर जाएं. बैचिंग फ़्रीक्वेंसी के मामले में, दोनों मोड एक ही तरह से काम करते हैं
पैरामीटर वाले साइड पैनल में, एग्रीगेशन की रणनीति > बैचिंग की फ़्रीक्वेंसी ढूंढें. इससे एग्रीगेट की जा सकने वाली रिपोर्ट की बैचिंग फ़्रीक्वेंसी का पता चलता है. इन रिपोर्ट को एग्रीगेशन सेवा की मदद से एक ही जॉब में प्रोसेस किया जाता है.
डिफ़ॉल्ट बैचिंग फ़्रीक्वेंसी देखें: डिफ़ॉल्ट रूप से, हर दिन की बैचिंग फ़्रीक्वेंसी का सिम्युलेशन किया जाता है.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें.
बैचिंग की फ़्रीक्वेंसी को हर हफ़्ते पर सेट करें.
सिमुलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें: नॉइज़ रेशियो अब पिछले सिमुलेशन की तुलना में कम (बेहतर) हैं.

एक और डिज़ाइन फ़ैसला है, जिसका असर एक बकेट में एट्रिब्यूट किए गए कन्वर्ज़न इवेंट की संख्या पर पड़ेगा. यह फ़ैसला, बैचिंग की उस फ़्रीक्वेंसी से जुड़ा है जिसका इस्तेमाल आपको करना है. बैचिंग फ़्रीक्वेंसी से पता चलता है कि एग्रीगेट की जा सकने वाली रिपोर्ट को कितनी बार प्रोसेस किया जाता है.

अगर किसी रिपोर्ट को ज़्यादा बार (जैसे, हर घंटे) एग्रीगेट करने के लिए शेड्यूल किया जाता है, तो उसमें कम कन्वर्ज़न इवेंट शामिल होंगे. वहीं, अगर उसी रिपोर्ट को कम बार (जैसे, हर हफ़्ते) एग्रीगेट करने के लिए शेड्यूल किया जाता है, तो उसमें ज़्यादा कन्वर्ज़न इवेंट शामिल होंगे. इस वजह से, हर घंटे की रिपोर्ट में ज़्यादा नॉइज़ शामिल होगा.``` में कम कन्वर्ज़न इवेंट शामिल होंगे. ऐसा इसलिए होगा, क्योंकि एग्रीगेशन शेड्यूल कम बार होता है (जैसे, हर हफ़्ते). इस वजह से, हर घंटे की रिपोर्ट में, हफ़्ते की रिपोर्ट के मुकाबले सिग्नल-टू-नॉइज़ रेशियो कम होगा. अलग-अलग फ़्रीक्वेंसी पर रिपोर्टिंग की ज़रूरी शर्तों को आज़माएं. साथ ही, हर फ़्रीक्वेंसी के लिए सिग्नल-टू-नॉइज़ रेशियो का आकलन करें.

ज़्यादा जानकारी के लिए, बैचिंग और लंबे समय तक के डेटा को इकट्ठा करना लेख पढ़ें.

फ़ैसला: कैंपेन वैरिएबल, जिनसे एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न पर असर पड़ता है

इसे Noise Lab में आज़माएं

हालांकि, इसका अनुमान लगाना मुश्किल हो सकता है. साथ ही, सीज़न के असर के अलावा, इसमें काफ़ी अंतर भी हो सकता है. इसलिए, हर दिन सिंगल-टच एट्रिब्यूशन वाले कन्वर्ज़न की संख्या का अनुमान लगाने की कोशिश करें. इसके लिए, 10 की सबसे नज़दीकी पावर का इस्तेमाल करें: 10, 100, 1,000 या 10,000.

ऐडवांस मोड पर जाएं.
पैरामीटर साइड पैनल में, अपना कन्वर्ज़न डेटा ढूंढें.
डिफ़ॉल्ट पैरामीटर देखें. डिफ़ॉल्ट रूप से, हर दिन एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या 1,000 होती है. अगर डिफ़ॉल्ट सेटअप (डिफ़ॉल्ट डाइमेंशन, हर डाइमेंशन के लिए संभावित अलग-अलग वैल्यू की डिफ़ॉल्ट संख्या, मुख्य रणनीति A) का इस्तेमाल किया जाता है, तो हर बकेट में औसतन 40 वैल्यू होती हैं. ध्यान दें कि इनपुट किए गए, एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की रोज़ की औसत संख्या PER BUCKET में वैल्यू 40 है.
डिफ़ॉल्ट पैरामीटर के साथ सिम्युलेशन चलाने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें.
अब एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की कुल संख्या को 100 पर सेट करें. ध्यान दें कि इससे, हर बकेट के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न की औसत संख्या कम हो जाती है.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि नॉइज़ रेशियो अब ज़्यादा हैं: ऐसा इसलिए है, क्योंकि जब आपके पास हर बकेट के लिए कम कन्वर्ज़न होते हैं, तो निजता बनाए रखने के लिए ज़्यादा नॉइज़ लागू किया जाता है.

विज्ञापन देने वाले व्यक्ति या कंपनी के लिए, कन्वर्ज़न की कुल संख्या और एट्रिब्यूट किए गए कन्वर्ज़न की कुल संख्या में अंतर होता है. इनमें से दूसरी सेटिंग से, खास जानकारी वाली रिपोर्ट में मौजूद नॉइज़ पर असर पड़ता है. एट्रिब्यूट किए गए कन्वर्ज़न, कुल कन्वर्ज़न का सबसेट होते हैं. ये कैंपेन वैरिएबल के हिसाब से बदलते रहते हैं. जैसे, विज्ञापन का बजट और विज्ञापन की टारगेटिंग. उदाहरण के लिए, अगर बाकी सभी चीज़ें एक जैसी हैं, तो आपको 10 हज़ार डॉलर के विज्ञापन कैंपेन की तुलना में 1 करोड़ डॉलर के विज्ञापन कैंपेन के लिए, एट्रिब्यूट किए गए कन्वर्ज़न की संख्या ज़्यादा मिलेगी.

विचारणीय बातें:

एक ही टचपॉइंट और एक ही डिवाइस वाले एट्रिब्यूशन मॉडल के हिसाब से एट्रिब्यूट किए गए कन्वर्ज़न का आकलन करें. ऐसा इसलिए, क्योंकि ये Attribution Reporting API से इकट्ठा की गई खास जानकारी वाली रिपोर्ट के दायरे में आते हैं.
एट्रिब्यूट किए गए कन्वर्ज़न के लिए, सबसे कम और सबसे ज़्यादा कन्वर्ज़न की संख्या को ध्यान में रखें. उदाहरण के लिए, अगर बाकी सभी चीज़ें एक जैसी हैं, तो विज्ञापन देने वाले व्यक्ति या कंपनी के लिए, कैंपेन के कम से कम और ज़्यादा से ज़्यादा संभावित बजट पर विचार करें. इसके बाद, दोनों नतीजों के लिए एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न का अनुमान लगाएं और उन्हें अपने सिम्युलेशन में इनपुट के तौर पर इस्तेमाल करें.
अगर आपको Android Privacy Sandbox का इस्तेमाल करना है, तो कैलकुलेशन में क्रॉस-प्लैटफ़ॉर्म एट्रिब्यूट किए गए कन्वर्ज़न को शामिल करें.

फ़ैसला: स्केलिंग का इस्तेमाल करना

इसे Noise Lab में आज़माएं

ऐडवांस मोड पर जाएं.
पैरामीटर साइड पैनल में, एग्रीगेशन की रणनीति > स्केलिंग ढूंढें. यह डिफ़ॉल्ट रूप से 'हां' पर सेट होता है.
नॉइज़ रेशियो पर स्केलिंग के सकारात्मक असर को समझने के लिए, पहले स्केलिंग को 'नहीं' पर सेट करें.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें.
स्केलिंग को 'हां' पर सेट करें. ध्यान दें कि Noise Lab, आपके इस्तेमाल के उदाहरण के लिए मेज़रमेंट के लक्ष्यों की रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के हिसाब से, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर अपने-आप कैलकुलेट करता है. किसी असली सिस्टम या ऑरिजिन ट्रायल सेटअप में, आपको स्केलिंग फ़ैक्टर के लिए अपनी कैलकुलेशन लागू करनी होगी.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि इस दूसरे सिम्युलेशन में, नॉइज़ रेशियो अब कम (बेहतर) हो गए हैं. ऐसा इसलिए है, क्योंकि आपने स्केलिंग का इस्तेमाल किया है.

मुख्य डिज़ाइन सिद्धांत के मुताबिक, जोड़ा गया नॉइज़, कॉन्ट्रिब्यूशन बजट का फ़ंक्शन होता है.

इसलिए, सिग्नल-टू-नॉइज़ रेशियो को बढ़ाने के लिए, कन्वर्ज़न इवेंट के दौरान इकट्ठा की गई वैल्यू को बदला जा सकता है. इसके लिए, उन्हें कॉन्ट्रिब्यूशन बजट के हिसाब से स्केल किया जा सकता है. साथ ही, एग्रीगेशन के बाद उन्हें डी-स्केल किया जा सकता है. सिग्नल-टू-नॉइज़ रेशियो बढ़ाने के लिए, स्केलिंग का इस्तेमाल करें.

फ़ैसला: मेज़रमेंट के लक्ष्यों की संख्या और निजता बजट का बंटवारा

यह स्केलिंग से जुड़ा है. स्केलिंग का इस्तेमाल करना लेख ज़रूर पढ़ें.

इसे Noise Lab में आज़माएं

मेज़रमेंट लक्ष्य, कन्वर्ज़न इवेंट में इकट्ठा किया गया एक अलग डेटा पॉइंट होता है.

ऐडवांस मोड पर जाएं.
साइड पैनल में मौजूद पैरामीटर में, वह डेटा ढूंढें जिसे आपको ट्रैक करना है: मेज़रमेंट के लक्ष्य. डिफ़ॉल्ट रूप से, आपके पास मेज़रमेंट के दो लक्ष्य होते हैं: खरीदारी की वैल्यू और खरीदारी की संख्या.
डिफ़ॉल्ट लक्ष्यों के साथ सिम्युलेशन चलाने के लिए, सिम्युलेट करें पर क्लिक करें.
'हटाएं' पर क्लिक करें. इससे, मेज़रमेंट का आखिरी लक्ष्य (उस मामले में खरीदारी की संख्या) हट जाएगा.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि इस दूसरे सिम्युलेशन के लिए, परचेज़ वैल्यू के नॉइज़ रेशियो अब कम (बेहतर) हैं. ऐसा इसलिए है, क्योंकि आपके पास मेज़रमेंट के कम लक्ष्य हैं. इसलिए, अब आपके एक मेज़रमेंट लक्ष्य को पूरा कॉन्ट्रिब्यूशन बजट मिलता है.
रीसेट करें पर क्लिक करें. अब आपके पास मेज़रमेंट के दो लक्ष्य हैं: खरीदारी की वैल्यू और खरीदारी की संख्या. ध्यान दें कि Noise Lab, आपके इस्तेमाल के उदाहरण के लिए मेज़रमेंट के लक्ष्यों की रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के हिसाब से, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर अपने-आप कैलकुलेट करता है. डिफ़ॉल्ट रूप से, नॉइज़ लैब बजट को मेज़रमेंट के लक्ष्यों के हिसाब से बराबर हिस्सों में बांटता है.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें. सिमुलेशन में दिखाए गए स्केलिंग फ़ैक्टर पर ध्यान दें.
अब, सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, निजता बजट के बंटवारे को पसंद के मुताबिक बनाएं.
हर मेज़रमेंट लक्ष्य के लिए असाइन किए गए बजट के प्रतिशत में बदलाव करें. डिफ़ॉल्ट पैरामीटर के हिसाब से, मेज़रमेंट लक्ष्य 1 यानी खरीदारी की वैल्यू की रेंज, मेज़रमेंट लक्ष्य 2 यानी खरीदारी की संख्या की रेंज से ज़्यादा है.मेज़रमेंट लक्ष्य 1 की रेंज 0 से 1, 000 के बीच है, जबकि मेज़रमेंट लक्ष्य 2 की रेंज 1 से 1 के बीच है. इसका मतलब है कि मेज़रमेंट लक्ष्य 2 हमेशा 1 के बराबर होता है. इस वजह से, इसे "स्केल करने के लिए ज़्यादा जगह" की ज़रूरत होती है: मेज़रमेंट के लक्ष्य 1 को मेज़रमेंट के लक्ष्य 2 की तुलना में ज़्यादा कॉन्ट्रिब्यूशन बजट असाइन करना सबसे सही होगा, ताकि इसे ज़्यादा असरदार तरीके से बढ़ाया जा सके (स्केलिंग देखें). इसलिए,
बजट का 70% हिस्सा, मेज़रमेंट के पहले लक्ष्य को असाइन करें. मेज़रमेंट के लिए, लक्ष्य 2 को 30% असाइन करें.
'सिम्युलेट करें' पर क्लिक करें.
सिम्युलेशन के बाद मिले नतीजों के नॉइज़ रेशियो देखें. खरीदारी की वैल्यू के लिए, नॉइज़ रेशियो अब पिछले सिम्युलेशन की तुलना में काफ़ी कम (बेहतर) हैं. खरीदारी की संख्या में कोई खास बदलाव नहीं हुआ है.
मेट्रिक के हिसाब से बजट के बंटवारे में बदलाव करते रहें. देखें कि इससे आवाज़ पर क्या असर पड़ता है.

ध्यान दें कि जोड़ें/हटाएं/रीसेट करें बटन की मदद से, मेज़रमेंट के लिए अपने कस्टम लक्ष्य सेट किए जा सकते हैं.

अगर कन्वर्ज़न इवेंट पर एक डेटा पॉइंट (मेज़रमेंट लक्ष्य) को मेज़र किया जाता है, जैसे कि कन्वर्ज़न की संख्या, तो उस डेटा पॉइंट को पूरा कॉन्ट्रिब्यूशन बजट (65536) मिल सकता है. अगर आपने किसी कन्वर्ज़न इवेंट पर एक से ज़्यादा मेज़रमेंट लक्ष्य सेट किए हैं, जैसे कि कन्वर्ज़न की संख्या और खरीदारी की वैल्यू, तो उन डेटा पॉइंट को कॉन्ट्रिब्यूशन बजट शेयर करना होगा. इसका मतलब है कि आपके पास अपनी वैल्यू को बढ़ाने के लिए कम विकल्प हैं.

इसलिए, मेज़रमेंट के जितने ज़्यादा लक्ष्य होंगे, सिग्नल-टू-नॉइज़ रेशियो उतना ही कम होगा (नॉइज़ ज़्यादा होगा).

मेज़रमेंट के लक्ष्यों के बारे में एक और फ़ैसला लेना होता है. यह फ़ैसला बजट के बंटवारे से जुड़ा होता है. अगर योगदान के बजट को दो डेटा पॉइंट के बीच बराबर बांटा जाता है, तो हर डेटा पॉइंट को 65536/2 = 32768 का बजट मिलता है. यह हर डेटा पॉइंट के लिए, ज़्यादा से ज़्यादा संभावित वैल्यू के हिसाब से सबसे सही हो सकता है या नहीं भी हो सकता. उदाहरण के लिए, अगर आपको खरीदारी की संख्या मेज़र करनी है, जिसकी ज़्यादा से ज़्यादा वैल्यू 1 है. साथ ही, खरीदारी की वैल्यू मेज़र करनी है, जिसकी कम से कम वैल्यू 1 और ज़्यादा से ज़्यादा वैल्यू 120 है, तो खरीदारी की वैल्यू को "ज़्यादा स्पेस" मिलने से फ़ायदा होगा. इसका मतलब है कि इसे कॉन्ट्रिब्यूशन बजट का ज़्यादा हिस्सा मिलेगा. आपको यह पता चलेगा कि नॉइज़ के असर को देखते हुए, कुछ मेज़रमेंट लक्ष्यों को दूसरों की तुलना में प्राथमिकता दी जानी चाहिए या नहीं.

फ़ैसला: आउटलायर मैनेजमेंट

इसे Noise Lab में आज़माएं

ऐडवांस मोड पर जाएं.
पैरामीटर साइड पैनल में, एग्रीगेशन की रणनीति > स्केलिंग ढूंढें.
पक्का करें कि 'स्केलिंग' सेटिंग 'हां' पर सेट हो. ध्यान दें कि Noise Lab, इस्तेमाल किए जाने वाले स्केलिंग फ़ैक्टर अपने-आप कैलकुलेट करता है. यह कैलकुलेशन, मेज़रमेंट के लक्ष्यों के लिए दी गई रेंज (औसत और ज़्यादा से ज़्यादा वैल्यू) के आधार पर की जाती है.
मान लें कि अब तक की सबसे बड़ी खरीदारी 2,000 डॉलर की थी, लेकिन ज़्यादातर खरीदारी 10 से 120 डॉलर के बीच होती है. सबसे पहले, यह देखते हैं कि अगर हम लिटरल स्केलिंग का तरीका इस्तेमाल करते हैं, तो क्या होता है. हमारा सुझाव है कि आप इस तरीके का इस्तेमाल न करें: purchaseValue के लिए ज़्यादा से ज़्यादा वैल्यू के तौर पर 2,000 डॉलर डालें.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि नॉइज़ रेशियो ज़्यादा हैं. ऐसा इसलिए है, क्योंकि हमारा स्केलिंग फ़ैक्टर 2,000 डॉलर के आधार पर कैलकुलेट किया जाता है. हालांकि, असल में ज़्यादातर खरीदारी की वैल्यू इससे काफ़ी कम होती हैं.
अब, आइए स्केलिंग के ज़्यादा व्यावहारिक तरीके का इस्तेमाल करें. ज़्यादा से ज़्यादा खरीदारी वैल्यू को 12,000 रुपये पर सेट करो.
'सिम्युलेट करें' पर क्लिक करें.
ध्यान दें कि इस दूसरे सिम्युलेशन में, नॉइज़ रेशियो कम (बेहतर) हैं.

स्केलिंग लागू करने के लिए, आम तौर पर किसी कन्वर्ज़न इवेंट की ज़्यादा से ज़्यादा संभावित वैल्यू के आधार पर, स्केलिंग फ़ैक्टर का हिसाब लगाया जाता है (इस उदाहरण में ज़्यादा जानें).

हालांकि, उस स्केलिंग फ़ैक्टर का हिसाब लगाने के लिए, लिटरल मैक्सिमम वैल्यू का इस्तेमाल न करें, क्योंकि इससे सिग्नल-टू-नॉइज़ रेशियो खराब हो जाएगा. इसके बजाय, आउटलायर हटाएं और व्यावहारिक तौर पर ज़्यादा से ज़्यादा वैल्यू का इस्तेमाल करें.

आउटलायर मैनेजमेंट एक जटिल विषय है. सिग्नल-टू-नॉइज़ रेशियो को बेहतर बनाने के लिए, कई तकनीकों का इस्तेमाल किया जा सकता है. इनमें से एक के बारे में ऐडवांस आउटलायर मैनेजमेंट में बताया गया है.

अगले चरण

अब आपने अपने इस्तेमाल के उदाहरण के लिए, नॉइज़ मैनेजमेंट की अलग-अलग रणनीतियों का आकलन कर लिया है. इसलिए, अब आपके पास ओरिजिन ट्रायल का इस्तेमाल करके, मेज़रमेंट का असली डेटा इकट्ठा करने का विकल्प है. इससे आपको खास जानकारी वाली रिपोर्ट के साथ एक्सपेरिमेंट करने में मदद मिलेगी. एपीआई आज़माने के लिए, गाइड और सुझाव देखें.

अपेंडिक्स

Noise Lab के बारे में खास जानकारी

नॉइज़ लैब की मदद से, नॉइज़ मैनेजमेंट की रणनीतियों का तुरंत आकलन किया जा सकता है और उनकी तुलना की जा सकती है. इसका इस्तेमाल इन कामों के लिए करें:

उन मुख्य पैरामीटर के बारे में जानें जिनसे नॉइज़ पर असर पड़ सकता है. साथ ही, यह भी जानें कि इन पैरामीटर का नॉइज़ पर क्या असर पड़ता है.
अलग-अलग डिज़ाइन के फ़ैसलों के आधार पर, आउटपुट मेज़रमेंट डेटा पर नॉइज़ के असर का अनुमान लगाएं. जब तक आपको सिग्नल-शोर अनुपात का सही लेवल न मिल जाए, तब तक डिज़ाइन पैरामीटर में बदलाव करें.
खास जानकारी वाली रिपोर्ट के बारे में अपने सुझाव/राय दें या शिकायत करें. हमें बताएं कि आपके लिए इप्सिलॉन और नॉइज़ पैरामीटर की कौनसी वैल्यू काम करती हैं और कौनसी नहीं? नत परिवर्तन बिंदु कहाँ हैं?

इसे तैयारी का एक चरण माना जाता है. नॉइज़ लैब, मेज़रमेंट डेटा जनरेट करता है. इससे, आपके इनपुट के आधार पर खास जानकारी वाली रिपोर्ट के आउटपुट को सिम्युलेट किया जा सकता है. यह किसी भी डेटा को सेव या शेयर नहीं करता है.

नॉइज़ लैब में दो अलग-अलग मोड होते हैं:

आसान मोड: इसमें, आपको आवाज़ से जुड़े कंट्रोल की बुनियादी बातों के बारे में जानकारी मिलती है.
ऐडवांस मोड: नॉइज़ को मैनेज करने की अलग-अलग रणनीतियों को टेस्ट करें. साथ ही, यह आकलन करें कि आपके इस्तेमाल के उदाहरणों के लिए, सिग्नल-टू-नॉइज़ रेशियो सबसे अच्छा किस रणनीति से मिलता है.

दोनों मोड के बीच टॉगल करने के लिए, सबसे ऊपर मौजूद मेन्यू में दिए गए बटन पर क्लिक करें (#1. इस स्क्रीनशॉट में).

सिंपल मोड

सिंपल मोड में, आपके पास पैरामीटर को कंट्रोल करने का विकल्प होता है. ये पैरामीटर, बाईं ओर या नीचे दिए गए स्क्रीनशॉट में#2 पर मौजूद होते हैं. जैसे, Epsilon. साथ ही, यह देखा जा सकता है कि इनका नॉइज़ पर क्या असर पड़ता है.
हर पैरामीटर में टूलटिप (`?` बटन) होती है. हर पैरामीटर के बारे में जानकारी देखने के लिए, इन पर क्लिक करें (नीचे दिए गए स्क्रीनशॉट में#3)
शुरू करने के लिए, "सिम्युलेट करें" बटन पर क्लिक करें और देखें कि आउटपुट कैसा दिखता है (नीचे दिए गए स्क्रीनशॉट में#4)
आउटपुट सेक्शन में, आपको कई तरह की जानकारी दिख सकती है. कुछ एलिमेंट के बगल में `?` का निशान होता है. अलग-अलग जानकारी के बारे में जानने के लिए, हर `?` पर क्लिक करें.
अगर आपको टेबल का बड़ा किया गया वर्शन देखना है, तो आउटपुट सेक्शन में जाकर, जानकारी टॉगल करें पर क्लिक करें (नीचे दिए गए स्क्रीनशॉट में#5)
आउटपुट सेक्शन में मौजूद हर डेटा टेबल के बाद, टेबल को ऑफ़लाइन इस्तेमाल करने के लिए डाउनलोड करने का विकल्प होता है. इसके अलावा, सबसे नीचे दाएं कोने में, सभी डेटा टेबल डाउनलोड करने का विकल्प भी होता है (नीचे दिए गए स्क्रीनशॉट में#6)
पैरामीटर सेक्शन में मौजूद पैरामीटर के लिए, अलग-अलग सेटिंग आज़माएं और यह देखने के लिए कि उनका आउटपुट पर क्या असर पड़ता है, सिम्युलेट करें पर क्लिक करें:

सिंपल मोड के लिए नॉइज़ लैब इंटरफ़ेस.

बेहतर मोड

ऐडवांस मोड में, पैरामीटर पर आपका ज़्यादा कंट्रोल होता है. कस्टम मेज़रमेंट लक्ष्य और डाइमेंशन जोड़े जा सकते हैं (नीचे दिए गए स्क्रीनशॉट में#1 और #2)
पैरामीटर सेक्शन में नीचे की ओर स्क्रोल करें और मुख्य रणनीति का विकल्प देखें. इसका इस्तेमाल अलग-अलग कुंजी स्ट्रक्चर को आज़माने के लिए किया जा सकता है (नीचे दिए गए स्क्रीनशॉट में#3)
- अलग-अलग मुख्य स्ट्रक्चर आज़माने के लिए, मुख्य रणनीति को "B" पर स्विच करें
- आपको जितने अलग-अलग मुख्य स्ट्रक्चर इस्तेमाल करने हैं उनकी संख्या डालें (डिफ़ॉल्ट रूप से "2" पर सेट है)
- 'कुंजी के स्ट्रक्चर जनरेट करें' पर क्लिक करें
- आपको मुख्य स्ट्रक्चर तय करने के विकल्प दिखेंगे. इसके लिए, आपको हर मुख्य स्ट्रक्चर के लिए, उन कुंजियों के बगल में मौजूद चेकबॉक्स पर क्लिक करना होगा जिन्हें आपको शामिल करना है
- आउटपुट देखने के लिए, 'सिम्युलेट करें' पर क्लिक करें.
  
  ऐडवांस मोड के लिए, नॉइज़ लैब का इंटरफ़ेस.
  
  ऐडवांस मोड के लिए, नॉइज़ लैब का इंटरफ़ेस.

गै़र-ज़रूरी आवाज़ों से जुड़ी मेट्रिक

मुख्य सिद्धांत

किसी उपयोगकर्ता की निजता को सुरक्षित रखने के लिए, डेटा में ग़ैर-ज़रूरी जानकारी जोड़ी जाती है.

नॉइज़ वैल्यू ज़्यादा होने का मतलब है कि बकेट/कुंजी कम हैं और उनमें सीमित संख्या में संवेदनशील इवेंट का योगदान है. यह काम Noise Lab अपने-आप करता है, ताकि लोग "भीड़ में छिप सकें" या दूसरे शब्दों में कहें, तो यह सीमित लोगों की निजता को ज़्यादा नॉइज़ जोड़कर सुरक्षित रखता है.

नॉइज़ की कम वैल्यू से पता चलता है कि डेटा सेटअप को इस तरह से डिज़ाइन किया गया है कि इससे लोगों को "भीड़ में छिपने" की सुविधा मिलती है. इसका मतलब है कि बकेट में, इवेंट की ज़रूरी संख्या से ज़्यादा इवेंट शामिल हैं. इससे यह पुष्टि की जा सकती है कि किसी उपयोगकर्ता की निजता सुरक्षित है.

यह स्टेटमेंट, औसत प्रतिशत गड़बड़ी (एपीई) और RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव गड़बड़ी) दोनों के लिए सही है.

APE (औसत प्रतिशत गड़बड़ी)

एपीई, सिग्नल के मुकाबले नॉइज़ का अनुपात होता है. सिग्नल का मतलब, खास जानकारी वाली सही वैल्यू से है.

एपीई की वैल्यू कम होने का मतलब है कि सिग्नल-टू-नॉइज़ रेशियो बेहतर है.

अगर एपीई 100% से ज़्यादा है, तो इसका क्या मतलब है? इसका मतलब है कि नॉइज़ का लेवल बहुत ज़्यादा है. यह सही वैल्यू से भी ज़्यादा है. उदाहरण के लिए, APE = 200% का मतलब है कि जोड़ा गया नॉइज़, सिग्नल से दोगुना है.

अगर एपीई की वैल्यू इनफ़िनिटी है, तो इसका क्या मतलब है? इसका मतलब है कि सही खास जानकारी की वैल्यू 0 थी. इसका मतलब है कि कम से कम एक बकेट खाली था. ज़्यादा जानकारी के लिए, [उदाहरण सेक्शन](#noise-examples) पढ़ें.

फ़ॉर्मूला

किसी खास जानकारी वाली रिपोर्ट के लिए, APE की गणना इस तरह की जाती है:

एपीई के लिए समीकरण. कुल वैल्यू देना ज़रूरी है, क्योंकि नॉइज़ नेगेटिव हो सकता है. — एपीई का समीकरण. निरपेक्ष वैल्यू ज़रूरी हैं, क्योंकि नॉइज़ नेगेटिव हो सकता है.

True, खास जानकारी की सही वैल्यू है. APE, हर सही खास जानकारी वाली वैल्यू के हिसाब से नॉइज़ का औसत होता है. यह खास जानकारी वाली रिपोर्ट की सभी एंट्री के हिसाब से औसत निकाला जाता है. Noise Lab में, इसे 100 से गुणा करके प्रतिशत में बदला जाता है.

फ़ायदे और नुकसान

छोटे साइज़ वाले बकेट का, APE की फ़ाइनल वैल्यू पर काफ़ी असर पड़ता है. इससे नॉइज़ का आकलन करते समय, गुमराह करने वाली जानकारी मिल सकती है. इसलिए, हमने एक और मेट्रिक, RMSRE_T जोड़ी है. इसे APE की इस सीमा को कम करने के लिए डिज़ाइन किया गया है. ज़्यादा जानकारी के लिए, उदाहरण देखें.

कोड

एपीई की गिनती के लिए, सोर्स कोड की समीक्षा करें.

RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव एरर)

RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव एरर) भी नॉइज़ को मेज़र करने का एक तरीका है.

RMSRE_T को समझने का तरीका

RMSRE_T की वैल्यू कम होने का मतलब है कि सिग्नल-टू-नॉइज़ रेशियो बेहतर है.
उदाहरण के लिए, अगर आपके इस्तेमाल के उदाहरण के लिए स्वीकार्य नॉइज़ रेशियो 20% है और RMSRE_T 0.2 है, तो आपको भरोसा हो सकता है कि नॉइज़ लेवल आपकी स्वीकार्य सीमा में आते हैं.

अगर RMSRE_T की वैल्यू 1 से ज़्यादा है, तो इसका क्या मतलब है? RMSRE_T की वैल्यू 1 से ज़्यादा होने का मतलब वही होता है जो APE की वैल्यू 100% से ज़्यादा होने का होता है. आरएमएसआरई (रूट मीन स्क्वेयर रिलेटिव एरर), डेटा साइंटिस्ट की ओर से इस्तेमाल की जाने वाली एक सामान्य मेट्रिक है. RMSRE_T, RMSRE का एक वैरिएंट है. RMSRE_T, RMSRE से दो तरह से अलग है:

RMSRE_T, नॉइज़-टू-सिग्नल रेट की तरह ही रिलेटिव गड़बड़ी का इस्तेमाल करता है. जैसे, नॉइज़/सही वैल्यू.
RMSRE_T, कम से कम सिग्नल के मौजूद होने की बात मानता है: नॉइज़/max(true, T).

फ़ॉर्मूला

किसी खास जानकारी वाली रिपोर्ट के लिए, RMSRE_T की गणना इस तरह की जाती है:

फ़ायदे और नुकसान

APE की तुलना में RMSRE_T को समझना थोड़ा मुश्किल है. हालांकि, इसके कुछ फ़ायदे हैं. इस वजह से, कुछ मामलों में यह एपीएस से ज़्यादा बेहतर है. जैसे, खास जानकारी वाली रिपोर्ट में नॉइज़ का विश्लेषण करने के लिए:

RMSRE_T ज़्यादा स्टेबल है. "T" थ्रेशोल्ड है. "T" का इस्तेमाल, RMSRE_T के हिसाब से कम कन्वर्ज़न वाले बकेट को कम वेट देने के लिए किया जाता है. इसलिए, छोटे साइज़ की वजह से ये बकेट नॉइज़ के लिए ज़्यादा संवेदनशील होते हैं. T का इस्तेमाल करने पर, कम कन्वर्ज़न वाले बकेट में मेट्रिक नहीं बढ़ती. अगर T की वैल्यू 5 है, तो 0 कन्वर्ज़न वाले बकेट में नॉइज़ वैल्यू 1 से बहुत ज़्यादा नहीं दिखेगी. इसके बजाय, इसे 0.2 पर कैप किया जाएगा, जो 1/5 के बराबर है, क्योंकि T, 5 के बराबर है. छोटी बकेट को कम वेट देने की वजह से, यह मेट्रिक ज़्यादा स्थिर होती है. इसलिए, दो सिम्युलेशन की तुलना करना आसान हो जाता है. छोटी बकेट में, नॉइज़ की वजह से बदलाव होने की संभावना ज़्यादा होती है.
RMSRE_T से, आसानी से एग्रीगेशन किया जा सकता है. कई बकेट के RMSRE_T और उनकी सही संख्या जानने से, उनके योग का RMSRE_T कैलकुलेट किया जा सकता है. इससे आपको इन कंबाइंड वैल्यू के लिए, RMSRE_T को ऑप्टिमाइज़ करने की सुविधा भी मिलती है.

APE के लिए एग्रीगेशन किया जा सकता है. हालांकि, इसका फ़ॉर्मूला काफ़ी मुश्किल है, क्योंकि इसमें लैप्लस नॉइज़ के योग का निरपेक्ष मान शामिल होता है. इस वजह से, एईपी को ऑप्टिमाइज़ करना मुश्किल हो जाता है.

कोड

RMSRE_T की गिनती के लिए, सोर्स कोड की समीक्षा करें.

उदाहरण

तीन बकेट वाली खास जानकारी की रिपोर्ट:

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 200

APE = (0.1 + 0.2 + 0.1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14

तीन बकेट वाली खास जानकारी की रिपोर्ट:

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 20

APE = (0.1 + 0.2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

तीन बकेट वाली खास जानकारी की रिपोर्ट:

bucket_1 = noise: 10, trueSummaryValue: 100
bucket_2 = noise: 20, trueSummaryValue: 100
bucket_3 = noise: 20, trueSummaryValue: 0

APE = (0.1 + 0.2 + इनफ़िनिटी) / 3 = इनफ़िनिटी

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

ऐडवांस की मैनेजमेंट

किसी डीएसपी या विज्ञापन मेज़रमेंट कंपनी के पास, दुनिया भर में विज्ञापन देने वाले हज़ारों ग्राहक हो सकते हैं. ये ग्राहक, अलग-अलग इंडस्ट्री, मुद्राओं, और खरीदारी की संभावित कीमतों से जुड़े हो सकते हैं. इसका मतलब है कि हर विज्ञापन देने वाले व्यक्ति या कंपनी के लिए एक एग्रीगेशन कुंजी बनाना और उसे मैनेज करना, शायद ही व्यावहारिक हो. इसके अलावा, ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू और एग्रीगेशन बजट को चुनना भी मुश्किल होगा. इससे दुनिया भर में विज्ञापन देने वाले इन हज़ारों लोगों या कंपनियों के डेटा में मौजूद नॉइज़ के असर को कम किया जा सकता है. इसके बजाय, आइए इन स्थितियों पर विचार करें:

मुख्य रणनीति A

विज्ञापन टेक्नोलॉजी से जुड़ी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए एक मुख्य कुंजी बनाने और उसे मैनेज करने का फ़ैसला करती है. विज्ञापन देने वाले सभी लोगों या कंपनियों और सभी मुद्राओं के लिए, खरीदारी की रेंज अलग-अलग होती है. जैसे, कम वॉल्यूम वाली, महंगी खरीदारी से लेकर ज़्यादा वॉल्यूम वाली, सस्ती खरीदारी तक. इससे यह मुख्य कुंजी मिलती है:

	कुंजी (एक से ज़्यादा मुद्राएं)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू	5,000,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा	[120 - 5000000]

मुख्य रणनीति बी

विज्ञापन टेक्नोलॉजी से जुड़ी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए दो कुंजियां बनाने और उन्हें मैनेज करने का फ़ैसला करती है. उन्होंने मुद्रा के हिसाब से कुंजियों को अलग करने का फ़ैसला किया. विज्ञापन देने वाले सभी लोगों या कंपनियों और सभी मुद्राओं के लिए, खरीदारी की रेंज कम वॉल्यूम, ज़्यादा कीमत वाली खरीदारी से लेकर ज़्यादा वॉल्यूम, कम कीमत वाली खरीदारी तक अलग-अलग होती है. मुद्रा के हिसाब से अलग-अलग करने पर, ये दो कुकी सेट होती हैं:

	कुंजी 1 (डॉलर)	बटन 2 (¥)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू	40,000 डॉलर	¥5,000,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा	[120 - 40,000]	[15,000 - 50,00,000]

मुख्य रणनीति B के नतीजे में, मुख्य रणनीति A के मुकाबले कम नॉइज़ होगा. ऐसा इसलिए, क्योंकि मुद्रा की वैल्यू, सभी मुद्राओं में एक जैसी नहीं होती. उदाहरण के लिए, मान लें कि ¥ में की गई खरीदारी को USD में की गई खरीदारी के साथ मिला दिया जाता है. इससे, दिए गए डेटा और नॉइज़ी आउटपुट पर क्या असर पड़ेगा.

मुख्य रणनीति C

विज्ञापन टेक्नोलॉजी सेवा देने वाली कंपनी, विज्ञापन देने वाले सभी ग्राहकों के लिए चार कुंजियां बनाती है और उन्हें मुद्रा x विज्ञापन देने वाले व्यक्ति या कंपनी के उद्योग के हिसाब से अलग-अलग करती है:

	बटन 1 (USD x हाई-एंड गहने के विज्ञापन देने वाले लोग या कंपनियां)	मुख्य 2 (¥ x हाई-एंड ज्वैलरी के विज्ञापन देने वाले लोग या कंपनियां)	तीसरी मुख्य वजह (अमेरिकी डॉलर x कपड़े बेचने वाले खुदरा दुकानदारों के विज्ञापन देने वाले लोग या कंपनियां)	मुख्य 4 (¥ x कपड़े बेचने वाले खुदरा दुकानदारों के विज्ञापन)
ज़्यादा से ज़्यादा एग्रीगेट की जा सकने वाली वैल्यू	40,000 डॉलर	¥5,000,000	500 डॉलर	¥65,000
परचेज़ कन्वर्ज़न की कुल वैल्यू की सीमा	[10,000 - 40,000]	[12,50,000 - 50,00,000]	[120 - 500]	[15,000 - 65,000]

मुख्य रणनीति C के नतीजे में, मुख्य रणनीति B के मुकाबले कम नॉइज़ होगा. ऐसा इसलिए, क्योंकि विज्ञापन देने वाले लोगों या कंपनियों की खरीदारी की वैल्यू, सभी के लिए एक जैसी नहीं होती. उदाहरण के लिए, सोचें कि महंगी ज्वैलरी की खरीदारी के साथ-साथ बेसबॉल हैट की खरीदारी से, मौजूदा डेटा और उससे मिलने वाले आउटपुट में कैसे बदलाव होगा.

आउटपुट में नॉइज़ कम करने के लिए, विज्ञापन देने वाले कई लोगों या कंपनियों के लिए, शेयर की गई ज़्यादा से ज़्यादा कुल वैल्यू और शेयर किए गए स्केलिंग फ़ैक्टर बनाएं. उदाहरण के लिए, विज्ञापन देने वाले लोगों या कंपनियों के लिए, इन रणनीतियों को आज़माया जा सकता है:

मुद्रा के हिसाब से अलग की गई एक रणनीति (USD, ¥, CAD वगैरह)
विज्ञापन देने वाले व्यक्ति या कंपनी के उद्योग के हिसाब से अलग-अलग रणनीतियां (बीमा, वाहन, खुदरा वगैरह)
एक रणनीति, जिसे खरीदारी के मिलते-जुलते वैल्यू रेंज के हिसाब से अलग किया गया है ([100], [1000], [10000] वगैरह)

विज्ञापन देने वाले लोगों या कंपनियों की समानताएं, कुंजियां, और उनसे जुड़े कोड के आधार पर मुख्य रणनीतियां बनाने से, कुंजियों को मैनेज करना आसान हो जाता है. साथ ही, सिग्नल-टू-नॉइज़ रेशियो बेहतर हो जाता है. विज्ञापन देने वाले अलग-अलग लोगों या कंपनियों की समानताएं ध्यान में रखते हुए, अलग-अलग रणनीतियों के साथ एक्सपेरिमेंट करें. इससे यह पता चलेगा कि कोड मैनेजमेंट की तुलना में, नॉइज़ के असर को ज़्यादा से ज़्यादा बढ़ाने के लिए कौनसी रणनीतियां सबसे सही हैं.

डेटा में मौजूद असामान्य वैल्यू का बेहतर मैनेजमेंट

विज्ञापन देने वाले दो लोगों या कंपनियों के लिए, एक उदाहरण देखते हैं:

विज्ञापन देने वाला व्यक्ति या कंपनी A:
- विज्ञापन देने वाले व्यक्ति या कंपनी A की साइट पर मौजूद सभी प्रॉडक्ट के लिए, खरीदारी की कीमत [$120 - $1,000] के बीच हो सकती है. यह कीमत 880 डॉलर के अंतर में है.
- खरीदारी के लिए तय की गई कीमतें, 880 डॉलर की रेंज में समान रूप से बंटी हुई हैं. साथ ही, खरीदारी के लिए तय की गई औसत कीमत से दो स्टैंडर्ड डेविएशन से बाहर कोई भी कीमत नहीं है.
विज्ञापन देने वाला व्यक्ति या कंपनी B:
- विज्ञापन देने वाले व्यक्ति या कंपनी B की साइट पर मौजूद सभी प्रॉडक्ट के लिए, खरीदारी की कीमत [$120 - $1,000] के बीच हो सकती है. यह कीमत 880 डॉलर के अंतर में है.
- खरीदारी की कीमतें, 120 से 500 डॉलर के बीच हैं. सिर्फ़ 5% खरीदारी, 500 से 1,000 डॉलर के बीच हुई.

योगदान बजट की ज़रूरी शर्तों और आखिरी नतीजों में नॉइज़ जोड़ने के तरीके को देखते हुए, विज्ञापन देने वाले व्यक्ति या कंपनी B को विज्ञापन देने वाले व्यक्ति या कंपनी A की तुलना में ज़्यादा नॉइज़ वाला आउटपुट मिलेगा. ऐसा इसलिए, क्योंकि विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए, आउटलायर के असर से जुड़ी कैलकुलेशन पर असर पड़ने की संभावना ज़्यादा है.

किसी बटन को खास तौर पर सेट अप करके, इस समस्या को कम किया जा सकता है. उन अहम रणनीतियों को टेस्ट करें जिनसे आउटलायर डेटा को मैनेज करने में मदद मिलती है. साथ ही, कुंजी की खरीदारी की सीमा के हिसाब से खरीदारी की वैल्यू को ज़्यादा समान रूप से डिस्ट्रिब्यूट किया जा सकता है.

विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए, खरीदारी की वैल्यू की दो अलग-अलग रेंज कैप्चर करने के लिए, दो अलग-अलग कुंजियां बनाई जा सकती हैं. इस उदाहरण में, विज्ञापन टेक्नोलॉजी ने ध्यान दिया है कि 500 डॉलर से ज़्यादा की खरीदारी की वैल्यू वाले आउटलायर दिख रहे हैं. विज्ञापन देने वाले इस व्यक्ति या कंपनी के लिए, दो अलग-अलग कुंजियां लागू करके देखें:

मुख्य स्ट्रक्चर 1 : ऐसी कुंजी जो सिर्फ़ 120 से 500 डॉलर के बीच की खरीदारी को कैप्चर करती है. इससे खरीदारी के कुल वॉल्यूम का ~95% हिस्सा कवर होता है.
मुख्य स्ट्रक्चर 2: ऐसा पासकोड जो सिर्फ़ 500 डॉलर से ज़्यादा की खरीदारी को कैप्चर करता है (खरीदारी के कुल वॉल्यूम का ~5%).

इस मुख्य रणनीति को लागू करने से, विज्ञापन देने वाले व्यक्ति या कंपनी B के लिए नॉइज़ को बेहतर तरीके से मैनेज किया जा सकेगा. साथ ही, उन्हें खास जानकारी वाली रिपोर्ट से ज़्यादा से ज़्यादा फ़ायदा मिलेगा. नई छोटी रेंज के हिसाब से, कुंजी A और कुंजी B में अब डेटा का डिस्ट्रिब्यूशन ज़्यादा एक जैसा होना चाहिए. यह डिस्ट्रिब्यूशन, पिछली एक कुंजी के मुकाबले हर कुंजी के लिए होना चाहिए. इससे हर कुंजी के आउटपुट में, पिछली एक कुंजी की तुलना में कम नॉइज़ का असर दिखेगा.

Noiselab संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

इस दस्तावेज़ के बारे में जानकारी

सुझाव/राय दें या शिकायत करें

शुरू करने से पहले

डिज़ाइन से जुड़े फ़ैसले

डिज़ाइन से जुड़ा मुख्य सिद्धांत

फ़ैसला: डाइमेंशन की बारीकी

इसे Noise Lab में आज़माएं

फ़ैसला: मुख्य स्ट्रक्चर

इसे Noise Lab में आज़माएं

फ़ैसला: बैचिंग की फ़्रीक्वेंसी

इसे Noise Lab में आज़माएं

फ़ैसला: कैंपेन वैरिएबल, जिनसे एट्रिब्यूट किए जा सकने वाले कन्वर्ज़न पर असर पड़ता है

इसे Noise Lab में आज़माएं

फ़ैसला: स्केलिंग का इस्तेमाल करना

इसे Noise Lab में आज़माएं

फ़ैसला: मेज़रमेंट के लक्ष्यों की संख्या और निजता बजट का बंटवारा

इसे Noise Lab में आज़माएं

फ़ैसला: आउटलायर मैनेजमेंट

इसे Noise Lab में आज़माएं

अगले चरण

अपेंडिक्स

Noise Lab के बारे में खास जानकारी

सिंपल मोड

बेहतर मोड

गै़र-ज़रूरी आवाज़ों से जुड़ी मेट्रिक

मुख्य सिद्धांत

APE (औसत प्रतिशत गड़बड़ी)

फ़ॉर्मूला

फ़ायदे और नुकसान

कोड

RMSRE_T (थ्रेशोल्ड के साथ रूट-मीन-स्क्वेयर रिलेटिव एरर)

RMSRE_T को समझने का तरीका

फ़ॉर्मूला

फ़ायदे और नुकसान

कोड

उदाहरण

ऐडवांस की मैनेजमेंट

मुख्य रणनीति A

मुख्य रणनीति बी

मुख्य रणनीति C

डेटा में मौजूद असामान्य वैल्यू का बेहतर मैनेजमेंट

Noiselab