खास जानकारी वाली रिपोर्ट में ग़ैर-ज़रूरी आवाज़ों को समझना

जानें कि ग़ैर-ज़रूरी डेटा का क्या मतलब है, इसे कहां जोड़ा जाता है, और इससे मेज़रमेंट पर क्या असर पड़ता है.

खास जानकारी वाली रिपोर्ट, एग्रीगेट की जा सकने वाली रिपोर्ट को एग्रीगेट करने से मिलती हैं. जब एग्रीगेट की जा सकने वाली रिपोर्ट को कलेक्टर की मदद से बैच में बांटा जाता है और एग्रीगेशन सेवा की मदद से प्रोसेस किया जाता है, तो खास जानकारी वाली रिपोर्ट में नॉइज़ जोड़ा जाता है. नॉइज़, रैंडम डेटा होता है. उपयोगकर्ता की निजता को सुरक्षित रखने के लिए, नॉइज़ जोड़ा जाता है. इस प्रोसेस का मकसद, ऐसा फ़्रेमवर्क बनाना है जो अलग-अलग निजता के हिसाब से मेज़रमेंट की सुविधा दे सके.

खास जानकारी की आखिरी रिपोर्ट में नॉइज़ जोड़ा जाता है.

खास जानकारी वाली रिपोर्ट में शोर की जानकारी

आम तौर पर, आज विज्ञापनों के मेज़रमेंट में नॉइज़ जोड़ना ज़रूरी नहीं है. हालांकि, कई मामलों में नॉइज़ जोड़ने से, नतीजों के विश्लेषण के तरीके में काफ़ी बदलाव नहीं होगा.

इस बारे में इस तरह से सोचने से मदद मिल सकती है: अगर कोई डेटा ग़ैर-ज़रूरी नहीं है, तो क्या आप उस डेटा के आधार पर भरोसे के साथ फ़ैसला ले पाएंगे?

उदाहरण के लिए, क्या विज्ञापन देने वाला व्यक्ति इस बात के आधार पर, अपने कैंपेन की रणनीति या बजट में बदलाव कर सकता है कि कैंपेन A में 15 कन्वर्ज़न और कैंपेन B में 16 कन्वर्ज़न मिले?

अगर इसका जवाब 'नहीं' है, तो शोर का कोई मतलब नहीं है.

आपको एपीआई के इस्तेमाल को इस तरह से कॉन्फ़िगर करना होगा कि:

  1. ऊपर दिए गए सवाल का जवाब हां है.
  2. नॉइज़ को इस तरह मैनेज किया जाता है कि किसी खास डेटा के आधार पर फ़ैसला लेने की आपकी क्षमता पर काफ़ी असर न पड़े. इसे इस तरह से देखा जा सकता है: कन्वर्ज़न की उम्मीद की जाने वाली कम से कम संख्या के लिए, आपको इकट्ठा की गई मेट्रिक में नॉइज़ को किसी खास प्रतिशत से कम रखना होगा.

इस सेक्शन और अगले सेक्शन में, हम 2 को हासिल करने की रणनीतियों के बारे में बताएंगे.

मुख्य कॉन्सेप्ट

एग्रीगेशन सेवा, हर बार समरी रिपोर्ट का अनुरोध किए जाने पर, हर समरी वैल्यू में एक बार नॉइज़ जोड़ती है. इसका मतलब है कि हर कीवर्ड के लिए एक बार.

ये गड़बड़ी की वैल्यू, किसी खास प्रायिकता बंटन से रैंडम तौर पर ली जाती हैं. इस बारे में नीचे बताया गया है.

शोर को कम करने वाले सभी एलिमेंट, दो मुख्य कॉन्सेप्ट पर निर्भर करते हैं.

  1. नॉइज़ डिस्ट्रिब्यूशन (जानकारी यहां दी गई है) एक जैसा रहता है, भले ही समरी वैल्यू कम या ज़्यादा हो. इसलिए, समरी वैल्यू जितनी ज़्यादा होगी, इस वैल्यू के मुकाबले शोर का असर उतना ही कम होगा.

    उदाहरण के लिए, मान लें कि 20,000 डॉलर की कुल खरीदारी की वैल्यू और 200 डॉलर की कुल खरीदारी की वैल्यू, दोनों एक ही डिस्ट्रिब्यूशन से चुने गए नॉइज़ के अधीन हैं.

    मान लें कि इस डिस्ट्रिब्यूशन से होने वाला शोर, -100 से +100 के बीच है.

    • 20,000 डॉलर की खरीदारी की खास जानकारी के लिए, गड़बड़ी 0 से 100/20,000=0.5% के बीच होती है.
    • 200 डॉलर की खरीदारी की खास जानकारी के लिए, गड़बड़ी 0 से 100/200=50% के बीच होती है.

    इसलिए, 200 डॉलर की वैल्यू के मुकाबले, 20,000 डॉलर की कुल खरीदारी की वैल्यू पर गड़बड़ी का असर कम पड़ेगा. तुलनात्मक तौर पर, 20,000 डॉलर की कीमत वाले टिकट में कम शोर हो सकता है. इसका मतलब है कि इसका सिग्नल-टू-नॉइज़ रेशियो ज़्यादा हो सकता है.

    ज़्यादा एग्रीगेट की गई वैल्यू पर, नॉइज़ का असर कम होता है.

    इसका कुछ अहम असर होता है, जिसकी जानकारी अगले सेक्शन में दी गई है. यह तरीका, एपीआई के डिज़ाइन का हिस्सा है. इसका असर लंबे समय तक रहता है. विज्ञापन टेक्नोलॉजी के विशेषज्ञ, डेटा इकट्ठा करने की अलग-अलग रणनीतियों को डिज़ाइन करने और उनका आकलन करने में अहम भूमिका निभाते रहेंगे.

  2. नॉइज़, समरी वैल्यू के बावजूद एक ही डिस्ट्रिब्यूशन से लिया जाता है. हालांकि, यह डिस्ट्रिब्यूशन कई पैरामीटर पर निर्भर करता है. इनमें से एक पैरामीटर, epsilon में, विज्ञापन टेक्नोलॉजी की मदद से बदलाव किया जा सकता है. ऐसा, ऑरिजिन ट्रायल के खत्म होने के बाद, अलग-अलग उपयोगिता/निजता अडजस्टमेंट का आकलन करने के लिए किया जाता है. हालांकि, यह मान लें कि एप्सीलॉन में बदलाव करने की सुविधा कुछ समय के लिए है. इस्तेमाल के उदाहरणों और अच्छी तरह से काम करने वाली एप्सिलॉन वैल्यू के बारे में अपने सुझाव, शिकायत या राय देने के लिए आपका स्वागत है.

विज्ञापन टेक्नोलॉजी कंपनी, नॉइज़ जोड़ने के तरीकों को सीधे तौर पर कंट्रोल नहीं कर सकती. हालांकि, वह अपने मेज़रमेंट डेटा पर नॉइज़ के असर को कम कर सकती है. अगले सेक्शन में, हम इस बारे में जानेंगे कि प्रैक्टिस में, शोर को कैसे कम किया जा सकता है.

इससे पहले, आइए हम यह जानें कि शोर को कैसे कम किया जाता है.

ज़ूम इन करने पर: ग़ैर-ज़रूरी आवाज़ को कैसे कम किया जाता है

शोर का एक डिस्ट्रिब्यूशन

शोर, लाप्लास डिस्ट्रिब्यूशन से लिया जाता है. इसके लिए, ये पैरामीटर इस्तेमाल किए जाते हैं:

  • औसत (μ) 0 होना चाहिए. इसका मतलब है कि गड़बड़ी की सबसे सही वैल्यू 0 है (कोई गड़बड़ी नहीं जोड़ी गई है). साथ ही, गड़बड़ी वाली वैल्यू, ओरिजनल वैल्यू से कम या ज़्यादा हो सकती है. इसे कभी-कभी बिना किसी पूर्वाग्रह के कहा जाता है.
  • b = CONTRIBUTION_BUDGET / epsilon का स्केल पैरामीटर.
    • CONTRIBUTION_BUDGET को ब्राउज़र में तय किया जाता है.
    • epsilon का इस्तेमाल एग्रीगेशन सेवा में किया जाता है.

इस डायग्राम में, μ=0 और b = 20 वाले लेप्लास डिस्ट्रिब्यूशन के लिए, प्रोबैबिलिटी डेंसिटी फ़ंक्शन दिखाया गया है:

μ=0, b = 20 वाले लेप्लास डिस्ट्रिब्यूशन के लिए, प्रोबैबिलिटी डेंसिटी फ़ंक्शन

ग़ैर-महत्वपूर्ण आवाज़ की अलग-अलग वैल्यू, ग़ैर-महत्वपूर्ण आवाज़ का एक डिस्ट्रिब्यूशन

मान लें कि कोई विज्ञापन टेक्नोलॉजी कंपनी, एग्रीगेशन की दो कुंजियों, key1 और key2 के लिए खास जानकारी वाली रिपोर्ट का अनुरोध करती है.

एग्रीगेशन सेवा, एक ही नॉइज़ डिस्ट्रिब्यूशन के हिसाब से, दो नॉइज़ वैल्यू x1 और x2 चुनती है. x1 को key1 की खास जानकारी वाली वैल्यू में जोड़ा जाता है और x2 को key2 की खास जानकारी वाली वैल्यू में जोड़ा जाता है.

डायग्राम में, हम नॉइज़ वैल्यू को एक जैसा दिखाएंगे. यह एक आसान तरीका है. असल में, ग़ैर-ज़रूरी डेटा की वैल्यू अलग-अलग होंगी, क्योंकि इन्हें डिस्ट्रिब्यूशन से रैंडम तौर पर लिया जाता है.

इससे पता चलता है कि गड़बड़ी की सभी वैल्यू एक ही डिस्ट्रिब्यूशन से आती हैं. साथ ही, वे उस खास वैल्यू से अलग होती हैं जिस पर उन्हें लागू किया जाता है.

शोर की अन्य प्रॉपर्टी

गड़बड़ी की जांच, खास जानकारी वाली हर वैल्यू पर लागू होती है. इसमें खाली वैल्यू (0) भी शामिल हैं.

खाली समरी वैल्यू भी गड़बड़ी का शिकार हो सकती हैं.

उदाहरण के लिए, अगर किसी कीवर्ड के लिए खास जानकारी की सही वैल्यू 0 है, तब भी इस कीवर्ड की खास जानकारी वाली रिपोर्ट में आपको ग़ैर-ज़रूरी जानकारी वाली वैल्यू दिखेगी. हालांकि, इसकी संभावना कम है कि यह वैल्यू 0 हो.

गड़बड़ी की वैल्यू, पॉज़िटिव या नेगेटिव हो सकती है.

पॉज़िटिव और नेगेटिव नॉइज़ के उदाहरण.

उदाहरण के लिए, गड़बड़ी से पहले की गई खरीदारी की रकम 3,27,000 होने पर, गड़बड़ी की रकम 6,000 या -6,000 हो सकती है. ये वैल्यू, उदाहरण के तौर पर दी गई हैं.

नॉइज़ का आकलन करना

नॉइज़ के स्टैंडर्ड डीविएशन की गिनती करना

ग़ैर-ज़रूरी आवाज़ का स्टैंडर्ड डेविएशन:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
उदाहरण

epsilon = 10 के लिए, गड़बड़ी का स्टैंडर्ड डेविएशन:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

मेज़रमेंट में अंतर होने पर, यह पता लगाना कि यह अंतर अहम है या नहीं

एग्रीगेशन सेवा की मदद से, हर वैल्यू के आउटपुट में जोड़े गए नॉइज़ का स्टैंडर्ड डेविएशन आपको पता होगा. इसलिए, तुलना के लिए सही थ्रेशोल्ड तय किए जा सकते हैं. इससे यह पता लगाया जा सकता है कि नतीजों में दिखने वाले अंतर, नॉइज़ की वजह से हो सकते हैं या नहीं.

उदाहरण के लिए, अगर किसी वैल्यू में जोड़ा गया नॉइज़ करीब +/- 10 (स्केलिंग के लिए) है और दो कैंपेन के बीच वैल्यू में अंतर 100 से ज़्यादा है, तो यह अनुमान लगाया जा सकता है कि हर कैंपेन के बीच मेज़र की गई वैल्यू में अंतर, सिर्फ़ नॉइज़ की वजह से नहीं है.

Engage and share feedback

You can participate and experiment with this API.

अगले चरण