वेब के लिए Topics API

Topics API, तीसरे पक्ष की कुकी का इस्तेमाल किए बिना, दिलचस्पी के हिसाब से विज्ञापन दिखाने की सुविधा देता है.

Topics API के काम करने का तरीका

Topics API का इस्तेमाल, उपयोगकर्ता की गतिविधि के आधार पर उन विषयों को देखने और उनका ऐक्सेस देने के लिए किया जा सकता है जिनमें उपयोगकर्ता की दिलचस्पी है. इसके बाद, Topics API, एपीआई कॉलर (जैसे, विज्ञापन टेक्नोलॉजी प्लैटफ़ॉर्म) को उपयोगकर्ता की दिलचस्पी के विषयों का ऐक्सेस दे सकता है. हालांकि, ऐसा करते समय उपयोगकर्ता की गतिविधि के बारे में अतिरिक्त जानकारी नहीं दी जाती.

मुख्य सिद्धांत

  • विषय, मौजूदा उपयोगकर्ता की दिलचस्पी का ऐसा विषय होता है जिसे कोई भी व्यक्ति आसानी से पढ़ सकता है. यह विषयों की टैक्सोनॉमी का हिस्सा होता है.
  • कॉल करने वाला कोई इकाई होती है. जैसे, कोई ऐप्लिकेशन, तीसरे पक्ष का एसडीके, वेबसाइट या सेवा. यह इकाई, उपयोगकर्ता की दिलचस्पी के विषयों को देखने या ऐक्सेस करने के लिए, Topics API से अनुरोध करती है.
  • अगर कॉलर ने पिछले तीन समयावधि के दौरान, इस विषय से जुड़े किसी वेब पेज या ऐप्लिकेशन से Topics API का अनुरोध किया है, तो वह विषय कॉलर की निगरानी में होता है.
  • एपॉच, विषय के हिसाब लगाने की अवधि होती है. यह डिफ़ॉल्ट रूप से एक हफ़्ते की होती है.
  • टैक्सोनॉमी, कैटगरी की हैरारकी वाली सूची होती है. उदाहरण के लिए, इसमें /Arts & Entertainment/Music & Audio/Soul & R&B और /Business & Industrial/Business Services/Corporate Events जैसी कैटगरी शामिल होती हैं.
  • विषयों को डेटा की कैटगरी तय करने वाले मॉडल का इस्तेमाल करके बनाया जाता है. यह मॉडल, उपयोगकर्ता की गतिविधि को शून्य या उससे ज़्यादा विषयों से मैप करता है.

Topics API फ़्लो के मुख्य चरण

Topics API के लाइफ़साइकल में तीन मुख्य चरण होते हैं:

  • उपयोगकर्ता की गतिविधि को निगरानी करें. जैसे, जब वे वेब पेज https://cats.example/tabby/index.html पर जाते हैं या ऐप्लिकेशन cats डाउनलोड करते हैं.
  • उपयोगकर्ता गतिविधि से विषय पाएं, जैसे कि /Pets & Animals/Pets/Cats.
  • उपयोगकर्ता के लिए पहले से ऐसे विषयों को ऐक्सेस करना जिनमें उनकी दिलचस्पी है. उदाहरण के लिए, काम के विज्ञापन चुनने के लिए सिग्नल के तौर पर, बिल्ली के खाने का प्रमोशन.

विषयों को देखना

कॉल करने वाले लोग, सिर्फ़ उन विषयों को ऐक्सेस कर सकते हैं जिनमें उन्होंने दिलचस्पी दिखाई है. जब कोई कॉलर, इस विषय से जुड़े कॉन्टेक्स्ट से Topics API का अनुरोध करता है, तो वह उस विषय को निगरानी में रखता है. इस कॉन्सेप्ट को समझने के लिए, यहां दिया गया आसान उदाहरण देखें.

  • मान लें कि Topics API के दो कॉलर हैं: A और B.
  • दो तरह के संदर्भ होते हैं:
    • Greenhouse, जैसे कि Home & Garden विषय से जुड़ा Greenhouse नाम का ऐप्लिकेशन या greenhouse.example वेबसाइट.
    • टेनिस की एक्सरसाइज़. उदाहरण के लिए, Sports/Tennis विषय से जुड़ा Tennis Exercises नाम का ऐप्लिकेशन या tennis.example वेबसाइट.
  • कॉलर A और B, दोनों Greenhouse के संदर्भ में मौजूद हैं.
  • टेनिस के व्यायाम के संदर्भ में, सिर्फ़ कॉल करने वाला B मौजूद है.
  • आसानी से समझने के लिए, मान लें कि पहले एपच (अवधि) से पहले, उपयोगकर्ता के लिए कोई विषय नहीं देखा गया था.
  • उपयोगकर्ता Greenhouse ऐप्लिकेशन पर जाता है और कॉलर A और B, उपयोगकर्ता के पेज या ऐप्लिकेशन पर आने की जानकारी रिकॉर्ड करने के लिए Topics API को कॉल करते हैं. Topics API को कॉल करने का तरीका जानने के लिए, अगले चरण में सुझाई गई, लागू करने की गाइड देखें. इस रिकॉर्ड (होस्टनेम या ऐप्लिकेशन डेटा) का इस्तेमाल, बाद में आपकी दिलचस्पी के विषयों का पता लगाने के लिए किया जाता है. Topics API, बाद में विषय Home & Garden को उस तरह से मार्क करेगा जिस तरह से कॉलर A और B ने देखा है.
  • उपयोगकर्ता, टेनिस की गतिविधियां ऐप्लिकेशन पर जाता है. सिर्फ़ कॉलर B, Topics API का अनुरोध भेजता है. Topics API बाद में, विषय Sports/Tennis को कॉलर B के हिसाब से मार्क करेगा.
  • एपॉच के खत्म होने तक, Topics API उपयोगकर्ता के सबसे ज़्यादा देखे गए विषयों को रीफ़्रेश कर देता है. साथ ही, उपयोगकर्ता की गतिविधि के आधार पर उन कॉलर का पता लगाता है जिन्होंने इन विषयों को देखा है.
  • बाद में, जब कॉल करने वाला B, Topics API को कोई दूसरा कॉल करता है, तो उसे रिस्पॉन्स कलेक्शन में इस उपयोगकर्ता के लिए Home & Garden या Sports/Tennis विषय मिल सकता है. इसके अलावा, 5% संभावना के साथ कोई दूसरा विषय भी मिल सकता है.
  • कॉलर A सिर्फ़ विषय Home & Garden को ऐक्सेस कर सकता है, क्योंकि उसने विषय Sports/Tennis को कभी नहीं देखा है. इसका मतलब है कि तीसरे पक्ष को उपयोगकर्ता के पसंदीदा विषय के बारे में सिर्फ़ उस खास संदर्भ (ऐप्लिकेशन या वेबसाइट) में पता चलेगा जहां वह मौजूद है.
इस डायग्राम में दिखाया गया है कि Topics API, विषयों को सिर्फ़ तब 'अवलोकित किया गया' के तौर पर मार्क करता है, जब कॉल करने वाले व्यक्ति की मौजूदगी कॉन्टेक्स्ट में हो.
Topics API, सिर्फ़ उन विषयों को मार्क करता है जिन पर कॉल करने वाले लोगों ने बात की है. कॉल करने वाले लोग सिर्फ़ उन विषयों को ऐक्सेस कर पाएंगे जिन्हें उन्होंने देखा है.

विषयों को चुनना

Topics, उपयोगकर्ता की गतिविधि से दिलचस्पी के विषयों का पता लगाता है. ये विषय, पहले से तय किए गए ओपन-सोर्स टैक्सोनॉमी से चुने जाते हैं. हर एपॉच में एक बार, Topics उपयोगकर्ता के सबसे ज़्यादा ब्राउज़ किए गए पांच विषयों और उन कॉलर को रीफ़्रेश करता है जिन्होंने एपॉच के दौरान उन्हें देखा था. Topics का डेटा की कैटगरी तय करने वाला मॉडल, उपयोगकर्ता की गतिविधि से विषयों का पता लगाता है: वेब पेज पर विज़िट के लिए होस्टनेम, Android पर ऐप्लिकेशन की जानकारी.

कॉल करने वाला व्यक्ति, उपयोगकर्ता की दिलचस्पी के विषयों को ऐक्सेस करता है

एपीआई सिर्फ़ वे विषय दिखाता है जिन्हें कॉल करने वाले ने हाल ही के तीन समयावधि में देखा है. कॉलर को ज़्यादा से ज़्यादा तीन विषय दिखाए जा सकते हैं. इनमें से हर विषय, हाल ही के तीन एपिसोड में से किसी एक का होगा. हालांकि, ऐसा तब ही होगा, जब कॉलर ने उस एपिसोड के लिए विषयों को देखा हो. कॉल करने वाला व्यक्ति, दिए गए विषयों का इस्तेमाल संदर्भ से जुड़ी जानकारी को बेहतर बनाने के लिए कर सकता है. साथ ही, इन विषयों को जोड़कर उपयोगकर्ता के लिए ज़्यादा काम का विज्ञापन ढूंढा जा सकता है.

इकोसिस्टम

Topics API को यह पक्का करना होगा कि दिलचस्पी के विषयों की जानकारी अप-टू-डेट हो. किसी उपयोगकर्ता के लिए विषयों का अनुमान, उसकी गतिविधि के आधार पर लगाया जाता है. यह गतिविधि, किसी तय समयावधि के दौरान की जाती है. इस समयावधि को 'एपॉच' कहते हैं. डिफ़ॉल्ट रूप से, यह समयावधि एक हफ़्ते की होती है. हर उपयोगकर्ता के लिए, एपिसोड का शुरू होने का समय अलग-अलग होता है. साथ ही, यह समय भी रैंडम होता है.

हर युग के बाद, Topics API उपयोगकर्ता के सबसे ज़्यादा ब्राउज़ किए गए पांच विषयों का हिसाब लगाता है. साथ ही, यह भी तय करता है कि किन कॉलर ने डिवाइस पर मौजूद जानकारी का इस्तेमाल करके उन विषयों को देखा. हर epoch का विषय, उस समयावधि में उपयोगकर्ता के सबसे ज़्यादा ब्राउज़ किए गए पांच विषयों में से चुना जाता है. यह किसी भी क्रम में हो सकता है. निजता को और बेहतर बनाने और यह पक्का करने के लिए कि सभी विषयों को दिखाया जा सके, दिलचस्पी के टैक्सोनॉमी में मौजूद सभी संभावित विषयों में से किसी एक विषय को रैंडम तौर पर चुने जाने की 5% संभावना होती है.

वेब पर विषयों को लागू करने के तरीके

वेब पर, विषयों का अनुमान उन पेजों के होस्टनेम से लगाया जाता है जिन्हें उपयोगकर्ता विज़िट करता है. उदाहरण के लिए, dogs.example वेबसाइट के लिए अनुमानित विषय /Pets & Animals/Pets/Dogs हो सकता है.

यहां दिए गए डायग्राम में, एक आसान उदाहरण दिखाया गया है. इससे पता चलता है कि Topics API, विज्ञापन टेक्नोलॉजी प्लैटफ़ॉर्म को सही विज्ञापन चुनने में कैसे मदद कर सकता है. इस उदाहरण में यह माना गया है कि उपयोगकर्ता के ब्राउज़र में, वेबसाइट के होस्टनेम को विषयों से मैप करने के लिए पहले से ही कोई मॉडल मौजूद है.

इस डायग्राम में, Topics API के लाइफ़साइकल के चरणों को दिखाया गया है. इसमें, उपयोगकर्ता के वेबसाइटों पर जाने से लेकर विज्ञापन दिखाए जाने तक की प्रोसेस शामिल है.
Topics API के लाइफ़साइकल डायग्राम में, एपीआई कार्रवाइयों के चरणों के बारे में खास जानकारी दी गई है.

ब्राउज़र, Topics API को कॉल करने वाले कोड के कॉन्टेक्स्ट से, कॉलर के ऑरिजिन का पता लगाता है. इसका मतलब है कि Topics का इस्तेमाल करने वाले लोग, अपने ऑरिजिन से iframe में एपीआई को कॉल करते हैं या वे अपने ऑरिजिन में फ़ेच में विषयों को शामिल करते हैं.

उदाहरण के लिए, सप्लाई-साइड प्लैटफ़ॉर्म (एसएसपी) को कई पब्लिशर की साइटों पर एम्बेड किया जा सकता है. इसके बाद, एसएसपी अपने शुरुआत की जगह से iframe में Topics API को कॉल कर सकता है. इससे, वह पब्लिशर की साइटों पर उपयोगकर्ता से जुड़े विषयों को देख सकता है. इसके बाद, इन विषयों को मांग पक्ष के प्लैटफ़ॉर्म (डीएसपी) के साथ शेयर किया जा सकता है, ताकि वह उपयोगकर्ता के लिए काम का विज्ञापन चुन सके.

एपीआई यह कैसे तय करता है कि कॉल करने वाले लोगों को कौनसे विषय दिखें

API कॉलर को सिर्फ़ वे विषय मिलते हैं जिन्हें उन्होंने हाल ही में देखा है. साथ ही, किसी उपयोगकर्ता के लिए विषयों को हर युग में एक बार रीफ़्रेश किया जाता है. युग, समय की एक अवधि होती है. Chrome में इसे एक हफ़्ते के लिए सेट किया जाता है. इसका मतलब है कि एपीआई, रोलिंग विंडो उपलब्ध कराता है. इसमें, कॉल करने वाले व्यक्ति या कंपनी को निगरानी में रखे गए विषय मिल सकते हैं.

यहां दी गई टेबल में, एक उपयोगकर्ता के ब्राउज़िंग इतिहास का उदाहरण दिया गया है. हालांकि, यह एक ही ईपॉक के दौरान का है और इसमें बहुत कम जानकारी शामिल है. इसमें, उपयोगकर्ता की विज़िट की गई साइटों से जुड़े विषय और हर साइट पर मौजूद एपीआई कॉलर दिखाए गए हैं. एपीआई कॉलर, ऐसी इकाइयां होती हैं जो साइट पर शामिल JavaScript कोड में document.browsingTopics() को कॉल करती हैं.

साइट विषय साइट पर एपीआई कॉल करने वाले लोग
running.example Running & Walking
Athletic Shoes
adtech1.example
adtech2.example
dogs.example Dogs adtech1.example
holiday.example Hotels & Accommodations adtech2.example
sunglasses.example Sunglasses [none]

इपोक के आखिर में (डिफ़ॉल्ट रूप से एक हफ़्ता), Topics API, ब्राउज़र के लिए हफ़्ते के सबसे लोकप्रिय विषयों को जनरेट करता है.

  • adtech1.example अब Running & Walking, Athletic Shoes, और Dogs विषयों को पाने की ज़रूरी शर्तें पूरी करता है. ऐसा इसलिए, क्योंकि उसने running.example और dogs.example पर इन विषयों को मॉनिटर किया था.
  • adtech1.example, इस उपयोगकर्ता के लिए Hotels & Accommodations विषय पाने की ज़रूरी शर्तें पूरी नहीं करता. ऐसा इसलिए है, क्योंकि यह उन साइटों पर मौजूद नहीं है जिन पर उपयोगकर्ता ने हाल ही में विज़िट किया है और जो उस विषय से जुड़ी हैं.
  • adtech2.example ने Running & Walking, Athletic Shoes, और Hotels & Accommodations विषयों को देखा है, लेकिन Dogs विषय को नहीं देखा है.

उपयोगकर्ता ने sunglasses.example साइट पर विज़िट किया. इस साइट पर Sunglasses विषय है, लेकिन इस साइट पर Topics API को कोई कॉल नहीं किया गया. इस समय, इसका मतलब है कि एपीआई, किसी भी कॉलर के लिए Sunglasses विषय को वापस नहीं भेजेगा.

दूसरे हफ़्ते में, उपयोगकर्ता किसी दूसरी साइट पर जाता है:

साइट विषय साइट पर एपीआई कॉल करने वाले लोग
cameras.example Camera & Photo Equipment adtech2.example

इसके अलावा, adtech2.example का कोड sunglasses.example में जोड़ा जाता है:

साइट विषय साइट पर एपीआई कॉल करने वाले लोग
sunglasses.example Sunglasses adtech2.example

पहले हफ़्ते से Running & Walking, Athletic Shoes, और Hotels & Accommodations के साथ-साथ, इसका मतलब यह भी है कि adtech2.example अब Camera & Photo Equipment और Sunglasses विषयों को पा सकेगा. हालांकि, ऐसा अगले ईपॉक यानी तीसरे हफ़्ते तक नहीं होगा. इससे यह पक्का होता है कि तीसरे पक्ष, किसी उपयोगकर्ता के बारे में कुकी से ज़्यादा जानकारी इकट्ठा नहीं कर सकते. इस मामले में, फ़ैशन में दिलचस्पी रखने वाले उपयोगकर्ता की जानकारी.

दो हफ़्ते बाद, Running & Walking, Athletic Shoes, और Hotels & Accommodations को adtech2.example की उन विषयों की सूची से हटाया जा सकता है जिनके लिए उपयोगकर्ता की दिलचस्पी के हिसाब से विज्ञापन दिखाए जा सकते हैं. ऐसा तब होगा, जब उपयोगकर्ता उन विषयों से जुड़ी किसी भी ऐसी साइट पर नहीं जाता है जिसमें adtech2.example का कोड शामिल हो.

जब उपयोगकर्ता ऐसी साइटों पर जाते हैं जो Topics API का इस्तेमाल करती हैं, तब यह एपीआई क्या-क्या करता है.
एपीआई, विषयों को कैसे देखता है और उन्हें कैसे ऐक्सेस करता है.

क्लासिफ़ायर मॉडल

Topics API, क्लासिफ़ायर मॉडल का इस्तेमाल करता है. यह मॉडल, वेबसाइट के होस्टनेम को शून्य या उससे ज़्यादा विषयों से मैप करता है. पूरी जानकारी का विश्लेषण करने से ज़्यादा काम के विज्ञापन दिखाए जा सकते हैं. जैसे, पूरे यूआरएल या पेज का कॉन्टेंट. हालांकि, इससे निजता कम हो सकती है.

टैक्सनॉमी

विषय, टैक्सोनॉमी से चुने जाते हैं. इन विषयों को Chrome ने चुना है, ताकि टैक्सोनॉमी को भरोसेमंद नेटवर्क के योगदान देने वाले लोग मैनेज कर सकें. टैक्सोनॉमी इतनी छोटी होनी चाहिए कि कई उपयोगकर्ताओं के ब्राउज़र, हर विषय से जुड़े हों. हमारा लक्ष्य यह है कि टैक्सोनॉमी, किसी बाहरी पार्टी से उपलब्ध कराई जाए. इस पार्टी में, पूरे इंडस्ट्री के सुझाव और राय शामिल होनी चाहिए.

संवेदनशील कैटगरी से बचने के लिए, विषयों को सार्वजनिक होना चाहिए. साथ ही, उन्हें मैन्युअल तरीके से चुना जाना चाहिए और अप-टू-डेट रहना चाहिए. Chrome में इस्तेमाल की गई टैक्सोनॉमी को, किसी व्यक्ति ने बनाया है. इसमें ऐसी कैटगरी शामिल नहीं हैं जिन्हें आम तौर पर संवेदनशील माना जाता है. जैसे, जातीयता या यौन रुझान.

विषयों के हिसाब से कैटगरी तय करना

50,000 सबसे लोकप्रिय साइटों के लिए विषयों को मैन्युअल तरीके से चुना जाता है. होस्टनेम और विषयों की इस चुनी गई सूची का इस्तेमाल, क्लासिफ़ायर मॉडल को ट्रेन करने के लिए किया जाता है. सबसे ज़्यादा ट्रैफ़िक वाली साइटों के लिए, विषयों को क्लासिफ़ायर मॉडल का इस्तेमाल करके ऐक्सेस करने के बजाय, ओवरराइड सूची से ऐक्सेस किया जाता है. अपने कंप्यूटर पर, बदलावों की सूची देखी जा सकती है.

chrome://topics-internals पेज की इमेज. इसमें क्लासिफ़ायर पैनल को चुना गया है.
chrome://topics-internals पेज के क्लासिफ़ायर पैनल में, मॉडल का वर्शन, उसका पाथ, और लिस्ट किए गए हर होस्ट से जुड़े विषयों की जानकारी होती है.

Chrome में Topics API को लागू करने के लिए, मॉडल को दिखाने वाली TensorFlow Lite फ़ाइल डाउनलोड की जाती है. इससे, उपयोगकर्ता के डिवाइस पर इसका इस्तेमाल किया जा सकता है.

उपयोगकर्ता के सबसे ज़्यादा ब्राउज़ किए गए पांच विषयों को कैसे चुना जाता है

एपीआई, हर ईपॉक के लिए एक विषय दिखाता है. हालांकि, ज़्यादा से ज़्यादा तीन विषय दिखाए जाते हैं. अगर तीन विषय दिखाए जाते हैं, तो इनमें मौजूदा और पिछले दो युगों के विषय शामिल होते हैं.

  1. हर ईपॉक के आखिर में, ब्राउज़र उन पेजों की सूची बनाता है जो इन शर्तों को पूरा करते हैं:
    • उपयोगकर्ता ने इस पेज को इपोक के दौरान देखा था.
    • इस पेज में ऐसा कोड शामिल है जो document.browsingTopics() को कॉल करता है.
    • एपीआई चालू किया गया हो. उदाहरण के लिए, उपयोगकर्ता या जवाब के हेडर ने इसे ब्लॉक न किया हो.
  2. उपयोगकर्ता के डिवाइस पर मौजूद ब्राउज़र, Topics API से मिले क्लासिफ़ायर मॉडल का इस्तेमाल करता है. इससे, हर पेज के होस्टनेम को विषयों की सूची से मैप किया जाता है.
  3. ब्राउज़र, पांच सबसे अहम विषयों की सूची जनरेट करता है.

    • विज्ञापन के इकोसिस्टम से मिले सुझाव, राय या शिकायत के आधार पर, टैक्सोनॉमी में मौजूद 22 रूट विषयों में से हर एक को "ज़्यादा काम का" या "सामान्य काम का" बकेट में असाइन किया जाता है. ब्राउज़र, सबसे पहले विषयों को उनके बकेट असाइनमेंट के हिसाब से क्रम में लगाता है. सभी डिसेंडेंट टॉपिक, अपने पैरंट रूट टॉपिक के बकेट असाइनमेंट को इनहेरिट करते हैं. "ज़्यादा काम के" विषयों को प्राथमिकता दी जाती है.
    • इसके बाद, ब्राउज़र हर बकेट में मौजूद विषयों को फ़्रीक्वेंसी के हिसाब से क्रम में लगाता है.
    • इस क्रम से लगाई गई सूची में से, सबसे ऊपर के पांच विषयों को उस epoch के लिए उपयोगकर्ता के सबसे ज़्यादा खोजे गए विषयों के तौर पर चुना जाता है.

इसके बाद, document.browsingTopics() तरीके से हर epoch के लिए, सबसे ज़्यादा ब्राउज़ किए गए पांच विषयों में से कोई विषय चुना जाता है. हालांकि, 5% संभावना यह भी होती है कि कोई विषय, विषयों की पूरी टैक्सोनॉमी से चुना जाए. Chrome में, उपयोगकर्ता एक-एक करके विषयों को हटा सकते हैं. इसके अलावा, वे अपना ब्राउज़िंग इतिहास मिटा सकते हैं, ताकि एपीआई से कम विषय दिखाए जाएं. उपयोगकर्ता, एपीआई से ऑप्ट आउट भी कर सकते हैं.

मौजूदा समय में देखे गए विषयों के बारे में जानकारी, chrome://topics-internals पेज पर देखी जा सकती है.

आगे क्या करना होगा

Topics API की मदद से वेब ऐप्लिकेशन को टेस्ट करने और डेवलप करने के लिए, अपना एनवायरमेंट तैयार करें.
लागू करने की जानकारी और कोड के सैंपल देखें, ताकि कॉल करने वाले लोग विषयों को देख और ऐक्सेस कर सकें.

इन्हें भी देखें

वेब पर Topics API को बेहतर तरीके से समझने के लिए, हमारे संसाधन देखें.