API Topics pour le Web

L'API Topics permet de diffuser des annonces ciblées par centres d'intérêt sans utiliser de cookies tiers.

Fonctionnement de l'API Topics

L'API Topics permet d'observer et d'accéder aux thèmes qui semblent intéresser l'utilisateur en fonction de son activité. L'API Topics peut ensuite donner aux appelants de l'API (comme les plates-formes de technologie publicitaire) l'accès aux centres d'intérêt d'un utilisateur, mais sans révéler d'informations supplémentaires sur son activité.

Concepts clés

  • Un thème est un sujet d'intérêt compréhensible pour l'utilisateur actuel. Il fait partie de la taxonomie Topics.
  • Un appelant est une entité, telle qu'une application, un SDK tiers, un site Web ou un service, qui envoie une requête à l'API Topics pour observer ou accéder aux centres d'intérêt d'un utilisateur.
  • Un thème est observé par un appelant s'il a effectué une requête API Topics à partir d'une page Web ou d'une application associée à ce thème au cours des trois dernières "epochs".
  • Une epoch est une période de calcul thématique, qui est par défaut d'une semaine.
  • Une taxonomie est une liste hiérarchisée de catégories, qui inclut, par exemple, les catégories /Arts & Entertainment/Music & Audio/Soul & R&B et /Business & Industrial/Business Services/Corporate Events.
  • Les thèmes sont dérivés à l'aide d'un modèle de classificateur qui met en correspondance l'activité des utilisateurs avec zéro ou plusieurs thèmes.

Étapes principales du flux de l'API Topics

Le cycle de vie de l'API Topics comporte trois étapes principales:

  • Observer l'activité des utilisateurs, par exemple lorsqu'ils accèdent à la page Web https://cats.example/tabby/index.html ou téléchargent l'application cats
  • Déduire des thèmes à partir de l'activité des utilisateurs, par exemple /Pets & Animals/Pets/Cats.
  • Thèmes d'accès précédemment observés pour l'utilisateur, par exemple pour sélectionner des annonces pertinentes (comme une promotion de nourriture pour chats).

Observer des sujets

Les appelants ne peuvent accéder qu'aux sujets d'intérêt qu'ils ont observés. Un appelant observe un thème lorsqu'il envoie une requête API Topics à partir d'un contexte associé à ce thème. Pour illustrer ce concept, prenons l'exemple simplifié suivant.

  • Supposons qu'il existe deux appelants de l'API Topics: A et B.
  • Il existe deux contextes :
    • Greenhouse, par exemple une application nommée Greenhouse ou un site Web greenhouse.example, associé au thème Home & Garden.
    • Exercices de tennis, par exemple une application nommée "Exercices de tennis" ou un site Web tennis.example, associé au sujet Sports/Tennis.
  • Les appelants A et B sont tous deux présents dans le contexte de Greenhouse.
  • Seul l'appelant B est présent dans le contexte des exercices de tennis.
  • Par souci de simplicité, supposons qu'aucun sujet n'a été observé pour l'utilisateur avant l'époché 1.
  • L'utilisateur accède à l'application Greenhouse, et les appelants A et B effectuent un appel d'API Topics pour enregistrer la visite de l'utilisateur sur la page ou l'application (consultez le guide d'implémentation suggéré dans la section Étapes suivantes pour savoir comment appeler l'API Topics). Cet enregistrement (un nom d'hôte ou des données d'application) est ensuite utilisé pour déduire les centres d'intérêt. L'API Topics marquera ensuite le thème Home & Garden comme observé par les deux appelants A et B.
  • L'utilisateur accède à l'application Exercices de tennis. Seul l'appelant B envoie une requête API Topics. L'API Topics marquera ultérieurement le thème Sports/Tennis comme observé par l'appelant B.
  • À la fin de l'epoch, l'API Topics actualise les principaux thèmes de l'utilisateur et détermine les appelants qui ont observé ces thèmes en fonction de l'activité de l'utilisateur.
  • Plus tard, lorsque l'appelant B effectue un autre appel à l'API Topics, il peut obtenir le thème Home & Garden ou Sports/Tennis (ou, avec une probabilité de 5 %, un thème aléatoire) pour cet utilisateur dans le tableau de réponse.
  • L'appelant A ne peut accéder qu'au thème Home & Garden, car il n'a jamais observé le thème Sports/Tennis. Cela signifie qu'un tiers ne connaîtra le sujet d'intérêt d'un utilisateur que dans le contexte spécifique (application ou site Web) où il est présent.
Schéma montrant que l'API Topics ne marque les thèmes comme observés que si les appelants sont présents dans le contexte.
L'API Topics ne marque les sujets observés que par les appelants qui sont présents dans le contexte de ces sujets. Les appelants ne pourront accéder qu'aux thèmes qu'ils ont observés.

Dégager des thèmes

Topics déduit les centres d'intérêt des utilisateurs à partir de leur activité. Les thèmes sont sélectionnés à partir d'une taxonomie Open Source prédéfinie. Une fois par epoch, Topics actualise les cinq principaux thèmes de l'utilisateur et les appelants qui les ont observés au cours de l'epoch. Le modèle de classificateur de thèmes dérive les thèmes de l'activité des utilisateurs: nom d'hôte pour une visite de page Web, informations sur l'application sur Android.

L'appelant accède aux centres d'intérêt de l'utilisateur

L'API ne renvoie que les thèmes observés par l'appelant au cours des trois dernières époques. Un appelant peut recevoir jusqu'à trois thèmes,un pour chacune des trois epochs récentes (si l'appelant a observé des thèmes pour cette époque). L'appelant peut utiliser les thèmes renvoyés pour compléter les informations contextuelles et les combiner pour trouver une annonce plus pertinente pour l'utilisateur.

Époques

L'API Topics doit s'assurer que les thèmes d'intérêt qu'elle fournit sont à jour. Les thèmes sont inférés pour un utilisateur en fonction de son activité au cours d'une période appelée "epoch", une semaine par défaut. Chaque utilisateur a ses propres époques (elles sont "par utilisateur") et l'heure de début initiale est aléatoire.

Une fois par epoch, l'API Topics calcule les cinq principaux thèmes de l'utilisateur et détermine les appelants qui ont observé ces thèmes à l'aide d'informations sur l'appareil. Le thème sélectionné pour chaque époque est choisi au hasard parmi les cinq thèmes principaux associés à l'utilisateur pour cette période. Pour renforcer la confidentialité et s'assurer que tous les thèmes peuvent être représentés, il y a 5% de chances que le thème soit sélectionné de manière aléatoire parmi tous les thèmes possibles de la taxonomie des centres d'intérêt.

Les thèmes sur le Web en pratique

Sur le Web, les thèmes sont déduits des noms d'hôte des pages que l'utilisateur consulte. Par exemple, le thème déduit pour le site Web chiens.example peut être /Animaux et animaux de compagnie/Animaux de compagnie/Chiens.

Le schéma suivant présente un exemple simplifié pour montrer comment l'API Topics peut aider une plate-forme de technologie publicitaire à sélectionner une annonce appropriée. L'exemple suppose que le navigateur de l'utilisateur dispose déjà d'un modèle permettant de mapper les noms d'hôte de sites Web à des thèmes.

Schéma montrant les étapes du cycle de vie de l'API Topics, de la visite d'un utilisateur sur des sites Web à l'affichage d'une annonce.
Le diagramme du cycle de vie de l'API Topics présente les étapes des actions de l'API d'un point de vue général.

Le navigateur détermine l'origine de l'appelant à partir du contexte du code qui appelle l'API Topics. En pratique, cela signifie que les utilisateurs de Topics appellent l'API dans un iFrame à partir de leur origine ou qu'ils incluent des thèmes dans une récupération vers leur origine.

Par exemple, une plate-forme côté offre (SSP) peut être intégrée aux sites de plusieurs éditeurs. Le SSP peut ensuite appeler l'API Topics dans un iFrame à partir de son origine, ce qui lui permet d'observer les thèmes associés à un utilisateur sur les sites de ces éditeurs. Ces thèmes peuvent ensuite être partagés avec une plate-forme côté demande (DSP) pour l'aider à sélectionner une annonce pertinente pour l'utilisateur.

Comment l'API décide quels appelants voient quels sujets

Les appelants d'API ne reçoivent que les thèmes qu'ils ont observés récemment. Les thèmes d'un utilisateur sont actualisés une fois par epoch, c'est-à-dire une période définie sur une semaine dans l'implémentation de Chrome. Cela signifie que l'API fournit une fenêtre glissante dans laquelle un appelant donné peut recevoir des thèmes observés.

Le tableau suivant présente un exemple (bien que très petit) d'historique de navigation hypothétique pour un utilisateur au cours d'une seule époque. Il indique les thèmes associés aux sites qu'il a consultés et les appelants d'API présents sur chaque site (les entités qui appellent document.browsingTopics() dans le code JavaScript inclus sur le site).

Site Thèmes Appelants d'API sur le site
running.example Running & Walking
Athletic Shoes
adtech1.example
adtech2.example
dogs.example Dogs adtech1.example
holiday.example Hotels & Accommodations adtech2.example
sunglasses.example Sunglasses [aucune]

À la fin de l'epoch (une semaine par défaut), l'API Topics génère les principaux thèmes du navigateur pour la semaine.

  • adtech1.example peut désormais recevoir les thèmes Running & Walking, Athletic Shoes et Dogs, car il les a observés sur running.example et dogs.example.
  • adtech1.example n'est pas éligible pour recevoir le thème Hotels & Accommodations pour cet utilisateur, car il n'est présent sur aucun des sites que l'utilisateur a consultés récemment et qui sont associés à ce thème.
  • adtech2.example a vu les thèmes Running & Walking, Athletic Shoes et Hotels & Accommodations, mais pas le thème Dogs.

L'utilisateur a visité sunglasses.example, qui comporte le thème Sunglasses, mais il n'y a eu aucun appel à l'API Topics sur ce site. À ce stade, cela signifie que l'API ne renverra pas le thème Sunglasses pour aucun appelant.

Au cours de la deuxième semaine, l'utilisateur consulte un autre site :

Site Thèmes Appelants d'API sur le site
cameras.example Camera & Photo Equipment adtech2.example

De plus, le code d'adtech2.example est ajouté à sunglasses.example :

Site Thèmes Appelants d'API sur le site
sunglasses.example Sunglasses adtech2.example

En plus de Running & Walking, Athletic Shoes et Hotels & Accommodations de la semaine 1, cela signifie qu'adtech2.example pourra désormais recevoir les thèmes Camera & Photo Equipment et Sunglasses, mais pas avant l'époque suivante, soit la semaine 3. Cela permet de s'assurer que les tiers ne peuvent pas en apprendre plus sur le passé d'un utilisateur (dans ce cas, son intérêt pour la mode) qu'ils ne le pourraient avec les cookies.

Au bout de deux semaines supplémentaires, Running & Walking, Athletic Shoes et Hotels & Accommodations peuvent être supprimés de la liste des thèmes éligibles d'adtech2.example si l'utilisateur ne consulte aucun site incluant du code provenant d'adtech2.example et traitant de ces thèmes.

Étapes suivies par l'API Topics lorsque les utilisateurs visitent des sites qui l'utilisent
Comment l'API observe les thèmes et y accède

Modèle de classification

Topics utilise un modèle de classification qui mappe les noms d'hôte des sites Web à zéro ou plusieurs thèmes (l'analyse d'informations supplémentaires, telles que les URL complètes ou le contenu des pages, peut permettre d'afficher des annonces plus pertinentes, mais peut également réduire la confidentialité).

Taxonomie

Les thèmes sont sélectionnés à partir d'une taxonomie. Ces thèmes ont été sélectionnés par Chrome dans le but de faire de la taxonomie une ressource gérée par des contributeurs fiables de l'écosystème. La taxonomie doit être suffisamment petite pour que les navigateurs de nombreux utilisateurs soient associés à chaque thème. L'objectif final est que la taxonomie provienne d'un tiers externe qui intègre les commentaires et les idées de l'ensemble du secteur.

Pour éviter les catégories sensibles, les thèmes doivent être publics, sélectionnés par l'humain et rester à jour. La taxonomie utilisée par Chrome a été sélectionnée manuellement pour exclure les catégories généralement considérées comme sensibles, telles que l'origine ethnique ou l'orientation sexuelle.

Classification des thèmes

Les thèmes sont sélectionnés manuellement pour les 50 000 principaux sites. Cette liste de remplacement de noms d'hôte et de thèmes est utilisée pour entraîner le modèle de classification. Pour les principaux sites, les thèmes sont accessibles à partir de la liste de remplacement plutôt qu'à l'aide du modèle de classification. Vous pouvez afficher la liste des remplacements en local sur votre ordinateur.

Page chrome://topics-internals avec le panneau "Classifier" sélectionné.
Le panneau "Classificateur" de la page chrome://topics-internals liste la version du modèle, son chemin d'accès et les thèmes associés à chaque hôte listé.

L'implémentation de l'API Topics par Chrome télécharge un fichier TensorFlow Lite représentant le modèle afin qu'il puisse être utilisé localement sur l'appareil de l'utilisateur.

Comment les cinq principaux thèmes de l'utilisateur sont-ils sélectionnés ?

L'API renvoie un thème pour chaque epoch, jusqu'à un maximum de trois. Si trois sont renvoyés, cela inclut les thèmes de l'époque actuelle et des deux précédentes.

  1. À la fin de chaque époque, le navigateur compile une liste de pages qui répondent aux critères suivants :
    • L'utilisateur a consulté la page au cours de l'époque.
    • La page inclut du code qui appelle document.browsingTopics().
    • L'API a été activée (par exemple, elle n'a pas été bloquée par l'utilisateur ni par un en-tête de réponse).
  2. Le navigateur, sur l'appareil de l'utilisateur, utilise le modèle de classification fourni par l'API Topics pour mapper le nom d'hôte de chaque page à une liste de thèmes.
  3. Le navigateur génère une liste des cinq principaux thèmes.

    • Chacun des 22 thèmes racines de la taxonomie est attribué à un bucket "utilité élevée" ou "utilité standard" en fonction des commentaires de l'écosystème publicitaire. Le navigateur trie d'abord les thèmes en fonction de leur attribution de bucket. Tous les sujets descendants héritent de l'attribution de bucket de leur sujet racine parent. Les thèmes à "forte utilité" sont prioritaires.
    • Le navigateur trie ensuite les thèmes par fréquence dans chaque catégorie.
    • Les cinq premiers thèmes de cette liste triée sont sélectionnés comme thèmes principaux de l'utilisateur pour cette epoch.

La méthode document.browsingTopics() renvoie ensuite un thème aléatoire parmi les cinq premiers pour chaque epoch, avec une probabilité de 5 % que l'un d'entre eux soit choisi au hasard dans la taxonomie complète des thèmes. Dans Chrome, les utilisateurs peuvent également supprimer des thèmes spécifiques ou effacer leur historique de navigation pour réduire le nombre de thèmes renvoyés par l'API. Les utilisateurs peuvent également désactiver l'API.

Vous pouvez afficher des informations sur les thèmes observés au cours de l'époque actuelle sur la page chrome://topics-internals.

Étapes suivantes

Préparez votre environnement à tester et à développer des applications Web avec l'API Topics.
Découvrez les détails de l'implémentation et des exemples de code permettant aux appelants d'observer et d'accéder aux sujets.

Voir aussi

Consultez nos ressources pour mieux comprendre l'API Topics sur le Web.