mardi 30 juin 2020

Entités classées dans les résultats de recherche sur Google

Lorsque quelqu'un qui effectue une recherche entre une requête dans un moteur de recherche, comme "les 10 meilleurs films de 2020", le moteur de recherche peut renvoyer des résultats montrant des liens vers plusieurs pages Web pertinentes pour la requête de recherche.

Cela peut montrent également des résultats qui pointent vers plusieurs pages Web qui incluent des listes des meilleurs films de 2020.

Un brevet accordé à Google concerne des listes d'entités classées dans les résultats de recherche qui sont basées sur les documents retournés en réponse à des questions sur des catégories spécifiques d'entités.

Il peut s'agir des meilleurs films de 2020 ou des meilleurs romans de 2020.

Il pourrait s'agir des meilleurs livres de science-fiction de 2020 ou du meilleur drame Série télévisée de 2020.

J'ai recherché différents types d'entités qui ont abouti à des carrousels montrant des entités classées pour mes requêtes:

 entités classées - meilleurs films 2020  " meilleurs films de 2020 "
 Entités classées - Meilleurs romans 2020vels  " meilleurs romans de 2020 "
 Entité classée - Meilleurs livres de science-fiction 2020  " meilleurs livres de science-fiction 2020 "
 Entités classées - Best Drama TV Series 2020  "meilleure série télévisée dramatique 2020"

Le processus derrière l'affichage des listes classées d'entités

La méthode du brevet comprend:

  • Envoi d'une requête.
  • Réception d'informations concernant les documents pertinents pour la requête.
  • Identification des entités associées aux documents.
  • Déterminer une catégorie pour la requête en fonction de la requête ou d'un sujet de documents retournés et des entités dans ces documents.
  • Determin indiquant qu'une liste d'entités doit être présentée en réponse à la requête.
  • Présentation des SERPs basée sur la détermination que la liste d'entités doit être présentée en réponse à la requête.

Comment les catégories d'entités dans les listes classées sont déterminées

Les SERP peuvent inclure une liste avec des informations identifiant les entités.

La détermination de la catégorie peut inclure la génération d'un score basé sur:

  • Si la requête comprend des termes associés à la catégorie, où la détermination de la catégorie peut être basée sur le score généré.
  • Au moins certains des documents sont associés à un sujet associé à la catégorie , où la détermination de la catégorie peut être basée sur le score généré.
  • Au moins certaines des entités, associées à la catégorie, où la détermination de la catégorie peut être basée sur le score généré.
  • La question de savoir si la requête comprend des termes figurant sur la liste noire, où la détermination que la liste d'entités doit être présentée en réponse à la requête peut être la based sur le score généré.

Classement des entités dans ces listes

Le processus derrière le classement des entités peut inclure:

  • Où le le document de résultat de recherche peut inclure des informations sur les entités dans un ordre basé sur le classement
  • Génération d'un score pour chacune des entités, où les scores sont basés sur la pertinence de l'entité particulière pour un document particulier.

Le processus à l'origine de ce brevet implique:

  • la réception d'une requête.
  • la réception d'informations concernant les documents pertinents pour la requête.
  • Identification des entités associées aux documents.
  • Détermination d'une catégorie pour la requête sur la base de la requête, d'un sujet des documents et des entités.
  • Détermination, basée sur la requête et la catégorie, qu'une liste d'entités doit être présentée en réponse à la requête.
  • Présentation d'un résultat de recherche basé sur la détermination que la liste d'entités doit être présentée en réponse à la requête.

Le résultat de la recherche le document peut inclure une liste avec des informations identifiant les entités.

Le document de résultat de recherche peut en outre inclure des liens vers les documents qui sont pertinents pour la requête.

Ce brevet peut être trouvé à:

Génération listes d'entités
Inventeurs: Toshiaki Fujiki, Slaven Bilac, Kavi J. Goel, Shuhei Takahashi, Tomohiko Kimura
Assigné: Google LLC
Brevet américain: 10 691 702
délivré le 23 juin 2020
Déposé le 31 août 2017

Résumé

«Un appareil peut être configuré pour recevoir une requête; recevoir des informations concernant les documents pertinents pour la requête; identifier les entités associées aux documents; déterminer une catégoriepour la requête basée sur la requête, un sujet des documents et les entités; déterminer, sur la base de la requête et de la catégorie, qu'une liste d'entités doit être présentée en réponse à la requête; et présenter un document de résultat de recherche basé sur la détermination que la liste d'entités doit être présentée en réponse à la requête. Le document de résultat de la recherche peut inclure une liste avec des informations identifiant les entités. et d'autres documents:

  • Un document peut inclure du texte, des images, etc., concernant des entités.
  • Une entité peut être extraite et / ou identifiée à partir d'un document en comparant le texte, les images, etc., vers un référentiel contenant des informations sur les entités.
  • Par exemple, une entité peut être associée au film "Toy Story 3".
  • Une autre entité peut être associée à la chanson "Party Rock Anthem".
  • Une autre entité peut être associée au livre "Hitchhiker's Guide to the Galaxy".
  • Les entités peuvent ensuite être classées. Par exemple, les catégories d'entités peuvent inclure des «films», des «chansons» ou des «livres».

Le référentiel mentionné dans ce brevet est probablement le graphe de connaissances de Google.

J'ai recherché "Best Planet of the Apes Movies", et si vous survolez l'un d'eux, vous voyez plus d'informations sur chacun des films:

 Planète des singes Films

Le brevet nous dit qu'ils peuvent afficher des informations supplémentaires sur les attributs des entités classées qu'ils retournent:

“Par exemple, l'interface utilisateur 145 peut inclure des images et des liens associés aux entités. De plus, ou altEn variante, l'interface utilisateur 145 peut également inclure d'autres informations associées à des entités, telles que des informations d'attribut - par exemple, la date de sortie, le crédit musical, le crédit producteur, la société de production ou similaire. Comme le montre la FIG. 1C, l'interface utilisateur 145 peut inclure, par exemple, le lien 110 et l'image 115 associés à Toy Story 3, ainsi que des liens et des images respectivement associés à Inception et au réseau social. "

Cette est de sorte que si vous êtes potentiellement intéressé à en savoir plus sur l'une des entités affichées dans une liste classée, vous pouvez en savoir suffisamment pour la regarder, la lire ou l'écouter.

Entité Extraction pour les classements

Les documents qui peuvent être retournés en réponse à une requête peuvent inclure des documents tels que "pages Web, articles de presse, résultats d'images, documents de blog, etc."

L'aspect d'identification des résultats de ce processus où les entités sont identifiées pourrait fournir des informations sur les attributs de ces entités.

Les entités peuvent être classées en fonction de facteurs pour déterminer les scores de ces entités.

One peut être si l'entité est extraite d'un document qui a un sujet moins pertinent:

"Par exemple, supposons qu'une première entité associée au film Toy Story 3 est extraite d'un document avec un sujet relatif au «football», tandis qu'une seconde entité associée au film Inception est extraite d'un document avec un sujet relatif au «cinéma». Le moteur de classement d'entité 230 peut déterminer que la première entité a une pertinence plus faible pour le résultat duquel la première entité a été extraite que la pertinence de la deuxième entité pour le résultat dont la deuxième entité a été extraite. "

Les termes d'un document dont une entité est extraite peuvent être examinés.

Un score IR (recherche d'informations) pour le document à partir duquel l'entité classée a été extraite peut être utilisé pour déterminer une entité score utilisé pour classer cette entité, en fonction de la pertinence de la page pour la requête.

Ainsi, une entité devant être classée pour les «meilleurs romans de science-fiction de 2020» à partir d'une page ayant un score IR élevé pour la requête, «meilleurs romans de science-fiction de 2020», aurait potentiellement un score d'entité plus élevé que une entité à partir d'une page qui a un score IR élevé pour «Certains romans OK Science Fiction de 2020».

Si une requête pour les entités classées peut inclure un attribut spécifique, tel que l'emplacement publié, et que la requête était quelque chose comme «les meilleurs romans de science-fiction américains de 2020», puis les entités classées peuvent être celles qui identifient le lieu de publication de cette entité.

La gamme d'attributs utilisés peut être assez large, comme décrit dans le brevet :

"Supposons, par exemple, que l'entité particulière soit associée à une catégorie" films ". Dans cet exemple, les attributs peuvent inclure des informations, telles que la date de sortie, le (s) acteur (s) et / ou actrice (s) principale (s), le (s) acteur (s) et / ou actrice (s) de soutien, le box-office brut, le crédit producteur exécutif, crédit musical, synopsis et / ou résumé associés au film, etc. Dans d'autres exemples, des entités associées à différentes catégories peuvent être associées à un ensemble d'attributs différent. Supposons en outre que l'entité particulière est associée à Toy Story 3, un film sorti en 2010 et que la requête inclut le terme «2010.» Ainsi, le moteur de classement d'entité 230 peut identifier que la requête est associée à un attribut de date de sortie associé à la entité particulière. "

Un autre facteur peut être si la requête contient des termes sur liste noire.

Il peut s'agir de termes pour adultes ou de termes offensants.

Un autre le facteur pourrait être si la requête est associée à des listes d'entités. Les listes d'entités incluent des expressions telles que:

  • "top"
  • "of 2020"
  • "Best"
  • "Best de "

Si la requête contient un tel terme, les entités des pages qui peuvent également être pertinentes pour celles-ci peuvent obtenir un score plus élevé dans une liste d'entités classées.

Lorsqu'un La requête inclut un déclencheur qui appelle une liste d'entités, il peut scomment un carrousel ou une liste d'entités.

S'il ne contient pas un tel déclencheur, il peut ne pas afficher une liste d'entités.

Résultats des entités classées

Ce brevet décrit un processus dans lequel vous pouvez facilement vous rattraper une fois que vous en avez connaissance.

Je me suis retrouvé à parcourir des requêtes telles que "Best Comedies 1975" et pendant des années à suivre.

Et "Best TV Shows 1980" et pendant des années après.

Best TV 1980 "meilleures émissions de télévision 1980"
 Meilleur téléviseur 1981  "meilleures émissions de télévision 1981"
Meilleur téléviseur 1982 " best TV shows 1982 "

Si vous effectuez ces recherches, vous verrez que les documents dont ces entités proviennent dans le reste des SERP sont pour eux des résultats "Top" ou "Best", et les des requêtes pour eux ont déclenché des listes de requêtes montrant ces carrousels.

Il existe d'autres listes d'entités classées, comme les lauréats du prix Pulitzer:

Pulitzer Award Winners 2019

Ou Meilleures plantes d'intérieur pour la qualité de l'air:

 Meilleures plantes d'intérieur pour la qualité de l'air

Explorer ces carrousels pour les entités classées était presque aussi amusant que de regarder les catégories basées sur l'ontologie sémantique dans la recherche d'images sur Google, que j'ai examinée dans les étiquettes de recherche d'images Google devenant plus sémantique?

Plus de ressources:

  • Que sont les entités et pourquoi elles sont importantes pour le référencement
  • Google Search 101: Fonctionnement du Knowledge Graph
  • New Patent Exp explique comment Google choisit les images pour les panneaux de connaissances

Crédits d'image

Toutes les captures d'écran prise par l'auteur, juin 2020

Aucun commentaire:

Enregistrer un commentaire