BERT (acronyme de « Bidirectional Encoder Representations from Transformers ») est le surnom donné par Google à un changement majeur dans la manière dont fonctionne son moteur de recherche.
Avec cette mise à jour, l’entreprise américaine souhaite répondre plus efficacement aux requêtes des internautes, en tenant compte des mots-clés utilisés et surtout de la manière dont ils sont agencés les uns aux autres.
TIC : voici comment disparaître d’Internet à 99,99% en 10 étapes
Fondamentalement, BERT doit permettre de comprendre le « sens » d’une requête et, donc, la signification des mots qui sont utilisés dans un contexte précis.
En somme, il ne s’agit plus de prendre les termes isolément, mais de les comprendre selon leur voisinage. Or, cela nécessite de tenir compte de certains éléments d’une requête qui étaient jusqu’à présent délaissés, parce que jugés secondaires.
Pandu Nayak, le vice-président de la recherche au sein de Google, donne un exemple assez clair du changement que BERT induit : auparavant, dans une requête demandant à Google s’il est possible d’aller récupérer un médicament à la pharmacie pour un tiers, le moteur de recherche se focalisait sur « récupérer », « médicament » et « pharmacie ». Il ne tenait pas compte d’un passage pourtant clé : « autrui ».
Désormais, BERT est capable de comprendre que le retrait d’un traitement n’est pas pour vous, mais de toute évidence pour un proche. Par conséquent, le résultat qui sera mis en avant sera une page du ministère américain de la Santé et des Services sociaux, qui répond justement à cette interrogation. Et cela, même si elle peut être très ancienne : en l’espèce, Google a montré que cela a fait remonter une page de 2002.
Si BERT va indéniablement améliorer l’expérience des recherches web, Google admet que son outil n’est pas forcément utile dans toutes les circonstances. Pandu Nayak donne le cas par exemple d’une recherche sur « tartan » qui est, rappelle Wikipédia, une étoffe de laine à carreaux de couleurs, typique des peuples celtes. Avec BERT, les résultats étaient plutôt textuels, alors qu’un support visuel peut être plus utile.
Lambassade-des-Etats-Unis-au-Nigeria-fermee-pour-une-duree-indeterminee-a-cause-du-shutdown
BERT est d’ores et déjà actif sur les requêtes passées en anglais, depuis octobre 2019. Concernant les autres langues, Google a commencé le lundi 9 décembre à déployer la mise à jour. Pandu Nayak indique que le déploiement nécessite quelques jours. Plus de 70 langues seront concernées par BERT, dont le français, le russe, l’italien, le japonais, l’espagnol, le coréen, l’allemand ou encore le portugais.