Pandu Nayak, le vice-président du moteur de recherche Google a avisé le 25 octobre 2019 concernant l’arrivée d’un nouvel algorithme très puissant nommé BERT. Il sert à mieux comprendre le langage naturel0 à base d’IA (machine learning) visant à mieux comprendre certains types de requêtes. La mise à jour de son algorithme est perçue comme la plus forte des cinq dernières années au vu de la société de Mountain View. Cet algorithme est déjà en place aux USA pour les demandes en anglais et sera étiré à l’avenir dans les autres pays et langues.
Qu’est-ce que BERT et quel est son usage ?
L’algorithme BERT signifie Bidirectional Encoder Representations from Transformers. Il a pour mission d’aider Google à référencer son site et à parfaire la compréhension des demandes afin de fournir des résultats plus fonctionnels notamment pour les requêtes formulées de manière naturelle.
BERT permet également à Google de mieux faire le référencement d’un site internet et de comprendre les contenus qu’il indexe. Il permet aussi à ce moteur de recherche d’avoir un aperçu de la « cohésion textuelle » et désambiguïser des phrases ou des expressions particulières lorsque des nuances polysémiques pourraient changer le sens littéral des mots.
Sa mission ne s’arrête pas là. Il aide Google à annoncer la phrase suivante, à améliorer la compréhension du langage naturel par le moteur de recherche afin d’offrir des résultats plus pertinents aux internautes.
Selon Google, il devrait avoir un impact non négligeable sur le référencement internet. Il permettra de déterminer les problèmes d’homonymie, mais aussi d’apporter des réponses à des questions directement dans les SERP. En général, cet algorithme permet à Google de s’adapter encore plus qu’avant à l’accroissement des recherches vocales ce qui ne se limite pas à celles faites avec des assistants.
Comment fonctionne l'algorithme BERT ?
On se basera sur un exemple très simple. Ex: “Can you get medicine for someone pharmacy”? Avant l’apparition de BERT, Google se serait concentré sur le terme « medicine ». Mais aujourd’hui, il est en mesure de percevoir le sens réel de l’expression « for someone » et donnera les résultats en conséquence. BERT permet au modèle de langage d’apprendre le contexte de mot basé sur les mots qui l’entourent plutôt que simplement le mot qui le précède ou le succède.
Que change le nouvel algorithme de Google ?
Comme toujours, le but de Google est de répondre, d’analyser et de comprendre au mieux une requête ou une question. La firme de Mountain View a porté à la connaissance des professionnels du référencement naturel qu’il est impossible d’optimiser un site web pour BERT.
Peut-on optimiser son site web pour la nouvelle mise à jour BERT ?
Retenez tout simplement qu’il n’est pas possible d’optimiser pour BERT. Toutefois, il est nécessaire d’améliorer son référencement Google. Pour certaines requêtes des internautes, surtout celles formulées à l’oral, Google comprendra de façon précise et fournira en résultats des pages qui répondent précisément aux doléances de l’internaute.
Les algorithmes basés sur BERT les plus populaires
DistilBERT et FastBERT sont des versions plus petites, légères, mais rapides de BERT CamemBERT. Cette dernière quant-à-elle est une version française développée par l’INRIA, XLNet and ALBERT par Google et Toyota. Sorti en septembre 2019, ALBERT est perçu comme le remplaçant de BERT qu’il dépasse dans tous les domaines, surtout en termes de score sur SQuAD 2.0.
Le SEO (Search Engine Optimization) veut dire en français : « Optimisation pour les moteurs de recherche ». Le but de toute agence de référencement est de parfaire la visibilité des sites web sur lesquels elle travaille en leur assurant une meilleure place dans les moteurs de recherche.
Le but des moteurs de recherche « Google, Yahoo et Bing » par exemple est de mettre à la disposition des internautes des résultats pertinents, des contenus informatifs. Donc, lorsqu’un site est bien optimisé, il se trouve en tête de liste dans les moteurs de recherche.
D’emblée, avec BERT, Google comprend mieux les formulations complexes dans les requêtes et les pages indexées, mais « travailler la longue traîne » n’est pas une « optimisation pour BERT ». À l’aide de ce système de traitement appelé Transformers, Google peut déterminer avec très une grande précision les arrières pensés sur les requêtes des internautes et en déduire pour mettre à leur disposition les classements de sites web pouvant répondre plus efficacement à leurs nécessités.
À la différence de l’ancien système d’analyse du moteur de recherche, l’algorithme BERT prend en considération toutes les prépositions telles que « pour » ou « à ». Malgré leurs caractères imperceptibles, ces prépositions peuvent avoir une conséquence sur la signification et le but des requêtes. L’algorithme BERT permet au moteur de recherche Google d’annuler les doubles sens que peut avoir un mot dans les requêtes.
L’annonce de BERT par Google concerne exclusivement les requêtes. L’algo BERT n’est pas là pour substituer RankBrain. Google a le choix d’utiliser plusieurs autres algorithmes afin de comprendre sa requête.