De plus en plus d’utilisateurs se tournent vers les outils d‘IA générative (ChatGPT et consorts) pour effectuer leurs recherches web. D’ailleurs, peut-être en faites-vous partie ? Pour ne pas perdre sa place de leader du search face à cette concurrence 3.0, Google prépare une réponse musclée : la Search Generative Experience – ou plus simplement SGE. Cette technologie devrait transformer le moteur de recherche tel que nous le connaissons en moteur de réponse propulsé par l’intelligence artificielle.
Aux États-Unis et dans des dizaines d’autres pays, une version-test de ce nouvel engin est déjà accessible. Et d’après les premières constatations Google SGE va faire mal en termes de SEO. Les experts annoncent des baisses de trafic organique monstrueuses… mais aussi des opportunités nouvelles pour gagner en visibilité sur le Web.
Forcément, en tant que passionnée de référencement naturel, tout cela a piqué ma curiosité. Je suis donc partie naviguer de l’autre côté de l’Atlantique pour recueillir des informations plus précises sur la Search Generative Experience et tenter de répondre à la question suivante : comment faudra-t-il faire pour optimiser ses articles de blog pour Google SGE ?
Google SGE : la révolution du search est en marche
Qu’est-ce que le Search Generative Experience de Google ?
Imaginez pouvoir dialoguer avec Google pour qu’il trouve des réponses plus précises à vos recherches. Imaginez aussi qu’il vous fournisse directement une réponse complète en compilant des informations dénichées dans plusieurs sources. Voilà, de manière très schématique, en quoi consiste la nouvelle expérience de recherche à laquelle vous pourrez bientôt accéder.
Pour être plus concret, lorsque vous effectuerez une recherche SGE vous proposera une réponse personnalisée grâce à son IA générative. Elle se matérialisera sous la forme d’un encart de couleur — appelé snapshot — qui apparaîtra en haut de la SERP (page d’affichage des résultats). Pour approfondir vos connaissances, vous aurez la possibilité de poser à l’intelligence artificielle des follow-up questions. Il s’agit de requêtes complémentaires en lien avec votre première recherche. L’outil générera alors d’autres retours, toujours en tenant compte des demandes que vous avez effectuées précédemment. SGE sera ainsi en mesure de vous fournir des réponses à des demandes complexes dans un contexte donné.
Un projet ambitieux du géant du Web pour garder sa position de leader
Cette innovation est la réponse musclée de Google à ChatGPT et aux autres IA qui secouent la toile. Mi-assistant virtuel, mi-moteur de recherche, le matou d’OpenAI avait vite été adopté par les Français dès son arrivée, fin 2022. D’après un sondage Ipsos, 47 % de ceux qui l’utilisent régulièrement s’en servent pour « trouver des informations spécifiques sur un sujet donné »…
Face à ce constat et au risque de perdre ses utilisateurs, Google n’a donc eu d’autre choix que de riposter. Il a donc annoncé dès le printemps 2023 l’arrivée imminente de l’avenir du search, aka Google SGE.
La promesse d’un moteur de recherche augmenté par l’IA
Pour rester le leader incontesté de la recherche sur Internet, Google promet à ses utilisateurs un moteur capable de générer directement des réponses pertinentes à des questions complexes. Pour ce faire, c’est donc l’intelligence artificielle qui est mise à contribution, et plus particulièrement :
- MUM (Multitask Unified Model) : un modèle qui comprend qu’une seule question peut demander une réponse combinant plusieurs types d’informations. Pour cela, il peut disséquer les données de diverses sources (et même de plusieurs formats de sources — articles, vidéos, images…) et les restituer de manière structurée.
- PaLM2 : un LLM (grand modèle de langage) capable de raisonner pour produire du code, des résultats mathématiques ou encore de la traduction.
Information gaps, hallucinations et thématiques YMYL : les limites de l’outil
Bien que Google ait sorti l’artillerie lourde pour SGE, l’outil a tout de même quelques limites.
La première d’entre elles correspond à ce que le géant du Web appelle le data void (ou information gaps). Ici, SGE s’abstiendra de présenter un snapshot, tout simplement parce que l’outil estime ne pas disposer de suffisamment d’informations pour le faire. Ceci vaut aussi pour les requêtes critiques. C’est-à-dire celles qui pourraient laisser penser que l’internaute est dans une situation de détresse, ou qu’il recherche des informations pour commettre un acte dangereux.
Il faut aussi savoir que les intelligences artificielles, comme celles qui propulsent la nouveauté de Google, peuvent être victimes « d’hallucinations ». Ce phénomène a déjà été largement documenté. Il se produit lorsque l’IA fournit une réponse qu’elle présente comme avérée, alors qu’elle ne dispose d’aucune information tangible à ce sujet.
Notons également que dans un souci de fournir un outil éthique, la teneur des réponses de l’IA a été volontairement influencée pour les thématiques dites YMYL (Your Money or Your Life). Sur ces sujets sensibles, SGE ne fournira pas toujours les informations compilées depuis les contenus web. Selon les cas, il précisera que ses réponses ne doivent pas être considérées comme fiables. Cette limitation de l’outil est donc plutôt bienvenue, pour éviter d’induire les internautes en erreur, notamment pour ce qui touche à leur santé, leurs finances ou encore leurs droits civiques.
Pratiques SEO : les changements en vue pour optimiser ses articles de blog pour Google SGE
Les critères pris en compte pour apparaître
Ce n’est pas nouveau, depuis toujours Google cherche à satisfaire l’internaute avec ses résultats organiques. C’est d’ailleurs pour cela que le moteur de recherche n’a cessé d’implémenter des mises à jour visant à promouvoir les contenus premium.
Nous pouvons par exemple citer :
- Panda (2011) : algorithme qui fait la chasse aux contenus dupliqués ou de piètre qualité.
- Penguin (2012), qui vise à débarrasser la toile des sites utilisant des techniques SEO black hat, comme le bourrage de mots clés ou l’achat de liens.
- BERT (2018) : un modèle de langage qui permet de contextualiser les contenus et ainsi les positionner selon leur pertinence par rapport à la requête dans la SERP.
- Etc.
Avec Google SGE, les règles du jeu ne changent pas.
Pour ressortir dans les résultats mis en avant, vos contenus devront briller par leur :
- pertinence ;
- qualité ;
- utilité ;
- fiabilité ;
- engagement ;
- diversité.
Vous trouvez que cela fait beaucoup de critères ?
En réalité, ils se résument à l’acronyme que vous connaissez sans doute : E-E-A-T. Plus que jamais, il sera indispensable de comprendre et appliquer les guidelines qui s’y rattachent : Experience, Expertise, Authority, Trust.
Les bonnes pratiques restent les mêmes : le SEO white hat va avoir la cote !
Vous l’aurez compris, la ligne de conduite ne change pas. Avec SGE, Google cherche à fournir la meilleure réponse possible aux internautes. Aussi faut-il toujours créer ses contenus avec une idée en tête : rendre service à votre cible.
Une page ou un article qui ne présenterait que peu de valeur ajoutée pourrait vite être reléguée au second plan.
Prenons l’exemple d’un article de blog entièrement généré par l’IA. Peu importe si la qualité rédactionnelle est présente et si le contenu est parfaitement optimisé. L’intelligence artificielle n’est pas capable de « produire de l’information ». Elle se contente de compiler des données présentes sur le Web. Un contenu publié tel quel ne répondrait pas aux critères d’expérience et de diversité souhaités par Google. Pourquoi ? Tout simplement parce que l’internaute serait en mesure de trouver des informations équivalentes sur d’autres articles déjà en ligne.
En d’autres termes, il ne faut plus publier beaucoup, il faut publier mieux :
- se concentrer sur des articles et des pages avec une réelle plus-value ;
- miser sur l’expertise et l’expérience (VOTRE contribution à la thématique traitée dans le contenu) ;
- citer ses sources en privilégiant bien sûr les références fiables ;
- maintenir à jour son actif éditorial en s’assurant que les anciens articles ne contiennent pas d’informations obsolètes.
L’intention de recherche, plus importante que jamais
Proposer du contenu utile, des informations claires et directement assimilables par les utilisateurs : voilà le crédo de SGE. Aussi, avant de rédiger tout article, un travail minutieux autour de la compréhension de l’intention de recherche sera nécessaire.
- Quel est le besoin, le problème ou la question qui se cache derrière la requête ?
- Quelles sont les informations qui pourront apporter une solution ?
- Comment construire mon contenu pour que ma réponse soit utile aux internautes ?
Bienvenue dans l’ère de la (méga-)longue traîne ?
La Search Generative Experience est capable de comprendre et répondre à des requêtes complexes imbriquant plusieurs « couches » d’informations. Ceci lui permet de fournir des résultats détaillés et personnalisés.
Il pourrait alors être pertinent de miser sur la (très) longue traîne pour développer des contenus spécifiques susceptibles d’être cités dans le snapshot.
Les petits détails qui feront toute la différence pour des contenus optimisés pour SGE
Comme nous l’avons vu, le nouveau joujou de Google permettra de mener une recherche web de manière conversationnelle avec l’intelligence artificielle. Il y a donc fort à parier que les internautes utiliseront des requêtes plus précises (et sans doute sous forme de questions directes). En clair, des termes similaires à ceux utilisés pour la recherche vocale.
L’utilisation d’un langage naturel sera donc à privilégier dans les contenus, de manière à faire écho à la terminologie employée par les utilisateurs.
Moteur de réponse propulsé par l’IA : des incertitudes sur le volume de trafic redirigé vers les sites web
Un snapshot qui risque d’exacerber le phénomène du zéro clic
Google l’annonce : il veut continuer à envoyer du trafic vers les sites.
As we bring generative AI into Search, we’re committed to continue sending valuable traffic to sites across the web.
Source Google
Mais s’agit-il d’un vœu pieux ?
En effet, les résultats naturels seront toujours affichés sous le bandeau SGE. Mais celui-ci prend de la place dans la SERP… beaucoup de place même.
Comme ce fut le cas avec les featured snippets ou les knowledge panels, les experts du SEO s’attendent donc à des bouleversements concernant le comportement des internautes. Cliqueront-ils toujours sur les résultats proposés si l’IA leur fournit déjà une réponse satisfaisante ? Auront-ils vraiment envie de scroller pour accéder aux différents contenus ?
Aux États-Unis, le site Search Engine Land a effectué un travail d’estimation sur le taux de clics (CTR) que génèreraient les premiers résultats naturels. 👇
Position dans la SERP | CTR de juin 2023 aux USA | CTR avec SGE (projections optimistes) | CTR avec SGE (projections pessimistes) |
1 | 17,15 % | 12,68 % | 6,34 % |
2 | 12,37 % | 12,68 % | 6,34 % |
3 | 8,51 % | 12,68 % | 6,34 % |
4 | 5,46 % | 5,46 % | 2,73 % |
5 | 3,63 % | 3,63 % | 1,82 % |
Bien qu’il soit encore tôt pour confirmer ces chiffres, il semble tout de même évident qu’en ce qui concerne les recherches informationnelles, les sites doivent s’attendre à une baisse du nombre de visiteurs obtenus via le référencement naturel habituel.
Quid de la mise en valeur des sources utilisées par Google SGE ?
Toutefois, les résultats naturels tels que nous les connaissons actuellement ne seront plus la seule manière de capter le trafic issu du search.
Dans un souci de fiabilité et de confiance, SGE devrait présenter les sources qu’il a utilisées pour générer sa réponse. Actuellement, celles-ci apparaissent sous la forme d’un carrousel situé juste sous le texte proposé par l’IA.
Il y a fort à parier que cette place de choix en haut de la ligne de flottaison de la page de résultats sera le nouveau Graal en matière de SEO.
Le site MOZ a publié un modèle d’analyse pour savoir si SGE représentera une menace ou une source d’acquisition de trafic sur vos mots clés principaux.
Il s’avère que les sites travaillant des requêtes à fort volume de recherche et qui ne sont actuellement pas présents dans les premiers résultats de la SERP pourraient gagner en visibilité grâce à la Search Generative Experience. En effet, les sources présentées dans le snapshot ne correspondent pas nécessairement aux premiers résultats naturels. Il est donc possible de « mal ranker », mais d’être mis en avant dans le carrousel.
⚠️ Mais attention ! L’affichage du snapshot n’est pas figé. Pour la même requête, on obtient généralement des résultats différents, que ce soit au niveau de la réponse en elle-même ou de l’affichage des contenus desquels provient l’information.
Vous verrez ci-dessous un exemple avec la requête Google SGE and traffic drop, que j’ai recherchée deux fois à 48 h d’intervalle. Comme vous pourrez le constater, la réponse à légèrement évoluée et l’une des sources n’est plus mentionnée dans la V2.
Des réponses qui restent à fournir concernant l’identification du trafic provenant de cette source
Au moment où je rédige cet article (mars 2024), il semblerait qu’il soit impossible pour les propriétaires de sites web de distinguer l’origine de leur trafic organique. J’entends par là qu’ils ne savent pas si leurs visiteurs ont cliqué sur l’un des résultats du carrousel SGE ou sur l’un des résultats de la SERP traditionnelle.
Alors, Google va-t-il intégrer une vue spécifique pour le trafic issu de la Search Generative Experience dans sa Search Console ?
Affaire à suivre…
Version US de Google SGE : je suis allée y faire des petits tests
Une version bêta disponible dans 120 pays, mais pas en France
En parallèle de mes recherches sur le sujet, j’avais bien entendu envie d’aller tester « la bête » moi-même. Je voulais notamment :
- me faire un avis personnel sur l’expérience de recherche conversationnelle ;
- observer les différents résultats pour les requêtes à visée informationnelle (pour les articles de blog).
Eh bien, cela m’a demandé un peu d’huile de coude.
Pour l’instant, il n’est possible d’accéder à SGE que via Google Search Labs : une version-test qui n’est pas encore disponible en France.
J’ai donc mis à contribution mon VPN et mon TOEIC 985/990 pour aller faire un petit tour sur la version disponible aux États-Unis.
SGE pour la recherche informationnelle : aperçu pour les articles de blog
En tant que rédactrice spécialisée dans l’apprentissage linguistique, j’en ai donc profité pour étudier des requêtes liées à mon domaine de prédilection. Je vous livre ici les résultats de l’une d’elles : spaced repetition for language learning (répétition espacée pour l’apprentissage des langues).
Un bandeau qui ne laisse pas beaucoup de place aux résultats naturels
Comme vous pouvez le voir sur cette première capture d’écran, le contenu proposé par l’IA ne permet pas d’afficher un grand nombre de résultats dans la SERP. L’œil de l’utilisateur est directement attiré par la définition et la source présente dans le carrousel.
💡Autre fait intéressant que j’ai constaté sur quelques requêtes : les UGC (user generated content, comme les forums type Reddit) se positionnent assez facilement dans les premiers résultats, mais ne sont généralement pas cités par SGE.
Que se passe-t-il quand on veut en savoir plus ?
Une fois que l’internaute a pris connaissance de cette première réponse synthétique, il est face à un choix :
- scroller pour consulter les sites de la page de résultats ;
- consulter la source présentée en carrousel ;
- cliquer sur « show more » pour en savoir plus.
Que feriez-vous face à une telle disposition des résultats ?
Intriguée par la phrase en transparence que l’on voit après la définition, mon premier réflexe a été de cliquer sur le bouton show more pour lire la suite de la réponse.
J’ai donc pu accéder à une réponse plus fournie et bien construite avec :
- La définition initiale.
- Un complément d’information applicable à l’apprentissage des langues.
- Des sources supplémentaires (qui ne sont visibles que si l’on clique sur la flèche de déroulement).
- Deux paragraphes sur les bénéfices de la répétition espacée.
- La méthode la plus commune pour appliquer la répétition espacée à l’apprentissage d’une langue.
- La possibilité d’affiner ma recherche, soit avec les suggestions, soit en tapant une nouvelle question.
Cette version étoffée de la réponse offre à l’utilisateur un condensé de ce qu’il pourrait trouver dans les résultats de la SERP. Il y a donc de fortes chances pour que sa navigation se limite aux sources présentées par SGE.
Le point sur les sources affichées par SGE
Comme nous l’avons déjà vu, les résultats mis en avant par SGE ne correspondent pas nécessairement à ceux dans le top de la SERP.
Dans l’exemple donné ci-dessus, on retrouve le site Chatterblog (celui du carrousel) en 8e position — sans compter les PAA et les résultats vidéos.
Sanako et PandaTree, que l’on voit sur la capture d’écran « show more », occupent respectivement la 2e et la 7e position.
À la consultation de ces articles, j’ai pu constater que celui de Chatterblog n’était pas nécessairement le mieux optimisé, d’où sa 8e position. En revanche, il apporte des informations claires et facilement « actionnables » par les internautes. Comparons par exemple les définitions de la répétition espacée données par cet article et celui de Sanako (2e sur Google).
➜ Chatterblog : “Spaced repetition systems are a way of committing things to memory that is based on the spacing effect. The spacing effect is the idea that things are better learned in the long term if you repeatedly do them, or go over them, over a long(ish) period of time, leaving spacing in between them.“
➜ Sanako : “Spaced repetition is a memory technique that involves repeatedly reviewing and recalling information at regular intervals until the information is learned at the required level.This approach helps students’ brains to remember more information as it keeps the material fresh in their minds for longer.“
La première définition s’adresse directement à l’internaute (you) et lui donne tout de suite les clés pour appliquer la répétition espacée. La seconde est plus impersonnelle et théorique.
Bien entendu, il faudra conduire des analyses sur un grand échantillon d’articles pour valider ces constatations, mais il semble bien que Google SGE favorise les résultats qui s’appliquent à répondre au mieux aux besoins des utilisateurs, avec des explications limpides, actionnables et sans jargon.
Points clés pour vous préparer à l’arrivée de la Search Generative Experience
En conclusion, la nouvelle expérience de recherche web proposée par Google risque de mettre un bon coup de pied dans la fourmilière du SEO. Bien qu’il soit encore difficile de dire à quelle sauce nos contenus seront mangés (mastiqués, digérés et restitués) par l’IA, on peut déjà s’attendre à une baisse de trafic provenant des résultats naturels.
En revanche, le snapshot SGE et les sites qu’il met en exergue pourraient bien redistribuer les cartes en permettant à des sites au ranking un peu bas de capter l’attention des internautes.
Pour avoir une chance d’être dans les petits papiers de SGE, il faudra toujours miser sur des contenus répondant à l’intention de recherche, aux critères de l’E-E-A-T, cela ne change pas. Mais plus que jamais, il faudra placer l’utilisateur au cœur de la stratégie d’optimisation. La volonté de Google est claire et affichée : les articles qui seront mis en avant seront ceux qui seront réellement utiles aux internautes, et non ceux rédigés pour les algorithmes.
N’optimisez pas vos contenus pour SGE. Optimisez-les pour vos lecteurs !