Nous allons vous présenter les travaux que nous avons mené en 2022 sur la mesure de la qualité de groupement à des fins d’optimisation de contenu web.
L’optimisation du référencement naturel repose en grande partie sur la qualité des mots-clés utilisés dans les contenus web. De nombreuses études [1, 2, 3] soulignent l’importance d’employer des expressions sémantiquement proches et alignées avec les intentions de recherche des utilisateurs. Malgré cela, aucune méthode éprouvée n’existe aujourd’hui pour évaluer la qualité d’un regroupement de mots-clés dans une optique SEO. Les outils se contentent souvent de lister des mots-clés connexes sans les structurer efficacement autour d’un sujet.
Ce manque de cadre méthodologique nous a conduits à poser la problématique suivante :Peut-on définir et mesurer objectivement la qualité d’un groupe de mots-clés à des fins de rédaction SEO ?
Méthodologie et Travaux
Notre recherche s’est articulée autour de la création d’un prototype de validation de groupement de mots-clés, intégrant des données issues du SEO (volumes de recherche, intentions, tendances) et des algorithmes de traitement du langage naturel (NLP). Nous avons repris des listes de mots-clés issues de cas réels et appliqué un algorithme de clustering, enrichi de données contextuelles pour chaque expression.
Les groupements générés ont été évalués selon deux approches :
- Une notation manuelle par des experts SEO, sur une échelle de 0 à 20.
- Le calcul automatique d’un indice de cohérence, basé sur :
- la similarité des intentions de recherche (via des matrices d’intentions),
- la corrélation des tendances de recherche (volumes mensuels),
- la similarité sémantique (à l’aide du modèle BERT).
Nous avons ensuite comparé ces indices avec les notes des experts pour mesurer leur pertinence.
Analyse des résultats
Les résultats de nos expériences montrent que l’indice de cohérence calculé ne parvient pas à reproduire fidèlement le jugement des experts : même avec une tolérance de ±10 %, le taux de réussite moyen reste inférieur à 50 %. Cette différence s’explique par le fait que les experts se basent sur des critères implicites et contextuels que les métriques SEO ne captent pas (ex. : intention marketing, ton attendu, structure rédactionnelle sous-jacente).
Cependant, l’expérience a mis en évidence plusieurs points positifs :
- Les experts obtiennent de meilleures évaluations lorsqu’ils disposent de données enrichies (tendance, intention).
- La similarité sémantique calculée avec BERT semble être le critère automatique le plus corrélé aux jugements humains, bien qu’insuffisant seul.
- Il est donc possible d’assister l’évaluation, sans pour autant pouvoir encore l’automatiser totalement.
Conclusion
Nos travaux ont confirmé l’intérêt de structurer les mots-clés en groupes cohérents pour améliorer la rédaction SEO, tout en montrant les limites des approches automatisées. Si les métriques SEO apportent une aide précieuse, elles ne remplacent pas encore l’analyse experte. L’évaluation de la pertinence d’un cluster SEO reste un processus hybride, combinant données objectives et intuition humaine.
Cette recherche ouvre la voie à de nouvelles pistes : apprentissage supervisé basé sur des jugements experts, enrichissement sémantique via contextes web, ou encore construction d’ontologies SEO.
Aller plus loin
Pourquoi vous parler de ça maintenant ? La recherche de mots-clés reste encore le coeur du travail des experts SEO et une étape essentielle pour mener à bien votre référencement aussi bien dans les moteurs de recherche classiques que dans les nouveaux moteurs génératifs tels que Search GPT ou Perplexity.
Nous vous proposer dans notre nouvel outil Share of Search une notre solution innovante pour générer des prompts et des mots-clé de qualité et suivre votre positionnement dans les moteur Génératifs. Plus d’informations sur shareofsearch.ai
Références
[1] Abhishek & Hosanagar (2007), Keyword Generation for Search Engine Advertising using Semantic Similarity between Terms[2] Hashemi, Asiaee & Kraft (2016), Query Intent Detection using Convolutional Neural Networks[3] Mohammadi, Chapon & Frémond (2020), Query Intent Detection from the SEO Perspective
Une étude menée par Jérémy Chiaoui et Ahmed Amir