Nouvel exemple de ce qu’on peut faire en utilisant le langage R. Cette fois çi nous allons nous pencher sur une analyse sémantique construite à partir d’une base de mots clés. Cette analyse est très utile pour prioriser les contenus à produire en fonction de leur potentiel de trafic SEO
Qu’est ce qu’une co-occurrence ?
Une co-occurrence est un terme souvent associé à un autre. Par exemple « mariée » et souvent associé à « robe ». L’identification des co-occurrence est possible grâce à l’analyse sémantique d’un corpus (ensemble de documents).
A quoi ça sert ce type d’analyses ?
Le détection de co-occurrence va vous permettre d’identifier des contenus à produire.
Ici nous allons pondérer les co-occurences en fonction des volumes de recherche. Ce qui va nous permettre
- de prioriser les contenus à créer
- d’optimiser la sémantique de nos pages déjà existantes
Dans le but de maximiser nos chances côté SEO
L’analyse
Récupérer les données
La première étape consiste à exporter une liste de mots clés. Pour cette exemple j’ai exporté la liste des mots clé contenant l’expression « matelas ».
J’ai récupéré cette liste à partir de l’outil Semrush.
Installer les packages
- « tm » est un package destiné au texte mining
- « wordcloud » va me permettre de mettre en forme mes résultats sous forme de tagcloud
- « RColorBrewer » va nous permettre de mettre tout ça en couleur
- « dplyr » permet de manipuler les données
L’installation des package n’est a réaliser qu’une fois.
Charger les packages
Pour pouvoir utiliser un package, il faut le charger.
Chargement des données
- Je charge les données
- Je filtre pour éviter d’avoir trop d’éléments : je ne garde que les mots clés recherchés plus de 300 fois par mois ( à adapter en fonction du mots clé analysé)
Création du corpus
- Je crée un corpus à partir de ma liste de mots clés
- Je récupère tous les mots contenu dans ma liste de mots clés
Nettoyage
Je retire l’expression de départ ainsi que ses dérivés (lemmes) : « matel »
Cela me permet de donner plus de poids aux autres expressions.
Je calcule le score de chaque mot
Pour chaque mot :
- Je retrouve les expressions qui le compose
- Je calcule le score : somme de volumes de recherche des expressions comportant un mot donné
Je génère mon tagcloud
Le résultat
Je récupère un joli tagcloud avec tous les termes associés au mot clé que j’ai souhaité analyser. Visuellement c’est simple à analyser.
Plus un mot est gros plus il est fréquemment associé au mot clé « matelas » dans les recherches des internautes sur Google.
Conclusion
Encore une fois, avec un script assez court, on arrive à automatiser une action qui peut prendre du temps, surtout si on réalise plusieurs fois la même analyse.
Ce type d’analyse est vraiment utile pour :
- Définir les contenus / pages à créer
- Créer le contenu de vos fiches produits
- Créer un cocon sémantique ( ici je conseille de faire une analyse par niveau)
Le must serait de récupérer les données via l’API de semrush pour ne plus avoir à faire d’export manuel 😉
Le script complet
Comme d’habitude n’hésitez pas à commenter / partager cet article.
Genial et astucieux
Merci
Très très bonne démonstration de l’Intérêt de R, je partage !
pour ceux qui n utilise pas semrush un model d export csv aurai été bien
excellent cette article
continue comme sa je suis fan
Bonjour, merci pour cet article et bien d’autres 😉
Pourriez-vous me préciser quelque chose. Je ne suis pas spécialement familière avec R, mais j’ambitionne de le devenir. J’ai suivi votre tuto à la lettre. Je ne pense pas avoir fait d’erreurs, mais cela vient certainement de mon utilisation avec RStudio. Pourriez vous s’il vous plait m’éclairer sur la démarche à suivre dans RStudio.
Un grand merci par avance
Bonjour,
il suffit de sélectionner tous le code source, le copier coller dans R studio, vous pouvez ensuite l’exécuter.
Grégory
Bonjour Grégory, merci pour ton tuto. J’écris car lorsque je veux filtrer les mots clés avec le code : #keywords 300), ça ne fonctionne pas. Je ne comprend pas car mes colonnes sont bonnes tout est ok mais rien à faire. Peux tu m’aider stp ?
Peux tu m’envoyer ton code ?
Merci
Greg