e836b50f2ef0083ecd0b470de7444e90fe76e7d61ab6124390f5c3_640_chart

Utiliser les quantiles pour détecter le trafic top/long tail avec R

Lorsqu’on analyse un site, il est primordial de déterminer si le trafic est plutôt top ou long tail car cela va influer fortement sur votre stratégie SEO.

Pour répondre à cette question les quantiles sont très pratiques…

Qu’est ce qu’un quantile ?

Un quantile est un regroupement d’éléments triés.

Par exemple si je décide de créer des percentiles, je vais créer 100 groupes en triant les éléments de manière croissantes.

Mon premier percentile contiendra les valeurs les plus faibles. Mon dernier percentile contiendra les valeurs les plus élevées.

Use case

Actuellement je travaille sur la stratégie d’optimisation d’un forum. Je vais donc commencer par me demander si mon trafic forum est plutôt top ou long tail.

S’il est top tail, je vais essayer de booster les quelques urls qui m’apportent beaucoup de trafic, à l’inverse s’il est long tail, je vais être amené à optimiser un grand nombre d’urls…

Avec R c’est facile

 

Je vais partir d’un dataset contenant le trafic SEO de chaque urls sur les 12 derniers mois.

 

# Trier le trafic
trafficSEOLastYear <- trafficSEOLastYear %>% arrange(desc(trafficSEOLastYear$sessions))

# Créer mes quantiles
quantile <- as.data.frame(quantile(trafficSEOLastYear$sessions, probs = seq(0, 1, by= 0.001))) # decile
colnames(quantile) = c("value")
quantile$indice <- as.double(gsub("%","",rownames(quantile)))*10

# Générer mon graphique
p <- ggplot(data=quantile, aes(x=indice, y=value))
p <- p + geom_point(size=2)
p

 

Le resultat

Rplot

Ici on voit bien que le trafic est plutôt long tail.

Ici j’ai basé mon exemple sur du trafic mais ce type d’analyse peut s’appliquer sur d’autres éléments :

  • maillage interne
  • Volumes de recherche
  • Nombre de backlinks
  • ….

 

 

 

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *