Le temps de chargement des pages impacte-t-il le crawl de Google ?

Oui… Et nous allons voir pourquoi et comment en tirer parti.

Pourquoi Google crawle-t-il mon site ?

Pour avoir des résultats fiables Google doit venir visiter les pages de votre site très régulièrement. Ca lui permet de détecter :

  • Les pages qu’il ne connait pas encore
  • Les pages qui ont été mises à jour depuis son dernier passage
  • Les pages qui génèrent des erreurs

Sur des gros sites, il n’est pas rare que Google visitent plus de 100K pages par jours. Certaines pages peuvent être crawlées toutes les heures.

Pourquoi le temps de chargement est-il un vrai problème pour Google ?

A l’échelle du web, ce suivi nécessite beaucoup de ressources. Google possède un grand nombre de datacenter pour réaliser ce type de taches. Ce qui, vous vous en doutez est très couteux.

Datacenter Google

Lorsque Google appelle une page, son serveur attend d’obtenir son contenu pour pouvoir l’analyser. Autant dire que si les pages mettent 10 secondes pour se charger,  les traitements deviennent beaucoup plus longs. A l’inverse si vous baissez de 50% le temps de chargement, cela pourrait permettre à Google de venir voir plus de pages sur votre site.

Voici un exemple obtenu à partir de l’outil Google Webmaster tools :

 

La baisse du temps de chargement correspond à la mise en place d’une solution de cache sur le site.

On note clairement une progression du nombre de pages explorées par jour à partir du moment où le temps de chargement a baissé.

Impact sur le référencement d’un site

Le 9 avril 2010 Google annonce officiellement prendre en compte le temps de chargement dans son algorithme. Ce n’est certainement pas le critère principal mais tout de même.

Autre élément, nous savons qu’une page qui n’a pas été crawlée pendant les 7 derniers jours a peu de chance de générer des visites moteur.

Autant dire que nous avons tout intérêt à optimiser le temps de chargement des pages de nos sites.

Comment améliorer le temps de chargement ?

Il y a plusieurs possibilités, qui dépendent de votre hébergement et de votre CMS.

Voici quelques pistes :

Muscler son serveur

Certaines offres d’hébergement ne sont vraiment pas chères mais votre site se trouvera hébergé sur le même serveur que des centaines d’autres. Autant dire que dans certains cas, cela peut nuire aux performances.

L’hébergement dédié est une bonne solution, qui permet de ne plus dépendre de la charge générée par les autres sites.

Utiliser du cache

Par défaut à chaque appel d’une page, le serveur « calcule » le code HTML à retourner. Le mécanisme de cache consiste à mémoriser le code HTML d’une page pour ne pas réaliser le calcul plusieurs fois. Le premier appel réalise les calculs et les suivants utilisent la copie qui a été sauvegardée. Ce qui est beaucoup plus rapide.

Chaque techno ou CMS possède ses propres mécanismes de cache. A vous de chercher ce qui convient le mieux à votre environnement.

Attention

Certaines mises à jour peuvent influer sur le temps de chargement des pages. Il faut donc monitorer le temps de chargement des pages régulièrement afin de ne pas avoir de mauvaises surprises.