Il y a 2 ans, nous avons commencé à stocker toutes les données SEO à dispositions sur bigQuery. ca s’avère très utile au quotidien pour data driver notre SEO.
Voici quelques fonctions / pratiques très utiles :
Utiliser des vues
Ce n’est pas propre à bigQuery, une vue est en quelque sorte une requête mémorisée qu’on peut appeler comme si c’était une table : une espèce de table virtuelle.
C’est très pratique car cela va vous permettre d’éviter les grosses requêtes complexes (que vous aurez du mal à relire dans 6 mois).
A la place vous pouvez les découper en plusieurs requêtes plus simple.
L’autre intérêt est la factorisation car quand vous optimiserez une vue, vous optimiserez également toutes les requêtes faisant appelle à cette vue.
Seul petit bémol, c’est la consommation de donnée, car il s’agit ici d’une requête. Si vos vues exécutent des requêtes sur de grosses tables, il sera peut être plus rentable de stocker les données générées dans une table. La bonne nouvelle c’est que ça peut se faire en deux temps.
Générer une plage de dates
C’est très pratique notamment quand vous avez des taches planifiées qui chargent des données. Par exemple les données GA ou GSC.
Il est souvent utile de vérifier que les données ont été chargées pour s’assurer que les données que vous allez utiliser dans vos rapport sont fiable (qu’il ne manque pas une journée de données).
La requête suivante permet de récupérer toutes les dates entre une date de début et de fin, comme si c’était une table
[pastacode lang= »sql » manual= »select%20*%20FROM%20UNNEST(GENERATE_DATE_ARRAY(‘2015-12-23’%2C%20’2016-01-09’))%20AS%20date » message= » » highlight= » » provider= »manual »/]
Vous pourrez donc faire une jointure avec vos données et vérifier s’il y a des données manquantes pour certains jours
Les fonctions sur les urls
Il existe des fonctions pour extraire des infos d’une url. On peut par exemple très facilement en extraire le nom de domaine sans devoir faire de regex.
NET.HOST(url)
Retourne le host (ex : www.marmiton.org)
[pastacode lang= »sql » manual= »select%20NET.HOST(‘https%3A%2F%2Fwww.marmiton.org%2Frecettes%2Frecette_gateau-au-chocolat-fondant-rapide_166352.aspx’) » message= » » highlight= » » provider= »manual »/]
NET.PUBLIC_SUFFIX(url)
Retourne l’extension
NET.REG_DOMAIN(url)
Retourne le nom de domaine
Et vous, avez vous identifié des commandes qui vous font gagner un temps fou ?
0 commentaire