g1597178cf854edaabb45e7aa40680dfc58124eac152f740c31ba2e2327e0d7fac2f3c44cbd91317127c7e2e8f404e248_640_notepad

Ces petites fonctions bigQuery très pratiques

Il y a 2 ans, nous avons commencé à stocker toutes les données SEO à dispositions sur bigQuery. ca s’avère très utile au quotidien pour data driver notre SEO.

Voici quelques fonctions / pratiques très utiles :

Utiliser des vues

Ce n’est pas propre à bigQuery, une vue est en quelque sorte une requête mémorisée qu’on peut appeler comme si c’était une table : une espèce de table virtuelle.

C’est très pratique car cela va vous permettre d’éviter les grosses requêtes complexes (que vous aurez du mal à relire dans 6 mois).

A la place vous pouvez les découper en plusieurs requêtes plus simple.

L’autre intérêt est la factorisation car quand vous optimiserez une vue, vous optimiserez également toutes les requêtes faisant appelle à cette vue.

Seul petit bémol, c’est la consommation de donnée, car il s’agit ici d’une requête. Si vos vues exécutent des requêtes sur de grosses tables, il sera peut être plus rentable de stocker les données générées dans une table. La bonne nouvelle c’est que ça peut se faire en deux temps.

Générer une plage de dates

C’est très pratique notamment quand vous avez des taches planifiées qui chargent des données. Par exemple les données GA ou GSC.

Il est souvent utile de vérifier que les données ont été chargées pour s’assurer que les données que vous allez utiliser dans vos rapport sont fiable (qu’il ne manque pas une journée de données).

La requête suivante permet de récupérer toutes les dates entre une date de début et de fin, comme si c’était une table

select * FROM UNNEST(GENERATE_DATE_ARRAY('2015-12-23', '2016-01-09')) AS date

 

2021-04-07 10_22_54-BigQuery – SEO-platform – Google Cloud Platform

Vous pourrez donc faire une jointure avec vos données et vérifier s’il y a des données manquantes pour certains jours

Les fonctions sur les urls

Il existe des fonctions pour extraire des infos d’une url. On peut par exemple très facilement en extraire le nom de domaine sans devoir faire de regex.

NET.HOST(url)

Retourne le host (ex : www.marmiton.org)

select NET.HOST('https://www.marmiton.org/recettes/recette_gateau-au-chocolat-fondant-rapide_166352.aspx')
NET.PUBLIC_SUFFIX(url)

Retourne l’extension

NET.REG_DOMAIN(url)

Retourne le nom de domaine

 

Et vous, avez vous identifié des commandes qui vous font gagner un temps fou ?

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *