Il y a un mois environ, j’ai eu l’occasion de participer à une table ronde organisée par Botify lors du Crawl2Convert. Pour préparer cette conférence, je m’étais fait quelques notes. Du coup je me suis dit que ce serait sympa d’en faire un article…
Qu’est ce que le machine learning ?
Le machine learning est une branche d’intelligence artificielle, qui consiste à créer un programme qui répond à un problème sans avoir été spécifiquement été développé pour. L’algo va utiliser une combinaison de mathématique et de statistiques pour proposer une résultat cohérent.
Ce type d’algo est très utilisé pour faire de la recommandation de contenus :
Ou encore pour faire de la reconnaissance d’image
Crédits : https://www.natural-solutions.eu/blog/le-deep-learning-et-la-reconnaissance-dimage
Sur ce second exemple, on a demandé à des humains de préciser quel légume apparaissait sur un échantillon d’images.
Le programme va analyser différents critères sur ces images (formes, couleurs,…) pour créer un algorithme qui propose les même résultats que les humains. On pourra ensuite utiliser cette algorithme à grand échelle sur de nouvelles images.
Pourquoi le machine learning est utile au SEO ?
Le SEO est un domaine où il y a beaucoup de data (mots clés, audience, ranking, crawl, logs webperf,…). Cette data est la matière dont les algos vont se nourrir.
En SEO, il y a beaucoup d’optimisations possibles sur un site, le machine learning va permettre d’automatiser certaines tâches qui peuvent s’avérer très chronophages sur de gros sites ou sur un gros volume de sites (ex : optimisation de title, classification,…).
Le SEO est une discipline à l’on cherche souvent à faire des prédictions. Ca tombe bien c’est une des points forts du machine learning
Le rêve de tout SEO est de décrypter l’algo de Google pour positionner ses sites au mieux. On ne va pas se mentir, il est probablement impossible de comprendre exactement comment ranker car énormément de facteurs entrent en ligne de compte. Le fait de comprendre un peu mieux les facteurs importants peut nous permettre de faire progresser notre ranking de manière intéressante.
Les approches possibles
Tout d’abord, il est important de comprendre qu’on a pas besoin d’être un expert en machine learning pour tester des algorithmes… Il suffit d’être un peu curieux.
Les algos externes
Les GAFA proposent des algorithmes utilisables via API qui peuvent vous rendre de grands services.
Par exemple, l’API “Natural Language” de Google, permet de retrouver les entités présentes dans un texte, cela peut être super utile pour classer des contenus ou pour identifier des contenus proches les uns des autres :
https://cloud.google.com/natural-language/
Jouer avec ces algos est une bonne entrée en matière pour identifier ce que vous pouvez en tirer.
Dans cette conférence, Britney Muller donne pleins d’exemple d’utilisation sympa :
Se former au machine learning et tester
Une seconde approche consiste à sous traiter des tâches à des experts, ce qui vous permettra de tester l’approche et de comprendre toutes les étapes. C’est l’option que nous avons pris pour débuter avant de monter une équipe en interne.
Si vous souhaitez, vous y mettre il existe des formations en ligne sur les plateformes MOOC notamment celle de Andrew Ng sur Coursera ou celle de SuperDatascience sur Udemy
Il y a également des formations présentielles (Ix labs et data seo labs notamment). Côté plateforme, vous pouvez également regarder ce qui se fait sur R, Python, DataIku par exemple.
Retour d’expérience
On a lancé en externe un projet de taggage sémantique pour classifier nos contenus. Ce POC nous a permis de démontrer en interne l’intérêt de ce type d’approche, ça nous a permis de mieux appréhender toutes les étapes à réaliser et d’identifier ce qui était chronophage notamment. Ca va nous être très utile pour la suite.
Cela nous a également permis d’acquérir un mindset qui va nous permettre d’identifier d’autres usages pour le futur, nous sommes entrés dans l’action sans attendre d’avoir toutes les compétences.
On s’est rendu compte que le projet a été long pour différentes raisons (organisation, mise à dispo des données,…). Ce sont des axes de progrès pour aller plus vite à l’avenir.
En Conclusion
- Le machine learning est une des grosses forces des GAFA, c’est important de tester cette approche pour déterminer si elle nous permet d’accélérer nous aussi.
- L’étape de la préparation de la data est clé. Bien souvent on a la data mais elle n’est pas exploitable pour diverses raisons (pas clean, pas centralisée,…). C’est un gros travail qui peut être lancé dès aujourd’hui pour ne pas vous freiner demain.
- Sur certains business, le machine learning est un réel accélérateur, il faut donc faire très attention de ne pas se retrouver distancer par vos concurrents qui utiliseraient ces techniques.
- Le SEO est un univers où le machine learning peut être très utile.
- L’automatisation est clé en SEO pour aller plus vite que vos concurrents, le machine learning n’est pas toujours nécessaire. Un algo classique peut souvent très bien faire l’affaire.
Photo by mikemacmarketing
0 commentaire