Au fur et à mesure de mon apprentissage sur R, je me suis construit un petit document où j’ai listé les fonctions que j’ai utilisé, ce pense bête me sert tous les jour pour écrire mes nouveaux scripts. J’ai donc décidé de la partager avec vous.
La gestion de fichiers
Lire un fichier
Voici quelques options pratiques :
- encoding : permet de spécifier l’encodage du fichier
- sep : permet de spécifier le séparateur
- header : permet de spécifier si la première ligne contient le nom des colonnes
- skip : permet de ne pas tenir compte des premières ligne
Sauvegarder un fichier
Voici quelques options pratiques :
- sep : permet de définir le séparateur
- append : permet de spécifier si vous souhaitez ajouter ce fichier à la suite des données existantes ou remplacer l’existant
- colnames : permet de spécifier si vous souhaitez nommer les colonnes
- quote : permet de spécifier si vous souhaitez mettre le texte entre guillement
La gestion des dataFrames
Dédupliquer
Vous pouvez dédupliquer sur la base d’un champ ou de l’intégralité du dataFrame
Convertir en dataframe
Renommer les colonnes
Pour le dataFrame urls, je spécifie les noms des 2 colonnes
La manipulation de données
La librairie DPLYR est vraiment pratique.
Croiser 2 dataFrames
Ici data va contenir la liste des lignes de Data1 et Data2 pour lesquelles le champ « keywords » de data1 est égal au champ « H1 » de data2
Exclusion
Ici data va contenir la liste des lignes de Data1 pour lesquelles le champ « keywords » de data1 n’est jamais présent dans le champ « H1 » de data2
Filtrer
Ici je récupère la liste des lignes du dataframe marque pour qui H1 n’est pas vide
Ici je récupère la liste des marques qui ne contiennent pas « adidas » dans leur url
Regroupement
Je regroupe toutes les urls et calcule un champ « score » qui correspondra à la somme du « trafic » de chaque url, et je trie le tout selon le champ « score »
Concaténer 2 dataFrame
Cette fonction permet d’ajouter des champs dans mon dataframe « motsCles ».
Attention cela ne fonctionne que s’il y a le même nombre de lignes
Concaténer
On peut concaténer autant le nombre de chaines souhaités.
Le paramètre « sep » permet de spécifier le séparateur.
Supprimer des colonnes
Vous pouvez spécifier l’indice de la colonne ou le nom de la colonne
Remplacer des valeurs
Ici je passe une url en relatif
Créer data.frame vide
Voilà pour une première liste. Bien sur ça n’est pas exhaustif, mais c’est un bon début.
Et vous y-a-t-il d’autres commandes qui vous sont vitales ?