Charger une librairie
library(dplyr)
Charger un fichier
apres=read.csv(file = « serps-2016-08-02.csv »,header=T, sep= »; »,encoding = « UTF-8 »)
Sauvegarder un fichier
write.table(listeSERPSNettoyee, file = « C:/Users/gflorin/Desktop/SERPS/Nettoye/obj_lndng.csv », sep = « ; », row.names = FALSE,append=FALSE,col.names = TRUE,na = « », quote = FALSE)
Déduplication
KeywordAvant <- unique(avant$Keyword)
Convertir en dataFrame
KeywordAvant <- as.data.frame(KeywordAvant)
Renommer les colonnes
colnames(urls) = c(« url »)
Union R
Si un champ : union(x, y)
Si plusieurs champs listeLiensSERPS <- rbind(listeLiensSERPSBloc1,listeLiensSERPSBloc2)
Jointures
Outer join: merge(x = df1, y = df2, by = « CustomerId », all = TRUE)
Left outer: merge(x = df1, y = df2, by = « CustomerId », all.x = TRUE)
Right outer: merge(x = df1, y = df2, by = « CustomerId », all.y = TRUE)
Cross join: merge(x = df1, y = df2, by = NULL)
Not in
KeywordPerdus <-data.frame(C= setdiff(KeywordAvant[,1], KeywordApres[,1]))
Dplyr
listeSERPSASupprimerMarque <- inner_join(x=listeSERPSAValider,y=listeMarque, by = c(« keywords » = « H1 »))
not in listeSERPSAGarder <- anti_join(x=listeSERPSAGarder,y=listeMarque, by = c(« keywords » = « H1 »))
Where marques <- filter(marques, H1 != « »)
Filtrer <- filter(marques, !grepl(« virtualsite=151517″,marques$urlRelative))
Filtrer : pagesNaturelles <- filter(motsCles, motsCles$url!= » »)
Concatener 2 tables : motsCles<-bind_rows(motsCles,marques)
Effectifs
table (backlinks$Target.URL)
Filtrer un data frame
Avec : test <- subset(backlinks, grepl(« castaluna.fr », backlinks$Source.URL))
Sans : test <- subset(backlinks, !grepl(« castaluna.fr », backlinks$Source.URL))
Ne commence pas par : test <- subset(test, !grepl(paste(« ^ », »acheter », » « , sep= » »), test$keywords,ignore.case=T))
Nombre de lignes
nrow(listeStopWords)
Concaténer
paste(« ^ »,listeStopWords$V1[i], » « , sep= » »)
Ajouter une colonne calculée
listeSERPSNettoye$url <- paste(« /lndng/ctlg.aspx?artcl= »,listeSERPSNettoye$keywordsclean,sep= » »)
Supprimer des colonnes
marques <-marques[ , c(2,4)]
Réordonner les colonnes
(listeLiensPDPNettoye<-listeLiensPDPNettoye[,c(« URLSource », »URLDestination », »AnchorLink », »idBloc »)])
Traitement sur un champ d’une liste
motsCles$formeNormalisee <- lapply(motsCles$formeNormalisee,traiterUneExpression)
Replace : sub(« http://www.laredoute.fr », » »,marques$Full.URL)
Graphiques
pie(test$sum,test$template)
Calculer le pourcentage : graphiqueTraficParPage$percent <- as.data.frame(prop.table(as.matrix(graphiqueTraficParPage$sum), margin=2)*100)
Ressources
https://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html
http://xtof.perso.math.cnrs.fr/Pouzat-MNHM-130417.html
Photo by canadianfamily
0 commentaire