Charger une librairie

 

library(dplyr)

 

Charger un fichier

 

apres=read.csv(file = « serps-2016-08-02.csv »,header=T, sep= »; »,encoding = « UTF-8 »)

 

Sauvegarder un fichier

 

write.table(listeSERPSNettoyee, file = « C:/Users/gflorin/Desktop/SERPS/Nettoye/obj_lndng.csv », sep = « ; », row.names = FALSE,append=FALSE,col.names = TRUE,na = «  », quote = FALSE)

 

Déduplication

 

KeywordAvant <- unique(avant$Keyword)

 

Convertir en dataFrame

 

KeywordAvant <- as.data.frame(KeywordAvant)

 

 

Renommer les colonnes

 

colnames(urls) = c(« url »)

 

 

Union R

 

Si un champ : union(x, y)

Si plusieurs champs listeLiensSERPS <- rbind(listeLiensSERPSBloc1,listeLiensSERPSBloc2)

 

Jointures

 

Outer join: merge(x = df1, y = df2, by = « CustomerId », all = TRUE)

Left outer: merge(x = df1, y = df2, by = « CustomerId », all.x = TRUE)

Right outer: merge(x = df1, y = df2, by = « CustomerId », all.y = TRUE)

Cross join: merge(x = df1, y = df2, by = NULL)

 

 

Not in

 

KeywordPerdus <-data.frame(C= setdiff(KeywordAvant[,1], KeywordApres[,1]))

 

 

Dplyr

 

listeSERPSASupprimerMarque <- inner_join(x=listeSERPSAValider,y=listeMarque, by = c(« keywords » = « H1 »))

not in listeSERPSAGarder <- anti_join(x=listeSERPSAGarder,y=listeMarque, by = c(« keywords » = « H1 »))

Where marques <- filter(marques, H1 != «  »)

 

Filtrer <- filter(marques, !grepl(« virtualsite=151517″,marques$urlRelative))

Filtrer : pagesNaturelles <- filter(motsCles, motsCles$url!= » »)

 

 

Concatener 2 tables : motsCles<-bind_rows(motsCles,marques)

 

 

Effectifs

 

table (backlinks$Target.URL)

 

Filtrer un data frame

 

Avec : test <- subset(backlinks, grepl(« castaluna.fr », backlinks$Source.URL))

Sans : test <- subset(backlinks, !grepl(« castaluna.fr », backlinks$Source.URL))

Ne commence pas par :  test <- subset(test, !grepl(paste(« ^ », »acheter », » « , sep= » »), test$keywords,ignore.case=T))

 

Nombre de lignes

 

nrow(listeStopWords)

 

Concaténer

 

paste(« ^ »,listeStopWords$V1[i], » « , sep= » »)

 

 

Ajouter une colonne calculée

 

listeSERPSNettoye$url <- paste(« /lndng/ctlg.aspx?artcl= »,listeSERPSNettoye$keywordsclean,sep= » »)

 

Supprimer des colonnes

 

marques <-marques[ , c(2,4)]

 

 

Réordonner les colonnes

 

(listeLiensPDPNettoye<-listeLiensPDPNettoye[,c(« URLSource », »URLDestination », »AnchorLink », »idBloc »)])

 

Traitement sur un champ d’une liste

 

motsCles$formeNormalisee <- lapply(motsCles$formeNormalisee,traiterUneExpression)

 

Replace : sub(« http://www.laredoute.fr », » »,marques$Full.URL)

 

 

Graphiques

 

pie(test$sum,test$template)

 

 

Calculer le pourcentage : graphiqueTraficParPage$percent <- as.data.frame(prop.table(as.matrix(graphiqueTraficParPage$sum), margin=2)*100)

 

Ressources

 

https://sites.google.com/site/rgraphiques/realiser-des-graphiques-avec-le-logiciel-r/histogrammes-et-boites-a-moustaches

https://cran.rstudio.com/web/packages/dplyr/vignettes/introduction.html

http://xtof.perso.math.cnrs.fr/Pouzat-MNHM-130417.html

 

Photo by canadianfamily

Catégories : R pour le SEO

0 commentaire

Laisser un commentaire

Emplacement de l’avatar

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *