一区二区三区日韩精品-日韩经典一区二区三区-五月激情综合丁香婷婷-欧美精品中文字幕专区

分享

R語言實用函數整理

 gearss 2018-04-16

初始化

options(stringsAsFactors=F,scipen=99)
rm(list=ls());gc()
getwd() 獲得工作路徑信息
setwd() 設置工作路徑
  • 1
  • 2
  • 3
  • 4

清空控制臺

快捷鍵control+L
  • 1

獲取目錄下所有文件名

filenames=dir("/Users/yuyin/Downloads/數據/Excel數據")
##or推薦第二種
setwd("/Users/yuyin/Downloads/數據/Excel數據")
filenames=dir()
  • 1
  • 2
  • 3
  • 4

讀取文件輸出文件

require(data.table)
library(data.table)
da<- fread("/Users/yuyin/Downloads/train_all_weekday.csv",header = FALSE)
#讀取gbk編碼文件
u<- read.csv("JData_User.csv",fileEncoding='gbk',header = TRUE)
write.table (out, file ="/Users/yuyin/Downloads/2.csv",sep =",",row.names = F,col.names=F,quote =F)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

讀寫xlsx文件

library("xlsx")
t=read.xlsx('吉林2014.xlsx',sheetIndex=1)
write.xlsx(t, file="./s.xlsx")
  • 1
  • 2
  • 3

SQL查詢

library(sqldf)
re=sqldf("select V1,V2,V6 from da where V2>=20161004 and V2<=20161017 order by V1,V2")
  • 1
  • 2

繪圖

library(recharts)
echartr(tmp,as.character(tmp$V2),V6,type = 'line')
  • 1
  • 2

分位數

#四個分位數
quantile(ck)  
#自定義分位數 
quantile(ck,  probs = c(0.85,0.95))
median中位數
mean均值
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

查看行數

nrow(data.frame)
  • 1

字符串操作

拼接字符串

##方法一
paste(Y,'/',m,'/',d,sep='')
##方法二
library(stringr)
pout=str_c(path,name,collapse='')
  • 1
  • 2
  • 3
  • 4
  • 5

替換字符串

name=str_replace_all(name,"/","_")
  • 1

DF去重

tt=unique(tt)
  • 1

合并數據框

合并行
rbind(t1,t2)
合并列
cbind(t1,t2)
  • 1
  • 2
  • 3
  • 4

DF排序

x=x[order(x$bad_comment_rate,decreasing=F),]
  • 1

生成隨機數

runif(n, min=0, max=1) 均勻分布
rnorm(n, mean=0, sd=1) 正態(tài)分布
sample(seq(0,100,by=1),1,replace=TRUE) 抽樣生成隨機數
  • 1
  • 2
  • 3

最大最小歸一化

b1=(data[,1]-min(data[,1]))/(max(data[,1])-min(data[,1]))  
b1=(d-min(d))/(max(d)-min(d))  
  • 1
  • 2

日期轉換

dateChar<-("2014-04-06")
dtV<-as.POSIXct(dateChar,format="%Y-%m-%d")
##或者dtV<-as.Date(dateChar,format="%Y-%m-%d")
format(dtV,"%Y/%m/%d %H:%M:%S")
#轉換為2014/4/6
Y=format(dtV,"%Y")
m=as.character(as.numeric(format(dtV,"%m")))
d=as.character(as.numeric(format(dtV,"%d")))
dt<-paste(Y,'/',m,'/',d,sep='')
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

計算時間差

d <- c('2013-12-05 18:43:00','2013-08-23 22:29:00')
difftime(d[2],d[1])
difftime(strptime(d, "%Y-%m-%d %H:%M:%S")[2],strptime(d, "%Y-%m-%d %H:%M:%S")[1],units='secs')
  • 1
  • 2
  • 3

高效數據清洗包dplyr代替sqldf

速度比sqldf快很多 適合數據量大處理

library(dplyr)
#將數據整理成的tbl_df數據(處理速度快) 
iris <- tbl_df(iris)
##變量篩選select  對應select  刪除-
select(iris,Sepal.Length,Sepal.Width)
select(iris,-Species)
##對數據運算并添加為新列mutate() 對應 count(a) as t1
mutate(iris,t1=Sepal.Length*2)
##計算
n(): 計算個數
n_distinct() #: 計算 x 中唯一值的個數
first(x), last(x) 和 nth(x, n)#: 返回對應秩的值, 類似于自帶函數 x[1], x[length(x)], 和 x[n]
##過濾filter  對應 where
filter(iris,Sepal.Length>5,Sepal.Width<4)
filter(iris,Sepal.Length>5 & Sepal.Width<4 & (Species == "setosa" | Species == "versicolor"))
##數據排序arrange  對應 order by
arrange(iris,Sepal.Length)
arrange(iris,desc(Sepal.Length))
##匯總group_by() 分組-匯總
group_by(iris, Species)
group_by(iris,Species,Petal.Width)  %>% summarise(c1=n(),c2=n_distinct(Species))
##計算summarise()
summarise(iris,c1=n(),c2=mean(Sepal.Length))
##多步操作連接符%>%
filter(iris,Sepal.Length>5,Sepal.Width<4) %>% summarise(c1=n(),c2=mean(Sepal.Length)) 
##抽樣sample_n sample_frac
sample_n(iris,20) 
##左連接 ab交集 差集
left_join(a, b, by="x1")
right_join(a, b, by="x1")
inner_join(a, b, by="x1")##保留匹配的數據
outer_join(a, b, by="x1")##保留所有數據
semi_join(a, b, by="x1") # 數據集a中能與數據集b匹配的記錄
anti_join(a, b, by="x1") # 數據集a中雨數據集b不匹配的記錄
intersect(x, y): x 和 y 的交集(按行)
union(x, y): x 和 y 的并集(按行)
setdiff(x, y): x 和 y 的補集 (在x中不在y中)
##列合并
bind_cols(y, z)
##行合并
bind_rows(y, z)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41

參考(特別是文章后面的翻譯圖片)

查詢相關R包

library(sos)
findFn('onehot')
##具體看sos的help
  • 1
  • 2
  • 3

    本站是提供個人知識管理的網絡存儲空間,所有內容均由用戶發(fā)布,不代表本站觀點。請注意甄別內容中的聯系方式、誘導購買等信息,謹防詐騙。如發(fā)現有害或侵權內容,請點擊一鍵舉報。
    轉藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    丰满人妻熟妇乱又乱精品古代| 黄片免费观看一区二区| 91欧美亚洲精品在线观看| 成年女人午夜在线视频| 国产传媒精品视频一区| 国产一区日韩二区欧美| 欧美又黑又粗大又硬又爽| 黄男女激情一区二区三区| 国内欲色一区二区三区| 国内尹人香蕉综合在线| 丝袜破了有美女肉体免费观看| 欧美丰满大屁股一区二区三区| 亚洲最大的中文字幕在线视频| 色婷婷人妻av毛片一区二区三区| 亚洲综合精品天堂夜夜| 亚洲熟女熟妇乱色一区| 亚洲视频在线观看你懂的| 少妇人妻无一区二区三区| 亚洲专区中文字幕视频| 日本欧美三级中文字幕| 欧美一区二区三区十区| 国产免费成人激情视频| 国产精品乱子伦一区二区三区| 黑丝国产精品一区二区| 老司机亚洲精品一区二区| 日本免费一区二区三女| 国产精品白丝久久av| 五月婷婷缴情七月丁香| 欧美午夜不卡在线观看| 毛片在线观看免费日韩| 日韩一区二区三区有码| 国产精品国产亚洲看不卡| 亚洲欧美日韩国产成人| 欧美综合色婷婷欧美激情| 中文字幕人妻综合一区二区 | 国产一级不卡视频在线观看| 日本男人女人干逼视频| 天堂av一区一区一区| 国产精品夜色一区二区三区不卡 | 大香蕉精品视频一区二区| 欧美成人一区二区三区在线|