排序為了更好地理解數(shù)據(jù),去重刪掉重復(fù)的觀察或者變量。
![](http://image109.360doc.com/DownloadImg/2020/07/0900/195061083_1_2020070912362699)
1 排序排序,基于某一個變量或者一組變量的值進(jìn)行有序排列,方便友好地理解數(shù)據(jù)。 代碼示范: # 加載R包
library(magrittr)
library(dplyr)
# 數(shù)據(jù)導(dǎo)入
data(iris)
iris.data <- iris
iris.data %>% head
# Sepal.Length 排序操作 默認(rèn)是升序
dplyr::arrange(iris.data, Sepal.Length) %>% head(n = 10)
# Sepal.Length 降序操作
dplyr::arrange(iris.data, desc(Sepal.Length)) %>% head(n = 10)
# 雙變量的排序操作
dplyr::arrange(iris.data, desc(Sepal.Length), Sepal.Width) %>% head(n = 10)
總結(jié):利用dplyr包的arrange()函數(shù),默認(rèn)是升序,若是要降序,對變量使用desc()函數(shù)。 2 去重去重,去掉重復(fù)的行。 代碼示范: # 加載R包
library(magrittr)
library(dplyr)
# 模擬數(shù)據(jù)
data1 <- data.frame(
id = c(1, 2, 1, 3, 4),
name = c('A', 'B', 'A', 'C', 'D')
)
data1 %>% print
# 去掉重復(fù)的行
data1 %>%
group_by(id, name) %>%
filter(row_number() == 1)
# 或者
data1 %>% unique
總結(jié):利用dplyr包的group_by()和filter()函數(shù)進(jìn)行去重操作或者使用base包的unique()函數(shù)去重。 您在閱讀中,關(guān)于排序和去重,有什么見解,請評論。
|